百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 优雅编程 > 正文

「运维」Prometheus监控Elasticsearch服务状态,索引情况等

sinye56 2024-12-23 13:26 5 浏览 0 评论

Prometheus主要是通过exporter进行监控信息的采集,对Elasticsearch服务主要是elasticsearch_exporter采集服务信息,如存储, 内存,索引大小,查询等信息。

安装配置

Elasticsearch Exporter采用Golang编写,下载地址为 github.com/prometheus-community/elasticsearch_exporter,下载解压即可运行。

# 下载elasticsearch_exporter
cd /usr/local/src/
wget https://github.com/prometheus-community/elasticsearch_exporter/releases/download/v1.5.0/elasticsearch_exporter-1.5.0.linux-amd64.tar.gz
tar -xzf elasticsearch_exporter-1.5.0.linux-amd64.tar.gz
mv elasticsearch_exporter-1.5.0.linux-amd64 elasticsearch_exporter 
## 用专用用户运行
useradd prometheus
chown -R prometheus:prometheus ./elasticsearch_exporter
su prometheus
./elasticsearch_exporter/elasticsearch_exporter

参数有:

选项

默认值

含义

es.uri

http://localhost:9200/

Elasticsearch node的地址

es.all

false

查询集群中所有节点的统计信息

es.indices

false

查询集群中的所有索引的统计信息

web.listen-address

0.0.0.0:9114

HTTP服务暴露端口

设置为系统服务,自动启动。

cat > /usr/lib/systemd/system/elasticsearch_exporter.service <<EOF
#elasticsearch_exporter.service
[Unit]
Description=elasticsearch_exporter
After=network.target

[Service]
Type=simple
User=prometheus
ExecStart=/usr/local/src/elasticsearch_exporter-1.5.0.linux-amd64/elasticsearch_exporter --es.uri http://x.x.x.x:9200 --es.all --es.indices
Restart=on-failure

[Install]
WantedBy=multi-user.target
EOF
## 启动
systemctl enable elasticsearch_exporter.service
systemctl start elasticsearch_exporter.service

它还提供了一系列指标开头,--no-collector.<name>参数来指定不想收集的指标,也可以通过--collector.<name>参数来指定想要打开的额外指标。

启动后,即可使用ip:9114/metrics访问,看到系统的即时指标。

Prometheus Server收集

Prometheus Server收集当前elasticsearch exporter的监控数据,配置prometheus.yml,以及详细的独立文件static_config_es.yml:

# prometheus.yml
scrape_configs:
  - job_name: "es"
    file_sd_configs:
      - files:
        - static_config_es.yml
# static_config_es.yml
- targets: ['192.168.16.230:9114']
  labels:
    instance: '生产ES'

如果获取主机监控信息时想指定获取的内容,需要配合使用Job的params参数。

配置完之后,如果节点配置在prometheus.yml中,需要重启,如果基于独立文件,加入节点会被定时自动扫描。prometheus提供的web页面的status-->targets中查看到监控的节点信息。

数据可视化

数据采集后,一般都使用grafana来展现各种视图。点击加号菜单中的“import”,输入Dashboard ID后点确定,即可从官网导入指定的仪表盘模板。

其中对Elasticsearch监控数据呈现得比较好的图表是,ID为2322的“ElasticSearch cluster stats”仪表盘,能看到集群的详情。

预警配置

Prometheus预警由Server触发,再通过独立的Alertmanager服务发送到指定目的地,如钉钉群,邮件,企业微信。配置prometheus.yml指定预警规则文件路径:

rule_files:
 - ./rules/*yml

预警规则文件(例rules/es.yml)如下:

groups:
- name: Elasticsearch
  rules:
  - alert: 集群状态
    expr: elasticsearch_cluster_health_status{color="red"} == 1
    for: 5m
    labels:
      severity: 严重
    annotations:
      description: "{{ $labels.instance }} 集群状态,5分钟持续Red"
      summary: "集群状态不可用"

配置如果没问题,则会在展示到alerts菜单下。

几个常用的预警项的表达式是:

  • 集群不可用:elasticsearch_cluster_health_status{color="red"} == 1
  • 正常的节点数量,elasticsearch_cluster_health_number_of_nodes
  • CPU使用率,elasticsearch_process_cpu_percent
  • 硬盘可用空间,elasticsearch_filesystem_data_free_bytes
  • 内存使用比例(Heap),elasticsearch_jvm_memory_used_bytes{area="heap"} / elasticsearch_jvm_memory_max_bytes{area="heap"}
  • 频繁GC,5分钟内出现多次,尤其是{gc="old"},rate(elasticsearch_jvm_gc_collection_seconds_count[5m])

表达式可以先在Server端的graph菜单中验证,或者在Grafana的图表中找参数。



相关推荐

CTO偷偷传我的系统性能优化十大绝招(万字干货)

上篇引言:取与舍软件设计开发某种意义上是“取”与“舍”的艺术。关于性能方面,就像建筑设计成抗震9度需要额外的成本一样,高性能软件系统也意味着更高的实现成本,有时候与其他质量属性甚至会冲突,比如安全性、...

提升效率!VMware虚拟机性能优化十大实用技巧

我40岁,干跨境婚恋中介的。为服务各国用户,常得弄英语、日语、俄语系统环境,VMware虚拟机帮了不少忙。用久了发现优化下性能,效率能更高。今儿就来聊聊优化技巧和同类软件。一、VMware虚拟...

低延迟场景下的性能优化实践

本文摘录自「全球C++及系统软件技术大会」ScottMeyers曾说到过,如果你不在乎性能,为什么要在C++这里,而不去隔壁的Pythonroom呢?今天我们就从“低延迟的概述”、“低延迟系...

Linux性能调优之内存负载调优的一些笔记

写在前面整理一些Linux内存调优的笔记,分享给小伙伴博文没有涉及的Demo,理论方法偏多,可以用作内存调优入门博文内容涉及:Linux内存管理的基本理论寻找内存泄露的进程内存交换空间调优不同方式的...

优化性能套路:带你战胜这只后段程序员的拦路虎

来源|极客时间《卖桃者说》作者|池建强编辑|成敏你好,这里是卖桃者说。今天给大家推荐一篇文章,来自倪朋飞老师的专栏《Linux性能优化实战》,文章主要讲的是优化性能的套路,这几乎是每个后端程序员...

SK海力士CXL优化解决方案已成功搭载于Linux:带宽提升30%,性能提升12%以上

SK海力士宣布,已将用于优化CXL(ComputeExpressLink)存储器运行的自研软件异构存储器软件开发套件(HMSDK)中主要功能成功搭载于全球最大的开源操作系统Linux上,不但提升了...

Linux内核优化:提升系统性能的秘诀

Linux内核优化:提升系统性能的艺术在深入Linux内核优化的世界之前,让我们先来理解一下内核优化的重要性。Linux内核是操作系统的核心,负责管理系统资源和控制硬件。一个经过精心优化的内核可以显著...

Linux系统性能优化:七个实战经验

Linux系统的性能是指操作系统完成任务的有效性、稳定性和响应速度。Linux系统管理员可能经常会遇到系统不稳定、响应速度慢等问题,例如在Linux上搭建了一个web服务,经常出现网页无法打开、打开速...

腾讯面试:linux内存性能优化总结

【1】内存映射Linux内核给每个进程都提供了一个独立且连续的虚拟地址空间,以便进程可以方便地访问虚拟内存;虚拟地址空间的内部又被分为内核空间和用户空间两部分,不同字长的处理器,地址空间的范围也不同...

Linux文件系统性能调优《参数优化详解》

由于各种的I/O负载情形各异,Linux系统中文件系统的缺省配置一般来说都比较中庸,强调普遍适用性。然而在特定应用下,这种配置往往在I/O性能方面不能达到最优。因此,如果应用对I/O性能要求较高,除...

Nginx 性能优化(吐血总结)

一、性能优化考虑点当我需要进行性能优化时,说明我们服务器无法满足日益增长的业务。性能优化是一个比较大的课题,需要从以下几个方面进行探讨当前系统结构瓶颈了解业务模式性能与安全1、当前系统结构瓶颈首先需要...

Linux问题分析与性能优化

排查顺序整体情况:top/htop/atop命令查看进程/线程、CPU、内存使用情况,CPU使用情况;dstat2查看CPU、磁盘IO、网络IO、换页、中断、切换,系统I/O状态;vmstat2查...

大神级产品:手机装 Linux 运行 Docker 如此简单

本内容来源于@什么值得买APP,观点仅代表作者本人|作者:灵昱Termux作为一个强大的Android终端模拟器,能够运行多种Linux环境。然而,直接在Termux上运行Docker并不可行,需要...

新手必须掌握的Linux命令

Shell就是终端程序的统称,它充当了人与内核(硬件)之间的翻译官,用户把一些命令“告诉”终端程序,它就会调用相应的程序服务去完成某些工作。现在包括红帽系统在内的许多主流Linux系统默认使用的终端是...

Linux 系统常用的 30 个系统环境变量全解析

在Linux系统中,环境变量起着至关重要的作用,它们犹如隐藏在系统背后的“魔法指令”,掌控着诸多程序的运行路径、配置信息等关键要素。尤其在shell脚本编写时,巧妙运用环境变量,能让脚本如虎...

取消回复欢迎 发表评论: