Prometheus完整的部署方案+實(shí)戰實(shí)例
Prometheus簡(jiǎn)介是一套開(kāi)源的系統監控報警框架。Prometheus作為新一代的云原生監控系統,相比傳統監控監控系統(Nagios或者Zabbix)擁有如下優(yōu)點(diǎn) 易管理性:Prometheus核心部分只有一個(gè)單獨的二進(jìn)制文件,可直接在本地工作,不依賴(lài)于分布式存儲 高效性:?jiǎn)我籔rometheus可以處理數以百萬(wàn)的監控指標;每秒處理數十萬(wàn)的數據點(diǎn) 易于伸縮性:通過(guò)使用功能分區(sharing)+聯(lián)邦集群(federation)可以對Prometheus進(jìn)行擴展,形成一個(gè)邏輯集群 豐富的看板:多種可視化圖表及儀表盤(pán)支持 針對容器監控:對docker,k8S監控有成熟解決方案 官方安裝說(shuō)明 準備兩臺服務(wù)器 101下載prometheus.yml主配置文件 開(kāi)啟內核路由轉發(fā) http://192.168.106.101:9090/ #訪(fǎng)問(wèn)該地址,出現一個(gè)簡(jiǎn)單ui界面,說(shuō)明部署成功 cAdvisor (Container Advisor) 用于收集正在允許的容器資源使用和性能信息。相當于zabbix-agent一樣提供一個(gè)數據采集的接口 100被監控服務(wù)器安裝 去101上修改prometheus的配置文件,復制一個(gè)job文件,job_name 指名稱(chēng),targets為cAdvisor服務(wù)器地址ip和端口 http://192.168.106.101:9090/ 可以看到監控指標說(shuō)明獲取數據成功 101服務(wù)器上安裝grafana http://192.168.106.101:3000/ #p配置數據源,配置完成點(diǎn)擊保存 保存,選擇Prometheus數據源后可以看到如下圖所示 可以看到100上所有容器都被監控到了,至此監控容器完成! 編寫(xiě)了一個(gè)采集linux主機metrics的腳本 運行這個(gè)腳本就能監控Linux主機 測試 訪(fǎng)問(wèn) 說(shuō)明采集信息成功 修改101服務(wù)上的配置文件/tmp/prometheus.yml 檢測方法:http://192.168.106.101:9090/classic/targets,up說(shuō)明采集成功 然后配置grafana儀表盤(pán),本次導入9276模板,和剛才導入模板的方式一致。導入完成即可看到如圖所示模板 至此實(shí)戰監控Linux部署完成Prometheus架構圖
Prometheus Server: 收集指標和存儲時(shí)間序列數據,并提供查詢(xún)接口
ClientLibrary:客戶(hù)端庫
Push Gateway: 短期存儲指標數據。主要用于臨時(shí)性的任務(wù)
Exporters:采集已有的第三方服務(wù)監控指標并暴露metrics
Alertmanager:告警
Web UI :簡(jiǎn)單的web控制臺https://prometheus.io/docs/prometheus/latest/installation/
192.168.106.101 #Prometheus服務(wù)端
192.168.106.100 #被監控服務(wù)器# my global config
global:
scrape_interval: 15s # 采集被監控段指標的一個(gè)周期
evaluation_interval: 15s # 告警評估的一個(gè)周期
# 告警的配置文件
alerting:
alertmanagers:
- static_configs:
- targets:
# - alertmanager:9093
# 告警規則配置
rule_files:
# - "first_rules.yml"
#被監控端的配置
scrape_configs:
- job_name: 'prometheus'
static_configs:
- targets: ['localhost:9090']
- job_name: "docker"
static_configs:
- targets: ['192.168.31.62:8080']
- job_name: "Linux"
static_configs:
- targets: ['192.168.31.62:9100']下載鏡像
docker pull prom/prometheus
echo -e "net.ipv4.ip_forward = 1\nnet.ipv4.conf.default.rp_filter = 0 \nnet.ipv4.conf.all.rp_filter = 0" >> /etc/sysctl.conf
sysctl -p啟動(dòng)鏡像,將主配置文件掛載到容器內
docker run -d --name=prometheus -p 9090:9090 -v /tmp/prometheus.yml:/etc/prometheus/prometheus.yml prom/prometheus
實(shí)戰一:監控一個(gè)容器服務(wù)(
常用的監控指標有: 內存,CPU,硬盤(pán),網(wǎng)絡(luò ),狀態(tài)
)非交互獲取容器的監控指標
`docker stats --no-stream lnmp_nginx `
docker部署cAdvisor:
docker run -d \
--volume=/:/rootfs:ro \
--volume=/var/run:/var/run:ro \
--volume=/sys:/sys:ro \
--volume=/var/lib/docker/:/var/lib/docker:ro \
--volume=/dev/disk/:/dev/disk:ro \
--publish=8080:8080 \
--detach=true \
--name=cadvisor \
google/cadvisor:latest訪(fǎng)問(wèn)該地址,就能看到實(shí)時(shí)采集到的數據
http://192.168.106.100:8080/containers/
http://192.168.106.100:8080/metrics #該地址的數據為prometheus識別的數據的接口
vim /tmp/prometheus.yml
docker restart prometheus #重啟服務(wù)
docker run -d --name=grafana -p 3000:3000 grafana/grafana
https://grafana.com/grafana/download #該地址下載grafana模板
實(shí)戰二:監控Linux主機
cat node_exporter.sh
#!/bin/bash
wget https://github.com/prometheus/node_exporter/releases/download/v0.17.0/node_exporter-0.17.0.linux-amd64.tar.gz
tar zxf node_exporter-0.17.0.linux-amd64.tar.gz
mv node_exporter-0.17.0.linux-amd64 /usr/local/node_exporter
cat </usr/lib/systemd/system/node_exporter.service
[Unit]
Description=https://prometheus.io
[Service]
Restart=on-failure
ExecStart=/usr/local/node_exporter/node_exporter
[Install]
WantedBy=multi-user.target
EOF
systemctl daemon-reload
systemctl enable node_exporter
systemctl restart node_exporterhttp://192.168.106.100:9100/metrics
docker restart prometheus