網站首頁 編程語言 正文
簡述
《Zabbix對Kafka topic積壓數據監控》一文的目的是通過Zabbix自動發現實現對多個消費者組的Topic及Partition的Lag進行監控。因在實際監控中發現有問題,為給感興趣的讀者不留坑,特通過此文對監控進行優化調整。
分區自動發現
# 未優化前的計算方式: # 自動發現配置文件 vim consumer-groups.conf #按消費者組(Group)|Topic格式,寫入自動發現配置文件 test-group|test # 執行腳本自動發現指定消費者和topic的分區 bash consumer-groups.sh discovery { "data": [ { "{#GROUP}":"test-group", "{#TOPICP}":"test", "{#PARTITION}":"0" }, { "{#GROUP}":"test-group", "{#TOPICP}":"test", "{#PARTITION}":"1" }, { "{#GROUP}":"test-group", "{#TOPICP}":"test", "{#PARTITION}":"3" }, { "{#GROUP}":"test-group", "{#TOPICP}":"test", "{#PARTITION}":"2" } ] }
經過上線驗證,當自動發現配置文件只有一個test-group|test
是沒有問題的,但當我們按需求再接入test-group|test1
(即test-group消費者組的第二個Topic)時,自動發現的結果如下:
# 未優化前的計算方式: vim consumer-groups.conf #按消費者組(Group)|Topic格式,寫入自動發現配置文件 test-group|test test-group|test1 # 執行腳本自動發現指定消費者和topic的分區 bash consumer-groups.sh discovery { "data": [ { "{#GROUP}":"test-group", "{#TOPICP}":"test", "{#PARTITION}":"0" }, { "{#GROUP}":"test-group", "{#TOPICP}":"test", "{#PARTITION}":"1" }, { "{#GROUP}":"test-group", "{#TOPICP}":"test", "{#PARTITION}":"3" }, { "{#GROUP}":"test-group", "{#TOPICP}":"test", "{#PARTITION}":"2" } { "{#GROUP}":"test-group", "{#TOPICP}":"test1", "{#PARTITION}":"0" }, { "{#GROUP}":"test-group", "{#TOPICP}":"test2", "{#PARTITION}":"1" }, { "{#GROUP}":"test-group", "{#TOPICP}":"test3", "{#PARTITION}":"2" } ] }
了解Zabbix自動發現格式的同學會發現,每個Topic的Partition會出現','
,這種格式是不符合規范,這就是導致我們的監控項會出現問題,因此我們需要進一步修改腳本。
經修改后,最終效果應該如下:
# 優化后的計算方式: vim consumer-groups.conf #按消費者組(Group)|Topic格式,寫入自動發現配置文件 test-group|test test-group|test1 # 執行腳本自動發現指定消費者和topic的分區 bash consumer-groups.sh discovery { "data": [ { "{#GROUP}":"test-group", "{#TOPICP}":"test", "{#PARTITION}":"0" }, { "{#GROUP}":"test-group", "{#TOPICP}":"test", "{#PARTITION}":"1" }, { "{#GROUP}":"test-group", "{#TOPICP}":"test", "{#PARTITION}":"3" }, { "{#GROUP}":"test-group", "{#TOPICP}":"test", "{#PARTITION}":"2" }, { "{#GROUP}":"test-group", "{#TOPICP}":"test1", "{#PARTITION}":"0" }, { "{#GROUP}":"test-group", "{#TOPICP}":"test1", "{#PARTITION}":"1" }, { "{#GROUP}":"test-group", "{#TOPICP}":"test1", "{#PARTITION}":"2" } ] }
獲取監控項“test-group/test/分區X”的Lag
經過自動發現后的數據,我們可以進一步獲取不同分區的lag
# 優化后的計算方式: # test-group test分區0 lag bash consumer-groups.sh lag test-group test 0 # test-group test分區1 lag bash consumer-groups.sh lag test-group test 1 # test-group test1分區0 lag bash consumer-groups.sh lag test-group test1 0
通過命令可以看到,我們的參數通過消費者組、Topic、Partition來獲取最終的lag值,如果不加消費者區分,那么無法區分不同消費者組和不同Topic相應的lag結果:
# 未優化前的計算方式: # 獲取分區0 lag bash consumer-groups.sh lag 0 # 獲取分區1 lag bash consumer-groups.sh lag 1 # 獲取分區2 lag bash consumer-groups.sh lag 2 # 獲取分區3 lag bash consumer-groups.sh lag 3
最終優化后腳本
# 自動發現配置文件 vim consumer-groups.conf #按消費者組(Group)|Topic格式,寫入自動發現配置文件 test-group|test test-group|test1 # 自動發現、lag計算腳本 vim consumer-groups.sh #!/bin/bash ##comment: 根據消費者組監控topic lag,進行監控告警 #配置文件說明 #消費者組|Topic #test-group|test #獲取topic 信息 cal_topic() { if [ $# -ne 2 ]; then echo "parameter num error, 讀取topic信息失敗" exit 1 else /usr/local/kafka/bin/./kafka-consumer-groups.sh --bootstrap-server 192.168.3.55:9092 --describe --group $1 |grep -w $2|grep -v none fi } #topic+分區自動發現 topic_discovery() { printf "{\n" printf "\t\"data\": [\n" m=0 num=`cat /etc/zabbix/monitor_scripts/consumer-groups.conf|wc -l` for line in `cat /etc/zabbix/monitor_scripts/consumer-groups.conf` do m=`expr $m + 1` group=`echo ${line} | awk -F'|' '{print $1}'` topic=`echo ${line} | awk -F'|' '{print $2}'` cal_topic $group $topic > /tmp/consumer-group-tmp count=`cat /tmp/consumer-group-tmp|wc -l` n=0 while read line do n=`expr $n + 1` #判斷最后一行 if [ $n -eq $count ] && [ $m -eq $num ]; then topicp=`echo $line | awk '{print $1}'` partition=`echo $line | awk '{print $2}'` printf "\t\t{ \"{#GROUP}\":\"${group}\", \"{#TOPICP}\":\"${topicp}\", \"{#PARTITION}\":\"${partition}\" }\n" else topicp=`echo $line | awk '{print $1}'` partition=`echo $line | awk '{print $2}'` printf "\t\t{ \"{#GROUP}\":\"${group}\", \"{#TOPICP}\":\"${topicp}\", \"{#PARTITION}\":\"${partition}\" },\n" fi done < /tmp/consumer-group-tmp done printf "\t]\n" printf "}\n" } if [ $1 == "discovery" ]; then topic_discovery elif [ $1 == "lag" ];then cal_topic $2 $3 > /tmp/consumer-group cat /tmp/consumer-group |awk -v t=$3 -v p=$4 '{if($1==t && $2==p ){print $5}}' else echo "Usage: /data/scripts/consumer-group.sh discovery | lag" fi # 手動運行 ## 自動發現 bash consumer-groups.sh discovery ## test-group test分區0 lag bash consumer-groups.sh lag test-group test 0
接入Zabbix
1.Zabbix配置文件
vim userparameter_kafka.conf UserParameter=topic_discovery,bash /data/scripts/consumer-groups.sh discovery UserParameter=topic_log[*],bash /data/scripts/consumer-groups.sh lag "$1" "$2" "$3"
2.Zabbix自動發現
3.監控項配置
4.告警信息
告警主機:Kafka_192.168.3.55 主機IP:192.168.3.55 主機組:Kafka 告警時間:2022.03.21 00:23:10 告警等級:Average 告警信息:test-group/test/分區1:數據積壓100 告警項目:topic_lag[test-group,test,1] 問題詳情: test-group/test/1: 62
原文鏈接:https://juejin.cn/post/7115038805291171877
相關推薦
- 2022-07-13 VMware安裝VMware Tools失敗/安裝不了,無網絡離線安裝
- 2023-04-02 GoLang函數棧的使用詳細講解_Golang
- 2022-07-06 如何利用python創建、讀取和修改CSV數據文件_python
- 2022-03-14 springboot下Static變量通過@Value和set方法注入失敗的問題和解決辦法
- 2022-06-29 C#集合之自定義集合類_C#教程
- 2022-08-04 scrapy中的spider傳參實現增量的方法_python
- 2022-10-07 C++結構體中變長數組的使用問題分解刨析_C 語言
- 2022-06-06 C#實現Excel轉PDF時設置內容適應頁面寬度_C#教程
- 最近更新
-
- window11 系統安裝 yarn
- 超詳細win安裝深度學習環境2025年最新版(
- Linux 中運行的top命令 怎么退出?
- MySQL 中decimal 的用法? 存儲小
- get 、set 、toString 方法的使
- @Resource和 @Autowired注解
- Java基礎操作-- 運算符,流程控制 Flo
- 1. Int 和Integer 的區別,Jav
- spring @retryable不生效的一種
- Spring Security之認證信息的處理
- Spring Security之認證過濾器
- Spring Security概述快速入門
- Spring Security之配置體系
- 【SpringBoot】SpringCache
- Spring Security之基于方法配置權
- redisson分布式鎖中waittime的設
- maven:解決release錯誤:Artif
- restTemplate使用總結
- Spring Security之安全異常處理
- MybatisPlus優雅實現加密?
- Spring ioc容器與Bean的生命周期。
- 【探索SpringCloud】服務發現-Nac
- Spring Security之基于HttpR
- Redis 底層數據結構-簡單動態字符串(SD
- arthas操作spring被代理目標對象命令
- Spring中的單例模式應用詳解
- 聊聊消息隊列,發送消息的4種方式
- bootspring第三方資源配置管理
- GIT同步修改后的遠程分支