網(wǎng)站首頁 編程語言 正文
引言
這篇文章將介紹當(dāng)WEB服務(wù)器報(bào)警,提示磁盤使用率問題和帶寬滿載時(shí)的一些排查思路和解決方案。
首先,我們一定要配置服務(wù)器的云監(jiān)控,如果是云廠商的服務(wù)器都有監(jiān)控服務(wù),開通即可。
如果是自建機(jī)房,監(jiān)控報(bào)警策略也是必須搭建的。
磁盤使用率報(bào)警
原因分析
- 日志沒有及時(shí)遷移或清理
- 程序異常輸出了大量的垃圾文件
- 掛載的硬盤存儲空間不足,不適應(yīng)業(yè)務(wù)發(fā)展,需要掛載新的磁盤。
解決方案
1. 日志遷移或清理
我們需要Nginx日志和項(xiàng)目運(yùn)行中的關(guān)鍵日志,方便定位問題、數(shù)據(jù)分析。
日志遷移的思路很簡單,目前主流的云廠商都支持日志遷移和存儲服務(wù),且成本不高。
如果是自建的服務(wù),可以掛載專門的存儲硬盤,不和業(yè)務(wù)服務(wù)器耦合在一起,將日志進(jìn)行單獨(dú)存儲。
2. 日志清理
- 切換到根目錄
cd /
- 查找到大文件,比如找到大于100M的文件
find . size +100M
- 沒用的日志大文件置為空(不要直接刪除,正在被使用的文件是無法直接刪除的)
cat /dev/null > /data/logs/php-fpm/error.log
網(wǎng)站流量異常,一直在報(bào)警
當(dāng)網(wǎng)站流量報(bào)警時(shí)喜憂參半,如果是因?yàn)楦慊顒?dòng)或者網(wǎng)站內(nèi)容命中了熱點(diǎn),被搜索引擎推薦,那真是像買彩票中獎(jiǎng)一樣高興。
不過,大多數(shù)情況,網(wǎng)站在毫無預(yù)兆的情況下突然打滿帶寬,大概率是被惡意攻擊了。
下面介紹一下我的排查思路
首先我登錄了網(wǎng)站的統(tǒng)計(jì)服務(wù)平臺,發(fā)現(xiàn)PV/UV等關(guān)鍵數(shù)據(jù)并沒有太大變化,但是服務(wù)器的帶寬卻被打滿了,說明異常流量不是通過刷網(wǎng)站頁面導(dǎo)致的,可能是通過刷接口導(dǎo)致的。
通過分析日志排查異常流量
首先切換到日志目錄,比如我的目錄是
cd /data/logs/nginx
查看訪問最頻繁的前10個(gè)IP
awk '{print $1}' access.log | sort -n |uniq -c | sort -rn | head -n 10
分析結(jié)果:
- 發(fā)現(xiàn)訪問量最高的ip是自身服務(wù)器的外網(wǎng)ip
- 發(fā)現(xiàn)有一組美國谷歌云的異常訪問
- 發(fā)現(xiàn)有一個(gè)北京xx網(wǎng)的異常訪問
- 其他基本是正常流量
解決異常流量
公網(wǎng)ip訪問量最大:
這是一個(gè)N年前的老項(xiàng)目,開發(fā)時(shí)是有一些知識盲點(diǎn)的,沒有考慮到內(nèi)網(wǎng)傳輸要比外網(wǎng)傳輸?shù)乃俣瓤旌芏唷?/p>
通過下面的方式替換了外網(wǎng)傳輸為內(nèi)網(wǎng)傳輸:
- 項(xiàng)目中的外網(wǎng)ip替換為內(nèi)網(wǎng)ip(發(fā)現(xiàn)項(xiàng)目代碼并沒有直接訪問外網(wǎng)ip,而是訪問了子項(xiàng)目的域名)
- 配置Linux服務(wù)器的host
# 打開Linux的hosts配置文件
vim /etc/hosts
# 將項(xiàng)目中請求的多個(gè)域名解析到本地的ip地址
127.0.0.1 多個(gè)域名用空格分隔
優(yōu)化完內(nèi)網(wǎng)傳輸之后,就開始最重要的事情了:
封禁惡意ip
- 創(chuàng)建(打開)黑名單配置文件
vim /etc/nginx/blackip.conf
- 將black.conf添加到nginx.conf中 (代碼段中的...代表省略的內(nèi)容)
http{
.
.
.
#ip黑名單
include /etc/nginx/blackip.conf;
.
.
.
}
- 添加要封禁的黑名單
#屏蔽單個(gè)ip訪問
deny IP;
#允許單個(gè)ip訪問
allow IP;
#屏蔽所有ip訪問
deny all;
#允許所有ip訪問
allow all;
#屏蔽整個(gè)段:從127.0.0.1到127.255.255.254
deny 127.0.0.0/8;
#屏蔽IP段:從127.45.0.1到127.45.255.254
deny 127.45.0.0/16;
#屏蔽IP段:從127.45.6.1到127.45.6.254
deny 127.45.6.0/24;
- 重啟Nginx服務(wù)
nginx -s reload
停掉不用的服務(wù)
在查詢Nginx的log時(shí),發(fā)現(xiàn)一些不再用的服務(wù)仍然有請求日志。
果斷停掉這些服務(wù)。
統(tǒng)計(jì)訪問最多的url 前10名
cat access.log |awk '{print $7}'| sort|uniq -c| sort -rn| head -10 | more
封禁了不再使用url
- 小程序接口封禁
- 網(wǎng)站快報(bào)相關(guān)的接口封禁
優(yōu)化結(jié)果
在進(jìn)行上述操作后,收到了服務(wù)器報(bào)警恢復(fù)正常的短信通知。
今天早晨登錄服務(wù)器監(jiān)控后臺,發(fā)現(xiàn)效果是灰常明顯的:
紅線左側(cè)是處理異常流量前的帶寬波動(dòng)圖,右側(cè)是處理后的波動(dòng)圖,淺色波動(dòng)線是昨天的流量情況。
總結(jié)
這是7年前剛?cè)胄袝r(shí)做的項(xiàng)目,單機(jī)部署,排查思路比較簡單清晰:查日志,封ip。
在微服務(wù)+分布式成為主流的今天,又要用哪些思路和工具排查問題呢?
原文鏈接:https://juejin.cn/post/7132292135306395679
相關(guān)推薦
- 2022-11-02 python?pip特殊用法之pip?install?-v?-e?.命令詳解_python
- 2022-09-21 ubuntu22通過docker安裝wechat啟動(dòng)后無界面的問題及解決方法_docker
- 2022-01-21 Shell編程:/bin/bash和/bin/sh的區(qū)別
- 2022-07-22 mybatis源碼之集成spring原理詳解
- 2022-09-03 Go語言中的變量和常量_Golang
- 2023-01-27 解決Pycharm模塊安裝慢問題的兩種方法_python
- 2022-05-10 git reset中hard與soft區(qū)別
- 2022-02-27 Web server failed to start. Port XXXX was already
- 最近更新
-
- window11 系統(tǒng)安裝 yarn
- 超詳細(xì)win安裝深度學(xué)習(xí)環(huán)境2025年最新版(
- Linux 中運(yùn)行的top命令 怎么退出?
- MySQL 中decimal 的用法? 存儲小
- get 、set 、toString 方法的使
- @Resource和 @Autowired注解
- Java基礎(chǔ)操作-- 運(yùn)算符,流程控制 Flo
- 1. Int 和Integer 的區(qū)別,Jav
- spring @retryable不生效的一種
- Spring Security之認(rèn)證信息的處理
- Spring Security之認(rèn)證過濾器
- Spring Security概述快速入門
- Spring Security之配置體系
- 【SpringBoot】SpringCache
- Spring Security之基于方法配置權(quán)
- redisson分布式鎖中waittime的設(shè)
- maven:解決release錯(cuò)誤:Artif
- restTemplate使用總結(jié)
- Spring Security之安全異常處理
- MybatisPlus優(yōu)雅實(shí)現(xiàn)加密?
- Spring ioc容器與Bean的生命周期。
- 【探索SpringCloud】服務(wù)發(fā)現(xiàn)-Nac
- Spring Security之基于HttpR
- Redis 底層數(shù)據(jù)結(jié)構(gòu)-簡單動(dòng)態(tài)字符串(SD
- arthas操作spring被代理目標(biāo)對象命令
- Spring中的單例模式應(yīng)用詳解
- 聊聊消息隊(duì)列,發(fā)送消息的4種方式
- bootspring第三方資源配置管理
- GIT同步修改后的遠(yuǎn)程分支