網站首頁 編程語言 正文
1. 前言
為什么要進行持久化?:持久化功能有效地避免因進程退出造成的數據丟失問題,當下次重啟時利用之前持久化的文件即可實現數據恢復。
持久化都有那些方式?:Redis支持RDB和AOF兩種持久化機制。
2. RDB
RDB持久化是把當前進程數據生成快照保存到硬盤的過程,觸發RDB持久化過程分為手動觸發和自動觸發。
2.1 手動觸發
手動觸發分別對應save
和bgsave
命令:
-
save
?命令::阻塞當前Redis服務器,直到RDB過程完成為止,對于內存比較大的實例會造成長時間阻塞,線上環境不建議使用。 -
bgsave
?命令:Redis進程執行fork操作創建子進程,RDB持久化過程由子進程負責,完成后自動結束。阻塞只發生在fork階段,一般時間很短。
顯然bgsave命令是針對save阻塞問題做的優化。因此Redis內部所有的涉及RDB的操作都采用bgsave的方式,而save命令已經廢棄。
2.2 自動觸發
- 使用save相關配置,如
save m n
。表示m秒內數據集存在n次修改時,自動觸發bgsave。 - 如果從節點執行全量復制操作,主節點自動執行bgsave生成RDB文件并發送給從節點。
- 執行debug reload命令重新加載Redis時,也會自動觸發save操作。
- 默認情況下執行shutdown命令時,如果沒有開啟AOF持久化功能則自動執行bgsave。
3. bgsave大致流程
流程說明:
- 執行bgsave命令,Redis父進程判斷當前是否存在正在執行的子進程,如RDB/AOF子進程,如果存在bgsave命令直接返回。
- 父進程執行fork操作創建子進程,fork操作過程中父進程會阻塞,通過
info stats
命令查看latest_fork_usec選項,可以獲取最近一個fork操作的耗時,單位為微秒。 - 父進程fork完成后,bgsave命令返回“Background saving started”信息并不再阻塞父進程,可以繼續響應其他命令。
- 子進程創建RDB文件,根據父進程內存生成臨時快照文件,完成后對原有文件進行原子替換。執行
lastsave
命令可以獲取最后一次生成RDB的時間,對應info統計的rdb_last_save_time選項。 - 進程發送信號給父進程表示完成,父進程更新統計信息,具體見info Persistence下的rdb_*相關選項。
關于RDB文件:
- 存儲位置:RDB文件保存在dir配置指定的目錄下,文件名通過dbfilename配置指定。可以通過執行config set dir{newDir}和config set dbfilename{newFileName}運行期動態執行,當下次運行時RDB文件會保存到新目錄。
- 壓縮:Redis默認采用LZF算法對生成的RDB文件做壓縮處理,壓縮后的文件遠遠小于內存大小,默認開啟,可以通過參數config set rdbcompression{yes|no}動態修改。
-
校驗:如果Redis加載損壞的RDB文件時拒絕啟動,并打印?
# Short read or OOM loading DB. Unrecoverable error, aborting now.
?(可以使用Redis提供的redis-check-dump工具檢測RDB文件并獲取對應的錯誤報告)。
4. RDB持久化方式的優缺點
優點:
- RDB是一個緊湊壓縮的二進制文件,代表Redis在某個時間點上的數據快照。非常適用于備份,全量復制等場景。比如每6小時執行bgsave備份,并把RDB文件拷貝到遠程機器或者文件系統中(如hdfs),用于災難恢復。(數據緊湊,便于存儲)
- Redis加載RDB恢復數據遠遠快于AOF的方式。(恢復速度快)
缺點:
- RDB方式數據沒辦法做到實時持久化/秒級持久化。因為bgsave每次運行都要執行fork操作創建子進程,屬于重量級操作,頻繁執行成本過高。(成本高)
- RDB文件使用特定二進制格式保存,Redis版本演進過程中有多個格式的RDB版本,存在老版本Redis服務無法兼容新版RDB格式的問題。(不兼容)
5. AOF
AOF(append only file)持久化:以獨立日志的方式記錄每次寫命令,重啟時再重新執行AOF文件中的命令達到恢復數據的目的。主要作用是解決了數據持久化的實時性。
6. AOF的使用方式
- 開啟AOF功能需要設置配置:appendonly yes,默認不開啟。
- AOF文件名通過appendfilename配置設置,默認文件名是appendonly.aof。(路徑同RDB)
- 主要流程有命令寫入(append)、文件同步(sync)、文件重寫(rewrite)、重啟加載(load)。
7. AOF流程剖析
流程描述:
- 所有的寫入命令會追加到aof_buf(緩沖區)中。
- AOF緩沖區根據對應的策略向硬盤做同步操作。
- 隨著AOF文件越來越大,需要定期對AOF文件進行重寫,達到壓縮的目的。
- 當Redis服務器重啟時,可以加載AOF文件進行數據恢復。
7.1 命令寫入
AOF命令寫入的內容直接是文本協議格式。例如set hello world這條命令,在AOF緩沖區會追加如下文本:
*3\r\n$3\r\nset\r\n$5\r\nhello\r\n$5\r\nworld\r\n
為什么使用文本協議格式?
- 文本協議具有很好的兼容性。(兼容性好)
- 開啟AOF后,所有寫入命令都包含追加操作,直接采用協議格式,避免了二次處理開銷。(處理簡單)
- 文本協議具有可讀性,方便直接修改和處理。(方便修改)
為什么要追加到aof_buf中而不是直接寫入硬盤?
- 如果每次寫AOF文件命令都直接追加到硬盤,那么Redis的性能就會受到硬盤讀寫速度的影響,而硬盤的讀寫速度相對于內存則是數量級上的差距,所以如果每次直接寫入硬盤則勢必會大幅度影響Redis的運行速度。(影響運行速度)
- 使用緩沖區暫存,Redis還可以提供多種緩沖區同步硬盤的策略,在性能和安全性方面做出平衡。(可以針對具體場景干預刷盤策略,以達到更好的效果)
7.2 文件同步
Redis提供了多種AOF緩沖區同步文件策略,由參數appendfsync控制。
系統調用write和fsync的幾點說明:
- write?:會觸發延遲寫(delayed write)機制。Linux在內核提供頁緩沖區用來提高硬盤IO性能。write操作在寫入系統緩沖區后直接返回。同步硬盤操作依賴于系統調度機制,例如:緩沖區頁空間寫滿或達到特定時間周期。同步文件之前,如果此時系統故障宕機,緩沖區內數據將丟失。(寫緩沖,定期由操作系統刷盤)
- fsync?:針對單個文件操作(比如AOF文件),做強制硬盤同步,fsync將阻塞直到寫入硬盤完成后返回,保證了數據持久化。(立即將緩沖數據刷盤)
策略的幾點說明:
- always:每次寫入都要同步AOF文件,在一般的SATA硬盤上,Redis只能支持大約幾百TPS寫入,顯然跟Redis高性能特性背道而馳,不建議配置。
- no:由于操作系統每次同步AOF文件的周期不可控,而且會加大每次同步硬盤的數據量,雖然提升了性能,但數據安全性無法保證。
- everysec:是建議的同步策略,也是默認配置,做到兼顧性能和數據安全性。(在系統突然宕機的情況下丟失1~2秒的數據)
7.3 重寫機制
為什么要重寫?:
- 隨著命令不斷寫入AOF,文件會越來越大。
- 會包含越來越多無用的命令記錄。(比如最近一次對一個值的更新操作,那么在此之前記錄的更新操作都會作廢)
- 更小的AOF文件可以更快地被Redis加載。
怎么重寫?:
- AOF文件重寫就是把Redis進程內的數據轉化為寫命令同步到新AOF文件。
重寫后那些優化讓文件變小了?:
- 進程內已經超時的數據不再寫入文件。(去除失效數據)
- 舊的AOF文件含有無效命令,如del key1、hdel key2、srem keys、set a111、set a222等。重寫使用進程內數據直接生成,這樣新的AOF文件只保留最終數據的寫入命令。(去除無用命令)
- 多條寫命令可以合并為一個,如:lpush list a、lpush list b、lpush list c可以轉化為:lpush list a b c;為了防止單條命令過大造成客戶 端緩沖區溢出,對于list、set、hash、zset等類型操作,以64個元素為界拆分為多條。(使用批量命令)
重寫有那些觸發方式?:
- 手動觸發 :直接調用bgrewriteaof命令。
-
自動觸發 :根據auto-aof-rewrite-min-size和auto-aof-rewritepercentage參數確定自動觸發時機。
- auto-aof-rewrite-min-size:表示運行AOF重寫時文件最小體積,默認為64MB。(根據當前文件大小)
- auto-aof-rewrite-percentage:代表當前AOF文件空間(aof_current_size)和上一次重寫后AOF文件空間(aof_base_size)的比值。(根據文件大小的增量)
自動觸發時機:
aof_current_size > auto-aof-rewrite-minsize && (aof_current_size-aof_base_size)/aof_base_size >= auto-aof-rewrite-percentage
aof_current_size 和 aof_base_size 可以在info Persistence統計信息中查看。
重寫流程概述:
流程描述:
-
執行AOF重寫請求。
- 如果當前進程正在執行AOF重寫,請求不執行并返回?
ERR Background append only file rewriting already in progress
?。 - 如果當前進程正在執行bgsave操作,重寫命令延遲到bgsave完成之后再執行,返回?
Background append only file rewriting scheduled
- 如果當前進程正在執行AOF重寫,請求不執行并返回?
- 父進程執行fork創建子進程,開銷等同于bgsave過程。
- (1)主進程fork操作完成后,繼續響應其他命令。所有修改命令依然寫入AOF緩沖區并根據appendfsync策略同步到硬盤,保證原有AOF機制正確性。(2)由于fork操作運用寫時復制技術(Copy On Write),子進程只能共享fork操作時的內存數據。由于父進程依然響應命令,Redis使用“AOF重寫緩沖區”保存這部分新數據,防止新AOF文件生成期間丟失這部分數據。
- 子進程根據內存快照,按照命令合并規則寫入到新的AOF文件。每次批量寫入硬盤數據量由配置aof-rewrite-incremental-fsync控制,默認為32MB,防止單次刷盤數據過多造成硬盤阻塞。
- (1)新AOF文件寫入完成后,子進程發送信號給父進程,父進程更新統計信息,具體見info persistence的aof_*相關統計。(2)父進程把AOF重寫緩沖區的數據寫入到新的AOF文件(3)并使用新AOF文件替換老文件,完成AOF重寫。
7.4 重啟加載
流程描述:
- AOF持久化開啟且存在AOF文件時,優先加載AOF文件,并輸出?
DB loaded from append only file: xxx seconds
?。 - AOF關閉或者AOF文件不存在時,加載RDB文件,并輸出?
DB loaded from disk: xxx seconds
?。 - 加載AOF或RDB文件成功后,Redis啟動成功。
- AOF或RDB文件存在錯誤時,Redis啟動失敗并打印錯誤信息。
關于文件校驗:
加載損壞的AOF文件時會拒絕啟動,并會輸出:
Bad file format reading the append only file: make a backup of your AOF file,then use ./redis-check-aof --fix <filename>
對于錯誤格式的AOF文件:先進行備份,然后采用redis-check-aof --fix命令進行修復,修復后使用diff-u對比數據的差異,找出丟失的數據,有些可以人工修改補全。
對于AOF文件結尾不完整:比如機器突然掉電導致AOF尾部文件命令寫入不全。Redis為我們提供了aof-load-truncated配置來兼容這種情況,默認開啟。加載AOF時,當遇到此問題時會忽略并繼續啟動,同時打印如下警告日志:
# !!! Warning: short read while loading the AOF file !!! # !!! Truncating the AOF at offset 397856725 !!! # AOF loaded anyway because aof-load-truncated is enabled
8. 問題定位與優化
8.1 關于fork操作
當Redis做RDB或AOF重寫時,一個必不可少的操作就是執行fork操作創建子進程,對于大多數操作系統來說fork是個重量級操作雖然fork創建的子進程不需要拷貝父進程的物理內存空間,但是會復制父進程的空間內存頁表,因此fork操作耗時跟進程總內存量息息相關。可以在info stats統計中查latest_fork_usec指標獲取最近一次fork操作耗時,單位微秒。
減少fork耗時的措施:
- 優先使用物理機或者高效支持fork操作的虛擬化技術,避免使用Xen。
- 控制Redis實例最大可用內存,fork耗時跟內存量成正比,線上建議每個Redis實例內存控制在10GB以內。
- 合理配置Linux內存分配策略,避免物理內存不足導致fork失敗。
- 降低fork操作的頻率,如適度放寬AOF自動觸發時機,避免不必要的全量復制等。
8.2 關于子進程開銷
CPU:
- 分析:子進程負責把進程內的數據分批寫入文件,這個過程屬于CPU密集操作,通常子進程對單核CPU利用率接近90%。
-
優化:
- Redis是CPU密集型服務,不要做綁定單核CPU操作。由于子進程非常消耗CPU,會和父進程產生單核資源競爭。
- 不要和其他CPU密集型服務部署在一起,造成CPU過度競爭。
- 如果部署多個Redis實例,盡量保證同一時刻只有一個子進程執行重寫工作。
內存:
- 分析:得益于Linux的寫時復制機制(copy on write),父子進程會共享相同的物理內存頁,當父進程處理寫請求時會把要修改的頁創建副本,而子進程在fork操作過程中共享整個父進程內存快照。(重寫時共享同一份物理內存區域,內存主要開銷在于?拷貝的頁表?和?應用 copy on write 時某些頁的拷貝?以及在進行AOF重寫所使用的?aof_rewrite_buf占用的大小?)
-
優化:
- 如果部署多個Redis實例,盡量保證同一時刻只有一個子進程在工作。
- 避免在大量寫入時做子進程重寫操作,這樣將導致父進程維護大量頁副本,造成內存消耗。
- Linux kernel在2.6.38內核增加了Transparent Huge Pages(THP),支持huge page(2MB)的頁分配,默認開啟。當開啟時可以降低fork創 建子進程的速度,但執行fork之后,如果開啟THP,復制頁單位從原來4KB變為2MB,會大幅增加重寫期間父進程內存消耗。
硬盤:
- 分析:子進程主要職責是把AOF或者RDB文件寫入硬盤持久化,所以在執行重寫的時候勢必會增加硬盤的寫入壓力。根據Redis重寫AOF或RDB的數據量,結合系統工具如sar、iostat、iotop等,可分析出重寫期間硬盤負載情況。
-
優化:
- 不要和其他高硬盤負載的服務部署在一起。如:存儲服務、消息隊列服務等。
- AOF重寫時會消耗大量硬盤IO,可以開啟配置no-appendfsyncon-rewrite,默認關閉。表示在AOF重寫期間不做fsync操作,注意!配置no-appendfsync-on-rewrite=yes時,在極端情況下可能丟失整個AOF重寫期間的數據,需要根據數據安全性決定是否配置。
- 當開啟AOF功能的Redis用于高流量寫入場景時,Redis的性能會受到硬盤寫入性能的影響。
- 對于單機配置多個Redis實例的情況,可以配置不同實例分盤存儲AOF文件,分攤硬盤寫入壓力。
8.3 關于AOF追加阻塞
描述:當開啟AOF持久化時,常用的同步硬盤的策略是everysec,用于平衡性能和數據安全性。對于這種方式,Redis使用另一條線程每秒執行fsync同步硬盤。當系統硬盤資源繁忙時,會造成Redis主線程阻塞。
問題定位:
- 發生AOF阻塞時,Redis輸出日志,用于記錄AOF fsync阻塞導致拖慢Redis服務的行為:?
Asynchronous AOF fsync is taking too long (disk is busy). Writing the AOF buffer without waiting for fsync to complete, this may slow down Redi
- 每當發生AOF追加阻塞事件發生時,在info Persistence統計中,aof_delayed_fsync指標會累加,查看這個指標方便定位AOF阻塞問題。
- AOF同步最多允許2秒的延遲,當延遲發生時說明硬盤存在高負載問題。
流程概述:
- 主線程負責寫入AOF緩沖區。
- AOF線程負責每秒執行一次同步磁盤操作,并記錄最近一次同步時間。
- 主線程負責對比上次AOF同步時間:
- 如果距上次同步成功時間在2秒內,主線程直接返回。
- 如果距上次同步成功時間超過2秒,主線程將會阻塞,直到同步操作完成。
也就是說:
- everysec配置最多可能丟失2秒數據,不是1秒。
- 如果系統fsync緩慢,將會導致Redis主線程阻塞影響效率。
原文鏈接:https://juejin.cn/post/7142382431251726367
相關推薦
- 2023-07-04 解決Uncaught (in promise) TypeError: Cannot read pro
- 2023-08-01 ref 和 reactive 函數標注類型解析
- 2022-06-02 C語言實現簡單的抽獎系統_C 語言
- 2022-09-25 解決ERROR in Conflict: Multiple assets emit differen
- 2022-08-23 使用Python腳本提取基因組指定位置序列_python
- 2022-10-11 詳解pandas?df.iloc[]的典型用法_python
- 2023-11-26 解決:element ui表格表頭自定義輸入框單元格el-input不能輸入問題
- 2023-05-24 Pytorch中retain_graph的坑及解決_python
- 最近更新
-
- window11 系統安裝 yarn
- 超詳細win安裝深度學習環境2025年最新版(
- Linux 中運行的top命令 怎么退出?
- MySQL 中decimal 的用法? 存儲小
- get 、set 、toString 方法的使
- @Resource和 @Autowired注解
- Java基礎操作-- 運算符,流程控制 Flo
- 1. Int 和Integer 的區別,Jav
- spring @retryable不生效的一種
- Spring Security之認證信息的處理
- Spring Security之認證過濾器
- Spring Security概述快速入門
- Spring Security之配置體系
- 【SpringBoot】SpringCache
- Spring Security之基于方法配置權
- redisson分布式鎖中waittime的設
- maven:解決release錯誤:Artif
- restTemplate使用總結
- Spring Security之安全異常處理
- MybatisPlus優雅實現加密?
- Spring ioc容器與Bean的生命周期。
- 【探索SpringCloud】服務發現-Nac
- Spring Security之基于HttpR
- Redis 底層數據結構-簡單動態字符串(SD
- arthas操作spring被代理目標對象命令
- Spring中的單例模式應用詳解
- 聊聊消息隊列,發送消息的4種方式
- bootspring第三方資源配置管理
- GIT同步修改后的遠程分支