網(wǎng)站首頁 編程語言 正文
最近剛寫了一篇文章介紹了下長事務(wù),以及一些長事務(wù)常見的危害,如無法及時的垃圾回收導(dǎo)致表膨脹之類的問題,最近剛好又碰到一個問題也是長事務(wù)所導(dǎo)致的。
上周六早上接到同事電話,說某個庫CPU一直很高,看了下全是某張大表的全表掃描導(dǎo)致,但是奇怪的是相關(guān)的查詢都有用到索引列,不知道為啥查詢?nèi)慷紱]走索引。
當我連上去查看時發(fā)現(xiàn)確實如此,如果只是某個查詢不走索引那可能是SQL本身寫的有問題,但是這張表相關(guān)的所有SQL都不走索引,那自然會想到是索引本身的原因了。那是不是索引失效了呢?經(jīng)過檢查發(fā)現(xiàn)這張表上的索引狀態(tài)均正常,并且我還將索引重建了,可仍然沒起作用。
正當我迷茫的時候,偶然間再去執(zhí)行相關(guān)SQL的時候發(fā)現(xiàn)竟然又都走索引了,這又是啥情況。。
我啥都沒做你就自己恢復(fù)了,那不是顯得我很呆?不行,必須得搞清楚啥原因。
當我再去查看相關(guān)索引的時候發(fā)現(xiàn),該索引的pg_index中的indcheckxmin列均為true,這個字段我之前有寫過一篇索引失效的文章里介紹過。那么什么情況下索引的該屬性會被設(shè)置為true呢?兩種情況:
- 當前事務(wù)中表上存在broken HOT chains;
- 當old_snapshot_threshold被設(shè)置時。
之前我們也介紹過,如果索引的該屬性為true那么在創(chuàng)建索引的事務(wù)中該索引是不可用的,不過這種場景我們基本不太會遇到,因為在實際應(yīng)用中我們基本不會在事務(wù)中創(chuàng)建完索引然后不提交該事務(wù)直接去使用。
而關(guān)于indcheckxmin的詳細解釋是:直到此pg_index行的xmin低于查詢的TransactionXmin之前,查詢都不能使用此索引。那么什么情況下會出現(xiàn)這種問題呢?長事務(wù)!
當我們創(chuàng)建索引的時候如果索引的indcheckxmin被設(shè)置為true,且數(shù)據(jù)庫中此時存在長事務(wù),那么直到該長事務(wù)提交前,該索引會一直不可用。
下面我們來模擬這種情況:
--會話一:打開一個長事務(wù)
bill=# begin;
BEGIN
bill=*# delete from t;
DELETE 1000
bill=*#
--會話二:創(chuàng)建索引
由于old_snapshot_threshold參數(shù)被設(shè)置,所以創(chuàng)建的索引indcheckxmin被設(shè)置為true了。
bill=# show old_snapshot_threshold ;
old_snapshot_threshold
------------------------
1h
(1 row)
bill=# create index idx_t1 on t1(id);
CREATE INDEX
bill=# select indisvalid,indcheckxmin,indisready,indislive from pg_index where indexrelid = 'idx_t1'::regclass;
indisvalid | indcheckxmin | indisready | indislive
------------+--------------+------------+-----------
t | t | t | t
(1 row)
使用該索引列進行查詢:
索引的確無法使用。
bill=# explain analyze select * from t1 where id = 100;
QUERY PLAN
-------------------------------------------------------------------------------------------------
Seq Scan on t1 (cost=0.00..209.00 rows=51 width=37) (actual time=0.010..0.692 rows=51 loops=1)
Filter: (id = 100)
Rows Removed by Filter: 9949
Planning Time: 0.150 ms
Execution Time: 0.706 ms
(5 rows)
bill=# set enable_seqscan = off;
SET
bill=# explain analyze select * from t1 where id = 100;
QUERY PLAN
-------------------------------------------------------------------------------------------------------------------
Seq Scan on t1 (cost=10000000000.00..10000000209.00 rows=51 width=37) (actual time=0.063..0.732 rows=51 loops=1)
Filter: (id = 100)
Rows Removed by Filter: 9949
Planning Time: 0.089 ms
Execution Time: 0.796 ms
(5 rows)
提交該長事務(wù)后再次查詢:
索引變得可用了。
bill=# explain analyze select * from t1 where id = 100;
QUERY PLAN
---------------------------------------------------------------------------------------------------------------
Index Scan using idx_t1 on t1 (cost=0.29..54.48 rows=51 width=37) (actual time=0.013..0.052 rows=51 loops=1)
Index Cond: (id = 100)
Planning Time: 0.061 ms
Execution Time: 0.067 ms
(4 rows)
果然是長事務(wù)的坑啊!
由于我們的庫中基本都打開了old_snapshot_threshold參數(shù),導(dǎo)致創(chuàng)建的索引的indcheckxmin一定是true。但這其實并不會有什么太大影響,問題在于在創(chuàng)建索引的同時數(shù)據(jù)庫中存在長事務(wù),這就導(dǎo)致了索引在創(chuàng)建完之后第一時間變得不可用了,需要直到該長事務(wù)被提交后才可用。
后來和同事求證發(fā)現(xiàn)他們之前也經(jīng)常碰到這種CPU變高然后又自己降下來的情況,之前并沒有注意是這張表的全表掃描導(dǎo)致的。由于該表是由pg_pathman創(chuàng)建的自動分區(qū),每天都會自己去創(chuàng)建一個新的分區(qū),因此如果每天自動創(chuàng)建分區(qū)的時候存在長事務(wù),那么創(chuàng)建完之后相關(guān)的分區(qū)上的索引均是不可用的,這也是為什么查詢不走索引然后又自己恢復(fù)的原因了。
這個案例其實我們在實際生產(chǎn)中遇到的可能性還是很大的,如果你的數(shù)據(jù)庫打開了old_snapshot_threshold參數(shù),同時沒有做好長事務(wù)的監(jiān)控,那么創(chuàng)建的索引就會出現(xiàn)這種不可用的情況。長事務(wù)危害不淺啊!
原文鏈接:https://foucus.blog.csdn.net/article/details/123345923
相關(guān)推薦
- 2023-07-30 使用Elementui元素動態(tài)增減表單組件
- 2021-12-09 數(shù)據(jù)庫建表設(shè)計六范式介紹_數(shù)據(jù)庫其它
- 2022-04-27 jQuery實現(xiàn)移動端懸浮拖動效果_jquery
- 2022-05-11 python?DataFrame的shift()方法的使用_python
- 2022-04-27 C語言的常量,字符串,轉(zhuǎn)義字符,注釋你都了解嗎_C 語言
- 2023-12-17 eclipse中設(shè)置自動補齊代碼
- 2022-07-22 Android Studio Arctic Fox 的不同之處
- 2022-08-26 C++中Boost的智能指針scoped_ptr_C 語言
- 最近更新
-
- window11 系統(tǒng)安裝 yarn
- 超詳細win安裝深度學(xué)習(xí)環(huán)境2025年最新版(
- Linux 中運行的top命令 怎么退出?
- MySQL 中decimal 的用法? 存儲小
- get 、set 、toString 方法的使
- @Resource和 @Autowired注解
- Java基礎(chǔ)操作-- 運算符,流程控制 Flo
- 1. Int 和Integer 的區(qū)別,Jav
- spring @retryable不生效的一種
- Spring Security之認證信息的處理
- Spring Security之認證過濾器
- Spring Security概述快速入門
- Spring Security之配置體系
- 【SpringBoot】SpringCache
- Spring Security之基于方法配置權(quán)
- redisson分布式鎖中waittime的設(shè)
- maven:解決release錯誤:Artif
- restTemplate使用總結(jié)
- Spring Security之安全異常處理
- MybatisPlus優(yōu)雅實現(xiàn)加密?
- Spring ioc容器與Bean的生命周期。
- 【探索SpringCloud】服務(wù)發(fā)現(xiàn)-Nac
- Spring Security之基于HttpR
- Redis 底層數(shù)據(jù)結(jié)構(gòu)-簡單動態(tài)字符串(SD
- arthas操作spring被代理目標對象命令
- Spring中的單例模式應(yīng)用詳解
- 聊聊消息隊列,發(fā)送消息的4種方式
- bootspring第三方資源配置管理
- GIT同步修改后的遠程分支