網(wǎng)站首頁(yè) 編程語(yǔ)言 正文
MongoDB排序時(shí)內(nèi)存大小限制與創(chuàng)建索引的注意事項(xiàng)詳解_MongoDB
作者:小白碼上飛 ? 更新時(shí)間: 2022-06-30 編程語(yǔ)言線上服務(wù)的MongoDB中有一個(gè)很大的表,我查詢時(shí)使用了sort()
根據(jù)某個(gè)字段進(jìn)行排序,結(jié)果報(bào)了下面這個(gè)錯(cuò)誤:
[Error] Executor error during find command :: caused by :: Sort operation used more than the maximum 33554432 bytes of RAM. Add an index, or specify a smaller limit.
at line 0, column 0
這是個(gè)非常常見(jiàn)的MongoDB報(bào)錯(cuò)了。因?yàn)镸ongoDB處理排序時(shí),如果排序的字段沒(méi)有建立索引,會(huì)把全表都丟到內(nèi)存中處理。
If MongoDB cannot use an index or indexes to obtain the sort order, MongoDB must perform a blocking sort operation on the data. A blocking sort indicates that MongoDB must consume and process all input documents to the sort before returning results.
而內(nèi)存的大小并不是無(wú)限使用的,MongoDB的默認(rèn)設(shè)置是32MB。一旦數(shù)據(jù)量超過(guò)32MB,則會(huì)報(bào)錯(cuò)。
參數(shù)internalQueryExecMaxBlockingSortBytes
32MB這個(gè)限制是在參數(shù)internalQueryExecMaxBlockingSortBytes中控制。你可以在MongoDB的客戶端上直接查看這個(gè)參數(shù)的值,執(zhí)行以下語(yǔ)句:
db.runCommand({ getParameter: 1, "internalQueryExecMaxBlockingSortBytes": 1 })
返回如下結(jié)果:
// 1
{
? ? "internalQueryExecMaxBlockingSortBytes": NumberInt("33554432"),
? ? "ok": 1,
? ? "operationTime": Timestamp(1651142670, 1),
? ? "$clusterTime": {
? ? ? ? "clusterTime": Timestamp(1651142670, 1),
? ? ? ? "signature": {
? ? ? ? ? ? "hash": BinData(0, "X09M2FBji5f+FOwaK/nLTv4+Ybs="),
? ? ? ? ? ? "keyId": NumberLong("7080087363631710209")
? ? ? ? }
? ? }
}
所以解決排序時(shí)內(nèi)存使用超過(guò)32MB的問(wèn)題,有兩個(gè)方法:
給排序的字段加索引。具體怎么加索引,會(huì)在后面細(xì)講。
修改internalQueryExecMaxBlockingSortBytes參數(shù)的大小,使用命令如下:
db.adminCommand({ setParameter: 1, internalQueryExecMaxBlockingSortBytes: 104857600 })
MongoDB 4.3的internalQueryMaxBlockingSortMemoryUsageBytes
我準(zhǔn)備在本地的MongoDB上復(fù)現(xiàn)這個(gè)問(wèn)題,于是把這個(gè)表直接導(dǎo)入到本地MongoDB中。結(jié)果發(fā)現(xiàn)排序時(shí)并沒(méi)有報(bào)錯(cuò)。使用上面的命令查看internalQueryExecMaxBlockingSortBytes參數(shù)的值時(shí),返回如下結(jié)果:
[17][ProtocolError] no option found to get
Google了一下,發(fā)現(xiàn)了MongoDB的官方網(wǎng)站上的兩個(gè)相關(guān)JIRA。
第一個(gè)JIRA [SERVER-44053] Rename setParameter for maximum memory usage of blocking sort - MongoDB Jira里表示,在4.3.1版本時(shí),因?yàn)閰?shù)命名描述不清楚,所以將參數(shù)internalQueryExecMaxBlockingSortBytes改為了internalQueryMaxBlockingSortMemoryUsageBytes。這解釋了為什么我執(zhí)行查詢參數(shù)的語(yǔ)句時(shí),沒(méi)有返回結(jié)果。
第二個(gè)JIRA [SERVER-50767] internalQueryExecMaxBlockingSortBytes causing config exception on mongod load - Mongo中,Comments里提到了,新的internalQueryMaxBlockingSortMemoryUsageBytes參數(shù),默認(rèn)值從32MB改成了100MB。也許我的這個(gè)表使用100MB內(nèi)存進(jìn)行排序就夠用了,所以沒(méi)有報(bào)錯(cuò)。
所以在4.3以上的版本(本機(jī)是5.0.4),執(zhí)行以下命令:
db.runCommand({ getParameter: 1, "internalQueryMaxBlockingSortMemoryUsageBytes": 1 })
可以看到查詢結(jié)果:
{ "internalQueryMaxBlockingSortMemoryUsageBytes": NumberInt("104857600"), "ok": 1 }
而服務(wù)器上的MongoDB版本為4.0.3,因此是爆出來(lái)最上面的問(wèn)題。
排序字段如何加索引?
這是個(gè)很簡(jiǎn)單的問(wèn)題,你用哪個(gè)字段排序,就對(duì)哪個(gè)字段加索引就好了。比如我要根據(jù)A字段進(jìn)行排序,則增加A字段的索引。
-- 加索引 db.bigMongoTable.createIndex({ "A": 1 }); -- 查詢 db.bigMongoTable.find({}).sort({ "A": 1 });
但是如果我改主意了,我要根據(jù)A、B兩個(gè)字段做排序:
db.bigMongoTable.find({}).sort({ "A": 1, "B": 1 });
那么熟悉的報(bào)錯(cuò)就又回來(lái)了。
是的!機(jī)智的MongoDB并不會(huì)像我們想的那樣,先用上A的索引,從而省點(diǎn)力氣。他依舊會(huì)把全部的數(shù)據(jù)丟到內(nèi)存里排序……
那我再加個(gè)B字段的索引吧,畢竟在MongoDB查詢的時(shí)候,對(duì)兩個(gè)字段分別建單鍵索引,靈活性比直接建一個(gè)復(fù)合索引要好一些,而且MongoDB的索引交集也可以讓這兩個(gè)單鍵索引實(shí)現(xiàn)和復(fù)合索引一樣的效果。
哦,不行喲,還是那個(gè)報(bào)錯(cuò)。
所以,當(dāng)多字段排序時(shí),你必須要建一個(gè)包含了這些字段的復(fù)合索引,且要注意以下幾點(diǎn):
- 查詢時(shí)參與排序的多個(gè)字段的順序,要和創(chuàng)建的索引每個(gè)字段的順序保持一致。比如你創(chuàng)建的索引是:
db.bigMongoTable.createIndex({"A":1,"B":1,"C":1});
那么你的排序語(yǔ)句也要按照順序如下:sort({"A":1,"B":1,"C":1})
。如果你調(diào)換A和B的順序,如下:sort({"B":1,"A":1,"C":1})
,則索引不會(huì)生效。 - 參與查詢的字段少于索引的字段,則要保證符合前綴匹配。還是第一點(diǎn)里的索引,如果排序語(yǔ)句是這樣:
sort({"A":1,"B":1})
,則索引繼續(xù)生效。如果是這樣:sort({"A":1,"C":1})
,則無(wú)法生效。這個(gè)你可以理解成和MySQL類似,索引都是按照最左匹配規(guī)則去觸發(fā)的,一條索引的中間部分跳過(guò)了就無(wú)效了。 - 參與sort的字段的排序方式,要和創(chuàng)建索引時(shí)的排序方式保持完全一致,或者完全相反。對(duì)于第一點(diǎn)里的索引,如果查詢
sort({"A":-1,"B":1})
或者sort({"A":1,"B":-1})
,索引則不會(huì)生效。只有在查詢sort({"A":1,"B":1})
或者sort({"A":-1,"B":-1})
時(shí),索引才會(huì)生效。
總結(jié)
- MongoDB的查詢結(jié)果在進(jìn)行排序時(shí),如果排序字段沒(méi)有添加索引,會(huì)將數(shù)據(jù)全部放到內(nèi)存中計(jì)算。如果數(shù)據(jù)量過(guò)大,超過(guò)配置的內(nèi)存大小,則會(huì)報(bào)錯(cuò)。
- 4.3版本之前,使用內(nèi)存的最大值通過(guò)參數(shù)internalQueryExecMaxBlockingSortBytes控制,默認(rèn)為32MB。4.3版本之后,通過(guò)參數(shù)internalQueryMaxBlockingSortMemoryUsageBytes控制。
- 正常的解決方式是添加索引,但是索引要包括全部參與排序的字段,且要遵循前綴匹配策略。
原文鏈接:https://www.cnblogs.com/codeflyer/p/16227595.html
相關(guān)推薦
- 2022-05-23 iOS實(shí)現(xiàn)簡(jiǎn)單分欄效果_IOS
- 2022-04-09 整合Spring + SpringMVC + Mybatis基礎(chǔ)框架的配置文件
- 2022-12-10 MongoDB中的push操作詳解(將文檔插入到數(shù)組)_MongoDB
- 2022-09-03 詳解Docker鏡像的基本操作方法_docker
- 2022-11-27 網(wǎng)站https訪問(wèn)是443端口還是433端口_服務(wù)器其它
- 2022-11-30 React之錯(cuò)誤邊界?Error?Boundaries示例詳解_React
- 2022-08-12 python算法加密?pyarmor與docker_python
- 2023-03-22 Nginx轉(zhuǎn)發(fā)丟失cookie表現(xiàn)形式及解決方案_nginx
- 最近更新
-
- window11 系統(tǒng)安裝 yarn
- 超詳細(xì)win安裝深度學(xué)習(xí)環(huán)境2025年最新版(
- Linux 中運(yùn)行的top命令 怎么退出?
- MySQL 中decimal 的用法? 存儲(chǔ)小
- get 、set 、toString 方法的使
- @Resource和 @Autowired注解
- Java基礎(chǔ)操作-- 運(yùn)算符,流程控制 Flo
- 1. Int 和Integer 的區(qū)別,Jav
- spring @retryable不生效的一種
- Spring Security之認(rèn)證信息的處理
- Spring Security之認(rèn)證過(guò)濾器
- Spring Security概述快速入門(mén)
- Spring Security之配置體系
- 【SpringBoot】SpringCache
- Spring Security之基于方法配置權(quán)
- redisson分布式鎖中waittime的設(shè)
- maven:解決release錯(cuò)誤:Artif
- restTemplate使用總結(jié)
- Spring Security之安全異常處理
- MybatisPlus優(yōu)雅實(shí)現(xiàn)加密?
- Spring ioc容器與Bean的生命周期。
- 【探索SpringCloud】服務(wù)發(fā)現(xiàn)-Nac
- Spring Security之基于HttpR
- Redis 底層數(shù)據(jù)結(jié)構(gòu)-簡(jiǎn)單動(dòng)態(tài)字符串(SD
- arthas操作spring被代理目標(biāo)對(duì)象命令
- Spring中的單例模式應(yīng)用詳解
- 聊聊消息隊(duì)列,發(fā)送消息的4種方式
- bootspring第三方資源配置管理
- GIT同步修改后的遠(yuǎn)程分支