網(wǎng)站首頁 編程語言 正文
模型訓練時GPU利用率太低的原因
最近在訓練SSD模型時發(fā)現(xiàn)GPU的利用率只有8%,而CPU的利用率卻非常高。
后來了解到,一般使用CPU進行數(shù)據(jù)的讀取和預處理,而使用GPU進行模型的正向傳播和反向傳播。由于CPU數(shù)據(jù)讀取跟不上(讀到內存+多線程+二進制文件),而GPU的處理速度太快,導致GPU的利用率不高。
最后總結一下,有的時候模型訓練慢并不是因為顯卡不行或者模型太大,而是在跑模型過程中有一些其他的操作導致速度很慢,尤其是文件的IO操作,這會導致GPU得不到連續(xù)性使用,整體速度特別慢。
問題的解決辦法
1,關閉一些日志記錄,減少日志IO操作頻率。
2,NVIDA提供了DALI庫,可以將數(shù)據(jù)處理轉移到GPU上。
模型訓練GPU利用率低,占用低怎么破
GPU 的顯存占用和算力利用直接影響模型的訓練速度
GPU 顯存占用低問題
1、提高batch_size
2、提高模型輸入尺寸
3、增加模型深度
推薦:優(yōu)先提高batch_size, 其他方法會對模型結構產(chǎn)生影響
GPU利用率低問題
1、提高線程數(shù)
2、打開pin_memory
# 在pytorch 加載數(shù)據(jù)時提高線程數(shù),打開pin_memory
torch.utils.data.DataLoader(image_datasets[x],
? ? ? ? ? ? ? ? ? ? ? ? ? ? batch_size=batch_size,?
? ? ? ? ? ? ? ? ? ? ? ? ? ? shuffle=True,
? ? ? ? ? ? ? ? ? ? ? ? ? ? num_workers=8,
? ? ? ? ? ? ? ? ? ? ? ? ? ? pin_memory=True)
總結
原文鏈接:https://blog.csdn.net/weixin_43213895/article/details/108186447
- 上一篇:沒有了
- 下一篇:沒有了
相關推薦
- 2022-03-29 python實現(xiàn)矩陣乘法_python
- 2024-03-01 【Promise】promise關鍵問題和解決辦法
- 2023-07-08 keycloak更新token調用updateToken函數(shù)無效,解決辦法
- 2022-06-02 Android?View的事件體系教程詳解_Android
- 2023-02-06 C#實現(xiàn)將聊天數(shù)據(jù)發(fā)送加密_C#教程
- 2022-08-05 RedisConfig 配置文件
- 2022-01-31 element-ui upload組件 上傳文件類型限制
- 2022-04-25 Python實現(xiàn)實時增量數(shù)據(jù)加載工具的解決方案_python
- 欄目分類
-
- 最近更新
-
- window11 系統(tǒng)安裝 yarn
- 超詳細win安裝深度學習環(huán)境2025年最新版(
- Linux 中運行的top命令 怎么退出?
- MySQL 中decimal 的用法? 存儲小
- get 、set 、toString 方法的使
- @Resource和 @Autowired注解
- Java基礎操作-- 運算符,流程控制 Flo
- 1. Int 和Integer 的區(qū)別,Jav
- spring @retryable不生效的一種
- Spring Security之認證信息的處理
- Spring Security之認證過濾器
- Spring Security概述快速入門
- Spring Security之配置體系
- 【SpringBoot】SpringCache
- Spring Security之基于方法配置權
- redisson分布式鎖中waittime的設
- maven:解決release錯誤:Artif
- restTemplate使用總結
- Spring Security之安全異常處理
- MybatisPlus優(yōu)雅實現(xiàn)加密?
- Spring ioc容器與Bean的生命周期。
- 【探索SpringCloud】服務發(fā)現(xiàn)-Nac
- Spring Security之基于HttpR
- Redis 底層數(shù)據(jù)結構-簡單動態(tài)字符串(SD
- arthas操作spring被代理目標對象命令
- Spring中的單例模式應用詳解
- 聊聊消息隊列,發(fā)送消息的4種方式
- bootspring第三方資源配置管理
- GIT同步修改后的遠程分支