網(wǎng)站首頁 編程語言 正文
pytorch Backward過程用時太長
問題描述
使用pytorch對網(wǎng)絡(luò)進行訓(xùn)練的時候遇到一個問題,forward階段很快(只需要幾毫秒),backward階段卻用時很長(需要十多秒)。
導(dǎo)致這個問題的原因很容易被大家忽視,而且網(wǎng)上基本上沒有直接的解決方案,經(jīng)過一天的折騰,總算把導(dǎo)致這個問題的原因搞清楚了。
解決方案
導(dǎo)致這個問題的原因在于訓(xùn)練數(shù)據(jù)的淺拷貝,由于backward過程中的梯度是和模型推理過程中的張量相關(guān)的,如果這些張量在被模型使用之前沒有被深拷貝,意味著backward過程的會重復(fù)從這些張量的原始內(nèi)存地址中取值,這個過程非常耗時。所以為了避免這個問題,需要養(yǎng)成一個好習(xí)慣,就是將張量數(shù)據(jù)輸入模型之前進行深拷貝
pytorch的深拷貝方式如下:
tensor_a = tensor_b.clone().detach()
Pytorch backward()簡單理解
backward()是反向傳播求梯度,具體實現(xiàn)過程如下
import torch
x=torch.tensor([1,2,3],requires_grad=True,dtype=torch.double)
y=x**2
z=y.mean()
z.backward()
print(x.grad)
結(jié)果
tensor([0.6667, 1.3333, 2.0000], dtype=torch.float64)
有幾個重要的點
1.必須要加上requires_grad=True才能求
2. 一般來說,需要標量才能求梯度。
3.具體過程如下:
z是一個標量(1*1矩陣)分別對x1,x2,x3求偏導(dǎo), 再代入x1,x2,x3的數(shù)值,就是如上程序輸出的結(jié)果
總結(jié)
原文鏈接:https://blog.csdn.net/ahhhhhh520/article/details/124864850
- 上一篇:沒有了
- 下一篇:沒有了
相關(guān)推薦
- 2022-04-27 Python基礎(chǔ)學(xué)習(xí)之認識線程_python
- 2022-05-13 數(shù)據(jù)結(jié)構(gòu)學(xué)習(xí)筆記——順序存儲結(jié)構(gòu)實現(xiàn)棧
- 2022-12-09 Oracle遞歸查詢簡單示例_oracle
- 2022-07-15 Sql?Server存儲過程詳解_MsSql
- 2022-04-27 簡單聊聊PyTorch里面的torch.nn.Parameter()_python
- 2023-01-02 Kotlin中空判斷與問號和感嘆號標識符使用方法_Android
- 2022-09-01 MongoDB對Document(文檔)的插入、刪除及更新_MongoDB
- 2022-04-11 K8S部署Kafka界面管理工具(kafkamanager)方法詳解_云其它
- 欄目分類
-
- 最近更新
-
- window11 系統(tǒng)安裝 yarn
- 超詳細win安裝深度學(xué)習(xí)環(huán)境2025年最新版(
- Linux 中運行的top命令 怎么退出?
- MySQL 中decimal 的用法? 存儲小
- get 、set 、toString 方法的使
- @Resource和 @Autowired注解
- Java基礎(chǔ)操作-- 運算符,流程控制 Flo
- 1. Int 和Integer 的區(qū)別,Jav
- spring @retryable不生效的一種
- Spring Security之認證信息的處理
- Spring Security之認證過濾器
- Spring Security概述快速入門
- Spring Security之配置體系
- 【SpringBoot】SpringCache
- Spring Security之基于方法配置權(quán)
- redisson分布式鎖中waittime的設(shè)
- maven:解決release錯誤:Artif
- restTemplate使用總結(jié)
- Spring Security之安全異常處理
- MybatisPlus優(yōu)雅實現(xiàn)加密?
- Spring ioc容器與Bean的生命周期。
- 【探索SpringCloud】服務(wù)發(fā)現(xiàn)-Nac
- Spring Security之基于HttpR
- Redis 底層數(shù)據(jù)結(jié)構(gòu)-簡單動態(tài)字符串(SD
- arthas操作spring被代理目標對象命令
- Spring中的單例模式應(yīng)用詳解
- 聊聊消息隊列,發(fā)送消息的4種方式
- bootspring第三方資源配置管理
- GIT同步修改后的遠程分支