網站首頁 編程語言 正文
一、dim的定義
TensorFlow對張量的階、維度、形狀有著明確的定義,而在pytorh中對其的定義卻模糊不清,僅僅有一個torch.size()的函數來查看張量的大小(我理解的這個大小指的就是TensorFlow對張量的形狀描述,也和numpy的.shape類似)。
所以,首先要搞清楚如何看一個張量的形狀。
import torch
z = torch.ones(2,3,4)
print(z)
print(z.size())
print(z.size(0))
print(z.size(1))
print(z.size(2))
以上代碼的控制臺輸出為:
tensor([[[1., 1., 1., 1.],
? ? ? ? ?[1., 1., 1., 1.],
? ? ? ? ?[1., 1., 1., 1.]],
?
? ? ? ? [[1., 1., 1., 1.],
? ? ? ? ?[1., 1., 1., 1.],
? ? ? ? ?[1., 1., 1., 1.]]])
torch.Size([2, 3, 4])
2
3
4
可見,我們成功創建了一個(2,3,4)大小的張量,那么我們人工應該怎么辨別一個張量的大小呢?
為了直觀,我把這個張量的中括號調整一個位置:
[
? ? [
? ? ? ? ?[1., 1., 1., 1.],
? ? ? ? ?[1., 1., 1., 1.],
? ? ? ? ?[1., 1., 1., 1.]
? ? ],
?
? ? [
? ? ? ? ?[1., 1., 1., 1.],
? ? ? ? ?[1., 1., 1., 1.],
? ? ? ? ?[1., 1., 1., 1.]
? ? ]
]
我們可以看到:
- 第一層(最外層)中括號里面包含了兩個中括號(以逗號進行分割),這就是(2,3,4)中的2
- 第二層中括號里面包含了三個中括號(以逗號進行分割),這就是(2,3,4)中的3
- 第三層中括號里面包含了四個數(以逗號進行分割),這就是(2,3,4)中的4
結論:pytorch中的tensor維度可以通過第一個數前面的中括號數量來判斷,有幾個中括號維度就是多少。拿到一個維度很高的向量,將最外層的中括號去掉,數最外層逗號的個數,逗號個數加一就是最高維度的維數,如此循環,直到全部解析完畢。
我們還看到:
z.size(0) = 2,z.size(1) = 3,z.size(2) = 4
第0維度為2,第1維度為3,第2維度為4,即維度的標號是以0開始的
二、dim 的理解
網上很多對dim的理解,比如,dim=0,表示的是行,函數的意思就是不要行這一維度,保留列巴拉巴拉之類的,個人覺得不好理解。
比如下圖博主的理解
那我的理解就是:
控制變量法大家知道嗎??或者消融實驗?就是幾個方法或者實驗的比較,保持只有一個因素是可變的,其他都是一致的,就是控制變量法,論文術語也叫消融實驗。
所以,dim的使用也是這樣,只有dim指定的維度是可變的,其他都是固定不變的。
- dim = 0,列不變(按列-將當前列所有行數據-計算),指定的是行,那就是行變,理解成:針對每一列中,所有行之間的數據比較或者求和等操作,是每一行的比較,因為行是可變的。
- dim = 1,行不變(按行-將當前行所有列數據-計算),指定的是列,那就是列變,理解成:針對每一行中,所有列之間的數據比較或者求和等操作,是每一行的比較,因為行是可變的。
三、舉例
torch.argmax() ?
- ?得到最大值的序號索引
- dim=0保留列維度,不要行了,保留列的size就可以了
- dim=1保留行維度,不要列了,保留行的size就可以了
a = torch.rand((3,4))
print(a)
b = torch.argmax(a, dim=1) ##行不變,指定列,列之間的比較,對下面每列數值進行比較,將最大值對應序號存下,比如下面第一列中第一個值最大,為0,第二列中第二個是最大值,為1,第三列同
print(b)
>>tensor([[0.8338, 0.6953, 0.7558, 0.5803],
[0.2105, 0.7638, 0.0912, 0.3341],
[0.5585, 0.8019, 0.6590, 0.2268]])
>>tensor([0, 1, 1])
說明:dim=1,指定列,也就是行不變,列之間的比較,所以原來的a有三行,最后argmax()出來的應該也是三個值,第一行的時候,同一列之間比較,最大值是0.8338,索引是0,同理,第二行,最大值的索引是1……
sum()
求和
a = t.arange(0,6).view(2,3)
a
>>tensor([[0, 1, 2],
[3, 4, 5]])
a.sum()
a.sum(dim=0) #列不變,指定行,行是可變的,對每一列中的所有行之間的數值進行求和,比如這個例子中,第一列0+3,第二列1+4,第三列2+5
a.sum(dim=1) #行不變,指定列,列是可變的,對每一行中的所有列之間的數值進行求和,比如這個例子中,第一行0+1+2,第二行3+4+5
>>tensor(15.)
>>tensor([3., 5., 7.])
>>tensor([ 3., 12.])
說明:dim=0,指定行,行是可變的,列是不變,所以就是同一列中,每一個行的比較,所以a.sum(dim = 0),第一列的和就是3,第二列的和就是5,第三列的和就是7.
同理,a.sum(dim=1),指定列,列是可變的,行是不變的,所以就是同一列之間的比較或者操作,所以第一行的求和是3,第二行的求和是12
cumsum()
累加
a = t.arange(0,6).view(2,3)
a
>>tensor([[0, 1, 2],
[3, 4, 5]])
a.cumsum(dim=0) # 指定行,列不變,行變,從第一行到最后一行的累加
>>tensor([[0, 1, 2],
[3, 5, 7]])
a.cumsum(dim=1) # 指定列,行不變,列變,從第一列到最后一列的累加
>>tensor([[ 0, 1, 3],
[ 3, 7, 12]])
總結
原文鏈接:https://jingliu.blog.csdn.net/article/details/114262597
相關推薦
- 2022-10-23 Redis的過期鍵刪除策略原理說明_Redis
- 2023-03-19 一文掌握匯編語言?halt?命令_匯編語言
- 2022-12-23 利用Python實現簡易計算器的示例代碼_python
- 2022-06-21 C#連接數據庫的幾種方法_C#教程
- 2022-11-17 python標準庫random模塊處理隨機數_python
- 2024-03-06 Modbus通信及數據存儲讀取
- 2022-07-18 SQL?Server使用T-SQL進階之公用表表達式(CTE)_MsSql
- 2022-06-07 OpenStack虛擬機快照和增量備份實現方法_OpenStack
- 最近更新
-
- window11 系統安裝 yarn
- 超詳細win安裝深度學習環境2025年最新版(
- Linux 中運行的top命令 怎么退出?
- MySQL 中decimal 的用法? 存儲小
- get 、set 、toString 方法的使
- @Resource和 @Autowired注解
- Java基礎操作-- 運算符,流程控制 Flo
- 1. Int 和Integer 的區別,Jav
- spring @retryable不生效的一種
- Spring Security之認證信息的處理
- Spring Security之認證過濾器
- Spring Security概述快速入門
- Spring Security之配置體系
- 【SpringBoot】SpringCache
- Spring Security之基于方法配置權
- redisson分布式鎖中waittime的設
- maven:解決release錯誤:Artif
- restTemplate使用總結
- Spring Security之安全異常處理
- MybatisPlus優雅實現加密?
- Spring ioc容器與Bean的生命周期。
- 【探索SpringCloud】服務發現-Nac
- Spring Security之基于HttpR
- Redis 底層數據結構-簡單動態字符串(SD
- arthas操作spring被代理目標對象命令
- Spring中的單例模式應用詳解
- 聊聊消息隊列,發送消息的4種方式
- bootspring第三方資源配置管理
- GIT同步修改后的遠程分支