網站首頁 編程語言 正文
nn.RNN(input_size, hidden_size, num_layers=1, nonlinearity=tanh, bias=True, batch_first=False, dropout=0, bidirectional=False)
參數說明
- input_size輸入特征的維度, 一般rnn中輸入的是詞向量,那么 input_size 就等于一個詞向量的維度
- hidden_size隱藏層神經元個數,或者也叫輸出的維度(因為rnn輸出為各個時間步上的隱藏狀態)
- num_layers網絡的層數
- nonlinearity激活函數
- bias是否使用偏置
- batch_first輸入數據的形式,默認是 False,就是這樣形式,(seq(num_step), batch, input_dim),也就是將序列長度放在第一位,batch 放在第二位
- dropout是否應用dropout, 默認不使用,如若使用將其設置成一個0-1的數字即可
- birdirectional是否使用雙向的 rnn,默認是 False
- 注意某些參數的默認值在標題中已注明
輸入輸出shape
- input_shape = [時間步數, 批量大小, 特征維度] = [num_steps(seq_length), batch_size, input_dim]
- 在前向計算后會分別返回輸出和隱藏狀態h,其中輸出指的是隱藏層在各個時間步上計算并輸出的隱藏狀態,它們通常作為后續輸出層的輸?。需要強調的是,該“輸出”本身并不涉及輸出層計算,形狀為(時間步數, 批量大小, 隱藏單元個數);隱藏狀態指的是隱藏層在最后時間步的隱藏狀態:當隱藏層有多層時,每?層的隱藏狀態都會記錄在該變量中;對于像?短期記憶(LSTM),隱藏狀態是?個元組(h, c),即hidden state和cell state(此處普通rnn只有一個值)隱藏狀態h的形狀為(層數, 批量大小,隱藏單元個數)
代碼
rnn_layer = nn.RNN(input_size=vocab_size, hidden_size=num_hiddens, ) # 定義模型, 其中vocab_size = 1027, hidden_size = 256
num_steps = 35 batch_size = 2 state = None # 初始隱藏層狀態可以不定義 X = torch.rand(num_steps, batch_size, vocab_size) Y, state_new = rnn_layer(X, state) print(Y.shape, len(state_new), state_new.shape)
輸出
torch.Size([35, 2, 256]) ? ? 1 ? ? ? torch.Size([1, 2, 256])
具體計算過程
H t = i n p u t ? W x h + H t ? 1 ? W h h + b i a s H_t = input * W_{xh} + H_{t-1} * W_{hh} + bias Ht?=input?Wxh?+Ht?1??Whh?+bias[batch_size, input_dim] * [input_dim, num_hiddens] + [batch_size, num_hiddens] *[num_hiddens, num_hiddens] +bias
可以發現每個隱藏狀態形狀都是[batch_size, num_hiddens], 起始輸出也是一樣的
注意:上面為了方便假設num_step=1
GRU/LSTM等參數同上面RNN
原文鏈接:https://blog.csdn.net/orangerfun/article/details/103934290
相關推薦
- 2022-10-17 React的diff算法核心復用圖文詳解_React
- 2022-10-02 react?redux及redux持久化示例詳解_React
- 2022-11-11 Vant 3.* 底部安全區適配 部分頁面不生效
- 2022-04-18 WPF使用代碼創建數據模板DataTemplate_實用技巧
- 2022-10-14 Jboss使用jndi配置數據源連接數據庫
- 2022-12-15 Qt開發之使用socket實現遠程控制_C 語言
- 2022-08-10 .Net通過TaskFactory.FromAsync簡化APM_實用技巧
- 2022-11-08 go語言Pflag?Viper?Cobra?核心功能使用介紹_Golang
- 最近更新
-
- window11 系統安裝 yarn
- 超詳細win安裝深度學習環境2025年最新版(
- Linux 中運行的top命令 怎么退出?
- MySQL 中decimal 的用法? 存儲小
- get 、set 、toString 方法的使
- @Resource和 @Autowired注解
- Java基礎操作-- 運算符,流程控制 Flo
- 1. Int 和Integer 的區別,Jav
- spring @retryable不生效的一種
- Spring Security之認證信息的處理
- Spring Security之認證過濾器
- Spring Security概述快速入門
- Spring Security之配置體系
- 【SpringBoot】SpringCache
- Spring Security之基于方法配置權
- redisson分布式鎖中waittime的設
- maven:解決release錯誤:Artif
- restTemplate使用總結
- Spring Security之安全異常處理
- MybatisPlus優雅實現加密?
- Spring ioc容器與Bean的生命周期。
- 【探索SpringCloud】服務發現-Nac
- Spring Security之基于HttpR
- Redis 底層數據結構-簡單動態字符串(SD
- arthas操作spring被代理目標對象命令
- Spring中的單例模式應用詳解
- 聊聊消息隊列,發送消息的4種方式
- bootspring第三方資源配置管理
- GIT同步修改后的遠程分支