網站首頁編程語言正文

批標準化層?tf.keras.layers.Batchnormalization()解析_python

作者：壯壯不太胖^QwQ ? 更新時間： 2023-05-29 編程語言

批標準化層 tf.keras.layers.Batchnormalization()

tf.keras.layers.Batchnormalization()

重要參數：

training：布爾值，指示圖層應在訓練模式還是在推理模式下運行。
training=True：該圖層將使用當前批輸入的均值和方差對其輸入進行標準化。
training=False：該層將使用在訓練期間學習的移動統計數據的均值和方差來標準化其輸入。

BatchNormalization 廣泛用于 Keras 內置的許多高級卷積神經網絡架構，比如 ResNet50、Inception V3 和 Xception。

BatchNormalization 層通常在卷積層或密集連接層之后使用。

批標準化的實現過程

求每一個訓練批次數據的均值
求每一個訓練批次數據的方差
數據進行標準化
訓練參數γ，β
輸出y通過γ與β的線性變換得到原來的數值

在訓練的正向傳播中，不會改變當前輸出，只記錄下γ與β。在反向傳播的時候，根據求得的γ與β通過鏈式求導方式，求出學習速率以至改變權值。

對于預測階段時所使用的均值和方差，其實也是來源于訓練集。比如我們在模型訓練時我們就記錄下每個batch下的均值和方差，待訓練完畢后，我們求整個訓練樣本的均值和方差期望值，作為我們進行預測時進行BN的的均值和方差。

批標準化的使用位置

原始論文講在CNN中一般應作用與非線性激活函數之前，但是，實際上放在激活函數之后效果可能會更好。

# 放在非線性激活函數之前
model.add(tf.keras.layers.Conv2D(64, (3, 3)))
model.add(tf.keras.layers.BatchNormalization())
model.add(tf.keras.layers.Activation('relu'))

# 放在激活函數之后
model.add(tf.keras.layers.Conv2D(64, (3, 3), activation='relu'))
model.add(tf.keras.layers.BatchNormalization())

tf.keras.layers.BatchNormalization使用細節

關于keras中的BatchNormalization使用，官方文檔說的足夠詳細。本文的目的旨在說明在BatchNormalization的使用過程中容易被忽略的細節。

在BatchNormalization的Arguments參數中有trainable屬性；以及在Call arguments參數中有training。兩個都是bool類型。第一次看到有兩個參數的時候，我有點懵，為什么需要兩個？

后來在查閱資料后發現了兩者的不同作用。

1，trainable是Argument參數，類似于c++中構造函數的參數一樣，是構建一個BatchNormalization層時就需要傳入的，至于它的作用在下面會講到。

2，training參數時Call argument（調用參數），是運行過程中需要傳入的，用來控制模型在那個模式（train還是interfere）下運行。關于這個參數，如果使用模型調用fit()的話，是可以不給的（官方推薦是不給），因為在fit()的時候，模型會自己根據相應的階段（是train階段還是inference階段）決定training值，這是由learning——phase機制實現的。

重點

關于trainable=False：如果設置trainable=False，那么這一層的BatchNormalization層就會被凍結（freeze），它的trainable weights(可訓練參數)（就是gamma和beta）就不會被更新。

注意：freeze mode和inference mode是兩個概念。

但是，在BatchNormalization層中，如果把某一層BatchNormalization層設置為trainable=False，那么這一層BatchNormalization層將一inference mode運行，也就是說(meaning that it will use the moving mean and the moving variance to normalize the current batch, rather than using the mean and variance of the current batch).

總結

原文鏈接：https://blog.csdn.net/weixin_46072771/article/details/108591263

日本免费高清视频-国产福利视频导航-黄色在线播放国产-天天操天天操天天操天天操|www.shdianci.com

網站首頁編程語言正文

批標準化層?tf.keras.layers.Batchnormalization()解析_python

目錄