Caffe 中的正則化損失(重量衰減)

求解器檔案中,我們可以使用 weight_decayregularization_type 選項設定全域性正則化損失。

在許多情況下,我們需要不同層的不同重量衰減率。這可以通過為網路定義檔案中的每一層設定 decay_mult 選項來完成,其中 decay_mult 是全域性權重衰減率的乘數,因此應用於一層的實際權重衰減率為 decay_mult*weight_decay

例如,以下定義了卷積層,無論解算器檔案中的選項如何都沒有權重衰減。

layer {
  name: "Convolution1"
  type: "Convolution"
  bottom: "data"
  top: "Convolution1"
  param {
    decay_mult: 0
  }
  convolution_param {
    num_output: 32
    pad: 0
    kernel_size: 3
    stride: 1
    weight_filler {
      type: "xavier"
    }
  }
}

有關更多資訊,請參閱此主題