位置：首頁 > 經驗 >

矩陣標準化步驟

矩陣標準化的目的是，通過標準化處理，得到均值為0，標準差為1的服從標準正態分佈的數據。(相對一維數據來説，也就是相對矩陣的每一列，數據的每一個維度）矩陣標準化方法是樣本數據減去均值然後除以標準差。

1)、方便處理數據。在一些實際問題中，我們得到的樣本數據都是多個維度的，即一個樣本是用多個特徵來表徵的。比如在預測房價的問題中，影響房價的因素有房子面積、卧室數量等，我們得到的樣本數據就是有關房子面積與卧室數量的一些樣本點，這裏的樣本點對又被稱為特徵向量。很顯然，這些特徵的量綱和數值的量級都是不一樣的，在預測房價時，如果直接使用原始的數據值，那麼他們對房價的影響程度將是不一樣的，而通過標準化處理，可以使得不同的`特徵具有相同的Scale。這樣，在使用梯度下降法學習參數的時候，不同特徵對參數的影響程度就一樣了。

簡而言之，當原始數據不同維度上的特徵的尺度（單位）不一致時，需要標準化步驟對數據矩陣進行預處理。

2)、加快收斂速度。大部分數據矩陣歸一化後收斂速度會加快。

3)、提升精度。

4)、防止梯度爆炸。