九九百科網

位置:首頁 > 經驗 > 

矩陣標準化步驟

經驗2.59W

矩陣標準化步驟

矩陣標準化的目的是,通過標準化處理,得到均值為0,標準差為1的服從標準正態分佈的數據。(相對一維數據來説,也就是相對矩陣的每一列,數據的每一個維度)矩陣標準化方法是樣本數據減去均值然後除以標準差。

1)、方便處理數據。在一些實際問題中,我們得到的樣本數據都是多個維度的,即一個樣本是用多個特徵來表徵的。比如在預測房價的問題中,影響房價的因素有房子面積、卧室數量等,我們得到的樣本數據就是有關房子面積與卧室數量的一些樣本點,這裏的樣本點對又被稱為特徵向量。很顯然,這些特徵的量綱和數值的量級都是不一樣的,在預測房價時,如果直接使用原始的數據值,那麼他們對房價的影響程度將是不一樣的,而通過標準化處理,可以使得不同的`特徵具有相同的Scale。這樣,在使用梯度下降法學習參數的時候,不同特徵對參數的影響程度就一樣了。

簡而言之,當原始數據不同維度上的特徵的尺度(單位)不一致時,需要標準化步驟對數據矩陣進行預處理。

2)、加快收斂速度。大部分數據矩陣歸一化後收斂速度會加快。

3)、提升精度。

4)、防止梯度爆炸。

標籤:矩陣 標準化