數據預處理的主要方法有哪些
經驗1.38W
數據的預處理是指對所收集數據進行分類或分組前所做的審核、篩選、排序等必要的處理;主要方法有數據清理,數據集成,數據變換,數據歸約等。
數據清理;數據清理例程通過填寫缺失的值、光滑噪聲數據、識別或刪除離羣點並解決不一致性來“清理”數據。主要是達到如下目標:格式標準化,異常數據清除,錯誤糾正,重複數據的清除。數據集成;數據集成例程將多個數據源中的數據結合起來並統一存儲,建立數據倉庫的過程實際上就是數據集成。數據變換;通過平滑聚集,數據概化,規範化等方式將數據轉換成適用於數據挖掘的形式。數據歸約;數據挖掘時往往數據量非常大,在少量數據上進行挖掘分析需要很長的時間,數據歸約技術可以用來得到數據集的歸約表示,它小得多,但仍然接近於保持原數據的完整性,並結果與歸約前結果相同或幾乎相同。
標籤:預處理
-
蜈組詞兩個字
蜈組詞兩個字有:蜈蚣、蜈蜊。蜈字讀作wú,蜈從蟲從吳,吳亦聲。吳本義為街頭説唱藝人,轉義為雜耍演員、雜耍表演。蟲與吳聯合起來表示一種像雜技團演員排着隊伍一起走路的蟲。...
-
李佳琦簡介
李佳琦,男,漢族,1992年10月出生,2011年考入南昌大學。電商主播,美粧達人,外號口紅一哥,美腕(上海)網絡科技有限公司合夥人。李佳琦曾於2018年9月成功挑戰30秒塗口紅最多人數的吉尼斯世界紀錄,成為塗口紅的世界紀錄保持者。2018年雙十一與馬雲PK賣口紅,最終戰勝馬雲。...
-
專業監理工程師職責
專業監理工程師的職責就是監督施工質量,確保工程質量符合標準和要求。他們負責對所管理工程質量、進度、安全、文明實施動態跟蹤管理,並及時發現和處理問題。此外,專業監理工程師還負責質量控制,包括核查進場材料、設備、構配件的原始憑證、檢測報告等質量證明文件...
-
薩提亞簡介
維吉尼亞薩提亞是舉世知名的心理治療師和家庭治療師,她是第一代的家庭治療師,從五十年代起已居於領導地位。她被《人類行為雜誌》譽為每個人的家庭治療大師,意思是指家庭治療是由她始創的,可見她在這方面的重大貢獻。...