當前位置:生活全書館 >

IT科技

> 資料預處理常見的幾種方法

資料預處理常見的幾種方法

資料預處理常見的幾種方法是:

資料預處理常見的幾種方法

1、墓於粗糙集( Rough Set)理論的約簡方法,粗糙集理論是一種研究不精確、不確定性知識的數學工具。現在受到了KDD的廣泛重視,利用粗糙集理論對資料進行處理是一種十分有效的精簡資料維數的方法。

2、基於概念樹的資料濃縮方法,在資料庫中,許多屬性都是可以進行資料歸類,各屬性值和概念依據抽象程度不同可以構成一個層次結構,概念的這種層次結構通常稱為概念樹。概念樹一般由領域專家提供,它將各個層次的概念按一般到特殊的順序排列。

3、資訊理論思想和普化知識發現,特徵知識和分類知識是普化知識的兩種主要形式,其演算法基本上可以分為兩類:資料立方方法和麵向屬性歸納方法。

4、基於統計分析的屬性選取方法,可以採用統計分析中的一些演算法來進行特徵屬性的選取,比如主成分分析、逐步迴歸分析、公共因素模型分析等。這些方法的共同特徵是,用少量的特徵元組去描述高維的原始知識基。

5、遺傳演算法(GA,Genetic Algo}thrn),遺傳演算法是一種基於生物進化論和分子遺傳學的全域性隨機搜尋演算法。遺傳演算法的基本思想是:將問題的可能解按某種形式進行編碼,形成染色體。隨機選取N個染色體構成初始種群。再根據預定的評價函式對每個染色體計算適應值。選擇適應值高的染色體進行複製,通過遺傳運算(選擇、交叉、變異)來產生一群新的更適應環境的染色體,形成新的種群。

標籤: 預處理
  • 文章版權屬於文章作者所有,轉載請註明 https://shqsg.com/dianzi/r54ezz.html