五種數據預處理方法
- 生活小竅門
- 關注:2.34W次
五種數據預處理方法:
1、墓於粗糙集理論的約簡方法。粗糙集理論是一種研究不精確、不確定性知識的數學工具。
2、基於概念樹的數據濃縮方法。在數據庫中,許多屬性都是可以進行數據歸類,各屬性值和概念依據抽象程度不同可以構成一個層次結構,概念的這種層次結構通常稱為概念樹。
3、信息論思想和普化知識發現。特徵知識和分類知識是普化知識的兩種主要形式,其算法基本上可以分為兩類:數據立方方法和麪向屬性歸納方法。
4、基於統計分析的屬性選取方法。可以採用統計分析中的一些算法來進行特徵屬性的選取,比如主成分分析、逐步迴歸分析、公共因素模型分析等。
5、遺傳算法。遺傳算法是一種基於生物進化論和分子遺傳學的全局隨機搜索算法。遺傳算法的基本思想是:將問題的可能解按某種形式進行編碼,形成染色體。
- 文章版權屬於文章作者所有,轉載請註明 https://shqsg.com/zh-mo/xiaoqiaomen/mozx92.html