當前位置:生活全書館 >

生活小竅門

> 大資料技術可以分為哪幾種類型

大資料技術可以分為哪幾種類型

大資料技術可以分為資料收集、資料存取、基礎架構、資料處理、統計分析、資料探勘、模型預測、結果呈現。以下是詳細介紹:

大資料技術可以分為哪幾種類型

1、資料收集:在大資料的生命週期中,資料採集處於第一個環節。根據MapReduce產生資料的應用系統分類,大資料的採集主要有4種來源:管理資訊系統、Web資訊系統、物理資訊系統、科學實驗系統。

2、資料存取:大資料的存去採用不同的技術路線,大致可以分為3類。第1類主要面對的是大規模的結構化資料。第2類主要面對的是半結構化和非結構化資料。第3類面對的是結構化和非結構化混合的大資料,

3、基礎架構:雲端儲存、分散式檔案儲存等。

4、資料處理:對於採集到的不同的資料集,可能存在不同的結構和模式,如檔案、XML 樹、關係表等,表現為資料的異構性。對多個異構的資料集,需要做進一步整合處理或整合處理,將來自不同資料集的資料收集、整理、清洗、轉換後,生成到一個新的資料集,為後續查詢和分析處理提供統一的資料檢視

5、統計分析:假設檢驗、顯著性檢驗、差異分析、相關分析、T檢驗、方差分析、卡方分析、偏相關分析、距離分析、迴歸分析、簡單迴歸分析、多元迴歸分析、逐步迴歸、迴歸預測與殘差分析、嶺迴歸、logistic迴歸分析、曲線估計、因子分析、聚類分析、主成分分析、因子分析、快速聚類法與聚類法、判別分析、對應分析、多元對應分析(最優尺度分析)、bootstrap技術等等。

6、資料探勘:目前,還需要改進已有資料探勘和機器學習技術;開發資料網路挖掘、特異群組挖掘、圖挖掘等新型資料探勘技術;突破基於物件的資料連線、相似性連線等大資料融合技術;突破使用者興趣分析、網路行為分析、情感語義分析等面向領域的大資料探勘技術。

7、模型預測:預測模型、機器學習、建模模擬。

8、結果呈現:雲端計算、標籤雲、關係圖等。

標籤: 哪幾種 技術
  • 文章版權屬於文章作者所有,轉載請註明 https://shqsg.com/xiaoqiaomen/g33wr5.html