當前位置:生活全書館 >

學習教育

> 大資料的特點

大資料的特點

大資料的特點

1、大資料有4個特點,為別為:Volume(大量)、Variety(多樣)、Velocity(高速)、Value(價值),一般我們稱之為4V。

2、大量。大資料的特徵首先就體現為“大”,從先Map3時代,一個小小的MB級別的Map3就可以滿足很多人的需求,然而隨著時間的推移,儲存單位從過去的GB到TB,乃至現在的PB、EB級別。隨著資訊科技的高速發展,資料開始爆發性增長。社交網路(微博、推特、臉書)、行動網路、各種智慧工具,服務工具等,都成為資料的來源。淘寶網近4億的會員每天產生的商品交易資料約20TB;臉書約10億的使用者每天產生的日誌資料超過300TB。迫切需要智慧的演算法、強大的資料處理平臺和新的資料處理技術,來統計、分析、預測和實時處理如此大規模的資料。

3、多樣。廣泛的資料來源,決定了大資料形式的多樣性。任何形式的資料都可以產生作用,目前應用最廣泛的就是推薦系統,如淘寶,網易雲音樂、今日頭條等,這些平臺都會通過對使用者的日誌資料進行分析,從而進一步推薦使用者喜歡的東西。日誌資料是結構化明顯的資料,還有一些資料結構化不明顯,例如音訊、視訊等,這些資料因果關係弱,就需要人工對其進行標註。

4、高速。大資料的產生非常迅速,主要通過網際網路傳輸。生活中每個人都離不開網際網路,也就是說每天個人每天都在向大資料提供大量的資料。並且這些資料是需要及時處理的,因為花費大量資本去儲存作用較小的歷史資料是非常不划算的,對於一個平臺而言,也許儲存的資料只有過去幾天或者一個月之內,再遠的資料就要及時清理,不然代價太大。基於這種情況,大資料對處理速度有非常嚴格的要求,伺服器中大量的資源都用於處理和計算資料,很多平臺都需要做到實時分析。資料無時無刻不在產生,誰的速度更快,誰就有優勢。

5、價值。這也是大資料的核心特徵。現實世界所產生的資料中,有價值的資料所佔比例很小。相比於傳統的小資料,大資料最大的價值在於通過從大量不相關的各種型別的資料中,挖掘出對未來趨勢與模式預測分析有價值的資料,並通過機器學習方法、人工智慧方法或資料探勘方法深度分析,發現新規律和新知識,並運用於農業、金融、醫療等各個領域,從而最終達到改善社會治理、提高生產效率、推進科學研究的效果。

標籤:
  • 文章版權屬於文章作者所有,轉載請註明 https://shqsg.com/xuexijiaoyu/20k1p5.html