資料分析 Big Data & Analytics (1)

基本介紹

教學目標

初步了解大數據與分析有四個重要的特性。

重點概念

大數據與分析主要有四個重要的特性,分別為資料量 (Volume)、速度 (Velocity)、多樣性 (Variety) 和真實性 (Veracity) 。

資料量 (Volume)

說明

主要與系統中資料量的快速增加有關,未來將會面臨系統延展和整合應用的挑戰。

轉變

將會從分析資料集,轉變為分析所有可用的資料內容。

速度 (Velocity)

說明

主要與擷取資料和分析機會有關,最短的時間內提供觀點與行動得以進行競爭。

轉變

將會從針對資料倉儲和市集中的資料進行分析,轉變為針對所有快速移動中的資料進行即時分析。

多樣性 (Variety)

說明

主要與管理許多類型的資料有關,每天建立的所有資料中有 80% 是非結構化的資料 (影片、圖片、郵件和社群媒體),所以要能將結構化資料與非結構化資料進行關聯分析。

轉變

將會從分析資料之前進行資料處理,轉變為只有當需要進行分析時才會進行資料處理。

可信度 (Veracity)

說明

當大數據的複雜程度提高時,就會很難建立可信度,然而對於決策分析而言,可信度非常重要。

轉變

從針對資料進行假設和測試,轉變為探索所有資料識別出關聯性。

相關資源