大數據分析的研究方法概念
本週期刊分享會的夥伴們
導讀了一篇大數據的經典文章
馬丁. 希爾伯特(Martin Hilbert)回顧了
約180篇關於大數據分析的期刊論文
並於2016年發表了一篇文章[1]
《 Big Data for Development: A Review of Promises and Challenges》
談到大數據分析的前景與挑戰
他歸結出五項大數據的重要特徵
以下簡單對其中兩項
顛覆傳統社會科學研究的概念進行分享
1.大數據的產生不是專為特定目的
為了預測流感
美國疾病管制局(CDC)要求醫生
只要碰到新型流感病例
就必須馬上通報
這種調查背後的資料有其特定目的
但Google透過大數據分析
對5,000萬個使用者常用的搜尋字串
以及2003年到2008年間季節性流感的傳播資料進行比對
進而發展出預測流感的模型
這些搜尋字串本身並非為了特定目的所記錄的資料
有趣的是
Google透過大數據所進行的分析效益
遠勝於公部門透過專屬資料所獲得的預測結果
過去
我們往往為了單一的研究目的
設計各種取得數據資料來源的方法
(例如:透過各種調查)
而大數據時代
則是利用網路上的各種資料
透過數據分析技術
得到預測結果並創造潛在商機
2.大數據取代隨機抽樣
在進行市場調查時
因為成本時效的限制
無法對母體進行普查
所以會透過抽樣
來進行各種統計分析
(如:收視率調查、滿意度調查、民意調查...等)
但其預測結果
也會因受限於抽樣而產生誤差
但透過大數據所獲得的資料
許多即為母體資料
因此不需要再進行抽樣
舉例來說
手機、電腦在許多國家的普及率已經超過了90%
透過手機、電腦裡的記錄
並利用大數據分析
所得到的結果效益也常常高於傳統的市調方法
在以上的概念發展下
傳統社會科學研究方法與新興社會科學研究方法
將會如何激盪
進而產生出何種火花
我們拭目以待
加油!
Peter
[1] Hilbert, Martin (2016), “Big Data for Development: A Review of Promises and Challenges,” Development Policy Review, Volume 34, Issue 1, January 2016, Pages 135–174.