科學研究演進的四種典範
以下與大家分享最近看到的一個概念
曾經獲得資訊科學領域中
最高榮譽圖靈獎(Turing Award)的得主Jim Gray
提出「科學典範」(Science Paradigm)的概念
並認為科學研究的演進
有以下四種典範[1]:
1.第一典範「科學實驗」:
以記錄方式,呈現實驗結果,描述自然現象
2.第二典範「理論推演」:
發展理論,建立模型,歸納驗證
3.第三典範「模擬仿真」:
透過電腦,對複雜現象進行模擬
4.第四典範「數據密集」:
對數據進行探索(data exploration,又稱eScience)
而大數據(Big data)
就是屬於上述科學研究的第四典範(Paradigm)
圖 科學研究演進的四種典範
繪圖:周晏汝
其中
第三典範「模擬仿真」與第四典範「數據密集」
都是利用電腦來對數據進行處理
兩者之間的差異
來自於第三典範「模擬仿真」
會先釐清問題
先確認假設
再利用數據進行分析與驗證
而第四典範「數據密集」則是先有大數據
然後透過分析
發現未知的理論
第四典範的作法
不強調推論「因果」(cause and effect)
而是強調發現「相關」(correlation)
這種思維
顛覆了傳統的做法
(另外對於「相關不等於因果」有興趣的同學,
推薦大家一個網站,裡面有許多有趣的案例。
spurious-correlations
http://tylervigen.com/spurious-correlations)
第四典範「數據密集」的研究概念
強調以完整的數據來進行分析
只要數據是真實的
我們就能了解資料背後的各種行為
進而找出模型
有興趣的同學
不妨再深入了解一下
加油!
Peter
[1] The Fourth Paradigm: Data-intensive Scientific Discovery (T. Hey, S. Tansley, and K. Tolle, 2009)