【資料科學】 - 面向與觀點

資料科學 - 面向與觀點

推薦讀物:Putting Predictive Analytics to Work

-  Harvard Business Review, September, 2017

在進行數據分析前,有許多前置作業必須要進行,除了確認分析報告的方向、瞭解需求對象的目標外,還需要去思考分析後可能的產出,以及能夠帶給目標聽眾什麼資訊,進一步去提供更深一層的知識或工具,甚至是潛在的發展契機等。

下列將討論分析的主要三個面向:

(1) 描述型分析(Descriptive Analytics) 

(2) 預測型分析(Predictive Analytics)

(3) 指示型分析(Prescriptive Analytics)


描述型分析 (Descriptive Analytics)

透過描述性分析,分析過去的資料 (可能為公司內部或是市場的資料) 來進行『闡述過去發生的事情』;其中分析的維度可能涵括:事件發生的頻率、事件發生的原因、事件影響的規模、事件的嚴重程度...等各種資料所傳達出來的訊息;正常情況下,採取適當的量化分析方法,往往便能驗證一班管理者常常有的"直覺性"質化分析。


例:某A公司在2018年度的營業額,相較去年的同期比,營業額成長了20%,但是淨利卻減少10%,透過數據分析後發現:每筆訂單的獲利率皆與2017年度相近,但隨著訂單的來源由中國慢慢轉移至美國,同時正逢美金貶值,導致匯差,獲利大幅下滑,即使客戶的訂單量上升,但是製造成本維持固定的情況下,美金轉換成台幣的淨利卻因而縮水。


預測型分析 (Predictive Analytics)

基於描述性分析後所建立的模型上,進行『未來事件的預測』;透過特性的選擇(feature selection),並經由描述性分析所建立的模型,依據現有的數據、現行的情況,來預測事件發生的可能性,或事件發生的情況等。


例:透過描述性分析過去氣象局天氣的數據,其中包括雲層厚度、空氣濕度、季節、大氣壓力、溫度、時辰、風的速度等特性(feature),進而去紀錄天晴情況(晴天、陰天、雨天、雨量,甚至是颱風的狀況等),最後透過現時的天氣狀況,去預測天氣陰晴,或是預測颱風形成、侵襲的時機點與路徑。



指示型分析(Prescriptive Analytics)


經過描述型分析後的模型以及預測型分析的結果,進行『未來事件的模擬』;透過以過往資料所建立的數據模型,調整可控的參數、操縱變數,來預估事件未來改變的狀況;換言之,透過自主調整未來情境下的參數,進而去預測事件發生的結果。


例:大賣場業者透過顧客的交易資料,了解顧客A的消費習慣後,提供其類似產品的廣告(網路廣告、實體信件等),是為「描述型分析」;再進一步透過同一消費者族群分析後,推薦其他顧客A可能購買的物品,是為「預測型分析」;最後推出他牌產品的促銷、產品組合販售增強消費者的選購意願,達到「指示型分析」。

※在【資料科學】 - 大數據崛起 一文中所提及"尿布與啤酒"的知名案例,便是指示型分析的成功典範。


在分析實務上,基於三大分析的面向,延伸出五大分析觀點去探究:


1.  What happened? And Why?  (描述型分析)

過去發生了什麼事情,為何發生這些事情?


2.  What is happening right now? (預測型分析)

現在正在發生什麼事情?


3.  What is likely to happen? (預測型分析)

那麼接下來可能會發現什麼事情呢?


4.  What is likely to have happened? (指示型分析)

假設接下來的情況,那麼事情會如何發展、發生什麼事情?


5.  Is there anything interesting and important? (*探索分析)

除了我們一直關注的議題之外,在分析中,還有什麼有趣或重要的發現?


*『探索分析』 - Discovery Analysis,通常是指在進行數據分析的過程中,資料科學家及分析需求者獲得"未預期"的結果,往往這一類的發現總有著出人意表的訊息。



瞭解三大分析面向的概念後,能提升數據分析師對於分析議題的敏感度,並延伸出五大分析的觀點,不僅能有更結構化的分析報告產出,更能使分析有方向、呈現更專業的資料科學邏輯


若有任何疑問或建議,我們相當歡迎讀者們,針對此議題來信與自由團隊做進一步探討喔!(Email: AI.Free.Team@gmail.com)