【資料科學】 - 大數據崛起

大數據崛起 - 管理的革命

推薦讀物:Big Data: The Management Revolution (繁中版 ) 

-  Harvard Business Review, October, 2012

隨著網路的興起與普及,每個人所製造的資料量也隨之提升,因此過去公司內部存在的分析方法漸漸無法適用現代,也因為有了發展新的分析方法的需求,資料分析,開始變成一門學問,人們開始研究如何從錯綜複雜的數據中,找到輔助公司營運的資訊。


為什麼傳統的分析方法無法適用現代?

現今數據的特性:3V (Volume、Velocity、Variety),大量、速度快、多元性,此三種特性,使得人們無法再以簡單的圖表、傳統的統計分析(回歸、假設驗證等)觀察出數據中的端倪、趨勢,必須透過一些資料處理的工具、資料視覺化的呈現,甚至是資料探勘、機器學習、人工智慧等,才得以挖掘出數據隱含的訊息,更進一步達到預測、假設分析。


大數據的 5Vs

從傳統的3V演進到現今的5V,雖然有些新增的層面感覺有點贅述,但是學術界及產業界有這些說法,小編也就在此提供給大家參考!

(1) Volume - 資料的大量性

(2) Velocity - 資料生成的快速性

(3) Variety - 資料種類的多樣性

(4) Veracity - 資料的可信度

(5) Value - 資料的價值性

上列五項特性,因分析主題及面向有許多不一樣的定義及情況,深入探討會有更多深奧的理論及判斷基準,在此就不深入研討大數據 Vs 的特性,有興趣的讀者可以進行Google相關分享文章(關鍵字:Big Data's 3Vs/4Vs/5Vs),會有許多相關探討,如果只是單純想瞭解上述5Vs的定義,在此推薦此篇文章


大數據、人工智慧促使管理革命

從大數據盛行至今,從傳統製造業到電子商務、網路公司等,甚至是養殖業、傳統農林漁牧業,都開始推行「企業數據決策文化」(知名企業如鴻海、華碩等),也因為越來越多成功的數據分析案例,許多企業甚至成立專責小組/部門,於許多不同領域的業務導入資料科學的應用,不僅達到節省營運成本、發掘潛在商機,甚至是創造新的商業模式等。


案例分享

許多經典的數據分析案例推動企業間重視大數據/數據分析/機器學習,也進而推動資料科學的發展。

● 啤酒、尿布,零售業的資料科學應用 (resource)

零售業中,如何正確地瞭解顧客的消費行為是一門重要的學問,因此預測變成最重要的議題之一,傳統的統計分析從商品的擺設位置、定價、顧客於賣場動向設計、客群的定位、促銷活動策略等,都深深地影響著零售業的業績。

美國一跨國零售企業,沃爾瑪(Walmart),大量蒐集顧客的消費資訊過後,發現了一個不為常理能推斷的祕密:尿布及啤酒經常出現在同一消費明細上,尤其是在周五一般公司的下班時段(約傍晚4-7點),這個發現讓數據分析師有了更多的假設:尿布與啤酒出現於消費明細上是偶然,或是有特定的客群會進行消費呢?

在做了許多假設後,數據分析員決定去驗證假設,果不其然,他們發現:在每周五下班時段,會固定有一客群,下班後的爸爸,至Walmart買一手 Friday Night 要喝的啤酒,同時受媽媽囑咐,買了家中嬰兒一週用量的尿布;發現了這個現象後,Walmart也開始針對此客群進行行銷手法,將尿布與啤酒同時擺設在靠近店門口的位置,並推動促銷專案,甚至將一些附加商品也擺設於鄰近位置,例如:嬰兒用品、零嘴等等,供消費者透過精心規劃的路徑擺設,快速購置齊全所需的物品!


未來的文章,自由團隊將提供讀者們更多案例分享文章,介紹更多資料科學於現實生活中的應用,同時將計畫提供更多實務操作的專題文章,請讀者們敬請期待!