近幾年,因為科技的發展與環境逐漸成熟,大數據在台灣也開始獲得很多關注而熱門起來。許多學校紛紛開設大數據課程、學程、或學院。並積極從資工、商管、統計等各種面向切入。現在,要蒐集並分析上億筆的數據,都可以透過電腦程式設計,在彈指間完成。如何利用大數據資料庫,建立正確的模型,解讀和分析數據背後所隱藏的事實,讓我們能更了解這個複雜的世界,為下一步行動提前做準備。
大數據資料的特色
●數據不論多大,仍是樣本
●資料需依理論篩選,否則容易迷失在海量資料中
●消費模型的正確性比數據本身更重要
●因果關係很重要
●這個世界是複雜的,亦需要複雜的模型詮釋人的行為
客觀的大數據+精密的統計分析=正確的決策
(節錄自任立中教授於前程文事業有限公司2016Autumn Catalog之專欄文章)
本書特色
●本書集結行銷、製造、雲端、醫療、會計、零售、社群、農業、金融、電商、地理、運動等十二大產業。讓您一窺大數據的全貌。
●31位頂尖學者與業界精英,將最精華的理論與實務結合。
●您將洞悉「大數據戰略4.0」的:
■四大戰略:資源整合、平台建置、創意思維、新創業態。
■四大內涵:理論、模型、預測、決策。
專文推薦
臺灣大學校長 楊泮池
前行政院院長 張善政
科技部管一學門總召集人 陳厚銘
作者介紹
作者簡介
王能超
學歷:臺灣大學地理環境資源研究所碩士
現職:崧旭資訊股份有限公司董事長
任立中
學歷:美國俄亥俄州立大學商學院行銷博士
現職:臺灣大學統計碩士學位學程暨統計教學中心主任
佘日新
學歷:英國華威大學商學院行銷暨策略管理博士
現職:逢甲大學講座教授
吳師豪
學歷:臺北大學企業管理博士
現職:高雄第一科技大學行銷與流通管理系副教授
李宗儒
學歷:美國德州農工大學博士
現職:中興大學行銷學系教授
周筱玲
學歷:臺灣大學財務金融研究所碩士
現職:元大期貨股份有限公司總經理
姚焱堯
學歷:政治大學應用數學研究所碩士
現職:筆記網路股份有限公司董事長
張少熙
學歷:臺灣師範大學運動與休閒學院教育學博士
現職:臺灣師範大學教授兼學務長
張慶賀
學歷:朝陽科技大學資訊管理研究所
現職:行政院農業委員會農糧署企劃組資訊科科長
張錦鋒
學歷:彰化師範大學工學博士
現職:達佛羅企業有限公司董事長兼總經理
梁錦琳
學歷:臺灣大學管理學院EMBA 碩士、美國伊利諾州立大學大眾傳播碩士
現職:鼎鼎聯合行銷股份有限公司總經理
梅筱珍
學歷:暨南國際大學國際企業學系博士
現職:財團法人中衛發展中心創新製造部副總經理
郭政弘
學歷:臺灣大學商學碩士
現職:勤業眾信聯合會計師事務所總裁
陳冠州
學歷:美國密西根州州立大學應用經濟學、餐旅資訊系
統博士
現職:美國普渡大學西北分校商學院副院長
陳傑豪
學歷:波士頓大學資訊科技碩士
現職:MIGO 功典執行長
陳博文
學歷:臺北科技大學資管與運籌碩士
現職:筆記網路股份有限公司研發主管
黃俊堯
學歷:英國倫敦商學院行銷博士
現職:臺灣大學工商管理學系暨商學研究所教授
黃薇如
學歷:美國南加州大學資訊碩士、政治大學商學院EMBA 碩士
現職:Yahoo 亞太區研發工程部副總經理
楊弘仁
學歷:約翰霍普金斯公衛學院博士班
現職:敏盛醫療體系執行長
楊立偉
學歷:臺灣大學資訊管理研究所博士
現職:意藍資訊董事總經理(創辦人)
楊馥瑜
學歷:暨南國際大學經濟學系碩士
現職:暨南國際大學新興產業策略與發展博士學位學程博士生
溫在弘
學歷:臺灣大學工學博士
現職:臺灣大學地理環境資源系副教授
董澍琦
學歷:美國賓州費城Drexel 大學財務金融學博士
現職:中興大學財務金融學系教授
賈景光
學歷:臺灣大學工程碩士學位、政治大學國際經營管理碩士
現職:IBM 全球企業諮詢服務事業群總經理
劉鏡清
學歷:臺灣大學商學研究所
現職:資誠企管顧問股份有限公司合夥人兼副董事長
潘國才
學歷:成功大學航空測量研究所
現職:國家發展委員會資訊管理處處長
蔡佳宏
學歷:臺灣大學EMBA 100 級碩士班會計與管理決策組畢業
現職:伊雲谷數位科技執行長
盧信銘
學歷:美國亞利桑那大學資訊管理博士
現職:臺灣大學資訊管理學系所副教授
諶家蘭
學歷:美國馬里蘭大學博士
現職:政治大學會計學系特聘教授
謝邦昌
學歷:臺灣大學生物統計學博士
現職:臺北醫學大學管理學院院長
簡均宇
學歷:亞洲大學企業經濟與策略博士班畢業
現職:南投縣南投市僑建國小科任教師
王能超
學歷:臺灣大學地理環境資源研究所碩士
現職:崧旭資訊股份有限公司董事長
任立中
學歷:美國俄亥俄州立大學商學院行銷博士
現職:臺灣大學統計碩士學位學程暨統計教學中心主任
佘日新
學歷:英國華威大學商學院行銷暨策略管理博士
現職:逢甲大學講座教授
吳師豪
學歷:臺北大學企業管理博士
現職:高雄第一科技大學行銷與流通管理系副教授
李宗儒
學歷:美國德州農工大學博士
現職:中興大學行銷學系教授
周筱玲
學歷:臺灣大學財務金融研究所碩士
現職:元大期貨股份有限公司總經理
姚焱堯
學歷:政治大學應用數學研究所碩士
現職:筆記網路股份有限公司董事長
張少熙
學歷:臺灣師範大學運動與休閒學院教育學博士
現職:臺灣師範大學教授兼學務長
張慶賀
學歷:朝陽科技大學資訊管理研究所
現職:行政院農業委員會農糧署企劃組資訊科科長
張錦鋒
學歷:彰化師範大學工學博士
現職:達佛羅企業有限公司董事長兼總經理
梁錦琳
學歷:臺灣大學管理學院EMBA 碩士、美國伊利諾州立大學大眾傳播碩士
現職:鼎鼎聯合行銷股份有限公司總經理
梅筱珍
學歷:暨南國際大學國際企業學系博士
現職:財團法人中衛發展中心創新製造部副總經理
郭政弘
學歷:臺灣大學商學碩士
現職:勤業眾信聯合會計師事務所總裁
陳冠州
學歷:美國密西根州州立大學應用經濟學、餐旅資訊系
統博士
現職:美國普渡大學西北分校商學院副院長
陳傑豪
學歷:波士頓大學資訊科技碩士
現職:MIGO 功典執行長
陳博文
學歷:臺北科技大學資管與運籌碩士
現職:筆記網路股份有限公司研發主管
黃俊堯
學歷:英國倫敦商學院行銷博士
現職:臺灣大學工商管理學系暨商學研究所教授
黃薇如
學歷:美國南加州大學資訊碩士、政治大學商學院EMBA 碩士
現職:Yahoo 亞太區研發工程部副總經理
楊弘仁
學歷:約翰霍普金斯公衛學院博士班
現職:敏盛醫療體系執行長
楊立偉
學歷:臺灣大學資訊管理研究所博士
現職:意藍資訊董事總經理(創辦人)
楊馥瑜
學歷:暨南國際大學經濟學系碩士
現職:暨南國際大學新興產業策略與發展博士學位學程博士生
溫在弘
學歷:臺灣大學工學博士
現職:臺灣大學地理環境資源系副教授
董澍琦
學歷:美國賓州費城Drexel 大學財務金融學博士
現職:中興大學財務金融學系教授
賈景光
學歷:臺灣大學工程碩士學位、政治大學國際經營管理碩士
現職:IBM 全球企業諮詢服務事業群總經理
劉鏡清
學歷:臺灣大學商學研究所
現職:資誠企管顧問股份有限公司合夥人兼副董事長
潘國才
學歷:成功大學航空測量研究所
現職:國家發展委員會資訊管理處處長
蔡佳宏
學歷:臺灣大學EMBA 100 級碩士班會計與管理決策組畢業
現職:伊雲谷數位科技執行長
盧信銘
學歷:美國亞利桑那大學資訊管理博士
現職:臺灣大學資訊管理學系所副教授
諶家蘭
學歷:美國馬里蘭大學博士
現職:政治大學會計學系特聘教授
謝邦昌
學歷:臺灣大學生物統計學博士
現職:臺北醫學大學管理學院院長
簡均宇
學歷:亞洲大學企業經濟與策略博士班畢業
現職:南投縣南投市僑建國小科任教師
目錄
推薦序 楊泮池 - 大數據戰略4.0:資源整合·平台建置·創意思維·新創業態
推薦序 張善政 - 大數據戰略4.0
推薦序 陳厚銘 - 大數據是21 世紀的新石油及新生產要素
自序 任立中 - 大數據戰略4.0:理論·模型·預測·決策
第1 章 行銷大數據1
任立中
壹、從行銷1.0 到行銷4.0 3
貳、建立行銷資料庫9
參、用行銷語言解讀統計模式14
肆、大數據的稀少性:一對一行銷22
陳傑豪
NPT(Next Purchase Time)回購時間預測協助零售百貨精準行銷24
第2 章 製造大數據31
佘日新、梅筱珍、楊馥瑜
壹、台灣廠商的突圍及產業變革32
貳、製造業要如何大數據33
參、老字號食品公司數位化變身39
肆、數據分析的衍繹與管理44
伍、大數據之下的創新商業模式46
賈景光 案例一
壹、吃軟也吃硬,大數據才有大價值51
貳、加快運作效率:本土材料大廠51
參、改造客戶體驗並強化關係:Olli 無人駕駛小巴52
肆、成為顛覆者而不被顛覆:John Deere 把農機變「農金」54
伍、台灣產業應擴充整體能力55
張錦鋒 案例二
達佛羅企業有限公司57
第3 章 雲端大數據63
陳冠州
壹、大數據源起64
貳、大數據的應用價值66
參、大數據面臨的挑戰69
肆、雲端源起71
伍、雲端運算72
陸、大數據與雲端運算結合的趨勢74
柒、雲端運算和大數據的個人隱私討論76
捌、總結81
蔡佳宏 案例
尚凡國際創新科技打造社群媒合配對第一品牌84
第4 章 醫療大數據91
謝邦昌
壹、大數據緣起92
貳、醫療大數據的發展93
參、醫療大數據的應用98
肆、大數據在電子病例之應用—台灣全民健康保險研究資料庫103
伍、醫療大數據的未來趨勢108
楊弘仁 案例
壹、彙整機構片段資訊,提供個人化醫療服務115
貳、串聯醫療機構形成價值鏈,提高醫療附加價值116
第5 章 會計大數據119
諶家蘭
壹、引言120
貳、大數據與會計專業123
參、大數據對於會計審計的影響132
肆、結語137
劉鏡清 案例一
壹、透過大數據降低費用,並防止舞弊141
貳、善用大數據與IOT,改善績效與財報141
參、減少人為作業時間、成本與風險,增加客戶服務競爭力143
肆、大數據協助改善經營風險及防制洗錢144
郭政弘 案例二
壹、會計師事務所裡的數據科學147
貳、數據分析應用實例148
參、會計師事務所的大數據規劃152
第6 章 零售大數據155
吳師豪
壹、生活中無所不在的大數據156
貳、零售業發展趨勢與困境156
參、零售業屬性與大數據的關聯性158
肆、零售運用大數據的案例161
伍、零售運用大數據的情境模式166
陸、零售運用大數據的成功關鍵因素170
柒、零售大數據相關議題171
捌、結論173
附錄、服務場域運用ICT 蒐集分析顧客購物旅程的大數據173
梁錦琳 案例
由零售大數據看消費趨勢176
第7 章 社群大數據183
盧信銘
壹、社群媒體:主要功能與病毒現象185
貳、資料特性188
參、社群大數據分析191
肆、結語203
楊立偉 案例
OpView 網路輿情觀測平台及社群口碑資料庫205
第8 章 農業大數據213
李宗儒、簡均宇
壹、前言214
貳、農糧產銷資料庫建立215
參、農業產銷資訊及相關系統217
肆、肥料銷售作業資訊化及其應用221
伍、結論226
潘國才、張慶賀 案例
農業資訊發展與大數據227
第9 章 金融大數據235
董澍琦
壹、前言236
貳、金融大數據之來源及價值挖掘238
參、金融大數據的特徵241
肆、大數據於金融業務之應用246
伍、結語252
周筱玲 案例
壹、互聯網保險254
貳、互聯網金融257
第10 章電商大數據261
黃俊堯
壹、電子商務不同發展階段與數據的關聯262
貳、電子商務的多元面貌265
參、顧客導向的電商數據分析267
肆、電子商務與大數據268
伍、不同電商經營型態下的數據來源270
陸、電子商務的數據分析272
柒、電子商務的數據應用274
捌、電商大數據的學界研究前景275
黃薇如 案例
未來電商決戰點!掌握客戶需求是關鍵279
第11 章 地理大數據285
溫在弘
壹、空間維度的思考方式286
貳、從地圖繪製到地理數據:空間決策的基礎287
參、從地理數據到地理「大」數據:智慧城市的想像291
肆、地理大數據的資料型態293
伍、地理大數據的應用價值298
陸、結語:挑戰與展望302
王能超 案例
壹、大數據商情分析服務系統303
貳、印尼森林大火的監控與管理系統─災害應對的群眾外包資料整合分析平台306
第12 章運動大數據309
張少熙
壹、發展緣起310
貳、核心架構313
參、發展主軸318
肆、未來趨勢322
伍、結論324
姚焱堯、陳博文 案例
健行/運動筆記325
推薦序 張善政 - 大數據戰略4.0
推薦序 陳厚銘 - 大數據是21 世紀的新石油及新生產要素
自序 任立中 - 大數據戰略4.0:理論·模型·預測·決策
第1 章 行銷大數據1
任立中
壹、從行銷1.0 到行銷4.0 3
貳、建立行銷資料庫9
參、用行銷語言解讀統計模式14
肆、大數據的稀少性:一對一行銷22
陳傑豪
NPT(Next Purchase Time)回購時間預測協助零售百貨精準行銷24
第2 章 製造大數據31
佘日新、梅筱珍、楊馥瑜
壹、台灣廠商的突圍及產業變革32
貳、製造業要如何大數據33
參、老字號食品公司數位化變身39
肆、數據分析的衍繹與管理44
伍、大數據之下的創新商業模式46
賈景光 案例一
壹、吃軟也吃硬,大數據才有大價值51
貳、加快運作效率:本土材料大廠51
參、改造客戶體驗並強化關係:Olli 無人駕駛小巴52
肆、成為顛覆者而不被顛覆:John Deere 把農機變「農金」54
伍、台灣產業應擴充整體能力55
張錦鋒 案例二
達佛羅企業有限公司57
第3 章 雲端大數據63
陳冠州
壹、大數據源起64
貳、大數據的應用價值66
參、大數據面臨的挑戰69
肆、雲端源起71
伍、雲端運算72
陸、大數據與雲端運算結合的趨勢74
柒、雲端運算和大數據的個人隱私討論76
捌、總結81
蔡佳宏 案例
尚凡國際創新科技打造社群媒合配對第一品牌84
第4 章 醫療大數據91
謝邦昌
壹、大數據緣起92
貳、醫療大數據的發展93
參、醫療大數據的應用98
肆、大數據在電子病例之應用—台灣全民健康保險研究資料庫103
伍、醫療大數據的未來趨勢108
楊弘仁 案例
壹、彙整機構片段資訊,提供個人化醫療服務115
貳、串聯醫療機構形成價值鏈,提高醫療附加價值116
第5 章 會計大數據119
諶家蘭
壹、引言120
貳、大數據與會計專業123
參、大數據對於會計審計的影響132
肆、結語137
劉鏡清 案例一
壹、透過大數據降低費用,並防止舞弊141
貳、善用大數據與IOT,改善績效與財報141
參、減少人為作業時間、成本與風險,增加客戶服務競爭力143
肆、大數據協助改善經營風險及防制洗錢144
郭政弘 案例二
壹、會計師事務所裡的數據科學147
貳、數據分析應用實例148
參、會計師事務所的大數據規劃152
第6 章 零售大數據155
吳師豪
壹、生活中無所不在的大數據156
貳、零售業發展趨勢與困境156
參、零售業屬性與大數據的關聯性158
肆、零售運用大數據的案例161
伍、零售運用大數據的情境模式166
陸、零售運用大數據的成功關鍵因素170
柒、零售大數據相關議題171
捌、結論173
附錄、服務場域運用ICT 蒐集分析顧客購物旅程的大數據173
梁錦琳 案例
由零售大數據看消費趨勢176
第7 章 社群大數據183
盧信銘
壹、社群媒體:主要功能與病毒現象185
貳、資料特性188
參、社群大數據分析191
肆、結語203
楊立偉 案例
OpView 網路輿情觀測平台及社群口碑資料庫205
第8 章 農業大數據213
李宗儒、簡均宇
壹、前言214
貳、農糧產銷資料庫建立215
參、農業產銷資訊及相關系統217
肆、肥料銷售作業資訊化及其應用221
伍、結論226
潘國才、張慶賀 案例
農業資訊發展與大數據227
第9 章 金融大數據235
董澍琦
壹、前言236
貳、金融大數據之來源及價值挖掘238
參、金融大數據的特徵241
肆、大數據於金融業務之應用246
伍、結語252
周筱玲 案例
壹、互聯網保險254
貳、互聯網金融257
第10 章電商大數據261
黃俊堯
壹、電子商務不同發展階段與數據的關聯262
貳、電子商務的多元面貌265
參、顧客導向的電商數據分析267
肆、電子商務與大數據268
伍、不同電商經營型態下的數據來源270
陸、電子商務的數據分析272
柒、電子商務的數據應用274
捌、電商大數據的學界研究前景275
黃薇如 案例
未來電商決戰點!掌握客戶需求是關鍵279
第11 章 地理大數據285
溫在弘
壹、空間維度的思考方式286
貳、從地圖繪製到地理數據:空間決策的基礎287
參、從地理數據到地理「大」數據:智慧城市的想像291
肆、地理大數據的資料型態293
伍、地理大數據的應用價值298
陸、結語:挑戰與展望302
王能超 案例
壹、大數據商情分析服務系統303
貳、印尼森林大火的監控與管理系統─災害應對的群眾外包資料整合分析平台306
第12 章運動大數據309
張少熙
壹、發展緣起310
貳、核心架構313
參、發展主軸318
肆、未來趨勢322
伍、結論324
姚焱堯、陳博文 案例
健行/運動筆記325
序
推薦序
大數據戰略4.0:資源整合‧平台建置‧創意思維‧新創業態
近幾年,「大數據」議題備受所有的產官學研等矚目,不論是個人、企業、產業、社會、政府、教育、國家、乃至全球都深受其影響,乃因大數據本身的特性具有大量性(Volume)、即時性(Velocity)、多樣性(Variety)、以及不確定性(Veracity)等4V屬性,反映出大數據將對整個人類文明產生衝擊。
面對當前大數據所將帶來的變化,我們要如何因應呢?如何結合科技、社會科學和人文等各領域的知識,回應知識經濟時代的需求,歸納本書十二項主題、三十一位作者群的論述,總結《大數據戰略4.0》的四大戰略為:資源整合、平台建置、創意思維與新創業態等,以對應4V特徵的衝擊與挑戰。亦即巨量的資料代表著各方的資源,因此首要的戰略就是必須要能有效地整合;而基於即時性的挑戰,一個高效能且更開放的平台,必須快速建置,是第二項戰略;有了這些基礎之後,第三項戰略就是培植創意人才,也就是讓具有創意思維的元素加入整個戰略的發展,以有效運用、解讀、跨領域的應用大數據所帶給我們的多樣性特質;第四項戰略則是要執行「Big Data+」的策略,創造新創業態的形成。
本書的內容提供了十二大產業的具體案例與理論基礎,讓讀者能充分了解上述四大戰略綱領的精義,難能可貴。為因應大數據時代,大學教育的內涵與機制也需要與時俱進,不僅要能隨著時代潮流做必要的調整,更必須能透過卓越的學術研究與教學,引領潮流。臺大為國內歷史悠久、最具規模、學風自由、思想多元、領域均衡的大學,希望能夠培育出具備專業領域能力的學生,也期盼學生具有獨立思考和創新能力,因為創新才是臺灣能夠在未來常保競爭力的根基,能為臺灣的發展注入更多能量。故本校全面推動創造力與創新能力的教育,培養學生創新思考、解決問題,以及跨領域的創新設計與實作之能力,以成為具社會關懷有使命感的人才,能回饋貢獻人類社會,從而提升國家競爭力,讓臺灣能永續發展。
本書總編輯任立中教授於今年8 月接任本校統計教學中心主任暨統計碩士學位學程主任,便積極投入心力,進行必要之改造。希望本書中面對變革的策略能在校園校務中迅速落實,逐步推動,共同打造本校成為國際學術研究重鎮。
楊泮池
臺灣大學校長
推薦序
大數據戰略4.0
日前臺灣大學任立中教授攜來一本書籍草稿《大數據戰略4.0》,集結國內產學菁英就行銷、製造以至於地理、運動共計十二個領域大數據的應用,撰寫推動戰略,堪稱當今國內大數據應用的經典。
要推動大數據的發展,各界莫不摩拳擦掌、躍躍欲試,但也無不面臨人才、經驗、專業能力匱乏的挑戰。我們臺灣推動大數據,究竟應該採取什麼策略,才能在不落人後,甚至在國際上有一席之地?表面上來看,大數據是資通訊領域一個新的境界,應該是由資通訊來引領風潮。的確,國際上類如Google 等先進業者,因為本身營運所需而開發出不少異於傳統資料處理分析的技術與工具,而且以開放的態度在網路上提供各界使用,因而被認為是大數據應用的先驅。而傳統的資料處理與統計方法,也有被翻轉的跡象,因此我們應該密切追隨、急起直追。但是,進一步去想,其實Google 等企業之所以發展出這些技術,是基於解決本身大數據應用(搜尋)的問題。換言之,是被其特有的應用需求所驅動。
大數據的許多應用,其實是具有專屬性或地域性的,例如大數據在金融業、製造業的應用,臺灣與其他國家會有不同的地方。這些應用,如果我們自己不去推動,其他國家大概也不會有人會替我們推動。因此,在推動大數據的策略上,「應用導向」應該是毋庸置疑的事。而基礎技術與工具的研發,也應該是基於充分的應用經驗與需求來驅動,而不是一昧追求國際上的熱門題目,落入發表期刊論文的迷思。本人在行政院副院長、院長任內推動大數據的政策應用,如要說有一個最重要的心得,莫過於此一體會。
也因此,任立中教授編輯的這本書具有特別的意義。坊間不乏翻譯的國際大數據應用書籍,但是要切入臺灣應用的精髓,莫如本書。期待讀者能藉由此書,激發出更多的應用創意,讓臺灣的大數據應用,能在國際上引領風騷!
張善政
前行政院院長
東吳大學巨資學院榮譽院長
推薦序
大數據是21 世紀的新石油及新生產要素
「大數據」於當今社會的重要性與對產業的影響力,已不可言喻。美國歐巴馬政府將「大數據」視為「21 世紀的新石油」,是「挖不完的金礦」。《大數據》作者麥爾荀伯格教授更將「大數據」看成是未來企業除了人才與設備、土地外,最重要的生產要素。《經濟學人》也認為「大數據」會「比你更了解你自己」。在日本,軟銀機器人Pepper 透過大數據的分析,能夠辨識顧客表情,與人開心互動交談。因此有些人將「大數據」譬喻為舊時的指南針,現代的望遠鏡與雷達,能幫助企業掌舵,激發各種創新、創意與創價的可能,從而創造出更多商機與成功的機會。
「大數據」擁有巨量性(Volume)、即時性(Velocity)、多樣性(Variety)以及不確定性(Veracity)等4V屬性。數據的「大」與「多」並不重要,端看如何精煉與應用,從4V的特性中萃取其價值。「大數據」開闢了新境界,轉變人們對世界的基本理解,環看周遭發生的大變化,就會知道這場巨量資料革命已然開始。企業如果想要保持領先地位,確定未來的商業模式如何改變,決策者必須站在這「大數據」的浪頭上,樂觀而務實的看待資料革命,因應新局並有效掌握該淘金密碼,挖掘這龐大潛藏的價值。
「大數據」的應用是跨領域連結的,無遠弗屆。最近非常火紅的寶可夢(Pokémon GO)尋寶遊戲,帶動了擴增實境、遊戲、文創,以及穿戴裝置等相關產業商機,將地理大數據的應用發揮到極致,創造出新的「寶可夢經濟學」。
任立中教授主編的《大數據戰略4.0》鉅著,終於在千呼萬喚中具現,是完遂多年來臺灣管理學界一直希望有學者願意編著一本有理論基礎以及臺灣產業實務意涵的「大數據」中文書籍。
該書內容分為十二個章節,每個章節涵蓋兩部分,分別由該領域的頂尖研究學者以及產業專家撰寫相關「大數據」的理論與應用內容。包括行銷大數據、製造大數據、雲端大數據、醫療大數據、會計大數據、零售大數據、社群大數據、農業大數據、金融大數據、電商大數據、地理大數據、運動大數據等。內容豐富,架構完整,輔以經典「大數據」案例說明,讓讀者看懂了「大數據」的威力與偉大的應用。
例如,伊拉波疫情擴散的監控、PM2.5 的空污感測、交通流量的管控、商情分析與服務系統的建立等,都是地理大數據應用的典範案例。醫院利用醫療大數據,可進行疫情和健康趨勢分析、強化醫學研發與用藥精準醫療等功能;Deloitte 透過會計大數據,能有效降低專案承接風險,並利用「審計雲」以及班佛定律和視覺化分析,可成功提高審計績效;John Deere 在IBM 大數據平台系統支援下,分析天氣資料(如溫度、濕度)以及土壤資料(如酸鹼度、特殊元素濃度),預測不同時間點應使用的水量、種子與化肥,幫助農民規劃最適當的農耕路徑和灌溉方式,從而節省農機油耗和灌溉用水,就是最佳的農業大數據成功應用;Olli 無人駕駛迷你公車可配備人工智慧列車長,與乘客交談並建議乘客的最佳用餐地點及觀光景點,最後Olli 載乘客到最近的捷運站,便是製造大數據最佳的應用典範。
「資料庫行銷」是「大數據」應用最多與最具代表性的一門學科,本書總編輯任立中教授,二十多年前就率先在臺灣大學開設「資料庫行銷」,是全臺灣第一位講授此一門課程的學者。任教授目前任教於臺灣大學國企系,並擔任臺灣大學統計碩士學位學程暨統計教學中心主任,同時兼任中華應用統計學會理事長、台灣行銷科學學會秘書長等職,多年來熱衷於教學研究工作,有豐富的學術涵養與實戰經驗。任教授是專攻行銷管理與行銷研究的學者,尤其在行銷決策模式與資料庫行銷等主題研究,有非常卓越的成果與貢獻,近年來更有兩篇非常重要的文章分別發表在Journal of Marketing Research〈JMR〉與Journal of American Statistics Association〈Journal of JASA〉二大世界頂尖學術期刊。在臺灣行銷學術界,任教授是唯一在該兩大期刊發表論述的管理學者,也是第一位在行銷三大期刊〈JMR〉發表著作的臺灣研究學者,有非常崇高的學術地位。
《大數據戰略4.0》是任立中教授與多位傑出學者及產業菁英數年來知識智慧的累積,確實是一本「大數據」的知識與應用寶典,不管是教師、學生或各行各業有志從事「大數據」相關工作的專業人士,都值得投注時間仔細研讀,必能有所獲得。在此,本人樂意將這本經典好書推薦給讀者共享。
陳厚銘
臺灣大學國企系特聘教授兼科技部管理一學門召集人
自序
大數據戰略4.0:理論‧模型‧預測‧決策
洞人心扉.動人心扉
Read people’s minds. Touch their souls.
當開始籌畫本書內容的時候,放在會議桌上的第一個問題就是:「什麼是大數據4.0」?有人說數據就是數據,難道0 到9 十個數字還有四種不同的演進或寫法?其實自人類有歷史以來,結繩記事、干支記數,數據的蒐集、紀錄、彙整、分析與應用,是人類文明得以傳承、昇華之關鍵。所以,如果就「數據」的發展歷程來看,4.0 意味著四個不同的演進階段。
大數據1.0:在1970 年代以前,最早期的數據大多是將直接觀察到的現象,透過人工的方式加以記錄下來。此時的數據量以當今的標準當然是稀少到不足以掛齒,但以當時的條件,其量不可謂不巨大。重點是分析的方法大多是一種描述性的說明。譬如100 位工廠作業員的動作如何影響產量(資料量:100×2)。
大數據2.0:到了1980 年代開始,當人們可以更有系統地蒐集資料時,所需面對的資料除了量體的進一步增加,其複雜度亦逐步攀升。譬如衡量1,000 位消費者生活型態的問項有一百個變數(資料量:1000×100)。此時簡單的敘述性統計已無法有效萃取出有用的資訊,而須藉助較複雜的統計分析模型(例如:多變量統計分析),才得以幫助決策者獲得關鍵的資訊。
大數據3.0:電腦之發展於1990 年代開始成熟,資料庫的建置愈來愈普及。不僅記錄了成千上萬橫斷面資料的紀錄,更加入了時間的動態性。譬如記錄100 萬名會員消費者在過去365 天對於1 萬個產品的購買交易紀錄(資料量:1,000,000×10,000×365)。再譬如一個生產製程中,有3 萬個查核點,每個查核點有1 千個變數,每秒均產生一個紀錄。一年下來的資料量:30,000×1,000×60×60×24×365=946,080,000,000,000。可想而知,此時單純的多變量或時間序列的統計分析模型,已不足以掌握此種整合縱斷面與橫斷面資料(簡稱縱橫資料Panel Data)之複雜性。更新更複雜的現代統計理論,結合更快速的電腦計算模擬功能,迅速發展成為大數據推波助瀾之關鍵因素。
大數據4.0:網際網路從2000 年開始,步入全面性的變革,再加上2010 年以後,移動通訊的深化,社群媒體的興起,使得原本就已經龐大的數字資料庫,更加上文字、語音、影像等超級複雜的資料型態,形成了現今所謂的「大數據」現象。然而,不管大數據的膨脹是多麼得令人難以想像與掌控,我們要面對的核心問題仍然一樣:如何靠更精密的統計分析模型,以及更快速的計算功能,以協助決策者獲得所需之關鍵的訊息。
因此,除了上述從數據的演化階段說明大數據4.0 之意義外,我們對於如何協助決策者獲得所需之關鍵的訊息,需要一個4.0 版的戰略框架的角度,來說明「大數據戰略4.0」的新義。這個框架涵蓋了四大構面:理論、模型、預測與決策。這四大構面是我們作者群幾次編輯會議中,對於有關大數據紛紛擾擾、形形色色的標籤、口號下,反覆討論之後,所歸納整理出它們的經與緯。首先,「大數據戰略」之目的為何?歸根結底就是要解決問題,解決決策者所面對的問題。而任何解決問題的架構流程,一定是先有一個理論基礎,告訴我們問題背後的邏輯與思路,然後將之建構成一個模型,通常是統計模型。在模型中所定義的變數以及變數與變數之間的關係,便是反映或呈現這套邏輯與思路。模型建立好之後,透過檢驗與實證,便可進行模擬與預測。決策者再根據預測所得之結果進行最終的決策。而在實務運作上,大數據戰略的第一步是先問我們所需做的決策是什麼?為了做這個決策,我們必須預知可能的結果以便於評估其後果;而為了能得到這個預測的結果,需要決定採用何種模型。而在建構模型的時候,要非常清楚與掌握有那些理論可以支持與解釋。
最後,我們上述宏觀大框架的層次,聚焦至微觀的資料的特性。大數據4.0 代表著未來我們在分析任何的數據,有四大特點或趨勢值得注意。
1. Not all data is created equal. 每一個資料點對於分析關鍵訊息時,其貢獻度(或重要性)並不是相同的。譬如有些人的意見比較重要,或是越靠近目前時間點的資料,在分析上,與其他的資料點就不能等量齊觀。
2. Not all data comes from same distribution. 傳統統計的基本假設均設立所有資料來自同一個母體時,便認為這些資料服從同一個分配(譬如常態分配)。但是,由於大數據的龐雜性,使得傳統模型的可靠度大幅降低。
3. Not all data can be observed. 所有可以被觀察、被記錄的資料,往往是表面的一種現象。而真正對於決策者有用的資訊,往往是隱藏在這些資料的背後。譬如消費者日常購買的食品交易紀錄便隱藏著熱量消耗的健康生活型態訊息。
4. Not all data is objective and unbiased. 在大數據中,並不是所有資料均是客觀的和無偏誤的。最明顯的例子是輿情分析中的文字探勘技術。如果資料本身就存在可能的偏誤時,任何精密的分析可能都徒勞無功了。
以上我們從三個方面:四種數據演進的歷程、四個數據戰略框架的元素、以及四項大數據分析特質的挑戰;定義4.0 之意涵。因此,本書以「大數據戰略4.0」為標題,總攬了大數據在十二大產業的理論、模型、預測與決策的探討。希望讀者能以此觀念架構閱讀各章節之內容,以便於吸收、消化。達到透視大數據之內涵,有效掌握其隱含之資訊,提升決策品質之目標。
唯有洞察人心於前,才能動人心扉於後。
任立中
臺灣大學統計碩士學位學程暨統計教學中心主任
臺灣大學全球品牌與行銷研究中心主任
臺灣大學管理學院國際企業學系行銷教授
台灣行銷科學學會秘書長
台灣行銷科學學報總編輯
中華應用統計學會理事長
大數據戰略4.0:資源整合‧平台建置‧創意思維‧新創業態
近幾年,「大數據」議題備受所有的產官學研等矚目,不論是個人、企業、產業、社會、政府、教育、國家、乃至全球都深受其影響,乃因大數據本身的特性具有大量性(Volume)、即時性(Velocity)、多樣性(Variety)、以及不確定性(Veracity)等4V屬性,反映出大數據將對整個人類文明產生衝擊。
面對當前大數據所將帶來的變化,我們要如何因應呢?如何結合科技、社會科學和人文等各領域的知識,回應知識經濟時代的需求,歸納本書十二項主題、三十一位作者群的論述,總結《大數據戰略4.0》的四大戰略為:資源整合、平台建置、創意思維與新創業態等,以對應4V特徵的衝擊與挑戰。亦即巨量的資料代表著各方的資源,因此首要的戰略就是必須要能有效地整合;而基於即時性的挑戰,一個高效能且更開放的平台,必須快速建置,是第二項戰略;有了這些基礎之後,第三項戰略就是培植創意人才,也就是讓具有創意思維的元素加入整個戰略的發展,以有效運用、解讀、跨領域的應用大數據所帶給我們的多樣性特質;第四項戰略則是要執行「Big Data+」的策略,創造新創業態的形成。
本書的內容提供了十二大產業的具體案例與理論基礎,讓讀者能充分了解上述四大戰略綱領的精義,難能可貴。為因應大數據時代,大學教育的內涵與機制也需要與時俱進,不僅要能隨著時代潮流做必要的調整,更必須能透過卓越的學術研究與教學,引領潮流。臺大為國內歷史悠久、最具規模、學風自由、思想多元、領域均衡的大學,希望能夠培育出具備專業領域能力的學生,也期盼學生具有獨立思考和創新能力,因為創新才是臺灣能夠在未來常保競爭力的根基,能為臺灣的發展注入更多能量。故本校全面推動創造力與創新能力的教育,培養學生創新思考、解決問題,以及跨領域的創新設計與實作之能力,以成為具社會關懷有使命感的人才,能回饋貢獻人類社會,從而提升國家競爭力,讓臺灣能永續發展。
本書總編輯任立中教授於今年8 月接任本校統計教學中心主任暨統計碩士學位學程主任,便積極投入心力,進行必要之改造。希望本書中面對變革的策略能在校園校務中迅速落實,逐步推動,共同打造本校成為國際學術研究重鎮。
楊泮池
臺灣大學校長
推薦序
大數據戰略4.0
日前臺灣大學任立中教授攜來一本書籍草稿《大數據戰略4.0》,集結國內產學菁英就行銷、製造以至於地理、運動共計十二個領域大數據的應用,撰寫推動戰略,堪稱當今國內大數據應用的經典。
要推動大數據的發展,各界莫不摩拳擦掌、躍躍欲試,但也無不面臨人才、經驗、專業能力匱乏的挑戰。我們臺灣推動大數據,究竟應該採取什麼策略,才能在不落人後,甚至在國際上有一席之地?表面上來看,大數據是資通訊領域一個新的境界,應該是由資通訊來引領風潮。的確,國際上類如Google 等先進業者,因為本身營運所需而開發出不少異於傳統資料處理分析的技術與工具,而且以開放的態度在網路上提供各界使用,因而被認為是大數據應用的先驅。而傳統的資料處理與統計方法,也有被翻轉的跡象,因此我們應該密切追隨、急起直追。但是,進一步去想,其實Google 等企業之所以發展出這些技術,是基於解決本身大數據應用(搜尋)的問題。換言之,是被其特有的應用需求所驅動。
大數據的許多應用,其實是具有專屬性或地域性的,例如大數據在金融業、製造業的應用,臺灣與其他國家會有不同的地方。這些應用,如果我們自己不去推動,其他國家大概也不會有人會替我們推動。因此,在推動大數據的策略上,「應用導向」應該是毋庸置疑的事。而基礎技術與工具的研發,也應該是基於充分的應用經驗與需求來驅動,而不是一昧追求國際上的熱門題目,落入發表期刊論文的迷思。本人在行政院副院長、院長任內推動大數據的政策應用,如要說有一個最重要的心得,莫過於此一體會。
也因此,任立中教授編輯的這本書具有特別的意義。坊間不乏翻譯的國際大數據應用書籍,但是要切入臺灣應用的精髓,莫如本書。期待讀者能藉由此書,激發出更多的應用創意,讓臺灣的大數據應用,能在國際上引領風騷!
張善政
前行政院院長
東吳大學巨資學院榮譽院長
推薦序
大數據是21 世紀的新石油及新生產要素
「大數據」於當今社會的重要性與對產業的影響力,已不可言喻。美國歐巴馬政府將「大數據」視為「21 世紀的新石油」,是「挖不完的金礦」。《大數據》作者麥爾荀伯格教授更將「大數據」看成是未來企業除了人才與設備、土地外,最重要的生產要素。《經濟學人》也認為「大數據」會「比你更了解你自己」。在日本,軟銀機器人Pepper 透過大數據的分析,能夠辨識顧客表情,與人開心互動交談。因此有些人將「大數據」譬喻為舊時的指南針,現代的望遠鏡與雷達,能幫助企業掌舵,激發各種創新、創意與創價的可能,從而創造出更多商機與成功的機會。
「大數據」擁有巨量性(Volume)、即時性(Velocity)、多樣性(Variety)以及不確定性(Veracity)等4V屬性。數據的「大」與「多」並不重要,端看如何精煉與應用,從4V的特性中萃取其價值。「大數據」開闢了新境界,轉變人們對世界的基本理解,環看周遭發生的大變化,就會知道這場巨量資料革命已然開始。企業如果想要保持領先地位,確定未來的商業模式如何改變,決策者必須站在這「大數據」的浪頭上,樂觀而務實的看待資料革命,因應新局並有效掌握該淘金密碼,挖掘這龐大潛藏的價值。
「大數據」的應用是跨領域連結的,無遠弗屆。最近非常火紅的寶可夢(Pokémon GO)尋寶遊戲,帶動了擴增實境、遊戲、文創,以及穿戴裝置等相關產業商機,將地理大數據的應用發揮到極致,創造出新的「寶可夢經濟學」。
任立中教授主編的《大數據戰略4.0》鉅著,終於在千呼萬喚中具現,是完遂多年來臺灣管理學界一直希望有學者願意編著一本有理論基礎以及臺灣產業實務意涵的「大數據」中文書籍。
該書內容分為十二個章節,每個章節涵蓋兩部分,分別由該領域的頂尖研究學者以及產業專家撰寫相關「大數據」的理論與應用內容。包括行銷大數據、製造大數據、雲端大數據、醫療大數據、會計大數據、零售大數據、社群大數據、農業大數據、金融大數據、電商大數據、地理大數據、運動大數據等。內容豐富,架構完整,輔以經典「大數據」案例說明,讓讀者看懂了「大數據」的威力與偉大的應用。
例如,伊拉波疫情擴散的監控、PM2.5 的空污感測、交通流量的管控、商情分析與服務系統的建立等,都是地理大數據應用的典範案例。醫院利用醫療大數據,可進行疫情和健康趨勢分析、強化醫學研發與用藥精準醫療等功能;Deloitte 透過會計大數據,能有效降低專案承接風險,並利用「審計雲」以及班佛定律和視覺化分析,可成功提高審計績效;John Deere 在IBM 大數據平台系統支援下,分析天氣資料(如溫度、濕度)以及土壤資料(如酸鹼度、特殊元素濃度),預測不同時間點應使用的水量、種子與化肥,幫助農民規劃最適當的農耕路徑和灌溉方式,從而節省農機油耗和灌溉用水,就是最佳的農業大數據成功應用;Olli 無人駕駛迷你公車可配備人工智慧列車長,與乘客交談並建議乘客的最佳用餐地點及觀光景點,最後Olli 載乘客到最近的捷運站,便是製造大數據最佳的應用典範。
「資料庫行銷」是「大數據」應用最多與最具代表性的一門學科,本書總編輯任立中教授,二十多年前就率先在臺灣大學開設「資料庫行銷」,是全臺灣第一位講授此一門課程的學者。任教授目前任教於臺灣大學國企系,並擔任臺灣大學統計碩士學位學程暨統計教學中心主任,同時兼任中華應用統計學會理事長、台灣行銷科學學會秘書長等職,多年來熱衷於教學研究工作,有豐富的學術涵養與實戰經驗。任教授是專攻行銷管理與行銷研究的學者,尤其在行銷決策模式與資料庫行銷等主題研究,有非常卓越的成果與貢獻,近年來更有兩篇非常重要的文章分別發表在Journal of Marketing Research〈JMR〉與Journal of American Statistics Association〈Journal of JASA〉二大世界頂尖學術期刊。在臺灣行銷學術界,任教授是唯一在該兩大期刊發表論述的管理學者,也是第一位在行銷三大期刊〈JMR〉發表著作的臺灣研究學者,有非常崇高的學術地位。
《大數據戰略4.0》是任立中教授與多位傑出學者及產業菁英數年來知識智慧的累積,確實是一本「大數據」的知識與應用寶典,不管是教師、學生或各行各業有志從事「大數據」相關工作的專業人士,都值得投注時間仔細研讀,必能有所獲得。在此,本人樂意將這本經典好書推薦給讀者共享。
陳厚銘
臺灣大學國企系特聘教授兼科技部管理一學門召集人
自序
大數據戰略4.0:理論‧模型‧預測‧決策
洞人心扉.動人心扉
Read people’s minds. Touch their souls.
當開始籌畫本書內容的時候,放在會議桌上的第一個問題就是:「什麼是大數據4.0」?有人說數據就是數據,難道0 到9 十個數字還有四種不同的演進或寫法?其實自人類有歷史以來,結繩記事、干支記數,數據的蒐集、紀錄、彙整、分析與應用,是人類文明得以傳承、昇華之關鍵。所以,如果就「數據」的發展歷程來看,4.0 意味著四個不同的演進階段。
大數據1.0:在1970 年代以前,最早期的數據大多是將直接觀察到的現象,透過人工的方式加以記錄下來。此時的數據量以當今的標準當然是稀少到不足以掛齒,但以當時的條件,其量不可謂不巨大。重點是分析的方法大多是一種描述性的說明。譬如100 位工廠作業員的動作如何影響產量(資料量:100×2)。
大數據2.0:到了1980 年代開始,當人們可以更有系統地蒐集資料時,所需面對的資料除了量體的進一步增加,其複雜度亦逐步攀升。譬如衡量1,000 位消費者生活型態的問項有一百個變數(資料量:1000×100)。此時簡單的敘述性統計已無法有效萃取出有用的資訊,而須藉助較複雜的統計分析模型(例如:多變量統計分析),才得以幫助決策者獲得關鍵的資訊。
大數據3.0:電腦之發展於1990 年代開始成熟,資料庫的建置愈來愈普及。不僅記錄了成千上萬橫斷面資料的紀錄,更加入了時間的動態性。譬如記錄100 萬名會員消費者在過去365 天對於1 萬個產品的購買交易紀錄(資料量:1,000,000×10,000×365)。再譬如一個生產製程中,有3 萬個查核點,每個查核點有1 千個變數,每秒均產生一個紀錄。一年下來的資料量:30,000×1,000×60×60×24×365=946,080,000,000,000。可想而知,此時單純的多變量或時間序列的統計分析模型,已不足以掌握此種整合縱斷面與橫斷面資料(簡稱縱橫資料Panel Data)之複雜性。更新更複雜的現代統計理論,結合更快速的電腦計算模擬功能,迅速發展成為大數據推波助瀾之關鍵因素。
大數據4.0:網際網路從2000 年開始,步入全面性的變革,再加上2010 年以後,移動通訊的深化,社群媒體的興起,使得原本就已經龐大的數字資料庫,更加上文字、語音、影像等超級複雜的資料型態,形成了現今所謂的「大數據」現象。然而,不管大數據的膨脹是多麼得令人難以想像與掌控,我們要面對的核心問題仍然一樣:如何靠更精密的統計分析模型,以及更快速的計算功能,以協助決策者獲得所需之關鍵的訊息。
因此,除了上述從數據的演化階段說明大數據4.0 之意義外,我們對於如何協助決策者獲得所需之關鍵的訊息,需要一個4.0 版的戰略框架的角度,來說明「大數據戰略4.0」的新義。這個框架涵蓋了四大構面:理論、模型、預測與決策。這四大構面是我們作者群幾次編輯會議中,對於有關大數據紛紛擾擾、形形色色的標籤、口號下,反覆討論之後,所歸納整理出它們的經與緯。首先,「大數據戰略」之目的為何?歸根結底就是要解決問題,解決決策者所面對的問題。而任何解決問題的架構流程,一定是先有一個理論基礎,告訴我們問題背後的邏輯與思路,然後將之建構成一個模型,通常是統計模型。在模型中所定義的變數以及變數與變數之間的關係,便是反映或呈現這套邏輯與思路。模型建立好之後,透過檢驗與實證,便可進行模擬與預測。決策者再根據預測所得之結果進行最終的決策。而在實務運作上,大數據戰略的第一步是先問我們所需做的決策是什麼?為了做這個決策,我們必須預知可能的結果以便於評估其後果;而為了能得到這個預測的結果,需要決定採用何種模型。而在建構模型的時候,要非常清楚與掌握有那些理論可以支持與解釋。
最後,我們上述宏觀大框架的層次,聚焦至微觀的資料的特性。大數據4.0 代表著未來我們在分析任何的數據,有四大特點或趨勢值得注意。
1. Not all data is created equal. 每一個資料點對於分析關鍵訊息時,其貢獻度(或重要性)並不是相同的。譬如有些人的意見比較重要,或是越靠近目前時間點的資料,在分析上,與其他的資料點就不能等量齊觀。
2. Not all data comes from same distribution. 傳統統計的基本假設均設立所有資料來自同一個母體時,便認為這些資料服從同一個分配(譬如常態分配)。但是,由於大數據的龐雜性,使得傳統模型的可靠度大幅降低。
3. Not all data can be observed. 所有可以被觀察、被記錄的資料,往往是表面的一種現象。而真正對於決策者有用的資訊,往往是隱藏在這些資料的背後。譬如消費者日常購買的食品交易紀錄便隱藏著熱量消耗的健康生活型態訊息。
4. Not all data is objective and unbiased. 在大數據中,並不是所有資料均是客觀的和無偏誤的。最明顯的例子是輿情分析中的文字探勘技術。如果資料本身就存在可能的偏誤時,任何精密的分析可能都徒勞無功了。
以上我們從三個方面:四種數據演進的歷程、四個數據戰略框架的元素、以及四項大數據分析特質的挑戰;定義4.0 之意涵。因此,本書以「大數據戰略4.0」為標題,總攬了大數據在十二大產業的理論、模型、預測與決策的探討。希望讀者能以此觀念架構閱讀各章節之內容,以便於吸收、消化。達到透視大數據之內涵,有效掌握其隱含之資訊,提升決策品質之目標。
唯有洞察人心於前,才能動人心扉於後。
任立中
臺灣大學統計碩士學位學程暨統計教學中心主任
臺灣大學全球品牌與行銷研究中心主任
臺灣大學管理學院國際企業學系行銷教授
台灣行銷科學學會秘書長
台灣行銷科學學報總編輯
中華應用統計學會理事長
網路書店
類別
折扣
價格
-
新書38折$190
-
新書9折$450
-
新書95折$475
-
新書$500