本書討論大數據理論及應用實踐的專着,從討論理論界的前沿觀點開始,之后轉向討論這些理論在日常商業活動中的實踐應用。
本書首先介紹了大數據分析的業務應用場景、分析建模過程和主要任務,以及模型商用的關鍵點;接着講述了數據收集、抽樣和預處理的實施要點;之后系統性地討論了各種模型技術及其應用,包括預測分析、描述分析、生存分析、社交網絡分析等。
在完成了這些理論知識和模型技術方法鋪墊之后,就進入到實踐應用部分,包括把分析活動轉化為生產力的關鍵事項,以及各種應用實例。
《大數據分析數據科學應用場景與實踐精髓》幫助讀者系統地梳理了各類模型方法的技術要點和應用要點,包括線性回歸、Logistic回歸、決策樹、聚類、關聯規則、序列規則、神經網絡、支持向量機、套袋算法、Boosting算法、隨機森林算法、生存分析等;本書還介紹了大量的應用實例,如信用風險建模、欺詐檢測、營銷響應提升模型、客戶流失預測、自動推薦、網頁分析、社交媒體分析,以及業務流程分析等。
因此,對於從事大數據分析相關工作的人士來說,本書是一本難得的實務指南;對於高等院校相關專業的師生來說,本書是一本非常好的課外閱讀材料,特別是書中關於如何把分析變成生產力的章節部分,相信一定能給他們很多的啟發和思考。
巴特•貝森斯(Bart Baesens)是比利時魯汶大學的副教授,英國南安普敦大學的講師,以及國際知名的數據分析知名顧問。他是網絡分析、客戶關系管理和欺詐偵測等領域傑出的研究實踐者。他在多種世界知名期刊(如《機器學習》(Machine Learning)和《管理科學》(Management
Science)上發表了多篇論文,還是《信用風險管理精要》(牛津大學出版社,2008年出版)一書的作者。