基於Python進行實踐開發,主要涉及的內容為:用敏捷式大數據開發方法論創建分析應用;用數據—價值棧,在一系列敏捷周期中創建價值;用多種數據結構從單個數據集中提取特征,獲取洞察;用圖表可視化數據,通過交互性報表從不同角度展示數據;用歷史數據進行預測,將預測轉化為行動。
王仁武,男,1968年4月出生,工科博士、副教授,現為華東師范大學商學院信息學系教師,主要研究方向為數據分析、數據挖掘和信息系統。
已出版(參編)主要著作:《商業分析》華東師范大學出版社 2014年9月;《序列構造神經網絡與多維數據分析》上海社科院出版社 2008年11月
目錄
基礎編
1 數據科學簡介
1.1 什麼是數據科學
1.2 如何學習數據科學
1.3 什麼是數據科學家
1.4 數據科學家需要掌握的技能
1.5 Python與數據科學
1.6 數據科學領域常用的Python包
本章小結
參考文獻
2 Python基礎知識
2.1 Python基本概念
2.2 序列和基本語句
2.3 函數和模塊
本章小結
習題
參考文獻
分析編
3 Python數據獲取與數據預處理
3.1 Python數據獲取
3.2 Python數據預處理
本章小結
習題
參考文獻
4 利用Python進行數據分析
4.1 數據分析與Python
4.2 基本統計分析
4.3 主成分分析(PCA)
4.4 線性回歸
本章小結
習題
參考文獻
挖掘編
5 利用Python進行數據挖拋
5.1 數據挖掘與Py
5.2 k最近鄰(k-Nearest Neighbor)
5.3 決策樹(Decision Tree)
5.4 朴素貝葉斯(Naive Bayesian)
5.5 邏輯回歸(Logistic Regression)
5.6 Apriori算法
5.7 聚類分析(Clustering Analysis)
5.8 隨機森林(Random Forest)
本章小結
習題
參考文獻
6 利用Python進行文本挖掘
6.1 文本挖掘簡介
6.2 Python與文本分類
6.3 Python與文本聚類
6.4 Python與文本情感分析
6.5 Python與全文檢索
本章小結
習題
參考文獻
提高編
7 Python與海量數據處理簡介
7.1 Spark簡介
7.2 Pag
7.3 Python與推薦系統
本章小結
習題
參考文獻
網路書店
類別
折扣
價格
-
新書87折$235