利用Python進行數據分析

利用Python進行數據分析
定價:534
NT $ 465
  • 作者:(美)麥金尼
  • 出版社:機械工業出版社
  • 出版日期:2014-01-01
  • 語言:簡體中文
  • ISBN10:7111436733
  • ISBN13:9787111436737
  • 裝訂:451頁 / 普通級 / 1-1
 

內容簡介

學習NumPy(NumericalPython)的基礎和高級知識;從pandas庫的數據分析工具開始利用高性能工具對數據進行加載、清理、轉換、合並以及重塑;利用matpIotlib創建散點圖以及靜態或交互式的可視化結果;利用pandas的groupby功能對數據集進行切片、切塊和匯總操作;處理各種各樣的時間序列數據。

Wes McKinney 資深數據分析專家,對各種Python庫(包括NumPy、pandas、matplotlib以及IPython等)等都有深入研究,並在大量的實踐中積累了豐富的經驗。撰寫了大量與Python數據分析相關的經典文章,被各大技術社區爭相轉載,是Python和開源技術社區公認的權威人物之一。開發了用於數據分析的著名開源Python庫——pandas,廣獲用戶好評。在創建Lambda Foundry(一家致力於企業數據分析的公司)之前,他曾是AQR Capital Management的定量分析師。
 

目錄

前言1’’
第1章 准備工作5
本書主要內容5
為什麼要使用Python進行數據分析6
重要的Python庫7
安裝和設置10
社區和研討會16
使用本書16
致謝18

第2章 引言20
來自bit.ly的1.usa.gov數據21
MovieLens1M數據集29
1880—2010年間全美嬰兒姓名35
小結及展望47

第3章 IPython:一種交互式計算和開發環境48
IPython基礎49
內省51
使用命令歷史60
與操作系統交互63
軟件開發工具66
IPythonHTMLNotebook75
利用IPython提高代碼開發效率的幾點提示77
高級IPython功能79
致謝81

第4章 NumPy基礎:數組和矢量計算82
NumPy的ndarray:一種多維數組對象83
通用函數:快速的元素級數組函數98
利用數組進行數據處理100
用於數組的文件輸入輸出107
線性代數109
隨機數生成111
范例:隨機漫步112

第5章 pandas入門115
pandas的數據結構介紹116
基本功能126
匯總和計算描述統計142
處理缺失數據148
層次化索引153
其他有關pandas的話題158

第6章 數據加載、存儲與文件格式162
讀寫文本格式的數據162
二進制數據格式179
使用HTML和WebAPI181
使用數據庫182

第7章 數據規整化:清理、轉換、合並、重塑186
合並數據集186
重塑和軸向旋轉200
數據轉換204
字符串操作217
示例:USDA食品數據庫224

第8章 繪圖和可視化231
matplotlibAPI入門231
pandas中的繪圖函數244
繪制地圖:圖形化顯示海地地震危機數據254
Python圖形化工具生態系統260

第9章 數據聚合與分組運算263
GroupBy技術264
數據聚合271
分組級運算和轉換276
透視表和交叉表288
示例:2012聯邦選舉委員會數據庫291

第10章 時間序列302
日期和時間數據類型及工具303
時間序列基礎307
日期的范圍、頻率以及移動311
時區處理317
時期及其算術運算322
重采樣及頻率轉換327
時間序列繪圖334
移動窗口函數337
性能和內存使用方面的注意事項342

第11章 金融和經濟數據應用344
數據規整化方面的話題344
分組變換和分析355
更多示例應用361

第12章 NumPy高級應用368
ndarray對象的內部機理368
高級數組操作370
廣播378
ufunc高級應用383
結構化和記錄式數組386
更多有關排序的話題388
NumPy的matrix類393
高級數組輸入輸出395
性能建議397

附錄A Python語言精要401
網路書店 類別 折扣 價格
  1. 新書
    87
    $465