統計思維:程序員數學之概率統計(第2版)

統計思維:程序員數學之概率統計(第2版)
定價:294
NT $ 256
  • 作者:(美)THINK STATS
  • 出版社:人民郵電出版社
  • 出版日期:2015-09-01
  • 語言:簡體中文
  • ISBN10:711540108X
  • ISBN13:9787115401083
  • 裝訂:186頁 / 普通級 / 2-1
 

內容簡介

是一本以全新視角講解概率統計的入門圖書。拋開經典的數學分析,Downey手把手教你用編程理解統計學。

具體說來,《統計思維:程序員數學之概率統計(第2版)》通過一個案例研究,介紹探索性數據分析的全過程:從收集數據、生成統計信息,到發現模式、驗證假設。同時研究分布、概率規則、可視化和其他多種工具及概念。此外,第2版新增了回歸、時間序列分析、生存分析和分析方法等章節。

Allen B. Downey是富蘭克林歐林工程學院計算機科學教授,曾執教於韋爾斯利學院、科爾比學院和加州大學伯克利分校。在加州大學伯克利分校獲得計算機科學博士學位。Downey已出版十余本技術書,包括Think Python、Think Bayes、Think Complexity等。
 

目錄

前言 xi

第1章 探索性數據分析 1
1.1 統計學方法 2
1.2 全國家庭增長調查 2
1.3 數據導入 3
1.4 DataFrame 4
1.5 變量 6
1.6 數據變換 6
1.7 數據驗證 8
1.8 解釋數據 9
1.9 練習 10
1.10 術語 11

第2章 分布 13
2.1 表示直方圖 14
2.2 繪制直方圖 14
2.3 全國家庭增長調查中的變量 15
2.4 離群值 18
2.5 第一胎 18
2.6 分布概述 20
2.7 方差 21
2.8 效應量 21
2.9 報告結果 22
2.10 練習 23
2.11 術語 23

第3章 概率質量函數 25
3.1 概率質量函數 25
3.2 繪制PMF 26
3.3 繪制PMF 的其他方法 28
3.4 課堂規模悖論 29
3.5 使用DataFrame 進行索引 31
3.6 練習 33
3.7 術語 34

第4章 累積分布函數 35
4.1 PMF 的局限 35
4.2 百分位數 36
4.3 CDF 37
4.4 表示CDF 38
4.5 比較CDF 39
4.6 基於百分位數的統計量 40
4.7 隨機數 41
4.8 比較百分位秩 42
4.9 練習 43
4.10 術語 44

第5章 分布建模 45
5.1 指數分布 45
5.2 正態分布 48
5.3 正態概率圖 49
5.4 對數正態分布 51
5.5 Pareto 分布 53
5.6 隨機數生成 56
5.7 為什麼使用模型 56
5.8 練習 57
5.9 術語 59

第6章 概率密度函數 61
6.1 PDF 61
6.2 核密度估計 63
6.3 分布框架 65
6.4 Hist 實現 65
6.5 Pmf 實現 66
6.6 Cdf 實現 67
6.7 矩 68
6.8 偏度 69
6.9 練習 72
6.10 術語 73

第7章 變量之間的關系 75
7.1 散點圖 75
7.2 描述關系特征 78
7.3 相關性 79
7.4 協方差 80
7.5 Pearson 相關性 81
7.6 非線性關系 82
7.7 Spearman 秩相關 82
7.8 相關性和因果關系 83
7.9 練習 84
7.10 術語 85

第8章 估計 87
8.1 估計游戲 87
8.2 猜測方差 89
8.3 抽樣分布 90
8.4 抽樣偏倚 93
8.5 指數分布 93
8.6 練習 95
8.7 術語 95

第9章 假設檢驗 97
9.1 經典假設檢驗 97
9.2 假設檢驗 98
9.3 檢驗均值差 100
9.4 其他檢驗統計量 101
9.5 檢驗相關性 102
9.6 檢驗比例 103
9.7 卡方檢驗 104
9.8 再談第一胎 105
9.9 誤差 106
9.10 功效 107
9.11 復現 108
9.12 練習 109
9.13 術語 109

第10章 線性最小二乘法 111
10.1 最小二乘法擬合 111
10.2 實現 112
10.3 殘差 113
10.4 估計 114
10.5 擬合優度 116
10.6 檢驗線性模型 118
10.7 加權重抽樣 119
10.8 練習 121
10.9 術語 121

第11章 回歸 123
11.1 StatsModels 124
11.2 多重回歸 125
11.3 非線性關系 127
11.4 數據挖掘 128
11.5 預測 129
11.6 Logistic 回歸 131
11.7 估計參數 132
11.8 實現 133
11.9 准確度 134
11.10 練習 135
11.11 術語 136

第12章 時間序列分析 139
12.1 導入和清洗數據 139
12.2 繪制圖形 141
12.3 線性回歸 143
12.4 移動平均值 144
12.5 缺失值 146
12.6 序列相關 148
12.7 自相關 149
12.8 預測 150
12.9 參考書目 154
12.10 練習 154
12.11 術語 155

第13章 生存分析 157
13.1 生存曲線 157
13.2 危險函數 159
13.3 估計生存曲線 160
13.4 Kaplan-Meier 估計 161
13.5 婚姻曲線 162
13.6 估計生存函數 163
13.7 置信區間 164
13.8 群組效應 166
13.9 外推 168
13.10 預期剩余生存期 169
13.11 練習 171
13.12 術語 172

第14章 分析方法 173
14.1 正態分布 173
14.2 抽樣分布 174
14.3 表示正態分布 175
14.4 中心極限定理 176
14.5 檢驗CLT 177
14.6 應用CLT 180
14.7 相關檢驗 181
14.8 卡方檢驗 183
14.9 討論 184
14.10 練習 184

作者介紹 186
封面介紹 186
網路書店 類別 折扣 價格
  1. 新書
    87
    $256