第1章 貝葉斯推斷的哲學 1
1.1 引言 1
1.1.1 貝葉斯思維 1
1.1.2 貝葉斯推斷在實踐中的運用 3
1.1.3 頻率派的模型是錯誤的嗎? 4
1.1.4 關於大數據 4
1.2 我們的貝葉斯框架 5
1.2.1 不得不講的實例:拋硬幣 5
1.2.2 實例:圖書管理員還是農民 6
1.3 概率分布 8
1.3.1 離散情況 9
1.3.2 連續情況 10
1.3.3 什麼是λ 12
1.4 使用計算機執行貝葉斯推斷 12
1.4.1 實例:從短信數據推斷行為 12
1.4.2 介紹我們的第一板斧:PyMC 14
1.4.3 說明 18
1.4.4 后驗樣本到底有什麼用? 18
1.5 結論 20
1.6 補充說明 20
1.6.1 從統計學上確定兩個l值是否真的不一樣 20
1.6.2 擴充至兩個轉折點 22
1.7 習題 24
1.8 答案 24
第2章 進一步了解PyMC 27
2.1 引言 27
2.1.1 父變量與子變量的關系 27
2.1.2 PyMC變量 28
2.1.3 在模型中加入觀測值 31
2.1.4 最后…… 33
2.2 建模方法 33
2.2.1 同樣的故事,不同的結局 35
2.2.2 實例:貝葉斯A/B測試 38
2.2.3 一個簡單的場景 38
2.2.4 A和B一起 41
2.2.5 實例:一種人類謊言的算法 45
2.2.6 二項分布 45
2.2.7 實例:學生作弊 46
2.2.8 另一種PyMC模型 50
2.2.9 更多的PyMC技巧 51
2.2.10 實例:挑戰者號事故 52
2.2.11 正態分布 55
2.2.12 挑戰者號事故當天發生了什麼? 61
2.3 我們的模型適用嗎? 61
2.4 結論 68
2.5 補充說明 68
2.6 習題 69
2.7 答案 69
第3章 打開MCMC的黑盒子 71
3.1 貝葉斯景象圖 71
3.1.1 使用MCMC來探索景象圖 77
3.1.2 MCMC算法的實現 78
3.1.3 后驗的其他近似解法 79
3.1.4 實例:使用混合模型進行無監督聚類 79
3.1.5 不要混淆不同的后驗樣本 88
3.1.6 使用MAP來改進收斂性 91
3.2 收斂的判斷 92
3.2.1 自相關 92
3.2.2 稀釋 95
3.2.3 pymc.Matplot.plot() 97
3.3 MCMC的一些秘訣 98
3.3.1 聰明的初始值 98
3.3.2 先驗 99
3.3.3 統計計算的無名定理 99
3.4 結論 99
第4章 從未言明的最偉大定理 101
4.1 引言 101
4.2 大數定律 101
4.2.1 直覺 101
4.2.2 實例:泊松隨機變量的收斂 102
4.2.3 如何計算Var(Z) 106
4.2.4 期望和概率 106
4.2.5 所有這些與貝葉斯統計有什麼關系呢 107
4.3 小數據的無序性 107
4.3.1 實例:地理數據聚合 107
4.3.2 實例:Kaggle的美國人口普查反饋比例預測比賽 109
4.3.3 實例:如何對Reddit網站上的評論進行排序 111
4.3.4 排序! 115
4.3.5 但是這樣做的實時性太差了 117
4.3.6 推廣到評星系統 122
4.4 結論 122
4.5 補充說明 122
4.6 習題 123
4.7 答案 124
第5章 失去一只手臂還是一條腿 127
5.1 引言 127
5.2 損失函數 127
5.2.1 現實世界中的損失函數 129
5.2.2 實例:優化「價格競猜」游戲的展品出價 130
5.3 機器學習中的貝葉斯方法 138
5.3.1 實例:金融預測 139
5.3.2 實例:Kaggle觀測暗世界大賽 144
5.3.3 數據 145
5.3.4 先驗 146
5.3.5 訓練和PyMC實現 147
5.4 結論 156
第6章 弄清楚先驗 157
6.1 引言 157
6.2 主觀與客觀先驗 157
6.2.1 客觀先驗 157
6.2.2 主觀先驗 158
6.2.3 決策,決策…… 159
6.2.4 經驗貝葉斯 160
6.3 需要知道的有用的先驗 161
6.3.1 Gamma分布 161
6.3.2 威沙特分布 162
6.3.3 Beta分布 163
6.4 實例:貝葉斯多臂老虎機 164
6.4.1 應用 165
6.4.2 一個解決方案 165
6.4.3 好壞衡量標准 169
6.4.4 擴展算法 173
6.5 從領域專家處獲得先驗分布 176
6.5.1 試驗輪盤賭法 176
6.5.2 實例:股票收益 177
6.5.3 對於威沙特分布的專業提示 184
6.6 共軛先驗 185
6.7 傑弗里斯先驗 185
6.8 當N增加時對先驗的影響 187
6.9 結論 189
6.10 補充說明 190
6.10.1 帶懲罰的線性回歸的貝葉斯視角 190
6.10.2 選擇退化的先驗 192
第7章 貝葉斯A/B測試 195
7.1 引言 195
7.2 轉化率測試的簡單重述 195
7.3 增加一個線性損失函數 198
7.3.1 收入期望的分析 198
7.3.2 延伸到A/B測試 202
7.4 超越轉化率:t檢驗 204
7.4.1 t檢驗的設定 204
7.5 增幅的估計 207
7.5.1 創建點估計 210
7.6 結論 211
術語表 213