Python是一種物件導向的指令碼語言,其代碼簡潔優美,類庫豐富,開發效率也很高,得到越來越多開發者的喜愛,廣泛應用於Web開發、網路程式設計、爬蟲開發、自動化運維、雲計算、人工智慧、科學計算等領域。預測技術在當今智慧分析及其應用領域中發揮著重要作用,也是大資料時代的核心價值所在。
隨著AI技術的進一步深化,預測技術將更好地支撐複雜場景下的預測需求,其商業價值不言而喻。基於Python來做預測,不僅能夠在業務上快速落地,還讓代碼維護更加方便。對預測原理的深度剖析和演算法的細緻解讀,是本書的一大亮點。
本書共分為3篇。
第1篇介紹預測基礎,主要包括預測概念理解、預測方法論、分析方法、特徵技術、模型優化及評價,讀者通過這部分內容的學習,可以掌握預測的基本步驟和方法思路。
第2篇介紹預測演算法,該部分包含多元回歸分析、複雜回歸分析、時間序列及進階演算法,內容比較有難度,需要細心品味。
第3篇介紹預測案例,包括短期日負荷曲線預測和股票價格預測兩個實例,讀者可以瞭解到實施預測時需要關注的技術細節。
希望讀者在看完本書後,能夠將本書的精要融會貫通,進一步在工作和學習實踐中提煉價值。
作者介紹
遊皓麟,大資料分析、資料採擷專家,高級培訓講師。畢業于東南大學,從事大資料相關領域工作8年有餘,專注大資料架構、機器學習、資料採擷、NLP、知識圖譜等領域的方案設計、演算法研究與工程實現。在遊戲、
目錄
第1 篇 預測入門
第1 章 認識預測 . 2
1.1 什麼是預測 . 2
1.1.1 占卜術 . 3
1.1.2 神秘的地動儀 . 3
1.1.3 科學預測 . 5
1.1.4 預測的原則 . 7
1.2 前沿技術 . 9
1.2.1 大資料與預測 . 10
1.2.2 大資料預測的特點 11
1.2.3 人工智慧與預測 . 15
1.2.4 人工智慧預測的特點 . 17
1.2.5 典型預測案例 . 18
1.3 Python 預測初步 . 26
1.3.1 數據預處理 . 27
1.3.2 建立模型 . 31
1.3.3 預測及誤差分析 . 34
第2 章 預測方法論 . 37
2.1 預測流程 . 37
2.1.1 確定主題 . 38
2.1.2 收集資料 . 40
2.1.3 選擇方法 . 42
2.1.4 分析規律 . 43
2.1.5 建立模型 . 48
2.1.6 評估效果 . 51
2.1.7 發佈模型 . 52
2.2 指導原則 . 53
2.2.1 界定問題 . 53
2.2.2 判斷預測法 . 55
2.2.3 外推預測法 . 56
2.2.4 因果預測法 . 58
2.3 團隊構成 . 59
2.3.1 成員分類 . 59
2.3.2 數據氛圍 . 61
2.3.3 團隊合作 . 63
第3 章 探索規律 . 65
3.1 相關分析 . 65
3.1.1 自相關分析 . 65
3.1.2 偏相關分析 . 68
3.1.3 簡單相關分析 . 69
3.1.4 互相關分析 . 80
3.1.5 典型相關分析 . 82
3.2 因果分析 . 87
3.2.1 什麼是因果推斷 . 87
3.2.2 因果推斷的方法 . 90
3.2.3 時序因果推斷 . 93
3.3 聚類分析 . 98
3.3.1 K-Means 演算法 . 98
3.3.2 系統聚類演算法 . 102
3.4 關聯分析 110
3.4.1 關聯規則挖掘 110
3.4.2 Apriori 演算法 . 111
3.4.3 Eclat 演算法 120
3.4.4 序列模式挖掘 . 123
3.4.5 SPADE 演算法 124
第4 章 特徵工程 . 136
4.1 特徵變換 . 136
4.1.1 概念分層 . 137
4.1.2 標準化 . 138
4.1.3 離散化 . 141
4.1.4 函數變換 . 143
4.1.5 深入表達 . 144
4.2 特徵組合 . 145
4.2.1 基於經驗 . 145
4.2.2 二元組合 . 146
4.2.3 高階多項式 . 148
4.3 特徵評價 . 151
4.3.1 特徵初選 . 151
4.3.2 影響評價 . 152
4.3.3 模型法 . 167
4.4 特徵學習 . 172
4.4.1 基本思路 . 173
4.4.2 特徵運算式 . 174
4.4.3 初始種群 . 183
4.4.4 適應度 . 185
4.4.5 遺傳行為 . 187
4.4.6 實例分析 . 192
第2 篇 預測演算法
第5 章 參數優化 . 199
5.1 交叉驗證 . 199
5.2 網格搜索 . 201
5.3 遺傳演算法 . 203
5.3.1 基本概念 . 203
5.3.2 遺傳演算法算例 . 204
5.3.3 遺傳演算法實現步驟 . 209
5.3.4 遺傳演算法Python 實現 210
5.4 粒子群優化 . 213
5.4.1 基本概念及原理 . 213
5.4.2 粒子群演算法的實現步驟 . 214
5.4.3 用Python 實現粒子群演算法 215
5.5 模擬退火 . 220
5.5.1 基本概念及原理 . 220
5.5.2 類比退火演算法的實現步驟 . 221
5.5.3 類比退火演算法Python 實現 222
第6 章 線性回歸及其優化 226
6.1 多元線性回歸 . 226
6.1.1 回歸模型與基本假定 . 226
6.1.2 最小二乘估計 . 227
6.1.3 回歸方程和回歸係數的顯著性檢驗 . 228
6.1.4 多重共線性 . 229
6.2 Ridge 回歸 233
6.2.1 基本概念 . 233
6.2.2 嶺跡曲線 . 233
6.2.3 基於GCV 準則確定嶺參數 . 235
6.2.4 Ridge 回歸的Python 實現 . 237
6.3 Lasso 回歸 . 237
6.3.1 基本概念 . 237
6.3.2 使用LAR 演算法求解Lasso . 238
6.3.3 Lasso 演算法的Python 實現 . 240
6.4 分位數回歸 . 242
6.4.1 基本概念 . 242
6.4.2 分位數回歸的計算 . 245
6.4.3 用單純形法求解分位數回歸及Python 實現 246
6.5 穩健回歸 . 248
6.5.1 基本概念 . 249
6.5.2 M 估計法及Python 實現 . 250
第7 章 複雜回歸分析 . 254
7.1 梯度提升回歸樹(GBRT) . 254
7.1.1 Boosting 方法簡介 254
7.1.2 AdaBoost 演算法 255
7.1.3 提升回歸樹演算法 . 257
7.1.4 梯度提升 . 259
7.1.5 GBRT 演算法的Python 實現 261
7.2 深度神經網路 . 264
7.2.1 基本概念 . 264
7.2.2 從線性回歸說起 . 269
7.2.3 淺層神經網路 . 272
7.2.4 深層次擬合問題 . 277
7.2.5 DNN 的Python 實現 278
7.3 支持向量機回歸 . 281
7.3.1 基本問題 . 281
7.3.2 LS-SVMR 演算法 . 284
7.3.3 LS-SVMR 演算法的Python 實現 . 285
7.4 高斯過程回歸 . 286
7.4.1 GPR 演算法 287
7.4.2 GPR 演算法的Python 實現 . 289
第8 章 時間序列分析 . 292
8.1 Box-Jenkins 方法 292
8.1.1 p 階自回歸模型 293
8.1.2 q 階移動平均模型 295
8.1.3 自回歸移動平均模型 . 296
8.1.4 ARIMA 模型 . 300
8.1.5 ARIMA 模型的Python 實現 . 301
8.2 門限自回歸模型 . 309
8.2.1 TAR 模型的基本原理 309
8.2.2 TAR 模型的Python 實現 . 310
8.3 GARCH 模型族 313
8.3.1 線性ARCH 模型 313
8.3.2 GRACH 模型 315
8.3.3 EGARCH 模型 . 315
8.3.4 PowerARCH 模型 . 316
8.4 向量自回歸模型 . 318
8.4.1 VAR 模型基本原理 318
8.4.2 VAR 模型的Python 實現 . 320
8.5 卡爾曼濾波 . 324
8.5.1 卡爾曼濾波演算法介紹 . 324
8.5.2 卡爾曼濾波的Python 實現 326
8.6 迴圈神經網路 . 328
8.6.1 RNN 的基本原理 329
8.6.2 RNN 演算法的Python 實現 332
8.7 長短期記憶網路 . 335
8.7.1 LSTM 模型的基本原理 . 336
8.7.2 LSTM 演算法的Python 實現 341
第3 篇 預測應用
第9 章 短期日負荷曲線預測 . 345
9.1 電力行業負荷預測介紹 . 345
9.2 短期日負荷曲線預測的基本要求 . 346
9.3 預測建模準備 . 347
9.3.1 基礎資料獲取 . 347
9.3.2 缺失資料處理 . 349
9.3.3 潛在規律分析 . 352
9.4 基於DNN 演算法的預測 355
9.4.1 資料要求 . 356
9.4.2 數據預處理 . 356
9.4.3 網路結構設計 . 357
9.4.4 建立模型 . 358
9.4.5 預測實現 . 359
9.4.6 效果評估 . 359
9.5 基於LSTM 演算法的預測 361
9.5.1 資料要求 . 361
9.5.2 數據預處理 . 362
9.5.3 網路結構設計 . 362
9.5.4 建立模型 . 363
9.5.5 預測實現 . 364
9.5.6 效果評估 . 364
第10 章 股票價格預測 . 367
10.1 股票市場簡介 . 367
10.2 獲取股票資料 . 368
10.3 基於VAR 演算法的預測 . 371
10.3.1 平穩性檢驗 . 371
10.3.2 VAR 模型定階 372
10.3.3 預測及效果驗證 . 373
10.4 基於LSTM 演算法的預測. 375
10.4.1 資料要求 . 375
10.4.2 數據預處理 . 376
10.4.3 網路結構設計 . 377
10.4.4 建立模型 . 377
10.4.5 預測實現 . 378
10.4.6 效果評估 . 378
參考文獻 . 381
第1 章 認識預測 . 2
1.1 什麼是預測 . 2
1.1.1 占卜術 . 3
1.1.2 神秘的地動儀 . 3
1.1.3 科學預測 . 5
1.1.4 預測的原則 . 7
1.2 前沿技術 . 9
1.2.1 大資料與預測 . 10
1.2.2 大資料預測的特點 11
1.2.3 人工智慧與預測 . 15
1.2.4 人工智慧預測的特點 . 17
1.2.5 典型預測案例 . 18
1.3 Python 預測初步 . 26
1.3.1 數據預處理 . 27
1.3.2 建立模型 . 31
1.3.3 預測及誤差分析 . 34
第2 章 預測方法論 . 37
2.1 預測流程 . 37
2.1.1 確定主題 . 38
2.1.2 收集資料 . 40
2.1.3 選擇方法 . 42
2.1.4 分析規律 . 43
2.1.5 建立模型 . 48
2.1.6 評估效果 . 51
2.1.7 發佈模型 . 52
2.2 指導原則 . 53
2.2.1 界定問題 . 53
2.2.2 判斷預測法 . 55
2.2.3 外推預測法 . 56
2.2.4 因果預測法 . 58
2.3 團隊構成 . 59
2.3.1 成員分類 . 59
2.3.2 數據氛圍 . 61
2.3.3 團隊合作 . 63
第3 章 探索規律 . 65
3.1 相關分析 . 65
3.1.1 自相關分析 . 65
3.1.2 偏相關分析 . 68
3.1.3 簡單相關分析 . 69
3.1.4 互相關分析 . 80
3.1.5 典型相關分析 . 82
3.2 因果分析 . 87
3.2.1 什麼是因果推斷 . 87
3.2.2 因果推斷的方法 . 90
3.2.3 時序因果推斷 . 93
3.3 聚類分析 . 98
3.3.1 K-Means 演算法 . 98
3.3.2 系統聚類演算法 . 102
3.4 關聯分析 110
3.4.1 關聯規則挖掘 110
3.4.2 Apriori 演算法 . 111
3.4.3 Eclat 演算法 120
3.4.4 序列模式挖掘 . 123
3.4.5 SPADE 演算法 124
第4 章 特徵工程 . 136
4.1 特徵變換 . 136
4.1.1 概念分層 . 137
4.1.2 標準化 . 138
4.1.3 離散化 . 141
4.1.4 函數變換 . 143
4.1.5 深入表達 . 144
4.2 特徵組合 . 145
4.2.1 基於經驗 . 145
4.2.2 二元組合 . 146
4.2.3 高階多項式 . 148
4.3 特徵評價 . 151
4.3.1 特徵初選 . 151
4.3.2 影響評價 . 152
4.3.3 模型法 . 167
4.4 特徵學習 . 172
4.4.1 基本思路 . 173
4.4.2 特徵運算式 . 174
4.4.3 初始種群 . 183
4.4.4 適應度 . 185
4.4.5 遺傳行為 . 187
4.4.6 實例分析 . 192
第2 篇 預測演算法
第5 章 參數優化 . 199
5.1 交叉驗證 . 199
5.2 網格搜索 . 201
5.3 遺傳演算法 . 203
5.3.1 基本概念 . 203
5.3.2 遺傳演算法算例 . 204
5.3.3 遺傳演算法實現步驟 . 209
5.3.4 遺傳演算法Python 實現 210
5.4 粒子群優化 . 213
5.4.1 基本概念及原理 . 213
5.4.2 粒子群演算法的實現步驟 . 214
5.4.3 用Python 實現粒子群演算法 215
5.5 模擬退火 . 220
5.5.1 基本概念及原理 . 220
5.5.2 類比退火演算法的實現步驟 . 221
5.5.3 類比退火演算法Python 實現 222
第6 章 線性回歸及其優化 226
6.1 多元線性回歸 . 226
6.1.1 回歸模型與基本假定 . 226
6.1.2 最小二乘估計 . 227
6.1.3 回歸方程和回歸係數的顯著性檢驗 . 228
6.1.4 多重共線性 . 229
6.2 Ridge 回歸 233
6.2.1 基本概念 . 233
6.2.2 嶺跡曲線 . 233
6.2.3 基於GCV 準則確定嶺參數 . 235
6.2.4 Ridge 回歸的Python 實現 . 237
6.3 Lasso 回歸 . 237
6.3.1 基本概念 . 237
6.3.2 使用LAR 演算法求解Lasso . 238
6.3.3 Lasso 演算法的Python 實現 . 240
6.4 分位數回歸 . 242
6.4.1 基本概念 . 242
6.4.2 分位數回歸的計算 . 245
6.4.3 用單純形法求解分位數回歸及Python 實現 246
6.5 穩健回歸 . 248
6.5.1 基本概念 . 249
6.5.2 M 估計法及Python 實現 . 250
第7 章 複雜回歸分析 . 254
7.1 梯度提升回歸樹(GBRT) . 254
7.1.1 Boosting 方法簡介 254
7.1.2 AdaBoost 演算法 255
7.1.3 提升回歸樹演算法 . 257
7.1.4 梯度提升 . 259
7.1.5 GBRT 演算法的Python 實現 261
7.2 深度神經網路 . 264
7.2.1 基本概念 . 264
7.2.2 從線性回歸說起 . 269
7.2.3 淺層神經網路 . 272
7.2.4 深層次擬合問題 . 277
7.2.5 DNN 的Python 實現 278
7.3 支持向量機回歸 . 281
7.3.1 基本問題 . 281
7.3.2 LS-SVMR 演算法 . 284
7.3.3 LS-SVMR 演算法的Python 實現 . 285
7.4 高斯過程回歸 . 286
7.4.1 GPR 演算法 287
7.4.2 GPR 演算法的Python 實現 . 289
第8 章 時間序列分析 . 292
8.1 Box-Jenkins 方法 292
8.1.1 p 階自回歸模型 293
8.1.2 q 階移動平均模型 295
8.1.3 自回歸移動平均模型 . 296
8.1.4 ARIMA 模型 . 300
8.1.5 ARIMA 模型的Python 實現 . 301
8.2 門限自回歸模型 . 309
8.2.1 TAR 模型的基本原理 309
8.2.2 TAR 模型的Python 實現 . 310
8.3 GARCH 模型族 313
8.3.1 線性ARCH 模型 313
8.3.2 GRACH 模型 315
8.3.3 EGARCH 模型 . 315
8.3.4 PowerARCH 模型 . 316
8.4 向量自回歸模型 . 318
8.4.1 VAR 模型基本原理 318
8.4.2 VAR 模型的Python 實現 . 320
8.5 卡爾曼濾波 . 324
8.5.1 卡爾曼濾波演算法介紹 . 324
8.5.2 卡爾曼濾波的Python 實現 326
8.6 迴圈神經網路 . 328
8.6.1 RNN 的基本原理 329
8.6.2 RNN 演算法的Python 實現 332
8.7 長短期記憶網路 . 335
8.7.1 LSTM 模型的基本原理 . 336
8.7.2 LSTM 演算法的Python 實現 341
第3 篇 預測應用
第9 章 短期日負荷曲線預測 . 345
9.1 電力行業負荷預測介紹 . 345
9.2 短期日負荷曲線預測的基本要求 . 346
9.3 預測建模準備 . 347
9.3.1 基礎資料獲取 . 347
9.3.2 缺失資料處理 . 349
9.3.3 潛在規律分析 . 352
9.4 基於DNN 演算法的預測 355
9.4.1 資料要求 . 356
9.4.2 數據預處理 . 356
9.4.3 網路結構設計 . 357
9.4.4 建立模型 . 358
9.4.5 預測實現 . 359
9.4.6 效果評估 . 359
9.5 基於LSTM 演算法的預測 361
9.5.1 資料要求 . 361
9.5.2 數據預處理 . 362
9.5.3 網路結構設計 . 362
9.5.4 建立模型 . 363
9.5.5 預測實現 . 364
9.5.6 效果評估 . 364
第10 章 股票價格預測 . 367
10.1 股票市場簡介 . 367
10.2 獲取股票資料 . 368
10.3 基於VAR 演算法的預測 . 371
10.3.1 平穩性檢驗 . 371
10.3.2 VAR 模型定階 372
10.3.3 預測及效果驗證 . 373
10.4 基於LSTM 演算法的預測. 375
10.4.1 資料要求 . 375
10.4.2 數據預處理 . 376
10.4.3 網路結構設計 . 377
10.4.4 建立模型 . 377
10.4.5 預測實現 . 378
10.4.6 效果評估 . 378
參考文獻 . 381
網路書店
類別
折扣
價格
-
新書$714