應用預測建模

應用預測建模
定價:594
NT $ 517
 

內容簡介

這是一本專注於預測建模的數據分析書,意在為實踐者提供預測建模過程的指導,比如如何進行數據預處理、模型調優、預測變量重要性度量、變量選擇等。

讀者可以從中學到許多建模方法以及提高對許多常用的、現代的有效模型的認識,如線性回歸、非線性回歸和分類模型,涉及樹方法、支持向量機等。第10章和第17章分別研究混凝土混合物的抗壓強度和作業調度兩個案例。

作者重實際應用,輕數學理論,從實際數據出發,結合開源軟件R語言來求解實際問題,詳細給出R代碼和處理的步驟。R包Applied Predictive Modeling包含書中使用的數據,以及可以用於重復書中每一章分析的R代碼,讓讀者能在一定精度范圍內重復本書的結果,並自然地將書中的預測建模方法應用到自己的數據上。章后附有習題,方便讀者鞏固所學。這本業界互相推薦的好書,適合所有數據分析人員閱讀。
 

目錄

譯者序
前言
第1章導論
1.1預測與解釋
1.2預測模型的關鍵部分
1.3專業術語
1.4實例數據集和典型數據場景
1.5概述
1.6符號
第一部分一般策略
第2章預測建模過程簡介
2.1案例分析:預測燃油效能
2.2主題
2.3總結
第3章數據預處理
3.1案例分析:高內涵篩選中的細胞分組
3.2單個預測變量數據變換
3.3多個預測變量數據變換
3.4處理缺失值
3.5移除預測變量
3.6增加預測變量
3.7區間化預測變量
3.8計算
習題
第4章過度擬合與模型調優
4.1過度擬合的問題
4.2模型調優
4.3數據分割
4.4重抽樣技術
4.5案例分析:信用評分
4.6選擇調優參數值
4.7數據划分建議
4.8不同模型間的選擇
4.9計算
習題
第二部分回歸模型
第5章衡量回歸模型的效果
5.1模型效果的定量度量
5.2方差偏差的權衡
5.3計算
第6章線性回歸及其擴展
6.1案例分析:定量構效關系建模
6.2線性回歸
6.3偏最小二乘法
6.4懲罰模型
6.5計算
習題
第7章非線性回歸模型
7.1神經網絡
7.2多元自適應回歸樣條
7.3支持向量機
7.4K近鄰
7.5計算
習題
第8章回歸樹與基於規則的模型
8.1簡單回歸樹
8.2回歸模型樹
8.3基於規則的模型
8.4裝袋樹
8.5隨機森林
8.6助推法
8.7Cubist
8.8計算
習題
第9章溶解度模型總結
第10章案例研究:混凝土混合物的抗壓強度
10.1模型構建策略
10.2模型性能
10.3優化抗壓強度
10.4計算
第三部分分類模型
第11章分類模型的效果度量
11.1類預測
11.2評估預測類
11.3評估類概率
11.4計算
第12章判別分析和其他線性分類模型
12.1案例分析:預測是否成功申請經費
12.2邏輯回歸
12.3線性判別分析
12.4偏最小二乘判別分析
12.5懲罰模型
12.6最近收縮質心
12.7計算
習題
第13章非線性分類模型
13.1非線性判別分析
13.2神經網絡
13.3靈活判別分析
13.4支持向量機
13.5K近鄰
13.6朴素貝葉斯
13.7計算
習題
第14章分類樹與基於規則的模型
14.1基本的分類樹
14.2基於規則的模型
14.3裝袋決策樹
14.4隨機森林
14.5助推法
14.6C5.0
14.7比較兩種分類預測變量編碼方式
14.8計算
習題
第15章經費申請模型的總結
第16章對嚴重類失衡的補救方法
16.1案例分析: 預測房車保險所有權
16.2類失衡的影響
16.3模型調優
16.4選擇截點
16.5調整先驗概率
16.6不等案例權重
16.7抽樣方法
16.8成本敏感度訓練
16.9計算
習題
第17章案例研究:作業調度
17.1數據切分和模型策略
17.2結果
17.3計算
第18章衡量預測變量重要性
18.1數值結果變量
18.2分類結果變量
18.3其他方法
18.4計算
習題
第19章特征選擇介紹
19.1使用無信息預測變量的結果
19.2減少預測變量個數的方法
19.3繞封法
19.4過濾法
19.5選擇偏差
19.6案例分析:預測認知損傷
19.7計算
習題
第20章影響模型表現的因素
20.1第Ⅲ類錯誤
20.2結果變量的測量誤差
20.3預測變量的測量誤差
20.4連續變量離散化
20.5模型預測何時是可信的
20.6大樣本的影響
20.7計算
習題
附錄
附錄A各種模型的總結
附錄BR語言介紹
附錄C值得關注的網站
參考文獻
網路書店 類別 折扣 價格
  1. 新書
    87
    $517