本書共5章,涉及使用SASEG做數據分析的主要分析方法。其中,第1章為數據分析方法概述,第2章至第4章為橫截面數據分析方法。第5章為時間序列分析方法。每章都根據所涉及的知識點的不同,選取了實用的案例,並為讀者准備了相應的思考和練習題。
本書是一本面向商業數據分析初學者的教材,從具體的商業數據分析案例入手,使讀者掌握數據分析的目的、理念、思路與分析步驟。
本書力圖淡化技術,對於方法的介紹也盡量避免涉及過多的數學內容,和高等數學相關的內容只在線形回歸和主成分分析這兩節中涉及到,而且都輔以圖形作形象的展現。因此本書的讀者只需要具有高中水平的數學基礎即可。
目錄
第1 章 數據分析方法概述 1
1.1 數據分析概述 .. 2
1.1.1 數據分析過程 2
1.1.2 數據分析的商業驅動 3
1.2 數據分析與挖掘方法分類介紹 . 5
1.2.1 描述性——無監督的學習 . 7
1.2.2 預測性——有監督的學習 .. 10
1.3 數據分析的方法論 . 12
1.3.1 數據挖掘的項目管理方法論:CRISP-DM 13
1.3.2 數據整理與建模的方法論:SEMMA .. 14
1.3.3 SAS EG 和SPSS 任務菜單編排與SEMMA 之間的關系. 16
第2 章 描述數據特征 .. 19
2.1 認識數據類型 20
2.2 單變量描述統計方法 21
2.2.1 分類變量的描述 21
2.2.2 連續變量的描述 22
2.3 創建頻數報表 35
2.4 生成匯總統計量 .. 38
2.5 用匯總表任務生成匯總報表 41
2.6 繪制條形圖 . 46
2.7 繪制地圖 .. 53
2.8 使用SPSS 進行描述統計 .. 55
2.8.1 頻率過程 .. 56
2.8.2 描述過程 .. 57
2.8.3 探索過程 .. 58
2.8.4 P-P 圖與Q-Q 圖 58
2.9 使用SPSS 繪制統計圖形 .. 60
2.9.1 作圖方法 .. 60
2.9.2 餅圖、柱圖與條圖 .. 64
2.9.3 線圖、高低圖和雙軸圖 70
2.9.4 散點圖 73
第3 章 描述性數據分析/挖掘方法 . 75
3.1 客戶細分方法介紹 . 76
3.1.1 客戶細分的意義 76
3.1.2 根據客戶利潤貢獻進行划分 . 77
3.1.3 根據個人或公司的生命歷程進行划分 78
3.1.4 根據客戶的產品偏好進行划分 79
3.1.5 根據客戶交易/消費行為進行划分 . 80
3.1.6 根據客戶的多維行為屬性細分 81
3.1.7 展現客戶/產品結構的戰略細分 .. 81
3.1.8 客戶細分:綜合運用 . 82
3.2 連續變量間關系探索與變量約減 . 82
3.2.1 多元統計基礎 . 82
3.2.2 多元變量壓縮的思路 . 87
3.2.3 主成分分析 .. 89
3.2.4 因子分析 . 103
3.2.5 對應分析 . 112
3.2.6 最優尺度分析 .. 119
3.2.7 多維尺度分析 .. 124
3.3 聚類分析 133
3.3.1 基本邏輯 . 134
3.3.2 系統聚類 . 135
3.3.3 快速聚類 . 146
3.3.4 兩步聚類 . 155
第4 章 預測性數據分析方法 .. 161
4.1 假設檢驗概念 . 162
4.1.1 統計推斷基本概念 164
4.1.2 變量分布的圖形探索 .. 165
4.1.3 均值的置信區間 . 167
4.1.4 假設檢驗基礎 .. 168
4.1.5 T 檢驗 . 169
4.2 構造對連續變量的預測模型 . 174
4.2.1 方差分析(ANOVA) 174
4.2.2 線性回歸 . 190
4.2.3 線性回歸的模型診斷 .. 203
4.2.4 線性回歸的全流程 211
4.3 構造對二分類變量的預測模型 217
4.3.1 分類變量之間的相關性檢驗 .. 217
4.3.2 邏輯回歸 . 224
第5 章 時間序列 .. 240
5.1 時間序列的趨勢分解法 241
5.1.1 趨勢分解法簡介 . 241
5.2.2 使用SAS EG 進行時間序列趨勢分解 .. 242
5.2.3 使用SPSS 進行時間序列趨勢分解 244
5.2 平穩時間序列(ARMA)模型設定與識別 . 245
5.2.1 平穩時間序列定義 245
5.2.2 平穩時間序列模型建模 . 246
5.2.3 ARMA 的模型設定與識別 .. 247
5.3 非平穩時間序列(ARIMA)模型設定與識別 .. 250
5.4 SAS EG 時間序列建模步驟 .. 252
5.5 SPSS 時間序列建模步驟 . 258
5.5.1 SPSS 構造ARIMA 模型使用的任務菜單 .. 258
5.5.2 「定義日期」任務 .. 260
5.5.3 「序列圖」任務 261
5.5.4 「自相關」任務 262
5.5.5 「創建模型」任務 .. 263
5.5.6 「使用模型」任務 .. 267
5.5.7 其他內容 . 267
附錄A 數據說明 .. 271
附錄B CDA 數據分析師致力於最好的數據分析人才建設 .. 278
參考文獻 282
1.1 數據分析概述 .. 2
1.1.1 數據分析過程 2
1.1.2 數據分析的商業驅動 3
1.2 數據分析與挖掘方法分類介紹 . 5
1.2.1 描述性——無監督的學習 . 7
1.2.2 預測性——有監督的學習 .. 10
1.3 數據分析的方法論 . 12
1.3.1 數據挖掘的項目管理方法論:CRISP-DM 13
1.3.2 數據整理與建模的方法論:SEMMA .. 14
1.3.3 SAS EG 和SPSS 任務菜單編排與SEMMA 之間的關系. 16
第2 章 描述數據特征 .. 19
2.1 認識數據類型 20
2.2 單變量描述統計方法 21
2.2.1 分類變量的描述 21
2.2.2 連續變量的描述 22
2.3 創建頻數報表 35
2.4 生成匯總統計量 .. 38
2.5 用匯總表任務生成匯總報表 41
2.6 繪制條形圖 . 46
2.7 繪制地圖 .. 53
2.8 使用SPSS 進行描述統計 .. 55
2.8.1 頻率過程 .. 56
2.8.2 描述過程 .. 57
2.8.3 探索過程 .. 58
2.8.4 P-P 圖與Q-Q 圖 58
2.9 使用SPSS 繪制統計圖形 .. 60
2.9.1 作圖方法 .. 60
2.9.2 餅圖、柱圖與條圖 .. 64
2.9.3 線圖、高低圖和雙軸圖 70
2.9.4 散點圖 73
第3 章 描述性數據分析/挖掘方法 . 75
3.1 客戶細分方法介紹 . 76
3.1.1 客戶細分的意義 76
3.1.2 根據客戶利潤貢獻進行划分 . 77
3.1.3 根據個人或公司的生命歷程進行划分 78
3.1.4 根據客戶的產品偏好進行划分 79
3.1.5 根據客戶交易/消費行為進行划分 . 80
3.1.6 根據客戶的多維行為屬性細分 81
3.1.7 展現客戶/產品結構的戰略細分 .. 81
3.1.8 客戶細分:綜合運用 . 82
3.2 連續變量間關系探索與變量約減 . 82
3.2.1 多元統計基礎 . 82
3.2.2 多元變量壓縮的思路 . 87
3.2.3 主成分分析 .. 89
3.2.4 因子分析 . 103
3.2.5 對應分析 . 112
3.2.6 最優尺度分析 .. 119
3.2.7 多維尺度分析 .. 124
3.3 聚類分析 133
3.3.1 基本邏輯 . 134
3.3.2 系統聚類 . 135
3.3.3 快速聚類 . 146
3.3.4 兩步聚類 . 155
第4 章 預測性數據分析方法 .. 161
4.1 假設檢驗概念 . 162
4.1.1 統計推斷基本概念 164
4.1.2 變量分布的圖形探索 .. 165
4.1.3 均值的置信區間 . 167
4.1.4 假設檢驗基礎 .. 168
4.1.5 T 檢驗 . 169
4.2 構造對連續變量的預測模型 . 174
4.2.1 方差分析(ANOVA) 174
4.2.2 線性回歸 . 190
4.2.3 線性回歸的模型診斷 .. 203
4.2.4 線性回歸的全流程 211
4.3 構造對二分類變量的預測模型 217
4.3.1 分類變量之間的相關性檢驗 .. 217
4.3.2 邏輯回歸 . 224
第5 章 時間序列 .. 240
5.1 時間序列的趨勢分解法 241
5.1.1 趨勢分解法簡介 . 241
5.2.2 使用SAS EG 進行時間序列趨勢分解 .. 242
5.2.3 使用SPSS 進行時間序列趨勢分解 244
5.2 平穩時間序列(ARMA)模型設定與識別 . 245
5.2.1 平穩時間序列定義 245
5.2.2 平穩時間序列模型建模 . 246
5.2.3 ARMA 的模型設定與識別 .. 247
5.3 非平穩時間序列(ARIMA)模型設定與識別 .. 250
5.4 SAS EG 時間序列建模步驟 .. 252
5.5 SPSS 時間序列建模步驟 . 258
5.5.1 SPSS 構造ARIMA 模型使用的任務菜單 .. 258
5.5.2 「定義日期」任務 .. 260
5.5.3 「序列圖」任務 261
5.5.4 「自相關」任務 262
5.5.5 「創建模型」任務 .. 263
5.5.6 「使用模型」任務 .. 267
5.5.7 其他內容 . 267
附錄A 數據說明 .. 271
附錄B CDA 數據分析師致力於最好的數據分析人才建設 .. 278
參考文獻 282
網路書店
類別
折扣
價格
-
新書$354