數據挖掘:實用案例分析

數據挖掘:實用案例分析
定價:474
NT $ 374
  • 作者:張良均
  • 出版社:機械工業出版社
  • 出版日期:2013-07-01
  • 語言:簡體中文
  • ISBN10:711142591X
  • ISBN13:9787111425915
  • 裝訂:403頁 / 普通級 / 1-1
 

內容簡介

是數據挖掘實戰領域頗具特色的一部作品,作者曾為10余個行業上百家大型企業提供數據挖掘服務,本書是其在數據挖掘領域探索近10年的經驗總結之作。全書以實踐和實用為宗旨,深度與廣度兼顧,實踐與理論並舉。

《數據挖掘:實用案例分析》共12章,分三個部分。

第一部分是基礎篇(第1~4章),主要對數據挖掘的基本概念、應用分類、建模方法及常用的建模工具進行了介紹,並對本書所用到的數據挖掘建模平台TipDM進行了說明。

第二部分是實戰篇(第5~10章),以案例的形式對數據挖掘技術在金融、電信、電力、互聯網、生產制造以及公共服務等行業的應用場景進行了討論;首先介紹案例背景,然后闡述分析方法與過程,最后完成模型構建;在介紹建模過程的同時穿插操作訓練,把相關的知識點嵌入相應的操作過程中;此外,第10章精心設計了6個實驗項目,讀者可以通過本章介紹的方法動手實踐,以鞏固數據挖掘知識,在分析建模過程的同時,進一步增強動手能力。

第三部分是高級篇(第11~12章),主要介紹基於第三方接口的數據挖掘二次開發技術,重點對常用的WEKA和MATLAB數據挖掘算法接口進行了探討;最后對基於Hadoop框架的海量數據挖掘進行了說明,以滿足讀者更高層次的需求。

張良均,資深數據挖掘專家和模式識別專家,有近10年的數據挖掘應用與咨詢經驗,8年多的數據倉庫系統管理與實施經驗,超過10年的系統開發與設計經驗。為電信、電力、零售、農業、銀行、電力、生物、化工、醫藥等多個行業上百家大型企業提供過數據挖掘應用與咨詢服務,實踐經驗非常豐富。此外,他精通Java EE企業級應用開發,是廣東工業大學和華南師范大學客座教授,著有《神經網絡實用教程》一書。
 

目錄

前言

第一部分 基礎篇

第1章 初識數據挖掘2
1.1什麼是數據挖掘2
1.2數據挖掘在企業商務智能應用中的定位2
1.2.1數據挖掘給企業帶來最大的投資收益3
1.2.2數據挖掘從本質上提升商務智能平台的價值3
1.2.3數據挖掘讓商務智能流程真正形成閉環4
1.3信息類BI應用與知識類BI應用5
1.4數據挖掘現狀及應用前景5
1.5本章小結7

第2章 數據挖掘的應用分類8
2.1分類與回歸8
2.1.1分類與回歸建模原理9
2.1.2分類與回歸算法10
2.2聚類11
2.2.1聚類分析建模原理11
2.2.2聚類算法12
2.3關聯規則13
2.3.1什麼是關聯規則13
2.3.2關聯規則算法14
2.4時序模式14
2.4.1什麼是時序模式14
2.4.2時間序列的組合成分15
2.4.3時間序列的組合模型15
2.4.4時序算法16
2.5偏差檢測16
2.6本章小結17

第3章 數據挖掘建模18
3.1數據挖掘的過程18
3.2數據挖掘建模過程18
3.2.1定義挖掘目標18
3.2.2數據取樣19
3.2.3數據探索20
3.2.4預處理21
3.2.5模式發現23
3.2.6模型構建23
3.2.7模型評價24
3.3常用的建模工具27
3.4本章小結29

第4章 頂尖數據挖掘平台TipDM31
4.1TipDM產品功能31
4.1.1TipDM平台提供的數據探索及預處理算法31
4.1.2TipDM平台提供的分類與回歸算法32
4.1.3TipDM平台提供的時序模式算法34
4.1.4TipDM平台提供的聚類分析算法35
4.1.5TipDM平台提供的關聯規則算法35
4.2TipDM使用說明37
4.3TipDM產品特點39
4.3.1支持CRISP—DM數據挖掘標准流程39
4.3.2提供豐富的數據挖掘模型和靈活算法40
4.3.3具有多模型的整合能力40
4.3.4提供靈活多樣的應用開發接口40
4.3.5海量數據的處理能力40
4.3.6適應不同類型層次人員需求41
4.4本章小結42

第二部分 實戰篇

第5章 數據挖掘在金融電信行業的應用44
5.1案例一:基於公司價值評價的證券策略投資44
5.1.1挖掘目標的提出44
5.1.2分析方法與過程44
5.1.3建模仿真51
5.1.4核心知識點52
5.1.5拓展思考53
5.2案例二:電信3G客戶識別系統54
5.2.1挖掘目標的提出54
5.2.2分析方法與過程54
5.2.3建模仿真58
5.2.4核心知識點61
5.2.5拓展思考63
5.3案例三:基於客戶分群的精准智能營銷64
5.3.1挖掘目標的提出64
5.3.2分析方法與過程65
5.3.3建模仿真75
5.3.4核心知識點81
5.3.5拓展思考82
5.4本章小結83

第6章 數據挖掘在電力行業的應用84
6.1案例一:電力負荷預測84
6.1.1挖掘目標的提出84
6.1.2分析方法與過程85
6.1.3建模仿真90
6.1.4核心知識點94
6.1.5拓展思考95
6.2案例二:自適應防竊漏電實時診斷96
6.2.1挖掘目標的提出96
6.2.2分析方法與過程96
6.2.3建模仿真107
6.2.4核心知識點110
6.2.5擴展思考111
6.3本章小結112

第7章 數據挖掘在互聯網行業的應用113
7.1案例一:商業零售行業中的購物籃分析113
7.1.1挖掘目標的提出113
7.1.2分析方法與過程113
7.1.3建模仿真118
7.1.4核心知識點120
7.1.5拓展思考121
7.2案例二:電子商務網站用戶行為分析124
7.2.1挖掘目標的提出124
7.2.2分析方法與過程124
7.2.3建模仿真129
7.2.4核心知識點132
7.2.5拓展思考132
7.3案例三:網絡入侵智能檢測134
7.3.1挖掘目標的提出134
7.3.2分析方法與過程136
7.3.3建模仿真137
7.3.4核心知識點141
7.3.5拓展思考141
7.4案例四:基於用戶行為分析的定向網絡廣告投放142
7.4.1挖掘目標的提出142
7.4.2分析方法與過程143
7.4.3建模仿真146
7.4.4結果及分析158
7.4.5核心知識點159
7.4.6拓展思考160
7.5案例五:企業信息系統用戶服務感知評價161
7.5.1挖掘目標的提出161
7.5.2分析方法與過程161
7.5.3建模仿真186
7.5.4核心知識點192
7.5.5拓展思考193
7.6本章小結194

第8章 數據挖掘在生產制造行業中的應用195
8.1案例一:基於小波變換的樁基完整性檢測195
8.1.1挖掘目標的提出195
8.1.2分析方法與過程196
8.1.3仿真過程202
8.1.4核心知識點204
8.1.5拓展思考204
8.2案例二:基於水色圖像的水質評價205
8.2.1挖掘目標的提出205
8.2.2分析方法與過程206
8.2.3建模仿真210
8.2.4核心知識點213
8.2.5拓展思考214
8.3案例三:生物質廢物混合厭氧消化優勢組分互補機制216
8.3.1挖掘目標的提出216
8.3.2分析方法與過程217
8.3.3建模仿真221
8.3.4核心知識點223
8.3.5拓展思考224
8.4案例四:基於RFM的企業客戶關系分析224
8.4.1挖掘目標的提出224
8.4.2分析過程與方法226
8.4.3建模仿真229
8.4.4核心知識點236
8.4.5拓展思考236
8.5案例五:水產養殖投入產出多目標優化仿真239
8.5.1挖掘目標的提出239
8.5.2分析方法與過程240
8.5.3建模仿真244
8.5.4核心知識點249
8.5.5拓展思考250
8.6本章小結252

第9章 數據挖掘在公共服務行業的應用253
9.1案例一:乳腺癌證素變化規律及截斷療法253
9.1.1挖掘目標的提出253
9.1.2分析方法與過程255
9.1.3建模仿真265
9.1.4核心知識點274
9.1.5拓展思考274
9.2案例二:卷煙消費者購買行為分析277
9.2.1挖掘目標的提出277
9.2.2分析過程與方法278
9.2.3挖掘建模281
9.2.4核心知識點287
9.2.5拓展思考288
9.3案例三:納稅人偷漏稅評估288
9.3.1挖掘目標的提出288
9.3.2分析方法與過程290
9.3.3建模仿真294
9.3.4核心知識點300
9.3.5拓展思考301
9.4案例四:道路缺陷自動識別302
9.4.1挖掘目標的提出302
9.4.2分析方法與過程304
9.4.3建模仿真319
9.4.4核心知識點322
9.4.5拓展思考322
9.5案例五:航空公司客運信息挖掘322
9.5.1挖掘目標的提出322
9.5.2分析方法與過程323
9.5.3建模仿真327
9.5.4核心知識點348
9.5.5拓展思考352
9.6本章小結353

第10章 動手實踐354
10.1實驗一:數據探索及數據預處理354
10.2實驗二:神經網絡模型的構建與使用356
10.3實驗三:決策樹模型的構建與使用358
10.4實驗四:聚類算法的構建與使用360
10.5實驗五:關聯規則模型的構建與使用361
10.6實驗六:時間序列模型的構建與使用363
10.7本章小結364

第三部分 高級篇

第11章 基於第三方接口的數據挖掘二次開發366
11.1WEKA數據挖掘接口366
11.1.1WEKA功能及其算法366
11.1.2WEKA包結構367
11.1.3WEKA算法入口370
11.1.4二次開發相關輸出370
11.2MATLAB數據挖掘接口370
11.3案例:基於MATLAB接口的數據挖掘二次開發372
11.3.1接口算法編程372
11.3.2用JavaBuilder創建Java組件385
11.3.3安裝MATLAB運行時環境386
11.3.4JDK環境及設置386
11.4本章小結389

第12章 基於Hadoop框架的海量數據挖掘開發390
12.1基於雲計算的海量數據挖掘技術特點390
12.2基於Hadoop的並行數據挖掘算法工具箱TipCDM392
12.3案例:基於海量計量數據的電力客戶在線分群方法392
12.3.1挖掘目標的提出392
12.3.2分析方法與過程393
12.3.3建模仿真399
12.3.4核心知識點400
12.4本章小結401

參考文獻402
網路書店 類別 折扣 價格
  1. 新書
    79
    $374