實戰大數據:MATLAB數據挖掘詳解與實踐

實戰大數據:MATLAB數據挖掘詳解與實踐
定價:534
NT $ 465
  • 作者:許國根
  • 出版社:清華大學出版社
  • 出版日期:2017-08-01
  • 語言:簡體中文
  • ISBN10:730245101X
  • ISBN13:9787302451013
  • 裝訂:547頁 / 普通級 / 1-1
 

內容簡介

大數據時代,我們需要對各種海量數據進行篩選、清洗、挖掘,在這個過程中,獲取有效數據的方式方法和模型算法成為了整個數據挖掘過程的重點,MATLAB作為一個數據挖掘工具,如何正確和准確地使用它成為了重中之重。

針對實際應用數據挖掘技術的要求,本書既介紹了數據挖掘的基礎理論和技術,又較為詳細地介紹了各種算法以及MATLAB程序。本書共分4篇,分別介紹了數據挖掘的基本概念、技術與算法以及應用實例。期望通過大量的實例分析幫助廣大讀者掌握數據挖掘技術,並應用於實際的研究中,提高對海量數據信息的處理及挖掘能力。本書針對性和實用性強,具有較高的理論和實用價值。

本書作者就職於部隊高校,專攻數據挖掘,並應用於大量實際項目,本書同時得到了國內著名數據挖掘公司的技術支持,很多案例來自實際項目。

本書可作為高等院校計算機工程、信息工程、生物醫學工程、化學、環境、經濟、管理等學科的研究生、本科生的教材或教學參考書,亦可作為企事業單位管理者、信息分析人員、市場營銷人員和研究與開發人員的參考資料。

許國根,畢業於南京大學分析化學專業,長期奮斗在一線的高校資深化學教師。為了實現「數學化學」夢想,一直致力於數學在化學中的應用研究,熱衷於MATLAB、模式識別、數據挖掘、化學計量學等相關知識的學習與應用,撰寫過多部介紹MATLAB在化學中應用技巧的書籍。
 

目錄

第1章 緒論 1
1.1 數據挖掘概述 2
1.2 數據挖掘的分類 4
1.3 數據挖掘的過程 5
1.4 數據挖掘的任務 6
1.5 數據挖掘的對象 8
1.5.1 數據庫 8
1.5.2 文本 10
1.5.3 圖像與視頻數據 10
1.5.4 Web數據 11
1.6 數據挖掘建模方法 11
1.6.1 業務理解 12
1.6.2 數據理解 13
1.6.3 數據准備 13
1.6.4 建模 14
1.6.5 評估 15
1.6.6 部署 16
1.7 數據挖掘的應用 16
1.7.1 在金融領域的應用 16
1.7.2 在零售業中的應用 17
1.7.3 在電信業的應用 18
1.7.4 在管理中的應用 19
1.7.5 在化學研究領域中的應用 19
1.7.6 在材料研究、生產方面的應用 20
1.7.7 在機械故障診斷與監測中的應用 21
1.7.8 在醫療領域中的應用 22
第2章 數據挖掘算法 25
2.1 決策樹算法 26
2.1.1 決策樹基本算法 27
2.1.2 ID3算法 29
2.1.3 C4.5算法 30
2.1.4 CART算法 31
2.1.5 決策樹的評價標准 32
2.1.6 決策樹的剪枝及優化 33
2.1.7 基於matlab的決策樹分析 34
2.2 人工神經網絡算法 41
2.2.1 人工神經網絡概述 41
2.2.2 人工神經網絡的基本模型 41
2.2.3 BP神經網絡 43
2.2.4 RBF神經網絡 45
2.2.5 SOM神經網絡 46
2.2.6 反饋型神經網絡(Hopfield) 47
2.2.7 基於matlab的神經網絡方法 49
2.3 進化算法 55
2.3.1 進化算法的基本原理 56
2.3.2 基因算法的主要步驟 60
2.3.3 基本遺傳算法 61
2.3.4 進化規划算法 63
2.3.5 進化策略計算 64
2.3.6 量子遺傳算法 68
2.3.7 人工免疫算法 72
2.3.8 基於matlab的進化算法 80
2.4 統計分析方法 87
2.4.1 假設檢驗 87
2.4.2 回歸分析 91
2.4.3 二項邏輯(logistic)回歸 100
2.4.4 方差分析 104
2.4.5 主成分分析 107
2.4.6 因子分析 110
2.4.7 基於matlab的統計分析方法 113
2.5 貝葉斯網絡方法 141
2.5.1 貝葉斯定理、先驗和后驗 142
2.5.2 貝葉斯網絡 142
2.5.3 貝葉斯網絡學習 143
2.5.4 主要貝葉斯網絡模型 145
2.5.5 基於matlab的貝葉斯網絡方法 148
2.6 支持向量機 160
2.6.1 支持向量機概述 160
2.6.2 核函數 162
2.6.3 基於matlab的支持向量機方法 164
2.7 關聯分析 167
2.7.1 概述 167
2.7.2 Apriori關聯規則算法 170
2.7.3 基於分類搜索的關聯規則算法 171
2.7.4 時序關聯規則算法 173
2.7.5 多值屬性關聯規則算法 174
2.7.6 增量關聯規則算法 175
2.7.7 基於關聯規則的分類算法 176
2.7.8 模糊關聯分類算法 177
2.7.9 關聯規則的評價 178
2.7.10 辛普森悖論 179
2.7.11 基於matlab的關聯規則分析 180
2.8 其他數據挖掘方法 182
2.8.1 近鄰法 182
2.8.2 K-means聚類 184
2.8.3 基於matlab的近鄰法及k-means聚類法 187
第3章 數據挖掘相關技術 191
3.1 數據倉庫 192
3.1.1 概述 192
3.1.2 數據倉庫設計 195
3.1.3 數據倉庫的開發應用 199
3.1.4 數據倉庫的技術管理 209
3.1.5 OLAP技術 210
3.1.6 基於matlab的數據倉庫開發技術 214
3.2 模糊集理論 234
3.1.1 模糊集合 234
3.1.2 模糊關系 237
3.1.3 模糊聚類 239
3.3.5 基於matlab的模糊集處理技術 244
3.3 粗糙集技術 255
3.3.1 粗糙集理論的基本概念 256
3.3.2 分類規則的形成 259
3.3.3 知識的約簡 259
3.3.4 模糊集與粗糙集 261
3.3.5 基於matlab的粗糙集處理方法 262
3.4 目標優化技術 265
3.4.1 極值問題 266
3.4.2 無約束非線性規划 267
3.4.3 有約束非線性規划 270
3.4.4 大規模優化問題的分解算法 270
3.4.5 其他優化方法 273
3.4.6 基於matlab的目標優化方法 274
3.5 可視化技術 281
3.5.1 可視化技術分類 282
3.5.2 多維數據可視化 283
3.5.3 圖形的特征分析 294
3.5.4 基於多元圖的圖形分類方法 297
3.5.5 基於色度學空間的多元圖表示 299
3.5.6 基於matlab的數據可視化技術 300
3.6 公式發現 314
3.6.1 概述 315
3.6.2 公式發現系統中的知識 315
3.6.3 基於matlab的公式發現 319
3.7 多媒體數據挖掘技術 320
3.7.1 文本挖掘 323
3.7.2 圖像挖掘 331
3.7.3 視頻挖掘 331
3.7.4 音頻挖掘 332
3.7.5 復合類型數據的挖掘 333
3.8 Web數據挖掘技術 334
3.8.1 Web內容挖掘 335
3.8.2 Web結構挖掘 337
3.8.3 Web使用挖掘 338

第4章 數據挖掘應用實戰 343
4.1 數據關系發現 344
4.2 數據統計特性 344
4.3 數據預處理 349
4.3.1 數據清理 349
4.3.2 數據集成與轉換 351
4.3.3 數據歸約與濃縮 353
4.3.4 數值數據的概念分層與離散化 360
4.3.5 例題 362
4.4 分類 373
4.5 例題 376
4.6 預測 381
4.6.1 回歸分析 381
4.6.2 時間序列預測模型 385
4.6.3 馬爾可夫鏈 389
4.6.4 灰色系統方法 390
4.6.5 例題 398
4.7 聚類 418
4.7.1 聚類分析概述 418
4.7.2 聚類分析中的數據類型 419
4.7.3相似性度量 422
4.7.4 聚類的特征 427
4.7.5 聚類准則 427
4.7.6 划分方法 429
4.7.7 層次方法 430
4.7.8 基於密度的方法 433
4.7.9 基於網格的方法 434
4.7.10 基於模型的聚類方法 435
4.4.11 基於目標函數的方法 436
4.7.12 離群點檢測 438
4.7.13 聚類有效性 445
4.7.14 例題 448
4.8 時序數據挖掘 462
4.8.1 基本定義 463
4.8.2 時序數據挖掘參數 464
4.8.3 時序關聯規則 464
4.8.4 時間序列挖掘 466
4.8.5 時間序列分段線性表示 468
4.8.6 時間序列的預測 469
4.8.7 例題 469
4.9 關聯規則挖掘 481
4.9.1 關聯規則的類型及挖掘算法 481
4.9.2 基於組織進化的關聯規則挖掘 481
4.9.3 基於組織層次進化的關聯規則挖掘 483
4.9.4 多維關聯規則挖掘 484
4.9.5 關聯規則擴展 485
4.9.6 例題 487
參考文獻 500
網路書店 類別 折扣 價格
  1. 新書
    87
    $465