本書對大數據挖掘與應用的基本算法進行了系統的介紹,每種算法不僅包括對算法基本原理的介紹,而且配有大量的例題以及基於阿里雲數加平台的演示,這種理論與實踐相結合的方式極大地方便了讀者對抽象的數據挖掘算法的理解和掌握。
本書共17章,內容覆蓋了數據預處理、關聯規則挖掘算法、分類算法和聚類算法及常見的數據挖掘應用,具體章節包括大數據簡介、數據預處理技術、關聯規則挖掘、邏輯回歸方法、KNN算法、朴素貝葉斯分類算法、隨機森林分類算法、支持向量機、人工神經網絡算法、決策樹分類算法、K means聚類算法、K
中心點聚類算法、自組織神經網絡聚類算法、DBSCAN聚類算法以及社交網絡分析方法及應用、文本分析方法及應用和推薦系統方法及應用等內容。
本書可作為高等院校數據挖掘課程的教材,也可作為從事數據挖掘工作及其他相關工程技術工作的人員的參考書。
目錄
第一篇 基礎篇
第1章 大數據簡介
1.1 大數據
1.1.1 大數據的定義
1.1.2 大數據的特點
1.1.3 大數據處理的挑戰
1.2 大數據挖掘
1.2.1 大數據挖掘的定義
1.2.2 大數據挖掘的特點
1.3 大數據挖掘的相關方法
1.3.1 數據預處理技術
1.3.2 關聯規則挖掘
1.3.3 分類
1.3.4 聚類
1.3.5 孤立點挖掘
1.3.6 演變分析
1.3.7 特異群組分析
1.4 大數據挖掘類型
1.4.1 Web數據挖掘
1.4.2 空間數據挖掘
1.4.3 流數據挖掘
1.5 大數據挖掘的常見應用
1.5.1 社交網絡分析
1.5.2 文本分析
1.5.3 推薦系統
1.6 常用的大數據統計分析方法
1.6.1 百分位
1.6.2 皮爾森相關系數
1.6.3 直方圖
1.6.4 T檢驗
1.6.5 卡方檢驗
1.7 常用的大數據挖掘評估方法
1.8 大數據平台相關技術
1.8.1 分布式存儲技術
1.8.2 分布式任務調度技術
1.8.3 並行計算技術
1.8.4 其他技術
1.9 大數據平台實例——阿里雲數加平台
1.9.1 數加平台簡介
1.9.2 數加平台產品簡介
1.9.3 數加平台優勢特色
1.9.4 機器學習平台簡介
1.9.5 機器學習平台功能
1.9.6 機器學習平台操作流程
1.10 小結
思考題
第二篇 技術篇
第2章 數據預處理技術
2.1 數據預處理的目的
2.2 數據采樣
2.2.1 加權采樣
2.2.2 隨機采樣
2.2.3 分層采樣
2.3 數據清理
2.3.1 填充缺失值
2.3.2 光滑噪聲數據
2.3.3 數據清理過程
2.4 數據集成
2.4.1 數據集成簡介
2.4.2 常用數據集成方法
2.5 數據變換
2.5.1 數據變換簡介
2.5.2 數據規范化
2.6 數據歸約
2.6.1 數據立方體聚集
2.6.2 維歸約
第3章 關聯規則挖掘
第4章 邏輯回歸方法
第5章 KNN算法
第6章 朴素貝葉斯分類算法
第7章 隨機森林分類算法
第8章 支持向量機
第9章 人工神經網絡算法
第10章 決策樹分類算法
第11章 K-means聚類算法
第12章 K-中心點聚類算法
第13章 自組織神經網絡聚類算法
第14章 DBSCAN聚類算法
第三篇 綜合應用篇
第15章 社交網絡分析方法及應用
第16章 文本分析方法及應用
第17章 推薦系統方法及應用
參考文獻
第1章 大數據簡介
1.1 大數據
1.1.1 大數據的定義
1.1.2 大數據的特點
1.1.3 大數據處理的挑戰
1.2 大數據挖掘
1.2.1 大數據挖掘的定義
1.2.2 大數據挖掘的特點
1.3 大數據挖掘的相關方法
1.3.1 數據預處理技術
1.3.2 關聯規則挖掘
1.3.3 分類
1.3.4 聚類
1.3.5 孤立點挖掘
1.3.6 演變分析
1.3.7 特異群組分析
1.4 大數據挖掘類型
1.4.1 Web數據挖掘
1.4.2 空間數據挖掘
1.4.3 流數據挖掘
1.5 大數據挖掘的常見應用
1.5.1 社交網絡分析
1.5.2 文本分析
1.5.3 推薦系統
1.6 常用的大數據統計分析方法
1.6.1 百分位
1.6.2 皮爾森相關系數
1.6.3 直方圖
1.6.4 T檢驗
1.6.5 卡方檢驗
1.7 常用的大數據挖掘評估方法
1.8 大數據平台相關技術
1.8.1 分布式存儲技術
1.8.2 分布式任務調度技術
1.8.3 並行計算技術
1.8.4 其他技術
1.9 大數據平台實例——阿里雲數加平台
1.9.1 數加平台簡介
1.9.2 數加平台產品簡介
1.9.3 數加平台優勢特色
1.9.4 機器學習平台簡介
1.9.5 機器學習平台功能
1.9.6 機器學習平台操作流程
1.10 小結
思考題
第二篇 技術篇
第2章 數據預處理技術
2.1 數據預處理的目的
2.2 數據采樣
2.2.1 加權采樣
2.2.2 隨機采樣
2.2.3 分層采樣
2.3 數據清理
2.3.1 填充缺失值
2.3.2 光滑噪聲數據
2.3.3 數據清理過程
2.4 數據集成
2.4.1 數據集成簡介
2.4.2 常用數據集成方法
2.5 數據變換
2.5.1 數據變換簡介
2.5.2 數據規范化
2.6 數據歸約
2.6.1 數據立方體聚集
2.6.2 維歸約
第3章 關聯規則挖掘
第4章 邏輯回歸方法
第5章 KNN算法
第6章 朴素貝葉斯分類算法
第7章 隨機森林分類算法
第8章 支持向量機
第9章 人工神經網絡算法
第10章 決策樹分類算法
第11章 K-means聚類算法
第12章 K-中心點聚類算法
第13章 自組織神經網絡聚類算法
第14章 DBSCAN聚類算法
第三篇 綜合應用篇
第15章 社交網絡分析方法及應用
第16章 文本分析方法及應用
第17章 推薦系統方法及應用
參考文獻
網路書店
類別
折扣
價格
-
新書79折$235