數據科學:R語言實戰

數據科學:R語言實戰
定價:414
NT $ 360
  • 作者:(美)DAN TOOMEY
  • 出版社:人民郵電出版社
  • 出版日期:2016-11-01
  • 語言:簡體中文
  • ISBN10:7115435901
  • ISBN13:9787115435903
  • 裝訂:327頁 / 普通級 / 1-1
 

內容簡介

本書講述的是R語言在數據科學中的應用,目標讀者是從事不同行業的數據分析師、數據挖掘工程師、機器學習工程師、自然語言處理工程師、數據科學家,以及從事大數據和人工智能領域的工作者、學生、老師等。

本書的優點在於其通俗易懂、容易上手,每一個實例都有現成的數據和源代碼,讀者不僅能理解整個案例的來龍去脈,還可以直接編譯本書提供的所有源代碼,從而了解怎麼從實際問題轉變成可實現的代碼,感受R語言的魅力,讓數據產生價值。這種學習和實踐相結合的方式非常適合初學者和有一定經驗的數據分析師。

本書的內容涵蓋了基於數據挖掘的常用模型,包括分類、聚類、關聯分析、預測、異常檢測等,還包括機器學習的常用算法和自然語言處理、數據可視化等內容。本書內容全面,做到了易讀、易用、易理解、易實現、易上手,是不可多得的R語言書籍。
 

目錄

第1章 模式的數據挖掘 1
1.1聚類分析 2
1.1.1K—means聚類 3
1.1.2K—medoids聚類 7
1.1.3分層聚類 12
1.1.4期望最大化 15
1.1.5密度估計 21
1.2異常檢測 24
1.2.1顯示異常值 25
1.2.2計算異常 28
1.3關聯規則 30
1.4問題 33
1.5總結 34

第2章 序列的數據挖掘 35
2.1模式 35
2.1.1Eclat 36
2.1.2arulesNBMiner 40
2.1.3Apriori 43
2.1.4用TraMineR確定序列 47
2.1.5序列相似點 54
2.2問題 57
2.3總結 57

第3章 文本挖掘 59
3.1功能包 60
3.1.1文本處理 60
3.1.2文本集群 69
3.2問題 80
3.3總結 80

第4章 數據分析——回歸分析 81
4.1功能包 81
4.1.1簡單回歸 81
4.1.2多次回歸 88
4.1.3多變量回歸分析 94
4.1.4穩健回歸 100
4.2問題 106
4.3總結 106

第5章 數據分析——相關性 107
5.1功能包 107
5.1.1基本相關性 108
5.1.2可視化相關性 112
5.1.3協方差 114
5.1.4皮爾森相關性 117
5.1.5多分格相關性 118
5.1.6四分相關性 122
5.1.7異構相關矩陣 126
5.1.8部分相關性 128
5.2問題 129
5.3總結 129

第6章 數據分析——聚類 131
6.1功能包 131
6.2K—means聚類 132
6.2.1示例 132
6.2.2Medoids集群 140
6.2.3cascadeKM函數 142
6.2.4基於貝葉斯定理信息選取集群 144
6.2.5仿射傳播聚類 146
6.2.6用於估測集群數量的間隙統計量 149
6.2.7分級聚類 151
6.3問題 153
6.4總結 154

第7章 數據可視化——R圖形 155
7.1功能包 155
7.1.1交互式圖形 156
7.1.2latticist功能包 160
7.1.3ggplot2功能包 169
7.2問題 180
7.3總結 181

第8章 數據可視化——繪圖 183
8.1功能包 183
8.2散點圖 183
8.2.1回歸線 187
8.2.2lowess線條 188
8.2.3scatterplot函數 189
8.2.4Scatterplot矩陣 192
8.2.5密度散點圖 197
8.3直方圖和條形圖 200
8.3.1條形圖 200
8.3.2直方圖 203
8.3.3ggplot2203
8.3.4詞雲 204
8.4問題 206
8.5總結 206

第9章 數據可視化——三維 207
9.1功能包 207
9.2生成三維圖形 208
9.2.1LatticeCloud——三維散點圖 212
9.2.2scatterplot3d 215
9.2.3scatter3d 216
9.2.4cloud3d 218
9.2.5RgoogleMaps 220
9.2.6vrmlgenbar3D 221
9.2.7大數據 223
9.2.8研究方向 228
9.3問題 234
9.4總結 234

第10章 機器學習實戰 235
10.1功能包 235
10.2數據集 236
10.2.1數據划分 240
10.2.2模型 241
10.2.3train方法 254
10.3問題 264
10.4總結 264

第11章 用機器學習預測事件 265
11.1自動預測功能包 265
11.1.1時間序列 266
11.1.2SMA函數 272
11.1.3分解函數 273
11.1.4指數平滑法 274
11.1.5預測 277
11.1.6霍爾特指數平滑法 281
11.2問題 293
11.3總結 293

第12章 監督學習和無監督學習 295
12.1功能包 296
12.1.1監督學習 296
12.1.2無監督學習 316
12.2問題 327
12.3總結 327
網路書店 類別 折扣 價格
  1. 新書
    87
    $360