是資深數據專家數十年教學與實踐經驗的結晶,以簡單直接的方式詳細講解R語言的所有基礎知識,以及常見統計方法和模型在R中的操作規范,通過大量實例,幫助讀者快速理解並掌握R的核心功能,有效解決實際工作問題。
《R語言:實用數據分析和可視化技術》共24章,第1~3章介紹R語言的獲取與安裝、R環境的設置以及R包的基礎知識;第4~5章介紹R語言基礎知識和高級數據結構,涉及數學運算、向量、調用函數以及數據框、列表、矩陣和數組等;第6章介紹如何導入數據;第7章詳細介紹統計圖形的繪制,包括基本繪圖和ggplot2;第8~10章介紹R函數編寫,包括對結構、參數和返回規則的討論,講解if和ifelse以及復雜語句控制程序的流程、for和while循環迭代等;第11~13章介紹數據的分組操作、數據整理和字符串操作;第14~15章介紹概率分布與描述性統計;第16~20章介紹線性模型、廣義線性模型、模型診斷、正則化與壓縮以及非線性模型等;第21章介紹時間序列和自相關;第22章介紹各種聚類方式,包括K—means和分層聚類;第23章討論可重復性、報告和利用knitr滑動展示;第24介紹如何創建R包。
賈里德.P.蘭德(Jared P.Lander),資深數據專家,Lander
Arlalytics公司創始人兼CEO,紐約開源統計編程聚會組織者,哥倫比亞大學統計學客座教授。在數據管理、多層次模型、機器學習、廣義線性模型、可視化、數據管理和統計計算等多個領域擁有豐富經驗。他致力於為各種類型的科技創業公司提供培訓、融資、金融、醫療和人道主義救援等工作。他擁有哥倫比亞大學統計學碩士學位及瑞米倫貝格大學數學學士學位。
目錄
譯者序
序言
前言
致謝
第1章 獲取R 1
1.1 下載R 1
1.2 R版本 2
1.3 32位與64位 2
1.4 安裝 2
1.5 R的社區版革命 8
1.6 小結 9
第2章 R環境 10
2.1 命令行界面 11
2.2 RStudio 12
2.3 Revolution Analytics RPE 20
2.4 小結 20
第3章 R包 21
3.1 包的安裝 21
3.2 包的加載 23
3.3 創建一個包 24
3.4 小結 24
第4章 R語言基礎 25
4.1 基本數學運算 25
4.2 變量 26
4.3 數據類型 28
4.4 向量 33
4.5 調用函數 37
4.6 函數文件 38
4.7 缺失數據 38
4.8 小結 39
第5章 高級數據結構 40
5.1 數據框 40
5.2 列表 47
5.3 矩陣 52
5.4 數組 54
5.5 小結 55
第6章 導入數據 56
6.1 導入CSV 56
6.2 導入Excel數據 57
6.3 讀入數據庫數據 58
6.4 導入其他統計工具數據 59
6.5 R二進制文件 60
6.6 包含在R中的數據 62
6.7 從互聯網上抓取數據 62
6.8 小結 63
第7章 統計圖形 64
7.1 基本圖形 64
7.2 ggplot266
7.3 小結 78
第8章 編寫R函數 79
8.1 hello world! 79
8.2 函數參數 80
8.3 返回值 82
8.4 do.call 83
8.5 小結 84
第9章 控制語句 85
9.1 if和else語句 85
9.2 switch語句 88
9.3 ifelse語句 89
9.4 復合檢查 90
9.5 小結 91
第10章 循環,Un—R方式的迭代 92
10.1 for循環 92
10.2 while循環 94
10.3 控制循環 94
10.4 小結 95
第11章 分組操作 96
11.1 apply函數族 96
11.2 aggregate 99
11.3 plyr 102
11.4 data.table 106
11.5 小結 114
第12章 數據整理 115
12.1 cbind和rbind 115
12.2 連接 116
12.3 reshape2122
12.4 小結 125
第13章 字符串操作 126
13.1 paste 126
13.2 把格式數據寫成串(sprintf) 127
13.3 提取文本 128
13.4 正則表達式 132
13.5 小結 138
第14章 概率分布 139
14.1 正態分布 139
14.2 二項分布 144
14.3 泊松分布 148
14.4 其他分布 150
14.5 小結 152
第15章 描述性統計 153
15.1 概括性統計量 153
15.2 相關系數和協方差 156
15.3 t—檢驗 163
15.4 方差分析 169
15.5 小結 171
第16章 線性模型 172
16.1 簡單線性回歸 172
16.2 多元回歸 177
16.3 小結 190
第17章 廣義線性模型 191
17.1 邏輯斯蒂回歸 191
17.2 泊松回歸 194
17.3 其他的廣義線性模型 198
17.4 生存分析 198
17.5 小結 202
第18章 模型診斷 203
18.1 殘差 203
18.2 模型比較 208
18.3 交叉驗證 211
18.4 Bootstrap 215
18.5 逐步變量選擇 218
18.6 小結 221
第19章 正則化和壓縮 222
19.1 彈性網絡 222
19.2 貝葉斯壓縮 235
19.3 小結 238
第20章 非線性模型 239
20.1 非線性最小二乘 239
20.2 樣條 241
20.3 廣義相加模型 245
20.4 決策樹 249
20.5 隨機森林 251
20.6 小結 251
第21章 時間序列和自相關 252
21.1 自回歸移動平均模型 252
21.2 向量自回歸 258
21.3 廣義自回歸異方差模型(GARCH) 263
21.4 小結 270
第22章 聚類 271
22.1 K—means 271
22.2 PAM 277
22.3 分層聚類 282
22.4 小結 284
第23章 可重復性、報告和利用knitr滑動展示 285
23.1 安裝LATEX程序 285
23.2 LATEX初級 286
23.3 通過LATEX使用knitr 288
23.4 Markdown技巧 291
23.5 使用knitr和Markdown 292
23.6 pandoc 293
23.7 小結 295
第24章 創建R包 296
24.1 目錄結構 296
24.2 包文件 297
24.3 包文檔 302
24.4 包的檢查、創建和安裝 304
24.5 提交至CRAN 305
24.6 C++代碼 305
24.7 小結 310
附錄A 相關資源 311
序言
前言
致謝
第1章 獲取R 1
1.1 下載R 1
1.2 R版本 2
1.3 32位與64位 2
1.4 安裝 2
1.5 R的社區版革命 8
1.6 小結 9
第2章 R環境 10
2.1 命令行界面 11
2.2 RStudio 12
2.3 Revolution Analytics RPE 20
2.4 小結 20
第3章 R包 21
3.1 包的安裝 21
3.2 包的加載 23
3.3 創建一個包 24
3.4 小結 24
第4章 R語言基礎 25
4.1 基本數學運算 25
4.2 變量 26
4.3 數據類型 28
4.4 向量 33
4.5 調用函數 37
4.6 函數文件 38
4.7 缺失數據 38
4.8 小結 39
第5章 高級數據結構 40
5.1 數據框 40
5.2 列表 47
5.3 矩陣 52
5.4 數組 54
5.5 小結 55
第6章 導入數據 56
6.1 導入CSV 56
6.2 導入Excel數據 57
6.3 讀入數據庫數據 58
6.4 導入其他統計工具數據 59
6.5 R二進制文件 60
6.6 包含在R中的數據 62
6.7 從互聯網上抓取數據 62
6.8 小結 63
第7章 統計圖形 64
7.1 基本圖形 64
7.2 ggplot266
7.3 小結 78
第8章 編寫R函數 79
8.1 hello world! 79
8.2 函數參數 80
8.3 返回值 82
8.4 do.call 83
8.5 小結 84
第9章 控制語句 85
9.1 if和else語句 85
9.2 switch語句 88
9.3 ifelse語句 89
9.4 復合檢查 90
9.5 小結 91
第10章 循環,Un—R方式的迭代 92
10.1 for循環 92
10.2 while循環 94
10.3 控制循環 94
10.4 小結 95
第11章 分組操作 96
11.1 apply函數族 96
11.2 aggregate 99
11.3 plyr 102
11.4 data.table 106
11.5 小結 114
第12章 數據整理 115
12.1 cbind和rbind 115
12.2 連接 116
12.3 reshape2122
12.4 小結 125
第13章 字符串操作 126
13.1 paste 126
13.2 把格式數據寫成串(sprintf) 127
13.3 提取文本 128
13.4 正則表達式 132
13.5 小結 138
第14章 概率分布 139
14.1 正態分布 139
14.2 二項分布 144
14.3 泊松分布 148
14.4 其他分布 150
14.5 小結 152
第15章 描述性統計 153
15.1 概括性統計量 153
15.2 相關系數和協方差 156
15.3 t—檢驗 163
15.4 方差分析 169
15.5 小結 171
第16章 線性模型 172
16.1 簡單線性回歸 172
16.2 多元回歸 177
16.3 小結 190
第17章 廣義線性模型 191
17.1 邏輯斯蒂回歸 191
17.2 泊松回歸 194
17.3 其他的廣義線性模型 198
17.4 生存分析 198
17.5 小結 202
第18章 模型診斷 203
18.1 殘差 203
18.2 模型比較 208
18.3 交叉驗證 211
18.4 Bootstrap 215
18.5 逐步變量選擇 218
18.6 小結 221
第19章 正則化和壓縮 222
19.1 彈性網絡 222
19.2 貝葉斯壓縮 235
19.3 小結 238
第20章 非線性模型 239
20.1 非線性最小二乘 239
20.2 樣條 241
20.3 廣義相加模型 245
20.4 決策樹 249
20.5 隨機森林 251
20.6 小結 251
第21章 時間序列和自相關 252
21.1 自回歸移動平均模型 252
21.2 向量自回歸 258
21.3 廣義自回歸異方差模型(GARCH) 263
21.4 小結 270
第22章 聚類 271
22.1 K—means 271
22.2 PAM 277
22.3 分層聚類 282
22.4 小結 284
第23章 可重復性、報告和利用knitr滑動展示 285
23.1 安裝LATEX程序 285
23.2 LATEX初級 286
23.3 通過LATEX使用knitr 288
23.4 Markdown技巧 291
23.5 使用knitr和Markdown 292
23.6 pandoc 293
23.7 小結 295
第24章 創建R包 296
24.1 目錄結構 296
24.2 包文件 297
24.3 包文檔 302
24.4 包的檢查、創建和安裝 304
24.5 提交至CRAN 305
24.6 C++代碼 305
24.7 小結 310
附錄A 相關資源 311
網路書店
類別
折扣
價格
-
新書87折$412