軟件開發專家數十年行業經驗的結晶,深入淺出地論述如何使用Mahout進行數據分類、聚類和預測,涉及Mahout開發環境、序列文件使用方式、整合Mahout和外部資源、實現朴素貝葉斯分類器、股市預測、頂棚聚類、頻譜預測、K-均值聚類等。
《Mahout實踐指南》是面向編程的,不涉及深奧的理論,簡單、易學,可以幫助讀者快速掌握Mahout的基本用法,實用性強。
全書共分10章。第1章介紹如何在單台機器上創建完整的Mahout開發環境。第2章重點介紹序列文件的使用方式。第3章詳細介紹如何使用命令行工具和代碼從RDBMS中讀寫數據。第4章詳細討論朴素貝葉斯分類器和互補朴素貝葉斯分類器的使用方法。第5章介紹如何使用logistic回歸和隨機森林預測股市。第6章描述Mahout框架中最常用的算法,包括大數據的聚類分析和分類。
第7章描述頻譜聚類的使用方式。第8章描述使用K-均值(包括序列方式和MapReduce方式)對主題中的文本文檔進行分類。第9章介紹頻繁模式挖掘算法的使用方式。第10章描述使用遺傳算法解決旅行商問題和提取規則。
目錄
譯者序
前言
關於評閱者
致謝
第1章 Mahout入門
秘笈1 安裝Java和Hadoop
秘笈2 設置Maven和NetBeans開發環境
秘笈3 編寫一個基本的推薦系統
第2章 使用序列文件——什麼時候和為什麼
秘笈4 從命令行創建序列文件
秘笈5 編寫代碼創建序列文件
秘笈6 編碼實現讀取序列文件
第3章 將Mahout和外部資源整合
秘笈7 導入外部資源HDFS
秘笈8 將數據從HDFS導入到RDBMS
秘笈9 創建一個Sqoop作業來處理RDBMS
秘笈10 使用Sqoop API導入數據
第4章 實現朴素貝葉斯分類器
秘笈11 使用Mahout文本分類器演示基本的使用樣例
秘笈12 編碼實現朴素貝葉斯分類器
秘笈13 通過命令行使用互補朴素貝葉斯
秘笈14 編碼使用互補朴素貝葉斯分類器
第5章 股市預測
秘笈15 為logistic回歸准備數據
秘笈16 使用logistic預測GOOG股票動態
秘笈17 通過Java編碼使用自適應的logistic回歸
秘笈18 在大規模的數據集上使用logistic回歸
秘笈19 使用隨機森林預測市場動態
第6章 頂棚聚類
秘笈20 基於命令行的頂棚聚類
秘笈21 基於帶參數命令行的頂棚聚類
秘笈22 通過Java代碼使用頂棚聚類
秘笈23 編寫你自己的距離估計
第7章 頻譜聚類
秘笈24 通過命令行使用EigenCuts
秘笈25 在Java代碼中使用EigenCuts
秘笈26 從原始數據創建相似度矩陣
秘笈27 使用頻譜聚類進行圖像分割
第8章 K-均值聚類
秘笈28 在Java代碼中使用K-均值聚類
秘笈29 使用K-均值聚類對交通事故進行聚類
秘笈30 使用MapReduce進行K-均值聚類
秘笈31 命令行方式使用K-均值聚類
第9章 軟計算
秘笈32 使用Mahout進行頻繁模式挖掘
秘笈33 為頻繁模式挖掘創建評價准則
秘笈34 在Java代碼中使用頻繁模式挖掘
秘笈35 使用LDA創建主題
第10章 實現遺傳算法
秘笈36 設置Mahout以便使用遺傳算法
秘笈37 在圖上使用遺傳算法
秘笈38 在Java代碼中使用遺傳算法
前言
關於評閱者
致謝
第1章 Mahout入門
秘笈1 安裝Java和Hadoop
秘笈2 設置Maven和NetBeans開發環境
秘笈3 編寫一個基本的推薦系統
第2章 使用序列文件——什麼時候和為什麼
秘笈4 從命令行創建序列文件
秘笈5 編寫代碼創建序列文件
秘笈6 編碼實現讀取序列文件
第3章 將Mahout和外部資源整合
秘笈7 導入外部資源HDFS
秘笈8 將數據從HDFS導入到RDBMS
秘笈9 創建一個Sqoop作業來處理RDBMS
秘笈10 使用Sqoop API導入數據
第4章 實現朴素貝葉斯分類器
秘笈11 使用Mahout文本分類器演示基本的使用樣例
秘笈12 編碼實現朴素貝葉斯分類器
秘笈13 通過命令行使用互補朴素貝葉斯
秘笈14 編碼使用互補朴素貝葉斯分類器
第5章 股市預測
秘笈15 為logistic回歸准備數據
秘笈16 使用logistic預測GOOG股票動態
秘笈17 通過Java編碼使用自適應的logistic回歸
秘笈18 在大規模的數據集上使用logistic回歸
秘笈19 使用隨機森林預測市場動態
第6章 頂棚聚類
秘笈20 基於命令行的頂棚聚類
秘笈21 基於帶參數命令行的頂棚聚類
秘笈22 通過Java代碼使用頂棚聚類
秘笈23 編寫你自己的距離估計
第7章 頻譜聚類
秘笈24 通過命令行使用EigenCuts
秘笈25 在Java代碼中使用EigenCuts
秘笈26 從原始數據創建相似度矩陣
秘笈27 使用頻譜聚類進行圖像分割
第8章 K-均值聚類
秘笈28 在Java代碼中使用K-均值聚類
秘笈29 使用K-均值聚類對交通事故進行聚類
秘笈30 使用MapReduce進行K-均值聚類
秘笈31 命令行方式使用K-均值聚類
第9章 軟計算
秘笈32 使用Mahout進行頻繁模式挖掘
秘笈33 為頻繁模式挖掘創建評價准則
秘笈34 在Java代碼中使用頻繁模式挖掘
秘笈35 使用LDA創建主題
第10章 實現遺傳算法
秘笈36 設置Mahout以便使用遺傳算法
秘笈37 在圖上使用遺傳算法
秘笈38 在Java代碼中使用遺傳算法
網路書店
類別
折扣
價格
-
新書87折$256