學習高級分析技術,並利用現有工具包使分析應用更加強大、精確和高效!《Hadoop高級數據分析 使用Hadoop生態系統設計和構建大數據系統》將架構、設計及實現信息恰當地融為一體,將指導你創建超越基礎方法(SF分類、聚類、推薦)的分析系統。
在本書中,最好實踐強調「確保連貫、高效的開發」。將使用包含工具箱、庫、可視化組件和報表代碼在內的標准第三方組件,借助集成「組合件」開發一個可運行的、可擴展的、端到端的完整示例系統。
《Hadoop高級數據分析使用Hadoop生態系統設計和構建大數據系統》強調以下四點:●具有分析組件及合理可視化結果的完整、靈活、可配置、高性能數據管道系統的重要性。深入探討的主題包括Spark、H2O、Vopal Wabbit(NLP)、Stanford NLP、Apache
Mahout,以及其他適用的工具包、庫和插件。●最好實踐和結構化設計原則。包括重要主題及示例部分。●用混合搭配或混合系統實現應用目標的重要性。你在學習深度示例時可體會到混合方法的重要性。●使用現有第三方庫是有效開發的關鍵。在開發示例系統時,深度示例將展示一些第三方工具包的功能。
Kerry Koitzsch,在計算機科學、圖像處理和軟件工程等領域擁有超過二十年的工作經驗,致力於研究Apache Hadoop和Apache Spark技術。Kerry擅長軟件咨詢,精通一些定制的大數據應用,包括分布式搜索、圖像分析、立體視覺和智能圖像檢索系統。Kerry目前就職於Kildane軟件技術股份有限公司,該公司是加州桑尼維爾市的一個機器人系統和圖像分析軟件提供商。