Spark是業界公認的近幾年發展最快、最受關注度的一體化多元化的大數據計算技術,可以同時滿足不同業務場景和不同數據規模的大數據計算的需要。
本書首先通過代碼實戰的方式對學習Spark前必須掌握的Scala內容進行講解並結合Spark源碼的閱讀來幫助讀者快速學習Scala函數式編程與面向對象完美結合的編程藝術,接着對Hadoop和Spark集群安裝部署以及Spark在不同集成開發環境的開發實戰作出了詳細的講解,然后基於大量的實戰案例來講解Spark核心RDD編程並深度解密RDD的密碼,並且通過實戰的方式詳解了TopN在Spark
RDD中的實現,為了讓讀者徹底了解Spark,本書用了大量的篇幅詳細解密了Spark的高可用性、內核架構、運行機制等內容。
Spark零基礎實戰這本書定位於零基礎的學員,也可以作為有一定大數據Hadoop經驗的從業者以及對大數據非常感興趣的學生的第一本Spark入門書籍。
王家林,DT大數據夢工廠創始人和首席專家,Spark亞太研究院院長和首席專家,移動互聯網和大數據技術領域集大成者,多家著名公司的技術顧問,業界知名資深技術培訓專家。
大數據技術公益推廣人,大數據在線教育世界知名技術專家,Spark 大數據中國區最具知名度的培訓專家之一。徹底研究了Spark 從0.5.0到1.6.1中共22個版本的Spark 源碼,目前致力於開發全球最優化的Spark 中國版本。尤其擅長Spark 在生產環境下各種類型和場景故障的排除和解決,痴迷於Spark 生產環境下任意類型(例如Shuffle 和各種內存問題)的Spark
程序的深度性能優化。
從2014年6月24日起,已開啟免費的Spark 公開課《決勝大數據時代Spark100 期公益大講堂》。在2015年6月27日成立DT 大數據夢工廠,開啟IMF(Impossible Mission Force)行動,率先在全球開展以Spark 為核心的,免費為社會培養100萬企業級實戰高級大數據人才行動計划,截至目前已有數千人參與到這個行動之中。
曾負責某知名公司的類Hadoop 框架開發工作,是Hadoop 一站式解決方案的提供者,同時也是雲計算和分布式大數據處理的較早實踐者之一,在實踐中用Hadoop 解決不同領域的大數據的高效處理和存儲。致力於Android、HTML5、Hadoop 等的軟、硬、雲整合的一站式解決方案專家。
2007年國內較早從事於Android 系統移植、軟硬整合、框架修改、應用程序軟件開發以及Android 系統測試和應用軟件測試的技術專家。
2015年12月,在電視媒體錄制了《大數據的奧秘》,《大數據時代的九大神器》等視頻光盤。
2016年1月至今,直播培訓課程Hadoop,MySQL,Linux,Scala,Java,Spark零基礎到高級企業級實戰,Spark源碼解析及性能優化,JVM性能調優,機器學習從零基礎到企業級實戰持續中。
-
航天相機CCD/CMOS成像系統設計
$407 -
基於聚合物的多功能納米複合材料(英文版)
$894 -
文本分析與文本挖掘
$574 -
當產品經理遇到人工智慧
$374 -
2018中國高速公路運輸量統計調查分析報告
$418 -
汽車自動變速器原理與檢修(第3版)
$294 -
大規模MIMO系統原理與設計分析
$459 -
夜景與弱光攝影:拍出好照片的50個關鍵技法
$308 -
無人駕駛:人工智慧如何顛覆汽車
$412 -
艦船綜合導航系統
$292 -
汽車美容與裝飾快速入門(全彩色圖解版)
$270 -
大數據技術基礎
$251 -
汽車維修快速入門與提高(彩色版)
$474 -
TRIZ創新方法及應用案例分析
$474 -
SOLIDWORKS&管道與佈線教程(2019版)
$299 -
現代感測技術與應用
$239 -
電腦控制技術(第2版)
$204 -
下一站 火星:馬斯克,貝佐斯與太空爭奪戰
$308 -
輕鬆玩轉無人機航拍(拍攝+後期全攻略)
$412 -
自動控制原理、現代控制理論學習百問百答
$360