Spark是業界公認的近幾年發展最快、最受關注度的一體化多元化的大數據計算技術,可以同時滿足不同業務場景和不同數據規模的大數據計算的需要。
本書首先通過代碼實戰的方式對學習Spark前必須掌握的Scala內容進行講解並結合Spark源碼的閱讀來幫助讀者快速學習Scala函數式編程與面向對象完美結合的編程藝術,接着對Hadoop和Spark集群安裝部署以及Spark在不同集成開發環境的開發實戰作出了詳細的講解,然后基於大量的實戰案例來講解Spark核心RDD編程並深度解密RDD的密碼,並且通過實戰的方式詳解了TopN在Spark
RDD中的實現,為了讓讀者徹底了解Spark,本書用了大量的篇幅詳細解密了Spark的高可用性、內核架構、運行機制等內容。
Spark零基礎實戰這本書定位於零基礎的學員,也可以作為有一定大數據Hadoop經驗的從業者以及對大數據非常感興趣的學生的第一本Spark入門書籍。
王家林,DT大數據夢工廠創始人和首席專家,Spark亞太研究院院長和首席專家,移動互聯網和大數據技術領域集大成者,多家著名公司的技術顧問,業界知名資深技術培訓專家。
大數據技術公益推廣人,大數據在線教育世界知名技術專家,Spark 大數據中國區最具知名度的培訓專家之一。徹底研究了Spark 從0.5.0到1.6.1中共22個版本的Spark 源碼,目前致力於開發全球最優化的Spark 中國版本。尤其擅長Spark 在生產環境下各種類型和場景故障的排除和解決,痴迷於Spark 生產環境下任意類型(例如Shuffle 和各種內存問題)的Spark
程序的深度性能優化。
從2014年6月24日起,已開啟免費的Spark 公開課《決勝大數據時代Spark100 期公益大講堂》。在2015年6月27日成立DT 大數據夢工廠,開啟IMF(Impossible Mission Force)行動,率先在全球開展以Spark 為核心的,免費為社會培養100萬企業級實戰高級大數據人才行動計划,截至目前已有數千人參與到這個行動之中。
曾負責某知名公司的類Hadoop 框架開發工作,是Hadoop 一站式解決方案的提供者,同時也是雲計算和分布式大數據處理的較早實踐者之一,在實踐中用Hadoop 解決不同領域的大數據的高效處理和存儲。致力於Android、HTML5、Hadoop 等的軟、硬、雲整合的一站式解決方案專家。
2007年國內較早從事於Android 系統移植、軟硬整合、框架修改、應用程序軟件開發以及Android 系統測試和應用軟件測試的技術專家。
2015年12月,在電視媒體錄制了《大數據的奧秘》,《大數據時代的九大神器》等視頻光盤。
2016年1月至今,直播培訓課程Hadoop,MySQL,Linux,Scala,Java,Spark零基礎到高級企業級實戰,Spark源碼解析及性能優化,JVM性能調優,機器學習從零基礎到企業級實戰持續中。