HBase:搞定BigData NoSQL實戰(HBase in action)
- 作者:Nick Dimiduk,Amandeep Khurana
- 譯者:謝磊
- 出版社:博碩
- 出版日期:2014-01-23
- 語言:繁體中文
- ISBN10:9862018526
- ISBN13:9789862018521
- 裝訂:平裝 / 400頁 / 17 x 23 cm / 普通級 / 單色印刷 / 初版
什麼是HBase?
HBase是一種架構在Hadoop的資料庫。
HBase是什麼?
HBase是一種分散式資料庫。
HBase不是什麼?
HBase不是一種關聯式資料庫,不提供ACID的保證。
HBase和NoSQL有什麼關係?
HBase是NoSQL的一種,使用的是Key-Vaule技術,而且是極為著名的代表性產品。
HBase在處理Big Data上,有什麼實證呢?
Facebook使用的就是HBase,每天數百億筆的使用者之間的互動完全難不倒HBase。
如果你只是想要了解什麼是HBase、HBase的用處、HBase的案例,那麼小編在上面講的已經足夠了,你不需要買這一本書,甚至不必去翻這本書。但如果你想要知道,為什麼Big Data不使用提供ACID的關聯式資料庫儲存,而適合用分散式的HBase資料庫,那麼本書會提供你詳細的答案。
本書最適合的讀者是工程師,而非不懂技術的商業人士,如果你是資料庫工程師或程式設計師,那麼本書非常適合你。本書會帶你一步一步地實現下列實務上的需求:
•[1]如果你想要實際安裝HBase,想要建立HBase的表格,想要塞些資料進去表格中,
•[2]如果你想要寫程式來存取HBase的資料,本書會提供示範的程式碼並詳細講解(本書大多數的程式碼為Java,因為HBase是用Java寫成的)。
•[3]如果你想要寫個script來自動化操作HBase,本書也會教你怎麼做。
•[4]如果你是DBA,想要好好地設計HBase的schema,本書會利用一個實際的產品案例和一個需要特殊領域知識的GIS案例,教你學會從哪些關鍵之處來設計最符合系統需求的schema。
•[5]如果你是系統管理員,必須保證系統的流暢性與可用性,本書也會教你調校HBase的各項參數,並且排除故障問題。
總之,本書是一本在操作HBase系統時、建置以HBase為資料庫的應用系統時,可以放在手邊的實戰參考書,能夠親手跟著做當然是最好的學習途徑。
但除了實作之外,本書也會對於為何要這樣做,提出詳細的說明。甚至於本書還會說明如果這樣做會有什麼結果,如果那樣做會有什麼結果。
之所以本書能夠在實務上提供那麼多的內容,完全是因為兩位作者本身就是HBase社群的佼佼者,而本書也請到了社群的主持人來幫忙做推薦序。
在HBase的領域中,同時期在撰寫的還有一本定價較高的書《HBase: The Definitive Guide》,該書偏重在介紹內部機制。本書為了與之做出區隔,更關注於實戰的內容與範例。在這本書中,Amandeep和Nick使用了適當的、飽含實踐經驗的文字,淺顯易懂地告訴你該怎麼使用HBase。確實是Big Data時代,工程師手邊不可缺少的一本書籍。
作者簡介
Nick Dimiduk
是一位資料架構師,他在2008年開始使用HBase,當時解決了夜間ETL 資料作業需要20多個小時才能完成的問題。
之後,他把Hadoop和HBase應用到各種使用場景,例如社交媒體、社交遊戲、點擊流的分析、氣候預測和GIS。
Nick還幫助建立了西雅圖的Scalability Meetup,以支持創業。現在他把主要精力投入在分散式、可擴展的線上存取科學資料系統之上。
Amandeep Khurana
是一位解決方案架構師,任職於Cloudera公司,在這間公司,他幫助客戶使用Hadoop和HBase,提供從規劃到建置與部署的全程服務。
加入Cloudera之前,Amandeep是Amazon的Elastic MapReduce團隊成員之一,提供Amazon Web Services。
Amandeep的專業背景在於大規模、分散式系統與資訊管理。
Nick和Amandeep兩位都是有真材實料的老師,他們是長期的HBase實踐者,也是HBase開發者社群的佼佼者。
在HBase中,應該怎樣設計schema來儲存複雜的資料,以保證讀寫效能的均衡?
應該怎樣規劃資料的存取模式(access pattern)來保證能將HBase群集的威力發揮到最大?
如果你訂閱了公開的mailing lists,類似問題還有許多。Amandeep和Nick會在這些地方幫助大家。
他們在各種使用者場景下使用HBase的豐富實戰經驗,可以幫你瞭解『schema和存取模式』的複雜性,幫你成功建置下一個專案。
Part I HBase的基礎
Chapter 1 HBase簡介
Chapter 2 HBase初體驗
Chapter 3 分散式HBase、HDFS 和MapReduce
Part II 高級概念
Chapter 4 HBase的表格設計
Chapter 5 使用輔助處理器擴展HBase
Chapter 6 其他的HBase客戶端選擇
Part III 應用系統實例
Chapter 7 用實例學HBase:OpenTSDB
Chapter 8 在HBase上查詢GIS
Part IV 讓HBase運轉起來
Chapter 9 部署HBase
Chapter 10 運行與維護
Appendix A 探索HBase系統
Appendix B 更多關於HDFS的工作原理