全球最大的商業分散式叢集實作:淘寶技術長親手教你Paxos及ZooKeeper

全球最大的商業分散式叢集實作:淘寶技術長親手教你Paxos及ZooKeeper
定價:580
NT $ 340 ~ 522
  • 作者:倪超胡嘉璽
  • 出版社:佳魁資訊
  • 出版日期:2015-09-30
  • 語言:繁體中文
  • ISBN10:9863792101
  • ISBN13:9789863792109
  • 裝訂:平裝 / 496頁 / 17 x 23 cm / 普通級 / 單色印刷 / 初版
 

內容簡介

  ■系統講解ZooKeeper這一應用廣泛、成熟的分散式協調架構的技術書
  ■原理深入,清楚說明ACID、CAP、BASE,2PC/3PC協定,Paxos、ZAB協定等熱門話題
  ■徹底剖析分散式一致性問題,並提出相應解決方案和實戰參考

專家推薦

  ZooKeeper 的穩定性和對一致性的保障一直為業界所稱道,在大量的分散式系統和開放原始碼元件中獲得應用。本書是作者在長期使用 ZooKeeper 後深入研究其演算法原理和原始程式碼的歸納,將對讀者在分散式一致性的理論學習與實作上有啟發意義。-新浪愛彩首席架構師 周鋒

  分散式一致性是風控系統架構與設計的重要目標,新一代的反洗錢交易即時分析系統採用 Storm 進行大數據的即時計算,ZooKeeper 作為 Storm 的重要組成部分,為資料一致性提供關鍵保障。本書深入淺出地描述分散式一致性這一問題的由來,並對 ZooKeeper 在 Storm、Hadoop 和 HBase 等大型分散式系統中的應用場景進行詳盡介紹,針對ZooKeeper在分散式系統中的業務實作與運行維護保障提供重要參考。-中國銀聯反洗錢系統核心負責人 羅科勤

  一致性是電腦學科中最「硬」和最重要的問題之一,可見寫這樣主題挑戰之大。阿里巴巴業務龐大,倪超之前維護的為整個集團提供一致性方案的ZooKeeper 叢集,場景之複雜、規模之大在中國甚至世界上都可能是罕見的。本人因工作需要對Paxos和ZooKeeper進行粗淺的學習,所以有機會和倪超有過交流,樂自不言,獲益良多。本書兼顧理論與實作,希望讓讀者讀完之後有所提升:使用上知其所以然,架構上能選擇出合適又低成本的方案。-阿里巴巴 Dubbo 架構、PaaS 平台資深架構師&核心開發 李鼎

  搜狐從 2009 年微博時代初期就利用 ZooKeeper 的發佈與訂閱模型實現對 CDN URL和一些基本管理設定的動態載入。至今ZooKeeper已經被運用在搜狐各大業務線上,完成許多分散式高可用服務的建置,範圍有關分散式快取、服務化架構和前端業務系統等等,幫助團隊解決了分散式方面的主要技術障礙,大幅加強業務穩定性和運行維護效率。本書全面詳盡地介紹分散式環境中各個典型場景下的 ZooKeeper 應用實例,為讀者建置自己的分散式高可用服務提供參考。-搜狐移動事業部高級運行維護主管 劉鵬
 

作者介紹

作者簡介

倪超


  新浪微博:@ni掌櫃

  阿里巴巴集團高級研發工程師,中國國家認證系統分析師,畢業於杭州電子科技大學計算機系。2010年加入阿里巴巴中繼軟體團隊,一直從事ZooKeeper的開發與運行維護工作,從中學習與總結不少分散式一致性相關的理論與實戰經驗,尤其對ZooKeeper及其相關技術有極深入的研究,目前擔任中繼軟體團隊專家組產品經理,負責分散式產品的產品化和雲端運算化改造工作。
 

目錄

前言

Chapter 01   分散式架構
1.1 從集中式到分散式
1.2 從ACID 到CAP/BASE

Chapter 02   一致性協定
2.1 2PC 與3PC
2.2 Paxos 演算法

Chapter 03   Paxos 的工程實作
3.1 Chubby
3.2 Hypertable

Chapter 04   ZooKeeper 與Paxos
4.1 初識ZooKeeper
4.2 ZooKeeper 的ZAB 協定

Chapter 05   使用ZooKeeper
5.1 部署與執行
5.2 用戶端指令碼
5.3 Java 用戶端API 使用
5.4 開放原始碼用戶端

Chapter 06   ZooKeeper 的典型應用場景
6.1 典型應用場景及實現
6.2 ZooKeeper 在大型分散式系統中的應用
6.3 ZooKeeper 在阿里巴巴的實作與應用

Chapter 07  ZooKeeper 技術內幕
7.1 系統模型.
7.2 序列化與協定
7.3 用戶端
7.4 階段
7.5 伺服器啟動
7.6 Leader 選舉
7.7 各伺服器角色介紹
7.8 請求處理
7.9 資料與儲存

Chapter 08   Chapter08 ZooKeeper 運行維護
8.1 設定詳解
8.2 四字指令
8.3 JMX
8.4 監控
8.5 建置一個高可用的叢集
8.6 日常運行維護

附錄1 Windows 平台上部署ZooKeeper
附錄2 從原始程式碼開始建置
附錄3 各發行版本重大更新記錄
附錄4 ZooKeeper 原始程式碼閱讀指引
 



問題的提出


  在電腦科學領域,分散式一致性問題是一個相當重要,且被廣泛探索與論證的問題,通常存在於諸如分散式檔案系統、快取系統和資料庫等大型分散式儲存系統中。

  什麼是分散式一致性?分散式一致性分為哪些類型?分散式系統達到一致性後將是一個什麼樣的狀態?如果失去了一致性約束,分散式系統是否還可以依賴?如果一味地追求一致性,對系統的整體架構和效能又有多大影響?這一系列的問題,似乎都沒有一個嚴格意義上準確的定義和答案。

  ■終端使用者

  IT 技術的發展,讓我們受益無窮,從日常生活的超市結帳到火箭發射,現代社會中幾乎所有企業,都離不開電腦技術的支援。

  儘管電腦工程師們創造出了很多高科技的電腦產品來解決我們日常碰到的問題,但使用者只會偏好選擇一些好用的產品,那些難以使用的電腦產品最後都會被淘汰--這種好用性,其實就是使用者體驗的一部分。

  電腦產品的使用者體驗,可以分為便捷性、安全性和穩定性等方面。在本書中,我們主要討論的是使用者在使用電腦產品過程中遇到的那些和一致性有關的問題。在此之前,我們首先來看一下電腦產品的終端使用者是誰,他們的需求又是什麼。

  ■火車站售票

  假如說我們的終端使用者是一位經常坐火車的旅行家,通常他是去車站的售票處購買車票,然後拿著車票去剪票口,再坐上火車,開始一段美好的旅行--一切似乎都是那麼和諧。想像一下,如果他選擇的目的地是台南,而某一趟開往台南的火車只剩下最後一張車票了,可能在同一時刻,不同售票視窗的另一位乘客也購買了同一張車票。假如說售票系統沒有進行一致性,兩人都購票成功了。而在剪票口剪票的時候,其中一位乘客會被告知他的車票無效--當然的台灣的鐵路售票系統已經很少出現這樣的問題了,但在這個實例中,我們可以看出,終端使用者對於我們的系統的需求非常簡單:

  “請售票給我,如果沒有票了,請在售票的時候就告訴我沒有票。"

  這就對購票系統提出了嚴格的一致性要求--系統的資料(在本例中指的就是那趟開往台南的火車的剩票數),無論在哪個售票視窗,每時每刻都必須是準確無誤的!

  ■網上購物

  假如說我們的終端使用者是一名網上購物狂,當他看到一件庫存量為5 的心儀商品,會迅速地確認購買,寫下收貨地址,然後下單。然而,在下單的那個瞬間,系統可能會告知該使用者:“庫存量不足!”此時,絕大部分的消費者常常都會抱怨自己動作太慢,使得心愛的商品被其他人搶走了!

  但其實有過網購系統開發經驗的工程師一定明白,在商品詳情頁面上顯示的那個庫存量,通常不是該商品的真實庫存量,只有在真正下單購買的時候,系統才會檢查該商品的真實庫存量。但是,誰在意呢?

  在上面三個實例中,相信讀者一定已經看出來了,我們的終端使用者在使用不同的電腦產品時對於資料一致性的需求是不一的:

  有些系統,既要快速地回應使用者,同時還要保障系統的資料對於任意用戶端都是真實可靠的,就像火車站的售票系統。

  還有些系統,需要為使用者保障絕對可靠的資料安全,雖然在資料一致性上存在延遲時間,但最後務必保障嚴格的一致,就像銀行的轉帳系統。

  另外的一些系統,雖然向使用者展示了一些可以說是「錯誤」的資料,但是在整個系統使用過程中,一定會在某一個流程上對系統資料進行準確無誤的檢查,進一步避免使用者發生不必要的損失,就像網購系統。

  ■更新的平行處理性

  在電腦發展的早期階段,受到底層硬體技術的限制,同時也是由於人們對於電腦系統的實際使用需求比較簡單,因此很多上層的應用程式架構都是單執行緒模型的。以C 語言為例,其誕生於上世紀70 年代,當時幾乎所有使用C 語言開發的應用程式都是單執行緒的。從現在來看,單執行緒應用程式雖然在執行效率上無法和後來的多執行緒應用程式相比,但是在程式設計模型上相對簡單,因此能夠避免多執行緒程式中出現的不少平行處理問題。

  隨著電腦底層硬體技術和現代作業系統的不斷發展,多執行緒技術開始被越來越多地引用到電腦程式設計模型之中,並對現代電腦應用程式的整體架構有著非常重要的作用。

  多執行緒的引用,為應用程式在效能上帶來卓越提升的同時,也帶來一個最大的副作用--平行處理。《Computer Systems: A Programmer's Perspective》一書對平行處理定義如下:如果邏輯控制流在時間上重疊,那麼它們就是平行處理的。這裡提到的邏輯控制流,通俗地講,就是一次程式操作,例如讀取或更新記憶體中變數的值。

  在本書後面的討論中,我們提到的“平行處理”都特指更新操作的平行處理,即有多個執行緒同時更新記憶體中變數的值--我們將這一現象稱為更新的平行處理性。

  ■分散式一致性問題

  在分散式系統中另一個需要解決的重要問題就是資料的複製。在我們日常的開發經驗中,相信很多開發人員都碰到過這樣的問題:假設用戶端C1 將系統中的值K 由V1 更新為V2,但用戶端C2 無法立即讀取到K 的最新值,需要在一段時間之後才能讀取到。讀者可能也已經猜到了,上面這個實例就是常見的資料庫之間複製的延遲時間問題。

  分散式系統對於資料的複製需求一般都來自以下兩個原因:

  ■為了加強系統的可用性,以防止單點故障引起的系統不可用。

  ■提升系統的整體效能,透過負載平衡技術,能夠讓分佈在不同地方的資料備份都能夠提供給使用者服務。

  資料複製在可用性和效能方面給分散式系統帶來的極大好處是不言而喻的,然而資料複製所帶來的一致性挑戰,也是每一個系統研發人員不得不面對的。

  所謂的分散式一致性問題,是指在分散式環境中引用資料複製機制後,不同資料節點間可能出現的,並無法依靠電腦應用程式本身解決的資料不一致情況。簡單地講,資料一致性就是指在對一個備份資料進行更新的同時,必須確保也能更新其他的備份,否則不同備份之間的資料將不再一致。

  那怎麼來解決這個問題呢?順著上面提到的複製延遲時間問題,很快就有人想到了一種解決辦法,那就是:

  “既然是由於延遲時間引起的問題,那我可以將寫入的動作阻塞,直到資料複製完成後,才完成寫入動作。"

  沒錯,這似乎能解決問題,而且有一些系統的架構也確實直接使用了這個想法。但這個想法在解決一致性問題的同時,又帶來了新的問題:寫入的效能。如果你的應用場景有非常多的寫入請求,那麼使用這個想法之後,後續的寫入請求都將阻塞在前一個請求的寫入操作上,導致系統整理效能急劇下降。

  整體來講,我們無法找到一種能夠滿足分散式系統所有系統屬性的一致性解決方案。因此,如何既保障資料的一致性,同時又不影響系統執行的效能,是每一個分散式系統都需要重點考慮和權衡的。於是,就出現了以下一致性等級:

  ■強一致性

  這種一致性等級是最符合使用者直覺的,它要求系統寫入什麼,讀出來的也會是什麼,使用者體驗好,但實現起來常常對系統的效能影響比較大。

  ■弱一致性

  這種一致性等級約束了系統在寫入成功後,不承諾立即可以讀到寫入的值,也不實際承諾多久之後資料能夠達到一致,但會盡可能地保障到某個時間等級(例如秒等級)後,資料能夠達到一致狀態。弱一致性還可以再進行細分:

  階段一致性:該一致性等級只保障對於寫入的值,在同一個用戶端階段中可以立即讀到一致的值,但其他的階段不能保障。

  使用者一致性:該一致性等級只保障對於寫入的值,在同一個使用者中可以立即讀到一致的值,但其他使用者不能保障。

  ■最後一致性

  最後一致性是弱一致性的特例,系統會保障在一定時間內,能夠達到一個資料一致的狀態。這裡之所以將最後一致性單獨提出來,是因為它是弱一致性中非常重要的一種一致性模型,也是業界在大型分散式系統的資料一致性上比較推崇的模型。

  本書將從分散式一致性的理論出發,向讀者說明幾種典型的分散式一致性協定是如何解決一致性問題的。之後,則會深入介紹分散式一致性問題的工業解決方案--ZooKeeper,並注重介紹這一分散式協調架構的使用方法、內部實現以及運行維護技巧。
網路書店 類別 折扣 價格
  1. 新書
    59
    $340
  2. 新書
    79
    $458
  3. 新書
    85
    $493
  4. 新書
    9
    $522
  5. 新書
    9
    $522