內容簡介

隨着各種高通量微陣列技術的飛速發展,基於基因表達譜數據的分析已經成為系統生物學研究中的一個非常重要的領域。基因表達譜數據的最大特點是高噪聲、高維數和小樣本,針對這種數據的特點,本書主要介紹了基因調控網絡的建模方法及其動態行為分析、分類器的設計及其誤差估計、數據和特征的正則化,以及聚類算法及其驗證過程等內容。

本書主要面向具有一定數學基礎的生物信息學、計算生物學或系統生物學等領域的研究生或科研人員,也可以作為研究基因組學的教科書或參考書。
 

目錄

譯者序
前言
第1章 生物基礎
1.1 遺傳學
1.1.1 核酸結構
1.1.2 基因
1.1.3 RNA
1.1.4 轉錄
1.1.5 蛋白質
1.1.6 翻譯
1.1.7 轉錄調控
1.2 基因組學
1.2.1 微陣列技術
1.3 蛋白質組學
第2章 基因網絡的確定性模型
2.1 圖模型
2.2 布爾網絡
2.2.1 細胞分化和細胞的功能狀態
2.2.2 網絡特性及動態行為
2.2.3 網絡推理
2.3 布爾網絡的推廣
2.3.1 異步
2.3.2 多值網絡
2.4 微分方程模型
2.4.1 有轉錄和翻譯過程的微分方程模型
2.4.2 連續微分方程模型的離散化
第3章 基因網絡的隨機模型
3.1 貝葉斯網絡
3.2 概率布爾網絡
3.2.1 定義
3.2.2 推理
3.2.3 PBN的動力學
3.2.4 暫態隨機PBN的穩態分析
3.2.5 PBN與貝葉斯網絡的關系
3.2.6 基於種子基因的子網絡的生長
3.3 干預
3.3.1 基因干預
3.3.2 結構干預
3.3.3 外部控制
第4章 分類
4.1 貝葉斯分類器
4.2 分類規則
4.2.1 一致分類器設計
4.2.2 分類規則實例
4.3 有約束的分類器
4.3.1 分散系數
4.3.2 VC維數
4.4 線性分類
4.4.1 Rosenblatt感知器
4.4.2 線性及二次判別分析
4.4.3 基於最小二乘誤差的線性判別式
4.4.4 支持向量機
4.4.5 線性判別式的設計誤差的表示
4.4.6 基於樣本QDA判別式的分布
4.5 神經網絡分類器
4.6 分類樹
4.6.1 分類與回歸樹
4.6.2 基於數據划分的強一致規則
4.7 誤差估計
4.7.1 重代人法
4.7.2 交叉驗證
4.7.3 自舉法
4.7.4 支撐
4.7.5 誤差估計器性能
4.7.6 特征集排序
4.8 誤差校正
4.9 魯棒分類器
4.9.1 最優魯棒分類器
4.9.2 魯棒分類器的性能比較
第5章 正則化
5.1 數據正則化
5.1.1 正則化判別分析
5.1.2 噪聲注入
5.2 復雜度正則化
5.2.1 誤差正則化
5.2.2 結構風險最小化
5.2.3 經驗復雜度
5.3 特征選擇
5.3.1 峰值現象
5.3.2 特征選擇算法
5.3.3 誤差估計對特征選擇的影響
5.3.4 冗余
5.3.5 並行增量特征選擇
5.3.6 貝葉斯變量選擇
5.4 特征提取
第6章 聚類
6.1 聚類算法的實例
6.1.1 歐氏距離聚類
6.1.2 自組織映射
6.1.3 分層聚類
6.1.4 基於模型的聚類算子
6.2 聚類算子
6.2.1 算法結構
6.2.2 標記算子
6.2.3 貝葉斯聚類器
6.2.4 聚類算子的分布測試
6.3 聚類的驗證
6.3.1 外部驗證
6.3.2 內部驗證
6.3.3 不穩定指數
6.3.4 貝葉斯因子
6.4 聚類算子學習
6.4.1 經驗誤差聚類算子
6.4.2 最近鄰聚類規則
索引
 

后基因組時代生物學研究的熱點由對細胞內個別基因或蛋白質功能的局部性研究,轉移到以細胞內全部的基因、mRNA、蛋白質及代謝產物為研究對象的各種「組學」研究,逐步把分子生物學推人系統生物學時代。2000年,I..Hood、A.Aderem和R.Aebersold創立了世界上第一個系統生物研究所(Institute for Systems Biology,ISB),標志着系統生物學研究的正式開始。系統生物學試圖通過對各種生物大分子所形成的基因調控網絡、信號轉導網絡、蛋白質相互作用網絡、代謝網絡等的研究來分析生物功能。作為這些網絡的基礎和核心,基因調控網絡已經成為后基因組時代系統生物學的一個研究重點和熱點。功能基因組研究的一個主要目的就是疾病的診斷和治療,其流程為,篩選特定細胞顯型的基因,建立基因相互作用的非線性模型,分析正常和異常狀況下基因之間的調控關系,設計適當的干預策略來影響、改變或修正系統動態的行為。所有這些研究的基礎則是對各種高通量技術所獲得的基因表達譜數據的處理、分析和建模。

I.Shmulevich和E.R.Dougherty在基因組信號處理領域具有很高的造詣和影響。2002年,他們在布爾網絡模型的基礎上,提出了研究基因調控網絡的概率布爾網絡(probabilistic boolean network,PBN)模型,為系統地研究基因調控網絡的干預奠定了基礎。本書的主要內容是他們近幾年研究成果的系統總結,2007年,劉文斌受溫州市「新世紀551人才工程」資助到系統生物研究所(ISB)I.Shmulevich教授的計算生物學研究小組做訪學研究,期間有幸看到這本書並學習了其中的大部分內容。

近年來,雖然國內有關生物信息學的譯著及書籍很多,但大部分是關於蛋白質及序列分析的軟件、算法及相關網絡資源的工具書,真正涉及生物信息學基本理論的著作還很少。和以往的書籍比較,本書的特點包括:①本書專門探討基因表達譜數據處理涉及的建模、分類及聚類的基本方法和理論。②作者將生物網絡的進化、細胞的功能狀態等生物學概念與基因調控網絡的動態行為有機地結合在一起,揭示了這些抽象數學概念所代表的實際生物學意義。③對PBN這種新的概率模型,作者采取例子驅動的方式,逐步介紹有關的概念、動態行為分析及干預過程,非常淺顯易懂。④作者從算子的角度將分類和聚類統一起來,詳細討論了二者涉及的算子的設計、誤差估計及魯棒性。⑤縱觀全書,作者站在科學認識論高度探討各種理論、方法及其優缺點,使得讀者能夠對這些復雜數學方法的本質有更深刻的認識。

基於上述原因,我們萌生了翻譯本書的念頭,主要是希望能為國內系統生物學研究的學者和研究生提供一本研究基因組學的教科書或參考書,促進我國在系統生物學方面的發展。如果本書能夠做到這一點,譯者將感到十分欣慰。在翻譯過程中,我們力求忠實、准確地把握原著的風格。由於譯者水平有限,另外時間倉促,書中難免有不當之處,懇請廣大讀者批評指正。

本書的翻譯和審校由劉文斌和高琳共同組織完成,其中,劉文斌負責第1~3章,高琳負責第4~6章。覃桂敏、趙建幫、孫鵬崗,劉志偉參與了本書所有圖表的編輯工作,張航、王欣、昝鄉鎮等參與了所有參考文獻的校對工作。全書由劉文斌最后統一核實、修改和整理。在此,對所有參與本書翻譯工作的所有人員表示由衷的感謝。

本書翻譯過程中得到了I.Shmulevich和E.R.Dougherty教授的大力支持,他們向譯者提供了書稿的電子版和英文版的最終版本,並且詳細探討了翻譯過程所遇到的各種問題。此外,西安電子科技大學的張軍英教授也在翻譯過程給予了很多指導。譯者感謝科學出版社的夏梁和莫結勝兩位編輯的大力支持和幫助,是他們的遠見,使得本書能夠盡快與讀者見面。最后,本書的翻譯特別得到國家自然科學基金重點項目「生物網絡數據分析與挖掘中相關理論與關鍵技術」(60933009)和國家自然科學基金面上項目「臨界基因調控網絡的可控性理論及其干預方法研究」(60970065)的資助。
網路書店 類別 折扣 價格
  1. 新書
    87
    $355