本書特色:
深入剖析卷積神經網絡核心:全連接層和卷積層
深入分析Caffe源碼實現架構,了解框架背后的運行機理
詳盡介紹網絡結構與訓練細節,解密復雜運算的基本原理
經典實踐場景:圖像語意分割,圖像生成。GAN模型的詳細分析與推導
樣例代碼采用C++和Python兩種語言編寫
語言輕松幽默易於理解,特別適合初學者快速掌握深度學習核心思想
本書適合對深度學習感興趣的讀者閱讀,也適合有志於從事計算機視覺研究等領域的廣大學生閱讀,可作為深度學習的入門教材。
馮超,畢業於中國科學院大學,猿輔導研究團隊視覺研究負責人,小猿搜題拍照搜題負責人之一。自2016年起在知乎開設了自己的專欄——《無痛的機器學習》,發表機器學習與深度學習相關文章,文章以輕松幽默的語言、細致深入的分析為特點,收到了不錯的反響,被多家媒體轉載。曾多次參與社區技術分享活動。
目錄
1 機器學習與深度學習的概念1
1.1 什麼是機器學習. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.1.1 機器學習的形式. . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
1.1.2 機器學習的幾個組成部分. . . . . . . . . . . . . . . . . . . . . . 8
1.2 深度學習的逆襲. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
1.3 深層模型在視覺領域的應用. . . . . . . . . . . . . . . . . . . . . . . . . 13
1.4 本書的主要內容. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
1.5 總結. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
2 數學與機器學習基礎18
2.1 線性代數基礎. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
2.2 對稱矩陣的性質. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
2.2.1 特征值與特征向量. . . . . . . . . . . . . . . . . . . . . . . . . . 22
2.2.2 對稱矩陣的特征值和特征向量. . . . . . . . . . . . . . . . . . . . 23
2.2.3 對稱矩陣的對角化. . . . . . . . . . . . . . . . . . . . . . . . . . 24
2.3 概率論. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
2.3.1 概率與分布. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
2.3.2 最大似然估計. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
2.4 信息論基礎. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
2.5 KL 散度. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
2.6 凸函數及其性質. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
2.7 機器學習基本概念. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
2.8 機器學習的目標函數. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42
2.9 總結. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
3 CNN 的基石:全連接層45
3.1 線性部分. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
3.2 非線性部分. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48
3.3 神經網絡的模樣. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50
3.4 反向傳播法. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
3.4.1 反向傳播法的計算方法. . . . . . . . . . . . . . . . . . . . . . . . 55
3.4.2 反向傳播法在計算上的抽象. . . . . . . . . . . . . . . . . . . . . 58
3.4.3 反向傳播法在批量數據上的推廣. . . . . . . . . . . . . . . . . . 59
3.4.4 具體的例子. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63
3.5 參數初始化. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65
3.6 總結. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68
4 CNN 的基石:卷積層69
4.1 卷積操作. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69
4.1.1 卷積是什麼. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69
4.1.2 卷積層效果展示. . . . . . . . . . . . . . . . . . . . . . . . . . . . 73
4.1.3 卷積層匯總了什麼. . . . . . . . . . . . . . . . . . . . . . . . . . 76
4.1.4 卷積的另一種解釋. . . . . . . . . . . . . . . . . . . . . . . . . . 77
4.2 卷積層的反向傳播. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79
4.2.1 實力派解法. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80
4.2.2 「偶像派」解法. . . . . . . . . . . . . . . . . . . . . . . . . . . . 84
4.3 ReLU . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88
4.3.1 梯度消失問題. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89
4.3.2 ReLU 的理論支撐. . . . . . . . . . . . . . . . . . . . . . . . . . . 92
4.3.3 ReLU 的線性性質. . . . . . . . . . . . . . . . . . . . . . . . . . . 93
4.3.4 ReLU 的不足. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93
4.4 總結. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 94
4.5 參考文獻. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 94
5 Caffe 入門95
5.1 使用Caffe 進行深度學習訓練. . . . . . . . . . . . . . . . . . . . . . . . 96
5.1.1 數據預處理. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 96
5.1.2 網絡結構與模型訓練的配置. . . . . . . . . . . . . . . . . . . . . 100
5.1.3 訓練與再訓練. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108
5.1.4 訓練日志分析. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 110
5.1.5 預測檢驗與分析. . . . . . . . . . . . . . . . . . . . . . . . . . . . 112
5.1.6 性能測試. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 115
1.1 什麼是機器學習. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.1.1 機器學習的形式. . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
1.1.2 機器學習的幾個組成部分. . . . . . . . . . . . . . . . . . . . . . 8
1.2 深度學習的逆襲. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
1.3 深層模型在視覺領域的應用. . . . . . . . . . . . . . . . . . . . . . . . . 13
1.4 本書的主要內容. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
1.5 總結. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
2 數學與機器學習基礎18
2.1 線性代數基礎. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
2.2 對稱矩陣的性質. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
2.2.1 特征值與特征向量. . . . . . . . . . . . . . . . . . . . . . . . . . 22
2.2.2 對稱矩陣的特征值和特征向量. . . . . . . . . . . . . . . . . . . . 23
2.2.3 對稱矩陣的對角化. . . . . . . . . . . . . . . . . . . . . . . . . . 24
2.3 概率論. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
2.3.1 概率與分布. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
2.3.2 最大似然估計. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
2.4 信息論基礎. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
2.5 KL 散度. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
2.6 凸函數及其性質. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
2.7 機器學習基本概念. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
2.8 機器學習的目標函數. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42
2.9 總結. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
3 CNN 的基石:全連接層45
3.1 線性部分. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
3.2 非線性部分. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48
3.3 神經網絡的模樣. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50
3.4 反向傳播法. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
3.4.1 反向傳播法的計算方法. . . . . . . . . . . . . . . . . . . . . . . . 55
3.4.2 反向傳播法在計算上的抽象. . . . . . . . . . . . . . . . . . . . . 58
3.4.3 反向傳播法在批量數據上的推廣. . . . . . . . . . . . . . . . . . 59
3.4.4 具體的例子. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63
3.5 參數初始化. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65
3.6 總結. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68
4 CNN 的基石:卷積層69
4.1 卷積操作. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69
4.1.1 卷積是什麼. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69
4.1.2 卷積層效果展示. . . . . . . . . . . . . . . . . . . . . . . . . . . . 73
4.1.3 卷積層匯總了什麼. . . . . . . . . . . . . . . . . . . . . . . . . . 76
4.1.4 卷積的另一種解釋. . . . . . . . . . . . . . . . . . . . . . . . . . 77
4.2 卷積層的反向傳播. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79
4.2.1 實力派解法. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80
4.2.2 「偶像派」解法. . . . . . . . . . . . . . . . . . . . . . . . . . . . 84
4.3 ReLU . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88
4.3.1 梯度消失問題. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89
4.3.2 ReLU 的理論支撐. . . . . . . . . . . . . . . . . . . . . . . . . . . 92
4.3.3 ReLU 的線性性質. . . . . . . . . . . . . . . . . . . . . . . . . . . 93
4.3.4 ReLU 的不足. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93
4.4 總結. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 94
4.5 參考文獻. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 94
5 Caffe 入門95
5.1 使用Caffe 進行深度學習訓練. . . . . . . . . . . . . . . . . . . . . . . . 96
5.1.1 數據預處理. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 96
5.1.2 網絡結構與模型訓練的配置. . . . . . . . . . . . . . . . . . . . . 100
5.1.3 訓練與再訓練. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108
5.1.4 訓練日志分析. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 110
5.1.5 預測檢驗與分析. . . . . . . . . . . . . . . . . . . . . . . . . . . . 112
5.1.6 性能測試. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 115
網路書店
類別
折扣
價格
-
二手書29折$136
-
新書$474