內容簡介
本書全面系統地介紹了聊天機器人的背景、典型應用場景,以及核心技術模組。並圍繞問答系統、任務對話系統和閒聊系統三種聊天機器人的具體展現,從技術原理和實踐兩個方面進行闡述,適合對自然語言處理有一定基礎又想進入聊天機器人應用研發的一線研發人員學習。
作者介紹
王昊奮
上海樂言資訊科技有限公司CTO,中文知識圖譜zhishi.me創始人、OpenKG發起人之一、CCF理事、CCF術語審定工委主任、CCF TF執委、中文資訊學會語言與知識計算委員會副秘書長,共發表80餘篇高水準論文,在知識圖譜、問答系統和聊天機器人等諸多領域有豐富的研發經驗,其帶隊構建的語義搜索系統在Billion Triple Challenge中榮獲全球第2名;在著名的本體匹配競賽OAEI的實體匹配任務中斬獲全球第1名。曾主持並參與多項國家自然科學基金、“863”重大專項和國家科技支撐專案,以學術負責人身份參與PayPal、Google、Intel、IBM、百度等企業的合作專案。
上海樂言資訊科技有限公司CTO,中文知識圖譜zhishi.me創始人、OpenKG發起人之一、CCF理事、CCF術語審定工委主任、CCF TF執委、中文資訊學會語言與知識計算委員會副秘書長,共發表80餘篇高水準論文,在知識圖譜、問答系統和聊天機器人等諸多領域有豐富的研發經驗,其帶隊構建的語義搜索系統在Billion Triple Challenge中榮獲全球第2名;在著名的本體匹配競賽OAEI的實體匹配任務中斬獲全球第1名。曾主持並參與多項國家自然科學基金、“863”重大專項和國家科技支撐專案,以學術負責人身份參與PayPal、Google、Intel、IBM、百度等企業的合作專案。
目錄
1 聊天機器人概述 1
1.1 聊天機器人的發展歷史 1
1.2 聊天機器人的分類與應用場景 6
1.3 聊天機器人生態介紹 9
1.3.1 典型聊天機器人框架介紹 11
1.3.2 聊天機器人平臺介紹 13
1.3.3 典型的聊天機器人產品介紹 13
1.4 參考文獻 19
2 聊天機器人技術原理 20
2.1 自然語言理解 21
2.1.1 自然語言理解概覽 23
2.1.2 自然語言理解基本技術 26
2.1.3 自然語言表示和基於深度學習的自然語言理解 36
2.1.4 基於知識圖譜的自然語言理解 46
2.2 自然語言生成 56
2.2.1 自然語言生成綜述 56
2.2.2 基於檢索的自然語言生成 58
2.2.3 基於範本的自然語言生成 59
2.2.4 基於深度學習的自然語言生成 60
2.3 對話管理 61
2.4 參考文獻 65
3 問答系統 67
3.1 問答系統概述 67
3.2 KBQA 系統 71
3.2.1 KBQA 系統簡介 71
3.2.2 主流的 KBQA 方法 79
3.3 KBQA 系統實現 96
3.3.1 系統簡介 96
3.3.2 模組設計 97
3.4 參考文獻 105
4 對話系統 109
4.1 對話系統概述 109
4.2 對話系統技術原理 113
4.2.1 NLU 模組 115
4.2.2 DST 模組 120
4.2.3 DPL 模組 121
4.2.4 NLG 模組 126
4.3 基於聊天機器人平臺搭建對話系統 126
4.3.1 NLU 模組實現 129
4.3.2 DST 與 DPL 模組實現 130
4.3.3 NLG 模組實現 131
4.4 面向任務的對話系統實現 132
4.5 參考文獻 137
5 閒聊系統 139
5.1 閒聊系統概述 139
5.2 基於對話庫檢索的閒聊系統 140
5.2.1 基於對話庫檢索的閒聊系統介紹140
5.2.2 對話庫的建立 143
5.2.3 基於檢索的閒聊系統實現145
5.3 基於生成的閒聊系統 150
5.3.1 基於生成的閒聊系統介紹 150
5.3.2 生成式閒聊系統的新發展 152
5.3.3 基於生成的閒聊系統實現 155
5.4 參考文獻 157
6 聊天機器人系統評測 159
6.1 問答系統評測 159
6.1.1 問答系統評測會議 160
6.1.2 問答系統評測資料集 171
6.1.3 問答系統評測標準 173
6.2 對話系統評測 174
6.2.1 對話系統評測會議 176
6.2.2 對話系統評測資料集 177
6.2.3 對話系統評測標準 178
6.3 閒聊系統評測 179
6.3.1 閒聊系統評測介紹 179
6.3.2 閒聊系統評測標準 180
6.4 參考文獻 183
7 聊天機器人挑戰與展望 185
7.1 開放式挑戰 185
7.2 技術與應用展望 187
7.3 從聊天機器人到虛擬生命190
7.4 參考文獻 193
1.1 聊天機器人的發展歷史 1
1.2 聊天機器人的分類與應用場景 6
1.3 聊天機器人生態介紹 9
1.3.1 典型聊天機器人框架介紹 11
1.3.2 聊天機器人平臺介紹 13
1.3.3 典型的聊天機器人產品介紹 13
1.4 參考文獻 19
2 聊天機器人技術原理 20
2.1 自然語言理解 21
2.1.1 自然語言理解概覽 23
2.1.2 自然語言理解基本技術 26
2.1.3 自然語言表示和基於深度學習的自然語言理解 36
2.1.4 基於知識圖譜的自然語言理解 46
2.2 自然語言生成 56
2.2.1 自然語言生成綜述 56
2.2.2 基於檢索的自然語言生成 58
2.2.3 基於範本的自然語言生成 59
2.2.4 基於深度學習的自然語言生成 60
2.3 對話管理 61
2.4 參考文獻 65
3 問答系統 67
3.1 問答系統概述 67
3.2 KBQA 系統 71
3.2.1 KBQA 系統簡介 71
3.2.2 主流的 KBQA 方法 79
3.3 KBQA 系統實現 96
3.3.1 系統簡介 96
3.3.2 模組設計 97
3.4 參考文獻 105
4 對話系統 109
4.1 對話系統概述 109
4.2 對話系統技術原理 113
4.2.1 NLU 模組 115
4.2.2 DST 模組 120
4.2.3 DPL 模組 121
4.2.4 NLG 模組 126
4.3 基於聊天機器人平臺搭建對話系統 126
4.3.1 NLU 模組實現 129
4.3.2 DST 與 DPL 模組實現 130
4.3.3 NLG 模組實現 131
4.4 面向任務的對話系統實現 132
4.5 參考文獻 137
5 閒聊系統 139
5.1 閒聊系統概述 139
5.2 基於對話庫檢索的閒聊系統 140
5.2.1 基於對話庫檢索的閒聊系統介紹140
5.2.2 對話庫的建立 143
5.2.3 基於檢索的閒聊系統實現145
5.3 基於生成的閒聊系統 150
5.3.1 基於生成的閒聊系統介紹 150
5.3.2 生成式閒聊系統的新發展 152
5.3.3 基於生成的閒聊系統實現 155
5.4 參考文獻 157
6 聊天機器人系統評測 159
6.1 問答系統評測 159
6.1.1 問答系統評測會議 160
6.1.2 問答系統評測資料集 171
6.1.3 問答系統評測標準 173
6.2 對話系統評測 174
6.2.1 對話系統評測會議 176
6.2.2 對話系統評測資料集 177
6.2.3 對話系統評測標準 178
6.3 閒聊系統評測 179
6.3.1 閒聊系統評測介紹 179
6.3.2 閒聊系統評測標準 180
6.4 參考文獻 183
7 聊天機器人挑戰與展望 185
7.1 開放式挑戰 185
7.2 技術與應用展望 187
7.3 從聊天機器人到虛擬生命190
7.4 參考文獻 193
序
推薦序
聊天機器人是社會關係網路、自動客服、語音助手、智慧音箱、遊戲等的重要支撐技術,它綜合應用了自然語言處理技術。自然語言處理是體現語言智慧非常關鍵的技術,它分析、理解和生成自然語言,實現人與機器的自然交流。
同時,機器翻譯、自動文摘、自動寫作、郵件或者短消息的自動回復也有助於人與人之間的交流。如果語言智慧可以實現突破,跟它同屬認知智慧的知識圖譜與常識推理等技術也會得到長足的發展,並推動整個人工智慧體系的進步,使更多的場景落地。自然語言處理被視為人工智慧“皇冠上的明珠”。要做好這項技術,達到和人一樣自然的交互是非常具有挑戰性的一項課題。許多積極投身于自然語言處理研究和開發的同仁,迫切需要掌握自然語言處理的基礎技術,瞭解技術前沿。
我很高興看到本書的出版。它系統地介紹了聊天機器人的技術體系和自然語言處理在聊天機器人中的應用,輔以案例,理論和實踐結合良好。本書深入淺出的風格對不同層次的讀者都有説明。
本書由王昊奮博士和邵浩博士主導,他們二位都是從學術界跨越到工業界的年輕人,並致力於將技術應用到產品實踐中。我和王昊奮在中國電腦學會術語工作委員會和自然語言專委會等組織中有緊密的合作。我認為,他不僅在學術上積極進取,還特別希望嘗試把各種新技術應用到產品中。他將理論和實踐相結合,多年來積累了豐富的研發經驗,走出了一條獨到的創新之路。本書由多位相關企業的資深技術研發人員參與撰寫。因此我相信本書一定會激發大家對聊天機器人的興趣和更深入的思考。
從本書的內容上看,除了對聊天機器人的歷史發展和技術體系的闡述,重點介紹了聊天機器人的 3 種典型表現形式:閒聊、對話和問答。以閒聊型聊天機器人為例,雖然基於檢索的方法是目前主流的產品實現方式,但隨著自然語言處理端到端技術的發展,生成式對話越來越受重視,有很多研究者嘗試用生成方法解決個性化、多輪對話和安全回復等問題。同時,本書介紹了知識圖譜的重要作用,因為基於知識圖譜的問答也是問答型聊天機器人的重要組成部分。
本書盡可能完整地展現了聊天機器人相關技術的最新進展,有興趣的讀者可通過此書全面瞭解聊天機器人。
聊天機器人已經在智慧客服、知識問答等場景裡有了較好的應用,未來會在大資料、深度學習和重要場景的推動下進一步提升智慧水準。我們可以暢想,在未來的某個時刻,會出現一個基於人工智慧技術的虛擬生命,它能夠真正理解人類的語言,有自己的記憶和情感,並可以和人進行自然真實的對話。儘管我們離這個目標尚遠,但是我們可以逐步靠近。這裡孕育著無窮的研究、開發機會和樂趣。我期待本書能激勵更多優秀的年輕人投身其中,做出更多成就!
微軟亞洲研究院副院長、國際計算語言學會主席
周明
聊天機器人是社會關係網路、自動客服、語音助手、智慧音箱、遊戲等的重要支撐技術,它綜合應用了自然語言處理技術。自然語言處理是體現語言智慧非常關鍵的技術,它分析、理解和生成自然語言,實現人與機器的自然交流。
同時,機器翻譯、自動文摘、自動寫作、郵件或者短消息的自動回復也有助於人與人之間的交流。如果語言智慧可以實現突破,跟它同屬認知智慧的知識圖譜與常識推理等技術也會得到長足的發展,並推動整個人工智慧體系的進步,使更多的場景落地。自然語言處理被視為人工智慧“皇冠上的明珠”。要做好這項技術,達到和人一樣自然的交互是非常具有挑戰性的一項課題。許多積極投身于自然語言處理研究和開發的同仁,迫切需要掌握自然語言處理的基礎技術,瞭解技術前沿。
我很高興看到本書的出版。它系統地介紹了聊天機器人的技術體系和自然語言處理在聊天機器人中的應用,輔以案例,理論和實踐結合良好。本書深入淺出的風格對不同層次的讀者都有説明。
本書由王昊奮博士和邵浩博士主導,他們二位都是從學術界跨越到工業界的年輕人,並致力於將技術應用到產品實踐中。我和王昊奮在中國電腦學會術語工作委員會和自然語言專委會等組織中有緊密的合作。我認為,他不僅在學術上積極進取,還特別希望嘗試把各種新技術應用到產品中。他將理論和實踐相結合,多年來積累了豐富的研發經驗,走出了一條獨到的創新之路。本書由多位相關企業的資深技術研發人員參與撰寫。因此我相信本書一定會激發大家對聊天機器人的興趣和更深入的思考。
從本書的內容上看,除了對聊天機器人的歷史發展和技術體系的闡述,重點介紹了聊天機器人的 3 種典型表現形式:閒聊、對話和問答。以閒聊型聊天機器人為例,雖然基於檢索的方法是目前主流的產品實現方式,但隨著自然語言處理端到端技術的發展,生成式對話越來越受重視,有很多研究者嘗試用生成方法解決個性化、多輪對話和安全回復等問題。同時,本書介紹了知識圖譜的重要作用,因為基於知識圖譜的問答也是問答型聊天機器人的重要組成部分。
本書盡可能完整地展現了聊天機器人相關技術的最新進展,有興趣的讀者可通過此書全面瞭解聊天機器人。
聊天機器人已經在智慧客服、知識問答等場景裡有了較好的應用,未來會在大資料、深度學習和重要場景的推動下進一步提升智慧水準。我們可以暢想,在未來的某個時刻,會出現一個基於人工智慧技術的虛擬生命,它能夠真正理解人類的語言,有自己的記憶和情感,並可以和人進行自然真實的對話。儘管我們離這個目標尚遠,但是我們可以逐步靠近。這裡孕育著無窮的研究、開發機會和樂趣。我期待本書能激勵更多優秀的年輕人投身其中,做出更多成就!
微軟亞洲研究院副院長、國際計算語言學會主席
周明
網路書店
類別
折扣
價格
-
新書$414