隨着信息科技的發展,人類進入了大數據時代。挖掘互聯網上海量主觀性文本已成為決策支持的重要手段。從產品消費、服務、醫療保健、金融服務、再到社會事件和政治選舉,觀點挖掘幾乎滲透到現實生活中每一個可能的領域。這些實際的應用為觀點挖掘的研究提供了強烈的動機。
本書在分析觀點挖掘相關理論和相關技術研究現狀基礎上,闡述了方面級觀點挖掘方法的分類、如何利用CRF方法以及主題模型進行方面級觀點挖掘、以及在觀點挖掘環境下實體和方面的指代消解研究。
實現了在線評論的智能化觀點挖掘,故本書書名為《在線評論方面級觀點挖掘理論與方法》,並進一步研究將觀點挖掘的結果應用於用戶滿意度評價及產品屬性績效類型界定方法。每部分研究工作詳細描寫了背景、問題、研究思路、實驗結果、結論與總結等。各部分工作相關,又獨成體系,可讀性好。
目錄
第1章觀點挖掘
1.1從數據挖掘到觀點挖掘
1.2觀點挖掘的含義及應用
1.3觀點挖掘研究
1.3.1觀點挖掘的不同級別
1.3.2情感詞典及相關問題
1.3.3自然語言處理問題
1.4垃圾觀點檢測
第2章觀點挖掘目標
2.1實體與觀點
2.2觀點挖掘的目標
2.3觀點文摘
2.3.1方面級觀點文摘的特點
2.3.2方面級觀點文摘的改進
2.3.3方面級對比觀點文摘
2.3.4傳統短文本文摘
第3章方面級觀點挖掘方法
3.1方面抽取
3.1.1基於頻率的方法
3.1.2基於關系的方法
3.1.3混合方法
3.1.4監督學習方法
3.1.5主題模型方法
3.2方面分類
3.3方面情感分類
第4章基於CRF的方面級觀點挖掘
4.1挖掘方法
4.1.1准備符號標記與訓練集
4.1.2定義學習函數
4.1.3訓練CRF模型
4.1.4CRF模型的使用
4.2實驗
4.2.1數據集
4.2.2性能評估方法
4.2.3用CRF挖掘中文評論的實驗結果
4.2.4差異顯著性檢驗
4.2.5CRF方法與其他方法挖掘中文評論的比較
第5章主題模型的設計決策
5.1主題因素
5.1.1全局主題與局部主題
5.1.2主題與方面的映射
5.1.3基於約束的方面分類
5.1.4基於需求的方面分類
5.2情感因素
5.2.1情感層
5.2.2情感之間的依賴
5.2.3情感與方面的分離
5.2.4情感先驗信息
5.3相關因素的實現技術
5.3.1主題因素的實現
5.3.2情感因素的實現
5.4相關因素的選取策略
第6章基於TMDP的方面級觀點挖掘
6.1TMDP模型
6.1.1模型參數的物理含義
6.1.2模型表示
6.1.3模型生成過程GP—TMDP
6.1.4參數r的設置
6.2模型參數估計
6.2.1基於collapsed吉布斯抽樣的主題參數估計算法Gibbs—TE
6.2.2基於情感預測的主題一方面映射算法TAMSP
6.2.3基於collapsed吉布斯抽樣的方面一情感分離參數估計算法(;ibbs—ASS
6.3實驗結果及分析
6.3.1數據集
6.3.2主題與方面對應關系的定性分析
6.3.3主題與方面對應關系的定量分析
6.3.4局部主題對方面識別的貢獻
6.3.5觀點詞識別的性能分析
6.3.6觀點詞和方面詞之間關聯的評估
6.3.7特征選擇對方面與情感分離的影響
6.3.8標簽數據尺寸對方面與情感分離的影響
6.3.9不同領域數據集對方面與情感分離的影響
第7章基於TMPP的方面級觀點挖掘
7.1TMPP模型
7.1.1基於短語級參數學習的主題模型演化
7.1.2基於短語級參數學習的主題模型中的參數
7.1.3模型生成過程
7.2模型參數估計
7.2.1AR—PLSI模型參數估計
7.2.2AR—LDA模型的參數估計
7.2.3ARI模型的參數估計
7.3實驗結果及分析
7.3.1數據集
7.3.2方面識別分析
7.3.3等級預測分析
7.3.4模型的適應性分析
第8章基於CRF的實體和方面的指代消解
8.1已有的指代消解方法
8.2針對觀點挖掘環境提出的新特征
8.2.1觀點極性一致性特征
8.2.2實體和方面與觀點詞的關系特征
8.3新特征的實驗分析
8.3.1數據集與特征集
8.3.2基線方法
8.3.3新特征的實驗結果分析
8.4基於CRF的指代消解
8.4.1約束化局部訓練CLT
8.4.2基於CLT的指代消解
8.4.3基於CLT的指代消解實驗驗證
8.4.4CLT的優化
8.4.5基於CLT的指代消解方法與分類方法的比較
第9章用戶滿意度評價及產品屬性績效類型界定
9.1情感詞相似性判定選擇
9.2基於協同過濾推薦算法的用戶對產品情感滿意度排序
9.2.1用戶情感滿意度評價指標體系
9.2.2構建用戶對產品的評分矩陣
9.2.3構建用戶相似集
9.2.4求解用戶情感滿意度推薦排序分值及結論
9.3基於雷達圖法的產品屬性績效類型界定
9.3.1產品績效評價指標體系
9.3.2產品績效評價指標的指標權重
9.3.3基於雷達圖法的產品屬性績效類型的判據界定
9.3.4基於雷達圖指標賦權值的分數值求法
9.3.5產品績效特征類型界定雷達圖
9.4基於灰色評估法的用戶滿意度評價
9.4.1用戶滿意度評測指標體系
9.4.2用戶滿意度的灰色評估模型
9.4.3用戶滿意度的灰色評價仿真運算
9.4.4軟件實現的程序流程
9.4.5求解用戶滿意度評價因素用戶等級結論值
參考文獻
1.1從數據挖掘到觀點挖掘
1.2觀點挖掘的含義及應用
1.3觀點挖掘研究
1.3.1觀點挖掘的不同級別
1.3.2情感詞典及相關問題
1.3.3自然語言處理問題
1.4垃圾觀點檢測
第2章觀點挖掘目標
2.1實體與觀點
2.2觀點挖掘的目標
2.3觀點文摘
2.3.1方面級觀點文摘的特點
2.3.2方面級觀點文摘的改進
2.3.3方面級對比觀點文摘
2.3.4傳統短文本文摘
第3章方面級觀點挖掘方法
3.1方面抽取
3.1.1基於頻率的方法
3.1.2基於關系的方法
3.1.3混合方法
3.1.4監督學習方法
3.1.5主題模型方法
3.2方面分類
3.3方面情感分類
第4章基於CRF的方面級觀點挖掘
4.1挖掘方法
4.1.1准備符號標記與訓練集
4.1.2定義學習函數
4.1.3訓練CRF模型
4.1.4CRF模型的使用
4.2實驗
4.2.1數據集
4.2.2性能評估方法
4.2.3用CRF挖掘中文評論的實驗結果
4.2.4差異顯著性檢驗
4.2.5CRF方法與其他方法挖掘中文評論的比較
第5章主題模型的設計決策
5.1主題因素
5.1.1全局主題與局部主題
5.1.2主題與方面的映射
5.1.3基於約束的方面分類
5.1.4基於需求的方面分類
5.2情感因素
5.2.1情感層
5.2.2情感之間的依賴
5.2.3情感與方面的分離
5.2.4情感先驗信息
5.3相關因素的實現技術
5.3.1主題因素的實現
5.3.2情感因素的實現
5.4相關因素的選取策略
第6章基於TMDP的方面級觀點挖掘
6.1TMDP模型
6.1.1模型參數的物理含義
6.1.2模型表示
6.1.3模型生成過程GP—TMDP
6.1.4參數r的設置
6.2模型參數估計
6.2.1基於collapsed吉布斯抽樣的主題參數估計算法Gibbs—TE
6.2.2基於情感預測的主題一方面映射算法TAMSP
6.2.3基於collapsed吉布斯抽樣的方面一情感分離參數估計算法(;ibbs—ASS
6.3實驗結果及分析
6.3.1數據集
6.3.2主題與方面對應關系的定性分析
6.3.3主題與方面對應關系的定量分析
6.3.4局部主題對方面識別的貢獻
6.3.5觀點詞識別的性能分析
6.3.6觀點詞和方面詞之間關聯的評估
6.3.7特征選擇對方面與情感分離的影響
6.3.8標簽數據尺寸對方面與情感分離的影響
6.3.9不同領域數據集對方面與情感分離的影響
第7章基於TMPP的方面級觀點挖掘
7.1TMPP模型
7.1.1基於短語級參數學習的主題模型演化
7.1.2基於短語級參數學習的主題模型中的參數
7.1.3模型生成過程
7.2模型參數估計
7.2.1AR—PLSI模型參數估計
7.2.2AR—LDA模型的參數估計
7.2.3ARI模型的參數估計
7.3實驗結果及分析
7.3.1數據集
7.3.2方面識別分析
7.3.3等級預測分析
7.3.4模型的適應性分析
第8章基於CRF的實體和方面的指代消解
8.1已有的指代消解方法
8.2針對觀點挖掘環境提出的新特征
8.2.1觀點極性一致性特征
8.2.2實體和方面與觀點詞的關系特征
8.3新特征的實驗分析
8.3.1數據集與特征集
8.3.2基線方法
8.3.3新特征的實驗結果分析
8.4基於CRF的指代消解
8.4.1約束化局部訓練CLT
8.4.2基於CLT的指代消解
8.4.3基於CLT的指代消解實驗驗證
8.4.4CLT的優化
8.4.5基於CLT的指代消解方法與分類方法的比較
第9章用戶滿意度評價及產品屬性績效類型界定
9.1情感詞相似性判定選擇
9.2基於協同過濾推薦算法的用戶對產品情感滿意度排序
9.2.1用戶情感滿意度評價指標體系
9.2.2構建用戶對產品的評分矩陣
9.2.3構建用戶相似集
9.2.4求解用戶情感滿意度推薦排序分值及結論
9.3基於雷達圖法的產品屬性績效類型界定
9.3.1產品績效評價指標體系
9.3.2產品績效評價指標的指標權重
9.3.3基於雷達圖法的產品屬性績效類型的判據界定
9.3.4基於雷達圖指標賦權值的分數值求法
9.3.5產品績效特征類型界定雷達圖
9.4基於灰色評估法的用戶滿意度評價
9.4.1用戶滿意度評測指標體系
9.4.2用戶滿意度的灰色評估模型
9.4.3用戶滿意度的灰色評價仿真運算
9.4.4軟件實現的程序流程
9.4.5求解用戶滿意度評價因素用戶等級結論值
參考文獻
網路書店
類別
折扣
價格
-
新書87折$235