「資料探勘」是將資料轉化為知識的過程,是資料管理、資訊處理領域研究、開發和應用的最活躍的分支之一。本書全面地論述了資料探勘領域的基本概念、基本原理和基本方法,內容包括資料探勘領域的經典理論和趨勢發展。全書共分14章,全面系統性地介紹了資料探勘的概念和過程、資料預先處理技術;深入地敍述了各種資料探勘技術,包括關聯規則、決策樹、群聚分析、基於樣例的學習、貝葉斯學習、粗糙集、神經網路、遺傳演算法、統計分析;並討論了資料探勘的典型應用,例如:分類、文件和Web探勘,以及資料探勘的應用和發展趨勢;並在第14章中提供一個具體的商業智慧解決方案實例。
透過本書的學習,讀者可以對資料探勘的整體結構、概念、原理、技術和發展有深入的瞭解和認識。本書既可作為相關專業的教材,也是資料探勘領域的研究者和開發者必備的參考書。
目錄
第1章 緒 論
1.1 什麼是資料探勘
1.2 為何進行資料探勘
1.3 資料探勘和統計分析的關係
1.4 資料探勘與資料倉儲的關係
1.5 資料探勘系統和其他系統的比較
1.6 資料探勘系統的分類
第2章 資料探勘過程
2.1 問題的定義與主題分析
2.2 準備資料
2.3 建立模型
2.4 模式評估
2.5 資料視覺化和知識管理
第3章 關聯規則
3.1 概述
3.2 關聯規則
3.3 關聯規則學習的Apriori演算法
3.4 探勘關聯規則的多策略方法
第4章 決策樹
4.1 什麼是決策樹
4.2 決策樹的原理
4.3 決策樹的應用
4.4 決策樹的優缺點
第5章 群聚分析
5.1 概述
5.2 基於劃分的群聚演算法
5.3 層次群聚
5.4 孤立點分析
第6章 基於樣例的學習
6.1 概述
6.2 最近鄰演算法
6.3 基於樣例的推理
第7章 貝式學習
7.1 貝式理論
7.2 樸素貝式分類
7.3 貝式信念網路
7.4 貝式分類的應用
第8章 粗糙集
8.1 關於知識的觀點
8.2 粗糙集理論的知識發現
8.3 決策表的定義
8.4 資料離散化
8.5 決策規則的獲取
8.6 粗糙集的化簡
第9章 神經網路
9.1 什麼是神經網路
9.2 神經網路的表示和學習
9.2.4 神經網路的學習
9.3 多層前饋神經網路
9.4 反饋式神經網路
9.5 神經網路的應用之一──群聚
第10章 遺傳演算法
10.1 遺傳演算法概述
10.2 基本遺傳演算法
10.3 遺傳演算法的實現技術
10.4 遺傳演算法的理論分析
10.5 遺傳演算法的應用實例
第11章 統計分析
11.1 樣本和統計推理
11.2 迴歸分析
11.3 主成分分析
第12章 文件和Web探勘
12.1 概論
12.2 文件探勘技術
12.3 Web資料探勘技術
12.4 文件和Web探勘的應用
第13章 資料探勘的應用和發展趨勢
13.1 空間資料探勘
13.2 圖像檢索和探勘
13.3 時間序列和序列檢索
13.4 隱私面臨的挑戰
第14章 商業智慧解決方案實例分析
14.1 商業智慧概述
14.2 商業智慧系統的處理流程和框架
14.3 商業智慧解決方案
附錄A IBM DB2 Intelligent Miner簡介
A.1 DB2 Intelligent Miner功能簡介
A.2 DB2 Intelligent Miner for Data使用簡介
A.3 建立模型
A.4 模型應用
A.5 建立統計函數
A.6 解釋探勘結果
參考文獻
1.1 什麼是資料探勘
1.2 為何進行資料探勘
1.3 資料探勘和統計分析的關係
1.4 資料探勘與資料倉儲的關係
1.5 資料探勘系統和其他系統的比較
1.6 資料探勘系統的分類
第2章 資料探勘過程
2.1 問題的定義與主題分析
2.2 準備資料
2.3 建立模型
2.4 模式評估
2.5 資料視覺化和知識管理
第3章 關聯規則
3.1 概述
3.2 關聯規則
3.3 關聯規則學習的Apriori演算法
3.4 探勘關聯規則的多策略方法
第4章 決策樹
4.1 什麼是決策樹
4.2 決策樹的原理
4.3 決策樹的應用
4.4 決策樹的優缺點
第5章 群聚分析
5.1 概述
5.2 基於劃分的群聚演算法
5.3 層次群聚
5.4 孤立點分析
第6章 基於樣例的學習
6.1 概述
6.2 最近鄰演算法
6.3 基於樣例的推理
第7章 貝式學習
7.1 貝式理論
7.2 樸素貝式分類
7.3 貝式信念網路
7.4 貝式分類的應用
第8章 粗糙集
8.1 關於知識的觀點
8.2 粗糙集理論的知識發現
8.3 決策表的定義
8.4 資料離散化
8.5 決策規則的獲取
8.6 粗糙集的化簡
第9章 神經網路
9.1 什麼是神經網路
9.2 神經網路的表示和學習
9.2.4 神經網路的學習
9.3 多層前饋神經網路
9.4 反饋式神經網路
9.5 神經網路的應用之一──群聚
第10章 遺傳演算法
10.1 遺傳演算法概述
10.2 基本遺傳演算法
10.3 遺傳演算法的實現技術
10.4 遺傳演算法的理論分析
10.5 遺傳演算法的應用實例
第11章 統計分析
11.1 樣本和統計推理
11.2 迴歸分析
11.3 主成分分析
第12章 文件和Web探勘
12.1 概論
12.2 文件探勘技術
12.3 Web資料探勘技術
12.4 文件和Web探勘的應用
第13章 資料探勘的應用和發展趨勢
13.1 空間資料探勘
13.2 圖像檢索和探勘
13.3 時間序列和序列檢索
13.4 隱私面臨的挑戰
第14章 商業智慧解決方案實例分析
14.1 商業智慧概述
14.2 商業智慧系統的處理流程和框架
14.3 商業智慧解決方案
附錄A IBM DB2 Intelligent Miner簡介
A.1 DB2 Intelligent Miner功能簡介
A.2 DB2 Intelligent Miner for Data使用簡介
A.3 建立模型
A.4 模型應用
A.5 建立統計函數
A.6 解釋探勘結果
參考文獻
序
序
隨著電腦應用的普及,尤其是三十年來資料庫技術的廣泛使用,以及近十年來網際網路應用的不斷深入,業務資料量急劇增長。事實上,每兩、三年資料量就會加倍。不幸的是,根據最近的調查,93%以上的資料在進入業務系統以後,從未得到使用。
在資訊爆炸的年代,更多的資訊意味著更多的競爭。隨著全球化競爭的加劇,企業比任何時候都需要更快更好地做出決策。在某種程度上,資料就是企業最寶貴的資源;資訊的決策能力就是企業的核心競爭力。然而對於任何組織或個人來說,大量未能利用的資料並不是財富,而是沉重的負擔。
面對大量的資料,我們往往無所適從,無法發現資料中存在的關係和規則,無法根據現有的資料去預測未來的發展趨勢,導致「我們淹沒在資料的海洋中,卻缺乏知識」的現象。我們希望運用資料探勘技術,從這些資料當中探勘出知識來。大量資料的背後隱藏了很多具有決策意義的資訊,透過對大量資料的分析,來發現資料之間的潛在聯繫,為人們提供自動決策支援。資料探勘,顧名思義就是從大量的資料中探勘出有用的資訊,即從大量的、不完全的、有雜訊的、模糊的、隨機的實際應用資料中,發現隱含的、規律性的、人們事先未知的,但又是潛在有用的,並且最終可理解的資訊與知識的非平凡過程。
資料探勘是一門綜合學科,融合了資料庫、人工智慧、機器學習、統計學等多個領域的理論和技術。資料探勘利用各種分析工具在大量資料中發現模型和資料間關係的過程,使用這些模型和關係可以進行預測,它能幫助決策者尋找資料間潛在的關聯,發現被忽略的因素,因而被認為是解決當今所面臨的資料爆炸,且資訊貧乏問題的一種有效方法。
資料探勘將資料轉化為知識,是資料管理、資訊處理領域研究、開發和應用的最活躍的分支之一。本書詳細地論述了資料探勘領域的基本概念、基本原理和基本方法,內容包括資料探勘領域的經典理論和趨勢發展。全書共分14章,並含有1個附錄,完整地介紹了資料探勘的概念和過程、資料預先處理技術;深入地敘述了各種資料探勘技術,包括關聯規則、決策樹、群聚分析、基於樣例的學習、貝葉斯學習、粗糙集、神經網路、遺傳演算法、統計分析;並討論了資料探勘的典型應用,例如:分類、文件和Web探勘,以及資料探勘的應用和發展趨勢。並在第14章中指出了一個具體的商業智慧解決方案實例。藉由本書的學習,讀者可以對資料探勘的整體結構、概念、原理、技術和發展有深入的瞭解和認識。
本書作者多年來從事相關領域的理論研究和軟體實務,並在最近兩年為研究生講授了資料探勘課程,本書正是基於這些理念而出版的。在作者的研究工作及本書的撰寫過程中,許多專家提出了中肯的建議和熱誠的幫助,在此表示衷心的感謝。
資料探勘是一個迅速發展的研究領域,不斷有新內容、新方法、新技術等湧現,書中的不當之處在所難免,敬請專家和讀者朋友指正。您的任何建議和批評都是我們極為寶貴的財富。
隨著電腦應用的普及,尤其是三十年來資料庫技術的廣泛使用,以及近十年來網際網路應用的不斷深入,業務資料量急劇增長。事實上,每兩、三年資料量就會加倍。不幸的是,根據最近的調查,93%以上的資料在進入業務系統以後,從未得到使用。
在資訊爆炸的年代,更多的資訊意味著更多的競爭。隨著全球化競爭的加劇,企業比任何時候都需要更快更好地做出決策。在某種程度上,資料就是企業最寶貴的資源;資訊的決策能力就是企業的核心競爭力。然而對於任何組織或個人來說,大量未能利用的資料並不是財富,而是沉重的負擔。
面對大量的資料,我們往往無所適從,無法發現資料中存在的關係和規則,無法根據現有的資料去預測未來的發展趨勢,導致「我們淹沒在資料的海洋中,卻缺乏知識」的現象。我們希望運用資料探勘技術,從這些資料當中探勘出知識來。大量資料的背後隱藏了很多具有決策意義的資訊,透過對大量資料的分析,來發現資料之間的潛在聯繫,為人們提供自動決策支援。資料探勘,顧名思義就是從大量的資料中探勘出有用的資訊,即從大量的、不完全的、有雜訊的、模糊的、隨機的實際應用資料中,發現隱含的、規律性的、人們事先未知的,但又是潛在有用的,並且最終可理解的資訊與知識的非平凡過程。
資料探勘是一門綜合學科,融合了資料庫、人工智慧、機器學習、統計學等多個領域的理論和技術。資料探勘利用各種分析工具在大量資料中發現模型和資料間關係的過程,使用這些模型和關係可以進行預測,它能幫助決策者尋找資料間潛在的關聯,發現被忽略的因素,因而被認為是解決當今所面臨的資料爆炸,且資訊貧乏問題的一種有效方法。
資料探勘將資料轉化為知識,是資料管理、資訊處理領域研究、開發和應用的最活躍的分支之一。本書詳細地論述了資料探勘領域的基本概念、基本原理和基本方法,內容包括資料探勘領域的經典理論和趨勢發展。全書共分14章,並含有1個附錄,完整地介紹了資料探勘的概念和過程、資料預先處理技術;深入地敘述了各種資料探勘技術,包括關聯規則、決策樹、群聚分析、基於樣例的學習、貝葉斯學習、粗糙集、神經網路、遺傳演算法、統計分析;並討論了資料探勘的典型應用,例如:分類、文件和Web探勘,以及資料探勘的應用和發展趨勢。並在第14章中指出了一個具體的商業智慧解決方案實例。藉由本書的學習,讀者可以對資料探勘的整體結構、概念、原理、技術和發展有深入的瞭解和認識。
本書作者多年來從事相關領域的理論研究和軟體實務,並在最近兩年為研究生講授了資料探勘課程,本書正是基於這些理念而出版的。在作者的研究工作及本書的撰寫過程中,許多專家提出了中肯的建議和熱誠的幫助,在此表示衷心的感謝。
資料探勘是一個迅速發展的研究領域,不斷有新內容、新方法、新技術等湧現,書中的不當之處在所難免,敬請專家和讀者朋友指正。您的任何建議和批評都是我們極為寶貴的財富。
網路書店
類別
折扣
價格
-
新書9折$405
-
新書9折$405
-
新書9折$405
-
新書95折$428
-
新書$450