• 雲端運算是基於網際網路的運算方式,它通過網際網路為個人使用者或企業使用者提供按需即取的服務。隨著電腦技術的發展,資料的存儲量成倍的增長,Data Mining 技術在“資料海洋、知識荒漠”的背景下應運而生的,並且一經出現就得到各個領域的重視。隨著Data Mining 的逐漸成熟,以Data Mining 為核心的Business
Intelligence(BI)已經成為了IT 和其他行業中的必爭之地同時伴隨著Big Data 的熱潮使得海量資料分析變成月來越重要的一個研究方向。雲端運算可以實現使用端通過線上上傳資料或購買資料,通過雲資料倉庫服務,進行資料倉庫建模和資料抽取,線上支付使用Data Mining 工具和Business Intelligence 相關分析處理軟體。Data Mining
和Business Intelligence 的原理相似,均由資料提供資訊、產生知識,再由知識累積智慧。而雲端運算可以使這個過程在網際網路上得以實現。也就是說雲端運算可以提供基於SaaS 的知識與智慧分析的服務(Information &Intelligence as a Service),簡稱IIaaS,它是SaaS 的延伸。
• 基於此利基MS Office Excel 變成為數據分析最方便有用及功能強大的軟體(全世界約有10 億人口會使用EXCEL) MS Office Excel 2013 結合SQL Server 2012 -2014支援解決大數據(BIG DATA)資料工作表(Work Sheet),並可以同時存儲大量變數的資料。為能有效提升Excel 2013
使用者資料處理和分析的能力,微軟公司提供了一個免費的資料採礦模組。通過調用該模組,Excel 2013 使用者可以方便快速的完成以往只有使用專業資料採礦軟體才能完成的任務。同時亦提供可視化的模組及動態分析模組(Power BI)使得海量數據的分析變得輕鬆又有趣。
• 本書的第一部分詳細敘述資料採礦的一般概念、通行規範、方法技術、以及軟體應用等。使讀者獲得一個較為清晰和正確的資料採礦觀念。本書的第二部分圍繞Excel 2013 的資料採礦模組,通過大量操作示範,詳細講述了Excel 2013 資料採礦模組的九大模型的使用。這些模型包括決策樹、貝氏機率分類、關聯規則、群集分析、時序群集、線性回歸、Logistic
回歸、類神經網路和時間序列分析。基本含蓋了主要的資料採礦方法。第三部分介紹了Excel 2013 的表格工具。結合第二部分所介紹的資料採礦方法,使用改進過的Excel
表格工具,可以很方便的進行圖形化的分析。這些分析方法在第三部分都有詳細的介紹。第四部分是資料採礦的實例。包含了銀行業、電信業、行銷企業及臺灣創新產業。通過詳細的操作講解和結果解釋,讀者可以獲得實際的資料採礦經驗,並能迅速在自己所處的領域中加以應用。這是一本實用的書,邁向 BIG DATA 領域的開門書,才疏學淺書中錯誤及不周之處請大家海涵並不吝指正。
作者介紹
作者簡介
謝邦昌 教授
學歷:
國立台灣大學生物統計學博士
現任:
台北醫學大學管理學院院長、大數據研究中心主任、中華資料採礦協會榮譽理事長
主要經歷:
•九十三年特種考試地方政府公務人員考試典試委員
•中國統計學社民意測驗召集委員、國際統計委員、統計教育委員
•統計服務委員、財務委員、統計獎學金委員(第三十一屆)
•輔仁大學統計資訊學系教授
•中國統計學社理事、民意測驗委員會召集人(1994~迄今)
•中華民國民意測驗協會理事(1995~迄今)
•內政部統計委員會委員(1995~迄今)
•國家科學委員會企劃考核處統計顧問(1996~迄今)
•行政院主計處統計委員會兼任研究員(1997~迄今)
•全國意向顧問研究中心榮譽顧問(1998~迄今)
•東森電視台顧問
•中華民國全國商業總會諮詢委員
•榮民總醫院 名譽顧問
•國家政策研究基金會 財政金融組顧問
•中國大陸國家統計局教材編審委員
•中國人民大學統計學系客座教授
•中國人民大學統計學系Data Mining中心客座教授
•中國人民大學應用統計研究中心教授
•中國人民大學統計調查研究中心顧問兼客座教授
•廈門大學計劃統計學系客座教授
•上海財經大學統計學系客座教授
•西安統計學院特聘研究員
•Journal Of Data Science 執行編輯
經歷:
•輔仁大學統計系教授兼系主任(1995~2000)
•輔仁大學管理學院院務發展委員(1996~1997)
•輔仁大學中西文化中心兼任研究員(1994~1996)
•輔仁管理評論編輯委員(1994~1997)
•TVBS民意調查中心榮譽顧問(1996~1998)
•東森電視台民意調查中心榮譽顧問(1999~2000)
•東森電視台市場及民意調查中心榮譽顧問(1999~2003)
•臺灣大學生物統計研究室兼任教授(1992~2003)
•輔仁大學總務長 (2003~2005)
•輔仁大學進修成長學院院長(2004~2005)
鄭宇庭
學歷:
美國明尼蘇達大學 統計學 博士
現職:
國立政治大學統計學系 副教授
主要經歷:
•國立政治大學統計學系副教授 (2002-迄今)
•國立政治大學資料採礦中心主任 (2007-迄今)
•國立政治大學統計學系助理教授 (1997-2002)
•國立政治大學商學院民意與市場調查中心主任 (2014-迄今)
•美國精算學會副精算師 (1995-迄今)
•國立政治大學選舉研究中心兼任委員 (1998-迄今)
•尼爾森電視收視率調查監督委員 (1998-2001)
•基隆市政府民意調查審議小組委員 (1998-1999)
•中國統計學社民意測驗及統計教育委員 (1999-2003)
•中華資料採礦協會常務理事 (2001-迄今)
•司法院資料採礦研討會委員 (2003-2004)
•中華市場研究協會常務理事 (2008-2012)
•中華市場研究協會副理事長 (2013-迄今)
謝邦昌 教授
學歷:
國立台灣大學生物統計學博士
現任:
台北醫學大學管理學院院長、大數據研究中心主任、中華資料採礦協會榮譽理事長
主要經歷:
•九十三年特種考試地方政府公務人員考試典試委員
•中國統計學社民意測驗召集委員、國際統計委員、統計教育委員
•統計服務委員、財務委員、統計獎學金委員(第三十一屆)
•輔仁大學統計資訊學系教授
•中國統計學社理事、民意測驗委員會召集人(1994~迄今)
•中華民國民意測驗協會理事(1995~迄今)
•內政部統計委員會委員(1995~迄今)
•國家科學委員會企劃考核處統計顧問(1996~迄今)
•行政院主計處統計委員會兼任研究員(1997~迄今)
•全國意向顧問研究中心榮譽顧問(1998~迄今)
•東森電視台顧問
•中華民國全國商業總會諮詢委員
•榮民總醫院 名譽顧問
•國家政策研究基金會 財政金融組顧問
•中國大陸國家統計局教材編審委員
•中國人民大學統計學系客座教授
•中國人民大學統計學系Data Mining中心客座教授
•中國人民大學應用統計研究中心教授
•中國人民大學統計調查研究中心顧問兼客座教授
•廈門大學計劃統計學系客座教授
•上海財經大學統計學系客座教授
•西安統計學院特聘研究員
•Journal Of Data Science 執行編輯
經歷:
•輔仁大學統計系教授兼系主任(1995~2000)
•輔仁大學管理學院院務發展委員(1996~1997)
•輔仁大學中西文化中心兼任研究員(1994~1996)
•輔仁管理評論編輯委員(1994~1997)
•TVBS民意調查中心榮譽顧問(1996~1998)
•東森電視台民意調查中心榮譽顧問(1999~2000)
•東森電視台市場及民意調查中心榮譽顧問(1999~2003)
•臺灣大學生物統計研究室兼任教授(1992~2003)
•輔仁大學總務長 (2003~2005)
•輔仁大學進修成長學院院長(2004~2005)
鄭宇庭
學歷:
美國明尼蘇達大學 統計學 博士
現職:
國立政治大學統計學系 副教授
主要經歷:
•國立政治大學統計學系副教授 (2002-迄今)
•國立政治大學資料採礦中心主任 (2007-迄今)
•國立政治大學統計學系助理教授 (1997-2002)
•國立政治大學商學院民意與市場調查中心主任 (2014-迄今)
•美國精算學會副精算師 (1995-迄今)
•國立政治大學選舉研究中心兼任委員 (1998-迄今)
•尼爾森電視收視率調查監督委員 (1998-2001)
•基隆市政府民意調查審議小組委員 (1998-1999)
•中國統計學社民意測驗及統計教育委員 (1999-2003)
•中華資料採礦協會常務理事 (2001-迄今)
•司法院資料採礦研討會委員 (2003-2004)
•中華市場研究協會常務理事 (2008-2012)
•中華市場研究協會副理事長 (2013-迄今)
目錄
Part I Data Mining演算法介紹
第0章 前言
•0-1 何謂Big data
•0-2 Big data實例
•0-3 SQL Server 2014簡介
第1章 資料採礦簡介
•1-1 資料採礦定義
•1-2 資料採礦重要性
•1-3 資料採礦功能
•1-4 資料採礦步驟
•1-5 資料採礦建模的標準CRISP-DM
第2章 資料採礦運用理論及技術
•2-1 迴歸分析
•2-2 關聯法則
•2-3 集群分析
•2-4 判別分析
•2-5 類神經網路分析
•2-6 決策樹分析
•2-7 其他分析方法
第3章 資料採礦與其他相關領域的關係
•3-1 資料採礦與統計分析的不同
•3-2 資料採礦與資料倉儲的關係
•3-3 KDD與資料採礦的關係
•3-4 OLAP與資料採礦的關係
•3-5 資料採礦與機器學習的關係
•3-6 Web Mining和Data Mining有什麼不同?
第4章 資料採礦商業軟體產品及其應用現狀
•4-1 資料採礦商業軟體的分類
•4-2 主要軟體的介紹
•4-3 顧客關係管理(CRM)
•4-4 資料採礦的行業應用
Part II Excel 2013資料採礦模組介紹
第5章 安裝與設定資料採礦增益集
•5-1 系統需求
•5-2 開始安裝
•5-3 完成安裝檢核
•5-4 組態設定
•5-5 組態完成檢核
第6章 Excel 2013資料採礦入門
•6-1 Excel 2013資料採礦功能介紹
•6-2 資料採礦使用說明
•6-3 資料採礦連接設定
•6-4 資料準備
•6-5 資料模型化
•6-6 精確度和驗證
•6-7 模型使用方式
•6-8 模型管理
第7章 決策樹
•7-1 基本概念
•7-2 決策樹模組的建置
•7-3 決策樹與判別函數比較
•7-4 計算方法
•7-5 Excel操作步驟
第8章 貝氏機率分類
•8-1 基本概念
•8-2 Excel操作步驟
第9章 關聯規則
•9-1 基本概念
•9-2 關聯規則的種類
•9-3 Apriori演算法
•9-4 Excel操作步驟
第10章 群集分析
•10-1 基本概念
•10-2 階層式群集分析
•10-3 群集分析原理
•10-4 Excel 操作步驟
第11章 時序集群
•11-1 基本概念
•11-2 相關研究和演算法
•11-3 Excel操作步驟
第12章 線性迴歸
•12-1 基本概念
•12-2 簡單迴歸分析
•12-3 複迴歸分析
•12-4 Excel操作步驟
第13章 羅吉斯迴歸
•13-1 基本概念
•13-2 logit變換
•13-3 logistic分佈
•13-4 列聯表的logistic迴歸模型
•13-5 Excel操作步驟
第14章 類神經網路
•14-1 基本概念
•14-2 類神經網路的特性
•14-3 神經網路的架構與訓練演算法
•14-4 類神經網路應用
•14-5 類神經網路優缺點
•14-6 Excel操作步驟
第15章 時間序列
•15-1 基本概念
•15-2 時間序列的成份
•15-3 時間序列資料的圖形介紹
•15-4 利用修勻法預測
•15-5 用趨勢投射預測時間序列
•15-6 預測含趨勢與季節成份的時間序列
•15-7 利用迴歸模型預測時間序列
•15-8 其他預測模式
•15-9 單變量時間序列預測模式
•15-10 時間趨勢預測模式
•15-11 Excel操作步驟
第16章 DMX(Data Mining Extension)介紹
•16-1 DMX介紹
•16-2 DMX函數介紹
•16-3 DMX資料採礦語法
•16-4 DMX應用範例
Part III Excel 2013表格工具介紹
第17章 其他分析方法
•17-1 分析關鍵影響因數
•17-2 偵測類別目錄
•17-3 加入遺漏值
•17-4 預測
•17-5 反白顯示例外狀況
•17-6 狀況分析
•17-7 假設
第18章 Excel 2013 Power BI
•18-1 Power BI
•18-2 Power Query
•18-3 Power Pivot
•18-4 Power View
•18-5 Power Map
Part IV 資料採礦範例
第19章 應用CRISP-DM在各產業建立資料採礦模型
•19-1 Data Mining建立信用卡使用者信用評測的採礦模型
•19-2 Data Mining在電信業的應用案例
•19-3 Data Mining在市場行銷的應用案例
•19-4 Data Mining在臺灣產業創新概況調查案例
第0章 前言
•0-1 何謂Big data
•0-2 Big data實例
•0-3 SQL Server 2014簡介
第1章 資料採礦簡介
•1-1 資料採礦定義
•1-2 資料採礦重要性
•1-3 資料採礦功能
•1-4 資料採礦步驟
•1-5 資料採礦建模的標準CRISP-DM
第2章 資料採礦運用理論及技術
•2-1 迴歸分析
•2-2 關聯法則
•2-3 集群分析
•2-4 判別分析
•2-5 類神經網路分析
•2-6 決策樹分析
•2-7 其他分析方法
第3章 資料採礦與其他相關領域的關係
•3-1 資料採礦與統計分析的不同
•3-2 資料採礦與資料倉儲的關係
•3-3 KDD與資料採礦的關係
•3-4 OLAP與資料採礦的關係
•3-5 資料採礦與機器學習的關係
•3-6 Web Mining和Data Mining有什麼不同?
第4章 資料採礦商業軟體產品及其應用現狀
•4-1 資料採礦商業軟體的分類
•4-2 主要軟體的介紹
•4-3 顧客關係管理(CRM)
•4-4 資料採礦的行業應用
Part II Excel 2013資料採礦模組介紹
第5章 安裝與設定資料採礦增益集
•5-1 系統需求
•5-2 開始安裝
•5-3 完成安裝檢核
•5-4 組態設定
•5-5 組態完成檢核
第6章 Excel 2013資料採礦入門
•6-1 Excel 2013資料採礦功能介紹
•6-2 資料採礦使用說明
•6-3 資料採礦連接設定
•6-4 資料準備
•6-5 資料模型化
•6-6 精確度和驗證
•6-7 模型使用方式
•6-8 模型管理
第7章 決策樹
•7-1 基本概念
•7-2 決策樹模組的建置
•7-3 決策樹與判別函數比較
•7-4 計算方法
•7-5 Excel操作步驟
第8章 貝氏機率分類
•8-1 基本概念
•8-2 Excel操作步驟
第9章 關聯規則
•9-1 基本概念
•9-2 關聯規則的種類
•9-3 Apriori演算法
•9-4 Excel操作步驟
第10章 群集分析
•10-1 基本概念
•10-2 階層式群集分析
•10-3 群集分析原理
•10-4 Excel 操作步驟
第11章 時序集群
•11-1 基本概念
•11-2 相關研究和演算法
•11-3 Excel操作步驟
第12章 線性迴歸
•12-1 基本概念
•12-2 簡單迴歸分析
•12-3 複迴歸分析
•12-4 Excel操作步驟
第13章 羅吉斯迴歸
•13-1 基本概念
•13-2 logit變換
•13-3 logistic分佈
•13-4 列聯表的logistic迴歸模型
•13-5 Excel操作步驟
第14章 類神經網路
•14-1 基本概念
•14-2 類神經網路的特性
•14-3 神經網路的架構與訓練演算法
•14-4 類神經網路應用
•14-5 類神經網路優缺點
•14-6 Excel操作步驟
第15章 時間序列
•15-1 基本概念
•15-2 時間序列的成份
•15-3 時間序列資料的圖形介紹
•15-4 利用修勻法預測
•15-5 用趨勢投射預測時間序列
•15-6 預測含趨勢與季節成份的時間序列
•15-7 利用迴歸模型預測時間序列
•15-8 其他預測模式
•15-9 單變量時間序列預測模式
•15-10 時間趨勢預測模式
•15-11 Excel操作步驟
第16章 DMX(Data Mining Extension)介紹
•16-1 DMX介紹
•16-2 DMX函數介紹
•16-3 DMX資料採礦語法
•16-4 DMX應用範例
Part III Excel 2013表格工具介紹
第17章 其他分析方法
•17-1 分析關鍵影響因數
•17-2 偵測類別目錄
•17-3 加入遺漏值
•17-4 預測
•17-5 反白顯示例外狀況
•17-6 狀況分析
•17-7 假設
第18章 Excel 2013 Power BI
•18-1 Power BI
•18-2 Power Query
•18-3 Power Pivot
•18-4 Power View
•18-5 Power Map
Part IV 資料採礦範例
第19章 應用CRISP-DM在各產業建立資料採礦模型
•19-1 Data Mining建立信用卡使用者信用評測的採礦模型
•19-2 Data Mining在電信業的應用案例
•19-3 Data Mining在市場行銷的應用案例
•19-4 Data Mining在臺灣產業創新概況調查案例
網路書店
類別
折扣
價格
-
新書78折$540
-
新書95折$655