從無標籤資料應用機器學習解決方案
“研究人員、工程師與學生將會喜歡這本書,因為本書充滿務實的非監督式學習技術,採用平鋪直述的方式,以及囊括了可快速練習的Python範例。” –Sarah Nagy Senior Data Scientist at Edison
許多專家認為非監督式學習是人工智慧的下一個前沿技術,並且是邁向強人工智慧的關鍵。由於世界上大多數資料都沒有標籤,因此無法應用傳統的監督式學習。從另一方面來說,非監督式學習則可以應用在無標籤的資料集,用以發現埋藏在資料深處裡有意義的樣式,而這些樣式幾乎不可能被人類發現。
作者Ankur
Patel藉由使用兩個簡單且已經可實際運用於業務開發(production-ready)的Python框架:Scikit-learn和Keras來示範如何應用非監督式學習。透過程式碼和實際操作範例,數據科學家將從資料中識別難以發現的樣式,獲得更深入的商業洞見、檢測異常、執行自動特徵工程和特徵選擇,以及生成合成資料集。你所需要的只是程式能力和一些機器學習經驗。
‧比較不同機器學習方法的優點和缺點:監督、非監督和強化學習
‧完整地設置和管理機器學習項目
‧為信用卡詐欺建立偵測系統
‧按照相同與不相同將使用者進行分群
‧實作半監督式學習
‧使用受限玻爾茲曼機(restricted Boltzmann machine, RBM)開發電影推薦系統
‧使用生成對抗網路建立合成影像