會coding並不代表會建模!
你是否曾經有以下問題:
「如何評估模型的適用性?」
「有人說模型參數越多越不好?」
「各種模型的差異以及特色是什麼?」
「有人說模型好壞不能只看預測精確率?」
「要選哪一種模型比較適合手上的資料?」
這本書,將帶你釐清以上所有疑惑,以及你心中更多問不出來的問題!
市面上有很多優質的書籍,可以將建模工具(如:TensorFlow、Keras、PyTorch
等框架)鉅細靡遺地操作一遍;或是涵蓋許多數學、統計學的學理面,完美展現漂亮的數學式。但仍舊會讓人有隔靴搔癢、似懂非懂的感覺。再加上資料科學應用在不同領域,如工程學、物理學、化學、生物學、生態學、哲學、或是經濟學,產生大量令人混淆的知識、名詞。因此,過去那種單點突破式的學習歷程,已經不足以應付當代資料科學家的養成。
想要在這混亂的資料科學領域裡脫穎而出,關鍵就在於你需要有見樹也見林的通盤觀念:以「模型」為中心,將相關的數學、統計知識環繞在這個中心,做一個通盤的介紹;接著,以俯視的角度,來抓住各領域常用模型之間的關聯,並說明許多技術本質上是殊途同歸;最後,我們即可探討現實中不同問題的分析方式,以及實務上建模需要注意的事情。
本書將會講解與模型相關的機率、統計、微分方程、自我迴歸、狀態空間、馬可夫鏈等觀念;並且比較隨機森林、支援向量機(SVM)、神經網路、深度學習、自編碼器、強化式學習、多體系統等各種不同模型的優劣;最後討論貝氏推論、最大後驗估計、費雪三原則、訊息準則、概似比檢驗等如何應用在實際建模的過程。
中文版提供免費Python程式下載,讓讀者可以實際演練書中的範例,加深對知識的理解。
本書用宏觀的角度,來解述資料分析數學模型,讓你徹底了解資料分析過程中,不可或缺的「數學模型」。有了這本書,你將會掌握當代數學模型的基本精神,讓你在未來的研究或工作上,可以更順利。
本書特色
● 改變傳統一直寫程式的教學,帶你回到資料科學最根本的觀念
● 俯視資料科學的各種技術,掌握模型的特性跟陷阱
● 底線標示重要觀念,粗體標示重要名詞,註解提供讀者延伸資訊
● 滿滿全彩圖說,每章結束附有重點整理,中文版附贈範例程式
好評推薦 (依姓名筆劃順序排列)
東京大學教授 西成活裕 推薦
國立高雄科技大學副教授 連志原 推薦
教育部國家講座教授/臺大講座教授/曾任臺大教務長 郭鴻基 推薦
國立臺灣大學名譽教授 謝南瑞 推薦