最夯的 Python 套件解說 ✕ 最夯的資料科學、機器學習技術,
本書帶您一次學會!
Python 是近來最熱門的程式語言, 也是資料科學、機器學習實作時的首選語言。Python 之所以在這些領域大放異彩, 就是仰賴了各種功能強大的第三方套件, 不過套件百百款, 該從哪些下手呢?很簡單, 很少用到的先不用花太多時間, 我們挑常用、關鍵的先學好!本書為有志於學習資料科學、機器學習的初學者, 嚴選出
NumPy、Pandas、Matplotlib、OpenCV、scikit-learn、tf.Keras 等最強套件, 絕對是初學者必須好好掌握的!
NumPy 數值運算套件可以做資料高速運算, 許多套件也都是以 NumPy 為基礎建構而成, 經常得跟 NumPy 搭配使用, 一定要紮穩這個重要基石;
在面對龐大的資料時, 使用 Pandas、Matplotlib 可以輕鬆做資料整理, 並藉由繪圖獲取重要資訊, 是資料科學實作的強大利器;
OpenCV 是電腦視覺 (Computer Vision) 領域響叮噹的套件, 不管是裁切、縮放、輪廓偵測、過濾影像以強化資訊...各種影像處理功能一應俱全, 是影像辨識、機器學習做資料擴增的最強助手;
最後, 我們將帶您一窺 scikit-learn、tf.Keras 這兩個重量級套件如何在機器學習、深度學習領域中發揮關鍵性的作用, 我們會實際操演如何利用它們做資料預處理 (Preprocessing)、建構 KNN / SVM / 邏輯斯迴歸 (Logistic regression) / 決策樹 (Decision tree) / 隨機森林 (Random
forest)…等監督式學習分類模型;以及建立 DNN、CNN 等影像辨識神經網路 (Neural network)。
看了本書之後, 你將深刻體會到各套件的強大之處, 利用短短幾行程式碼, 竟然瞬間完成許多運算、建模工作。不過各套件的函式、參數設定可不像網路文章寫的這麼單純, 當中有許多設定「眉角」需要特別注意, 為此, 小編都經過逐一詳測, 針對可能遇到的問題添加大量註解, 幫助讀者更加理解內容!
本書特色
□資料科學熱門套件解說
‧紮穩 NumPy 重要基礎:axis、dimention、陣列切片、各種高速運算函式
‧Pandas 資料分析技巧:資料清理、缺失值處理、快速取得各種統計數據
‧Matplotlib 資料視覺化:繪製 2D / 3D 圖 / 子圖、比較資料的分布狀況
‧OpenCV 影像處理:影像裁切 / 縮放 / 翻轉...做資料擴增, 二值化 (binarization) / 降雜訊...強化重要影像資訊
□最紮實的機器學習、深度學習實戰
‧機器學習的資料預處理 (Data preprocessing)
‧快速建構 KNN / SVM / 邏輯斯迴歸 (Logistic regression) / 決策樹 (Decision tree) / 隨機森林 (Random forest)...監督式學習分類模型
‧建立 DNN、CNN 影像辨識神經網路 (Neural network)
‧建模完只是第一步!各模型超參數 (Hyperparameter) 調整心法大公開!
□本書由【施威銘研究室監修】, 書中針對原書進行大量補充, 並適當添加註解, 幫助讀者更加理解內容!