隨機的世界：大數據時代的機率統計學

定價：~~320~~ 元

NT $ 253 ~ 304

作者：李帥
出版社：清文華泉事業有限公司
出版日期：2020-04-10
語言：繁體中文
ISBN10：9869885721
ISBN13：9789869885720
裝訂：平裝 / 224頁 / 17 x 23 x 1.12 cm / 普通級 / 單色印刷 / 初版

內容簡介

　　巴菲特曾說：「我寧要模糊的正確，也不要精確的錯誤。」
　　連氣象預報都不能相信，這世界上還有什麼是百分之百確定的？
　　全球貓奴磨刀霍霍向薛丁格，怒吼著接受制裁吧！
　　薛丁格表示任君處置──如果你能證明貓真的被毒死的話！
　　致敬「球神」Kobe的殞落，球迷獻花、演講哀悼，
　　透過計算頻率、平均數和中位數，黑曼巴之魂在統計學中永恆不滅！
　　談到世界上最神奇的常數，你大概會說：有位捲捲頭裸男站在圓圈裡──
　　黃金比例已經成為一種套路，但我要說的是常數e！
　　從前，有一個宋國農夫，撿到一隻撞樹的死兔子──大家都聽膩了我知道
　　但孟子寫完故事只感嘆宋國人很笨，他卻不知道等到兔子的機率有37％！
　　數據會說話，但說的到底是真話還是假話？
　　每年公布平均薪資時，總是有民眾抗議「根本不準」！
　　──這數字確實有問題，所以沒達標別氣餒，超過也不代表你已躋身上流社會！
　　Google剛推出「流感趨勢」的工具時，神準媲美章魚哥
　　人們天真的以為靠蘋果就能遠離醫生了──
　　後來季節性流感在美國大爆發，你要蘋果還是要口罩？
　　後悔高中沒好好上數學課嗎？《隨機的世界》這就幫你補足人生遺憾！
　　本書拋棄死板的數學定義，挑選經典而貼近日常的實例，讓讀者在看故事的同時也能破除數字迷思！
　　說簡單到「老嫗能解」就有點太浮誇了，
　　但能百分之百確定的是：絕對比高中數學課本有趣Ｎ倍！

作者介紹

作者簡介

李帥

　　大學和碩士均就讀電子工程系，現就職於某網路技術研究所，任網路工程師。碩士和工作期間曾參與雲端運算、大數據、網路流量分析等多個科學研究項目，在雲端運算和資料分析等技術領域富有一定經驗，與妻子曾共同翻譯英文科普讀物《讓你愛上數學的50個遊戲》等書，著有《世界是隨機的：大數據時代的機率統計學》。

前言

第一章機率
1.1 生還是死：這是一個機率問題
1.2 隨機事件：翻飛的硬幣
1.3 條件機率：門後的老山羊與豪車
1.4 獨立事件：反覆拋起的硬幣
1.5 全機率公式：英超冠軍爭奪戰

第二章隨機變量
2.1 隨機變量：骰子遊戲
2.2 期望與變異數：百變骰子
2.3 大數法則：莊家的信條

第三章統計
3.1 從樣本到總體：管中窺豹
3.2 頻率、平均數與中位數：致敬「黑曼巴」
3.3 變異數與標準差：致敬馬刺
3.4 平均數與變異數估計：近射與狙擊

第四章分布
4.1 分布：統計學的「九九乘法表」
4.2 等機率分布：硬幣的兩面
4.3 幾何分布：一次就好
4.4 二項分布：反覆擲骰子
4.5 帕松分布：神奇的e
4.6 正態分布：完美曲線
4.7 指數分布：「二八」與「長尾」

第五章賭博中的機率統計
5.1 賭博：激情與理性
5.2 雙色球：千年等一回
5.3 足彩：愛足球，更愛足彩
5.4 德州撲克：我不是教你詐
5.5 「21點」：保守未必是壞事

第六章假設檢定
6.1 主場優勢：規律還是假象？
6.2 假設檢定：主場真的有優勢嗎？
6.3 反證法：無罪推定

第七章貝氏定理
7.1 牧師貝氏：深藏功與名
7.2 賭神貝氏：一賭定終身
7.3 死神貝氏：連環恐怖攻擊
7.4 神探貝氏：嫌疑犯X的獻身
7.5 單純貝氏：智慧分類

第八章線性迴歸
8.1 預測未來：以數據之名
8.2 線性迴歸：奇準的票房預測
8.3 適合度評估：適合度檢定與分區段適合度檢定

第九章漫談機率統計
9.1 觀念導正：機率統計常識
9.2 後設認知：機率統計之「道」
9.3 兵器譜：統計軟體大盤點
9.4 大數據：創新與挑戰

參考文獻

看更多

序

序

　　凱文•凱利在《失控》中曾提道，當高度連結的群體數量大到一定程度時，群體特徵便會湧現，這是群體中任何個體都不具備的特徵。比如，大量水滴彙集成河水、海水，便會產生讓水滴「感到陌生」的新特徵——漩渦和波浪。

　　二〇一三年八月，Google提出了一個票房預測模型，該模型僅以單詞搜索量為依據，便可以提前一個月預測電影的首週票房，準確度高達94%；更令人驚訝的是，這是一個簡單的線性迴歸模型。Google是如何做到的呢？

　　人類已經進入大數據時代，可是絕大多數的人，對數據統計等基本常識還在算術常識時代。這是一個科技的時代，相對於十年前和二十年前，全球市值最大、最受人尊敬的公司Top10，全部變成了蘋果、微軟、Google……這些高科技公司。任何普通人都用智慧手機，任何人都在享受高科技技術帶來的便利。

　　為了更好地工作和生活，我們要瞭解一下這些高科技技術的常識。筆者在這方面有一些經驗，所以特地編寫了本書，希望以比較科普和有趣的筆調，讓你瞭解一門新的科學，甚至進入一個新的領域。

　　大學時，我曾上過「機率論」和「數理統計」兩門課，雖然完整地學習了機率統計，卻只是一知半解；攻讀碩士時，我在科學研究工作中需要用到機率統計，方才無奈地發現，當年所學已完完全全地還給了老師。我只能匆忙地自學了機率統計，勉強能應付科學研究工作，但心中對機率統計的很多概念仍舊一頭霧水。後來，我有幸與我的妻子走到了一起，她大學和碩士期間主修「應用數學」，在她的幫助下，我這個機率統計的門外漢終於入門了。

　　碩士畢業前，我和妻子共同翻譯了一部英文科普讀物《讓你愛上數學的50個遊戲》，這本書幫助我進一步鞏固了機率統計知識，也讓我萌生了寫書的念頭。畢業後我仍從事科學研究工作，參與了幾個與數據分析有關的項目，發現自己對機率統計的理解仍然不夠深刻，於是一口氣閱讀了幾本機率統計的科普書，比如《深入淺出數據分析》、《深入淺出統計學》和《生活中的機率趣事》，終於搞懂了「貝氏定理」、「假設檢定」等概念。看書之餘，我在「部落格」上寫了幾篇讀書心得，出版社的編輯看到我寫的文章，問我是否願意寫一本機率統計的科普書，說實話，能寫作一本屬於自己的書是我的小小理想，既然機會來了，我怎麼會拒絕呢？

　　開始寫作前，我為自己設定了三個原則。

　　一是理解而非定義。機率統計的教科書充滿了數學公式，雖然數學公式能對抽象的概念做出精確的定義，但這樣的定義太晦澀，難以理解。這是一本寫給初學者的書，我想幫助讀者理解概念的含義，而非求解某個具體問題。所以，我會用解釋性的語言來描述概念，而不是給出標準的定義。這麼做風險很大，但我願意嘗試，希望本書可以幫助讀者更快速、更深刻地理解概念。

　　二是引導而非灌輸。從小到大，我們都承受了太多的灌輸式教育，我很慶幸，自己在灌輸式教育下活了下來，但我不希望「灌輸」給讀者任何東西。所以，我總是以案例作先導，先引起讀者的興趣和思考，然後在解答問題的過程中講述知識。希望這麼做可以為讀者減負，讓讀者更流暢的閱讀，在輕鬆愉快中學到知識。

　　三是有趣而非無趣。很多人說，「有趣」是對一個人最高的評價，而我覺得一本書同樣如此。圖書銷售排行榜上，小說永遠是主角，因為它們「有趣」。讀者喜歡故事，不喜歡說教，這是事實，更是真理。我要努力避開說教式的言辭，把知識融入故事中，在講解知識的同時，帶給讀者閱讀的樂趣。

　　寫作時，我盡量堅持這三個原則，雖然期間有過掙扎和迷茫，但最終還是完成了這本書。

　　本書共有九章，第一章和第二章介紹機率和隨機變量的基礎知識；第三章和第四章介紹統計和分布的基礎知識；第五章是專門介紹賭博中的機率統計的一章，前四章的知識在這裡得到了應用；第六、七、八章分別介紹了機率統計的三個重要方法——假設檢定、貝氏定理和線性迴歸；第九章是漫談機率統計。

　　我的閱讀建議是：第一、二章合併閱讀，第三、四章合併閱讀，再閱讀第五、六、七、八、九章，後五章各自獨立，不需按順序閱讀。

　　本書由李帥主筆編寫，同時參與編寫的還有黃維、金寶花、李陽、程斌、胡亞麗、焦帥偉、馬新原、能永霞、王雅瓊、於健、周洋、謝國瑞、朱珊珊、李亞傑、王小龍、張彥梅、李楠、黃丹華、夏軍芳、武浩然、武曉蘭、張宇微、毛春豔、張敏敏、呂夢琪等作者，在此一併感謝。

　　這是我的第一本書，其中難免出現錯誤，希望讀者理解包涵，也歡迎讀者批評指正。

　　最後，我要感謝我的家人和朋友。感謝我的父母，陪伴我成長，幫助我養成了讀書和寫作的習慣。感謝我的妻子，一直理解我、陪伴我，並給我講解了一些晦澀的數學概念。感謝劉子沖、王充山、秦培根、劉翼、孫淼、趙瑋琪等老朋友，你們的支持和鼓勵是我堅持寫作的動力！

編者

看更多