推薦序
大多數天鵝是白的
這本書探討以量化資料預測人類行為,在各方面得到的應用成果。其實,早在二次大戰時,美軍就率先利用這種預測分析。1940年時,「模控學」(cybernetics)之父維納(Norbert
Wiener)開始嘗試預測德國軍機的行蹤,目標是擊落德國軍機。他的方法是利用先前觀察取得的軍機移動資料,預測軍機可能的飛行路徑,考慮飛行員最可能採取的閃避方式,預測軍機接下來可能移動的位置,這樣就能把軍機擊落。可惜,維納只能預測軍機下一秒的動作,但是要擊落軍機,卻需要預測二十秒內的飛行路徑。
不過,在席格這本書裡,你會知道許多預測工作其實相當成功。畢竟,從維納那個時代以來,電腦的處理速度突飛猛進,我們能收集的資料也越來越多。因此,銀行、零售業者、選戰活動、醫生和醫院、以及許多組織最近在預測特定人群行為時,全都獲得豐碩的成果。他們對預測分析投入心力,協助自己贏得顧客青睞、打贏選戰並戰勝疾病。
依我所見(我想席格也這麼認為),整體來說,預測分析對人類是有利的。從健保、犯罪和恐怖主義這些方面來說,預測分析可以拯救性命;對廣告業來說,利用預測既能提高效率,也能落實環保(減少寄送直銷郵件和型錄的數量),同時不會浪費收件者的寶貴時間和關注心力。而對政界來說,重視這種科學方法的候選人,似乎都能在選戰中成為贏家(或許有些人不認同這種說法,但我認為預測分析確實對打贏選戰有幫助)。
不過,就像席格在這本書裡開宗明義地指出,這些方法也可能用在一些不好的地方。席格對此坦率直言,讓我十分欽佩,他引述電影《蜘蛛人》中的一句台詞:「權力越強,責任越大。」換言之,身為社會的一分子,我們在使用預測模型時必須審慎小心,在應用方面有些禁忌要列入考量,不能為了一己之私就犧牲他人的權益。跟其他強效技術或破壞性創新一樣,預測分析基本上跟道德無關,能用來為善,也能用來作惡。不過,為了避免預測分析被拿來做壞事,了解這個方法究竟能做什麼,當然再重要不過。如果繼續看下去,你就會知道預測分析的效力有多強大。
這本書的探討重點就是預測分析,預測分析不但是一種分析類型,也是最有趣、最重要的分析類型。我不認為我們需要更多只講敘述性分析(descriptive analytics)的書籍,因為那種分析只描述過去,沒有針對事件起因提出任何見解。我常把自己的論述比喻成第三種分析,也就是規範分析(prescriptive
analytics),這種分析告訴使用者,透過控制實驗或最適化要做什麼。不過,這類量化方法不像預測分析這樣廣受採用。
這本書及其所依據的構想跟塔雷伯(Nassim Nicholas
Taleb)的研究,剛好形成很好的對比。塔雷伯在《黑天鵝效應》和其他著作中提出的論點是,由於隨機性和複雜事件本身的不可預測性,讓人們為預測所做的努力注定徒勞無功。塔雷伯說得沒錯,有些事件是無法預測的黑天鵝;但事實上,大多數人類行為都有跡可尋,既固定又可以預測。席格在這本書裡提出許多成功預測的實例,都提醒我們這項事實——大多數天鵝是白的。
席格也抗拒目前對「大數據」風潮的推崇,雖然他在書中提及的一些實例確實屬於這一類,也就是資料龐大又缺乏結構,很難用傳統那種關係資料庫加以管理。但是,預測分析的重點不是資料數量大小或控制難易程度,重點是拿資料來做什麼用途。我自己就發現「大數據通常用途少」,許多實際拿大數據做分析的人,只是拿數據設計一些引人注目的視覺分析,這樣做他們就很滿意了。相較之下,這樣做當然不像設計預測模型那樣有價值。
席格這本書以深入淺出的方式,敘述預測分析的重要,讓一般讀者都能看懂這項複雜高深的技術。書中不但穿插有趣的故事和圖解,還以生動的文筆,讓一般讀者能輕鬆閱讀。就算數學讓你很傷腦筋,你也該看看這本好書,因為在這個數據為王的時代裡,每個人(包括你在內)從出生到死亡的一舉一動,都受到預測。而且很可能的情況是,大多數人在職場上會更加需要考慮預測模型,或用預測模型進行評估,並依據預測模型的結果採取行動。
簡單講,我們生活在凡事講究預測的社會裡,要在這種社會出人頭地的上策就是,了解預測模型的目標、技術和限制。而且,要做到這一點的速效方式很簡單,那就是趕快把這本書好好看完。
湯瑪斯.戴文波特(Thomas H. Davenport)
哈佛大學商學院訪問教授
國際分析學院(International Institute for Analytics)共同創辦人
作者序
預測分析究竟在做什麼?
昨日已逝,明日是謎,珍惜當下,盡力而為。
每當我跟別人說我做哪一行時,對方總會用奇怪的表情看著我。這就是從事預測這一行會遭遇的職業傷害。
資訊時代因為一項明顯疏漏而蒙受其害。這樣講可能會讓許多人跌破眼鏡,我們現在主動地記錄世上發生的每件事,那還會有什麼事被我們漏掉?以前人們撰寫史書記載重要事件,現在科技進步,利用電腦系統就能保存個人的每次點擊項目、付款記錄、通話清單、破產資料、犯罪記錄和病歷。有了這些資料,你認為熱愛數據者就算沒被寵壞,也應該感到滿足。
但是在這浩瀚無垠的資訊裡,卻沒有包括一項最寶貴的資訊,那就是:還沒有發生的事。
大家都渴望獲得預見未來的能力,我們都對預測相當著迷。我們膜拜號稱有預測能力的女神,我們花大錢去算命,我們注意星座運勢也喜歡占星學,就連吃飯時也不忘來片幸運餅乾,看看籤詩的運勢預測。
但是,許多熱中靈媒和算命的人卻唾棄科學。講到科學,他們的本能反應就是:「討厭!」科學不是太難懂,就是太無趣。許多人甚至相信,就本質來說,如果沒有超自然能力的支援,根本不可能做任何預測。
我喜歡的喜劇影集《靈異妙探》就是以此為主題,主角是觀察力過人的偵探——堪稱是當代講究數據的福爾摩斯。他觀察入微,甚至讓警方誤以為他能如此準確地推論,是因為他涉案。這位英雄為了讓自己脫困,不得不順應常理:他告訴警方,他是靈媒,警方才放過他,請他繼續協助打擊犯罪。劇情就這樣發展下去。
我自己也有過類似的經歷,有時朋友問我是什麼星座,我沒有假裝自己相信占星術,而是幽默地回答:「我是天蠍座,天蠍座的人不相信占星術。」
在朋友聚會時,我常被人問起是從事哪一行。這時我會兩眼呆滯、鼓起勇氣,小心地說:「預測分析。」大多數人都很幸運,能用簡短一句話描述自己的工作,比方說:醫生、律師、服務生、會計師或演員。但是對我來說,每次要描述這個大多數人都不知道的領域,實在太煞風景。我越想簡短回答,對話就變得越平淡無趣:
「我是技術類企管顧問。」人們還是繼續追問:「哪種技術?」
「我讓電腦預測人們會做什麼。」大家聽了滿臉困惑,根本不相信我說的話,還面露難色。
「我讓電腦從資料中學習,以便預測人類的行為。」大家聽了一頭霧水,沒人會想在聚會中聊數據資料。
「我分析資料找出模式。」大家聽了眼神更加呆滯,開始心不在焉,我這樣回答讓大家都很難接上話,也讓場面變得很尷尬。
「我協助行銷人員找出會購買或取消訂單的顧客。」大家似乎有點明白我的意思,但是這樣講根本是矮化和局限預測分析這個領域。
「我預測顧客行為,就像塔吉特百貨(Target)預測顧客是否懷孕那樣。」接著,大家就開始挪動腳步,沒人想搭理我。
所以,我寫這本書告訴大家,預測分析究竟在做什麼,這種預測方法為何符合直覺,不但效力強大還讓人歎為觀止。
我要跟大家報告這個好消息:小預測可以做大妙用。我把這種現象稱為預測效應,這也是從頭至尾貫穿本書的一項主題。預測的效力相當顯著,畢竟預測比臆測來得準確。這種效應讓預測分析變得可信,我們不必做一些不可能做到的事,也不必具有超凡的洞察力。這本書的內容既令人興奮又值得信賴:預測未來,讓原本像薄霧籠罩的模糊未來,開始變得清晰些,這樣做確實有利可圖。預測分析就是用這種方式,對抗金融風險,強化健保制度,減少垃圾郵件,提高打擊犯罪的效益,並協助企業讓銷售額激增。
你有科學家或企業家的精神嗎?讓你興奮的是預測這個構想,或是預測能為世界堅守的價值?
了解不可知的未來這個概念吸引著我。預測似乎蔑視這項自然法則:你無法預見未來,因為未來還沒發生。但是我們找到一個應變對策,我們設計能從經驗中學習的機器。這種嚴格控制的學科是利用我們確實知道的事(以資料形式顯示),更準確地預測接下來會發生的事。我們將最頂尖的數學方法和技術結合在一起,有系統地調整修正,直到我們設計出一套讓自己滿意的系統,看透以往擋在現在與未來之間、讓人捉摸不透的層層阻礙。
預測專家每天討論著,要大膽邁向「未來」這個沒人到過的地方!
人各有所長,有些人做業務,有些人從政,我鑽研預測分析,這工作實在棒極了。