推薦序
大數據,為什麼?
「大數據」應該是近來最熱門的話題和口號之一,不論是數據還是演算法,都試圖讓我們看清這個世界背後,其實存在著超乎我們想像的邏輯世界;近年來我個人離開了熟悉的數位行銷領域,轉換到一個不但陌生和而且充滿未知的數據行銷領域,一開始、還帶著初生之犢的好奇心與熱情來試探這個未知領域的邊界,慢慢地、隨著實務服務經驗的累積與思考觀察,逐漸發現到「數據世界的答案是沒有盡頭的」,如果我們一開始沒有「問對問題」,那很有可能我們會虛擲可觀的時間和成本,去探討一個沒有商業價值的空泛問題。
前亞馬遜(Amazon)首席科學官韋思岸博士(Dr. Andreas Weigend)在2014年拜訪台灣的時候,也曾經和我們團隊激盪過,究竟數據為我們帶來了怎樣的價值,在一片眾說紛紜中,我們歸結出一個簡單而純粹的目的:「To make better decisions」(做更好的決策)。
因為,從個人到品牌決策人員,每天都不斷地面臨各種決策的情境,在缺乏系統化的經驗分析數據下,我們經常習慣依賴一些非理性的線索而做出錯誤的決策,但是透過系統化的數據蒐集、自動化分析以及有策略觀點的報表解讀,未來我們都將可以透過這種學習迴圈,持續優化我們的決策價值,這種數據化的學習能力將會是下一個階段至為關鍵的競爭力指標。
不過,本書也特別指出:數據時代反映的應該是對於問題決策更好、更快的應變效率、而不是盲目地追求對人性最大的演算控制;大數據的應用不該從昂貴的系統和尖端的分析技術開始,真正的鑰匙是──一切要從我們習以為常的現象中梳理出真正關鍵的問題開始。關於本書,以及那些對科技的誇大之詞
夏雨農/MIGO(功典集團) 台灣區總經理
前言
關於本書,以及那些「科技炒作」的誇大說法
本質上來說,演算法(algorithms)有點像一步一步的程式指令,通常透過電腦執行。然而,若說這樣的性質描述很簡單易懂,它們內部的運作、以及對我們生活的影響,卻絕非如此。
演算法透過分類、過濾、選擇,提供給我們日常生活的訊息、促成我們在谷歌搜尋引擎的查詢結果、臉書中朋友的動態訊息、以及亞馬遜網站對我們可能會想購買的產品類型預測。漸漸地,演算法也將負責掌控未來的電影、音樂和其它娛樂的形式,預測什麼樣的人適合做我們的終身伴侶,甚至於介入法律執行和警察行動的模式。演算法能夠掃描你的個人資料庫,進而推薦你可能會是一位工作勤奮的雇員,同樣的,它也能指控你犯罪,或者判定你不適合駕駛汽車。在這個過程當中,引用道格拉斯•亞當斯(Douglas
Adams)所說的,演算法正深深地改變我們觀看「生命、宇宙及萬事萬物」的方式。
所有科技觀察當中,我最喜歡的其中之一,便是文化理論家保羅•耶里歐(Paul Virilio)所說的︰「發明船舶的同時,也製造了船難的機會。」當然我們也可以倒過來說:「造成船難的人,同時也是發明船舶的人。」演算法對於船舶失事(引申失敗、毁減),也有其應負的責任(我將在這本書中詳細探討),然而,演算法同樣也發揮驚人實用的功效︰讓我們得以瀏覽每天產生的25億GB
的海量數據資料(相當於人腦所能承受的百萬倍訊息),並且從中取得可操作的結論。
正如同「如何雕刻大象」的老格言一樣(鑿去任何不屬於大象的部份即可),我將首先解釋這本書不是什麼樣的書。首先要聲明的是,這不是一本關於演算法的計算機科學教科書,還有其它更好的書(更有資格的作家)能達成教科書的任務。
這本書也不是講述演算法的歷史概念。我曾經考慮過這個方向,但一想到這計劃的規模、以及最後的結果(若在合適的作者筆下,絕對會是極好的),可能會與我試圖避開的教科書方向殊途同歸,最終還是打消了這個念頭。我這麼說並非要表達歷史書和教科書是必然相同的事情,而是昔日利基數學概念的歷史發展,很可能只會引起原本對此主題相當熟悉的數學家或電腦科學家的興趣。
相反的,我想要傳達的真相是,演算法無所不在地影響我們的生活模式(有些細微,有些卻不然)︰從我們喜愛的娛樂,乃至於我們思考人際關係的方式。尋找帥哥辣妹約會對象、拍出一部好萊塢大爛片、自我身體檢測、想辦法減少律師服務費用,這些事有什麼共通之處?這是一本關於我們所認知的生活數位科技化(algorithmisation of life)的書。
我的日常工作是為《快速企業》雜誌(Fast Company〉書寫「數位人文」相關領域的文章,期間我常常在思考「演算法文化」背後的含意,以及「不管是什麼問題,都可以用正確的演算法解決」這樣(不全然錯誤)的概念。
最能傳達我的意思的例子,可見於比爾•唐瑟(Bill Tancer)2009年的《網路作用與意義》(Click: What We Do Online and Why It
Matters)一書。唐瑟曾被譽為「世界上研究網路〔行為〕的傑出專家」,他在此書一開始時,描述他有一天在開車的途中,所聽到的一段廣播訪問。受訪者是一個英國心理學家,談到他發展的一套數學公式,旨在客觀地測定一年當中最令人沮喪的是哪一個星期。
經過一番研究之後,他發現答案是一月的第三週,正是因為新年的新計劃沒有達成、度假期間所累積的信用卡債務、和一如往常的灰暗天氣等原因所造成的。唐瑟表示他自己並沒有被這項研究結果說服,但並不是因為他質疑還原公式(reductive formula)竟然能夠回答沮喪這種複雜和多面向的問題,而是因為他有自信可以找到一套更好的計算方程式。
換句話說,他的問題並不是在於此事能有「演算結果」,而是在於它的「運算方式」。
這本書正是我受了多年來聽到的類似觀察所刺激,所有的論點都宣稱,「沒有任何問題是科技無法化為最基本的計算公式」因而取得客觀答案的。這樣的思維也正是「The
Formula」(本書原文書名:數位方程式)的原因,它不僅只是代表文中所描述的各種科技發展的總稱,這標題暗示的是帶一點兒意識型態的成份,那樣的意識型態顯現在我對演算法、及其相關的技術裝置,採取更廣泛的觀點:將它們視為「科技合理性」(techno-rationality)特殊形式的體現,建立在承諾客觀性的一種社會秩序徵兆。
以此看來,本書所採用「The Formula」的觀點,一如已故的美國政治科學家和通訊理論家哈樂德•拉斯韋爾(Harold Lasswell)所定義的「技術」(technique)一字。如拉斯韋爾所言,技術是指「利用手邊可取得的資源,達到價值標準的整體實踐 。」它指的是應用、以及應用的範圍,還有潛藏在表面下客觀事實的存在,只要用正確的數據挖掘工具就可以被梳理出來。
我們好想用公式理解世界
除了少數幾個著名的例外,大多數的科技作家都太過於理想化,認為所有的科技發展都是正面的。 結果便產生一種趨勢,科技作家紛紛將每個新的發明,歌頌為劃時代的圖騰,最後衍生出誇大的「cyberbole」(科技炒作)一詞。雖然這本書很可能加入書店架上陳列的,演算法以及巨量資料(big
data)相關書籍的行列中,但我所感興趣的是回溯到更早之前,而非僅只於談論網路的誕生、或個人電腦的時代。
在1960年代前期,法國社會學家(也是主張無政府主義的神學家!)雅各•伊路爾(Jacques
Ellul)曾描述「技術人」這種生物概念:指一個體「執著於結果,執著於透過標準化設備的運作達成立即的結果…永不懈怠地致力於尋找一個『最佳的模式』以達成任何設定的目標。」這個目標偶爾會被尋找方法達到目的地的天真熱情所模糊(或是加速進行):不是因為倫理道德這種難以量化的議題,而是因為人類企圖追求巧妙、精確和「驚人效率」解決之道的夢想能力。
正如同伊路爾的觀察所證明的,這種態度以前就存在了;谷歌的創始人以及我在書中討論到的各種各樣高科技公司的首腦,也非第一批人展現已故美國社會學家路易斯•孟福特(Lewis
Mumford)所謂的「指令的意志」(will-to-order),意即以公式理解世界的欲望。這概念寫在1930年代,早在現代電腦誕生之前,孟福特就注意到自動化操作是為了「擴大人類身體的機械或感官能力」,同時也是為了「回歸到可測量的制序和規律性的生活程序」。想要充份理解一張大幅的圖像,他建議我們必須簡化它。這也像「想要將人類智力」這種抽象概念變成可量化的事情,我們就必須更進一步提取重點,除去複雜性,將之編派一個看似武斷的數字:「智力商數」(IQ)。
真正新鮮的是,類似這樣的概念此刻被具體實現的程度,幾乎已經到了難以想像還有哪一個工作或生活領域,不受演算化和數位方程式所操控的。
本書要敘述的正是我們如何走到這一步,以及演算法時代如何衝擊以及形塑各個議題:諸如人類的創造力、人際關係(特別是浪漫的愛情關係)、身份認同、和法律相關事務。
對以上這些議題,演算法全都很擅長為我們提供答案。
但真正的問題是:演算法是否提供了我們想要的答案。