第一次見到這本書的電子版是在2007年的年底,當時北京大學的閆宏飛博士向我推薦了這本書。從網上下載書稿的電子版之後,我便迫不及待地在一周時間內通讀了這本書。讀完之後便萌發了翻譯這本書的沖動,隨後我就聯系作者、聯系劍橋大學出版社並通過朋友尋找獲得授權的國內出版社。輾轉數月之後,我被告知該書已經交由其他學者翻譯,很快便可出版。听到這個消息,雖然我有些遺憾,但也算是心里的-塊石頭得以落地。所以,當去年8月人民郵電出版社突然聯系並詢問我是否有意翻譯這本著作時,我心里的驚訝可想而知。當然,驚訝之余我毫不猶豫地接受了這份邀請,並從此開始了長達教月的翻譯歷程。
之所以願意翻譯這本書不僅僅是由于該書的作者都是學術界甚至業界鼎鼎大名的人物,更主要的是因為本書在內容和組織上都有獨到之處。之前也有很多信息檢索方面的教材,但是其中很多內容已經過時。信息檢索是‧門不斷發展並和其他領域、技術不斷融合的學科。這本書補充了一些近年來受到廣泛關注的新內容。比如︰基于語言建模的信息檢索模型,基于機器學習的排序方法、檢索結果的Snippet生成,聚類標簽生成、XML檢索、搜索廣告、網頁作弊,等等。除此之外,本書每章末尾的“參考文獻及補充讀物”,
一節也給出了相關技術的最新進展。本書在內容上與傳統教材的另一個顯著不同之處是加大了文本分類,聚類技術的介紹篇幅,實際上這些技術已經成為當代信息檢索不可分割的一部分。另‧方面,本書在深度上超過了大部分傳統教材。在介紹信息檢索技術的同時,本書深入介紹了其背後所依賴的原理。因此,本書不僅可以用作信息檢索領域的入門教材,還能滿足對該領域進行深入研究的需要。另外,本書給出了很多實際當中的運行算法和實施細節,這些內容對于信息檢索技術的實際應用有很好的參考價值。最後值得一提的是,本書在結構上也進行了巧妙構思。首先通過‧個例子引出基本技術,然後通過基本技術的不斷增強來介紹信息檢索的其他技術。全書渾然一體,讀起來也有一氣呵成的感覺。
這麼一本優秀的著作在給譯者的翻譯帶來無窮動力的同時,無疑也給翻譯帶來了無形的壓力。為了盡量保證每章譯稿的質量並保持譯文的前後一致性,整本書的初譯工作全部由譯者本人獨立完成,在翻譯過程中譯者也閱讀了大量相關的教材和論文,井前後進行了六次自我校對。在校對過程中,有很多學術界同仁也提出了很多寶貴的意見和建議。他們包括︰中科院研究生院的朱廷劭教授、中科院自動化所的趙軍研究員、中科院軟件所的孫樂研究員、復旦大學的黃董菁教授、江西師範大學的王明文教授,江西財經大學的劉德喜博士,北京大學的閆宏飛博士、何靖博士、清華大學的張敏博士,北京語言大學的徐燕博士等。譯者所在的中科院計算所信息檢索課題組及選修研究生院《現代信息檢索》課程的部分學生也提出了大量修改建議,他們是︰郎皓,李亞楠、顧智字、李鵬、李銳、馬宏遠.張愛華.蔣在帆、沈沉、史亮、衛冰潔,崔雅趣、趙琴琴、李恆訓、袁平廣、邱泳欽、李丹、魯凱、徐飛、張帥、張啟龍、廖鳳,鐘進文、來亮、趙娟等。對于他們無私的幫助,我表示由衷的感謝。感謝我所在的前瞻研究實驗室主任李錦濤老師對我的翻譯工作給予的支持和肯定。當然,本書的翻譯工作得以順利完成,還要感謝人民郵電出版社眾多工作人員特別是責任編輯楊海玲女士在各方面的支持和幫助。另一個需要感謝的是我的妻子、在前前後後近八個月當中,除上班時間完成自己的科研工作外,我幾乎所有的業余時間都用在翻譯和校對上,而她卻默默地承擔起兩歲的兒子的所有撫育責任。
翻譯的過程中,我還有幸與原文的第二作者Prabhakar Raghavan教授進行了當面交流,他對我的翻譯工作給予了極大鼓勵。在與原文作者的郵件交流中,我也澄清了一些理解上的誤區.井修正了原書中的多處錯誤。
雖然得到了眾人的幫助,自己也算認真努力,但由于本人專業水平、理解能力和寫作功底都十分有限,加上時間上仍顯倉促,最後的譯稿中‧定存在不少理解上的偏差,譯文也會有許多生硬之處。希望讀者能不吝提出修改的意見和建議,以便對現有譯稿不斷改進,直至為國內信息檢索領域的讀者真E造福為止。來信請聯系wbxj2008@gmail,com,對譯稿J修改結果也會及時公布在網站http://ir.ict.ac.cn/~wangbin/iir-book/上。原書的初稿電子版、相關課件、勘誤表、論壇等信息也可以從網站http:nlp.stanford.edu/IR-book/information-retriveal-book.html下載。
譯者簡介
王斌博士,中國科學院計算技術研究所前瞻研究實驗室信息檢索課題組組長,副研究員,博士生導師。主持國家973。863、國家自然科學基金、國際合作基金、部委及企業合作等課題20余項,在包括SIGIR、CIKM、EMNLP等在內的會議和刊物上發表學術論文100余篇。擔任CIKM、AIRS、CCIR、SEWM等國際國內會議的程序委員會委員,同時是ACM和IEEE會員、中國計算機學會高級會員、中國中文信息學會會員、中文信息學會信息檢索專業委員會委員及《中文信息學報》編委。自2006年起在中國科學院研究生院講授《現代信息檢索》研究生課程,迄今培養博士、碩士研究生近30名。