研究先秦文獻的信息處理,包括詞匯和歷史知識的處理與智能檢索。先秦漢語是漢語可以溯及的源頭,對先秦文獻做詞匯處理,目的在於追本溯源,了解先秦漢語詞匯的基本面貌。用計算語言學方法梳理這一時期的歷史事件、人名、地名等知識,有助於更好地理解先秦文獻。
與現當代中文文獻相比,先秦傳世文獻規模很小,但相關的注疏文獻十分豐富。因此書中采用了與一般中文信息處理不同的方法——基於注疏文獻的方法。對比實驗表明,這種方法在先秦文獻信息處理中具有顯著的優勢。
陳小荷,江西豐城人。北京大學現代漢語專業文學博士。現任南京師范大學文學院語言科學及技術系教授、博士生導師,兼中國中文信息學會理事、 《中文信息學報》編委。主要研究方向為中文信息處理、漢語語法學。代表作有《現代漢語自動分析——ViSual C++實現》
《漢語口語里表示「……再說」的語素「着」》等。主持國家社會科學基金項目1項,江蘇省高校社科重點研究基地重大項目1項,參與國家社會科學基金重大項目1項。