漢英語料的平行處理技術,旨在利用雙語信息以解決歧義現象。《漢英平行語料庫的平行處理》研究了漢英平行語料中的未登錄詞識別、詞性標注、詞義標注及句法分析等層面的平行處理技術及其有效性,實現了漢一英雙向平行處理。
在詞匯未對齊平行語料中,采用了基於個性規則的詞性、詞義消歧方法。精加工1000句對的漢英平行語料,可作為加工大規模平行語料的資源。平行處理技術可以有效解決單語處理時的一系列困難,有助於漢英機器翻譯知識的自動獲取。
馮敏萱,江蘇南京人。語言學及應用語言學專業文學博士。現任南京師范大學文學院語言科技系講師,獲校第八屆青年教師教學大賽「教學十佳」稱號。主要研究方向為中文信息處理、語料庫語言學。發表論文20篇,代表作有《帶后綴「者」的派生詞識別》、《英語人名的漢譯名平行識別》和Parallel Processing Strategy for Segmentation
Ambiguity。現主持江蘇省社會科學基金項目1項,參與國家社會科學基金項目等4項。