第1章 中文信息處理技術概論
1.1 信息處理的實質
1.1.1 信息和信息技術
1.1.2 文字信息處理
1.1.3 中文的文字信息處理的特點
1.2 漢字編碼的種類與中文信息處理過程中漢字編碼的變換
1.3 中英文兼容技術
1.4 ASCII體系的漢字內碼
1.4.1 概述
1.4.2 未佔用C1區的編碼方式
1.4.3 覆蓋C1區的編碼方式
1.5 Unicode與Unicode漢字
1.5.1 背景
1.5.2 替代標準
1.5.3 方法與狀態
1.5.4 設計思想
1.5.5 Unicode字集
1.5.6 未來擴展與字符收錄
1.5.7 代碼賦值
1.5.8 細目
1.5.9 Unicode漢字
1.6 中文信息處理系統五層結構模型
1.7 中文信息處理技術發展概況
1.7.1 漢字標準代碼
1.7.2 漢字操作平台
1.7.3 漢字輸入方法
1.7.4 文字處理和文字編輯排版系統
1.7.5 中文信息檢索系統技術
1.7.6 翻譯系統技術
1.7.7 漢語自然語言理解
習題1
第2章 漢字編碼輸入原理
2.1 漢字和漢字屬性
2.1.1 漢字發展及其分級
2.1.2 漢字的結構分析
2.1.3 漢字的字音和字義
2.1.4 漢字的排序
2.1.5 漢字的屬性
2.2 漢字編碼輸入方法
2.2.1 概述
2.2.2 漢字鍵盤碼的笛卡兒積集分析
2.2.3 漢字信息的熵值
2.2.4 海曼公式與漢字編碼的鍵盤特性
2.2.5 漢字編碼輸入方法的簡易評測方法
2.2.6 漢字編碼輸入方法專業評測方法
2.2.7 漢字鍵盤碼的譯碼問題
2.3 有關中文輸入技術現狀與發展的幾個問題
習題2
第3章 漢字字形存儲與壓縮技術
3.1 漢字字形存儲與字形碼
3.1.1 漢字字形的數字化
3.1.2 整字存儲與壓縮存儲
3.2 漢字壓縮存儲常見方法
3.3 衡量壓縮與還原技術的重要指標
3.4 漢字字形壓縮的方法與技術
3.4.1 漢字筆畫矢量存儲方法
3.4.2 部件組字壓縮方法
3.4.3 子信息塊哈夫曼樹壓縮
3.4.4 字形輪廓壓縮
3.4.5 黑白段與線性增量壓縮
3.4.6 筆畫輪廓壓縮
習題3
第4章 漢字識別技術
4.1 OCR技術概況
4.1.1 概述
4.1.2 漢字識別應用領域
4.1.3 印刷體文字識別的研究
4.2 漢字識別種類
4.3 漢字識別原理
4.4 漢字識別一般方法
4.4.1 印刷體文字識別研究方法簡介
4.4.2 聯機手寫文字識別研究方法
4.5 漢字識別產品介紹
4.5.1 漢王數字化檔案館解決方案概述
4.5.2 漢王數字檔案資源建設
4.5.3 漢王數字檔案的管理利用
4.5.4 漢王數字圖書館解決方案
4.6 漢字識別技術的最新進展
4.7 漢字識別系統的未來發展
習題4
第5章 中西文兼容處理技術
第6章 漢語自然語言理解
第7章 中文信息處理技術的應用
附錄A 中華人民共和國國家標準GB 2312—1980《信息技術 信息交換用漢字編碼字符集 基本集》
附錄B 中華人民共和國標準GB/T 7589—1987《信息交換用漢字編碼字符集 第二輔助集》
附錄C 中華人民共和國國家標準GB/T 7590—1987《信息交換換用漢字編碼字符集 第四輔助集》
附錄D 中華人民共和國國家標準GB 13000.1—1993《信息技術 通用多八位編碼字符集(UCS) 第一部分︰體系結構與基本多文種平面》
附錄E 中華人民共和國國家標準GB 18030—2000《信息技術 信息交換用漢字編碼字符集 基本集的擴充》
參考文獻