藏語計算語言學
![]() |
題 目:藏語計算語言學 |
內容提要:
《藏語計算語言學》是國內第一本全面系統地介紹藏語計算語言學的著書,由淺入深地講解了藏語計算語言學的基本理論和知識框架。全書在漢語、英語等自然語言計算機處理的相關基本知識和方法的基礎上,結合藏語特點,介紹了基于規則的藏語自然語言分析方法,也介紹了基于統計的分析方法。全書共分四個部分,分別為藏文及藏文信息處理的基礎知識、藏文詞法分析、藏文句法分析和藏文語義分析。第一部分介紹了計算語言學的基本理論知識、藏文及藏文信息處理的基本知識;第二部分針對藏文信息處理中特有的分詞問題,介紹了藏文自動分詞及分詞規范、分詞中歧義的消解、未登錄詞識別、藏文詞性標注及標注標準,以及藏文語料庫的相關知識;第三部分從藏語語法的表示入手,將藏語自然語言處理形式化,再給出藏語語法分析的算法;第四部分介紹了藏語語義的表示及分析算法。
目錄
第1章計算語言學概論
1.1計算語言學的定義
1.2計算語言學的發展歷程
1.3計算語言學的研究范疇
1.4計算語言學的研究方法
1.5計算語言學與藏語研究
1.6計算語言學的發展趨勢
第2章計算語言學基礎知識
2.1概率統計基礎
2.1.1事件和概率
2.1.2隨機變量與分布函數
2.1.3隨機變量的數字特征
2.1.4最大似然估計
2.2信息論基礎
2.2.1信息的最優編碼設計
2.2.2信息熵
2.2.3噪聲信道模型
2.3隱馬爾可夫模型
2.3.1馬爾可夫過程
2.3.2隱馬爾可夫過程
2.3.3向前算法和向后算法
2.3.4韋特比(Viterbi)算法
2.3.5Baum—Welch算法
第3章形式語法與自動機理論
3.1形式語法
3.1.1形式定義
3.1.2形式語法分類
3.2自動機理論
3.2.1自動機概述
3.2.2自動機術語
3.2.3形式描述
3.2.4有限自動機的分類
3.2.5有限自動機的擴展
第4章藏文信息處理
4.1藏文概述
4.2藏文字的構件
4.3藏文的拼與寫
4.3.1藏文拼音規則
4.3.2藏文虛詞形態規則
4.3.3藏文字體
4.4藏文編碼與標準
4.4.1編碼標準
4.4.2鍵盤及字庫標準
第5章藏文自動分詞
5.1藏文自動分詞概述
5.1.1藏文自動分詞的意義和作用
5.1.2藏文文本的切分特點
5.1.3藏文自動分詞的難點
5.2藏文分詞規范
5.2.1制定藏文分詞規范的目標
5.2.2藏文分詞規范簡介
5.3藏文分詞詞典
5.3.1藏文分詞詞典的機制
5.3.2基于詞屬性的藏文分詞詞典
5.4藏文分詞方法
5.4.1基于規則的分詞方法
5.4.2基于統計的分詞方法
5.4.3基于規則和統計的方法利弊
5.4.4專家系統分詞法
5.4.5基于神經網絡的分詞方法
5.5藏文分詞歧義理論
5.5.1藏文分詞歧義的類型
5.5.2歧義消解的方法
5.6藏文未登錄詞
5.6.1藏文未登錄詞分類
5.6.2藏文未登錄詞的識別方法
第6章藏文詞類自動標注
6.1藏文詞類劃分的意義
6.2藏文詞類劃分的理論依據
6.3藏文詞類體系
6.4藏文詞類及標記集規范
6.4.1適用范圍
6.4.2詞類及標記集規范確定原則
6.5藏文詞性自動標注
6.5.1詞性標注
6.5.2難點分析
6.6詞性標注方法
6.6.1基于規則的方法
6.6.2基于統計的方法
6.6.3規則與統計相結合的方法
6.7HMM在藏文詞性標注中的應用
6.7.1先驗概率和條件概率
6.7.2HMM的三個基本問題
6.7.3Viterbi算法
6.7.4HMM與詞性標注的關系
第7章藏文語料庫與詞匯知識庫
7.1語料庫的定義
7.2語料庫的作用
7.2.1對藏語語言研究的作用
7.2.2對藏語自然語言處理的作用
7.2.3多學科綜合研究
7.3語料庫的發展簡史
7.3.1第一代(20世紀70—80年代)
7.3.2第二代(20世紀80—90年代)
7.3.3第三代(20世紀90年代至今)
7.4國內語料庫建設概況
7.5語料庫的分類
7.6藏文語料庫的設計
7.7藏文語料庫構建原則
7.8藏文語料庫的應用
7.9藏文語料庫的標記及其規范
7.10藏文語料庫的標記框架
7.10.1藏文語料庫中文本屬性的標記
7.10.2藏語文本結構信息的標記
7.10.3段落標記
7.10.4句子標記
7.10.5詞匯標記
7.11藏文語料庫框架標記范例
7.12詞匯知識庫
7.12.1FrameNet
7.12.2WordNet
7.12.3GKB
7.12.4HowNet
第8章藏語句法知識的表示
8.1基于短語結構的藏語句法形式化
8.1.1短語結構語法概述
8.1.2短語結構語法構成要素
8.2基于范疇語法的藏語句法形式化
8.2.1范疇語法概述
8.2.2范疇語法的基本思想和規則
8.2.3范疇語法與藏語句法形式化
8.3基于詞匯功能的藏語句法形式化
8.3.1詞匯功能語法概述
8.3.2詞匯功能語法理論框架
8.3.3LFG兩種語法層次結構
8.4基于功能合一的藏語句法形式化
8.4.1復雜特征集的定義
8.4.2藏語詞匯的定義描述
8.4.3藏語句法規則的描述
8.4.4藏語語義規則的描述
8.4.5藏語句子合一運算的描述
8.5基于依存的藏語句法形式化
8.5.1依存語法概述
8.5.2依存語法理論
8.5.3依存語法的定義
8.5.4依存結構圖
……
第9章藏語句法分析
第10章藏語語義知識的表示
第11章藏語語義分析
第12章藏語歧義消解
附錄
參考文獻
- 建設美麗社區營造宜居環境 社區居民笑容是甜的
- 2018中國九寨溝第十三屆國際冰瀑旅游節開幕
- 天津自貿試驗區平行進口汽車試點延伸至華南
- 宣講達人王輔成:永遠牢記身上這份黨員責任
- 首輪中央環保督察問責超1.8萬人 明年或"回頭看"
- 天津環境保護突出問題邊督邊改第二百零三批公開信息
- 中央環保督察期間群眾都舉報了哪些問題? 官方回應
- 10名一線職工獲"國企楷?!け本┌駱?十大人物稱號
- 對涉罪未成年人教育為主是放縱犯罪?最高檢回應
- 城市空間改造百姓說了算 東城老鍋爐房變社區綜合服務樓
- 中央環保督察發現多個共性問題:與地方不作為有關
- 如何避免督察后地方放松整改?國家環保督察辦回應
- 地方探索對侵害未成年人罪犯信息公開 最高檢回應
- 今起京津冀實施外國人144小時過境免簽政策
- 督察問責雷聲大、雨點小?國家環保督察辦回應