-
>
妙相梵容
-
>
基立爾蒙文:蒙文
-
>
我的石頭記
-
>
心靈元氣社
-
>
女性生存戰爭
-
>
縣中的孩子 中國縣域教育生態
-
>
(精)人類的明天(八品)
漢語最長名詞短語識別研究 版權信息
- ISBN:9787567146549
- 條形碼:9787567146549 ; 978-7-5671-4654-9
- 裝幀:一般膠版紙
- 冊數:暫無
- 重量:暫無
- 所屬分類:>
漢語最長名詞短語識別研究 內容簡介
人類語言具有結構性,非常明顯的體現是句法結構。理解語言離不開對句法結構的分析。因此,自動句法分析作為自然語言處理的基礎性工作,是通往語言理解的基石,很多復雜的自然語言處理任務都需要建立在一定程度的句法分析基礎之上。 自然語言處理研究認為兩種名詞短語有重要價值,一種是基本名詞短語,一種是**名詞短語。相比較而言,后者不僅長度大,所合成分與結構也更復雜多樣。作為名詞短語的一種動態類型,漢語**名詞短語占據了一半以上的句長比例,識別出它們就可以快速地掌握句子的基本骨架,不僅有助于完全句法分析,也對機器翻譯、信息抽取等多種任務具有很高的應用價值。 **名詞短語識別工作雖然取得了一定的進展,但距離令人滿意的效果還有不小的差距,從而對各種應用系統的支持也受到限制。目前主流的**名詞短語識別方法是統計機器學習方法,通過詞語位置分類和序列標注實現短語識別,大大提高了正確率和召回率,但也遇到了增長瓶頸。打破這一瓶頸,需要我們深入研究**名詞短語的結構和分布規律,提出新的識別策略、方法和有效特征。 《漢語**名詞短語識別研究》從理論定義、分布描寫、識別方法等角度對**名詞短語識別工作進行系統的探討。首先,通過層次構造、長度約束、名詞性認定和外延范圍的認定,界定了一種新的多層級**名詞短語。其次,從句法功能、句法結構和線性特征等角度細致地描寫**名詞短語的分布規律,分析了其復雜性構造和識別難點問題。*后,基于分布規律制定合適的識別策略和方法,選取有效的識別特征,并分類進行識別實驗。
漢語最長名詞短語識別研究 目錄
**節 漢語自動句法分析的難點問題
第二節 多視域下的*長名詞短語研究
第三節 *長名詞短語研究的方法與資源
第四節 本書的主要內容與特色
第二章 名詞短語識別的相關研究綜述
**節 名詞短語研究
第二節 組塊分析研究
第三節 搭配獲取研究
第三章 理論基礎與*長名詞短語的界定
**節 漢語短語的分類框架
第二節 語言組塊理論
第三節 *長名詞短語的界定
第四章 *長名詞短語的分布調查與分析
**節 *長名詞短語的抽取
第二節 句法功能與外部鄰接
第三節 句法結構與內部構成
第四節 復雜性與MNP構造
第五節 識別策略的確定
第五章 表層*長名詞短語的識別
**節 統計機器學習模型及其選用
第二節 基于基本名詞短語歸約的識別
第三節 基于分類器集成的識別
第六章 內層*長名詞短語的識別
**節 層級構造
第二節 識別難點分析
第三節 識別策略的確定
第四節 多層級的iMNP識別
第五節 基于規則的修正
第七章 *長名詞短語識別工作的反思與展望
**節 研究工作的反思
第二節 進一步的研究計劃
參考文獻
附錄
附錄1 清華漢語樹庫(TCT)詞類標記集
附錄2 清華漢語樹庫(TCT)句法功能標記集
附錄3 清華漢語樹庫(TCT)句法結構標記集
附錄4 CRF特征模板
附錄5 動詞配價詞典示例
附錄6 基本名詞短語提升規則
- >
企鵝口袋書系列·偉大的思想20:論自然選擇(英漢雙語)
- >
史學評論
- >
伊索寓言-世界文學名著典藏-全譯本
- >
山海經
- >
回憶愛瑪儂
- >
羅曼·羅蘭讀書隨筆-精裝
- >
大紅狗在馬戲團-大紅狗克里弗-助人
- >
李白與唐代文化