-
>
妙相梵容
-
>
基立爾蒙文:蒙文
-
>
我的石頭記
-
>
心靈元氣社
-
>
女性生存戰爭
-
>
縣中的孩子 中國縣域教育生態
-
>
(精)人類的明天(八品)
概念背景圖及其應用 版權信息
- ISBN:9787030726261
- 條形碼:9787030726261 ; 978-7-03-072626-1
- 裝幀:一般膠版紙
- 冊數:暫無
- 重量:暫無
- 所屬分類:>>
概念背景圖及其應用 內容簡介
知識工程是人工智能發展中重要的研究工作。形式概念分析提出后廣泛用戶不同領域的知識表示,近年來知識圖譜在信息檢索領域解決了不同層面應用的知識表達和知識推理中。在形式概念分析和知識圖譜研究工作上,圍繞一些不適合建立領域知識圖譜的應用背景,知識的獲取、知識的表示、知識推理等問題,提出了從文本中一些具有內涵和外延概念這一知識的提取方法;圍繞互聯網網頁獲取這一背景,首次提出了概念之間的語義相似計算方法、網頁獲取過程中分層概念背景圖的基本概念、理論基礎、實現算法。用于解決領域工程中知識的表示和表達。將該分層概念背景圖用于解決互聯網文本語義計算和網頁獲取的取得了良好的效果。
概念背景圖及其應用 目錄
第1章 概念背景圖的數學基礎 1
1.1 偏序 1
1.2 偏序與有向無環圖 3
1.3 格 5
1.4 閉包算子和Galois連接 6
1.5 概念與概念格 6
第2章 概念及其挖掘 10
2.1 概念格的構建算法 10
2.1.1 批處理算法 10
2.1.2 增量算法 11
2.2 基于信息系統的概念提取方法 12
2.3 多值形式背景概念格的構建 14
2.3.1 形式背景與概念 15
2.3.2 構造概念格的算法 19
2.3.3 算法復雜度分析 25
2.3.4 正確性分析 26
2.3.5 有效性分析 28
2.3.6 實驗分析 28
2.4 基于矩陣運算的概念格構建 30
2.4.1 獲取形式概念 31
2.4.2 建格算法 33
2.4.3 實例分析 36
2.4.4 算法分析 37
2.4.5 仿真實驗 38
2.4.6 實驗分析 41
第3章 概念之間的關系 43
3.1 格上概念相似度的計算 43
3.2 基于編輯距離的相似性度量方法 45
3.3 概念相似度計算 47
3.4 概念相似度的典型應用 49
3.4.1 概念與Agent間的相似度計算方法 49
3.4.2 Agents間的相似度計算方法 50
3.4.3 兩個Agent Crawlers間的理解度 50
第4章 知識圖譜相關技術 54
4.1 實體獲取主要方法 55
4.1.1 基于詞典知識庫的方法 56
4.1.2 基于種子概念的方法 56
4.1.3 基于語言學規則的方法 57
4.1.4 基于統計機器學習的方法 57
4.1.5 混合方法 58
4.2 關系提取 59
4.2.1 人物互動關系提取算法 59
4.2.2 微博的特點改進依賴三元核 60
4.2.3 依賴三元核詞項語義特征和句法特征改進方法 61
4.3 微博人物互動關系分類 67
4.3.1 關系描述詞提取規則 68
4.3.2 詞典分類關系描述詞 69
4.4 知識圖譜的建立 73
第5章 相關背景圖及其構建 75
5.1 鏈接背景圖 75
5.2 相關背景圖的研究 77
5.2.1 相關背景圖在鏈接上存在的缺陷 79
5.2.2 改進思路 80
5.2.3 改進方法 81
5.2.4 算法舉例說明 84
5.2.5 鏈接路徑的相關背景圖的改進實驗結果 86
5.3 網頁語義上的相關背景圖的改進 90
5.3.1 HowNet的相關預備知識 90
5.3.2 單詞的相似性計算 92
5.3.3 文檔的相似性 94
5.3.4 重新定義相關性信任度 94
5.3.5 擴展主題特征詞 95
5.3.6 網頁語義的相關背景圖的改進實驗結果 96
5.4 相關背景圖的應用 99
5.4.1 發現與主題相關的微博用戶 99
5.4.2 主題相關用戶的收集 102
5.5 實驗以及評價 104
5.5.1 構造實驗數據集 104
5.5.2 評價指標 105
5.5.3 實驗結果與分析 106
第6章 概念背景圖及構建 108
6.1 概念格上隱含的關系 108
6.2 格上核心概念的定義 109
6.3 格上概念距離的計算 110
6.4 概念相似度的應用 113
6.5 概念背景圖的構建 114
6.6 概念背景圖在網頁挖掘中的應用 118
6.7 概念背景圖的更新 123
6.7.1 增量概念及其產生算法 123
6.7.2 更新概念背景圖 126
6.7.3 刪除主題不相關概念 128
6.8 概念背景圖的系統實現及應用 132
6.8.1 系統構建 132
6.8.2 實驗數據集的介紹 133
6.8.3 評價指標 135
6.8.4 結果分析 135
第7章 不同類型的概念背景圖 138
7.1 領域本體的語義相關度度量 138
7.1.1 語義相關度 138
7.1.2 語義相關度度量 139
7.2 WordNet與語義相關度 141
7.2.1 WordNet概述 141
7.2.2 基于WordNet的語義相關度 142
7.2.3 信息內容與語義相關度 143
7.3 領域本體和相似概念背景圖的主題爬行策略 144
7.3.1 鏈接分析概述 145
7.3.2 領域本體和相似概念背景圖的主題爬行流程 145
7.4 實驗及結果分析 150
7.4.1 準備數據集 150
7.4.2 收集主題數據及處理 152
7.4.3 構建相似概念背景圖 153
7.4.4 計算錨文本相關度及預測URL優先級分值 154
7.5 實驗結果對比分析 155
第8章 概念背景圖的分層 158
8.1 概念背景圖的參數確定 158
8.2 概念背景圖的層次劃分 158
8.3 獲取OSCCG及OPV的詳細過程 162
8.4 概念背景圖的更新機制 163
8.4.1 相關概念 163
8.4.2 概念背景圖中概念的更新 164
8.4.3 概念背景圖層次的更新 167
8.5 實驗及結果分析 169
8.5.1 **部分實驗結果 171
8.5.2 第二部分實驗結果 173
參考文獻 175
概念背景圖及其應用 節選
第1章 概念背景圖的數學基礎 概念背景圖(concept context graph,CCG)中的“概念”一詞,借鑒人類自然語言中的“概念”,包含外延和內涵。概念的內涵是指一個概念反映的事物的本質屬性的總和,即概念的內容。例如:“商品是用來交換的勞動產品”,其中,“用來交換的勞動產品”就是概念“商品”的內涵。概念的外延是指這個概念所反映的事物對象(人、地、事、物)的范圍,即具有概念所反映的屬性的事物或對象。內涵和外延之間存在著某種特殊的聯系,這種聯系表明,內涵所描述的屬性是外延所有對象共同具有的,外延包含的所有對象也只能具有其內涵描述的屬性。內涵對外延來講是封閉的,外延對內涵來講也是封閉的。一些概念之間存在著泛化、特化、同義、近義等關系。形式概念分析利用數學中的序、格將自然語言中的概念進行了形式化的定義,并對概念之間的這些關系進行討論。本章重點討論一些相關的序、格、概念格等內容。 1.1 偏序 一般來講兩個具有固定秩序的客體x和y組成一個序偶。序偶是有序二元組,與集合不同。對于集合而言。但對于序偶和,它們是不相等的。比如集合與集合是相同的,包括2和3兩個元素,而直角坐標系上的點序偶和分別表示不同的點。 定義1.1(序偶相等)序偶和相等,即,當且僅當且。 在許多研究中,序偶常常來源于兩個不同的集合或領域,用來研究兩類不同事物之間的關系。任意給定兩個集合,可以定義一種序偶。建立在一定應用背景下的序偶,其中的兩個集合具有一定的聯系,那么這樣的序偶就有特定的意義。沒有建立在一定應用背景下的序偶,是沒有實際意義的。 定義1.2(笛卡兒積)令X與Y是任意兩個集合,對于序偶,x是X中的元素,y是Y中的元素。所有這樣的序偶的集合,稱為集合X和Y的笛卡兒積或直積,記作,定義式為 (1.1) 例1.1 設X是三個網頁的集合,包含三個不同的URL,即,Y是三個網頁共有關鍵詞的集合,包括人工智能(artificial intelligence,AI)和深度學習(deep learning,DL)。 定義1.3(二元關系)[1] 令X與Y是任意兩個集合,集合,稱R是X,Y的二元關系;若序偶,則記作。若,則說R是X上的二元關系。常用表示的逆關系,與是等價的。 例1.2 R1,R2,R3,R4,R5,R6都是集合,上的二元關系。 定義1.4(偏序關系)[1] 集合X上的二元關系R稱為一個偏序關系,如果滿足: 自反性(對任意,有); 反對稱性(對任意,若且,那么一定不存在); 傳遞性(對任意,若且)。 在這里必須說明幾個問題: (1)關于偏序關系反對稱性,對任意,若且,則。 (2)常常把偏序關系表示為,稱為小于等于關系,一個集合X上的偏序記為。 ①定義1.4中自反性可以描述為對任意,有; ②反對稱性可以描述為對任意,若且,那么一定不存在; ③傳遞性可以描述為對任意,若且。 (3)R是X上的偏序關系,若對于,必有或,則R稱為X上的全序。 ①其反自反性可以描述為對任意,有; ②反對稱性可以描述為對任意,若且,那么; ③傳遞性可以描述為對任意,若且。 例1.3 設,其是對任意包含的人物群體的包含關系,則為一個偏序集,也是一種非嚴格偏序。 設;X是Y的冪集合,其是對任意集合包含關系,則為一個偏序集,也是一種非嚴格偏序。 設X是互聯網中網頁的集合,其是對任意不存在環路的網頁鏈接通路關系,由于網頁自己不能鏈接自己,這種關系只能是。則為一個偏序集,也是一種嚴格偏序。 設X是世界所有人,其是對任意長晚輩關系,由于自己和自己不能構成長晚輩關系,這種關系只能是。則為一個偏序集,也是一種嚴格偏序。 設,X是Y的冪集合,其是對任意集合包含關系。則為一個偏序集,也是一種非嚴格偏序。 1.2 偏序與有向無環圖 偏序關系可以用一個有向無環圖表示,任意的是圖中的結點,其具體代表X集合中的元素。該偏序中的任意一個有序對必然對應G中的一段弧。 定義1.5(鄰近)[1] 在偏序關系中,對任意,若,且不存在,則稱是的下鄰近,是的上鄰近。 例1.4 設,其是對任意集合包含關系,則圖1.1是的偏序關系圖。 圖1.1 的偏序關系圖 這種偏序關系圖,可以理解為箭頭結點比箭尾結點大,默認下端比上端的結點小,可以省略圖中箭頭,這樣的圖常常稱為Hasse圖。圖1.2示意了常見的具有1到4格點半序關系的Hasse圖。 圖1.2 具有1到4格點半序關系的Hasse圖[1] 定義1.6(偏序直積)[1] 兩個偏序關系和,它們的直積定義為:,直積中關系表示滿足且。 例1.5 設X是實數集,是實數的大小關系,它們構成二維直角坐標x軸,是一個偏序關系。設Y是實數集,是實數的大小關系,它們構成二維直角坐標y軸,是一個偏序關系。就是平面直角坐標系中的點,中滿足,也即滿足且。 1.3 格 在一個偏序關系中,N是X的一個子集,X中的元素滿足對任意的,都有,則稱是N的一個下界;如果N的所有下界組成的集合中有*大元素,則稱這個元素為N的下確界。反之,在一個偏序關系中,N是X的一個子集,X中的元素s滿足對任意的,都有,則稱s是N的一個上界;如果N的所有上界組成的集合中有*小元素,則稱這個元素為N的上確界。 圖1.3是一個由10個結點組成的偏序關系,其中,則集合滿足N的下界條件,1是N的下確界;集合滿足N的上界條件,8是N的上確界。 圖1.3 10個結點組成的偏序關系圖[1] 定義1.7(完全格)[1] 設是偏序關系,若X的任意二元子集都存在上確界以及下確界,則稱是格(lattice)。若X中任意子集都存在上確界以及下確界,則稱是完全格。 (1)完全格中存在一個*大的元素(*小的上確界),稱為1元素,也存在一個*小的元素(*大的下確界),稱為0元素。 (2)在完全格中,*小元和*大元都為。 (3)在完全格上,定義兩個運算和。對任意,若,則。運算和運算分別稱為取大和取小運算。 (4)運算和運算滿足結合律、交換律和分配律。對任意,有 結合律: 分配律: 交換律: 1.4 閉包算子和Galois連接 定義1.8(閉包算子)[1] 給定偏序關系,在X上的閉包算子是函數,如果滿足以下三個條件: (1)且,具有擴展性; (2)若,則,是單調遞增函數; (3)且,是冪等函數。 定義1.9(Galois連接)[1] 給定兩個偏序關系和,令和是它們之間的兩個單調函數,與是Galois連接,當且僅當和滿足以下三個條件: (1)若,則; (2)若,則; (3) Galois連接在其他參考文獻中有另一種等價定義:和,如果,則,即,也稱和是兩個偏序關系和上的Galois連接。 定義1.10(關系Galois連接)[1] 集合X和Y上的任意一個二元關系,則X與Y之間的關系Galois連接和定義為 (1.2) 也即子集關系映射。 1.5 概念與概念格 概念是人類進行思維的*基本單位,是用來組織成為諸如判斷、結論等更為復雜思想的基礎,是人類進行知識表述的一種有效手段,屬于哲學的范疇。基于Birkhoff對格理論的貢獻,德國的Rudolf Wille在1982年首先將形式概念分析
- >
龍榆生:詞曲概論/大家小書
- >
羅曼·羅蘭讀書隨筆-精裝
- >
姑媽的寶刀
- >
人文閱讀與收藏·良友文學叢書:一天的工作
- >
史學評論
- >
小考拉的故事-套裝共3冊
- >
巴金-再思錄
- >
伯納黛特,你要去哪(2021新版)