国产第1页_91在线亚洲_中文字幕成人_99久久久久久_五月宗合网_久久久久国产一区二区三区四区

讀書月攻略拿走直接抄!
歡迎光臨中圖網 請 | 注冊
> >>
數據科學技術:文本分析和知識圖譜

包郵 數據科學技術:文本分析和知識圖譜

出版社:清華大學出版社出版時間:2024-01-01
開本: 其他 頁數: 344
中 圖 價:¥95.5(7.4折) 定價  ¥129.0 登錄后可看到會員價
加入購物車 收藏
開年大促, 全場包郵
?新疆、西藏除外
本類五星書更多>

數據科學技術:文本分析和知識圖譜 版權信息

數據科學技術:文本分析和知識圖譜 本書特色

《數據科學技術:文本分析和知識圖譜》是一本深入淺出的數據科學技術指南。書中詳細介紹了文本分析和知識圖譜等關鍵技術,結合典型案例展示了數據科學在安全、應急等行業的應用實踐。無論你是數據科學領域的專業人士還是對數據科學感興趣的讀者,這本書都能幫助你深入了解數據科學的基本概念、方法和*新技術。通過學習《數據科學技術:文本分析和知識圖譜》,你將能夠掌握數據科學的核心知識,為自己的職業發展和創新項目提供有力支持。

數據科學技術:文本分析和知識圖譜 內容簡介

數據科學的關鍵技術包括數據存儲計算、數據治理、結構化數據分析、語音分析、視覺分析、文本分析和知識圖譜等方面。本書的重點是詳細介紹文本分析和知識圖譜方面的技術。文本分析技術主要包括文本預訓練模型、多語種文本分析、文本情感分析、文本機器翻譯、文本智能糾錯、NL2SQL問答以及ChatGPT大語言模型等。知識圖譜技術主要包括知識圖譜構建和知識圖譜問答等。本書將理論介紹和實踐相結合,詳細闡述各個技術主題的實現路線,并對應用于業界算法大賽中的技術方案和技巧進行源代碼解讀,幫助讀者深入理解技術原理。*后,本書還介紹了文本分析和知識圖譜技術在政務、公共安全、應急等多個行業中的智能應用實踐案例。 《數據科學技術:文本分析和知識圖譜》適合具備Python和機器學習技術基礎的高等院校學生、文本分析(或者自然語言處理)以及知識圖譜領域的算法工程師和研究機構的研究者閱讀,也適合數據科學和人工智能領域的研究者作為參考書。

數據科學技術:文本分析和知識圖譜 目錄

第1章 什么是數據科學 1
1.1 數據科學的定義 1
1.1.1 數據科學的背景 1
1.1.2 數據科學的定義 1
1.2 數據科學的關鍵技術 3
1.2.1 數據存儲計算 5
1.2.2 數據治理 12
1.2.3 結構化數據分析 28
1.2.4 語音分析 44
1.2.5 視覺分析 55
1.2.6 文本分析 61
1.2.7 知識圖譜 65
1.3 本章小結 65
1.4 習題 66
1.5 本章參考文獻 66
第2章 文本預訓練模型 68
2.1 文本分析技術的發展史 68
2.2 Transformer模型結構 70
2.3 預訓練模型的結構和變種 75
2.4 加速處理器GPU和TPU 79
2.4.1 GPU的介紹 79
2.4.2 GPU產品命名 80
2.4.3 TPU和GPU的區別 83
2.4.4 TPU的使用總結 84
2.5 預訓練模型的常見問題 87
2.5.1 模型輸入的常見問題 87
2.5.2 模型原理的常見問題 90
2.5.3 模型進化的常見問題 94
2.6 預訓練模型的源碼解讀 96
2.6.1 模型架構 96
2.6.2 BertModel 96
2.6.3 BERT預訓練任務 107
2.6.4 BERT 微調 112
2.7 本章小結 114
2.8 習題 114
2.9 本章參考文獻 115
第3章 多語種文本分析 116
3.1 多語種文本分析背景介紹 116
3.2 多語種文本分析技術 116
3.2.1 Polyglot技術 116
3.2.2 Multilingual BERT 117
3.2.3 XLM多語言模型 117
3.2.4 XLMR多語言模型 119
3.2.5 模型實驗效果 120
3.3 多語種文本分析源碼解讀 121
3.4 本章小結 125
3.5 習題 126
3.6 本章參考文獻 126
第4章 文本情感分析 127
4.1 情感分析背景介紹 127
4.2 情感分析技術 127
4.2.1 目標和挑戰 127
4.2.2 技術發展歷程 129
4.2.3 情感分析的需求分析 133
4.2.4 情感分析的落地實踐 134
4.2.5 模型開發平臺的構建 137
4.3 情感分析比賽和方案 144
4.3.1 背景介紹 144
4.3.2 方案介紹 146
4.3.3 數據清洗和增廣 147
4.3.4 多模態融合 147
4.3.5 機器學習技巧 148
4.4 情感分析源碼解讀 151
4.4.1 F1值適應優化技巧代碼 151
4.4.2 對抗訓練代碼 152
4.5 本章小結 154
4.6 習題 154
4.7 本章參考文獻 155
第5章 文本機器翻譯 156
5.1 機器翻譯背景介紹 156
5.2 機器翻譯技術 157
5.2.1 基于規則的機器翻譯 157
5.2.2 統計機器翻譯 158
5.2.3 神經網絡機器翻譯 159
5.2.4 Encoder-Decoder模型 161
5.2.5 注意力機制模型 162
5.2.6 工業級神經網絡實踐 164
5.3 機器翻譯比賽和方案 167
5.3.1 WMT21翻譯任務 167
5.3.2 WMT22 翻譯任務 168
5.4 機器翻譯源碼解讀 169
5.4.1 通用框架介紹 169
5.4.2 翻譯模型實現 170
5.5 本章小結 180
5.6 習題 181
5.7 本章參考文獻 181
第6章 文本智能糾錯 183
6.1 文本糾錯背景介紹 183
6.2 文本智能糾錯技術 184
6.2.1 智能糾錯的意義和難點 185
6.2.2 智能糾錯解決的問題 185
6.2.3 業界主流解決方案 186
6.2.4 技術方案實踐 190
6.3 文本智能糾錯技術 193
6.3.1 比賽介紹 193
6.3.2 校對問題思考 194
6.4 糾錯方案和源碼解讀 195
6.4.1 GECToR原理解讀 195
6.4.2 MacBERT原理解讀 199
6.4.3 PERT原理解讀 200
6.4.4 PLOME原理解讀 202
6.4.5 比賽方案 203
6.5 本章小結 204
6.6 習題 205
6.7 本章參考文獻 205
第7章 知識圖譜構建 206
7.1 知識圖譜背景介紹 206
7.1.1 知識和知識圖譜 206
7.1.2 知識獲取、知識抽取與信息抽取
的區別207
7.1.3 知識圖譜構建范式 208
7.2 非結構化信息抽取技術 211
7.2.1 信息抽取框架 211
7.2.2 命名實體識別 212
7.2.3 關系識別 213
7.2.4 事件抽取 215
7.3 生成式統一模型抽取技術 216
7.4 模型源碼解讀 220
7.5 本章小結 224
7.6 習題 224
7.7 本章參考文獻 225
第8章 知識圖譜問答 226
8.1 背景介紹 226
8.2 知識圖譜問答技術 229
8.2.1 信息檢索方法 229
8.2.2 語義解析方法 231
8.3 方案和源碼解讀 233
8.3.1 NL2SPARQL 233
8.3.2 NL2SPARQL語義解析方案 234
8.3.3 T5、BART、UniLM模型簡介 234
8.3.4 T5、BART、UniLM方案 236
8.3.5 訓練T5、BART、UniLM
生成模型 237
8.3.6 語義排序方案和代碼 239
8.3.7 SPARQL修正代碼 241
8.4 本章小結 245
8.5 習題 245
第9章 結構化知識NL2SQL問答 246
9.1 NL2SQL背景介紹 246
9.2 NL2SQL技術 249
9.2.1 NL2SQL技術路線 249
9.2.2 NL2SQL項目實踐 255
9.3 NL2SQL比賽和方案 256
9.4 NL2SQL源碼解讀 259
9.5 本章小結 269
9.6 習題 269
9.7 本章參考文獻 270
第10章 ChatGPT大語言模型 271
10.1 ChatGPT介紹 271
10.1.1 ChatGPT的定義和背景 271
10.1.2 ChatGPT的發展歷程 272
10.2 GPT模型概述 272
10.2.1 GPT-1模型的原理 272
10.2.2 GPT-2模型的原理 273
10.2.3 GPT-3模型的原理 275
10.3 ChatGPT的實現原理 277
10.3.1 大模型的微調技術 277
10.3.2 ChatGPT的能力來源 278
10.3.3 ChatGPT的預訓練和微調 279
10.4 ChatGPT的應用 282
10.4.1 ChatGPT提示工程 282
10.4.2 ChatGPT應用場景 283
10.4.3 ChatGPT的優缺點 284
10.5 開源大模型 285
10.5.1 ChatGLM大模型 285
10.5.2 LLaMA大模型 288
10.6 本章小結 294
10.7 習題 294
10.8 本章參考文獻 295
第11章 行業實踐案例 296
11.1 智慧政務實踐案例 296
11.1.1 案例背景 296
11.1.2 解決方案 297
11.1.3 系統架構和實現 299
11.1.4 案例總結 307
11.2 公共安全實踐案例 308
11.2.1 案例背景 308
11.2.2 解決方案 309
11.2.3 系統架構及實現 311
11.2.4 案例總結 317
11.3 智能應急實踐案例 318
11.3.1 案例背景 319
11.3.2 解決方案 320
11.3.3 系統架構及實現 321
11.3.4 案例總結 332
11.4 本章小結 334
11.5 習題 334
展開全部

數據科學技術:文本分析和知識圖譜 作者簡介

蘇海波
清華大學電子工程系博士,副研究員,在文本分析、知識圖譜、大模型等人工智能方向擁有超過十年的研發實踐經驗。多篇SCI和EI論文發表于國外頂尖學術會議和期刊,獲得國家發明專利20余項,曾擔任科技部重點研發計劃子課題負責人。獲得2019年和2020年北京市科學技術進步獎,帶領團隊獲得多個業界知名算法技術評測的冠軍和亞軍。 劉譯璟
北京大學博士、正高級工程師,現任北京百分點科技集團股份有限公司CTO。在云計算、大數據、人工智能等領域擁有15年研究和工作經驗。曾榮獲北京市科學技術獎等獎項,承擔國家科技部重點研發計劃項目2項,參與多個國家自然科學基金項目,多篇論文曾發表于國內外學術刊物。 易顯維
中國地質大學碩士,擁有12年AI算法研發崗相關研發管理經驗。在數據挖掘、OCR、文本分析等方面擁有豐富的實踐經驗,在眾多知名企事業單位舉辦的高水平機器學習算法競賽中累計獲獎20余次。 蘇 萌
美國康奈爾大學博士,研究員, 現任北京百分點科技集團股份有限公司董事長兼CEO、北京大學國家發展研究院實踐教授、北京大學光華管理學院實踐教授、北京市商會副會長、海淀區工商聯副主席、海淀區政協委員、國務院學位委員會全國應用統計專業 “大數據專家委員會" 委員等。曾執教于北京大學光華管理學院,任副系主任、博士生導師。

商品評論(0條)
暫無評論……
書友推薦
本類暢銷
編輯推薦
返回頂部
中圖網
在線客服
主站蜘蛛池模板: 久草电影在线播放 | 四虎网站在线观看 | 少女高清影视在线观看动漫 | 国产大片黄在线观看私人影院 | 99在线精品免费视频九九视 | 亚洲午夜久久久影院伊人 | 午夜男女刺激爽爽影院 | 美女扒开屁股让男人桶 | 亚洲一本大道无码av天堂 | 高清在线观看自拍视频 | 国产精品欧美久久久久无广告 | 99在线热播精品免费 | 亚洲一区无码中文字幕乱码 | 日本三级视频在线观看 | 久草网在线 | 亚洲一区二区三区日本久久九 | 亚洲毛片无码专区亚洲乱 | 亚洲午夜久久久精品电影院 | 四虎在线影视在线影库 | 日本黄网站免费 | 国产中年熟女高潮大集合 | 久久精品视频在线 | 亚洲天堂久久 | 高清性色生活片久久久 | 国产成人精品亚洲日本在线 | 日韩 ed2k | 成人无码视频在线观看网站 | 国产精品后入内射日本在线观看 | 国产精品视频一区麻豆 | 少妇被爽到高潮喷水久久欧美精品 | 亚洲精品一区二区三区美女 | 天天摸天天做天天爽水多 | 午夜福利伦伦电影理论片在线观看 | 拍真实国产伦偷精品 | 欧美一区精品二区三区 | 中文字幕 亚洲一区 | 成年人小视频在线观看 | 欧美喷潮久久久xxxxx | 亚洲色欧美色2019在线 | 日韩插啊免费视频在线观看 | 亚洲av中文无码字幕色三 |