-
>
全國計算機等級考試最新真考題庫模擬考場及詳解·二級MSOffice高級應用
-
>
決戰行測5000題(言語理解與表達)
-
>
軟件性能測試.分析與調優實踐之路
-
>
第一行代碼Android
-
>
JAVA持續交付
-
>
EXCEL最強教科書(完全版)(全彩印刷)
-
>
深度學習
自然語言理解與行業知識圖譜:概念、方法與工程落地:concepts, methods and practice 版權信息
- ISBN:9787111698302
- 條形碼:9787111698302 ; 978-7-111-69830-2
- 裝幀:一般膠版紙
- 冊數:暫無
- 重量:暫無
- 所屬分類:>
自然語言理解與行業知識圖譜:概念、方法與工程落地:concepts, methods and practice 本書特色
從自然語言理解入手,詳細講解了行業知識圖譜在真實項目中構建、應用、維護等階段中的各種“坑”和“技”。
自然語言理解與行業知識圖譜:概念、方法與工程落地:concepts, methods and practice 內容簡介
本部分首先闡述自然語言理解的發展脈絡和理解邏輯,主要圍繞語言符號、處理體系、語義理解等進行探討,引出自然語言理解的自動分析原理和方法,包括自然語言特征、統計學習、機器學習、深度學習、知識圖譜等。 第1章概述自然語言發展脈絡,描述了語言理解的研究現狀、商業形勢、認知突破口和未來預測。 第2章梳理語言理解的演變流程,介紹我們面臨的各類自然語言理解任務,*后給出語言理解的研究體系框架,引出自然語言理解的基礎——自然語言處理。 第3章重點介紹自然語言處理相關特征工程和文本任務對應的各類算法模型、深度學習的前沿進展。語言處理需要考慮特征構造(字、詞、句、章級別)和特征表示,以利于后續自動處理。在特征表示方面,從早的符號表示到現在的張量表示,形成統計學習的基礎。接下來結合統計學習框架,論述語言學習原理和語言模型,結合概率圖模型和其他機器學習算法,闡述這些常規算法在自然語言處理任務中的應用和效果。然后進一步討論深度學習的各類算法,對語言學習中的神經網絡算法和新成果進行分析。*后探討現有處理方法的發展邊界,提出引入外源知識(知識圖譜)來提高認知能力的必要性。 第4章系統介紹知識圖譜,包括知識圖譜工程和知識圖譜智能。然后梳理國內外常見的通用知識圖譜,并進一步總結熱門行業的知識圖譜發展現狀。*后結合語言知識和知識圖譜的搭建流程,引入語義特征,通過行業文本實例操作,幫助讀者了解語義理解的本質。 行業知識圖譜部分包含第5~8章。 本部分在上述基本自然語言處理方法講解的基礎上,繼續闡述行業知識圖譜搭建和行業應用的方法。目前從事自然語言理解的公司都將精力放在通用文本理解上,這些文本往往口語化嚴重、特征雜亂、信息量不足,導致算法處理形成的*終產品的用戶體驗不佳。考慮到行業文本往往有一定規范,相對容易取得突破口,也有利于推動行業發展,所以我們選擇從行業文本出發,以專利文本實操作為樣板。 第5章介紹行業知識工程實踐,以專利行業為例,詳細地描述了一個行業知識工程建設的過程。首先基于自然語言處理和知識圖譜搭建方法,建設行業知識庫,包括術語庫、產品庫、技術庫、標準庫、規則庫等,進而開發行業主題分析模型、行業文本分類算法、相似度計算方法、價值評估方法和機器翻譯方法。 第6章介紹知識圖譜模塊的搭建,包括關鍵詞助手、語義搜索、分級管理、高級分析、推薦和問答等。結合實際應用,探討知識圖譜在提高智能性方面的能力和效果。 第7章在前面知識工程和知識圖譜智能基礎上搭建智能應用平臺,介紹了平臺的各類功能組件,描述了自下而上的軟件服務封裝邏輯,進一步向上封裝為行業文本分析功能組件,包括檢索、分析、挖掘、管理、預警、運營等。讀者可以將這套思路在各行業進行實踐驗證,將上述組件和權限、安全板塊集成為應用平臺,搭建常態化文本分析運營平臺,完成平臺級別或各細分模塊的商業產品落地。 第8章依托智能應用平臺,結合實踐案例給出團隊的應用經驗,即通過四個行業案例來驗證平臺的認知能力。 《自然語言理解與行業知識圖譜:概念、方法與工程落地》以自然語言理解和行業知識圖譜應用落地為目標,闡述了一個從0到1的行業文本理解案例。 《自然語言理解與行業知識圖譜:概念、方法與工程落地》為互聯網企業的智能平臺構建提供了很好的案例參考,也為行業信息化從業者提供了從入門到進階的技術指導,適合作為自然語言處理、知識圖譜、計算機、人工智能等領域從業者的學習指導書,也非常適合對自然語言處理、知識圖譜感興趣的學生和創業團隊閱讀。
自然語言理解與行業知識圖譜:概念、方法與工程落地:concepts, methods and practice 目錄
自然語言理解與行業知識圖譜:概念、方法與工程落地:concepts, methods and practice 作者簡介
王楠,北京大學博士,“創青春-中關村U30”2020年度優勝者,先后任教于中國科學院、北京信息科技大學計算機學院。研究方向包括人工智能算法、知識圖譜、自然語言處理與地球電磁學等。主持或參與國家科技重大專項、高分專項、軍口預研、衛星系統、企業大數據系統等科研項目,累計獲得研發經費超過千萬元人民幣。負責企業級“專利大數據智能分析系統”的研發,領導技術團隊完成軟件平臺搭建、商用和優化。以作者身份發表行業內高水平論文十余篇,獲得多項發明和實用新型專利,提交專利申請十余項。 趙宏宇,現就職于騰訊看點搜索團隊,擔任算法研究員。有多年NLP、搜索系統、推薦系統的工作經驗,涉及專利、招聘和網頁搜索等場景。精通PyTorch、TensorFlow等主流深度學習框架,擅長運用NLP前沿技術解決工業項目難題。在意圖識別、內容推薦、相關性排序等領域有多年實戰經驗。曾參與千萬級用戶求職領域的推薦工作,作為算法主要負責人,主導全新算法落地迭代、線上算法優化以及上億DAU網頁搜索優化迭代。曾與人合著《智能搜索與推薦系統:原理、算法與應用》一書。 蔡月,清華-深圳灣實驗室聯合培養博士后,于2017年獲得北京大學生物醫學工程博士學位。曾擔任東軟醫療上海磁共振研發中心高級算法研究員。研究方向為數據科學、磁共振圖像算法、深度學習等,擅長腦科學領域數據分析、磁共振圖像加速、去噪等算法研究。曾在腦科學領域SCI期刊Neuroscience、Neurotoxicity Research上發表多篇文章,獲得多項發明專利。
- >
自卑與超越
- >
隨園食單
- >
中國人在烏蘇里邊疆區:歷史與人類學概述
- >
上帝之肋:男人的真實旅程
- >
苦雨齋序跋文-周作人自編集
- >
月亮與六便士
- >
詩經-先民的歌唱
- >
回憶愛瑪儂