>
>
網(wǎng)絡(luò)信息采集加工與應(yīng)用技術(shù)
網(wǎng)絡(luò)信息采集加工與應(yīng)用技術(shù) 版權(quán)信息
- ISBN:9787559133458
- 條形碼:9787559133458 ; 978-7-5591-3345-8
- 裝幀:一般膠版紙
- 冊數(shù):暫無
- 重量:暫無
- 所屬分類:>
網(wǎng)絡(luò)信息采集加工與應(yīng)用技術(shù) 內(nèi)容簡介
本書重點(diǎn)介紹了網(wǎng)絡(luò)信息采集的主要技術(shù)方法、信息加工的主要技術(shù)以及信息應(yīng)用具體實(shí)踐等內(nèi)容。其中的信息采集部分主要介紹了基于RSS訂閱、網(wǎng)絡(luò)爬蟲、網(wǎng)站API、物聯(lián)網(wǎng)傳感器、問答大模型等信息采集方式,以及信源發(fā)現(xiàn)技術(shù)、主題采集技術(shù)、定點(diǎn)采集技術(shù)和常用采集工具等;信息加工部分主要介紹了時(shí)間信息識別與標(biāo)準(zhǔn)化技術(shù)、實(shí)體關(guān)系分類技術(shù)、文本摘要生成技術(shù)、事件抽取技術(shù)、文獻(xiàn)聚類技術(shù)、技術(shù)脈絡(luò)分析技術(shù)等;信息應(yīng)用部分主要介紹了信息推薦技術(shù)、信息采集平臺的構(gòu)建以及知識管理平臺的構(gòu)建等。
網(wǎng)絡(luò)信息采集加工與應(yīng)用技術(shù) 目錄
**部分信息采集技術(shù)
1互聯(lián)網(wǎng)信息資源的值
2網(wǎng)絡(luò)信息采集的主要方式
2.1基于RSS 訂閱的信息采集
2.2基于網(wǎng)絡(luò)爬蟲的信息采集
2.3基于網(wǎng)站API的信息采集
2.4基于物聯(lián)網(wǎng)傳感器的信息采集
2.5基于問答大模型的信息采集
3網(wǎng)絡(luò)信息采集的主要技術(shù)
3.1定點(diǎn)采集技術(shù)
3.2主題采集技術(shù)
3.3采集技術(shù)
3.4實(shí)時(shí)流數(shù)據(jù)采集技術(shù)
4網(wǎng)絡(luò)信息采集的主要工具
4.1 Scrapy
4.2BeautifulSoup
4.3Selenium
4.4PySpider
4.pache Nutch
4.6Goutte
4.7Crawlera
4.8Apify
4.9Octoparse
4.10Import. io
4.11Content Grabber
4.12ParseHub
4.13WebHarvy
5基于網(wǎng)站特征分析的信源發(fā)現(xiàn)技術(shù)
5.1問題的提出及相關(guān)研究
5.2網(wǎng)站特征分析及數(shù)據(jù)處理
5.3基于網(wǎng)站特征分析的相關(guān)度計(jì)算
5.4信源發(fā)現(xiàn)技術(shù)系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)
5.5研究結(jié)論
延伸閱讀
……
第二部分信息加工技術(shù)
第三部分信息應(yīng)用技術(shù)
展開全部
書友推薦
- >
名家?guī)阕x魯迅:故事新編
- >
新文學(xué)天穹兩巨星--魯迅與胡適/紅燭學(xué)術(shù)叢書(紅燭學(xué)術(shù)叢書)
- >
【精裝繪本】畫給孩子的中國神話
- >
煙與鏡
- >
羅庸西南聯(lián)大授課錄
- >
人文閱讀與收藏·良友文學(xué)叢書:一天的工作
- >
月亮與六便士
- >
山海經(jīng)
本類暢銷