零基礎(chǔ)開發(fā)AI AGENT――手把手教你用扣子做智能體 版權(quán)信息
- ISBN:9787121483714
- 條形碼:9787121483714 ; 978-7-121-48371-4
- 裝幀:平裝-膠訂
- 冊數(shù):暫無
- 重量:暫無
- 所屬分類:>>
零基礎(chǔ)開發(fā)AI AGENT――手把手教你用扣子做智能體 本書特色
(1)不懂編程是很多人開發(fā)Agent的痛點,扣子提供了一個零門檻開發(fā)Agent的平臺。通過可視化設(shè)計,不懂編程也能開發(fā)Agent。
(2)沒有開發(fā)思路也不用擔(dān)心,本書詳細(xì)介紹了開發(fā)Agent的實施框架,即明確應(yīng)用場景、梳理業(yè)務(wù)流程和分析痛點、梳理Agent的功能定位和開發(fā)需求、繪制Agent的運行流程圖、設(shè)置大模型及參數(shù)、設(shè)計提示詞、配置Agent技能、設(shè)計用戶溝通頁面、測試與調(diào)優(yōu)、發(fā)布。只要懂業(yè)務(wù)就能開發(fā)Agent,如果懂代碼就可以更好地開發(fā)Agent。
(3)AI Agent在個人工作提效、企業(yè)降本增效、提升生產(chǎn)力上都有巨大潛力。掌握先進(jìn)生產(chǎn)力,快人一步。
零基礎(chǔ)開發(fā)AI AGENT――手把手教你用扣子做智能體 內(nèi)容簡介
Agent(智能體)是大模型落地的重要方向,是AI技術(shù)的下一個風(fēng)口。為了讓更多非技術(shù)出身的人能夠通俗地理解Agent,并零門檻利用Agent開發(fā)平臺設(shè)計自己的Agent,我們撰寫了本書。 本書分為入門篇、工具篇、實戰(zhàn)篇。入門篇介紹了Agent的概念、發(fā)展、與Prompt和Copilot的區(qū)別,Agent對個人和企業(yè)的價值,以及開發(fā)Agent需要掌握的基礎(chǔ)知識。工具篇詳細(xì)介紹了Agent開發(fā)平臺的演進(jìn),盤點了國內(nèi)的主流Agent開發(fā)平臺,重點介紹了扣子平臺的操作要點,并提出了Agent開發(fā)的通用流程。實戰(zhàn)篇圍繞5個典型的Agent使用場景,詳細(xì)介紹了11個Agent的開發(fā)過程。 本書適合對AI感興趣的讀者閱讀,包括學(xué)習(xí)Agent的開發(fā)者、想要提升工作效率的職場人、推動企業(yè)AI深化應(yīng)用的管理者、希望在AI領(lǐng)域創(chuàng)業(yè)的人、學(xué)校的老師和學(xué)生等。 無論你是哪種類型的讀者,本書都能幫助你系統(tǒng)并且輕松地掌握Agent從概念到實操的相關(guān)知識、技能和方法,讓你在AI時代更好地適應(yīng)工作和生活。
零基礎(chǔ)開發(fā)AI AGENT――手把手教你用扣子做智能體零基礎(chǔ)開發(fā)AI AGENT――手把手教你用扣子做智能體 前言
以ChatGPT的發(fā)布為標(biāo)志,我們似乎進(jìn)入了一個新的時代。生成式AI(人工智能)技術(shù)正在以前所未有的速度發(fā)展。AI技術(shù)被認(rèn)為是一項顛覆性的創(chuàng)新技術(shù),甚至被認(rèn)為催生了第四次工業(yè)革命。截至2024年10月,我國大模型的注冊用戶數(shù)超過6億,人工智能企業(yè)已超過4500戶,完成備案并上線的生成式人工智能服務(wù)大模型超過200個。
當(dāng)您閱讀本書時,相信您對AI技術(shù)已不再陌生,您身邊的人,或多或少、或主動或被動,對AI技術(shù)可能都有一定的了解。有的人在日常工作中已經(jīng)離不開AI工具了,借助各類AI工具,工作效率和工作質(zhì)量都有了明顯提高;有的人的商業(yè)嗅覺敏銳,已經(jīng)投身于AI應(yīng)用的創(chuàng)業(yè)大潮中;有的人看到了AI技術(shù)未來會帶來企業(yè)運營模式和成本結(jié)構(gòu)的改變,開始在自己的企業(yè)中引進(jìn)AI數(shù)字員工,實現(xiàn)降本增效。當(dāng)然,也有的人雖然了解AI概念,但親自使用AI工具的頻率還不高。
總體來看,目前還處于AI技術(shù)發(fā)展的早期,如何將大模型應(yīng)用到具體的業(yè)務(wù)場景中,實現(xiàn)商業(yè)價值變現(xiàn),是AI創(chuàng)業(yè)者和從業(yè)者在探索的重要課題。在這一背景下,AI Agent(智能體,簡稱Agent)應(yīng)運而生,成為AI落地的重要方向。
Agent是利用大模型構(gòu)建的面向業(yè)務(wù)場景的AI應(yīng)用,在大模型能力的基礎(chǔ)上,通過記憶、規(guī)劃、使用工具等能力,能夠執(zhí)行更復(fù)雜的任務(wù)。與使用Prompt(提示詞)和大模型對話相比,Agent更智能、更有效。
零基礎(chǔ)開發(fā)AI AGENT――手把手教你用扣子做智能體 目錄
入門篇——人人都需要AI Agent
第1章 為什么要學(xué)習(xí)AI Agent 3
1.1 初步認(rèn)識Agent 3
1.1.1 Agent的概念與發(fā)展 3
1.1.2 Agent是高層級的AI技術(shù)應(yīng)用 5
1.1.3 Agent的特點與能力 7
1.2 Agent讓大模型更可用 8
1.2.1 大模型 Agent,實現(xiàn)AI應(yīng)用場景化 8
1.2.2 Agent讓傳統(tǒng)軟件更智能 9
1.2.3 百花齊放,Agent是下一代應(yīng)用 11
1.3 Agent對個人和企業(yè)的價值 12
1.3.1 Agent影響個人工作和生活方式 12
1.3.2 Agent助力企業(yè)降本增效 14
第2章 開發(fā)Agent的知識儲備 18
2.1 了解Agent的工作原理 18
2.1.1 Agent的基本決策流程:感知—規(guī)劃—行動 18
2.1.2 Agent的4大能力:規(guī)劃、記憶、使用工具、行動 19
2.1.3 Agent相關(guān)術(shù)語 20
2.2 規(guī)劃Agent業(yè)務(wù)場景所需的業(yè)務(wù)流程知識 24
2.2.1 開發(fā)Agent為什么要學(xué)習(xí)業(yè)務(wù)流程知識 24
2.2.2 Agent開發(fā)者的業(yè)務(wù)流程工具箱 26
2.3 開發(fā)Agent是否需要掌握編程技術(shù) 30
2.3.1 借助Agent開發(fā)平臺,不會編程也可以開發(fā)Agent 30
2.3.2 掌握編程技術(shù),有助于Agent開發(fā)進(jìn)階 32
工具篇——Agent開發(fā)很簡單
第3章 認(rèn)識Agent開發(fā)平臺 35
3.1 Agent開發(fā)平臺的演進(jìn) 35
3.1.1 什么是Agent開發(fā)平臺 35
3.1.2 國外的Agent開發(fā)平臺的進(jìn)化歷程 37
3.1.3 Agent開發(fā)平臺的發(fā)展趨勢 40
3.2 國內(nèi)的Agent開發(fā)平臺速覽 41
3.2.1 國內(nèi)的Agent開發(fā)平臺梳理 41
3.2.2 Agent開發(fā)平臺綜合對比 49
3.3 扣子國內(nèi)版 52
3.3.1 扣子的特點 52
3.3.2 扣子的功能布局與使用技巧速覽 53
第4章 開發(fā)Agent的流程與策略 58
4.1 開發(fā)Agent的通用流程 58
4.1.1 開發(fā)Agent的“3-10”實施框架 58
4.1.2 規(guī)劃Agent 59
4.1.3 設(shè)計Agent 61
4.1.4 上線Agent 67
4.2 開發(fā)Agent的策略 69
4.2.1 懂場景和業(yè)務(wù),比懂AI技術(shù)更重要 70
4.2.2 通過工具拓展能力,是Agent具有價值的關(guān)鍵 70
4.2.3 堅持小而美,聚焦特定的應(yīng)用場景和功能 71
4.2.4 把Agent當(dāng)成助手,而不是一個完全托管的解決方案 71
第5章 Agent開發(fā)的功能模塊詳解——插件、工作流、圖像流 72
5.1 插件 72
5.1.1 什么是插件 72
5.1.2 在扣子的插件商店中給Agent配置插件 80
5.1.3 通過API文檔創(chuàng)建插件 83
5.2 工作流 92
5.2.1 工作流的組成 93
5.2.2 工作流節(jié)點詳解 94
5.2.3 創(chuàng)建、鏈接測試及發(fā)布工作流 112
5.3 圖像流 114
5.3.1 圖像流的組成 115
5.3.2 圖像流的工具詳解 115
5.3.3 創(chuàng)建和使用圖像流 123
5.3.4 圖像流實戰(zhàn)案例——換臉 126
第6章 Agent開發(fā)的功能模塊詳解——知識庫、記憶與對話體驗 128
6.1 知識庫 128
6.1.1 什么是Agent知識庫 128
6.1.2 Agent知識庫的功能 128
6.1.3 Agent知識庫的運行邏輯 129
6.1.4 創(chuàng)建知識庫 131
6.1.5 使用知識庫 142
6.2 變量 144
6.2.1 什么是變量 144
6.2.2 變量的應(yīng)用 145
6.3 數(shù)據(jù)庫 146
6.3.1 什么是數(shù)據(jù)庫 146
6.3.3 Agent數(shù)據(jù)庫的應(yīng)用 147
6.4 卡片 150
6.5 其他技能項 153
6.5.1 長期記憶 153
6.5.2 文件盒子 154
6.5.3 對話體驗及角色 157
實戰(zhàn)篇——5大場景、11個Agent案例
第7章 開發(fā)專業(yè)分析類Agent 163
7.1 業(yè)務(wù)場景解讀:對特定領(lǐng)域長文檔的深度理解與專業(yè)輸出 163
7.1.1 什么是專業(yè)分析類Agent 163
7.1.2 專業(yè)分析類Agent的使用場景 164
7.1.3 專業(yè)分析類Agent的3大核心功能 165
7.2 入門案例1:AI投標(biāo)助手 166
7.2.1 規(guī)劃Agent:自動檢索招標(biāo)文件關(guān)鍵信息的投標(biāo)助手 166
7.2.2 AI投標(biāo)助手的開發(fā)過程詳解 168
7.2.3 AI投標(biāo)助手的運行效果 179
7.3 進(jìn)階案例2:調(diào)研診斷Agent 182
7.3.1 規(guī)劃Agent:可替代初級顧問的AI數(shù)字員工 182
7.3.2 調(diào)研診斷Agent的開發(fā)過程詳解 185
7.2.3 調(diào)研診斷Agent的運行效果 198
7.4 舉一反三:專業(yè)分析類Agent的開發(fā)小結(jié) 202
第8章 開發(fā)角色扮演類Agent 204
8.1 業(yè)務(wù)場景解讀:讓Agent具有鮮明的人物個性及能力標(biāo)簽 204
8.1.1 什么是角色扮演類Agent 204
8.1.2 角色扮演類Agent的使用場景 204
8.1.3 角色扮演類Agent的核心功能和開發(fā)要點 205
8.2 入門案例1:小學(xué)生的英語口語陪練Agent 206
8.2.1 規(guī)劃Agent:小學(xué)生的英語口語陪練引導(dǎo)老師 206
8.2.2 小學(xué)生的英語口語陪練Agent的開發(fā)過程詳解 207
8.2.3 小學(xué)生的英語口語陪練Agent的運行效果 209
8.3 進(jìn)階案例2:模擬面試官Agent 210
8.3.1 規(guī)劃Agent:幫助提升面試水平的模擬面試官 210
8.3.2 模擬面試官Agent的開發(fā)過程詳解 212
8.3.3 模擬面試官Agent的運行效果 215
8.4 進(jìn)階案例3:多專家Agent 218
8.4.1 多Agent系統(tǒng)的概念與現(xiàn)狀 218
8.4.2 設(shè)計意大利旅行Agent 219
8.5 舉一反三:角色扮演類Agent的開發(fā)小結(jié) 230
第9章 開發(fā)知識問答類Agent 231
9.1 業(yè)務(wù)場景解讀:基于對知識的理解提供更專業(yè)的回復(fù) 231
9.1.1 什么是知識問答類Agent 231
9.1.2 知識問答類Agent的使用場景 233
9.1.3 知識問答類Agent的3大開發(fā)要點 234
9.2 入門案例1:公司首席知識官Agent 236
9.2.1 規(guī)劃Agent:變被動管理企業(yè)知識為主動響應(yīng) 236
9.2.2 公司首席知識官Agent的開發(fā)過程詳解 238
9.2.3 公司首席知識官Agent的運行效果 247
9.3 進(jìn)階案例2:全能助理問問Agent 249
9.3.1 規(guī)劃Agent:萬能問答小助手 249
9.3.2 全能助理問問Agent的開發(fā)過程詳解 250
9.3.3 全能助理問問Agent的運行效果 260
9.4 舉一反三:知識問答類Agent的開發(fā)小結(jié) 263
第10章 開發(fā)內(nèi)容營銷和自媒體運營類Agent 264
10.1 業(yè)務(wù)場景解讀:基于豐富的語料和語音能力提高大模型的創(chuàng)作力 264
10.1.1 什么是內(nèi)容營銷和自媒體運營類Agent 264
10.1.2 內(nèi)容營銷和自媒體運營類Agent的使用場景 265
10.1.3 內(nèi)容營銷和自媒體運營類Agent的核心功能和開發(fā)要點 266
10.2 入門案例1:每日AI簡報Agent 266
10.2.1 規(guī)劃Agent:自動化的新媒體運營官 266
10.2.2 每日AI簡報Agent的開發(fā)過程詳解 267
10.2.3 每日AI簡報Agent的運行效果 271
10.3 進(jìn)階案例2:抖音熱點視頻轉(zhuǎn)小紅書圖文筆記Agent 273
10.3.1 規(guī)劃Agent:跨平臺自動轉(zhuǎn)換文案的達(dá)人 273
10.3.2 抖音熱點視頻轉(zhuǎn)小紅書圖文筆記Agent的開發(fā)過程詳解 275
10.3.3 抖音熱點視頻轉(zhuǎn)小紅書圖文筆記Agent的運行效果 285
10.3.4 復(fù)盤 286
10.4 舉一反三:內(nèi)容營銷和自媒體運營類Agent的開發(fā)小結(jié) 287
第11章 開發(fā)效率辦公類Agent 289
11.1 業(yè)務(wù)場景解讀:日常辦公流程的智能化與自動化 289
11.1.1 什么是效率辦公類Agent 289
11.1.2 效率辦公類Agent的使用場景 290
11.1.3 效率辦公類Agent的核心功能和開發(fā)要點 291
11.2 入門案例1:文本糾錯助手Agent 292
11.2.1 規(guī)劃Agent:提高文檔質(zhì)量的AI助手 292
11.2.2 文本糾錯助手Agent的開發(fā)詳解 294
11.2.3 文本糾錯助手Agent的運行效果 298
11.3 進(jìn)階案例2:會議紀(jì)要助手Agent 299
11.3.1 規(guī)劃Agent:可以自動化生成會議紀(jì)要的AI數(shù)字員工 299
11.3.2 會議紀(jì)要助手Agent的開發(fā)過程詳解 301
11.3.3 會議紀(jì)要助手Agent的運行效果 311
11.4 舉一反三:效率辦公類Agent的開發(fā)小結(jié) 313
零基礎(chǔ)開發(fā)AI AGENT――手把手教你用扣子做智能體 相關(guān)資料
AI技術(shù)正在迅速滲透到社會的各個領(lǐng)域,以獨特的方式深刻影響并重塑我們的工作和生活方式。在這個快速變革的時代,掌握AI技術(shù)以提升工作效率和豐富生活體驗,已成為現(xiàn)代人不可或缺的核心能力。葉濤等憑借多年跨學(xué)科研究經(jīng)驗,以及在管理顧問職業(yè)生涯中積累的豐富的專業(yè)知識和實踐案例,成功地將“懂AI的業(yè)務(wù)專家”和“懂業(yè)務(wù)的AI專家”兩種角色有機(jī)融合。本書是集理論深度與實踐指導(dǎo)于一體的經(jīng)典之作。姜華大連理工大學(xué)教授、博士生導(dǎo)師、學(xué)科評價中心主任 葉濤為我們機(jī)構(gòu)提供了長達(dá)5年的顧問服務(wù),依托10多年企業(yè)咨詢與管理實踐經(jīng)驗,從AI技術(shù)場景應(yīng)用的獨特視角撰寫了本書。本書看似是介紹如何使用Agent開發(fā)平臺的工具書,實則是傳授如何用業(yè)務(wù)思維駕馭AI工具的方法論。所以,你看本書完全不會感覺晦澀難懂,而是像聽一名接地氣的產(chǎn)品經(jīng)理或?qū)I(yè)顧問娓娓道來。鐘宏武4.1 開發(fā)Agent的通用流程
第2章介紹了開發(fā)Agent需要掌握的基本知識,第3章介紹了開發(fā)Agent常用的平臺。那么,如何運用這些知識和平臺,從零開始設(shè)計一個Agent呢?本節(jié)就來系統(tǒng)性地講解開發(fā)Agent的流程與步驟。
4.1.1 開發(fā)Agent的“3-10”實施框架
開發(fā)Agent的流程與開發(fā)傳統(tǒng)軟件的流程完全不同。一個軟件項目從開發(fā)到上線,通常需要配置項目經(jīng)理、產(chǎn)品經(jīng)理、系統(tǒng)架構(gòu)師、UI設(shè)計工程師、開發(fā)工程師(前端、后端工程師)、測試工程師等崗位和角色,并遵循軟件開發(fā)的一般流程和各項規(guī)范。當(dāng)然,創(chuàng)業(yè)團(tuán)隊開發(fā)軟件,也會出現(xiàn)一兩個工程師跑通全模塊的情況,但通常在軟件的交互體驗、功能穩(wěn)定性等方面容易出現(xiàn)bug。
基于Agent開發(fā)實踐,我們總結(jié)出“3-10”實施框架,如圖4-1所示,即通常會按照3個階段,10個環(huán)節(jié)開發(fā)一個具備生產(chǎn)級應(yīng)用、商業(yè)化能力的Agent。
(1)規(guī)劃Agent的階段。該階段包括定義Agent的應(yīng)用場景、梳理業(yè)務(wù)流程和分析痛點、梳理Agent的功能定位和開發(fā)需求3個環(huán)節(jié)。
(2)設(shè)計Agent的階段。包括繪制Agent的運行流程圖、設(shè)置大模型及參數(shù)、設(shè)計提示詞、配置Agent技能、設(shè)計用戶溝通頁面5個環(huán)節(jié)。
(3)上線Agent的階段。包括測試與調(diào)優(yōu)、發(fā)布兩個環(huán)節(jié)。
圖4-1
4.1.2 規(guī)劃Agent
規(guī)劃Agent的階段如同項目立項的可研分析與評估或軟件開發(fā)的藍(lán)圖設(shè)計階段。在這個階段需要回答以下問題。
(1)What。這是一個什么樣的Agent?它的使用場景是什么?它的用戶是誰?它能做什么?
(2)Why。為什么要開發(fā)這個Agent?它能夠解決什么問題?與傳統(tǒng)業(yè)務(wù)流程相比,它的價值是什么?與直接使用大模型對話相比,它的價值是什么?
(3)How。Agent如何實現(xiàn)所定義的功能?
規(guī)劃Agent是開發(fā)Agent的底層思考,用以指導(dǎo)Agent的具體設(shè)計。
4.1 開發(fā)Agent的通用流程
第2章介紹了開發(fā)Agent需要掌握的基本知識,第3章介紹了開發(fā)Agent常用的平臺。那么,如何運用這些知識和平臺,從零開始設(shè)計一個Agent呢?本節(jié)就來系統(tǒng)性地講解開發(fā)Agent的流程與步驟。
4.1.1 開發(fā)Agent的“3-10”實施框架
開發(fā)Agent的流程與開發(fā)傳統(tǒng)軟件的流程完全不同。一個軟件項目從開發(fā)到上線,通常需要配置項目經(jīng)理、產(chǎn)品經(jīng)理、系統(tǒng)架構(gòu)師、UI設(shè)計工程師、開發(fā)工程師(前端、后端工程師)、測試工程師等崗位和角色,并遵循軟件開發(fā)的一般流程和各項規(guī)范。當(dāng)然,創(chuàng)業(yè)團(tuán)隊開發(fā)軟件,也會出現(xiàn)一兩個工程師跑通全模塊的情況,但通常在軟件的交互體驗、功能穩(wěn)定性等方面容易出現(xiàn)bug。
基于Agent開發(fā)實踐,我們總結(jié)出“3-10”實施框架,如圖4-1所示,即通常會按照3個階段,10個環(huán)節(jié)開發(fā)一個具備生產(chǎn)級應(yīng)用、商業(yè)化能力的Agent。
(1)規(guī)劃Agent的階段。該階段包括定義Agent的應(yīng)用場景、梳理業(yè)務(wù)流程和分析痛點、梳理Agent的功能定位和開發(fā)需求3個環(huán)節(jié)。
(2)設(shè)計Agent的階段。包括繪制Agent的運行流程圖、設(shè)置大模型及參數(shù)、設(shè)計提示詞、配置Agent技能、設(shè)計用戶溝通頁面5個環(huán)節(jié)。
(3)上線Agent的階段。包括測試與調(diào)優(yōu)、發(fā)布兩個環(huán)節(jié)。
圖4-1
4.1.2 規(guī)劃Agent
規(guī)劃Agent的階段如同項目立項的可研分析與評估或軟件開發(fā)的藍(lán)圖設(shè)計階段。在這個階段需要回答以下問題。
(1)What。這是一個什么樣的Agent?它的使用場景是什么?它的用戶是誰?它能做什么?
(2)Why。為什么要開發(fā)這個Agent?它能夠解決什么問題?與傳統(tǒng)業(yè)務(wù)流程相比,它的價值是什么?與直接使用大模型對話相比,它的價值是什么?
(3)How。Agent如何實現(xiàn)所定義的功能?
規(guī)劃Agent是開發(fā)Agent的底層思考,用以指導(dǎo)Agent的具體設(shè)計。
1.定義Agent的應(yīng)用場景
“場景”這個詞在很多領(lǐng)域都有廣泛的應(yīng)用。它通常指的是一個特定的空間、時間或情境,包含了某種活動、事件或行為的發(fā)生。它描述了用戶在使用產(chǎn)品或服務(wù)時所處的具體環(huán)境和情境。定義應(yīng)用場景的主要目的是提高對特定用戶、特定生活或工作情境問題的處理能力,提高產(chǎn)品或服務(wù)滿意度。
Agent是AI技術(shù)的場景化應(yīng)用,其天然就帶有場景化的屬性。因此,在設(shè)計Agent之前,有必要對其應(yīng)用場景進(jìn)行定義。
定義Agent的應(yīng)用場景通常包括確定Agent的用戶群體、Agent的用途、Agent的價值等要素。
例如,一個旅行規(guī)劃Agent的用戶群體是有旅行需求的群體,可能是情侶、父母和孩子、團(tuán)隊等多種群體。該Agent的用途是進(jìn)行旅行的行程規(guī)劃,提供包括每日行程、交通出行、旅游景點、住宿、美食、紀(jì)念品等的綜合信息。該Agent的價值是能夠根據(jù)用戶畫像和旅行訴求,檢索旅行和酒店App、美食App、天氣App、短視頻App等,集成景點、交通、住宿、美食、打卡、穿衣等信息,將其一體化、組合式呈現(xiàn)給用戶。
再如,第7章的案例——AI投標(biāo)助手,是一個檢索并生成投標(biāo)文件的關(guān)鍵信息的 Agent,其用戶群體是企業(yè)中負(fù)責(zé)投標(biāo)的市場部門或商務(wù)部門的員工,或參與投標(biāo)工作的技術(shù)部門的員工。該Agent的用途是快速閱讀用戶上傳的招標(biāo)文件,給用戶生成準(zhǔn)確、全面、結(jié)構(gòu)化的招標(biāo)文件的關(guān)鍵信息,并準(zhǔn)確回答用戶關(guān)于招標(biāo)文件的各種問題。該Agent的價值是節(jié)省人工閱讀長達(dá)幾十頁招標(biāo)文件的時間成本,并方便招標(biāo)文件的關(guān)鍵信息在不同人員間準(zhǔn)確、全面?zhèn)鬟f,減少人工檢索信息的缺漏和傳遞的偏差。
通過以上兩個案例不難看出,定義Agent的應(yīng)用場景是對規(guī)劃Agent中“What”的回答。一個高質(zhì)量的Agent,應(yīng)該有明確且具體的用戶群體、有效且精準(zhǔn)的用途。更重要的是,Agent要能夠具有獨特價值。例如,旅行規(guī)劃Agent的獨特價值就是減少用戶切換多個不同功能的App進(jìn)行信息檢索、手動規(guī)劃行程的工作量,能夠提供一站式、集成化的旅行規(guī)劃服務(wù)。AI投標(biāo)助手的獨特價值是相對于傳統(tǒng)人工信息檢索、傳遞的低效率、信息衰減而言的,通過長文檔理解能力,減少人工閱讀和查找招標(biāo)文件的工作量。
2.梳理業(yè)務(wù)流程和分析痛點
要想實現(xiàn)Agent的功能,就需要針對Agent的應(yīng)用場景進(jìn)行業(yè)務(wù)流程分析,系統(tǒng)化梳理業(yè)務(wù)邏輯,并分析痛點,尋找Agent的獨特價值,以確保Agent能夠有效地解決實際問題。
例如,對于AI投標(biāo)助手,基于其應(yīng)用場景,我們可以梳理出以下常規(guī)的業(yè)務(wù)流程:①購買并獲取招標(biāo)文件;②把招標(biāo)文件分發(fā)給商務(wù)、業(yè)務(wù)相關(guān)人員;③標(biāo)記與解讀招標(biāo)文件的關(guān)鍵信息;④制定投標(biāo)策略;⑤分模塊制作投標(biāo)文件;⑥審核標(biāo)書;⑦投標(biāo)。
對于這樣的業(yè)務(wù)流程,識別出兩大痛點:痛點一,信息查找費時費力。從冗長的招標(biāo)文件中找到關(guān)鍵信息(如開標(biāo)時間和地點、投標(biāo)人資格要求、投標(biāo)保證金、最高限價、付款條件、投標(biāo)文件組成、評分規(guī)則、合同條款等)需要花費大量的人工時間,并且要足夠耐心和仔細(xì)。痛點二,信息在傳遞時容易丟失。制作一份投標(biāo)文件,通常需要多方協(xié)作完成,例如技術(shù)人員負(fù)責(zé)制定技術(shù)方案,商務(wù)人員負(fù)責(zé)提供資質(zhì)、業(yè)績等信息,報價人員負(fù)責(zé)測算價格,審核人員對照招標(biāo)評審要點審核投標(biāo)文件等。招標(biāo)文件的關(guān)鍵信息在不同崗位間傳遞,在這個過程中,很容易出現(xiàn)信息丟失、理解偏差等風(fēng)險,導(dǎo)致投標(biāo)文件作廢或者得分不佳,影響中標(biāo)。
通過分析業(yè)務(wù)流程的環(huán)節(jié),我們可以從更細(xì)致的顆粒度理解Agent應(yīng)用場景下的業(yè)務(wù)邏輯,確保設(shè)計的Agent更貼近真實的業(yè)務(wù)流程,更好地消除用戶痛點,滿足用戶需求。
3.梳理Agent的功能定位和開發(fā)需求
在梳理業(yè)務(wù)流程和分析痛點的基礎(chǔ)上,我們要進(jìn)一步梳理出Agent的功能定位和開發(fā)需求,用于指導(dǎo)Agent的具體設(shè)計。梳理Agent的功能定位和開發(fā)需求要圍繞Agent的能力實現(xiàn)展開,包括Agent是否需要通過配置專有知識庫增強(qiáng)特定領(lǐng)域的大模型輸出能力,Agent執(zhí)行的任務(wù)是否需要通過工作流分解為多個子任務(wù),Agent是否需要調(diào)用插件獲得拓展能力。
例如,AI投標(biāo)助手需要把人工閱讀投標(biāo)文件識別關(guān)鍵信息的流程轉(zhuǎn)變?yōu)橛葾I系統(tǒng)協(xié)助讀取招標(biāo)文件的流程,其功能定位和開發(fā)需求經(jīng)過梳理,包括:①配置知識庫,掌握招投標(biāo)專業(yè)知識,熟悉各類招投標(biāo)項目的文件結(jié)構(gòu)、術(shù)語、內(nèi)容、關(guān)鍵信息等。②大模型需要具備長文檔理解和輸出能力,一份招標(biāo)文件長達(dá)幾十頁甚至上百頁,必須選擇合適的大模型和token參數(shù)(輸入和輸出的文字長度)。③Agent的任務(wù)流程較短,不要使用工作流。④Agent需要具備閱讀和檢索用戶上傳的文檔(通常是pdf、doc、圖片等格式的)的技能,需要配置相關(guān)功能插件。④輸出的結(jié)果要有極高的準(zhǔn)確性和全面性,需要防止大模型出現(xiàn)“幻覺”。
4.1.3 設(shè)計Agent
在規(guī)劃Agent后,就可以使用Agent開發(fā)平臺開發(fā)Agent了。
1.繪制Agent的運行流程圖
Agent的運行流程圖對Agent執(zhí)行任務(wù)的節(jié)點、節(jié)點的類型、節(jié)點的邏輯關(guān)系、節(jié)點的先后次序等進(jìn)行圖形化呈現(xiàn),其作用是讓開發(fā)者根據(jù)Agent開發(fā)平臺的功能模塊,整體做好Agent的結(jié)構(gòu)化布局和功能路徑規(guī)劃,確保后續(xù)開發(fā)Agent的效率和Agent的可靠性。Agent的運行流程圖就像一張設(shè)計圖,指導(dǎo)整個施工過程。
圖4-2所示為一個抖音視頻轉(zhuǎn)小紅書爆款文案Agent的運行流程圖,該圖呈現(xiàn)了Agent從開始到結(jié)束的任務(wù)執(zhí)行過程、不同的功能節(jié)點(大模型、插件、卡片等)、具體的活動內(nèi)容、節(jié)點間的關(guān)聯(lián)關(guān)系等。這張流程圖對Agent的模塊構(gòu)成、各模塊的功能進(jìn)行了清晰定義。接下來,我們就可以詳細(xì)設(shè)計和測試每個模塊了。
圖4-2
對于需要配置工作流的Agent,通常需要繪制如圖4-2所示的運行流程圖。對于比較簡單的、不需要配置工作流的Agent,可以參考圖4-3繪制運行流程圖。圖4-3所示為AI投標(biāo)助手的運行流程圖。這個Agent不需要引入工作流,但需要滿足用戶的3種需求:一是用戶上傳招標(biāo)文件,Agent按照格式要求輸出關(guān)鍵信息;二是用戶針對上傳的招標(biāo)文件提問,Agent基于招標(biāo)文件輸出精確的答案;三是用戶提出不基于上傳的招標(biāo)文件的問題,Agent給予專業(yè)的回答。要想滿足用戶的3種需求,Agent需要具備調(diào)用插件、檢索知識庫的技能,同時需要通過大模型的提示詞準(zhǔn)確地響應(yīng)用戶需求,并按照格式要求輸出。繪制這樣的Agent運行流程圖有利于快速開發(fā)Agent。
圖4-3
2.設(shè)置大模型及參數(shù)
大模型是Agent的大腦,無工作流模式的Agent通常只會使用單一的大模型進(jìn)行思考和回答,工作流模式的Agent則可能會多次使用不同的大模型。
設(shè)置大模型主要包括大模型選型、設(shè)置大模型的參數(shù)兩個方面。大模型選型是根據(jù)Agent的任務(wù)需求和應(yīng)用場景,選擇合適的大模型廠商及具體的模型型號。不同的大模型在處理不同的任務(wù)時會存在性能差異。一些大模型也推出了不同上下文長度的模型產(chǎn)品。例如,扣子的豆包模型分為豆包·Function call模型32K(指模型一次能夠處理32,000 token的文本。token是文本中最小的語義單元,一個token通常等于1~1.8個漢字)和豆包角色扮演模型32K,Kimi模型分為Kimi(8K)、Kimi(32K)、Kimi(128K)。要想快速了解大模型的回答效果,可以使用扣子的模型廣場功能,進(jìn)行模型PK,以便選用合適的大模型。最大回復(fù)長度則要根據(jù)輸入模型的文本長度和模型輸出的文本長度來判斷,8K、32K模型可以滿足一般的問答對話任務(wù),但對于長文檔的理解和輸出任務(wù),如閱讀報告、撰寫小說等,則需要選擇32K、128K等處理長上下文的模型。
設(shè)置大模型的參數(shù)一般包括生成多樣性、輸入及輸出設(shè)置。圖4-4(1)和圖4-4(2)所示分別為扣子和文心智能體平臺的大模型參數(shù)設(shè)置頁面。生成多樣性是非常重要的大模型參數(shù),它定義大模型的回復(fù)是更精確、更穩(wěn)定,還是更靈活、更有創(chuàng)意。通常而言,專業(yè)問答類、特定領(lǐng)域檢索類Agent,要求大模型回答得更精確、更穩(wěn)定;聊天類、文案創(chuàng)作類Agent,要求大模型回答得更靈活、更有創(chuàng)意。輸入設(shè)置主要是對上下文對話輪數(shù)的設(shè)置。開發(fā)者需要合理設(shè)置大模型的最大回復(fù)長度,特別是對有長文本輸出需求的Agent,如創(chuàng)作長文檔、撰寫報告類Agent,需要預(yù)測文本長度。隨著Agent開發(fā)平臺開始收費,選擇大模型需要考慮經(jīng)濟(jì)性問題,合理地設(shè)置這些參數(shù),既能確保大模型的效果,也能減少不必要的token消耗。
圖4-4
3.設(shè)計提示詞
在開發(fā)Agent時,設(shè)計提示詞也是很重要的環(huán)節(jié),扣子稱之為人設(shè)與回復(fù)邏輯。提示詞是Agent調(diào)用大模型執(zhí)行任務(wù)的指令,是Agent規(guī)劃、思考能力的體現(xiàn)。單Agent模式下的提示詞設(shè)計和工作流模式下的提示詞設(shè)計有所不同。
在單Agent模式下,通常只有一個提示詞,Agent要靠這個提示詞來調(diào)用大模型、各類插件、知識庫、數(shù)據(jù)庫等功能模塊,并按照預(yù)定義的格式輸出結(jié)果。單Agent模式下的提示詞,就像一個系統(tǒng)規(guī)劃師。因此,撰寫單Agent模式下的提示詞一般會比撰寫工作流模式下的提示詞更復(fù)雜,難度更大,要求更高。
在工作流模式下,只有大模型節(jié)點才需要提示詞。提示詞的功能是調(diào)用大模型執(zhí)行所在節(jié)點的任務(wù)。與單Agent模式下的提示詞指揮全局有所不同,工作流模式下的提示詞只在其所在的節(jié)點起作用,不影響其他節(jié)點運行。如果一個工作流中有多個大模型,就需要配置多個提示詞,每個提示詞都只會匹配各自節(jié)點的大模型。如圖4-5所示,在工作流模式下,在選擇大模型節(jié)點后,會出現(xiàn)大模型節(jié)點頁面,開發(fā)者需要選擇大模型、設(shè)置大模型參數(shù)、設(shè)計提示詞等。
圖4-5
無論在哪種模式下,設(shè)計提示詞的方法和技巧都是通用的。不同場景的Agent,在提示詞結(jié)構(gòu)上有所差異,如角色扮演類Agent的提示詞包括人設(shè)/角色、性格特點、語言特點、行為方式、限制/注意事項,工具類Agent的提示詞包括人設(shè)/角色、技能、知識、限制/注意事項,圖像創(chuàng)作類Agent的提示詞包括人設(shè)/角色、詳細(xì)描述、風(fēng)格、色彩、情感表達(dá)、技能、限制/注意事項。要想學(xué)習(xí)撰寫Agent提示詞的技巧,可以看Agent開發(fā)平臺的相關(guān)說明文檔,或者Agent商店中公開配置的Agent 提示詞。
4.配置Agent技能
配置Agent技能是讓Agent掌握使用各類工具的能力,從而實現(xiàn)Agent的能力擴(kuò)展。配置Agent技能包括配置插件/API、工作流、知識庫、數(shù)據(jù)庫、變量、卡片等。
在“繪制Agent的運行流程圖”部分,我們已經(jīng)規(guī)劃了Agent的技能,如在哪個環(huán)節(jié)調(diào)用插件,在哪個環(huán)節(jié)調(diào)用知識庫,在哪個環(huán)節(jié)使用卡片等。第4章和第5章會詳細(xì)介紹插件、工作流、圖像流、知識庫、變量、數(shù)據(jù)庫、卡片等的使用方法,這里不重復(fù)介紹。
5.設(shè)計用戶溝通頁面
以上環(huán)節(jié)已經(jīng)完成了Agent的核心功能開發(fā),設(shè)計用戶溝通頁面是為了便于用戶快速理解、正確使用Agent。設(shè)計用戶溝通頁面包括設(shè)計開場白、引導(dǎo)/預(yù)置問題、快捷指令、背景圖片、語音/數(shù)字人等。圖4-6所示為扣子的設(shè)計用戶溝通頁面的模塊。“開場白文案”是用戶進(jìn)入Agent后自動展示的引導(dǎo)信息。它的主要作用是幫助用戶理解Agent的用途,以及如何與其進(jìn)行交互。“開場白預(yù)置問題”用于引導(dǎo)用戶提問,類似于提問示例。“背景圖片”可以讓Agent的顯示效果與眾不同。選擇“語音”可以讓Agent用設(shè)定的數(shù)字人聲音播放輸出的文本內(nèi)容,并且可以讓用戶實現(xiàn)與Agent的語音互動。
圖4-6
設(shè)計用戶溝通頁面不影響Agent的能力輸出和功能發(fā)揮。開發(fā)者可以根據(jù)Agent的應(yīng)用場景和功能,使用通俗化、場景化的自然語言。
4.1.4 上線Agent
1.測試與調(diào)優(yōu)
在上線Agent前,通常需要多次測試與調(diào)優(yōu)。在Agent開發(fā)平臺的“預(yù)覽與調(diào)試”窗口,可以對Agent進(jìn)行測試與調(diào)整。
對話調(diào)優(yōu)是所有Agent開發(fā)平臺都具備的功能,即在發(fā)布Agent前,通過用戶對話測試Agent的回答效果,判斷Agent功能配置的有效性。但是對于復(fù)雜工作流的Agent,僅通過對話輸入和Agent結(jié)果輸出,很難識別和發(fā)現(xiàn)Agent內(nèi)部運行過程中存在問題的環(huán)節(jié),修正難度較大,所以我們推薦扣子的調(diào)試臺功能。
圖4-7所示為扣子的“預(yù)覽與調(diào)試”窗口。我們可以通過對話測試Agent的能力,如輸入“北京空氣質(zhì)量”,得到Agent的回答。我們單擊“調(diào)試”按鈕,可以打開“調(diào)試詳情”窗口。調(diào)試詳情包括耗時、調(diào)用樹/火焰圖、節(jié)點詳情、輸入、輸出等信息。
零基礎(chǔ)開發(fā)AI AGENT――手把手教你用扣子做智能體 作者簡介
葉濤壹啟同輝創(chuàng)始人,擁有管理咨詢和AI培訓(xùn)咨詢雙重工作背景與經(jīng)驗。AI時代新咨詢倡導(dǎo)者:15年管理咨詢工作經(jīng)驗,中國企業(yè)聯(lián)合會戰(zhàn)略咨詢專業(yè)委員會成員,全國中小企業(yè)管理咨詢服務(wù)專家信息庫專家。曾擔(dān)任知名上市咨詢機(jī)構(gòu)董事、常務(wù)副總裁。專注于幫助成長性企業(yè)構(gòu)建AI時代的組織能力,實現(xiàn)經(jīng)營突破。主導(dǎo)過100多個咨詢項目成功交付,輔導(dǎo)過多家企業(yè)實現(xiàn)業(yè)績倍增和組織升級。AI場景化落地賦能師:系統(tǒng)提出個人和組織應(yīng)用AI技術(shù)的底層方法論——C-SMT能力框架,基于“業(yè)務(wù)場景”提供AI賦能培訓(xùn)和企業(yè)AI咨詢服務(wù)。“AICX”公眾號創(chuàng)辦人。“AICX”是一個備受好評的專業(yè)自媒體賬號,分享AI技術(shù)在工作、生活中的應(yīng)用。管鍇武漢大學(xué)管理學(xué)碩士,擁有多年企業(yè)高層管理經(jīng)驗和6年企業(yè)管理咨詢經(jīng)驗。致力于研究如何將AI技術(shù)有效地應(yīng)用于企業(yè)運營中,以實現(xiàn)降本增效的目標(biāo)。張心雨西北工業(yè)大學(xué)工學(xué)學(xué)士,香港理工大學(xué)管理學(xué)碩士。曾在頭部地產(chǎn)公司從事人力資源管理工作多年。持續(xù)研究AI技術(shù)在工作和生活中的應(yīng)用。
- >
伊索寓言-世界文學(xué)名著典藏-全譯本
- >
中國人在烏蘇里邊疆區(qū):歷史與人類學(xué)概述
- >
月亮虎
- >
我從未如此眷戀人間
- >
史學(xué)評論
- >
伯納黛特,你要去哪(2021新版)
- >
中國歷史的瞬間
- >
上帝之肋:男人的真實旅程