图书简介:
第1章 从大模型到AI Agent 1
1.1 Agent的概念与工作原理 1
1.1.1 Agent的概念 1
1.1.2 Agent的工作原理 2
1.2 Agent在AI应用落地中的价值 3
1.2.1 场景化 3
1.2.2 流程化 5
1.2.3 个性化 8
1.2.4 本地化 9
1.3 Agent正在从好玩走向好用 10
1.3.1 好用的AI应用——生产级Agent 10
1.3.2 生产级Agent助力企业经营管理突破 13
第2章 Dify介绍及Agent开发流程 17
2.1 快速了解Agent开发平台及Dify 17
2.1.1 Agent开发平台速览 17
2.1.2 Agent开发平台的分类与使用 18
2.1.3 Agent开发平台与通用Agent平台的区别 19
2.1.4 Dify的特点与优势 20
2.2 Dify的使用方式 23
2.2.1 用云服务方式使用Dify 23
2.2.2 部署并使用Dify社区版 27
2.3 生产级Agent的开发流程 27
2.3.1 如何开发一个生产级Agent 27
2.3.2 开发生产级Agent的注意事项 30
第3章 部署Dify的开发环境 32
3.1 部署Dify的总体方案 32
3.2 部署Docker 34
3.2.1 在本地电脑上部署Docker 34
3.2.2 在云服务器上部署Docker 42
3.3 部署Dify 45
3.3.1 下载Dify的源代码文件 45
3.3.2 部署Dify服务端 47
3.3.3 在前端访问Dify 50
3.3.4 在云服务器上部署Dify 51
3.4 部署模型管理平台 52
3.4.1 什么是模型管理平台 52
3.4.2 部署Ollama 53
3.4.3 部署Xinference 59
3.4.4 Dify接入模型管理平台 63
3.4.5 在云服务器上部署模型管理平台 70
第4章 Dify的功能介绍及5种应用 73
4.1 Dify的主页面 73
4.1.1 探索页面 73
4.1.2 工作室页面 74
4.1.3 知识库页面 74
4.1.4 工具页面 75
4.2 Dify的5种应用 76
4.2.1 聊天助手 77
4.2.2 Agent 80
4.2.3 文本生成应用 83
4.2.4 Chatflow(对话工作流) 86
4.2.5 工作流 96
4.3 Dify知识库 98
4.3.1 Dify知识库的功能 98
4.3.2 创建Dify知识库 99
4.3.3 知识库分段及检索参数配置 101
4.3.4 连接外部知识库 108
4.4 Dify工具扩展 109
4.4.1 来自市场的工具 110
4.4.2 自定义工具 111
4.4.3 作为工具发布的工作流 111
第5章 Dify工作流节点详解及实操案例 113
5.1 数据预处理模块 114
5.1.1 开始节点 114
5.1.2 知识检索节点 116
5.1.3 变量赋值节点 117
5.1.4 参数提取器节点 122
5.1.5 代码执行节点 124
5.1.6 文档提取器节点 127
5.1.7 列表操作节点 129
5.1.8 变量聚合器节点 131
5.2 数据生成模块 132
5.2.1 LLM节点 132
5.2.2 问题分类器节点 137
5.2.3 条件分支节点 139
5.2.4 迭代节点 142
5.2.5 循环节点 145
5.3 数据输出模块 148
5.3.1 模板转换节点 148
5.3.2 HTTP请求节点 149
5.3.3 Agent节点 151
5.3.4 结束节点 154
5.3.5 直接回复节点 154
第6章 开发发票识别助手Agent 156
6.1 项目需求:自动识别并初步审核发票 156
6.1.1 业务场景概述 156
6.1.2 传统手工作业的痛点 156
6.1.3 发票识别助手Agent的功能 157
6.2 发票识别助手Agent的开发过程详解 157
6.2.1 入门案例:开发增值税发票识别助手Agent 158
6.2.2 进阶案例:多类型发票聚合识别助手Agent 165
6.3 举一反三:Agent开发小结与场景延伸 183
第7章 开发标书阅读与内容框架生成助手Agent 185
7.1 项目需求:自动识别标书的关键内容并生成内容框架 185
7.1.1 业务场景概述 185
7.1.2 传统手工作业的痛点 185
7.1.3 标书阅读与内容框架生成助手Agent的功能 186
7.2 标书阅读与内容框架生成助手Agent详解 187
7.2.1 入门案例:开发标书阅读助手Agent 187
7.2.2 进阶案例:开发标书阅读与内容框架生成助手Agent 199
7.3 举一反三:Agent开发小结与场景延伸 213
第8章 开发本地知识问答助手Agent 214
8.1 项目需求:在确保数据安全前提下智能问答 214
8.1.1 业务场景概述 214
8.1.2 建设公司知识库的痛点 214
8.1.3 本地知识问答助手Agent的功能 215
8.2 本地知识问答助手Agent的开发过程详解 216
8.2.1 本地配置公司知识库 216
8.2.2 解读及设置知识库参数 220
8.2.3 创建本地知识问答助手Agent 223
8.2.4 本地知识问答助手Agent开发过程展示 228
8.3 本地知识问答助手Agent的运行效果 230
8.4 举一反三:Agent开发小结与场景延伸 235
第9章 开发人才招聘数字员工Agent 237
9.1 项目需求:从收集岗位需求到评估面试的人才招聘全流程AI化 237
9.1.1 业务场景概述 237
9.1.2 传统的人才招聘工作的痛点 238
9.1.3 人才招聘数字员工Agent的功能 239
9.2 人才招聘数字员工Agent的开发过程详解 240
9.2.1 人才招聘数字员工Agent的运行流程图 240
9.2.2 创建人才招聘数字员工Agent 241
9.2.3 编排人才招聘数字员工Agent 243
9.3 人才招聘数字员工Agent的运行效果 265
9.4 举一反三:Agent开发小结与场景延伸 275
展开
生成式AI技术以大模型为核心。近年来,大模型的能力快速迭代,带来了更自然的文本生成、更高级的语义理解、更低的资源消耗、更广泛的应用领域。然而,在AI技术的实际应用中,仅仅依靠大模型的通用能力,往往难以满足复杂多样的业务场景需求。于是,AI Agent(简称Agent,智能体)正在成为推动AI技术走向实用化、价值化的关键力量。一些率先应用AI技术的企业,已经通过Agent将AI技术嵌入业务流程中,在营销策划、资料审核、文案生成、智能问答、客户服务、人才招聘等方面掀起效率革命。
2025年被业界认为是Agent元年。随着大模型推理能力及多模态能力的增强,Agent已经从简单的Chatbot(聊天机器人)发展为能够执行复杂任务的Workflow(工作流)。Agent的应用场景越来越丰富,并从To C(消费者用户)场景逐渐向To B(企业级用户)场景发展。
如果说大模型是AI系统的“大脑”,那么Agent就是赋予其行动能力的“手和脚”。Agent不仅能理解复杂指令,还能拆解和规划任务、调用工具、记忆上下文、执行复杂任务,最终形成完整的“感知—决策—执行”任务闭环。
那么,用什么工具开发Agent?开发Agent需要什么技能?非技术人员能不能学得会?如何寻找Agent的应用场景?如何让Agent消除真实业务的痛点?
针对以上疑问,为了让更多非IT技术背景的人能够快速掌握Agent的开发和使用能力,我们撰写了本书。本书的定位为零基础开发Agent的实操指南,以Dify作为开发Agent的工具。你不需要掌握编程知识,通过学习本书的内容,能够初步掌握用Dify开发 Agent的技巧和实操能力。
在出版本书之前,我们已经出版了《零基础开发AI Agent:手把手教你用扣子做智能体》,该书系统地介绍了如何用扣子(Coze)平台开发Agent,书中的案例侧重于To C场景,学习难度相对较低。与扣子相比,Dify的使用者以企业级用户为主。因此,本书的案例侧重于To B场景。通过学习本书的内容,你可以实现Agent开发从“好玩”到“好用”的跨越。当然,如果你在使用Dify之前,有学习和使用扣子等Agent开发平台的经验,那么学习本书的内容会更加轻松。
本书采用“方法总结-工具操作-项目实战”的结构循序渐进地展开介绍,共分为9章。
第1章简要介绍了Agent的概念与工作原理,总结了Agent在AI应用落地中的4大独特价值,并提出了在真实业务场景中应用的生产级Agent的概念与应用价值。
第2章梳理了国内外Agent开发平台的发展脉络,以及Dify的特点与优势,基于Dify在开发生产级Agnet方面的能力,从方法论层面总结了开发生产级Agent的流程与注意事项。
第3章详细演示了如何在本地电脑及云服务器上部署Dify。私有化部署是Dify的重要优势。实际上,很多生产级Agent的开发与应用,对私有数据的安全及保密都有很高的要求。因此,不想用云服务方式使用Dify的开发者,需要仔细阅读本章,按照操作指引就能完成Dify的部署。需要说明的是,本章有一定的代码操作难度,非IT技术开发者在阅读时可能有一定困难。如果你只需要用云服务方式使用Dify,那么可以跳过本章。
第4章和第5章全面介绍了Dify的各项功能及使用技巧,以案例化的形式展示了Dify的5种AI应用的特点,并借助10余个案例详细介绍了Dify的18个工作节点的具体使用方法。建议你在使用Dify开发完整项目之前,认真学习这些内容,并参照本书中的案例进行练习,充分掌握Dify的设计原理和使用方法,为后续学习复杂的项目案例奠定坚实基础。当然,在学习后续的项目案例时,如果对Dify的某个功能的理解有困难,也可以回顾这些内容定向学习。
第6章到第9章是项目案例,选取了发票识别与处理、长文档处理、本地知识问答、人才招聘这4个典型的业务场景,用6个典型的项目案例,手把手演示了从需求分析、运行流程、节点设计到运行效果的全链路Agent开发过程,并总结了每个案例的开发经验,为你提供了开发类似功能的Agent的思路。对这些案例的阅读原则上没有先后顺序,你可以根据自己的兴趣选择任意案例开始学习。
我们从AI技术应用者的视角,以用户能看得懂的语言风格撰写本书,用通俗的文字解读复杂的技术概念,并在本书中穿插大量实操案例进行演示,力求做到图文并茂。需要说明的是,Agent开发平台日新月异,你在阅读本书时可能会发现Dify的个别界面和功能与本书介绍的略有不同,你需要结合实际情况判断,灵活运用书中的知识。
你可以将本书当作开发生产级Agent的入门书。本书介绍的Agent开发平台及案例,以企业级的业务场景为主。不过,对于需要开发任务复杂、数据庞大、高输出准确率、高运行稳定性的Agent,还是建议寻找专业的管理咨询专家、技术厂商进行定制开发。
为了确保本书的专业性和实用性,我们在撰写过程中,寻求了技术专家的支持。来自中国移动的智能体专家解飞老师,为我们提供了Dify部署、部分案例中的Agent开发的技术支持。来自安徽曦腾信息科技有限公司的冯峰老师,为我们提供了硬件、安全及部分案例中的Agent开发的技术支持。感谢所有为本书付出辛勤努力的作者、编辑和其他工作人员。
感谢广大读者对本书的喜爱,希望本书能够帮助你系统、快速地学会开发Agent。欢迎各界人士与我们互动讨论,共同推动AI技术在真实业务场景中的应用。
展开