编辑推荐:
第1章 生成式人工智能简介 1
1.1 从图灵测试说起 2
1.1.1 图灵测试的基本原理与影响 2
1.1.2 图灵测试的执行与挑战 3
1.1.3 智能的度量方法 3
1.1.4 人工智能与人类智能之间的关系 4
1.2 从数据到知识 4
1.2.1 DIKW模型 5
1.2.2 知识的表示 6
1.2.3 自然语言处理的发展史 7
1.3 通用人工智能的曙光 9
1.3.1 内容皆可生成 9
1.3.2 文本生成 10
1.3.3 图片生成 11
1.3.4 视频生成 12
1.3.5 决策式AI与生成式AI 14
1.4 实验1:分辨人类创作与AIGC 15
1.4.1 实验目的 15
1.4.2 实验步骤 15
第2章 预训练大模型 16
2.1 什么是GPT 16
2.1.1 Generative(生成式) 17
2.1.2 Pre-trained(预训练) 18
2.1.3 Transformer(变换器) 19
2.2 大模型的关键技术 20
2.2.1 基于人类反馈的强化学习 20
2.2.2 模型微调 21
2.2.3 基于提示词的自然交互 22
2.3 大模型的能力评估 23
2.3.1 评估基准指标 23
2.3.2 国内外主流大模型能力评估 24
2.4 规模定律 25
2.4.1 机器是如何学习的 25
2.4.2 规模定律的性质与应用 27
2.4.3 模型性能的涌现 28
2.5 实验2:写作比赛 29
2.5.1 实验目的 29
2.5.2 实验步骤 29
第3章 负责任的生成式人工智能 30
3.1 什么是AI伦理 31
3.1.1 AI伦理与科技 31
3.1.2 AI伦理与道德 32
3.1.3 我国AI伦理发展现状 32
3.2 AIGC引发的风险与挑战 33
3.2.1 数据隐私和安全性 33
3.2.2 内容的真实性和准确性 35
3.2.3 歧视与偏见 37
3.2.4 对法律法规的挑战 37
3.3 构建负责任的AIGC的原则与策略 38
3.3.1 构建原则 39
3.3.2 构建策略 42
3.4 实验3:使用平台快速搭建自己的AIGC应用 44
3.4.1 实验目的 44
3.4.2 实验步骤 44
3.4.3 实验总结与评估 45
第4章 提示工程 46
4.1 提示词 47
4.1.1 什么是token 47
4.1.2 如何设计提示词 49
4.2 思维链 54
4.2.1 思维链的应用方法 54
4.2.2 思维链的应用案例 55
4.2.3 思维链的优势与挑战 56
4.3 RAG 57
4.3.1 RAG的工作原理 58
4.3.2 RAG的核心优势 59
4.3.3 RAG的应用场景 59
4.4 提示工程的最佳实践 60
4.4.1 理解任务与目标 60
4.4.2 设计具体和清晰的提示词 61
4.4.3 引导大模型关注关键细节 62
4.4.4 迭代优化提示词 62
4.4.5 确保提示词的公平性与包容性 63
4.4.6 持续监控并调整提示词 64
4.5 实验4:提示工程实战 64
4.5.1 实验目的 64
4.5.2 实验步骤 64
4.5.3 实验总结与评估 65
第5章 多媒体内容的生成 66
5.1 AIGC的本质 67
5.1.1 多媒体内容的基本构成要素解析 67
5.1.2 多媒体内容的生成原理 69
5.2 两种生成策略 70
5.2.1 自回归生成 70
5.2.2 非自回归生成 71
5.3 AIGC驱动的多媒体内容生成 72
5.3.1 图像的生成 73
5.3.2 扩散模型 77
5.3.3 音频的生成 82
5.3.4 视频的生成 84
5.4 实验5:AI短视频制作探索 86
5.4.1 实验目的 86
5.4.2 实验步骤 86
5.4.3 实验总结与评估 86
第6章 RAG与微调 88
6.1 RAG的基本原理与工作流程 89
6.1.1 什么是RAG 89
6.1.2 为什么需要RAG 91
6.1.3 RAG的工作流程 95
6.1.4 RAG的适用场景 98
6.2 AI Agent(智能体) 99
6.2.1 Agent特征分析 100
6.2.2 Agent的四种设计模式 103
6.3 微调 109
6.3.1 什么是微调 110
6.3.2 主要微调方法 111
6.3.3 微调的流程与最佳实践 113
6.4 实验6:设计与本地文档对话的智能体 116
6.4.1 实验目的 116
6.4.2 实验步骤 117
6.4.3 实验总结与评估 118
第7章 行业赋能 119
7.1 生成式人工智能赋能千行百业 120
7.1.1 经济价值创造 121
7.1.2 关键领域的价值聚焦 121
7.1.3 行业影响 121
7.1.4 工作活动自动化 122
7.1.5 生产力提升 122
7.2 教育创新赋能 122
7.2.1 教学环节的智能化提升 123
7.2.2 学生学习方式的变革 123
7.2.3 教育管理的智能化 124
7.2.4 教育资源的普及 124
7.2.5 智能教育生态的构建 124
7.2.6 教育行业落地场景 124
7.3 医疗健康赋能 125
7.3.1 药物研发与新药发现 126
7.3.2 疾病诊断与早期筛查 126
7.3.3 个性化治疗与精准医疗 127
7.3.4 患者管理与健康服务 127
7.3.5 人工智能医疗落地场景 128
7.4 消费零售赋能 130
7.4.1 利用大模型重塑品牌与消费者的连接 131
7.4.2 消费领域落地场景 132
7.5 智能制造赋能 133
7.5.1 通过大模型实现制造业的智能化升级 134
7.5.2 智能制造落地场景 134
7.6 游戏娱乐赋能 135
7.6.1 大模型助力游戏创作与设计 136
7.6.2 生成式人工智能推动娱乐体验的个性化 136
7.6.3 虚拟人物与虚拟世界的创造 136
7.6.4 游戏内经济与虚拟物品创造 136
7.6.5 游戏娱乐落地场景 137
7.7 实验7:角色扮演类多智能体应用设计体验 137
7.7.1 实验目的 137
7.7.2 实验步骤 138
7.7.3 实验总结与评估 139
第8章 生成式人工智能应用的构建 140
8.1 LangGraph简介 141
8.1.1 LangGraph的核心概念 142
8.1.2 LangGraph的优势与应用场景 142
8.2 任务1:基础对话系统的设计 143
8.2.1 创建模型 144
8.2.2 定义图的状态(MessageState) 146
8.2.3 创建LLM节点 146
8.2.4 构建图 147
8.2.5 运行测试 147
8.3 任务2:为系统添加工具调用能力 148
8.3.1 Reducer函数 149
8.3.2 创建工具(乘法器) 149
8.3.3 构建图 150
8.3.4 运行测试 150
8.4 任务3:为系统添加路由能力 151
8.4.1 构建图 152
8.4.2 运行测试 153
8.5 任务4:智能体的创建 153
8.5.1 创建工具(四则运算器) 154
8.5.2 使用提示词引导大模型 155
8.5.3 构建图 155
8.5.4 运行测试 156
8.6 任务5:具有记忆的智能体的创建 157
8.6.1 MemorySaver检查点 158
8.6.2 设置线程ID 159
8.7 任务6:Web界面的创建 161
8.7.1 Gradio简介 162
8.7.2 使用Gradio为“四则计算器”智能体添加Web界面 163
展开
生成式人工智能(Generative Artificial Intelligence AI,GAI,也简称为生成式AI或GenAI)技术正以前所未有的速度改变着我们的生活与工作方式。从智能对话到图像生成、从个性化推荐到自动化创作,生成式人工智能的应用已经渗透到各行各业,成为推动技术创新和产业转型的重要力量。然而,这一技术的飞速发展,也带来了许多挑战和思考,特别是在技术普及、伦理治理、行业应用等方面,需要深入研究与探索。
本书应时代浪潮而生,旨在为广大读者提供一套系统且全面的生成式人工智能学习框架,帮助读者从理论到实践全面了解这一领域的最新发展。本书以技术为核心,结合现实应用场景,深入浅出地阐述了生成式人工智能的核心原理、关键技术与实际应用,力求为读者提供一条从入门到精通的知识路径。
在编写本书的过程中,我们坚持“理论与实践相结合”的原则,通过对生成式人工智能技术的深入分析,结合具体案例和代码实现,帮助读者在掌握技术基础的同时,提升其解决实际问题的能力。全书涵盖了从基础理论到行业应用的关键知识,既注重学术深度,也关注技术的实际可操作性。
一、技术与伦理并重,关注未来发展
生成式人工智能不仅是一个技术问题,还涉及诸多伦理与社会问题。随着生成式人工智技术的普及,我们越来越意识到其带来的社会影响。数据偏见、算法歧视、隐私保护等问题日益突出。因此,本书在讲解技术原理的同时,特别关注生成式人工智能的伦理治理问题,强调负责任的技术开发。我们认为,人工智能技术的持续健康发展,离不开对伦理与社会责任的深入思考。
本书特别设立了专门章节探讨“负责任的生成式人工智能”,从数据偏见、算法透明度、伦理框架等多个角度进行详细分析,帮助读者理解在设计和应用生成式人工智能时应遵循的伦理原则。我们希望通过这一部分内容,引导技术开发者和使用者更加注重社会效益,推动生成式人工智能技术向更加公平、公正、可持续的方向发展。
二、以实践驱动创新,助力行业变革
在本书的第4章~第8章,我们聚焦于生成式人工智能的关键技术应用和行业赋能,特别是提示工程、多模态数据处理、RAG(Retrieval-Augmented Generation,检索增强生成)等前沿技术。随着技术的不断进步,生成式人工智能不仅局限于文本的生成,跨媒体、多模态的生成能力也将逐步成熟,开创更多的创新应用场景。
在行业应用方面,本书选取了金融、医疗、教育、制造等多个具有代表性的行业,展示生成式人工智能如何解决行业中的实际问题。例如,如何利用人工智能优化智能投顾、进行个性化诊疗、创建教育智能体等,如何在工业质检中通过人工智能提升检测效率和精度。这些真实的行业应用案例,不仅能帮助读者理解生成式人工智能技术的具体实现,也为未来的行业变革提供了实践的指导。
三、面向未来的技术框架
本书不仅是对现有生成式人工智能技术的总结,更是对未来发展趋势的展望。随着技术的不断演进,生成式人工智能的应用将呈现出更广泛的前景。我们在本书中对未来可能出现的技术变革进行了初步的探讨,包括大模型的进一步优化、人工智能与人类协作的新模式,以及跨领域融合的潜力等。这些内容旨在激发读者的创新思维,帮助他们在技术飞速发展的背景下,始终保持对未来的敏锐洞察和不断学习的动力。
通过本书的出版,我们希望为读者提供一条通向生成式人工智能深度理解与应用的路径,帮助他们在日益复杂的技术环境中脱颖而出。无论是想深入掌握生成式人工智能技术的学生、开发者,还是希望将人工智能技术应用于行业实践的一线人员,本书都将成为他们值得依赖的学习与实践工具。
本书包含丰富的配套学习资源,读者可登录华信教育资源网免费下载,也可通过封底“一书一码”兑换完整学习资源。
生成式人工智能正在以前所未有的速度改造我们的世界,理解并驾驭这一强大工具,将为每位读者打开通向未来的大门。让我们共同探索这个充满机遇与挑战的领域,推动人工智能技术的发展与应用,携手迈向更加智能的未来。
作 者
展开