华信教育资源网
走进大模型
作   译   者:马平 出 版 日 期:2025-10-01
出   版   社:电子工业出版社 维   护   人:孟宇 
书   代   号:G0514020 I S B N:9787121514029

图书简介:

本书不同于其他大模型的书,力求用形象生动的语言和图文并茂的形式,描述大模型的来龙去脉。从大模型的产生,大模型的演变过程,大模型的核心技术和基础架构,到大模型的应用场景,大模型面临的挑战和问题,大模型的发展趋势,给读者一个大模型的全貌。本书既适合入门者快速走进大模型,又可以为人工智能领域的大学生,研究生,创业者和研发人员提供有价值的参考和指导。
您的专属联系人更多
关注 评论(0) 分享
配套资源 图书内容 样章/电子教材 图书评价
  • 配 套 资 源

    本书资源

    本书暂无资源

    会员上传本书资源

  • 图 书 内 容

    内容简介

    本书不同于其他大模型的书,力求用形象生动的语言和图文并茂的形式,描述大模型的来龙去脉。从大模型的产生,大模型的演变过程,大模型的核心技术和基础架构,到大模型的应用场景,大模型面临的挑战和问题,大模型的发展趋势,给读者一个大模型的全貌。本书既适合入门者快速走进大模型,又可以为人工智能领域的大学生,研究生,创业者和研发人员提供有价值的参考和指导。

    图书详情

    ISBN:9787121514029
    开 本:16(185*235)
    页 数:208
    字 数:250

    本书目录

    第1章  大模型的由来	1
    1.1  什么是大模型	1
    1.1.1  大模型的定义	1
    1.1.2  有哪些类型的大模型	4
    1.2  大模型发展的三个阶段和三次飞跃	6
    1.2.1  萌芽期	6
    1.2.2  沉淀期	7
    1.2.3  爆发期	9
    1.3  大模型带来的机会	14
    1.3.1  行业应用遍地开花	14
    1.3.2  商业智能落地	16
    1.3.3  个性化服务提升	18
    1.3.4  教育与培训赋能	20
    第2章  从深度学习到大模型	29
    2.1  什么是深度学习	29
    2.1.1  深度学习的由来	29
    2.1.2  深度学习的定义	33
    2.1.3  深度学习的应用领域	35
    2.2  大模型用了深度学习的哪些技术	37
    2.2.1  深度神经网络	37
    2.2.2  激活函数	38
    2.2.3  损失函数	39
    2.2.4  优化算法	40
    2.3  神经网络模型向大模型的发展	40
    2.3.1  CNN	40
    2.3.2  RNN	41
    2.3.3  Transformer	42
    2.3.4  多模态模型	44
    2.3.5  扩散模型	45
    2.4  大模型的建模技术	47
    2.4.1  大模型的预训练	47
    2.4.2  大模型的微调	50
    2.4.3  大模型的推理	51
    第3章  大模型的架构—Transformer	54
    3.1  Transformer的提出	54
    3.1.1  传统模型的限制	54
    3.1.2  Transformer模型的引入	55
    3.2  Transformer的优势	56
    3.2.1  并行计算	56
    3.2.2  长距离依赖建模	58
    3.2.3  模块化设计	58
    3.3  Transformer的自注意力机制	58
    3.3.1  自注意力机制的提出	58
    3.3.2  自注意力机制的三个阶段	59
    3.3.3  多头自注意力机制	60
    3.4  Transformer的架构	61
    3.4.1  基础Transformer架构	61
    3.4.2  基于Transformer的BERT	62
    3.4.3  基于Transformer的GPT	63
    3.4.4  基于Transformer的T5	65
    3.5  Transformer的最新进展Titans	66
    3.5.1  Titans是什么	66
    3.5.2  Titans的三种变体	67
    3.5.3  Titans的意义与影响	69
    3.6  Transformer的应用场景	70
    3.6.1  图像和视频理解	70
    3.6.2  文本生成	78
    3.6.3  文本风格迁移	79
    3.6.4  内容续写	79
    第4章  大模型的代表—GPT	80
    4.1  GPT的由来	80
    4.1.1  GPT的提出	80
    4.1.2  GPT为何采用Transformer架构	82
    4.2  GPT的发展历程—从GPT-1到GPT-4	84
    4.2.1  GPT-1—多项语言处理大模型	84
    4.2.2  GPT-2—多任务学习大模型	85
    4.2.3  GPT-3—复杂任务与专家知识大模型	88
    4.2.4  GPT-4—多模态交互大模型	89
    4.3  GPT的应用场景	90
    4.4  GPT的发展	92
    4.4.1  多模态能力的强大	92
    4.4.2  GPT-O系列的提出	94
    4.4.3  快思考到慢思考	98
    第5章  国内外典型的大模型	103
    5.1  OpenAI的Sora大模型	103
    5.2  Google的Gemini大模型	107
    5.3  Meta的LLaMA大模型	113
    5.4  百度的文心大模型	114
    5.5  腾讯的混元大模型	118
    5.6  阿里的通义千问大模型	122
    5.7  华为的盘古大模型	124
    5.8  幻方量化的DeepSeek大模型	125
    5.9  国内外大模型对比	129
    第6章  大模型的应用领域	141
    6.1  NLP	141
    6.2  对话系统与聊天机器人	146
    6.3  计算机视觉	147
    6.4  推荐系统	150
    6.5  自动驾驶	152
    6.6  医疗健康诊断	153
    第7章  大模型面临的挑战与对策	158
    7.1  算力挑战与对策	158
    7.2  模型架构局限性与对策	162
    7.3  幻觉问题与对策	163
    7.4  伦理与安全挑战	165
    7.5  模型可解释性挑战与对策	176
    第8章  大模型的未来展望	184
    8.1  大模型的跨模态融合	184
    8.2  大模型与智能体的融合	187
    8.3  大模型的具身智能	193
    8.4  大模型的开源与推理能力提升	195
    参考文献	197
    
    展开

    前     言

    前    言
    当人类第一次目睹GPT-4解析量子物理时,当自动驾驶系统在暴雨中做出比人类更精准的避让判断时,当蛋白质折叠的百年难题在AlphaFold的神经网络中轰然瓦解时,我们正站在一个时代的临界点上。此刻,全球算力的洪流正以前所未有的速度汇聚,孕育着一种超越传统认知的智能形态,大模型已不再是实验室里的幽灵代码,而是正在重构人类文明的数字造物主。
    本书将带您穿透参数矩阵的迷雾,亲历这场硅基文明的寒武纪大爆发。翻看本书的每一页,您将触摸到千亿神经元构建的思维图谱,目睹Transformer架构如何将人类语言炼化为智能的暗物质,见证混合专家系统在并行计算中迸发的意识火花。本书不是一本冰冷的算法手册,而是一场关于机器如何思考的沉浸式探险—我们将解剖GPT、Gemini、DeepSeek等大模型的神经突触,甚至窥见AI对齐研究中关乎人类命运的伦理博弈。
    您将看到,在硅基生命体的“心跳”(GPU集群的脉冲)和“血液”(海量数据流)之间,大模型正以指数级速度进化出理解、创造与推理的能力。大模型不仅解构了图灵测试的边界,还在重新定义知识生产的范式:从代码生成、科学发现到艺术创作,一场由0和1驱动的“文艺复兴”正在发生。这场革命暗藏锋刃—当模型的参数量突破百万亿级时,大模型会取代人类还是成为人类最强大的外脑?答案或许就藏在您即将展开的阅读旅程中。
    本书由具有海外工业界背景、多年深耕AI技术的大学教授编著完成,感谢北京航空航天大学博士研究生穆宇,硕士研究生杨华和高玉立收集的相关资料。本书既有对多模态融合、思维链、大模型推理等核心技术的精辟解析,又有对AI社会学的前瞻和思辨。我们避开了艰深的数学公式,转而用全方位多维度的叙事,带您穿梭于超算中心的服务器阵列、算法竞技场、神经架构之间。当您读完并合上书时,那些曾令人望而生畏的“黑箱”,将成为您认知版图中闪耀的坐标。
    我们即将揭开大模型的神秘面纱,带您走进大模型的美妙世界。
    展开

    作者简介

    马平,北京航空航天大学软件学院副教授,主持多项基金项目,出版多种教材,出版方向:人工智能方向。
  • 样 章 试 读
    本书暂无样章试读!
  • 图 书 评 价 我要评论
华信教育资源网