图书详情

大规模语言模型：从理论到实践

丛书名：通用智能与大模型丛书

作译者：张奇等出版日期：2024-01-01

出版社：电子工业出版社维护人：符隆美

书代号：TP467050 ＩＳＢＮ：9787121467059

图书简介：

2023年ChatGPT火爆全球，以其为代表的人工智能大语言模型成为全球人工智能从业者关注的焦点。本书详细介绍了构建大语言模型的四个主要阶段：预训练、有监督微调、奖励建模和强化学习。每个阶段都有算法、代码、数据、难点及实践经验的详细讨论。本书以大语言模型的基础理论开篇，探讨了大语言模型预训练数据的构建方法，以及大语言模型如何理解并服从人类指令，介绍了大语言模型的扩展应用和评估方法，为读者提供了更全面的视野。本书旨在为对大语言模型感兴趣的读者提供入门指南，也可作为高年级本科生和研究生自然语言处理相关课程的补充教材。

样书申请

定价 109.0

购买

您的专属联系人更多

联系人：符隆美

电话：010-88254014

邮箱：fulm@phei.com.cn

关注评论(3) 分享

分享到：

配套资源图书内容样章/电子教材图书评价

配套资源
本书资源

本书暂无资源
会员上传本书资源
为本书上传资源
图书内容

内容简介

2023年ChatGPT火爆全球，以其为代表的人工智能大语言模型成为全球人工智能从业者关注的焦点。本书详细介绍了构建大语言模型的四个主要阶段：预训练、有监督微调、奖励建模和强化学习。每个阶段都有算法、代码、数据、难点及实践经验的详细讨论。本书以大语言模型的基础理论开篇，探讨了大语言模型预训练数据的构建方法，以及大语言模型如何理解并服从人类指令，介绍了大语言模型的扩展应用和评估方法，为读者提供了更全面的视野。本书旨在为对大语言模型感兴趣的读者提供入门指南，也可作为高年级本科生和研究生自然语言处理相关课程的补充教材。

图书详情

ISBN：9787121467059

开本：16(185*235)

页数：320

字数：465

本书目录

本书暂无目录

前言

本书暂无前言

作者简介

张奇复旦大学计算科学技术学院教授、博士生导师。主要研究方向是自然语言处理和信息检索，聚焦自然语言表示、信息抽取、鲁棒性和解释性分析等任务。兼任中国中文信息学会理事、中国中文信息学会信息检索专委会常务委员、中国人工智能青年工作委员会常务委员、SIGIR Beijing Chapter组织委员会委员等。多次担任ACL、EMNLP、COLING、全国信息检索大会等重要国际、国内会议的程序委员会主席、领域主席、讲习班主席等。近年来，承担了国家重点研发计划课题、国家自然科学基金、上海市科委等多个项目，在国际重要学术刊物和会议上发表论文150余篇，获得美国授权专利4项，作为第二译者翻译专著《现代信息检索》。获得WSDM 2014最佳论文提名奖、COLING 2018 领域主席推荐奖、NLPCC 2019杰出论文奖、COLING 2022杰出论文奖。获得上海市“晨光计划”人才计划、复旦大学“卓越2025”人才培育计划等支持，获得钱伟长中文信息处理科学技术一等奖、汉王青年创新一等奖、上海市科技进步二等奖、教育部科技进步二等奖、ACM 上海新星提名奖、IBM Faculty Award等奖项。桂韬，复旦大学自然语言处理实验室副研究员、硕士生导师。研究领域为预训练模型、信息抽取和鲁棒模型。在高水平国际学术期刊和会议上发表论文40余篇，主持国家自然科学基金、计算机学会、人工智能学会的多个基金项目。获钱伟长中文信息处理科学技术奖一等奖（2/5）、中国中文信息学会优秀博士论文奖、COLING 2018 最佳论文提名奖、NLPCC 2019 杰出论文奖，入选第七届“中国科协青年人才托举工程”、上海市启明星计划。黄萱菁，复旦大学计算机学院教授、博士生导师。主要从事人工智能、自然语言处理和信息检索研究。兼任中国中文信息学会理事，中国计算机学会自然语言处理专委会副主任，中国人工智能学会女科技工作者委员会副主任，计算语言学学会亚太分会副主席，亚太信息检索学会指导委员会委员。近年来，承担了国家重点研发计划课题、国家自然科学基金等多个项目，在国际重要学术刊物和会议上发表论文150余篇。获钱伟长中文信息处理科学技术奖、上海市育才奖、人工智能全球女性学者、福布斯中国科技女性等多项荣誉。
样章试读

查看样章
图书评价我要评论

本书资源

会员上传本书资源

内容简介

图书详情

本书目录

前 言

作者简介

前言