图书简介:
第1章 绪论 11.1 引言 11.2 概念 41.2.1 什么是机器学习 41.2.2 机器学习的流程 51.2.3 机器学习模型的分类 61.2.4 机器学习应用领域介绍 71.3 常用术语 91.3.1 假设函数和损失函数 91.3.2 拟合、过拟合和欠拟合 101.4 机器学习环境构建和常用工具 111.4.1 Python 111.4.2 Anaconda+ Jupyter Notebook 121.4.3 NumPy 141.4.4 Matplotlib 151.4.5 Pandas 161.4.6 Scikit-learn 161.4.7 PyTorch 17第2章 机器学习基础概念 222.1 相关数学概念 232.1.1 线性代数 232.1.2 微分 262.1.3 概率 282.2 数据特征表示 282.2.1 数据特征 282.2.2 特征工程和特征学习 292.3 评价指标 322.4 损失函数 37
第3章 典型线性模型 403.1 线性回归模型 403.1.1 线性回归的概念 403.1.2 线性回归模型的代码实现 423.2 逻辑回归模型 453.2.1 逻辑回归的概念 453.2.2 逻辑回归模型的代码实现 463.3 朴素贝叶斯模型 493.3.1 朴素贝叶斯的概念 493.3.2 朴素贝叶斯模型的代码实现 523.4 决策树模型 533.4.1 决策树的概念 533.4.2 决策树模型的代码实现 563.5 支持向量机模型 603.5.1 支持向量机的概念 603.5.2 支持向量机模型的代码实现 633.6 KNN模型 653.6.1 KNN的概念 653.6.2 KNN模型的代码实现 673.7 随机森林模型 703.7.1 随机森林的概念 703.7.2 随机森林模型的代码实现 71第4章 前馈神经网络 734.1 神经元与感知机 744.2 激活函数 764.2.1 Sigmoid函数 774.2.2 Tanh函数 78
4.2.3 ReLU函数 784.2.4 Swish函数 814.2.5 Maxout函数 824.2.6 Softplus函数 834.2.7 Softmax函数 834.3 前馈神经网络结构 844.3.1 通用近似定理 854.3.2 应用到机器学习 864.3.3 参数学习 874.4 反向传播算法 884.5 梯度计算 914.5.1 数值微分 914.5.2 符号微分 924.5.3 自动微分 924.6 网络优化 954.6.1 优化问题 954.6.2 优化算法 974.7 前馈神经网络应用实例 98第5章 卷积神经网络 1025.1 卷积运算 1035.1.1 一维卷积 1035.1.2 二维卷积 1045.1.3 卷积的变种 1055.2 卷积神经网络结构 1075.2.1 输入层 1075.2.2 卷积层 1085.2.3 池化层 1105.3 参数学习 1125.4 几种典型的卷积神经网络 1125.4.1 LeNet-5 1125.4.2 AlexNet 1135.4.3 VGG网络 1155.4.4 ResNet 1155.4.5 Inception网络 1165.5 应用实例:基于卷积神经网络的人脸识别 1175.5.1 人脸数据采集 1185.5.2 图像预处理 1195.5.3 加载图像 1205.5.4 模型搭建 1205.5.5 识别与验证 126第6章 循环神经网络 1286.1 循环神经网络概念 1296.2 循环神经网络结构 1306.3 长距离依赖与参数学习 1326.3.1 长距离依赖 1326.3.2 参数学习 1336.4 基于门控的循环神经网络 1376.4.1 LSTM网络 1376.4.2 LSTM网络的变体 1396.4.3 GRU网络 1406.5 深度循环神经网络 1416.6 应用实例:基于循环神经网络的语言模型 1426.6.1 定义模型 1426.6.2 训练模型 144第7章 图神经网络 1467.1 图的定义与术语 1467.2 图神经网络结构 1497.3 图神经网络常用模型 1527.3.1 GCN模型 1527.3.2 GGNN模型 1547.3.3 GAT模型 1567.4 图神经网络应用实例 1587.4.1 数据集及预处理 1587.4.2 图卷积层定义 1627.4.3 模型定义 1647.4.4 模型训练 164第8章 机器学习模型的应用 1688.1 Transformer应用 1688.1.1 自注意力机制 1698.1.2 位置编码模块 1708.1.3 模型框架 1708.1.4 模型代码 1738.2 REPVGG应用 1818.2.1 模型框架 1818.2.2 结构重参化 1838.2.3 模型代码 1858.3 基于前馈神经网络的方面级情感三元组提取 192
8.3.1 模型框架 1938.3.2 模型训练 1998.3.3 数据集 2028.3.4 结果测试 2038.4 国内机器学习开源平台 205
展开
尊敬的读者,很高兴你能看到这本机器学习教材!机器学习是一门迅速发展的科学,它已经在各个行业产生了深远的影响,从医疗保健到金融、交通、娱乐等。通过机器学习,我们可以让计算机从数据中学习和发现模型,从而提供有关未来的预测和决策。本书的目标是为读者提供一种全面的介绍,从基本概念到高级技术,帮助读者理解和应用机器学习。无论是学生、研究人员,还是工业界的专业人士,我们相信本书都会为你提供丰富的知识和实践经验。我们假设读者已经具备一定的数学和编程基础,尽管如此,我们仍会尽力使用简单的语言和直观的示例来解释复杂的概念,以确保尽可能多的读者都能从本书中受益。机器学习的核心思想是让计算机通过学习数据来改进性能。本书介绍了各种机器学习算法和技术,如监督学习、无监督学习、强化学习等;介绍了常用的机器学习模型,如线性回归、决策树、支持向量机、神经网络等,并讨论了它们的原理、优缺点及适用场景。此外,本书还介绍了机器学习的关键概念,如特征工程、模型评估与选择、过拟合与欠拟合等。本书讨论了数据预处理和特征选择的技术,以及交叉验证和调参的方法,还讨论了如何处理不平衡数据、处理缺失值和异常值,以及处理文本、图像和时间序列数据的特殊技术。除理论知识外,本书还提供大量实际案例和实验,帮助读者将所学应用到实际问题中。本书使用流行的机器学习库和工具,如Python的Scikit-learn和PyTorch,来演示实现机器学习模型的实际步骤。最后,要强调的是,机器学习是一个不断发展的领域,新的算法和技术不断涌现,本书仅能帮助读者入门,我们鼓励读者继续深入学习和探索机器学习的前沿技术。希望本书能够为读者打下坚实的基础,激发读者对机器学习的兴趣,并成为读者在探索和实践中的指南。本书包含配套教学资源,读者可登录华信教育资源网注册后免费下载。本书难免存在一些不足之处,敬请读者多提宝贵意见和建议。
作 者
展开