华信教育资源网
大数据平台应用
大数据
丛   书   名: 高等职业教育云计算系列规划教材
作   译   者:张靖,李俊翰 出 版 日 期:2020-03-01
出   版   社:电子工业出版社 维   护   人:徐建军 
书   代   号:G0385400 I S B N:9787121385407

图书简介:

本书是结合职业教育的实际情况开发的云计算技术与应用专业系列教材之一。对云计算技术与应用专业、大数据技术与应用专业或者大数据初学者是一本不错的入门教程。本书强调理论知识以够用为度,注重动手能力,在动手中逐渐掌握大数据相关技术。本书内容包括大数据概述、Hadoop基础知识、大数据平台搭建、数据的获取、数据清理、数据分析、数据可视化、大数据管理平台Ambari等知识。涵盖内容较为广泛,但注重点到为止,方便读者迅速入门。
定价 39.0
您的专属联系人更多
关注 评论(0) 分享
配套资源 图书内容 样章/电子教材 图书评价
  • 配 套 资 源
    图书特别说明:导入Excel时图书分类为空!

    本书资源

    会员上传本书资源

  • 图 书 内 容

    内容简介

    本书是结合职业教育的实际情况开发的云计算技术与应用专业系列教材之一。对云计算技术与应用专业、大数据技术与应用专业或者大数据初学者是一本不错的入门教程。本书强调理论知识以够用为度,注重动手能力,在动手中逐渐掌握大数据相关技术。本书内容包括大数据概述、Hadoop基础知识、大数据平台搭建、数据的获取、数据清理、数据分析、数据可视化、大数据管理平台Ambari等知识。涵盖内容较为广泛,但注重点到为止,方便读者迅速入门。

    图书详情

    ISBN:9787121385407
    开 本:16开
    页 数:196
    字 数:329.0

    本书目录

    第1章  感知大数据	1
    任务1  认知大数据	1
    子任务1  定义大数据	2
    子任务2  洞悉大数据的特征	2
    任务2  探究大数据常用的技术	3
    任务3  窥视大数据的商业应用	4
    课后练习	5
    第2章  环视Hadoop	6
    任务1  溯源Hadoop	6
    子任务1  较量Hadoop与传统文件系统	8
    子任务2  发现Hadoop的核心和特点	9
    子任务3  初访MapReduce	10
    任务2  查究Hadoop分布式文件系统	12
    子任务1  探究HDFS工作机制	12
    子任务2  厘清HDFS的前提和设计目标	15
    子任务3  深挖HDFS的核心机制	19
    任务3  构建MapReduce编程模型	22
    子任务1  解构MapReduce编程模型	22
    子任务2  揭秘YARN与MapReduce	24
    任务4  漫游Hadoop系统及其生态圈	25
    课后练习	32
    第3章  部署Hadoop大数据平台	34
    任务1  掌控Hadoop平台的部署模式	34
    任务2  部署Hadoop集群	36
    任务3  编写首个MapReduce程序	59
    任务4  初次运行MapReduce程序	60
    课后练习	64
    本章附录	65
    第4章  设计爬虫获取数据源	69
    任务1  初探大数据	69
    任务2  剖析大数据	74
    任务3  爬取大数据	76
    任务4  活用Scrapy框架高效编制爬虫	79
    任务5  运用Scrapy	81
    课后练习	89
    第5章  清洗数据与存储结构化	91
    任务1  揭示数据清洗	91
    任务2  清洗数据	92
    子任务1  熟知数据的基本操作	92
    子任务2  处理数据缺失	94
    子任务3  规范化数据	96
    子任务4  处理数据表结构的错误	97
    子任务5  处理日期数据的问题	102
    任务3  使用分布式数据库系统和结构存储数据	104
    子任务1  安装并使用Hive数据仓库	104
    子任务2  安装并使用HBase分布式数据库	110
    课后练习	114
    第6章  分析大数据	115
    任务1  透视数据分析	115
    任务2  构建分析模型	116
    子任务1  厘清数据分析过程	116
    子任务2  数据机器学习模型	117
    任务3  运用大数据分析算法分析数据	119
    子任务1  运用K-Means聚类算法分析数据	120
    子任务2  运用线性回归算法分析数据	123
    子任务3  运用决策树算法分析数据	127
    课后练习	130
    第7章  可视化大数据	131
    任务1  洞察pyecharts库	131
    任务2  活用可视化	132
    子任务1  活用柱状图/条形图(Bar)	132
    子任务2  活用散点图(EffectScatter)	139
    子任务3  活用漏斗图(Funnel)	142
    子任务4  活用仪表盘(Gauge)	143
    子任务5  活用地理坐标图(Geo)	144
    子任务6  活用关系图(Graph)	145
    子任务7  活用热力图(HeatMap)	148
    子任务8  活用K线图(Kline/Candlestick)	150
    子任务9  活用折线图/面积图(Line)	152
    子任务10  活用水球图(Liquid)	153
    子任务11  活用地图(Map)	154
    子任务12  活用饼图(Pie)	155
    子任务13  活用平行坐标系(Parallel)	156
    子任务14  活用雷达图(Radar)	159
    子任务15  活用词云(WordCloud)图	160
    课后练习	161
    第8章  平台化快速部署Hadoop	163
    任务1  探寻大数据管理平台	163
    任务2  配置基础环境	165
    子任务1  配置Linux系统	165
    子任务2  禁用Transparent Huge Pages	169
    子任务3  安装并配置JDK	170
    任务3  安装并配置Ambari	170
    任务4  快速部署Hadoop大数据集群	173
    课后练习	178
    附录A  课后练习参考答案	179
    展开

    前     言

    大数据是新一代信息技术的重要组成部分,是国家战略高新技术及相关产业发展的基础技术支撑。大数据技术为各行各业带来了新的发展趋势。随着大数据技术及相关产业的快速发展,对各类技术技能型人才的需求也日趋旺盛。据工业和信息化部统计预测,未来几年将是我国大数据产业人才需求相对集中的时期,对于大数据产业人才的需求每年将呈现数十万的缺口。  
    本书从技术现状出发,注重发展前沿,软件采用最新版本,以保证教材内容的新颖性;加入丰富的案例,以确保教材内容的多样性;理论联系实际,以体现教材内容的创新性。本书以Hadoop为基础,讲解感知大数据、环视Hadoop、部署Hadoop大数据平台、设计爬虫获取数据源、清洗数据与存储结构化、分析大数据、可视化大数据、平台化快速部署Hadoop等知识。通过对本书的学习,可以培养读者对大数据发展的整体理解、实操Hadoop运维和开发Hadoop MapReduce应用程序。
    第1章讲解感知大数据,主要内容包括定义大数据、洞悉大数据的特征、探究大数据常用的技术、窥视大数据的商业应用等。
    第2章讲解环视Hadoop,主要内容包括溯源Hadoop、查究Hadoop分布式文件系统、构建MapReduce编程模型、漫游Hadoop系统及其生态圈等。
    第3章讲解部署Hadoop大数据平台,主要内容包括掌控Hadoop平台的部署模式、部署Hadoop集群、编写首个MapReduce程序、初次运行MapReduce程序等。
    第4章讲解设计爬虫获取数据源,主要内容包括初探大数据、剖析大数据、爬取大数据、活用Scrapy框架高效编制爬虫、运用Scrapy等。
    第5章讲解清洗数据与存储结构化,主要内容包括揭示数据清洗、清洗数据、使用分布式数据库系统和结构存储数据等。
    第6章讲解分析大数据,主要内容包括透视数据分析、构建分析模型、运用大数据分析算法分析数据等。
    第7章讲解可视化大数据,主要内容包括洞察pyecharts库,活用pyecharts库进行大数据的可视化,如柱状图/条形图、散点图、漏斗图、仪表盘、地理坐标图、关系图、热力图、K线图、折线图/面积图、水球图、地图、饼图、平行坐标系、雷达图、词云图等。
    第8章讲解平台化快速部署Hadoop,主要内容包括探寻大数据管理平台、配置基础环境、安装并配置Ambari、快速部署Hadoop大数据集群等。
    本书由重庆电子工程职业学院的张靖、李俊翰担任主编,由孙小娟、王磊担任副主编,重庆电子工程职业学院的李腾教授、路亚教授参与内容设计。感谢重庆电子工程职业学院人工智能与大数据学院院长武春岭教授对该书的悉心指导。感谢重庆市交通开投科技发展有限公司高工黄跃军、重庆华伟工业(集团)有限责任公司高工肖松参与本书内容的编写。感谢重庆翰海睿智大数据科技有限公司、北京红亚华宇科技有限公司、新华三技术有限公司参与本书的案例设计和测试。重庆科技学院的陈易、重庆电子工程职业学院的马皖川等同学在本书的编写过程中一直参与案例测试和文字校对等工作,在此也一并表示感谢。
    为了方便教师教学,本书配有电子教学课件,请有此需要的教师登录华信教育资源网(www.hxedu.com.cn)注册后免费下载,如有问题可在网站留言板留言或与电子工业出版社联系(E-mail:hxedu@phei.com.cn)。
    虽然我们精心组织、认真编写,但错误和疏漏之处在所难免。同时,由于编者水平有限,书中难免存在不足之处,恳请广大读者给予批评和指正,以便在今后的修订中不断改进。
    
    
                                                                          编  者
    展开

    作者简介

    本书暂无作者简介
  • 样 章 试 读
  • 图 书 评 价 我要评论
华信教育资源网