QQ在线客服
免费咨询热线
400-615-1233
工作时间-工作日
8:30-17:30
完成教师认证即可享有全部教学资源下载权限
0立封
0平封

大数据技术基础

需要更多信息,请联系杨 洋
  • 类  别:数据管理与大数据技术
  • 书  名:大数据技术基础
  • 主  编:袁帅 冯明卿
  • 定  价:45
  • 开  本:16开
  • 印刷方式:双色
  • 页  数:220
  • 时  间:2025年6月
  • 出  版  社:中国矿业大学出版社
  • 书  号:978-7-5646-6600-2

内容摘要

        全书共包括12个模块,分别是大数据概论、Hadoop基础知识、HDFS分布式文件系统、YARN资源管理调度框架、MapReduce分布式并行计算框架、Zoopkeeper、数据采集工具、Hive分布式数据仓库、HBase NoSQL数据库、Kafka分布式消息队列、Spark分布式计算框架、流计算框架。
        本书可作为本科及高职院校专业课的教材,也可供大数据相关的研究人员和从业者学习参考。

目录

模块1 大数据概论
1.1 大数据的定义 2
1.2 大数据的特征 2
1.3 大数据的产生及发展 3
1.4 大数据的应用场景 3
1.5 大数据生态系统 4
1.6 知识拓展 6
1.7 任务自测 6
 
模块2 Hadoop 基础知识
2.1 Hadoop 概述 8
2.2 Hadoop 生态系统 8
2.3 知识拓展 9
2.4 任务自测 10
 
模块3 HDFS 分布式文件系统
3.1 HDFS 介绍 12
3.2 HDFS 体系架构 13
3.3 HDFS 存储原理 14
3.4 HDFS 读写流程 15
3.5 安装虚拟机软件与虚拟机 17
3.6 安装远程连接工具 26
3.7 安装JDK 30
3.8 任务实施 31
3.9 知识拓展 47
3.10 任务考评 50
3.11 任务实训 50
3.12 任务自测 51
 
模块4 YARN 资源管理调度框架
4.1 YARN 介绍 54
4.2 YARN 体系结构 55
4.3 YARN 的工作流程 57
4.4 YARN 调度器 58
4.5 任务实施 59
4.6 知识拓展 67
4.7 任务考评 68
4.8 任务实训 69
4.9 任务自测 70
 
模块5 MapReduce 分布式并行计算框架
5.1 MapReduce 介绍 72
5.2 MapReduce 体系架构 73
5.3 MapReduce 的工作流程 74
5.4 任务实施 74
5.5 知识拓展 75
5.6 任务考评 76
5.7 任务实训 77
5.8 任务自测 77
 
模块6 Zookeeper 分布式服务协调框架
6.1 ZooKeeper 介绍 80
6.2 ZooKeeper 体系架构 80
6.3 ZooKeeper 的工作流程 81
6.4 ZooKeeper Shell 常用命令 81
6.5 任务实施 84
6.6 知识拓展 86
6.7 任务考评 88
6.8 任务实训 88
6.9 任务自测 89
 
模块7 数据采集工具
7.1 数据采集工具概述 92
7.2 Sqoop 介绍 92
7.3 Flume 介绍 92
7.4 DataX 介绍 93
7.5 任务实施 93
7.6 知识拓展 102
7.7 任务考评 102
7.8 任务实训 103
7.9 任务自测 103
 
模块8 Hive 分布式数据仓库
8.1 Hive 简介 106
8.2 Hive 体系架构 107
8.3 Hive 的运行机制 108
8.4 Hive 的重要概念 109
8.5 任务实施 113
8.6 任务考评 118
8.7 任务实训 118
8.8 知识拓展 119
8.9 任务自测 120
 
模块9 HBase NoSQL 数据库
9.1 HBase 简介 124
9.2 HBase 数据模型 124
9.3 HBase 体系架构 125
9.4 HBase 的运行原理 127
9.5 任务实施 128
9.6 知识拓展 144
9.7 任务考评 148
9.8 任务实训 148
9.9 任务自测 149
 
模块10 Kafka 分布式消息队列
10.1 Kafka 简介 152
10.2 Kafka 体系架构 152
10.3 Kafka 的运行机制 153
10.4 任务实施 153
10.5 知识拓展 166
10.6 任务考评 167
10.7 任务实训 167
10.8 任务自测 168
 
模块11 Spark 分布式计算框架
11.1 Spark 简介 170
11.2 Spark 技术架构 171
11.3 任务实施 172
11.4 知识拓展 182
11.5 任务考评 183
11.6任务实训 183
11.7 任务自测 184
 
模块12 流计算框架
12.1 流计算框架概述 188
12.2 Flink 流处理框架 189
12.3 Spark Streaming 流处理框架 190
12.4 任务实施 191
12.5 知识拓展 203
12.6 任务考评 204
12.7 任务实训 204
12.8 任务自测 205
 
参考文献 207
◎袁帅,副教授,郑州电力高等专科学校信息通信学院副院长,全国职业技能大赛裁判、河南省技术能手、河南省青年岗位能手、河南省骨干教师、河南省“双师型”教师。发表论文20余篇,省级、校级教科研课题立结项10余项,获得河南省教学成果二等奖、全国电力职业教育教学成果奖二等奖,主编、参编教材3本。指导学生参加职业技能竞赛、一带一路暨金砖国家技能发展与技术创新大赛、“互联网+”和“挑战杯”创新创业大赛,获国家级、省级以上奖项10余项。

◎冯明卿,副教授,郑州电力高等专科学校信息通信学院院长,河南省省级名师,职业教育国家学分银行专家库专家,中国计算机学会会员,中国职业技术教育学会智慧物联网专业委员会常务委员、全国高等院校计算机基础教育研究会高职计算机与电子商务专委会常务委员,一带一路暨金砖国家技能发展国际联盟大数据和人工智能专业委员会常务理事,河南省计算机教育研究会职业教育专业委员会常务委员,郑州市电力物联网工程技术研究中心主任。
  • Spark技术与应用

    主编:王晓燕 袁帅

    全书共分为九个任务,分别是搭建Spark开发环境、项目数据采集、探索Scala编程方法、揭秘弹性分布式数据集、Spark SQL——数据融合

    ¥55
  • Hadoop大数据开发实例教程(双色)

    主编:喻衣鑫 张鲁燕

    本书共分10个模块,各模块自成体系又相互关联,从大数据生态系统引申出Hadoop生态系统,然后依次介绍Hadoop的安装与基本配置、Hadoop

    ¥43
  • 办公自动化技术可视化教程(第2版) (Windows 7+Office 2010)

    主编:邵杰

    本书全面介绍办公自动化工作中所需要掌握的常用办公软件的操作、常用办公设备的使用与维护,以及网络的有关知识。全书采用详实的图

    ¥66
  • 办公自动化技术可视化教程

    主编:邵杰

    本书为项目案例型教材,根据知识学习规律,精心设计了相应的项目和案例,共分15章,第1~3章介绍了办公自动化概述、常用办公及工具

    ¥49.5
  • 计算机网络技术基础

    主编:陈孟祥

    本书介绍了计算机网络相关知识,重点介绍计算机网络的功能、作用、组成、原理等内容。本书共分为8个模块,内容涵盖了计算机网络的

    ¥58
  • 多媒体技术与应用

    主编:汪绪彪

    本书以多媒体技术应用为主线组织内容,对常用软件的基础知识、使用方法、应用技巧进行了介绍。全书共7个模块,依次对多媒体技术基

    ¥65
  • 计算机网络技术项目化教程

    主编:张敬斋 王晨

    本书系统地介绍了计算机网络的基础知识、相关技术和实际应用。全书共5个项目,主要内容包括:计算机网络基础知识、 局域网及其技

    ¥45
  • 信息安全技术与应用

    主编:丁华

    本书针对信息安全面临的各种威胁、信息安全技术、信息保护方法等方面进行了讲解。本书共分9 章,内容包括信息安全技术概述、数据

    ¥49.9
  • 局域网组网技术

    主编:王鹏

      本书是为高职高专计算机及相关专业编写的教材。  本教材全面而系统地介绍了局域网的基础知识、基本技术和基本应用,主要内容包括:局

    ¥39.8