QQ在线客服
免费咨询热线
400-615-1233
工作时间-工作日
8:30-17:30
0立封
0平封

大数据技术基础

需要更多信息,请联系杨 洋
  • 类  别:计算机系列
  • 书  名:大数据技术基础
  • 主  编:袁帅 冯明卿
  • 定  价:45
  • 开  本:16开
  • 印刷方式:双色
  • 页  数:220
  • 时  间:2025年6月
  • 出  版  社:中国矿业大学出版社
  • 书  号:978-7-5646-6600-2

内容摘要

        全书共包括12个模块,分别是大数据概论、Hadoop基础知识、HDFS分布式文件系统、YARN资源管理调度框架、MapReduce分布式并行计算框架、Zoopkeeper、数据采集工具、Hive分布式数据仓库、HBase NoSQL数据库、Kafka分布式消息队列、Spark分布式计算框架、流计算框架。
        本书可作为本科及高职院校专业课的教材,也可供大数据相关的研究人员和从业者学习参考。

目录

模块1 大数据概论
1.1 大数据的定义 2
1.2 大数据的特征 2
1.3 大数据的产生及发展 3
1.4 大数据的应用场景 3
1.5 大数据生态系统 4
1.6 知识拓展 6
1.7 任务自测 6
 
模块2 Hadoop 基础知识
2.1 Hadoop 概述 8
2.2 Hadoop 生态系统 8
2.3 知识拓展 9
2.4 任务自测 10
 
模块3 HDFS 分布式文件系统
3.1 HDFS 介绍 12
3.2 HDFS 体系架构 13
3.3 HDFS 存储原理 14
3.4 HDFS 读写流程 15
3.5 安装虚拟机软件与虚拟机 17
3.6 安装远程连接工具 26
3.7 安装JDK 30
3.8 任务实施 31
3.9 知识拓展 47
3.10 任务考评 50
3.11 任务实训 50
3.12 任务自测 51
 
模块4 YARN 资源管理调度框架
4.1 YARN 介绍 54
4.2 YARN 体系结构 55
4.3 YARN 的工作流程 57
4.4 YARN 调度器 58
4.5 任务实施 59
4.6 知识拓展 67
4.7 任务考评 68
4.8 任务实训 69
4.9 任务自测 70
 
模块5 MapReduce 分布式并行计算框架
5.1 MapReduce 介绍 72
5.2 MapReduce 体系架构 73
5.3 MapReduce 的工作流程 74
5.4 任务实施 74
5.5 知识拓展 75
5.6 任务考评 76
5.7 任务实训 77
5.8 任务自测 77
 
模块6 Zookeeper 分布式服务协调框架
6.1 ZooKeeper 介绍 80
6.2 ZooKeeper 体系架构 80
6.3 ZooKeeper 的工作流程 81
6.4 ZooKeeper Shell 常用命令 81
6.5 任务实施 84
6.6 知识拓展 86
6.7 任务考评 88
6.8 任务实训 88
6.9 任务自测 89
 
模块7 数据采集工具
7.1 数据采集工具概述 92
7.2 Sqoop 介绍 92
7.3 Flume 介绍 92
7.4 DataX 介绍 93
7.5 任务实施 93
7.6 知识拓展 102
7.7 任务考评 102
7.8 任务实训 103
7.9 任务自测 103
 
模块8 Hive 分布式数据仓库
8.1 Hive 简介 106
8.2 Hive 体系架构 107
8.3 Hive 的运行机制 108
8.4 Hive 的重要概念 109
8.5 任务实施 113
8.6 任务考评 118
8.7 任务实训 118
8.8 知识拓展 119
8.9 任务自测 120
 
模块9 HBase NoSQL 数据库
9.1 HBase 简介 124
9.2 HBase 数据模型 124
9.3 HBase 体系架构 125
9.4 HBase 的运行原理 127
9.5 任务实施 128
9.6 知识拓展 144
9.7 任务考评 148
9.8 任务实训 148
9.9 任务自测 149
 
模块10 Kafka 分布式消息队列
10.1 Kafka 简介 152
10.2 Kafka 体系架构 152
10.3 Kafka 的运行机制 153
10.4 任务实施 153
10.5 知识拓展 166
10.6 任务考评 167
10.7 任务实训 167
10.8 任务自测 168
 
模块11 Spark 分布式计算框架
11.1 Spark 简介 170
11.2 Spark 技术架构 171
11.3 任务实施 172
11.4 知识拓展 182
11.5 任务考评 183
11.6任务实训 183
11.7 任务自测 184
 
模块12 流计算框架
12.1 流计算框架概述 188
12.2 Flink 流处理框架 189
12.3 Spark Streaming 流处理框架 190
12.4 任务实施 191
12.5 知识拓展 203
12.6 任务考评 204
12.7 任务实训 204
12.8 任务自测 205
 
参考文献 207

主编信息

◎袁帅,副教授,郑州电力高等专科学校信息通信学院副院长,全国职业技能大赛裁判、河南省技术能手、河南省青年岗位能手、河南省骨干教师、河南省“双师型”教师。发表论文20余篇,省级、校级教科研课题立结项10余项,获得河南省教学成果二等奖、全国电力职业教育教学成果奖二等奖,主编、参编教材3本。指导学生参加职业技能竞赛、一带一路暨金砖国家技能发展与技术创新大赛、“互联网+”和“挑战杯”创新创业大赛,获国家级、省级以上奖项10余项。

◎冯明卿,副教授,郑州电力高等专科学校信息通信学院院长,河南省省级名师,职业教育国家学分银行专家库专家,中国计算机学会会员,中国职业技术教育学会智慧物联网专业委员会常务委员、全国高等院校计算机基础教育研究会高职计算机与电子商务专委会常务委员,一带一路暨金砖国家技能发展国际联盟大数据和人工智能专业委员会常务理事,河南省计算机教育研究会职业教育专业委员会常务委员,郑州市电力物联网工程技术研究中心主任。

相关图书

  • Spark技术与应用

    主编:王晓燕 袁帅

    全书共分为九个任务,分别是搭建Spark开发环境、项目数据采集、探索Scala编程方法、揭秘弹性分布式数据集、Spark SQL——数据融合

    ¥55
  • 办公自动化技术可视化教程 (第2版)(Windows 7+Office 2010)

    主编:邵杰

    本书全面介绍办公自动化工作中所需要掌握的常用办公软件的操作、常用办公设备的使用与维护,以及网络的有关知识。全书采用详实的图

    ¥66
  • 电力电子技术

    主编:张建国

    本书除绪论外共7章,内容包括晶闸管及单相可控整流电路的应用、三相可控整流电路的应用、有源逆变电路的应用、全控型电力电子器件

    ¥42
  • 单片机技术及应用

    主编:曹月真

    本书共9个课题,包括单片机的初步认知、交通信号灯设计与制作、按键与数码管应用设计、中断系统的应用、LED点阵显示设计、你来我往

    ¥48
  • 数控机床电气控制技术

    主编:高艳平 陈甫

    本书共6个项目,主要内容包括数控机床常用低压电器、数控机床典型控制线路、数控系统及其接口应用、数控机床主传动系统的控制、数

    ¥49
  • 模拟电子技术

    主编:张俊才

    本书按照理实一体化的思想进行编写完善,突出技能训练,更适合职业教育教学需要,以实际项目为中心,以实际工作为引导。全书共分为

    ¥45
  • 信息技术基础(第2版)(WPS版)

    主编:朱利华

    本书内容包括走进信息时代 ——信息技术应用基础、制作 绿色亚运环保骑行 活动方案——文档处理、制作农林牧渔业总产值季度报表

    ¥49.9
  • 信息技术(职业本科版)

    主编:叶莉 胡三宁 彭沛

    本书根据教育部颁布的《高等职业教育专科信息技术课程标准(2021年版)》基础模块进行编写。 全书设计为14个单元,分为基础

    ¥59.8
  • 信息技术与人工智能基础

    主编:王瑞 董娟

    本书共8个模块,内容包括信息技术应用基础、WPS文字应用、WPS表格应用、WPS演示应用、人工智能基础、人工智能的行业应用、AIGC助力

    ¥55
  • 信息技术(WPS Office)

    主编:杨俭 幸荔芸

    本书共包括七个项目,分别是信息技术应用基础、文档处理、电子表格处理、演示文稿制作、信息检索与计算机网络、新一代信息技术概述

    ¥49.9