App 下载
注册
登录
|
搜索
正在搜索中...
首页
我的书架
我的主页
我的收藏
我的书评
《写给大忙人的Hadoop 2》首先介绍了Hadoop 的背景知识,包括Hadoop 2 和YARN 的工作原理和对Hadoop 1 的改进,然后将数据湖与传统存储比较。
……
[ 展开全部 ]
第2 章到第8 章,分别介绍了Hadoop 2 和核心服务的安装方法、Hadoop 分布式文件系统、MapReduce 和YARN 编程,以及利用Apache Pig 等Hadoop 工具简化编程。最后两章讲述了利用Apache Ambari 等工具管理Hadoop 和基本的管理程序。附录包括Hadoop 2 故障诊断和排除的基础知识、Apache Hue 和Apache Spark 安装等。 《写给大忙人的Hadoop 2》通俗易懂,具有大量操作实例,易于上手,适合Hadoop 用户、管理员、开发和运维人员、程序员、架构师、分析师和数据科学工作者阅读。
[ 收起 ]
作者:【美】Douglas Eadline(道格拉斯•伊德理恩)
出版社:电子工业出版社
定价:69.00元
ISBN:7121288052
给个评价
做个书摘
书摘 (21 )
评价 (1 )
查看所有书摘
按目录显示书摘
只显示目录
1 背景和概念 1
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
定义Apache Hadoop 1
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
Apache Hadoop 的发展简史 3
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
大数据的定义 4
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
Hadoop 作为数据湖 5
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
使用Hadoop:管理员、用户或两种身份兼具 7
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
原始的MapReduce. 7
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
Apache Hadoop 的设计原则 8
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
Apache Hadoop MapReduce 示例 8
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
MapReduce 的优势 10
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
Apache Hadoop V1 MapReduce 操作 11
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
使用Hadoop V2 超越MapReduce 13
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
Hadoop V2 YARN 操作设计 14
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
Apache Hadoop 项目生态系统 16
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
总结和补充资料 18
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
2 安装攻略 21
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
核心Hadoop 服务 21
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
Hadoop 配置文件 22
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
规划你的资源 23
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
硬件的选择 23
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
软件的选择 24
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
在台式机或笔记本电脑上安装 25
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
安装Hortonworks HDP 2.2 沙箱 25
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
用Apache 源代码安装Hadoop 32
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
配置单节点YARN 服务器的步骤 33
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
运行简单的MapReduce 示例 42
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
安装 Apache Pig(可选) 42
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
安装Apache Hive(可选) 43
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
使用Ambari 安装Hadoop 44
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
执行Ambari 安装 45
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
撤消Ambari 安装 59
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
使用Apache Whirr 在云中安装Hadoop 59
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
总结和补充资料 65
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
3 HDFS 基础知识 67
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
HDFS 设计的特点 67
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
HDFS 组件 68
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
HDFS 块复制 71
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
HDFS 安全模式 72
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
机架的识别 73
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
NameNode 高可用性 73
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
HDFS NameNode 联邦 75
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
HDFS 检查点和备份 76
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
HDFS 快照 76
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
HDFS NFS 网关 76
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
HDFS 用户命令 77
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
简要HDFS 命令参考 77
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
一般HDFS 命令 78
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
列出HDFS 中的文件 79
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
在HDFS 中创建一个目录 80
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
将文件复制到HDFS 80
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
从HDFS 复制文件 81
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
在HDFS 中复制文件 81
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
删除在HDFS 中的文件 81
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
删除在HDFS 中的目录 81
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
获取HDFS 状态报告 81
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
HDFS 的Web 图形用户界面 82
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
在程序中使用HDFS 82
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
HDFS Java 应用程序示例 82
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
HDFS C 应用程序示例 86
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
总结和补充资料 88
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
4 运行示例程序和基准测试程序 91
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
运行MapReduce 示例 91
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
列出可用的示例 92
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
运行Pi 示例 93
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
使用Web 界面监控示例 95
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
运行基本Hadoop 基准测试程序 101
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
运行Terasort 测试 101
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
运行TestDFSIO 基准 102
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
管理Hadoop MapReduce 作业 104
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
总结和补充资料 105
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
5 Hadoop MapReduce 框架 107
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
MapReduce 模型 107
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
MapReduce 并行数据流. 110
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
容错和推测执行 114
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
推测执行. 114
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
Hadoop MapReduce 硬件 115
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
总结和补充资料 115
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
6 MapReduce 编程 117
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
编译和运行Hadoop WordCount 的示例 117
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
使用流式接口 122
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
使用管道接口 125
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
编译和运行Hadoop Grep 链示例 127
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
调试MapReduce. 131
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
作业的列举、清除和状态查询 131
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
Hadoop 日志管理 131
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
启用YARN 日志聚合 132
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
Web 界面日志查看 133
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
命令行日志查看 133
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
总结和补充资料 135
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
7 基本的Hadoop 工具 137
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
使用Apache Pig 137
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
Pig 示例演练 138
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
使用Apache Hive 140
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
Hive 示例演练 140
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
更高级的Hive 示例 142
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
使用Apache Sqoop 获取关系型数据 145
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
Apache Sqoop 导入和导出方法 145
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
Apache Sqoop 版本更改 147
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
Sqoop 示例演练 148
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
使用Apache Flume 获取数据流 155
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
Flume 的示例演练 157
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
使用Apache Oozie 管理 Hadoop 工作流 160
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
Oozie 示例演练 162
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
使用Apache HBase 170
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
HBase 数据模型概述 170
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
HBase 示例演练 171
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
总结和补充资料 176
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
8 Hadoop YARN 应用程序 179
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
YARN 分布式shell 179
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
使用YARN 分布式shell 180
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
一个简单的示例 181
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
使用更多的容器 182
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
带有shell 参数的分布式 shell 示例 183
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
YARN 应用程序的结构 185
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
YARN 应用程序框架 187
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
Hadoop MapReduce 188
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
Apache Tez 188
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
Apache Giraph 189
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
Hoya:HBase on YARN 189
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
Dryad on YARN 189
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
Apache Spark 189
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
Apache Storm 190
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
Apache REEF:可持续计算执行框架 190
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
Hamster:Hadoop 和MPI 在同一集群 190
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
Apache Flink:可扩展的批处理和流式数据处理 191
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
Apache Slider:动态应用程序管理 191
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
总结和补充资料 192
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
9 用Apache Ambari 管理Hadoop 193
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
快速浏览 Apache Ambari 194
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
仪表板视图 194
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
服务视图. 197
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
主机视图. 199
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
管理视图. 201
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
查看视图. 201
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
Admin 下拉菜单 202
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
更改Hadoop 属性 206
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
总结和补充资料 212
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
10 基本的Hadoop 管理程序 213
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
基本的Hadoop YARN 管理 214
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
停用YARN 节点 214
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
YARN WebProxy 214
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
使用 JobHistoryServer 215
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
管理YARN 作业 215
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
设置容器内存 215
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
设置容器核心 216
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
设置MapReduce 属性 216
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
基本的HDFS 管理 217
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
NameNode 用户界面 217
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
将用户添加到HDFS 219
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
在HDFS 上执行FSCK 220
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
平衡HDFS 221
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
HDFS 安全模式 222
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
停用HDFS 节点 222
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
SecondaryNameNode 223
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
HDFS 快照 223
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
配置到HDFS 的NFSv3 网关 225
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
容量调度程序背景知识 229
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
Hadoop 2 的MapReduce 兼容性 231
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
启用应用主控程序的重新启动功能 231
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
计算一个节点的承载容量 232
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
运行Hadoop 1 的应用程序 233
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
总结和补充资料 235
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
附录A 本书的网页和代码下载 237
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
附录B 入门流程图和故障排除指南 239
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
入门流程图 239
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
常见的Hadoop 故障排除指南 239
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
规则1:不要惊慌 239
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
规则2:安装并使用Ambari 244
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
规则3:检查日志 244
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
规则4:简化情况 245
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
规则5:在互联网上提问 245
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
其他有用的提示 246
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
附录C 按主题列出的Apache Hadoop 资源汇总 253
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
常规的Hadoop 信息 253
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
Hadoop 安装攻略 253
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
HDFS 254
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
示例 255
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
MapReduce. 255
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
MapReduce 编程 255
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
基本工具 256
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
YARN 应用程序框架 257
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
Ambari 管理 257
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
基本的Hadoop 管理 257
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
附录D 安装Hue Hadoop GUI 259
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
Hue 安装 259
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
安装和配置Hue 262
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
启动Hue 263
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
Hue 用户界面 263
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
附录E 安装Apache Spark 267
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
在集群上安装Spark. 267
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
在整个集群中启动Spark. 268
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
在伪分布式的单节点安装版本中安装和启动Spark 270
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
运行Spark 示例 271
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
导购链接
×
做书摘
文字书摘
读图识字
至少还需要输入
10
字
保存原图片为书摘
上传图片
识别
最多输入
500
个字
上传图片
重新上传
写点笔记吧
至少还需要输入
10
字
章节(选填)
1 背景和概念 1
定义Apache Hadoop 1
Apache Hadoop 的发展简史 3
大数据的定义 4
Hadoop 作为数据湖 5
使用Hadoop:管理员、用户或两种身份兼具 7
原始的MapReduce. 7
Apache Hadoop 的设计原则 8
Apache Hadoop MapReduce 示例 8
MapReduce 的优势 10
Apache Hadoop V1 MapReduce 操作 11
使用Hadoop V2 超越MapReduce 13
Hadoop V2 YARN 操作设计 14
Apache Hadoop 项目生态系统 16
总结和补充资料 18
2 安装攻略 21
核心Hadoop 服务 21
Hadoop 配置文件 22
规划你的资源 23
硬件的选择 23
软件的选择 24
在台式机或笔记本电脑上安装 25
安装Hortonworks HDP 2.2 沙箱 25
用Apache 源代码安装Hadoop 32
配置单节点YARN 服务器的步骤 33
运行简单的MapReduce 示例 42
安装 Apache Pig(可选) 42
安装Apache Hive(可选) 43
使用Ambari 安装Hadoop 44
执行Ambari 安装 45
撤消Ambari 安装 59
使用Apache Whirr 在云中安装Hadoop 59
总结和补充资料 65
3 HDFS 基础知识 67
HDFS 设计的特点 67
HDFS 组件 68
HDFS 块复制 71
HDFS 安全模式 72
机架的识别 73
NameNode 高可用性 73
HDFS NameNode 联邦 75
HDFS 检查点和备份 76
HDFS 快照 76
HDFS NFS 网关 76
HDFS 用户命令 77
简要HDFS 命令参考 77
一般HDFS 命令 78
列出HDFS 中的文件 79
在HDFS 中创建一个目录 80
将文件复制到HDFS 80
从HDFS 复制文件 81
在HDFS 中复制文件 81
删除在HDFS 中的文件 81
删除在HDFS 中的目录 81
获取HDFS 状态报告 81
HDFS 的Web 图形用户界面 82
在程序中使用HDFS 82
HDFS Java 应用程序示例 82
HDFS C 应用程序示例 86
总结和补充资料 88
4 运行示例程序和基准测试程序 91
运行MapReduce 示例 91
列出可用的示例 92
运行Pi 示例 93
使用Web 界面监控示例 95
运行基本Hadoop 基准测试程序 101
运行Terasort 测试 101
运行TestDFSIO 基准 102
管理Hadoop MapReduce 作业 104
总结和补充资料 105
5 Hadoop MapReduce 框架 107
MapReduce 模型 107
MapReduce 并行数据流. 110
容错和推测执行 114
推测执行. 114
Hadoop MapReduce 硬件 115
总结和补充资料 115
6 MapReduce 编程 117
编译和运行Hadoop WordCount 的示例 117
使用流式接口 122
使用管道接口 125
编译和运行Hadoop Grep 链示例 127
调试MapReduce. 131
作业的列举、清除和状态查询 131
Hadoop 日志管理 131
启用YARN 日志聚合 132
Web 界面日志查看 133
命令行日志查看 133
总结和补充资料 135
7 基本的Hadoop 工具 137
使用Apache Pig 137
Pig 示例演练 138
使用Apache Hive 140
Hive 示例演练 140
更高级的Hive 示例 142
使用Apache Sqoop 获取关系型数据 145
Apache Sqoop 导入和导出方法 145
Apache Sqoop 版本更改 147
Sqoop 示例演练 148
使用Apache Flume 获取数据流 155
Flume 的示例演练 157
使用Apache Oozie 管理 Hadoop 工作流 160
Oozie 示例演练 162
使用Apache HBase 170
HBase 数据模型概述 170
HBase 示例演练 171
总结和补充资料 176
8 Hadoop YARN 应用程序 179
YARN 分布式shell 179
使用YARN 分布式shell 180
一个简单的示例 181
使用更多的容器 182
带有shell 参数的分布式 shell 示例 183
YARN 应用程序的结构 185
YARN 应用程序框架 187
Hadoop MapReduce 188
Apache Tez 188
Apache Giraph 189
Hoya:HBase on YARN 189
Dryad on YARN 189
Apache Spark 189
Apache Storm 190
Apache REEF:可持续计算执行框架 190
Hamster:Hadoop 和MPI 在同一集群 190
Apache Flink:可扩展的批处理和流式数据处理 191
Apache Slider:动态应用程序管理 191
总结和补充资料 192
9 用Apache Ambari 管理Hadoop 193
快速浏览 Apache Ambari 194
仪表板视图 194
服务视图. 197
主机视图. 199
管理视图. 201
查看视图. 201
Admin 下拉菜单 202
更改Hadoop 属性 206
总结和补充资料 212
10 基本的Hadoop 管理程序 213
基本的Hadoop YARN 管理 214
停用YARN 节点 214
YARN WebProxy 214
使用 JobHistoryServer 215
管理YARN 作业 215
设置容器内存 215
设置容器核心 216
设置MapReduce 属性 216
基本的HDFS 管理 217
NameNode 用户界面 217
将用户添加到HDFS 219
在HDFS 上执行FSCK 220
平衡HDFS 221
HDFS 安全模式 222
停用HDFS 节点 222
SecondaryNameNode 223
HDFS 快照 223
配置到HDFS 的NFSv3 网关 225
容量调度程序背景知识 229
Hadoop 2 的MapReduce 兼容性 231
启用应用主控程序的重新启动功能 231
计算一个节点的承载容量 232
运行Hadoop 1 的应用程序 233
总结和补充资料 235
附录A 本书的网页和代码下载 237
附录B 入门流程图和故障排除指南 239
入门流程图 239
常见的Hadoop 故障排除指南 239
规则1:不要惊慌 239
规则2:安装并使用Ambari 244
规则3:检查日志 244
规则4:简化情况 245
规则5:在互联网上提问 245
其他有用的提示 246
附录C 按主题列出的Apache Hadoop 资源汇总 253
常规的Hadoop 信息 253
Hadoop 安装攻略 253
HDFS 254
示例 255
MapReduce. 255
MapReduce 编程 255
基本工具 256
YARN 应用程序框架 257
Ambari 管理 257
基本的Hadoop 管理 257
附录D 安装Hue Hadoop GUI 259
Hue 安装 259
安装和配置Hue 262
启动Hue 263
Hue 用户界面 263
附录E 安装Apache Spark 267
在集群上安装Spark. 267
在整个集群中启动Spark. 268
在伪分布式的单节点安装版本中安装和启动Spark 270
运行Spark 示例 271
页码(选填)
这本书已经添加了这些章节,请勾选或者新建你的书摘所属的章节
add
up
down
remove
1 背景和概念 1
定义Apache Hadoop 1
Apache Hadoop 的发展简史 3
大数据的定义 4
Hadoop 作为数据湖 5
使用Hadoop:管理员、用户或两种身份兼具 7
原始的MapReduce. 7
Apache Hadoop 的设计原则 8
Apache Hadoop MapReduce 示例 8
MapReduce 的优势 10
Apache Hadoop V1 MapReduce 操作 11
使用Hadoop V2 超越MapReduce 13
Hadoop V2 YARN 操作设计 14
Apache Hadoop 项目生态系统 16
总结和补充资料 18
2 安装攻略 21
核心Hadoop 服务 21
Hadoop 配置文件 22
规划你的资源 23
硬件的选择 23
软件的选择 24
在台式机或笔记本电脑上安装 25
安装Hortonworks HDP 2.2 沙箱 25
用Apache 源代码安装Hadoop 32
配置单节点YARN 服务器的步骤 33
运行简单的MapReduce 示例 42
安装 Apache Pig(可选) 42
安装Apache Hive(可选) 43
使用Ambari 安装Hadoop 44
执行Ambari 安装 45
撤消Ambari 安装 59
使用Apache Whirr 在云中安装Hadoop 59
总结和补充资料 65
3 HDFS 基础知识 67
HDFS 设计的特点 67
HDFS 组件 68
HDFS 块复制 71
HDFS 安全模式 72
机架的识别 73
NameNode 高可用性 73
HDFS NameNode 联邦 75
HDFS 检查点和备份 76
HDFS 快照 76
HDFS NFS 网关 76
HDFS 用户命令 77
简要HDFS 命令参考 77
一般HDFS 命令 78
列出HDFS 中的文件 79
在HDFS 中创建一个目录 80
将文件复制到HDFS 80
从HDFS 复制文件 81
在HDFS 中复制文件 81
删除在HDFS 中的文件 81
删除在HDFS 中的目录 81
获取HDFS 状态报告 81
HDFS 的Web 图形用户界面 82
在程序中使用HDFS 82
HDFS Java 应用程序示例 82
HDFS C 应用程序示例 86
总结和补充资料 88
4 运行示例程序和基准测试程序 91
运行MapReduce 示例 91
列出可用的示例 92
运行Pi 示例 93
使用Web 界面监控示例 95
运行基本Hadoop 基准测试程序 101
运行Terasort 测试 101
运行TestDFSIO 基准 102
管理Hadoop MapReduce 作业 104
总结和补充资料 105
5 Hadoop MapReduce 框架 107
MapReduce 模型 107
MapReduce 并行数据流. 110
容错和推测执行 114
推测执行. 114
Hadoop MapReduce 硬件 115
总结和补充资料 115
6 MapReduce 编程 117
编译和运行Hadoop WordCount 的示例 117
使用流式接口 122
使用管道接口 125
编译和运行Hadoop Grep 链示例 127
调试MapReduce. 131
作业的列举、清除和状态查询 131
Hadoop 日志管理 131
启用YARN 日志聚合 132
Web 界面日志查看 133
命令行日志查看 133
总结和补充资料 135
7 基本的Hadoop 工具 137
使用Apache Pig 137
Pig 示例演练 138
使用Apache Hive 140
Hive 示例演练 140
更高级的Hive 示例 142
使用Apache Sqoop 获取关系型数据 145
Apache Sqoop 导入和导出方法 145
Apache Sqoop 版本更改 147
Sqoop 示例演练 148
使用Apache Flume 获取数据流 155
Flume 的示例演练 157
使用Apache Oozie 管理 Hadoop 工作流 160
Oozie 示例演练 162
使用Apache HBase 170
HBase 数据模型概述 170
HBase 示例演练 171
总结和补充资料 176
8 Hadoop YARN 应用程序 179
YARN 分布式shell 179
使用YARN 分布式shell 180
一个简单的示例 181
使用更多的容器 182
带有shell 参数的分布式 shell 示例 183
YARN 应用程序的结构 185
YARN 应用程序框架 187
Hadoop MapReduce 188
Apache Tez 188
Apache Giraph 189
Hoya:HBase on YARN 189
Dryad on YARN 189
Apache Spark 189
Apache Storm 190
Apache REEF:可持续计算执行框架 190
Hamster:Hadoop 和MPI 在同一集群 190
Apache Flink:可扩展的批处理和流式数据处理 191
Apache Slider:动态应用程序管理 191
总结和补充资料 192
9 用Apache Ambari 管理Hadoop 193
快速浏览 Apache Ambari 194
仪表板视图 194
服务视图. 197
主机视图. 199
管理视图. 201
查看视图. 201
Admin 下拉菜单 202
更改Hadoop 属性 206
总结和补充资料 212
10 基本的Hadoop 管理程序 213
基本的Hadoop YARN 管理 214
停用YARN 节点 214
YARN WebProxy 214
使用 JobHistoryServer 215
管理YARN 作业 215
设置容器内存 215
设置容器核心 216
设置MapReduce 属性 216
基本的HDFS 管理 217
NameNode 用户界面 217
将用户添加到HDFS 219
在HDFS 上执行FSCK 220
平衡HDFS 221
HDFS 安全模式 222
停用HDFS 节点 222
SecondaryNameNode 223
HDFS 快照 223
配置到HDFS 的NFSv3 网关 225
容量调度程序背景知识 229
Hadoop 2 的MapReduce 兼容性 231
启用应用主控程序的重新启动功能 231
计算一个节点的承载容量 232
运行Hadoop 1 的应用程序 233
总结和补充资料 235
附录A 本书的网页和代码下载 237
附录B 入门流程图和故障排除指南 239
入门流程图 239
常见的Hadoop 故障排除指南 239
规则1:不要惊慌 239
规则2:安装并使用Ambari 244
规则3:检查日志 244
规则4:简化情况 245
规则5:在互联网上提问 245
其他有用的提示 246
附录C 按主题列出的Apache Hadoop 资源汇总 253
常规的Hadoop 信息 253
Hadoop 安装攻略 253
HDFS 254
示例 255
MapReduce. 255
MapReduce 编程 255
基本工具 256
YARN 应用程序框架 257
Ambari 管理 257
基本的Hadoop 管理 257
附录D 安装Hue Hadoop GUI 259
Hue 安装 259
安装和配置Hue 262
启动Hue 263
Hue 用户界面 263
附录E 安装Apache Spark 267
在集群上安装Spark. 267
在整个集群中启动Spark. 268
在伪分布式的单节点安装版本中安装和启动Spark 270
运行Spark 示例 271
×
添加一个书摘本
搜索创建书摘本
搜索
正在搜索...
不对,换一下
书名
作者
出版社
备注
ISBN
*
*
1 背景和概念 1
定义Apache Hadoop 1
Apache Hadoop 的发展简史 3
大数据的定义 4
Hadoop 作为数据湖 5
使用Hadoop:管理员、用户或两种身份兼具 7
原始的MapReduce. 7
Apache Hadoop 的设计原则 8
Apache Hadoop MapReduce 示例 8
MapReduce 的优势 10
Apache Hadoop V1 MapReduce 操作 11
使用Hadoop V2 超越MapReduce 13
Hadoop V2 YARN 操作设计 14
Apache Hadoop 项目生态系统 16
总结和补充资料 18
2 安装攻略 21
核心Hadoop 服务 21
Hadoop 配置文件 22
规划你的资源 23
硬件的选择 23
软件的选择 24
在台式机或笔记本电脑上安装 25
安装Hortonworks HDP 2.2 沙箱 25
用Apache 源代码安装Hadoop 32
配置单节点YARN 服务器的步骤 33
运行简单的MapReduce 示例 42
安装 Apache Pig(可选) 42
安装Apache Hive(可选) 43
使用Ambari 安装Hadoop 44
执行Ambari 安装 45
撤消Ambari 安装 59
使用Apache Whirr 在云中安装Hadoop 59
总结和补充资料 65
3 HDFS 基础知识 67
HDFS 设计的特点 67
HDFS 组件 68
HDFS 块复制 71
HDFS 安全模式 72
机架的识别 73
NameNode 高可用性 73
HDFS NameNode 联邦 75
HDFS 检查点和备份 76
HDFS 快照 76
HDFS NFS 网关 76
HDFS 用户命令 77
简要HDFS 命令参考 77
一般HDFS 命令 78
列出HDFS 中的文件 79
在HDFS 中创建一个目录 80
将文件复制到HDFS 80
从HDFS 复制文件 81
在HDFS 中复制文件 81
删除在HDFS 中的文件 81
删除在HDFS 中的目录 81
获取HDFS 状态报告 81
HDFS 的Web 图形用户界面 82
在程序中使用HDFS 82
HDFS Java 应用程序示例 82
HDFS C 应用程序示例 86
总结和补充资料 88
4 运行示例程序和基准测试程序 91
运行MapReduce 示例 91
列出可用的示例 92
运行Pi 示例 93
使用Web 界面监控示例 95
运行基本Hadoop 基准测试程序 101
运行Terasort 测试 101
运行TestDFSIO 基准 102
管理Hadoop MapReduce 作业 104
总结和补充资料 105
5 Hadoop MapReduce 框架 107
MapReduce 模型 107
MapReduce 并行数据流. 110
容错和推测执行 114
推测执行. 114
Hadoop MapReduce 硬件 115
总结和补充资料 115
6 MapReduce 编程 117
编译和运行Hadoop WordCount 的示例 117
使用流式接口 122
使用管道接口 125
编译和运行Hadoop Grep 链示例 127
调试MapReduce. 131
作业的列举、清除和状态查询 131
Hadoop 日志管理 131
启用YARN 日志聚合 132
Web 界面日志查看 133
命令行日志查看 133
总结和补充资料 135
7 基本的Hadoop 工具 137
使用Apache Pig 137
Pig 示例演练 138
使用Apache Hive 140
Hive 示例演练 140
更高级的Hive 示例 142
使用Apache Sqoop 获取关系型数据 145
Apache Sqoop 导入和导出方法 145
Apache Sqoop 版本更改 147
Sqoop 示例演练 148
使用Apache Flume 获取数据流 155
Flume 的示例演练 157
使用Apache Oozie 管理 Hadoop 工作流 160
Oozie 示例演练 162
使用Apache HBase 170
HBase 数据模型概述 170
HBase 示例演练 171
总结和补充资料 176
8 Hadoop YARN 应用程序 179
YARN 分布式shell 179
使用YARN 分布式shell 180
一个简单的示例 181
使用更多的容器 182
带有shell 参数的分布式 shell 示例 183
YARN 应用程序的结构 185
YARN 应用程序框架 187
Hadoop MapReduce 188
Apache Tez 188
Apache Giraph 189
Hoya:HBase on YARN 189
Dryad on YARN 189
Apache Spark 189
Apache Storm 190
Apache REEF:可持续计算执行框架 190
Hamster:Hadoop 和MPI 在同一集群 190
Apache Flink:可扩展的批处理和流式数据处理 191
Apache Slider:动态应用程序管理 191
总结和补充资料 192
9 用Apache Ambari 管理Hadoop 193
快速浏览 Apache Ambari 194
仪表板视图 194
服务视图. 197
主机视图. 199
管理视图. 201
查看视图. 201
Admin 下拉菜单 202
更改Hadoop 属性 206
总结和补充资料 212
10 基本的Hadoop 管理程序 213
基本的Hadoop YARN 管理 214
停用YARN 节点 214
YARN WebProxy 214
使用 JobHistoryServer 215
管理YARN 作业 215
设置容器内存 215
设置容器核心 216
设置MapReduce 属性 216
基本的HDFS 管理 217
NameNode 用户界面 217
将用户添加到HDFS 219
在HDFS 上执行FSCK 220
平衡HDFS 221
HDFS 安全模式 222
停用HDFS 节点 222
SecondaryNameNode 223
HDFS 快照 223
配置到HDFS 的NFSv3 网关 225
容量调度程序背景知识 229
Hadoop 2 的MapReduce 兼容性 231
启用应用主控程序的重新启动功能 231
计算一个节点的承载容量 232
运行Hadoop 1 的应用程序 233
总结和补充资料 235
附录A 本书的网页和代码下载 237
附录B 入门流程图和故障排除指南 239
入门流程图 239
常见的Hadoop 故障排除指南 239
规则1:不要惊慌 239
规则2:安装并使用Ambari 244
规则3:检查日志 244
规则4:简化情况 245
规则5:在互联网上提问 245
其他有用的提示 246
附录C 按主题列出的Apache Hadoop 资源汇总 253
常规的Hadoop 信息 253
Hadoop 安装攻略 253
HDFS 254
示例 255
MapReduce. 255
MapReduce 编程 255
基本工具 256
YARN 应用程序框架 257
Ambari 管理 257
基本的Hadoop 管理 257
附录D 安装Hue Hadoop GUI 259
Hue 安装 259
安装和配置Hue 262
启动Hue 263
Hue 用户界面 263
附录E 安装Apache Spark 267
在集群上安装Spark. 267
在整个集群中启动Spark. 268
在伪分布式的单节点安装版本中安装和启动Spark 270
运行Spark 示例 271