Hadoop零基础入门

@[TOC]Hadoop

一、Hadoop是什么/h2>

(1) Hadoop是一个分布式系统基础架构
(2) Hadoop主要解决海量数据的存储和海量数据的分析问题
(3) Hadoop可以指一个更广泛的概念——Hadoop生态圈

二、Hadoop的优势

(1)高可靠性:Hadoop底层维护多个数据副本,所以即使Hadoop某个计算元素出现故障,也不会导致数据的丢失。
(2)高扩展性:在集群间分布任务数据,可以方便的扩展数以千计的节点
(3)高效性:在MapRfeduce的思想下,Hadoop是并行工作的,以加快任务的处理速度。
(4)高容错性:能够在后台自动将失败的任务重新进行分配。

三、Hadoop的组成(3.x)

MapReduce(计算)、Yarn(资源调度)、HDFS(数据存储)、Common(辅助工具)

四、HDFS架构概述

HDFS,是一个分布式文件系统。
(1) NomeNode(简称nn):存储文件的元数据,如文件名,文件目录结构,文件属性(生成时间、副本数、文件权限),以及每个文件的块列表和块所在的DataNode等。
(2) DataNode(dn):在本地文件系统存储数据块数据,以及数据块的校验和。
(3) Secondary NameNode(2nn):每隔一段时间对NameNode元数据备份。

五、YARN架构概述

YARN,另一种资源协调者,是Hadoop的资源管理器。
(1) ResourceManager(RM):整个集群资源(内存、CPU等)的老大。
(2) NodeManager(NM):整个节点服务器资源的老大。
(3) ApplicationMaster(AM):单个任务运行的老大。
(4) Container:容器,相当于一台独立的服务器,里面封装了任务运行所需要的资源,如内存、CPU、磁盘、网络等。
注意:(1)客户端可以有多个
(2)集群上可以运行多个ApplicationMaster
(3)每个NodeManager上可以有多个Container

六、MapReduce架构概述

MapReduce将计算过程分为两个阶段:Map和Reduce。
(1)Map阶段并行处理事务
(2)Reduce阶段对Map结果进行汇总

七、 大数据生态体系

Hadoop零基础入门
方法二:右键“库”界面,点击新建虚拟机。
Hadoop零基础入门
3.不做任何处理,点击下一步

Hadoop零基础入门
5.客户机操作系统选择选择Linux,版本选择CentOS 7 64位。然后点击下一步。
Hadoop零基础入门
7.保持默认状态即可,点击下一步
Hadoop零基础入门
9.一定要选择使用网络地址转换(NAT),然后点击下一步
Hadoop零基础入门
11.保持默认即可,点击下一步
Hadoop零基础入门
13.磁盘大小设置为20GB即可,如果是以后有更多用处的,可以多设置一些,然后选择将虚拟磁盘存储为单个文件。点击下一步
Hadoop零基础入门
15.点击自定义硬件
Hadoop零基础入门
17.点击完成
Hadoop零基础入门
19. 进入页面
Hadoop零基础入门
21.选择软件安装,进入其页面后选择带GUI的服务器,然后点击左上角完成
Hadoop零基础入门
23.点击网络和主机名,打开以太网,然后点击左上角完成
Hadoop零基础入门
25.设置root用户密码,并创建用户
Hadoop零基础入门
27.第一次登陆最好使用root用户,点击未列出,然后输入用户名root,然后输入密码,即可登录
Hadoop零基础入门

九、设置静态、更改主机名、设置主机映射

1.点击编辑,虚拟网络编辑器。

Hadoop零基础入门
3.选择VMnet8,选择NET模式,进入NET设置
Hadoop零基础入门
5.通过 控制面板->网络和Internet->网络连接,来到如下界面,右键VMnet8,点击属性。
Hadoop零基础入门
7.箭头所指的需相同,圈中所指 可任意更改,常改为1,然后点击确定
Hadoop零基础入门
9.按键a,进入输入模式,更改一下内容,IP状态、IP地址、网关、域名解释器。然后按键ESC,退出编辑模式,最后输入:wq!进行保存。
在这里插入图片描述
Hadoop零基础入门
Hadoop零基础入门
Hadoop零基础入门
13. 打开终端,查看主机名
Hadoop零基础入门
15.输入ping www.baidu.com,如下图所示,既为成功。ctrl+C停止
Hadoop零基础入门
Hadoop零基础入门
检查防火墙状态:
3.给sqy用户赋予权限输入
Hadoop零基础入门
4.切换到sqy用户,输入 su sqy,进入opt目录。
Hadoop零基础入门
6.创建文件夹module、software,并设置权限
Hadoop零基础入门
删除JDK,输入
Hadoop零基础入门
2. 选择下一页
Hadoop零基础入门
4. 选择创建完整克隆,选择下一页
Hadoop零基础入门
6. 同样操作,共克隆三台

十二、克隆机基础设置

三台机器均执行以下操作
1.输入
只需修改IP地址即可,IP地址不可重复

Hadoop零基础入门
2. 输入 ,修改主机名:
Hadoop零基础入门
3. 输入,查看主机映射
Hadoop零基础入门
5. 输入,查看IP地址
Hadoop零基础入门
7. 输入,验证主机名是否修改成功
Hadoop零基础入门
2.查看JDK
Hadoop零基础入门
在该新建文本中输入

Hadoop零基础入门
4. 分别输入java、javac、java -version,没有报错,既为JDK配置成功

十四、hadoop安装

自行安装,使用Xftp将压缩包从主机传输到虚拟机,保存在先前我们创建的文件夹software中
1.解压hadoop安装包

Hadoop零基础入门
3.输入
Hadoop零基础入门
输入,让修改生效
Hadoop零基础入门

来源:ZSup{A}

声明:本站部分文章及图片转载于互联网,内容版权归原作者所有,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!

上一篇 2022年6月21日
下一篇 2022年6月21日

相关推荐