Hadoop零基础入门

2022年6月21日下午1:10 • 行业观察

@[TOC]Hadoop

一、Hadoop是什么/h2>

（1） Hadoop是一个分布式系统基础架构
（2） Hadoop主要解决海量数据的存储和海量数据的分析问题
（3） Hadoop可以指一个更广泛的概念——Hadoop生态圈

二、Hadoop的优势

（1）高可靠性:Hadoop底层维护多个数据副本，所以即使Hadoop某个计算元素出现故障，也不会导致数据的丢失。
（2）高扩展性：在集群间分布任务数据，可以方便的扩展数以千计的节点
（3）高效性：在MapRfeduce的思想下，Hadoop是并行工作的，以加快任务的处理速度。
（4）高容错性：能够在后台自动将失败的任务重新进行分配。

三、Hadoop的组成（3.x）

MapReduce（计算）、Yarn（资源调度）、HDFS（数据存储）、Common（辅助工具）

四、HDFS架构概述

HDFS，是一个分布式文件系统。
(1) NomeNode（简称nn）:存储文件的元数据，如文件名，文件目录结构，文件属性（生成时间、副本数、文件权限），以及每个文件的块列表和块所在的DataNode等。
(2) DataNode(dn):在本地文件系统存储数据块数据，以及数据块的校验和。
(3) Secondary NameNode(2nn):每隔一段时间对NameNode元数据备份。

五、YARN架构概述

YARN，另一种资源协调者，是Hadoop的资源管理器。
（1） ResourceManager(RM):整个集群资源（内存、CPU等）的老大。
（2） NodeManager(NM):整个节点服务器资源的老大。
（3） ApplicationMaster(AM):单个任务运行的老大。
（4） Container：容器，相当于一台独立的服务器，里面封装了任务运行所需要的资源，如内存、CPU、磁盘、网络等。
注意：(1)客户端可以有多个
(2)集群上可以运行多个ApplicationMaster
(3)每个NodeManager上可以有多个Container

六、MapReduce架构概述

MapReduce将计算过程分为两个阶段：Map和Reduce。
（1）Map阶段并行处理事务
（2）Reduce阶段对Map结果进行汇总

七、大数据生态体系

Hadoop零基础入门

方法二：右键“库”界面，点击新建虚拟机。

Hadoop零基础入门

3．不做任何处理，点击下一步

Hadoop零基础入门

5.客户机操作系统选择选择Linux,版本选择CentOS 7 64位。然后点击下一步。

Hadoop零基础入门

7.保持默认状态即可，点击下一步

Hadoop零基础入门

9．一定要选择使用网络地址转换（NAT），然后点击下一步

Hadoop零基础入门

11.保持默认即可，点击下一步

Hadoop零基础入门

13.磁盘大小设置为20GB即可，如果是以后有更多用处的，可以多设置一些，然后选择将虚拟磁盘存储为单个文件。点击下一步

Hadoop零基础入门

15.点击自定义硬件

Hadoop零基础入门

17.点击完成

Hadoop零基础入门

19. 进入页面

Hadoop零基础入门

21.选择软件安装，进入其页面后选择带GUI的服务器，然后点击左上角完成

Hadoop零基础入门

23.点击网络和主机名，打开以太网，然后点击左上角完成

Hadoop零基础入门

25.设置root用户密码，并创建用户

Hadoop零基础入门

27.第一次登陆最好使用root用户，点击未列出，然后输入用户名root，然后输入密码，即可登录

Hadoop零基础入门

九、设置静态、更改主机名、设置主机映射

1.点击编辑，虚拟网络编辑器。

Hadoop零基础入门

3.选择VMnet8，选择NET模式，进入NET设置

Hadoop零基础入门

5.通过控制面板->网络和Internet->网络连接，来到如下界面，右键VMnet8，点击属性。

Hadoop零基础入门

7.箭头所指的需相同，圈中所指可任意更改，常改为1，然后点击确定

Hadoop零基础入门

9.按键a，进入输入模式，更改一下内容，IP状态、IP地址、网关、域名解释器。然后按键ESC，退出编辑模式，最后输入：wq!进行保存。
在这里插入图片描述

Hadoop零基础入门

Hadoop零基础入门

Hadoop零基础入门

13. 打开终端，查看主机名

Hadoop零基础入门

15.输入ping www.baidu.com，如下图所示，既为成功。ctrl+C停止

Hadoop零基础入门

Hadoop零基础入门

检查防火墙状态：
3.给sqy用户赋予权限输入

Hadoop零基础入门

4.切换到sqy用户，输入 su sqy，进入opt目录。

Hadoop零基础入门

6.创建文件夹module、software，并设置权限

Hadoop零基础入门

删除JDK,输入

Hadoop零基础入门

2. 选择下一页

Hadoop零基础入门

4. 选择创建完整克隆，选择下一页

Hadoop零基础入门

6. 同样操作，共克隆三台

十二、克隆机基础设置

三台机器均执行以下操作
1.输入
只需修改IP地址即可，IP地址不可重复

Hadoop零基础入门

2. 输入，修改主机名：

Hadoop零基础入门

3. 输入，查看主机映射

Hadoop零基础入门

5. 输入，查看IP地址

Hadoop零基础入门

7. 输入，验证主机名是否修改成功

Hadoop零基础入门

2.查看JDK

Hadoop零基础入门

在该新建文本中输入

Hadoop零基础入门

4. 分别输入java、javac、java -version，没有报错，既为JDK配置成功

十四、hadoop安装

自行安装，使用Xftp将压缩包从主机传输到虚拟机，保存在先前我们创建的文件夹software中
1.解压hadoop安装包

Hadoop零基础入门

3.输入

Hadoop零基础入门

输入,让修改生效

Hadoop零基础入门

来源：ZSup{A}

声明：本站部分文章及图片转载于互联网，内容版权归原作者所有，如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢！

基于FPGA的两位按键控制LED数码管加减计数实验

上一篇 2022年6月21日

DDD落地的那叫一个高级

下一篇 2022年6月21日