Hadoop完全分布式环境搭建

最近在学习hadoop,经过几番折腾终于把分布式环境搭建成功,这里总结一下搭建过程和过程中遇到的问题与解决方案。
一、准备工作
1.下载vmvare软件,配置NAT网络模式
NAT是网络地址转换,是在宿主机和虚拟机之间增加一个地址转换服务,负责外部和虚拟机之间的通讯转接和IP转换。

这里写图片描述
三台虚拟机的ip:

3.配置虚拟机
修改hostname:

按i修改成以下内容

按wq保存修改,需要重启才能生效。
修改host:

添加以下内容

需要把以上hosts配置到windows的hosts文件中,不然在windows开发时连接不上hdfs

关闭防火墙和selinux(不关闭会造成我们的集群运行不成功)

关闭防火墙

关闭selinux

这里写图片描述
配置成功后我们可以把文件放在指定的文件夹,那么在虚拟机可以去如下目录寻找文件,实现本地windows与虚拟机文件夹共享

这里写图片描述
1.安装JDK
去共享文件夹拷贝已经下载好的jdk包

然后解压jdk安装包

重命名

配置环境变量

使用source命令生效

查看Java环境变量配置是否成功

到此jdk已经安装成功
其他两台虚拟机可以按照上述方式安装,也可以使用快捷方式,通过以下命令同步这两台虚拟机

然后分别在另外两台虚拟机上执行source命令,使配置文件生效
2.hadoop安装

去共享文件夹拷贝已经下载好的jdk包

然后解压jdk安装包

重命名

配置环境变量

使用source命令生效

进入hadoop文件夹查看目录:

  • etc目录存放配置文件
  • sbin目录下存放服务的启动命令
  • share目录下存放jar包与文档
    配置mapred-env.sh

配置yarn-env.sh

配置core-site.xml

配置hdfs-site.xml

配置yarn-site.xml

配置mapred-site.xml,如果没有就拷贝mapred-site.xml.template然后重命名为mapred-site.xml

配置从节点的主机名,前面配置host的时候已经ip和hostname做了映射就可以使用hostname,如果没有就需要写对应的ip

同理我们也可以通过命令去同步另外两台虚拟机,减少安装hadoop时间

然后分别在两台虚拟机上执行source命令

分别在三台虚拟机创建以下目录文件(前面的配置文件中使用)

在三台虚拟机上分别对目录更改权限

启动hdfs,首次启动需格式化hdfs,后面可以选择性格式化

格式化完毕后可以使用以下命令开启集群(我们可以单独启动hdfs,yarn等,命令在sbin目录下)

启动完后,执行jps查看执行情况
主节点(hadoop001):

从节点(hadoop002):

从节点(hadoop003):

到此集群已成功,接着继续看一下控制台的一些情况
输入http://192.168.10.106:50070,查看hdfs运行情况:

这里写图片描述
输入http://192.168.10.106:8088查看YARN运行情况
这里写图片描述

运行自带的案例hadoop-mapreduce-examples查看yarn的工作情况

来源:xiaoxsen

声明:本站部分文章及图片转载于互联网,内容版权归原作者所有,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!

上一篇 2022年5月8日
下一篇 2022年5月8日

相关推荐