Hadoop完全分布式环境搭建

最近在学习hadoop，经过几番折腾终于把分布式环境搭建成功，这里总结一下搭建过程和过程中遇到的问题与解决方案。
一、准备工作
1.下载vmvare软件，配置NAT网络模式
NAT是网络地址转换，是在宿主机和虚拟机之间增加一个地址转换服务，负责外部和虚拟机之间的通讯转接和IP转换。

三台虚拟机的ip：

3.配置虚拟机
修改hostname：

按i修改成以下内容

按wq保存修改，需要重启才能生效。
修改host：

添加以下内容

需要把以上hosts配置到windows的hosts文件中，不然在windows开发时连接不上hdfs

关闭防火墙和selinux（不关闭会造成我们的集群运行不成功）

关闭防火墙

关闭selinux

配置成功后我们可以把文件放在指定的文件夹，那么在虚拟机可以去如下目录寻找文件，实现本地windows与虚拟机文件夹共享

1.安装JDK
去共享文件夹拷贝已经下载好的jdk包

然后解压jdk安装包

重命名

配置环境变量

使用source命令生效

查看Java环境变量配置是否成功

到此jdk已经安装成功
其他两台虚拟机可以按照上述方式安装，也可以使用快捷方式,通过以下命令同步这两台虚拟机

然后分别在另外两台虚拟机上执行source命令，使配置文件生效
2.hadoop安装

去共享文件夹拷贝已经下载好的jdk包

然后解压jdk安装包

重命名

配置环境变量

使用source命令生效

进入hadoop文件夹查看目录：

配置yarn-env.sh

配置core-site.xml

配置hdfs-site.xml

配置yarn-site.xml

配置mapred-site.xml，如果没有就拷贝mapred-site.xml.template然后重命名为mapred-site.xml

配置从节点的主机名，前面配置host的时候已经ip和hostname做了映射就可以使用hostname，如果没有就需要写对应的ip

同理我们也可以通过命令去同步另外两台虚拟机，减少安装hadoop时间

然后分别在两台虚拟机上执行source命令

分别在三台虚拟机创建以下目录文件（前面的配置文件中使用）

在三台虚拟机上分别对目录更改权限

启动hdfs，首次启动需格式化hdfs，后面可以选择性格式化

格式化完毕后可以使用以下命令开启集群(我们可以单独启动hdfs，yarn等，命令在sbin目录下)

启动完后，执行jps查看执行情况
主节点（hadoop001）：

从节点（hadoop002）：

从节点（hadoop003）：

到此集群已成功，接着继续看一下控制台的一些情况
输入http://192.168.10.106:50070，查看hdfs运行情况：

输入http://192.168.10.106:8088查看YARN运行情况

运行自带的案例hadoop-mapreduce-examples查看yarn的工作情况

来源：xiaoxsen

声明：本站部分文章及图片转载于互联网，内容版权归原作者所有，如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢！