Hadoop完全分布式集群搭建
使用四台Linux机器搭建集群规划:
1 | 192.168.230.10 192.168.230.11 192.168.230.12 192.168.230.14 |
1.1.更改/etc/目录下的hosts文件,添加集群主机和ip地址的映射
1 | [root@node1 ~]# vi /etc/hosts |
1.2.将node1的/etc/目录下的hosts文件发送给node2.node3.node5的/etc/目录下,覆盖原hosts文件
1 | [root@node1 ~]# scp /etc/hosts root@node2:/etc/ |

1.3.设置ssh免秘钥登录
1 | 操作四台机器node1.node2.node3.node5分别生成秘钥目录 |

1.3.1.在node1上进行免密码登录就用的是私钥,登录别的机器比如node2.node3.node5则用的是公钥
1 | 把公钥文件放入认证文件中去 |
1 | [root@node1 ~]$ ls -a |
1.3.2.将node1的公钥发送给node2.node3.node5的~/opt/目录中
1 | [root@node1 ~]# scp ~/.ssh/id_dsa.pub root@node2:/opt/ |
1.3.3.node2.node3.node5将node1的公钥放到认证文件中去
1 | [root@node2 ~]$ cat /opt/id_dsa.pub >> ~/.ssh/authorized_keys |
1.3.4.node1免秘钥登录node2.node3.node5
1 | [root@node1 ~]# ssh node2 |
1.4.同步集群时间
1 | [root@node1 ~]# yum install ntpdate |
1 | [root@node1 ~]# ntpdate -u ntp.sjtu.edu.cn |
1.5.在node1.node2.node3.node5上检查是否有安装jdk
1 | [root@node1 ~]# javac -version |
1.6.上传Hadoop压缩文件到node1主机指定目录上
1.7.解压hadoop压缩文件
2.在node1(NameNode)上配置/opt/modules/hadoop-2.5.1/etc/hadoop/目录下的hadoop-env.sh文件
1 | export JAVA_HOME=/usr/java/jdk1.7.0_79 |
3.在node1(NameNode)上配置/opt/modules/hadoop-2.5.1/etc/hadoop/目录下的core-site.xml文件
1 | <configuration> |
4.在node1(NameNode)上配置/opt/modules/hadoop-2.5.1/etc/hadoop/目录下的hdfs-site.xml文件
1 | <configuration> |
5.在node1(NameNode)上配置/opt/modules/hadoop-2.5.1/etc/hadoop/目录下的slaves文件
1 | slaves中配的是datanode的主机名 |
6.在node1(NameNode)上配置/opt/modules/hadoop-2.5.1/etc/hadoop/目录下的masters文件
1 | masters中配的是secondarynamenode的主机名 |
6.配置hadoop的环境变量
1 | [root@node1 ~]# vi ~/.bash_profile |
6.1.将~目录下的.bash_profile配置环境变量的文件发送给node2.node3.node5
1 | [root@node1 ~]# scp ~/.bash_profile root@node2:~/ |
7.将node1主机/opt/modules/hadoop-2.5.1目录下的内容发送给node2.node3.node5主机的/opt/modules/hadoop-2.5.1目录下
1 | [root@node1 ~]# scp -r /opt/modules/hadoop-2.5.1 root@node2:/opt/modules/hadoop-2.5.1 |
8.在node1[192.168.230.10]主机下初始化namenode
1 | [root@node1 hadoop-2.5.1]# ./bin/hdfs namenode -format |

9.启动HDFS
1 | [root@node1 hadoop-2.5.1]# ./sbin/start-dfs.sh |

10.访问namenode的web监控
1 | node1:50070 |

11.访问secondarynamenode的web监控
1 | node5:50090 |

12.hdfs上传文件
1 | bin/hdfs -mkdir /usr |
13.查看日志
1 | 查找.log结尾的文件 |
14.看端口
1 | netstat -ntpl |grep java |
本文作者 : Matrix
原文链接 : https://matrixsparse.github.io/2016/03/20/Hadoop完全分布式集群搭建/
版权声明 : 本博客所有文章除特别声明外,均采用 CC BY-NC-SA 4.0 许可协议。转载请注明出处!
知识 & 情怀 | 二者兼得