Hadoop-3.3.6完全分布式集群搭建
作者:mmseoamin日期:2024-03-20

目录

1.克隆两台虚拟机,作为从机使用

2.从机ip设置

3.Xshell连接

5.配置环境变量

6.配置hadoop-env.sh文件及其他重要文件

7.分发文件

8.启动hadoop集群并测试

9.访问web界面

10.运行官方案例



1.克隆两台虚拟机,作为从机使用

右击创建好的虚拟机hadoop base,选择管理-克隆-点击下一步-虚拟机中的当前状态-下一步-创建完整克隆-下一步-设置克隆机名称,安装位置-完成。

2.从机ip设置

启动两台从机,打开终端,修改主机名称分别为ljl01,ljl02。设置静态ip,与主节点ljl的hosts文件保持一致,设置成功重启网络。

Hadoop-3.3.6完全分布式集群搭建,第1张

3.Xshell连接

打开Xshell7,左上角新建文件,在弹出框设置两个从节点的名称和ip地址,然后连接,随后输入root账号密码完成连接。Hadoop-3.3.6完全分布式集群搭建,第2张

4.配置免密登录

回到主节点ljl,执行ssh-keygen -t rsa命令

Hadoop-3.3.6完全分布式集群搭建,第3张

把公钥复制到各个节点,第一次登陆会让你输入密码

Hadoop-3.3.6完全分布式集群搭建,第4张

Hadoop-3.3.6完全分布式集群搭建,第5张

对自己也需要设置免密登录

Hadoop-3.3.6完全分布式集群搭建,第6张

测试免密登录是否配置成功

Hadoop-3.3.6完全分布式集群搭建,第7张

测试成功之后,exit回到ljl节点

5.配置环境变量

在上一节,jdk和hadoop的环境变量都以配置好

Hadoop-3.3.6完全分布式集群搭建,第8张

6.配置hadoop-env.sh文件及其他重要文件

首先进入hadoop所在配置文件目录/usr/local/src/Hadoop-3.3.6/etc/hadoop,在此目录打开终端。

 vim Hadoop-env.sh

Hadoop-3.3.6完全分布式集群搭建,第9张

修改core-site.xml, vim core-site.xml

Hadoop-3.3.6完全分布式集群搭建,第10张

修改hdfs-site.xml文件

Hadoop-3.3.6完全分布式集群搭建,第11张

修改yarn-site.xml文件

Hadoop-3.3.6完全分布式集群搭建,第12张

修改mapred-site.xml文件

Hadoop-3.3.6完全分布式集群搭建,第13张

修改workers

Hadoop-3.3.6完全分布式集群搭建,第14张

7.分发文件

cd /usr/local/src
# 分发jdk,$PWD:获取当前所在目录的绝对路径
scp -r jdk1.8.0_211 root@ljl01:$PWD
scp -r jdk1.8.0_211 root@ljl02:$PWD
# 分发hadoop
scp -r hadoop-3.3.6 root@ljl01:$PWD
scp -r hadoop-3.3.6 root@ljl02:$PWD
# 分发/etc/hosts
scp /etc/hosts root@ ljl01:/etc/
scp /etc/hosts root@ ljl02:/etc/
# 分发/etc/profile
scp /etc/profile root@ ljl01:/etc/
scp /etc/profile root@ ljl02:/etc/

Hadoop-3.3.6完全分布式集群搭建,第15张

然后在两个从节点上执行 source /etc/profile

Hadoop-3.3.6完全分布式集群搭建,第16张

Hadoop-3.3.6完全分布式集群搭建,第17张

8.启动hadoop集群并测试

启动hdfs

start-dfs.sh

Hadoop-3.3.6完全分布式集群搭建,第18张

启动yarn

start-yarn.sh

Hadoop-3.3.6完全分布式集群搭建,第19张

jps 分别查看三个节点的进程

Hadoop-3.3.6完全分布式集群搭建,第20张Hadoop-3.3.6完全分布式集群搭建,第21张

Hadoop-3.3.6完全分布式集群搭建,第22张

9.访问web界面

主节点的地址+端口号(如:192.168.10.100:9870)

Hadoop-3.3.6完全分布式集群搭建,第23张

10.运行官方案例

统计每个单词出现的频率

vi words.txt 然后添加如下内容

hadoop hdfs hdfs Hadoop
mapreduce mapreduce Hadoop
hdfs Hadoop yarn yarn

hdfs dfs -mkdir /input #在hdfs上创建文件夹

hdfs dfs -put words.txt /input/  #把words.txt上传到dfs的input 文件夹中

后运行wordcount

Hadoop-3.3.6完全分布式集群搭建,第24张

hdfs dfs -ls /output #查看结果

Hadoop-3.3.6完全分布式集群搭建,第25张

集群搭建结束。