在CentOS上部署Hadoop的步骤如下:
-
准备工作:
- 确保操作系统为CentOS 7/8或更高版本。
- 安装JDK 8,配置环境变量。
- 配置SSH,确保节点之间可以通过SSH无密码登录。
-
安装Hadoop:
- 从Apache Hadoop官方网站下载最新版本的Hadoop(例如Hadoop 3.3.1)。
- 解压Hadoop文件并移动到指定目录(如/usr/local/hadoop)。
-
配置环境变量:
- 编辑/etc/profile文件,添加Hadoop的环境变量:
export HADOOP_HOME=/usr/local/hadoop export HADOOP_CONF_DIR=$HADOOP_HOME/etc/hadoop export PATH=$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbin
- 保存并退出,然后执行
source /etc/profile
使配置生效。
- 编辑/etc/profile文件,添加Hadoop的环境变量:
-
配置Hadoop主要文件:
- 编辑core-site.xml,配置文件系统的默认URI:
fs.defaultFS hdfs://localhost:9000 - 编辑hdfs-site.xml,配置HDFS的存储目录和副本数:
dfs.replication 1 dfs.namenode.name.dir /usr/local/hadoop/hdfs/namenode dfs.datanode.data.dir /usr/local/hadoop/hdfs/datanode - 编辑mapred-site.xml和yarn-site.xml,配置MapReduce和YARN的相关信息。
- 编辑core-site.xml,配置文件系统的默认URI:
-
格式化HDFS:
- 在主节点上执行以下命令格式化HDFS:
hdfs namenode -format
- 在主节点上执行以下命令格式化HDFS:
-
启动Hadoop集群:
- 在主节点上执行以下命令启动Hadoop集群:
start-dfs.sh start-yarn.sh
- 在主节点上执行以下命令启动Hadoop集群:
-
验证集群:
- 使用以下命令验证Hadoop集群的运行状态:
jps
- 确认输出中包含NameNode、DataNode、ResourceManager、NodeManager等进程。
- 使用以下命令验证Hadoop集群的运行状态:
这些步骤涵盖了在CentOS上部署Hadoop的基本流程,确保每个步骤都正确执行可以有效避免后续的问题。