在Debian上安装Hadoop的步骤如下:
1. 更新系统
首先,确保你的系统是最新的:
sudo apt update sudo apt upgrade -y
2. 安装Java环境
Hadoop需要Java环境,推荐安装Java 8或更高版本:
sudo apt install openjdk-8-jdk
验证Java安装:
java -version
3. 创建Hadoop用户
创建一个新的用户来运行Hadoop,并赋予必要的权限:
sudo adduser hadoop sudo usermod -aG sudo hadoop
4. 下载并解压Hadoop
从Apache Hadoop官方网站下载最新版本的Hadoop,并解压到指定目录:
wget https://downloads.apache.org/hadoop/common/hadoop-3.3.1/hadoop-3.3.1.tar.gz sudo tar -xzvf hadoop-3.3.1.tar.gz -C /usr/local/
5. 配置环境变量
在~/.bashrc
文件中添加Hadoop的环境变量:
export HADOOP_HOME=/usr/local/hadoop export PATH=$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbin
使环境变量生效:
source ~/.bashrc
6. 配置Hadoop配置文件
在Hadoop目录下,编辑以下配置文件:
- core-site.xml:
fs.defaultFS hdfs://namenode:9000
- hdfs-site.xml:
dfs.replication 3 dfs.namenode.name.dir /usr/local/hadoop/dfs/name dfs.datanode.data.dir /usr/local/hadoop/dfs/data
- mapred-site.xml:
mapreduce.framework.name yarn
- yarn-site.xml:
yarn.nodemanager.aux-services mapreduce_shuffle yarn.nodemanager.aux-services.mapreduce.shuffle.class org.apache.hadoop.mapred.ShuffleHandler
7. 格式化HDFS
在NameNode上运行以下命令格式化HDFS:
hdfs namenode -format
8. 启动Hadoop服务
在NameNode上启动Hadoop的NameNode和DataNode:
start-dfs.sh
在ResourceManager上启动YARN:
start-yarn.sh
9. 验证安装
可以通过Hadoop的Web界面验证安装是否成功。NameNode的Web界面通常在http://namenode:9000
。