Hadoop - start
QuikStart
安装Hadoop
wget https://archive.apache.org/dist/hadoop/common/hadoop-3.2.2/hadoop-3.2.2.tar.gz
Hadoop操作模式
可以选择Hadoop集群以以下三个支持模式之一:
- 独立/单机模式:默认情况下,被配置在一个独立的模式中运行Java程序。
- 模拟分布式模式:这是单台机器的分布式模拟。Hadoop守护每个进程,如hdfs, yarn, MapReduce等,都将作为一个独立的Java程序运行,对开发有利。
- 完全分布式模式:这种模式时完全分布式的最小两台或多台计算机的集群。
在单机模式下安装Hadoop
独立/单机模式适合开发期间运行MapReduce程序,容易进行测试和调试。
设置JAVA_HOME
变量
export JAVA_HOME=pwd
设置Java环境变量
export PATH=$PATH:$JAVA_HOME/bin
将Hadoop添加到环境变量
export PATH=$PATH:/home/hadoop/bin
检验Hadoop安装
hadoop version
测试基本功能
编译MapReduce实例,提供了若干功能。
hadoop jar $HADOOP_HOME/share/hadoop/mapreduce/hadoop-mapreduce-examples-3.2.2.jar
使用MapReduce计算单词个数
hadoop jar $HADOOP_HOME/share/hadoop/mapreduce/hadoop-mapreduce-examples-3.2.2.jar wordcount input output
模拟分布式模式安装Hadoop
在伪分布式模式下安装Hadoop
设置Hadoop
1 | export HADOOP_HOME=/usr/local/hadoop |
提交
source ~/.bashrc
Hadoop配置 TODO 配置文件的意义
core-site.xml
1 | <configuration> |
hdfs-site.xml
1 | <configuration> |
yarn-site.xml
1 | <configuration> |
mapred-site.xml
1 | <configuration> |
验证安装 TODO 指令含义
- 名称节点设置
hdfs name -format
- 验证DFS
start-dfs.sh
- 验证Yarn
start-yarn.sh
注意
- 报错
ERROR: Attempting to operate on hdfs namenode as root
在start-dfs.sh
, stop-dfs.sh
文件添加
1 | HDFS_DATANODE_USER=root |
在start-yarn.sh
, stop-yarn.sh
文件添加
1 | YARN_RESOURCEMANAGER_USER=root |
- 报错
Permission denied (publickey,gssapi-keyex,gssapi-with-mic,password).
1 | ssh-keygen -t rsa |
浏览器访问Hadoop TODO 端口对应含义
访问集群信息
http://ip:8042/
References
https://www.yiibai.com/hadoop/hadoop_enviornment_setup.html
https://www.cnblogs.com/woofwoof/p/10024104.html