百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 优雅编程 > 正文

大数据平台搭建:Hadoop安装与配置详细步骤

sinye56 2024-12-14 15:02 15 浏览 0 评论



Hadoop 安装与配置

3.1 虚拟机环境准备

1)准备三台虚拟机,虚拟机配置要求如下:

(1)单台虚拟机:内存4G,硬盘50G,安装必要环境

sudo yum install -y epel-release
sudo yum install -y psmisc nc net-tools rsync vim lrzsz ntp libzstd openssl-static tree iotop git

(3)修改克隆虚拟机的静态IP

sudo vim /etc/sysconfig/network-scripts/ifcfg-ens33

改成

DEVICE=ens33
TYPE=Ethernet
ONBOOT=yes
BOOTPROTO=static
NAME="ens33"
IPADDR=192.168.1.101
PREFIX=24
GATEWAY=192.168.1.2
DNS1=192.168.1.2

(4)查看Linux虚拟机的虚拟网络编辑器,编辑->虚拟网络编辑器->VMnet8




(5)查看Windows系统适配器VMware Network Adapter VMnet8的IP地址


(6)保证Linux文件中IP地址、Linux虚拟网络编辑器地址和Windows系统VM8网络IP地址相同。

2)修改主机名

(1)修改主机名称

sudo hostnamectl --static set-hostname hadoop101


(2)配置主机名称映射,打开/etc/hosts

sudo vim /etc/hosts

添加如下内容

192.168.1.100 hadoop100

192.168.1.101 hadoop101

192.168.1.102 hadoop102

192.168.1.103 hadoop103

192.168.1.104 hadoop104

192.168.1.105 hadoop105

192.168.1.106 hadoop106

192.168.1.107 hadoop107

192.168.1.108 hadoop108

(3)修改window7的主机映射文件(hosts文件)


(a)进入C:\Windows\System32\drivers\etc路径


(b)打开hosts文件并添加如下内容

192.168.1.100 hadoop100

192.168.1.101 hadoop101

192.168.1.102 hadoop102

192.168.1.103 hadoop103

192.168.1.104 hadoop104

192.168.1.105 hadoop105

192.168.1.106 hadoop106

192.168.1.107 hadoop107

192.168.1.108 hadoop108


(4)修改window10的主机映射文件(hosts文件)


(a)进入C:\Windows\System32\drivers\etc路径


(b)拷贝hosts文件到桌面


(c)打开桌面hosts文件并添加如下内容

192.168.1.100 hadoop100

192.168.1.101 hadoop101

192.168.1.102 hadoop102

192.168.1.103 hadoop103

192.168.1.104 hadoop104

192.168.1.105 hadoop105

192.168.1.106 hadoop106

192.168.1.107 hadoop107

192.168.1.108 hadoop108


(d)将桌面hosts文件覆盖C:\Windows\System32\drivers\etc路径hosts文件


3)关闭防火墙

sudo systemctl stop firewalld

sudo systemctl disable firewalld


4)创建bigdata用户

sudo useradd bigdata

sudo passwd bigdata


5)重启虚拟机

reboot


6)配置bigdata用户具有root权限

vi sudo
修改/etc/sudoers文件,找到下面一行(91行),在root下面添加一行,如下所示:
## Allow root to run any commands anywhere
root    ALL=(ALL)     ALL
bigdata   ALL=(ALL)     ALL

7)在/opt目录下创建文件夹

(1)在/opt目录下创建module、software文件夹

sudo mkdir module
sudo mkdir software

(2)修改module、software文件夹的所有者cd

sudo mkdir /opt/module /opt/software
sudo chown bigdata:bigdata /opt/module /opt/software

3.2 在102安装JDK

1)卸载现有JDK

rpm -qa | grep -i java | xargs -n1 sudo rpm -e --nodeps


2)用SecureCRT工具将JDK导入到opt目录下面的software文件夹下面


3) “alt+p”进入sftp模式


4)选择jdk1.8拖入工具


5)在Linux系统下的opt目录中查看软件包是否导入成功

ls /opt/software/

看到如下结果:

hadoop-3.1.3.tar.gz jdk-8u212-linux-x64.tar.gz


6)解压JDK到/opt/module目录下

tar -zxvf jdk-8u212-linux-x64.tar.gz -C /opt/module/


7)配置JDK环境变量

(1)新建/etc/profile.d/my_env.sh文件

sudo vim /etc/profile.d/my_env.sh

添加如下内容

#JAVA_HOME
export JAVA_HOME=/opt/module/jdk1.8.0_212
export PATH=$PATH:$JAVA_HOME/bin

(2)保存后退出

:wq

(3)重启xshell窗口,让环境变量生效


8)测试JDK是否安装成功

java -version

如果能看到以下结果、则Java正常安装

java version "1.8.0_212"

注意:重启(如果java -version可以用就不用重启)

sudo reboot


3.3 在102安装Hadoop

Hadoop下载地址:https://archive.apache.org/dist/hadoop/common/hadoop-3.1.3/


1)用SecureCRT工具将hadoop-3.1.3.tar.gz导入到opt目录下面的software文件夹下面

切换到sftp连接页面,选择Linux下编译的hadoop jar包拖入,

拖入hadoop的tar包

拖入Hadoop的tar包成功


2)进入到Hadoop安装包路径下

[bigdata@hadoop101 ~]$ cd /opt/software/


3)解压安装文件到/opt/module下面

[bigdata@hadoop101 software]$ tar -zxvf hadoop-3.1.3.tar.gz -C /opt/module/


4)查看是否解压成功

[bigdata@hadoop101 software]$ ls /opt/module/

hadoop-3.1.3


5)将Hadoop添加到环境变量

(1)获取Hadoop安装路径

[bigdata@hadoop101 hadoop-3.1.3]$ pwd

/opt/module/hadoop-3.1.3


(2)打开/etc/profile.d/my_env.sh文件

sudo vim /etc/profile.d/my_env.sh

在profile文件末尾添加JDK路径:(shitf+g)

##HADOOP_HOME
export HADOOP_HOME=/opt/module/hadoop-3.1.3
export PATH=$PATH:$HADOOP_HOME/bin
export PATH=$PATH:$HADOOP_HOME/sbin

(3)保存后退出

:wq


(4)让修改后的文件生效

[bigdata@ hadoop101 hadoop-3.1.3]$ source /etc/profile


6)测试是否安装成功

[bigdata@hadoop101 hadoop-3.1.3]$ hadoop version

Hadoop 3.1.3


7)重启(如果Hadoop命令不能用再重启)

[bigdata@ hadoop101 hadoop-3.1.3]$ sync

[bigdata@ hadoop101 hadoop-3.1.3]$ sudo reboot


3.4 Hadoop目录结构

1)查看Hadoop目录结构

[bigdata@hadoop101 hadoop-3.1.3]$ ll

总用量 52

drwxr-xr-x. 2 bigdata bigdata  4096 5月  22 2017 bin
drwxr-xr-x. 3 bigdata bigdata  4096 5月  22 2017 etc
drwxr-xr-x. 2 bigdata bigdata  4096 5月  22 2017 include
drwxr-xr-x. 3 bigdata bigdata  4096 5月  22 2017 lib
drwxr-xr-x. 2 bigdata bigdata  4096 5月  22 2017 libexec
-rw-r--r--. 1 bigdata bigdata 15429 5月  22 2017 LICENSE.txt
-rw-r--r--. 1 bigdata bigdata   101 5月  22 2017 NOTICE.txt
-rw-r--r--. 1 bigdata bigdata  1366 5月  22 2017 README.txt
drwxr-xr-x. 2 bigdata bigdata  4096 5月  22 2017 sbin
drwxr-xr-x. 4 bigdata bigdata  4096 5月  22 2017 share

2)重要目录

(1)bin目录:存放对Hadoop相关服务(HDFS,YARN)进行操作的脚本

(2)etc目录:Hadoop的配置文件目录,存放Hadoop的配置文件

(3)lib目录:存放Hadoop的本地库(对数据进行压缩解压缩功能)

(4)sbin目录:存放启动或停止Hadoop相关服务的脚本

(5)share目录:存放Hadoop的依赖jar包、文档、和官方案例


你的赞,我都当成喜欢。

专注分享大数据技术&智能技术&基础&实战,干货,资料。


关注本号,让更多人了解技术,让技术造福更多人。欢迎转发传播,感谢您的关注,谢谢。

相关推荐

一个不错的软件版本命名规范!

之前写了一篇如何自动生成版本号的文章,《让你的C程序,自动打印版本信息》初衷是让自己的程序在运行时自动打印与版本相关的信息,避免测试时因为版本信息不确定导致的一些功能对应不上去的问题,当时留了一个坑,...

国产操作系统迎来发展风口 公务领域更能培育起Linux生态

谷歌和微软在俄罗斯市场的一番套路猛如虎,就让我们深刻地意识到了,只有自己的东西才能靠得住。也由此,国内操作系统发展迎来了发展风口。我就看到有朋友就秀出了他们单位采购的纯国产的主机,一款华为的主机,纯国...

5个大有“前途”的Linux桌面发行版本

ZD至顶网CIO与应用频道08月27日专栏:Linux无处不在。你的服务器里,你的电话、汽车、手表、烤面包机、冰箱……和台式机里都有Linux的身影。虽然在桌面上见到Linux的用户比在自动调温...

Linux 常用应用软件大全

编译自:https://www.fossmint.com/most-used-linux-applications/作者:MartinsD.Okoi译者:HankChow对于许多应用程序...

Linux 4.1 系列的最大版本 4.1.18 LTS发布,带来大量修改

(LCTT译注:这是一则过期的消息,但是为了披露更新内容,还是发布出来给大家参考)著名的内核维护者GregKroah-Hartman貌似正在度假中,因为SashaLevin2016年2月16日的...

Linux发行版需要杀软吗?卡巴斯基推出免费KVRT病毒扫描清理工具

IT之家6月4日消息,你认为使用Linux发行版,需要杀毒软件吗?或许很多用户认为Linux发行版偏小众,因此受到黑客攻击的风险也相对较小,不过卡巴斯基并不这么认为,近期推出了适用于...

适合开发人员的 5款 Linux 发行版

什么是Linux?Linux是基于Unix的操作系统。由LinusTorvalds开发于1991年首次发布其内核。因为Linux是开源软件,其发行版由不同组织发布,因此不同的发行版具有不同的风格...

VMware Workstation 17.0 Pro 发布:新增 TPM 2.0 完美兼容Win11

IT之家11月18日消息,VMwareWorkstation17.0Pro现已发布,它带来了许多新特性,例如微软Windows11硬性要求:虚拟可信平台模块(TPM)2.0。...

你是否需要一个容器专用的Linux发行版本?

单单使用容器是不够的,提供商们认为你需要一个容器专用的Linux发行版本。我们可以让容器在不同的操作系统上运行,不同的操作系统都有自己的虚拟化服务,如:SolarisZones、BSDJails、...

Tizen 3.0版本发布 采用Linux 4.1内核

2015-09-2111:31:39作者:马荣【中关村在线软件资讯】9月21日消息:尽管三星靠着Android系统设备在移动市场赚钱,但是仍然没有忘记自家的Tizen开发。现在Tizen3.0版...

欧拉操作系统演进:应用累计超130万套 支持鲲鹏、英特尔、飞腾等芯片

21世纪经济报道记者倪雨晴深圳报道4月15日,在欧拉开发者大会(openEulerDeveloperDay2022)的主论坛上,欧拉首个数字基础设施全场景长周期版openEuler22.03...

Papyros:以Material Design为灵感的Linux发行版本

项目团队并不希望只是采用传统的桌面主题,而是致敬谷歌Android系统的MaterialDesign设计语言想要打造出某些不同以往足够吸引用户的Linux发行版本,自然该版本还在不断的更新和改进中,...

比特网早报:全国空间计量技术委员会成立,银河麒麟操作系统上架微信Linux4.0.0版本

2024年11月6日消息,昨夜今晨,科技圈都发生了哪些大事?行业大咖抛出了哪些新的观点?比特网为您带来值得关注的科技资讯:全国空间计量技术委员会在北京成立近日,经市场监管总局批准,全国空间计量技术委员...

2024年最稳定的5个Linux发行版,赶紧收藏!

Linux是最流行的免费开源平台之一。Linux已被广泛使用,因为它安全、可扩展和灵活。Linux发行版收集开源代码,对其进行编译,并将其组合成一个可以轻松启动和安装的操作系统。它们还提供不同的...

彰显Linux生态繁华,Ubuntu、Fedora等四发行版同时发布新版本

上周对于开源社区来说是忙碌的一周。EndeavourOS和TrueNASScale于周二(4月16日)发布,Fedora于周三(4月17日)发布,Ubuntu于周四(4月18日)发布。四个新版本中都...

取消回复欢迎 发表评论: