百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 优雅编程 > 正文

0695-5.10.2-如何将CM的外部PostgreSQL数据库迁移至MySQL服务

sinye56 2024-09-22 08:33 2 浏览 0 评论

作者:朱超杰

文档编写目的

在前面的文章《0694-5.10.2-如何将CM内嵌PostgreSQL服务迁移至外部PostgreSQL》介绍了将CM内嵌的PostgreSQL迁移至外部PostgreSQL,因为CM内嵌的PostgreSQL数据库不支持直接迁移至MySQL。本篇文章Fayson主要介绍如何将集群使用的外部PostgreSQL迁移至MySQL数据库。

注意:不支持直接从Cloudera Manager嵌入式PostgreSQL迁移到MySQL / Oracle数据库。您必须首先从Cloudera Manager嵌入式PostgreSQL数据库服务器迁移到外部PostgreSQL数据库服务器。

只有在成功从嵌入式PostgreSQL数据库服务器迁移到外部PostgreSQL数据库服务器后,才能迁移到外部MySQL或Oracle数据库。

  • 内容概述

1.安装Mariadb服务

2.数据库迁移

3.验证

4.总结

  • 测试环境

1.CM和CDH版本均为5.10.2

2.采用root用户

迁移前集群环境确认

1.CM元数据库类型为postgresql

cat /etc/cloudera-scm-server/db.properties



2.Hue用户及用户组

Hue的数据库类型为PostgreSQL



用户信息



用户组信息



管理员信息



3.Hive数据库及表信息

Hive的数据库类型为PostgreSQL



如下所示,当前hive中有default和test两个数据库;default数据库中有mytest(分区表)和mytest_no_partitions两个表。



查看mytest表的数据



4.Sentry授权信息

Sentry的数据库类型为PostgreSQL



Sentry的授权信息如下



安装MySQL

1.选一台节点安装MariaDB服务

yum -y install mariadb mariadb-server



2.启动mariadb服务并设置为开机自启动

systemctl start mariadb
systemctl enable mariadb
systemctl status mariadb | grep Active



3.初始化MariaDB数据库

/usr/bin/mysql_secure_installation

使用root用户登录查看当前数据库



4.安装MySQL JDBC驱动

将mysql驱动上传至/usr/share/java目录,并以软链接的方式去掉驱动版本号



迁移CM元数据库

1.导出Cloudera Manager配置文件

获取当前支持的API版本

curl -u admin:admin "http://192.168.0.173:7180/api/version"



导出json格式配置文件

curl -u admin:admin "http://192.168.0.173:7180/api/v15/cm/deployment" > /root/cm/cm-deployment.json



2.执行如下命令,保留Cloudera Manager的GUID号

sudo -u postgres psql -qtAX scm -c "select GUID from CM_VERSION" > /etc/cloudera-scm-server/uuid



3.停止集群和Cloudera Management Service服务



4.在CM节点上执行如下命令停止cloudera-scm-server服务

systemctl stop cloudera-scm-server
systemctl status cloudera-scm-server | grep Active



5.登录MySQL执行如下SQL语句创建scm数据库及用户并授权

create database scm default character set utf8;
CREATE USER 'scm'@'%' IDENTIFIED BY 'password';
GRANT ALL PRIVILEGES ON scm.* TO 'scm'@'%';
FLUSH PRIVILEGES;



执行如下命令,初始化Cloudera Manager数据库配置

/usr/share/cmf/schema/scm_prepare_database.sh mysql scm scm password



6.清空所有节点的/var/run/cloudera-scm-agent/process/目录

a.使用批量命令,停止集群所有节点的agent和supervisor服务

batch_cmd.sh node.list " service cloudera-scm-agent next_stop_hard"
batch_cmd.sh node.list "service cloudera-scm-agent stop"



查看进程是否已被停止

ps -ef | grep cmf-agent
ps -ef | grep supervisord



b.使用批量命令,使用mv命令将集群所有节点的agent目录备份

batch_cmd.sh node.list "mv /var/run/cloudera-scm-agent /var/run/cloudera-scm-agent-BU"



batch_cmd.sh node.list "ls /var/run | grep cloudera-scm-agent*"



使用批量命令,启动集群所有节点的cloudera-scm-agent服务

batch_cmd.sh node.list "systemctl start cloudera-scm-agent"
batch_cmd.sh node.list "systemctl status cloudera-scm-agent | grep Active"



7.启动Cloudera Manager Server

systemctl start cloudera-scm-server
netstat -lnpt | grep 7180



使用超级管理员用户登录CM



接收许可条款,【继续】



如果有许可证,上传许可证,没有许可证选择企业试用版,【继续】

注意:必须要上传许可证或者选择试用版继续之后再返回主页,否则会导致使用curl导入集群配置时失败。



单击左上角返回CM主页



当前CM主页状态如下:



8.执行如下命令调用CM API接口,恢复Cloudera Manager配置

curl -H "Content-Type: application/json" --upload-file /root/cm/cm-deployment.json -u admin:admin "http://192.168.0.173:7180/api/v15/cm/deployment?deleteCurrentDeployment=true"



再次查看CM主页,CM配置已导入成功



9.启动服务

启动Cloudera Mangement Service



Cloudera Management Service启动成功后,等待parcel分发完成,然后启动集群服务并分发客户端配置。



查看集群CM元数据库使用的数据库服务器,如下所示,此时已迁移至MySQL

cat /etc/cloudera-scm-server/db.properties



迁移集群其他服务元数据库

此时只有CM的数据库scm迁移到了MySQL,集群其他服务的元数据库(Hive、Sentry、Hue、Oozie等)任然配置的为PostgreSQL,接下来主要介绍通过使用工具将PostgreSQL数据库迁移至MySQL数据库,如下示例以迁移Hive元数据库为例。

1.下载安装数据库转换工具 DBConvert for MySQL & PostgreSQL,下载地址如下:

https://dbconvert.com/downloads/dbconvert_mysql_postgresql.zip

下载完成之后解压,执行dbconvert_mysql_postgresql文件夹下的setup.exe进行安装



2.安装完成后打开该软件,选择【Try】使用版



3.这里以hive元数据库转换为例,配置PostgreSQL数据库连接信息



测试连接成功,单击下一步



此时会显示数据库中的所有表,全部勾选;然后单击【OK】



配置目标数据库连接信息(即我们要迁移的MySQL信息)



测试连接成功后单击【Next】



自定义要转换的表,然后单击【Next】



单击【commit】开始进行转换



转换成功后显示如下



然后依次转换其他数据库即可

注意:转换hue数据库时,有些表因为外键的原因不能被转换,根据提示取消相关外键即可

4.数据库迁移完成后,登录mysql查看数据库如下:



创建用户并授予数据库上的权限

CREATE USER 'hive'@'%' IDENTIFIED BY 'password';
GRANT ALL PRIVILEGES ON hive.* TO 'hive'@'%';
FLUSH PRIVILEGES;
CREATE USER 'sentry'@'%' IDENTIFIED BY 'password'; 
GRANT ALL PRIVILEGES ON sentry. * TO 'sentry'@'%'; 
FLUSH PRIVILEGES;
CREATE USER 'rman'@'%' IDENTIFIED BY 'password'; 
GRANT ALL PRIVILEGES ON rman. * TO 'rman'@'%'; 
FLUSH PRIVILEGES;
CREATE USER 'hue'@'%' IDENTIFIED BY 'password'; 
GRANT ALL PRIVILEGES ON hue. * TO 'hue'@'%'; 
FLUSH PRIVILEGES;
CREATE USER 'oozie'@'%' IDENTIFIED BY 'password'; 
GRANT ALL PRIVILEGES ON oozie. * TO 'oozie'@'%'; 
FLUSH PRIVILEGES;



更换数据库服务器

5.进入Hive配置页面,修改Hive的Metastore数据库类型为MySQL,然后修改其在 MySQL中的数据库名称



6.完成上述修改后,然后回到CM主页,根据提示重启相关服务



服务重启完成后,此时数据库已迁移至MySQL数据库服务器。



迁移后验证

6.1 Hue验证

1.查看Hue当前数据库类型为MySQL



2.使用管理员账号hive登录Hue验证数据是否完整

hive用户的管理员权限与迁移前一致

迁移后的用户信息与迁移前数据一致



用户组信息与迁移前信息一致



6.2 Hive验证

1.查看Hive当前数据库类型为MySQL



2.通过Hue查看Hive数据库以及表信息如下:



3.查看mytest表数据如下:



查看mytest表结构如下:



由上图可知,数据库迁移完成后Hive的数据库、表、表结构以及表数据均迁移成功。

6.3 Sentry验证

1.查看Sentry当前数据库类型为MySQL



2.通过Hue查看Sentry的授权信息如下:



3.使用hive用户进行建表测试

建表成功



向表中插入数据,数据插入成功



执行查询操作,查询成功



4.使用ldapuser1用户登录Hue,进行建表测试

建表失败,报错如下:

Error while compiling statement: FAILED: SemanticException No valid privileges User ldapuser1 does not have privileges for SWITCHDATABASE The required privileges: Server=server1->Db=*->Table=+->Column=*->action=select;Server=server1->Db=*->Table=+->Column=*->action=insert;



执行数据插入操作,操作失败,报错如下:

Error while compiling statement: FAILED: SemanticException No valid privileges User ldapuser1 does not have privileges for SWITCHDATABASE The required privileges: Server=server1->Db=*->Table=+->Column=*->action=select;Server=server1->Db=*->Table=+->Column=*->action=insert;



执行查询操作,操作失败,报错如下:

Error while compiling statement: FAILED: SemanticException No valid privileges User ldapuser1 does not have privileges for SWITCHDATABASE The required privileges: Server=server1->Db=*->Table=+->Column=*->action=select;Server=server1->Db=*->Table=+->Column=*->action=insert;



由上可知,sentry数据库迁移后,授权信息也迁移成功。

总结

1.将Cloudera Manager服务使用的PostgreSQL迁移至MySQL时,主要通过CM API接口导出集群配置信息json文件,再通过CM API接口导入完成数据库的迁移。

2.集群其它服务(Hive、Sentry、Oozie、Hue等)在迁移时并未相应的API接口实现,主要是通过DBConvert for MySQL & PostgreSQL工具将PostgreSQL数据的数据转换为MySQL数据库的方式解决。

3.在进行Hue数据库转换的过程中由于部分表外键的问题,导致转换失败,需要将报错的外键取消勾选。

4.Oozie服务重启失败,报错如下:

Caused by: com.mysql.jdbc.exceptions.jdbc4.MySQLSyntaxErrorException: Table 'oozie.VALIDATE_CONN' doesn't exist



解决方式:为oozie服务创建数据库



相关推荐

RHEL8和CentOS8怎么重启网络

本文主要讲解如何重启RHEL8或者CentOS8网络以及如何解决RHEL8和CentOS8系统的网络管理服务报错,当我们安装好RHEL8或者CentOS8,重启启动网络时,会出现以下报错:...

Linux 内、外网双网卡路由配置

1.路由信息的影响Linux系统中如果有多张网卡的情况下,如果路由信息配置不正确,...

Linux——centos7修改网卡名

修改网卡名这个操作可能平时用不太上,可作为了解。修改网卡默认名从ens33改成eth01.首先修改网卡配置文件名(建议将原配置文件进行备份)...

CentOS7下修改网卡名称为ethX的操作方法

?Linux操作系统的网卡设备的传统命名方式是eth0、eth1、eth2等,而CentOS7提供了不同的命名规则,默认是基于固件、拓扑、位置信息来分配。这样做的优点是命名全自动的、可预知的...

Linux 网卡名称enss33修改为eth0

一、CentOS修改/etc/sysconfig/grub文件(修改前先备份)为GRUB_CMDLINE_LINUX变量增加2个参数(net.ifnames=0biosdevname=0),修改完成...

CentOS下双网卡绑定,实现带宽飞速

方式一1.新建/etc/sysconfig/network-scripts/ifcfg-bond0文件DEVICE=bond0IPADDR=191.3.60.1NETMASK=255.255.2...

linux 双网卡双网段设置路由转发

背景网络情况linux双网卡:网卡A(ens3)和网卡B(...

Linux-VMware设置网卡保持激活

Linux系统只有在激活网卡的状态下才能去连接网络,进行网络通讯。修改配置文件(永久激活网卡)...

VMware虚拟机三种网络模式

01.VMware虚拟机三种网络模式由于linux目前很热门,越来越多的人在学习linux,但是买一台服务放家里来学习,实在是很浪费。那么如何解决这个问题?虚拟机软件是很好的选择,常用的虚拟机软件有v...

Rocky Linux 9/CentOS Stream 9修改网卡配置/自动修改主机名(实操)

推荐...

2023年最新版 linux克隆虚拟机 解决网卡uuid重复问题

问题描述1、克隆了虚拟机,两台虚拟机里面的ip以及网卡的uuid都是一样的2、ip好改,但是uuid如何改呢?解决问题1、每台主机应该保证网卡的UUID是唯一的,避免后面网络通信有问题...

Linux网卡的Vlan配置,你可能不了解的玩法

如果服务器上连的交换机端口已经预先设置了TRUNK,并允许特定的VLAN可以通过,那么服务器的网卡在配置时就必须指定所属的VLAN,否则就不通了,这种情形在虚拟化部署时较常见。例如在一个办公环境中,办...

Centos7 网卡绑定

1、切换到指定目录#备份网卡数据cd/etc/sysconfig/network-scriptscpifcfg-enp5s0f0ifcfg-enp5s0f0.bak...

Linux搭建nginx+keepalived 高可用(主备+双主模式)

一:keepalived简介反向代理及负载均衡参考:...

Linux下Route 路由指令使用详解

linuxroute命令用于显示和操作IP路由表。要实现两个不同子网之间的通信,需要一台连接两个网络的路由器,或者同时位于两个网络的网关来实现。在Linux系统中,设置路由通常是为了解决以下问题:该...

取消回复欢迎 发表评论: