全量迁移

功能介绍

全量迁移gs_mysync是一个用Python3编写的将MySQL迁移至openGauss的复制工具,支持初始全量数据的复制功能。gs_mysync通过一次初始化配置,使用只读模式,将MySQL的数据全量拉取到openGauss。支持在同一快照下,表间数据并行迁移。

全量迁移支持的功能:支持表及表数据、视图、触发器、自定义函数、存储过程的全量迁移

特性优势

基于sysbench测试模型,2路鲲鹏920 CPU、openEuler操作系统下,MySQL数据库10张表(无主键)单表数据量在500万以上时,gs_mysync使用20并发迁移数据至openGauss,整体全量迁移性能可达300M/s以上。

环境准备

ARM+openEuler 20.03 或 X86+CentOS 7

操作步骤

全量迁移gs_mysync依赖MySQL一键式迁移工具gs_rep_portal,可实现全量迁移的安装、启动、停止、卸载整个过程。

如果用户的系统版本不在以下版本中,则内网场景下可能无法安装portal,此时安装portal需要保证pip3 install功能可用,可以连接外部网络的场景下安装portal不受系统版本影响。

各系统版本和架构对应的portal下载链接如下:

系统名称系统架构下载链接
centos7x86_64https://opengauss.obs.cn-south-1.myhuaweicloud.com/latest/tools/centos7/PortalControl-5.1.0-x86_64.tar.gz
openEuler20.03x86_64https://opengauss.obs.cn-south-1.myhuaweicloud.com/latest/tools/openEuler20.03/PortalControl-5.1.0-x86_64.tar.gz
openEuler20.03aarch64https://opengauss.obs.cn-south-1.myhuaweicloud.com/latest/tools/openEuler20.03/PortalControl-5.1.0-aarch64.tar.gz
openEuler22.03x86_64https://opengauss.obs.cn-south-1.myhuaweicloud.com/latest/tools/openEuler22.03/PortalControl-5.1.0-x86_64.tar.gz
openEuler22.03aarch64https://opengauss.obs.cn-south-1.myhuaweicloud.com/latest/tools/openEuler22.03/PortalControl-5.1.0-aarch64.tar.gz
  • 根据系统版本下载对应版本的portal(这里以centos系统x86架构为例)

    wget https://opengauss.obs.cn-south-1.myhuaweicloud.com/latest/tools/centos7/PortalControl-5.1.0-x86_64.tar.gz
    

    解压,并进入portal对应目录

    tar -zxvf PortalControl-5.1.0-x86_64.tar.gz
    cd portal
    
  • 修改gs_rep_portal配置文件

    配置文件位于config目录内,全量迁移相关的配置文件主要包含如下两个,相关参数含义简要说明如下:

    • toolspath.properties
    # 迁移工具的版本号
    tools.version=5.1.0
    # 系统名称
    system.name=centos7
    # 系统架构
    system.arch=x86_64
    # 全量迁移工具整体的安装路径
    chameleon.install.path=/ops/portal/tools/chameleon/
    # 全量迁移python虚拟环境的路径,可自定义修改
    chameleon.venv.path=/ops/portal/tools/chameleon/chameleon-${tools.version}/
    # 全量迁移用户相关路径
    chameleon.path=~/.pg_chameleon/
    # 全量迁移tar包的下载路径
    chameleon.pkg.url=https://opengauss.obs.cn-south-1.myhuaweicloud.com/latest/tools/${system.name}/chameleon-${tools.version}-${system.arch}.tar.gz
    # 全量迁移安装包的路径,可自定义修改
    chameleon.pkg.path=/ops/portal/pkg/chameleon/
    # 全量迁移安装包的名称
    chameleon.pkg.name=chameleon-${tools.version}-${system.arch}.tar.gz
    
    • migrationConfig.properties
    # 用于指定全量迁移是否迁移对象,包括函数、存储过程、触发器、视图,默认为yes;若设置为no,表示不迁移对象
    snapshot.object=yes
    # mysql用户名
    mysql.user.name=root
    # mysql密码
    mysql.user.password=***
    # mysql数据库ip
    mysql.database.host=127.0.0.1
    # mysql数据库端口
    mysql.database.port=3306
    # mysql数据库名称
    mysql.database.name=test123
    # openGauss用户名
    opengauss.user.name=test
    # openGauss密码
    opengauss.user.password=***
    # openGauss数据库ip
    opengauss.database.host=127.0.0.1
    # openGauss数据库端口
    opengauss.database.port=5432
    # openGauss数据库名称
    opengauss.database.name=test1234
    # openGauss数据库的schema名称
    opengauss.database.schema=test123
    # 全量迁移的安装方式,默认为offline,表示离线安装,需通过参数chameleon.pkg.path指定离线安装包的路径;若设置为online,对应在线安装,在线下载的安装包将存放在参数chameleon.pkg.path指定的路径
    default.install.mysql.full.migration.tools.way=offline
    
    • chameleon/config-example.yml

    除上述的基础参数外,工具自身还有一些高级参数,详情请参见配置参数说明

  • 安装

    sh gs_mysync.sh install workspace.id
    

    其中workspace.id表示迁移任务id,取值为数字和小写字母的组合,不同的id区分不同的迁移任务,不同迁移任务可并行启动。若未设置workspace.id,则使用其默认值1。若使用已存在的workspace.id,并修改其中的配置,请在portal/workspace/${workspace.id}/config/路径下修改对应的配置文件。

  • 启动

    sh gs_mysync.sh start workspace.id
    
  • 停止

    sh gs_mysync.sh stop workspace.id
    
  • 卸载

    sh gs_mysync.sh uninstall workspace.id
    

上述安装、启动、停止、卸载命令均不会在后台运行,若需在后台运行,请在命令后添加&符号。

意见反馈
编组 3备份
    openGauss 2024-07-13 00:55:20
    取消