从ECS上的自建MySQL同步至PolarDB MySQL
更新时间:2020-04-23 10:55:02
PolarDB是阿里巴巴自主研发的下一代关系型分布式云原生数据库,可完全兼容MySQL,具备简单易用、高性能、高可靠、高可用等优势。通过数据传输服务DTS(Data
Transmission Service),您可以将自建的MySQL数据库同步至PolarDB MySQL,本文以ECS上的自建MySQL为例介绍配置流程。
前提条件
已创建PolarDB MySQL集群,详情请参见创建PolarDB MySQL集群。
注意事项
- DTS在执行全量数据初始化时将占用源库和目标库一定的读写资源,可能会导致数据库的负载上升,在数据库性能较差、规格较低或业务量较大的情况下(例如源库有大量慢SQL、存在无主键表或目标库存在死锁等),可能会加重数据库压力,甚至导致数据库服务不可用。因此您需要在执行数据同步前评估源库和目标库的性能,同时建议您在业务低峰期执行数据同步(例如源库和目标库的CPU负载在30%以下)。
- 如果同步对象为单个或多个表(非整库),那么在数据同步时,请勿对源库的同步对象使用gh-ost或pt-online-schema-change等类似工具执行在线DDL变更,否则会导致同步失败。
注意 为避免同步失败,数据同步期间您可以使用数据管理DMS(Data Management Service)来执行在线DDL变更,详情请参见不锁表结构变更。
- 全量初始化过程中,并发INSERT会导致目标集群的表碎片,全量初始化完成后,目标集群的表空间比源库的表空间大。
- 如果数据同步的源库没有主键或唯一约束,且记录的全字段没有唯一性,可能会出现重复数据。
支持同步的SQL操作
- DML:INSERT、UPDATE、DELETE
- DDL:CREATE TABLE、ALTER TABLE、RENAME TABLE、TRUNCATE TABLE、DROP TABLE
功能限制
- 不兼容触发器
同步对象为整个库且这个库中包含了会更新同步表内容的触发器,那么可能导致同步数据不一致。例如数据库中存在了两个表A和B。表A上有一个触发器,触发器内容为在INSERT一条数据到表A之后,在表B中插入一条数据。这种情况在同步过程中,如果源集群表A上进行了INSERT操作,则会导致表B在源集群跟目标集群数据不一致。
此类情况须要将目标集群中的对应触发器删除掉,表B的数据由源集群同步过去,详情请参见源库存在触发器时如何配置同步作业。
- RENAME TABLE限制
RENAME TABLE操作可能导致同步数据不一致。例如同步对象只包含表A,如果同步过程中源集群将表A重命名为表B,那么表B将不会被同步到目标库。为避免该问题,您可以在数据同步配置时,选择同步表A和表B所在的整个数据库作为同步对象。
准备工作
为自建MySQL创建账号并设置binlog
说明 用于数据同步的数据库账号需具备待同步对象的SELECT、REPLICATION CLIENT、REPLICATION SLAVE权限。
支持的同步架构
- 一对一单向同步
- 一对多单向同步
- 级联单向同步
- 多对一单向同步
关于各类同步架构的介绍及注意事项,请参见数据同步拓扑介绍。
操作步骤