基于案例分析 MySQL Group Replication 的故障检测流程( 七 )

注意事项如果集群中存在 UNREACHABLE 的节点 , 会有以下限制和不足:

  1. 不能调整集群的拓扑 , 包括添加和删除节点 。
  2. 在单主模式下 , 如果 Primary 节点出现故障了 , 无法选择新主 。
  3. 如果 Group Replication 的一致性级别等于 AFTER 或 BEFORE_AND_AFTER , 则写操作会一直等待 , 直到 UNREACHABLE 节点 ONLINE 并应用该操作 。
  4. 集群吞吐量会下降 。如果是单主模式 , 可将 group_replication_paxos_single_leader (MySQL 8.0.27 引入的)设置为 ON 解决这个问题 。
所以 , 在线上 group_replication_member_expel_timeout 不宜设置过大 。
参考资料[1] Extending replication instrumentation: account for memory used in XCom
[2] MySQL Group Replication - Default response to network partitions has changed
[3] No Ping Will Tear Us Apart - Enabling member auto-rejoin in Group Replication

经验总结扩展阅读