0%

集群master选举

发表于 2022-07-08 更新于 2025-08-13 分类于 Elasticsearch 阅读次数： Valine：
本文字数： 1.8k 阅读时长 ≈ 2 分钟

Elasticsearch 集群主节点（Master）选举机制详解

主节点（Master）是 Elasticsearch 集群的核心管理者，负责维护集群元数据（如索引创建 / 删除、分片分配）、协调节点加入 / 退出等。主节点的选举机制直接影响集群的稳定性，尤其是在节点故障或网络波动时，合理的选举配置可避免 “脑裂” 等严重问题。

主节点选举的触发场景

主节点选举在以下情况触发：

集群首次启动：无主节点时，所有候选主节点（node.master: true）参与选举。
现有主节点故障：节点检测到主节点失联（如网络中断、进程崩溃），触发重新选举。
主节点主动退出：主节点因负载过高或配置变更主动下线。

选举核心流程

候选主节点资格

只有配置 node.master: true 的节点才有资格参与选举（主节点候选节点），其他节点（如纯数据节点）仅参与投票，不竞选主节点。

选举步骤

Ping 阶段：候选节点通过 Zen Discovery 机制互相发送 ping 请求，交换集群状态和节点信息。
投票阶段：候选节点根据节点 ID、集群状态版本等信息，向 “最优” 候选节点投票（通常优先选择现有集群状态最新的节点）。
确认主节点：当某个候选节点获得 超过 discovery.zen.minimum_master_nodes 数量的投票时，成为新主节点。
集群同步：新主节点与其他节点同步集群元数据，确保全集群状态一致。

关键配置参数解析

`discovery.zen.ping_timeout`

作用：控制候选节点间 ping 请求的超时时间（默认 3s）。
场景：网络延迟较高时（如跨机房集群），需调大该值（如 10s~30s），避免因短暂网络波动误判节点故障，导致不必要的重新选举。
配置示例：
1
discovery.zen.ping_timeout: 10s

`discovery.zen.join_timeout`

作用：新节点加入集群时，向主节点发送 join 请求的超时时间（默认 60s，为 ping_timeout 的 20 倍）。
场景：节点加入时若主节点负载高或网络慢，可适当延长（如 5m），避免新节点反复重试。
配置示例：
1
discovery.zen.join_timeout: 5m

`discovery.zen.minimum_master_nodes`（核心防脑裂参数）

作用：指定选举主节点所需的最小候选节点投票数，是防止 “脑裂” 的关键。
脑裂风险：若集群因网络分区分裂为多个子集群，每个子集群可能独立选举主节点，导致数据不一致。
计算方式：
1
minimum_master_nodes = (候选主节点数量 / 2) + 1
例如：3 个候选主节点时，值为 2；5 个候选主节点时，值为 3。

配置示例：

1	discovery.zen.minimum_master_nodes: 2 # 3个候选主节点时的合理配置

`discovery.zen.no_master_block`

作用：当集群无可用主节点时，控制对集群操作的限制（默认 write）。
可选值：
- write：允许读操作，阻塞写操作（平衡可用性与一致性）。
- all：阻塞所有操作（优先保证数据一致性）。

配置示例：

1	discovery.zen.no_master_block: write # 无主节点时允许读取，禁止写入

主节点故障后的集群行为

检测主节点失联：
每个节点定期向主节点发送 ping 请求（由 discovery.zen.fd.ping_interval 控制，默认 1s），若连续 discovery.zen.fd.ping_retries 次（默认 3 次）超时，则判定主节点故障。
触发重新选举：
候选节点重新执行 Ping → 投票 → 确认流程，根据 minimum_master_nodes 选举新主节点。
分片恢复：
新主节点上线后，重新分配未分配的分片（如将故障节点的主分片副本升级为主分片），恢复集群可用性。

最佳实践

候选主节点数量：建议配置 3~5 个候选主节点（奇数），既保证高可用，又避免选举流程过于复杂。
minimum_master_nodes 必配：严格按公式配置，杜绝脑裂风险（生产环境最常见的稳定性问题之一）。
超时参数适配网络：跨机房或网络不稳定的集群，适当调大 ping_timeout 和 join_timeout，减少误判。
主节点与数据节点分离：候选主节点尽量不存储数据（node.data: false），避免因数据操作负载影响选举和集群管理

欢迎关注我的其它发布渠道