elasticsearch的灵魂唯一master选举机制原理分析（elasticsearch master选举）-eolink官网

elasticsearch的灵魂唯一master选举机制原理分析（elasticsearch master选举）

master作为cluster的灵魂必须要有，还必须要唯一，否则集群就出大问题了。因此master选举在cluster分析中尤为重要。对于这个问题我将分两篇来分析。第一篇也就是本篇，首先会简单说一说mater选举的一些算法，及elasticsearch的选举原理。第二篇也就是下一篇，会结合zenDiscovery代码为仔细分析elasticsearch的master选举的实现。

简单来说master的作用跟单个jvm中的同步关键字synchronized相同，集群中多节点协调工作必须要保证数据的一致性，但是不同节点分布在不同的jvm中，不可能用jvm的同步机制。所以需要一个“锁”，节点操作集群中的资源时都通过它来解决一致性问题，这就是master。关于分布式系统的master选举算jMEAlpWQ法有很多，最有名的当然要数paxos算法，在它的基础上出现了非常多的变体算法。关于这个算法请参考相关网页和资料，不是一两句话能说清楚的，这里不再祥述。但是paxos的功能远远超出了master选举，一致性向才是它的目标，任何需要实现一致性的问题都可以使用该算法，因此zookeeper功能远远不止master选举。

还有一种比较简单的算法就是Bully，它通过一定的直接给每个节点赋予一唯一的ID，这些ID是可以排序的，每次master选举都会选举ID最大的节点。这种实现非常简单。但是会存在一些问题，在master负载过重时它会假死，于是第二大节点就成为了master节点。因此假死master节点因负载减轻又活了过来，于是他又被选为master，然后又假死……，这种情况可能一直存在导致系统不稳定。

集群还有一个问题就是brain split：一个集群因为网络问题导致多个master选举出来而分裂。这也是master选举必须要解决的问题。elasticsearch的master选举原理jMEAlpWQ我觉得是在bully的基础上做了改进。相比于paxos实现的zookeeper它完美的解决了master选举问题，但不如zookeeper强大，因为zookeeper功能远远超出了master选举，它的master选举却不需要这么多功能。它原理如下：

对所有可以成为master的节点根据nodeId排序，每次选举每个节点都把自己所知道节点排一次序，然后选出第一个（第0位）节点，暂且认为它是master节点。如果对某个节点的投票数达到一定的值（可以成为master节点数n/2+1）并且该节点自己也选举自己，那这个节点就是master。否则重新选举。对于brain split问题，需要把候选master节点最小值设置为可以成为master节点数n/2+1（quorum ）

以上就是master选举的三条原则，其实第三天包含在第二条之中，为了说明brain split问题这里单独拿出来说一下。下面看一下ElectMasterService的相关代码，来补充说明一下一上的文字描述：

public DiscoveryNode electMaster(Iterable nodes) {

List sortedNodes = sortedMasterNodes(nodes);

if (sortedNodes == null || sortedNodes.isEmpty()) {

return null;

}

return sortedNodes.get(0);

}

private static class NodeComparator implements Comparator {

@Override

public int compare(DiscoveryNode o1, DiscoveryNode o2) {

if (o1.masterNode() && !o2.masterNode()) {

return -1;

}

if (!o1.masterNjMEAlpWQode() && o2.masterNode()) {

return 1;

}

return o1.id().compareTo(o2.id());

}

以上是节点排序比较器，可以看到它只是比较了nodeId，因此是按nodeId排序。从这两两段代码来看很像是bully算法的实现。为了解决brain split问题开发者加入了master候选数据量限制，代码如下：

public boolean hasEnoughMasterNodes(Iterable nodes) {

if (minimumMasterNodes < 1) {

return true;

}

int count = 0;

for (DiscoveryNode node : nodes) {

if (node.masterNode()) {

count++;

}

return count >= minimumMasterNodes;

}

通过比较节点能“看到”的候选master数量和配置的最小值来确定是否可以进行选举，如果数量不够会导致选举不能进行，这样就可以保证集群不会被分裂。下面以一个图(图片来自于elasticsearch官网)来说明:

假设之前选举了A节点为master，两个switch之间突然断线了，这样就分词了两部分。CDE和AB，因为 minimumMasterNodes的数目为3（集群中5个节点都可以成为master，3=5/2+1），因此cde会可以进行选举假设C成为master。AB两个节点因为少于3所以无法选举，只能一直寻求加入集群，要么线路连通加入到CDE中要么就一直处于寻找集群状态，这样就保证了集群不分裂。

总结一下，本篇介绍了master选举的两种算法和elasticsearch的选举原理，并分析了它原理中的两条，第二条将在下一篇discovery中接下分析。

以上就是elasticsearch的灵魂唯一master选举机制原理分析的详细内容，更多关于elasticsearch唯一master选举机制的资料请关注我们其它相关文章！

#yyds干货盘点#Python线性表-单链表

372 2022-08-03

elasticsearch的灵魂唯一master选举机制原理分析（elasticsearch master选举）

python selenium使用xpath定位（python和java哪个更值得学）

#yyds干货盘点#Python线性表-单链表

分布式面试分布式锁实现及应用场景

推荐文章

接口调用是什么意思？几种常用接口调用方式

接口设计原则

8款在线 API 接口文档管理工具

api管理系统是什么？

什么是接口调试？接口调试的步骤有哪些？

api 接口管理系统有哪些？

接口测试有几种测试方法

API文档生成工具有哪些？

微服务和api网关区别

交换机配置步骤

最近发表

热评文章

在线接口文档管理工具推荐，支持在线测试，HTTP接口

开源的在线接口文档wiki工具Mindoc的介绍与使

如何优雅的进行接口设计？接口设计的六大原则是什么？

什么是API测试,api检测公司

遇到百度网址安全中心提醒您该页面可能存在钓鱼欺诈信息

软件接口设计怎么做？前后端分离软件接口设计思路

elasticsearch的灵魂唯一master选举机制原理分析（elasticsearch master选举）

微信扫一扫：分享

推荐文章

最近发表

热评文章