Zookeeper 选举机制(六)

Apr 07,2017 in ZooKeeper lang 繁 read (798)

ZooKeeper Server

leader

只有1个，负责管理集群

follower

多个，执行leader指令。leader挂掉，重新选举leader

Leader选举过程

首先在/节点下创建ephemeral(临时的)目录/elect。
每个zk服务器都在给目录下创建自己对应的节点，例如/../zk_1，类型或者为sequence，或者为ephemeral。zk集群为sequence的节点分配一个比前一个的大的序号。
拥有最小序号者就是leader

ZooKeeper何时开始选举

Leader选举的前提

所有follower监视leader的节点
leader故障时，leader节点被自动删除。
删除操作触发所有follower的watcher事件。
所有follower按照上文的过程进行选举

从众现象：所有follower都要参与到leader选举过程中，资源消耗比较大，如何快选？

ZooKeeper快选Leader

只有一个follower参与选举

每个follower只对树形节点中自己之前的node设置watcher
只有自己watch的follower挂掉后，自己才进行选举
通常自己将成为下一个leader
每次选举只有一个follower参与，速度很快

选举流程简述

目前有5台服务器，每台服务器均没有数据，它们的编号分别是1,2,3,4,5,按编号依次启动，它们的选择举过程如下：

服务器1启动，给自己投票，然后发投票信息，由于其它机器还没有启动所以它收不到反馈信息，服务器1的状态一直属于Looking。
服务器2启动，给自己投票，同时与之前启动的服务器1交换结果，由于服务器2的编号大所以服务器2胜出，但此时投票数没有大于半数，所以两个服务器的状态依然是LOOKING。
服务器3启动，给自己投票，同时与之前启动的服务器1,2交换信息，由于服务器3的编号最大所以服务器3胜出，此时投票数正好大于半数，所以服务器3成为领导者，服务器1,2成为小弟。
服务器4启动，给自己投票，同时与之前启动的服务器1,2,3交换信息，尽管服务器4的编号大，但之前服务器3已经胜出，所以服务器4只能成为小弟。
服务器5启动，后面的逻辑同服务器4成为小弟。

Matrix42

Record and Share!