ZooKeeper Server

leader

  • 只有1个,负责管理集群

follower

  • 多个,执行leader指令。leader挂掉,重新选举leader

Leader选举过程

  • 首先在/节点下创建ephemeral(临时的)目录/elect。

  • 每个zk服务器都在给目录下创建自己对应的节点,例如/../zk_1,类型或者为sequence,或者为ephemeral。zk集群为sequence的节点分配一个比前一个的大的序号。

  • 拥有最小序号者就是leader

ZooKeeper何时开始选举

Leader选举的前提

  • 所有follower监视leader的节点

  • leader故障时,leader节点被自动删除。

  • 删除操作触发所有follower的watcher事件。

  • 所有follower按照上文的过程进行选举

从众现象:所有follower都要参与到leader选举过程中,资源消耗比较大,如何快选?

ZooKeeper快选Leader

只有一个follower参与选举

  • 每个follower只对树形节点中自己之前的node设置watcher

  • 只有自己watch的follower挂掉后,自己才进行选举

  • 通常自己将成为下一个leader

  • 每次选举只有一个follower参与,速度很快

选举流程简述

目前有5台服务器,每台服务器均没有数据,它们的编号分别是1,2,3,4,5,按编号依次启动,它们的选择举过程如下:

  • 服务器1启动,给自己投票,然后发投票信息,由于其它机器还没有启动所以它收不到反馈信息,服务器1的状态一直属于Looking。

  • 服务器2启动,给自己投票,同时与之前启动的服务器1交换结果,由于服务器2的编号大所以服务器2胜出,但此时投票数没有大于半数,所以两个服务器的状态依然是LOOKING。

  • 服务器3启动,给自己投票,同时与之前启动的服务器1,2交换信息,由于服务器3的编号最大所以服务器3胜出,此时投票数正好大于半数,所以服务器3成为领导者,服务器1,2成为小弟。

  • 服务器4启动,给自己投票,同时与之前启动的服务器1,2,3交换信息,尽管服务器4的编号大,但之前服务器3已经胜出,所以服务器4只能成为小弟。

  • 服务器5启动,后面的逻辑同服务器4成为小弟。