上一章接头了paxos算法,把paxos推到一个很高的位置。可是,paxos有没有什么问题呢?实际上,paxos照旧有其自身的缺点的:
1. 活锁问题。在base-paxos算法中,不存在leader这样的脚色,于是存在这样一种环境,劳务派遣管理系统,即P1提交了一个proposal n1而且通过了prepare阶段;此时P2提交了一个proposal n2(n2>n1)而且也通过了prepare阶段;P1在commit时因为已经通过了n2而被拒绝;于是P1继承提交一个proposal n3而且通过prepare阶段;巧的是此时P2开始commit了,由于n2<n3再次被拒绝……如此轮回来去。这种环境被称为活锁。即整个系统都没死,但由于相互请求资源而被相互锁死。为了不产糊口锁的环境,最简朴的方法虽然是缩减proposer到一个,这样就不会产生相互请求锁死的环境,也即退化。事实上许多厥后的家产级协议,都是paxos协议的退化可能变种。
2. 巨大度问题。base-paxos协议中还存在这样那样的问题,于是各类变种paxos呈现了,好比为了办理活锁问题,呈现了multi-paxos;为了办理通信次数较多的问题,呈现了fast-paxos;为了只管淘汰斗嘴,呈现了epaxos。可以看到,家产级实现需要思量更多的方面,诸如机能,软件开发,异常等等。这也是为啥很多漫衍式的一致性框架并非真正基于paxos来实现的原因。
3. 全序问题。对付paxos算法来说,不能担保两次提交最终的顺序,而zookeeper需要做到这点,可以参考文献1。
For high-performance, it is important that ZooKeeper can handle multiple outstanding state changes requested by the client and that a prefix of operations submitted concurrently are committed according to FIFO order.
基于以上这些原因,zookeeper并没有用paxos作为本身实现的协议,取而代之回收了一种称为zab的协议,全称是zookeeper atomic broadcast。下面简朴先容一下zab协议。
上面说过了,paxos存在活锁问题,为了办理活锁问题,zab引入了leader,可是单leader就是赤裸裸的单点问题,如何办理这个单点呢?
paxos回收的要领是leader选举(没有回收主备,因为主备过于牢靠,不足漫衍式)。leader选举就一定呈近况态纷歧致的环境,于是就有着同步这样的进程。
zab协议分为4个阶段,即阶段0为leader选举,阶段1为发明,阶段2为同步,阶段3为广播。而实际实现时将发明及同步阶段归并为一个规复阶段。
0. leader选举阶段。当集群中没有leader可能其他人感觉不到leader时会进入这一阶段,这一阶段的主要目标是选出zxid最大的节点作为准leader。
1. recovery阶段。本阶段的主要目标是按照准leader的环境将数据同步到其他节点。同步完成后准leader变为leader。
2. broadcast阶段。本阶段的主要目标是leader收到请求,并将请求转为proposal,其他节点按照协议举办核准或通过。broadcast阶段事实上就是一个两阶段提交的简化版。其所有进程都跟两阶段提交一致,独一纷歧致的是不醒目事务的回滚。
广播的进程实际上雷同于二阶段提交,可是假如实现完整的两阶段提交,那就办理了一致性问题,没须要发现新协议了,所以zab实际上丢弃了两阶段提交的事务回滚,于是一台follower只能回覆ACK可能爽性就不回覆了,leader只要收到过半的呆板回覆即通过proposal。可是这样的设计就存在许多问题,好比假如一个follower因为网络问题从新到尾一直充公到过leader的proposal,后续的询问恰好落到这台follower上该如那里理惩罚?好比leader第一阶段收到了所有follower的ACK后提交,然后通知其他follower提交,这时本身挂了该如那里理惩罚?于是降生了瓦解规复阶段,旨在对各类纷歧致环境做出规复和处理惩罚。
对付选举和规复阶段。zab算法需要确保两件事。
1. 已经处理惩罚过的proposal不能被扬弃。
产生场景:leader发送了proposal,follower1和follower2回覆了ACK给leader,leader向所有follower发送commit请求并commit自身,此时leader挂了。leader已经提交,可是follower尚未提交,这会存在纷歧致的环境。
确保方法:
a. 从头选举leader时只挑选zxid最大的follower。因为至少半数的follower曾今回覆ACK,意味着从头选举时zxid最大的follower应该是当初回覆ACK但尚未提交的个中一台。
b. 该follower即准leader,将自身收到prepare但尚未提交的proposal提交
c. 在选举阶段准leader已经能拿到其余follower的所有事务荟萃,于是准leader按照各个follower的事务执行环境,别离成立行列,先发送prepare请求,再发送commit请求,让所有follower都同步到与leader一样的状态。
通过以上方法,可以或许确保提交过的proposal不会呈现扬弃的环境。
2. 已经扬弃的proposal不能被反复处理惩罚。