从0开始学架构_27_26_高可用存储架构集群和分区

你好，我是华仔。

今天我和你分享的主题是高可用存储架构、集群和分区。

上一期我讲了高可用存储架构中常见的双击架构分别为主备复制、主从复制、双击切换和主主复制，并分析了每类架构的优缺点以及适应场景。

今天我们一起来看看另外两种常见的高可用存储架构，数据集群和数据分区主备主从主主架构。

本质上呢都有一个隐含的。

假设主机能够存储所有数据，但主机本身的存储和处理能力肯定是有极限的。

以PC为例，英特尔三八六时代服务器存储能力只有几百MB,奔腾时代，服务器存储能力可以有几十GB库。

睿多核时代的服务器可以有几个TB?单纯从硬件发展的角度来看，似乎发展速度还是挺快的，但如果和业务发展速度对比，那就差得远了。

早在二零一三年，facebook就有两千五百亿张上传照片，当时这些照片的容量就已经达到了二百五十PB,字节平均一天上传的图片有三亿五千万张。

如此大量的数据，单台服务器肯定是无法存储和处理的。

我们必须使用多台服务器来存储数据，这就是数据集群架构。

简单来说，集群就是多台机器组合在一起，形成一个统一的系统。

这里的布台数量上至少是三台，相比而言，主备主从都是两台机器。

根据集群中机器承担的不同角色来划分集群可以分为两类数据集中集群，数据分散集群一数据集中集群。

数据集中集群与主备主从这类架构相似，我们也可以称数据集中集群为一主多倍或者一主多从。

无论是一主一从，一主一倍，还是一主多备一主多从数据都只能往主机中写。

而读操作可以参考主备主从架构，进行灵活多变。

文稿中的架构图是读写全部到主机的一种架构。

虽然架构上是类似的，但由于集群里面的服务器数量更多，导致复杂度整体更高一些。

具体体现在主机如何将数据复制给备机？备机如何检测主机状态？主机故障后，如何决定新的主机？先来看主机如何将数据复制给备机主备和主从架构中只有一条复制通道，而数据集中集群架构中存在多条复制通道，多条复制通道首先会增大主机复制的压力。

某些场景下，我们需要考虑如何降低主机复制压力，或者降低主机复制给正常读写带来的压力。

其次，多条复制通道可能会导致多个备机之间数据不一致。

某些场景下，我们需要对备机之间的数据一致性进行检查和修正。

再来看备机如何检测主机状态？主备和主从架构中，只有一台备机需要进行主机状态判断。

在数据集中集群架构中，多台备机都需要对主机状态进行判断。

而不同的备机判断的结果可能是不同的。

如何处理不同备机对主机状态的不同判断是一个复杂的问题。

然后看看主机故障后，如何决定新的主机储存架构中，如果主机故障将备机升级为主机即可，而在数据集中集群架构中有多台备机都可以升级为主机，但实际上只能允许一台备机升级为主机。

那么，究竟选择哪一台备机作为新的主机备机之间如何协调？这也是一个复杂的问题。

目前开源的数据集中集群，以zookeeper为典型，zookeeper通过ZAB算法来解决上述提到的几个问题，但ZAB算法的复杂度是很高的。

二、数据分散集群数据分散集群只多个服务器组成一个集群，每台服务器都会负责存储一部分数据。

同时为了提升硬件利用率，每台服务器又会备份一部分数据。

数据分散集群的复杂点在于，如何将数据分配到不同的服务器上。

算法需要考虑这些设计点，均衡性。

算法需要保证服务器上的数据分区基本是均衡的，不能存在某台服务器上的分区数量是另外一台服务器的几倍的情况。

容错性。

当出现部分服务器故障时，算法需要将原来分配给故障服务器的数据分区分配给其他服务器可伸缩性。

当集训容量不够，扩充新的服务器后，算法能够自动将部分数据分区迁移到新的服务器，并保证扩容后所有服务器的均衡性。

数据分散集群和数据集中集群的不同点在于，数据分散集群中的每台服务器都可以处理读写请求。

因此不存在数据集中集群中负责写的主机那样的角色。

但在数据分散集群中，必须有一个角色来负责执行数据分配算法。

这个角色可以是独立的一台服务器，也可以是集群自己选举出的一台服务器。

如果是集群服务器，选取出来一台机器承担数据分区分配的职责，则这台服务器一般也会叫做主机。

但我们需要知道，这里的主机和数据集中集群中的主机，其职责是有差异的。

Hadoop的实现就是独立的服务器，负责数据分区的分配。

这台服务器叫做name node. Hadoop数据分区管理架构，请点击文稿查看。

与hadoop不同的是，elastic search集群通过选取一台服务器来做数据分区的分配，叫做master road.其数据分区管理架构请点击门口查看数据集群架构中，客户端只能将数据写到主机。

数据分散集群架构中，客户端可以向任意服务器中读写数据。

正是因为这个关键的差异，决定了两种集群的应用场景不同。

一般来说，数据集中集群适合数据量不大，集群机器数量不多的场景。

例如，zookeeper集群一般推荐五台机器左右，数据量是单台服务器就能够支撑。

而数据分散集群，由于其良好的可伸缩性适合业务数据量巨大、集群机器数量庞大的业务场景，例如hadoop集群，h base集群大规模的集群可以达到上百台甚至上千台服务器。

前面我们讨论的存储高可用架构呢都是基于硬件故障的场景去考虑和设计的。

主要考虑当部分硬件可能损坏的情况下，系统应该如何处理。

但对于一些影响非常大的灾难或者事故来说，有可能所有的硬件全部故障。

例如新奥尔良水灾，每家大停电、洛杉矶大地震等。

这些极端灾害或者事故可能会导致一个城市甚至一个地区的所有基础设施瘫痪。

这种情况下，基于硬件故障而设及的高可用架构不再适用。

我们需要基于地理级别的故障来设计高可用架构，这就是数据分区架构产生的背景。

数据分区只将数据按照一定的规则进行分区，不同分区分布在不同的地理位置上，每个分区存储一部分数据，通过这种方式来规避地理级别的故障所造成的巨大影响。

采用了数据分区的架构后，即使整个地区发生严重的自然灾害或者事故，受影响的也只是一部分数据，而不是全部数据都不可用。

当故障恢复后，其他地区备份的数据也可以帮助故障地区快速恢复业务设计。

一个良好的数据分区架构需要从多方面去考虑，一、数据量数据量的大小直接决定了分区的规则复杂度，例如使用mysql来存储数据。

假设一台mysql存储能力是五百GB,那么两TB的数据就至少需要四台mysql服务器。

而如果数据是两百TB,并不是增加到八百台的mysql服务器那么简单。

如果按照四台服务器那样去平行管理，八百台服务器，复杂度会发生本质的变化。

具体表现为，八百台服务器里面可能每周都有一两台服务器故障，从八百台里面定位出两台服务器故障，很多情况下呢并不是一件容易的事情。

运维复杂度高，增加新的服务器分区相关的配置，甚至规则需要修改。

而每次修改理论上都有可能影响已有的八百台服务器的运行，不小心改错配置的情况在实践中太常见了。

如此大量的数据，如果在地理位置上全部集中于某个城市，风险很大，遇到了水灾大停电。

这种灾难性的故障时，数据可能全部丢失，因此分区规则需要考虑地理容灾。

因此，数据量越大，分区规则会越复杂，考虑的情况也越多。

二分区规则地理位置有近有远。

因此，可以得到不同的分区规则，包括洲际分区、国家分区、城市分区具体采取哪种或者哪几种规则，需要综合考虑业务范围、成本等因素。

通常情况下，洲际分区主要用于面向不同大洲提供服务。

由于跨州通讯的网络延迟，已经大到不适合提供在线服务了。

因此，周际间的数据中心可以不互通，或者仅仅作为备份国家分区，主要用于面向不同国家的用户提供服务。

不同国家有不同语言、法律业务等。

国家间的分区一般也仅作为备份城市分区，由于都在同一个国家或者地区内网络延迟较低，业务相似分区同时对外提供服务，可以满足业务异地多活之类的需求。

三、复制规则，数据分区指将数据分散在多个地区，在某些异常或者灾难情况下，虽然部分数据受影响，但整体数据并没有全部被影响，本身就相当于一个高可用方案了，但仅仅做到这点还不够，因为每个分区本身的数据量虽然只是整体数据的一部分，但还是很大。

这部分数据如果损坏或者丢失损失同样难以接受。

因此，即使是分区架构，同样需要考虑复制方案。

常见的分区复制规则有三种，分别是集中式互备式和独立式。

集中式备份纸存在一个总的备份中心，所有的分区都将数据备份到备份中心，你可以在文稿中看到其基本架构。

集中式备份架构的优缺点是设计简单，各分区之间并无直接联系，可以做到互补，影响扩展容易。

如果要增加第四个分区，只需要将武汉分区的数据复制到西安备份中心即可。

其他分区不受影响，成本较高，需要建立一个独立的备份中心。

互备式备份指每一个分区备份另外一个分区的数据，你可以在文稿中看到其基本架构。

互备式备份架构的优缺点是设计比较复杂，各个分区除了要承担业务数据存储，还需要承担备份功能，相互之间互相关联和影响扩展麻烦。

如果增加一个武汉分区，则需要修改广州分区的复制指向武汉分区，然后将武汉分区的复制指向北京分区。

而原有北京分区已经备份了的，广州分区的数据怎么处理也是个难题。

不管是做数据迁移，还是广州分区，历史数据保留在北京分区新数据备份到武汉分区，无论哪种方式都很麻烦，成本低，直接利用已有的设备。

独立式备份指每个分区自己有独立的备份中心，你可以在文稿中看到其基本架构，有一个细节，需要特别注意各个分区的备份，并不和原来的分区在一个地方。

例如，北京分区的备份放到了天津、上海的放到了杭州、广州的放到了汕头。

这样做的主要目的是规避同城或者相同地理位置，同时发生灾难性故障的极端情况。

如果北京分区机房在朝阳区而备份机房，放在通州区，整个北京停电的话，两个机房都无法工作。

独立式备份架构的优缺点是，设计简单，各分区互不影响，扩展容易新增的分区，只需要搭建自己的备份中心，即可成本高。

每个分区需要独立的备份中心。

备份中心的场地成本是主要成本，因此独立式比集中式成本要高很多。

今天我为你讲了大数据量存储的两种高可用存储架构、集群架构和分区架构，并介绍了其中的关键设计点。

希望对你有所帮助。

这就是今天的全部内容，留一道思考题给你吧。

既然数据集群就可以做到不同节点之间复制，数据为何不搭建一个远距离分布的集群，来应对地理位置级别的故障呢？欢迎你把答案写到留言区，和我一起讨论。

相信经过深度思考的回答，也会让你对知识的理解更加深刻。