-->

左耳听风_058_57_管理设计篇之部署升级策略

你好,我是陈浩,我网名猪耳朵house.这节课我们要讲的内容呢是部署升级策略。

在分布式系统的世界里呢,一个服务有多个实例,所以部署或者升级一个服务啊也会变得比较麻烦。

那今天呢我们来讨论服务部署的模式。

那一般来说呢有这几种。

第一个呢是停机部署,就是把现有版本的服务停机,然后呢部署新的版本。

那第二个呢是蓝绿部署部署好新的版本之后呢,把流量从老服务那边给切过来。

那第三个呢就是滚动部署,就是一点一点的升级现有的服务。

那第四个呢是灰度步数,意思呢就是把一部分用户切到新版本上面来,然后呢看一下有没有问题。

那如果没有问题呢,就继续扩大升级,直到全部升级完成。

那第五呢就是AB测试啊,就是同时上线两个版本,然后做相关的比较。

那接下来呢我们就来看一下每种方式的使用场景和优缺点。

首先呢我们来说停机部署。

停机部署呢其实是最简单粗暴的方式啊,就是简单的把现有版本的服务给停机,然后啊部署新的版本。

有的时候呢我们不得不使用这样的方式啊来部署或者升级多个服务。

比如新版本中的服务呢,使用到了和老版本完全不兼容的数据表设计。

那这个时候啊我们对生产有两个变更,一个是数据库,另一个呢是服务,而且新老版本互不兼容。

所以呢只能使用停机部署的方式。

那这种方式的优势呢就是在部署过程中啊,不会出现新老版本同时在线的情况,所有的状态呢完全一致。

停机部署呢主要是为了解决新版本的一致性问题。

那这种方式的问题呢就是会停机啊,对用户的影响呢很大。

所以一般来说呢,这种部署方式啊需要事前挂公告,选择一个用户访问少的时间段来做。

而蓝绿部署与停机部署最大的不同呢,就是它会在生产线上部署相同数量的新服务。

然后当新的服务测试确认ok之后呢,把流量切到新的服务这边来。

那蓝绿部署比停机部署好的地方呢,就是它不需要停机。

我们可以看到这种部署方式呢,就是我们说的预发环境。

在我以前的金融公司里啊,也经常用这种方式。

生产线上呢有两套相同的集群,一套是product,是真实服务的那另一套呢是stage,属于发环境发布,发stage,然后呢把流量切到stage这边,于是stage啊就成了product,而之前的product呢就成了stage,有点像换叶似的。

那这种方式的优点呢就是没有停机,实时发布和升级,也可以避免有新旧版本同时在线的问题。

但这种部署的问题呢就是有点浪费啊,因为需要使用双倍的资源。

另外呢如果我们的服务中有状态,比如一些缓存什么的,那停机部署和蓝绿部署呢都会有问题。

那接着呢我们来说滚动部署,滚动部署策略呢就是说通过逐个替换应用的所有实例来缓慢发布应用的一个新版本。

那通常的过程呢就是在负载调度之后啊,有一个版本a的应用实例池。

当下一个版本b的实例部署成功,可以响应请求的时候啊,就把这个实例啊加到池子中。

然后版本a的一个实例呢就从池中删除并下线。

那这种部署方式直接对现有的服务进行升级啊,比较便于操作。

而且在缓慢的更新的过程中呢,对于有状态的服务啊也是比较友好的状态呢,可以在更新中慢慢重建起来。

但是呢这种部署的问题啊也是比较多的那第一个问题呢就是在发布过程中啊,会出现新老两个版本同时在线的情况。

同一个用户的请求呢可能会在新老版中切换而导致问题。

那第二呢,就是我们的新版程序没有在生产线上经过验证就上线了。

那第三呢就是在整个过程中啊,生产环境处于一个新老更替的中间状态。

那如果有问题需要回滚呢,就有点麻烦了。

那第四呢就是在升级过程中需要做一些别的运维工作。

我们还要判断哪些节点是老版本的,哪些节点是新版本的那这个呢就太痛苦了。

那第五呢,因为新老版本的代码同时在线,所以它依赖的服务呢需要同时处理两个版本的请求。

那这个呢可能会带来兼容性问题。

还有一个问题呢,就是我们无法让流量在新老版本中切换。

然后呢,我们再来说一说灰度部署,灰度部署呢又叫金丝雀cannary部署它的得名啊来源于矿井中的金丝雀。

在十七世纪的时候呢,英国的矿井工人发现金丝雀对瓦斯这种气体啊十分敏感,空气中哪怕有极其微量的瓦斯,金丝雀也会停止歌唱。

而当瓦斯的含量超过一定限度的时候呢,虽然愚钝的人类毫无察觉,但是金丝雀呢却早已毒发身亡了。

那当时呢在采矿设备相对简陋的条件下工,人们每次下井呢都会带上一只金丝雀作为瓦斯检测指标,以便在危险的状况下进行撤离。

那灰度部署呢就是指逐渐将生产环境的流量从老版本切换到新版本。

那通常呢流量是按比例分配的,例如百分之九十的请求流向老版本,百分之十的请求呢流向新的版本。

然后呢没有发现问题,就逐步扩大新版本上的流量,减少老版本上的流量。

那除了切流量之外呢,对于多租户的平台,例如云计算平台,灰度部署呢,也可以将一些新的版本先部署到一些用户上。

那如果没有问题呢,就扩大部署啊,直到全部用户。

那一般的策略呢是从内部用户开始,然后呢是一般用户,最后啊是大客户。

那这个技术大多数用在缺少足够的测试,或者缺少可靠的测试,或者呢对新版本的稳定性缺乏信心的情况下,把一部分的用户切到新版上来,然后看一下有没有问题。

如果没有问题呢,就继续扩大升级啊,直到全部升级完成。

那最后一个呢就是AB测试,AB测试和蓝绿部署,或者金丝雀灰度部署呢完全是不一样的。

Ab测试呢是同时上线两个版本,然后啊做相关的比较,它是用来测试应用功能表现的方法,例如可用性啊、受欢迎程度啊,还有可见性等等。

蓝绿部署呢是为了不停机。

灰度部署呢是对新版本的质量没有信心。

而AB测试呢是对新版的功能没信心。

这里要注意啊,一个是质量,一个是功能,比如网站UI大改版推荐算法的更新流程的改变。

我们不知道新的版本是否会得到用户的青睐,或是能得到更好的用户体验。

我们需要收集一定的用户数据才能知道。

于是呢我们就需要在生产线上发布两个版本,拉一部分用户过来当小白鼠,然后呢通过科学的观测得出来相关的结论。

那AB测试的目的呢就是通过科学的实验设计采样样本的代表性、流量分割与小流量测试等方式来获得具有代表性的实验结论。

明确信这个结论啊,在推广到全部流量时可信。

我们可以看到AB测试呢,它包含了灰度发布的功能。

也就是说呢,如果我们的观测只是观测有没有bug,那就是灰度发布。

那当然呢如果我们复杂一点,要观测用户的一些数据指标,这完全也可能做成自动化的。

如果新版本数据好呢,就自动化的切一点流量过来啊,如果不行呢,就换一批用户再试试。

那对于灰度发布或者AB测试呢,可以使用一些技术来选择用户,比如浏览器cookie查询、参数、地理位置、技术知识,还有客户端语言啊等等。

部署应用呢有很多种方法,但实际采用哪种方式呢取决于需求和预算。

当发布到开发或者模拟环境的时候呢,停机或者滚动部署是一个好选择,因为比较干净和快速。

那当发布到生产环境的时候呢,滚动部署或者蓝绿部署啊通常是一个好选择。

但新平台的主流程测试呢是必须的。

蓝绿部署呢也不错,但是需要额外的资源。

如果应用缺乏测试,或者对软件的功能和稳定性影响缺乏信心,那么呢就可以使用金丝雀部署或者AB测试来发布。

那如果业务呢需要根据地理位置、语言、操作系统或者浏览器特征等参数来给一些特定的用户来测试。

那么呢就可以采用AB测试技术。

我在文中呢给你总结了一张表格,你的课后啊可以好好看一看。

好了,我们来总结一下今天分享的主要内容。

首先呢常见的部署升级策略呢有停机、蓝绿滚动灰度,还有AB测试这几种。

然后呢我讲述了每一种部署策略的含义和优缺点。

在最后呢我将它们放在一起做了一个比较。

那下一篇文章呢是分布式系统设计模式的第三部分性能设计中的第一篇缓存。

希望能对你有帮助,也欢迎你来分享一下你接触到的部署方式有哪些,在什么场景下使用哪一种部署方式呢?文末呢我给出了分布式系统设计模式系列文章的目录,希望你能在这个列表里啊找到自己感兴趣的内容。