下载APP
关闭
讲堂
客户端下载
兑换中心
企业版
渠道合作
推荐作者

21 | 分布式系统架构的冰与火

2017-12-12 陈皓
左耳听风
进入课程

讲述:柴巍

时长08:54大小4.08M

最近几年,我们一直在谈论各式各样的架构,如高并发架构、异地多活架构、容器化架构、微服务架构、高可用架构、弹性化架构等。还有和这些架构相关的管理型的技术方法,如 DevOps、应用监控、自动化运维、SOA 服务治理、去 IOE 等。面对这么多纷乱的技术,我看到很多团队或是公司都是一个一个地去做这些技术,非常辛苦,也非常累。这样的做法就像我们在撑开一张网里面一个一个的网眼。

其实,只要我们能够找到这张网的“纲”,我们就能比较方便和自如地打开整张网了。那么,这张“分布式大网”的总线——“纲”在哪里呢?我希望通过这一系列文章可以让你找到这个“纲”,从而能让你更好更有效率地做好架构和工程。

分布式系统架构的冰与火

首先,我们需要阐述一下为什么需要分布式系统,而不是传统的单体架构。也许这对你来说已经不是什么问题了,但是请允许我在这里重新说明一下。使用分布式系统主要有两方面原因。

  • 增大系统容量。我们的业务量越来越大,而要能应对越来越大的业务量,一台机器的性能已经无法满足了,我们需要多台机器才能应对大规模的应用场景。所以,我们需要垂直或是水平拆分业务系统,让其变成一个分布式的架构。

  • 加强系统可用。我们的业务越来越关键,需要提高整个系统架构的可用性,这就意味着架构中不能存在单点故障。这样,整个系统不会因为一台机器出故障而导致整体不可用。所以,需要通过分布式架构来冗余系统以消除单点故障,从而提高系统的可用性。

当然,分布式系统还有一些优势,比如:

  • 因为模块化,所以系统模块重用度更高;

  • 因为软件服务模块被拆分,开发和发布速度可以并行而变得更快;

  • 系统扩展性更高;

  • 团队协作流程也会得到改善;

  • ……

不过,这个世界上不存在完美的技术方案,采用任何技术方案都是“按下葫芦浮起瓢”,都是有得有失,都是一种 trade-off。也就是说,分布式系统在解决上述问题的同时,也给我们带来了其他的问题。因此,我们需要清楚地知道分布式系统所带来的问题。

下面这个表格比较了单体应用和分布式架构的优缺点。

从上面的表格我们可以看到,分布式系统虽然有一些优势,但也存在一些问题。

  • 架构设计变得复杂(尤其是其中的分布式事务)。

  • 部署单个服务会比较快,但是如果一次部署需要多个服务,流程会变得复杂。

  • 系统的吞吐量会变大,但是响应时间会变长。

  • 运维复杂度会因为服务变多而变得很复杂。

  • 架构复杂导致学习曲线变大。

  • 测试和查错的复杂度增大。

  • 技术多元化,这会带来维护和运维的复杂度。

  • 管理分布式系统中的服务和调度变得困难和复杂。

也就是说,分布式系统架构的难点在于系统设计,以及管理和运维。所以,分布式架构解决了“单点”和“性能容量”的问题,但却新增了一堆问题。而对于这些新增的问题,还会衍生出更多的子问题,这就需要我们不断地用各式各样的技术和手段来解决这些问题。

这就出现了我前面所说的那些架构方式,以及各种相关的管理型的技术方法。这个世界就是这样变得复杂起来的。

分布式系统的发展

从 20 世纪 70 年代的模块化编程,80 年代的面向事件设计,90 年代的基于接口 / 构件设计,这个世界很自然地演化出了 SOA——基于服务的架构。SOA 架构是构造分布式计算应用程序的方法。它将应用程序功能作为服务发送给最终用户或者其他服务。它采用开放标准与软件资源进行交互,并采用标准的表示方式。

开发、维护和使用 SOA 要遵循以下几条基本原则。

  • 可重用,粒度合适,模块化,可组合,构件化以及有互操作性。

  • 符合开放标准(通用的或行业的)。

  • 服务的识别和分类,提供和发布,监控和跟踪。

但 IBM 搞出来的 SOA 非常重,所以对 SOA 的裁剪和优化从来没有停止过。比如,之前的 SOAP、WSDL 和 XML 这样的东西基本上已经被抛弃了,而改成了 RESTful 和 JSON 这样的方式。而 ESB(Enterprise Service Bus,企业服务总线)这样非常重要的东西也被简化成了 Pub/Sub 的消息服务……

不过,SOA 的思想一直延续着。所以,我们现在也不说 SOA 了,而是说分布式服务架构了。

下面是一个 SOA 架构的演化图。

我们可以看到,面向服务的架构有以下三个阶段。

  • 20 世纪 90 年代前,是单体架构,软件模块高度耦合。当然,这张图同样也说明了有的 SOA 架构其实和单体架构没什么两样,因为都是高度耦合在一起的。就像图中的齿轮一样,当你调用一个服务时,这个服务会调用另一个服务,然后又调用另外的服务……于是整个系统就转起来了。但是这本质是比较耦合的做法。

  • 而 2000 年左右出现了比较松耦合的 SOA 架构,这个架构需要一个标准的协议或是中间件来联动其它相关联的服务(如 ESB)。这样一来,服务间并不直接依赖,而是通过中间件的标准协议或是通讯框架相互依赖。这其实就是 IoC(控制反转)和 DIP(依赖倒置原则)设计思想在架构中的实践。它们都依赖于一个标准的协议或是一个标准统一的交互方式,而不是直接调用。

  • 而 2010 年后,出现了微服务架构,这个架构更为松耦合。每一个微服务都能独立完整地运行(所谓的自包含),后端单体的数据库也被微服务这样的架构分散到不同的服务中。而它和传统 SOA 的差别在于,服务间的整合需要一个服务编排或是服务整合的引擎。就好像交响乐中需要有一个指挥来把所有乐器编排和组织在一起。

一般来说,这个编排和组织引擎可以是工作流引擎,也可以是网关。当然,还需要辅助于像容器化调度这样的技术方式,如 Kubernetes。在 Martin Fowler 的 Microservices 这篇文章中有详细描述。

微服务的出现使得开发速度变得更快,部署快,隔离性高,系统的扩展度也很好,但是在集成测试、运维和服务管理等方面就比较麻烦了。所以,需要一套比较好的微服务 PaaS 平台。就像 Spring Cloud 一样需要提供各种配置服务、服务发现、智能路由、控制总线……还有像 Kubernetes 提供的各式各样的部署和调度方式。

没有这些 PaaS 层的支撑,微服务也是很难被管理和运维的。好在今天的世界已经有具备了这些方面的基础设施,所以,采用微服务架构,我认为只是一个时间问题了。

小结

好了,今天的内容就到这里。相信通过今天的学习,你应该已经对为什么需要分布式系统,而不是传统的单体架构,有了清晰的认识。并且对分布式系统的发展历程了然于心。下一篇文章,我将结合亚马逊的分布式架构实践,来谈谈分布式系统架构的技术难点及应对方案。

下面我列出了《分布式系统架构的本质》系列文章的目录,希望你能在这个列表里找到自己感兴趣的内容。

在文章的最后,很想听听大家在进行分布式系统开发,把一个单体应用拆解成服务化或是微服务中遇到的问题和难点是什么?踩过什么样的坑?你是如何应对的?

© 版权归极客邦科技所有,未经许可不得传播售卖。 页面已增加防盗追踪,如有侵权极客邦将依法追究其法律责任。
上一篇
20 | Git协同工作流,你该怎么选?
下一篇
22 | 从亚马逊的实践,谈分布式系统的难点
 写留言

精选留言(46)

  • javaee
    2017-12-11
    22
    微服务通常根据业务来划分边界,粒度通常是一个独立的业务,具体多大合适不是一开始就决定的,这是一个逐步拆分细化的过程,李智慧老师说任何复杂的架构都是从最简单的应用慢慢演化过来的,就像当年的淘宝发展到现在。单体应用,为了高可用,需要集群多实例部署。查询太慢,访问太慢,加缓存,DB读写分离。业务发展到一定复杂程度,单体应用太庞大,会产生一系列问题。例如开发方面,一个工程几十上百人不停的改动,如何协作,一个人的代码有问题,影响了所有业务。每一个版本的迭代与发布,开发、测试、沟通得花大把时间,可能还会出错,牵一发而可能动全身。运维上,发布一次可以睡个午觉,发布一次影响线上所有功能。资源方面,扩容到几十上百台机器的时候,DB、NoSQL等的连接数撑爆了……
    展开
  • 左耳朵
    2017-12-07
    8
    @ lfn 当然不是
    展开
  • 左耳朵
    2017-12-07
    7
    @ coco 后面的“数据调度”会讲
    展开
  • 左耳朵
    2017-12-07
    7
    @ helloworld 关于技术细节,我会单开另一个系列讲各种Pattern。敬请期待。
  • coco
    2017-12-07
    7
    我遇到的比较麻烦的就是数据一致性问题。一个操作需要调用好几个服务,后面的服务异常,前面的服务怎么回滚,如何保证事务。
    展开
  • whhbbq
    2017-12-24
    5
    服务化过程中代码层面需要注意以下几点1.序列化。接口的入参出参需要序列化;之前在单体应用中适用的service接口,可能不适用远程调用,需要改造,如匿名函数作为参数的接口。2.既当入参又当出参的接口,在服务化后,不再适用,需要改造。即调用更新接口后,需要调用查询接口以返回正确的值。3.服务化后,要考虑写接口是否是幂等。4.考虑接口超时,设置合理的超时时间。
    展开
  • Michael
    2017-12-07
    4
    我很想知道对于新手来说,应该如何去学习分布式系统?耗子哥能给一些建议或者列一些书单么?
  • 艾小祥
    2017-12-07
    3
    期待下一篇文章
    展开
  • godtrue
    2018-12-29
    2
    阅后留痕

    单机在中间,往下研究是多线程高并发,往上研究是分布式高并发,往下是线程级别,往上是进程,集群级别,不过他们的根本是为了速度,为了快,为了快点将任务做完。

    1:什么是分布式?
    我认为相对单机而言,分布式至少是多机部署,多机共同分担任务处理

    2:分布式核心解决的问题是什么?
    我认为本质如浩哥所言,一是增加系统容量,二是实现系统高可用,其他还有并行开发、服务解耦

    3:分布式引入的问题是什么?
    数据不一致性,测试、运维复杂,排障链路长

    4:分布式实现的难点是什么?
    CAP

    5:目前有哪些分布式的最佳实践?
    不太清楚?

    6:分布式必备技术有哪些?
    RPC、MQ、各种集群存储系统、负载均衡、容器化部署
    展开
  • TH
    2018-03-15
    2
    耗子叔这篇文章简洁明了,但是在了解微服务的过程中仍有一些结合实际情况产生的疑问,希望能得到解答。
    1.服务化和分布式是什么关系?是否把单体应用拆成服务就意味着一定要分布式部署?
    2.包含本地操作和业务逻辑的桌面应用应当如何改造?把业务逻辑从本地客户端挪到服务端是不是会带来性能损失?
    3.在企业内部应用(用户都在同一个局域网)的情况下,使用分布式架构是否有必要?
    展开
  • 张向阳
    2017-12-10
    2
    微服务粒度怎么把握?什么东西可以被拆分出来独立为一个服务?有没有方法论可以遵循。期待老师能够分享
  • Michael
    2017-12-08
    2
    耗子哥 你好 一直就对分布式感兴趣 但是不知道该从哪里入手 要学的东西太多了。耗子哥能不能给个建议或者入手的地方
    展开
  • xzyline
    2017-12-08
    2
    服务的部署问题,需要按业务线,重要等级,服务性能,服务类型高cpu还是高io好多维度需要考虑。
    还有服务的负载均衡也不好处理。
    展开
  • yunfeng
    2017-12-07
    2
    既然分布式架构的难点和痛点在维护和运维,能否讲讲分布式架构下的如何维护好软件和运维呢
  • Silence
    2017-12-07
    2
    我们在分布式架构下开发时,当时遇到的问题主要是数据一致性的问题,就是有些时候必须采用分布式锁实现
  • 梁汉泉
    2017-12-07
    2
    15年,部署在阿里云服务,服务A访问服务B,因没有内网DNS以及阿里云的网络原因,流量走到公网又回来,延时秒级,更有甚者,服务B访问服务X也走的是公网,延时3s+…同样部署在AWS的服务在1秒内!
  • missa
    2018-03-20
    1
    目前比较流行的分布式,应该算是微服务了。难点是服务之间的管理,调度。
  • krugle
    2018-03-14
    1
    可不可以讲一些架构设计的基础,很多概念都不清楚,网上的概念也不统一

    作者回复: 后面有相应的设计模式系列

  • 秋天
    2018-03-08
    1
    对于一些关键名词加深啦理解,从理论层面有知道啦一些知识应用
  • A1
    2017-12-14
    1
    终于等到你详解分布式系统构建!
    展开