服务发现

服务化的普及，令软件系统得以通过分布于网络中不同机器的互相协作来复用功能

最早的服务发现可以直接依赖DNS将一个全限定名翻译为一至多个IP地址或者SRV等其他类型的记录便可

但进入微服务时代后，服务宕机上线下线变得更加频繁 DNS就力不从心了。

服务注册与发现的实现是随zk-eureka-nacos/consul这条线过来的

服务发现原理

sequenceDiagram    participant 服务消费者    participant 注册中心    participant 服务提供者    服务提供者 ->> 注册中心: 注册 (register)    服务提供者 ->> 注册中心: 续约 (renew)    服务提供者 ->> 注册中心: 下载 (cancel)    服务消费者 ->> 注册中心: 获取注册列表 (get registry)    服务消费者 ->> 服务提供者: 发起远程调用

自理式服务发现

自理式结构就是指每个微服务自己完成服务发现

应用层：服务直接与服务注册表交互

好处在于可以处理多平台部署问题，弊端则是需要为每种编程语言提供一个SDK。

代理式服务发现

平台层：使用基础设施来实现服务发现

平台路由器有单点故障风险和性能风险

服务发现共性设计

服务注册：服务通过某些形式将自己的坐标信息通知到服务注册中心
服务维护：服务发现框架必须能监控服务健康状况，及时剔除不健康的服务
服务发现：消费者可以通过框架将服务名转为具体的坐标

在真实系统中，服务发现中心是整个系统的基础架构如果它一挂整个系统就完全崩溃了所以必须进行高可用支持

sequenceDiagram    participant ServiceProvider1 as Service Provider    participant ServiceDiscovery1 as Service Discovery    participant ServiceDiscovery2 as Service Discovery    participant ServiceDiscovery3 as Service Discovery    participant ServiceConsumer1 as Service Consumer    ServiceProvider1 ->> ServiceDiscovery1: Register / Renew / Cancel    ServiceDiscovery1 ->> ServiceDiscovery2: Replicate    ServiceDiscovery2 ->> ServiceDiscovery3: Replicate    ServiceDiscovery1 ->> ServiceConsumer1: Discovery    ServiceConsumer1 ->> ServiceProvider1: Remote Call

服务发现中心有以Eureka的AP注册中心也有以Consul为代表的CP注册中心

当然也有AP CP随时转换的Nacos

AP在出现在系统出现网络分区也能继续对外提供服务不会影响系统操作的正确性场景下是十分有用的

服务注册中心的实现

在分布式KV存储中间件上开发自己的框架：zk，redis，etcd
基础设施实现：DNS
专用框架：Eureka Nacos等

AP实现

flowchart TD    subgraph 注册中心        服务注册["服务注册"]        消息回放["消息回放"]    end    subgraph 消息总线        接口1["接口: com.test.Order\n地址: 192.168.1.9:9080\n版本: 2019113589"]        接口2["接口: com.test.Hello\n地址: 192.168.1.2:9080\n版本: 2019103243"]        更多接口["......"]        旧版本接口["接口: com.test.Hello\n地址: 192.168.1.2:9080\n版本: 2019093143"]    end    服务注册 -->|生成注册消息| 接口1    服务注册 -->|生成注册消息| 接口2    服务注册 -->|生成注册消息| 更多接口    消息回放 -->|推拉结合 接受大于本地版本的消息 放弃小于本地版本的消息| 接口1    消息回放 -->|推拉结合 接受大于本地版本的消息 放弃小于本地版本的消息| 接口2    接口1 -->|先入先出\n版本递增| 接口1    接口2 -->|先入先出\n版本递增| 接口2

Eureka

Eureka是Netflix开发的服务发现框架,Eureka包含两个组件： Eureka Server和Eureka Client.

各个节点启动后，会在Eureka Server中进行注册，这样Eureka Server中的服务注册表中将会存储所有可用服务节点的信息

在应用启动后，将会向Eureka Server发送心跳,默认周期为30秒

保证AP，eureka在设计时优先保证可用性，每一个节点都是平等的，一部分节点挂掉不会影响到正常节点的工作，不会出现类似zk的选举leader的过程

sequenceDiagram    participant ApplicationClient as ApplicationClient    participant EurekaServer as EurekaServer    participant ApplicationService as ApplicationService    ApplicationService ->> EurekaServer: register    ApplicationService --) EurekaServer: renew    ApplicationClient ->> EurekaServer: 定期获取    ApplicationClient ->> ApplicationService: 调用服务

启动：

读取和 server 的交互配置信
读取自身的配置信息，封装
去 server 端拉取注册信息并缓存到本地
服务注册
启动 3 个定时任务

运行：

定时发送心跳到server端，维持租约
从server端拉取注册表信息，并更新本地缓存
监控自身变化，有变动再去注册

销毁：

把servery端自己的租约销毁掉

服务注册

获取读锁
在注册表查找instance info
租约是否存在
- 不存在：创建新租约
- 存在：判断最后更新时间
  - 如果更新时间比较大，则更新时间戳
  - 设置上线时间

服务续约

eureka:  instance:    lease-expiration-duration-in-seconds: 10 # 10秒即过期    lease-renewal-interval-in-seconds: 5 # 5秒一次心跳

接收服务心跳

flowchart TD    A[false]    B{查询租约}    C{是否为unknown}    D[取消租约]    E[更新时间]    F[统计每分钟续约次数，用于自我保护]    B -->|不存在| A    B -->|存在| C    C -->|是| D    C -->|否| E    E --> F

失效剔除与自我保护

失效剔除

有些时候，我们的服务实例并不一定会正常下线，可能由于内存溢出、网络故障等原因使得服务不能正常工作，而服务注册中心并未收到“服务下线”的请求。为了从服务表中将这些无法提供服务的实例剔除，Eureka Server 在启动的时候会创建一个定时任多默认每隔一一段时间(默认为60秒)将当前清单中超时(默认为90秒)没有续约的服务除出去

自我保护

默认情况下,EurekaClient会定时向EurekaServer端发送心跳，如果EurekaServer在一定时间内没有收到EurekaClient发送的心跳，便会把该实例从注册服务列表中剔除（默认是90秒）,为了防止只是EurekaClient与EurekaServer之间的网络故障，在短时间内丢失大量的实例心跳，这时候EurekaServer会开启自我保护机制，EurekaServer不会踢出这些服务

在开发中，由于会重复重启服务实例，所以经常会出现以下警告：

EMERGENCY!EUREKA MAY BE INCORRECTLY CLAIMING INSTANCES ARE UP WHEN THEY'RE NOT.RENEWALS ARE LESSER THAN THRESHOLD AND HENCE THE INSTANCES ARE NOT BEGING EXPIRED JUST TO BE SAFE.

所以开发时需要关闭自我保护

eureka:  server:    enable-self-preservation: false # 关闭自我保护模式（缺省为打开）    eviction-interval-timer-in-ms: 1000 # 扫描失效服务的间隔时间（缺省为60*1000ms）

服务下线

是否有租约
- 没有租约下线失败
- 否则从注册表中移除
- 设置下线时间
- 添加下线记录

Eureka集群

Eureka 满足AP 牺牲了 C

集群同步

zookeeper

保证CP，即任何时刻对zookeeper的访问请求能得到一致性的数据结果，同时系统对网络分割具备容错性，但是它不能保证每次服务的可用性

Nacos

服务发现和服务健康监测
动态配置服务
动态DNS服务
服务即其元数据管理

概念

地域物理的数据中心，资源创建成功后不能更换
可用区同一地域内，电力和网络互相独立的物理区域
接入点地域的某个服务的入口域名
[命名空间](/软件工程/微服务/服务治理/配置中心.html#自定义namespace)
配置
配置管理系统配置的编辑、存储、分发、变更管理、历史版本管理、变更审计等
配置项一个具体的可配置的参数与其值域，通常以 param-key=param-value 的形式存在
配置集一组相关或者不相关的配置项的集合
配置集ID
配置分组
配置快照 Nacos 的客户端 SDK 会在本地生成配置的快照类似于缓存
服务
服务名
服务注册中心
服务发现对服务下的实例的地址和元数据进行探测
元信息服务或者配置的描述信息
应用
服务分组
虚拟集群同一个服务下的所有服务实例组成一个默认集群
实例
权重
健康检查
健康保护阈值止因过多实例不健康导致流量全部流向健康实例

屏幕截图 2020-09-23 163728

架构

屏幕截图 2020-09-23 163102

vs Zookeeper & Eureka

不同点:

Zookeeper采用CP保证数据的一致性的问题
Eureka采用ap的设计理念架构注册中心，完全去中心化思想
Nacos.从1.0版本支持CP和AP混合模式集群，默认是采用Ap保证服务可用性，CP的形式底层集群raft协议保证数据的一致性的问题。

最主要的是Eureka集群中的各个节点是对等的，而Nacos则有主从之分