2022年6月3日13:55:52

1 Hystrix熔断器

1.1 分布式系统面临的问题

1.1.1 服务雪崩

微服务中，服务间调用关系错综复杂，一个服务的业务，有可能需要调用多个其它微服务，才能完成。

如图，如果说，我们需要访问的某个服务，Dependency-I发生了故障，此时，我们应用中，调用Dependency-I的服务，也会故障，造成阻塞。

此时，其它业务似乎不受影响。

例如微服务I发生异常，请求阻塞，用户不会得到响应，则tomcat的这个线程不会释放，于是越来越多的用户请求到来，越来越多的线程会阻塞：

服务器支持的线程和并发数有限，请求一直阻塞，会导致服务器资源耗尽，从而导致所有其它服务都不可用，形成雪崩效应。

这就好比，一个汽车生产线，生产不同的汽车，需要使用不同的零件，如果某个零件因为种种原因无法使用，那么就会造成整台车无法装配，陷入等待零件的状态，直到零件到位，才能继续组装。此时如果有很多个车型都需要这个零件，那么整个工厂都将陷入等待的状态，导致所有生产都陷入瘫痪。一个零件的波及范围不断扩大。

雪崩效应产生的几种场景：

**流量激增：**比如异常流量、用户重试导致系统负载升高；
缓存刷新：假设A为client端，B为Server端，假设A系统请求都流向B系统，请求超出了B系统的承载能力，就会造成B系统崩溃；
**程序有Bug：**代码循环调用的逻辑问题，资源未释放引起的内存泄漏等问题；
硬件故障：比如宕机，机房断电，光纤被挖断等。
数据库严重瓶颈，比如：长事务、sql超时等。
线程同步等待：系统间经常采用同步服务调用模式，核心服务和非核心服务共用一个线程池和消息队列。如果一个核心业务线程调用非核心线程，这个非核心线程交由第三方系统完成，当第三方系统本身出现问题，导致核心线程阻塞，一直处于等待状态，而进程间的调用是有超时限制的，最终这条线程将断掉，也可能引发雪崩；

1.1.2 雪崩解决方案

1.1.2.1 超时机制

通过网络请求其他服务时，都必须设置超时。正常情况下，一个远程调用一般在几十毫秒内就返回了。当依赖的服务不可用，或者因为网络问题，响应时间将会变得很长（几十秒）。而通常情况下，一次远程调用对应了一个线程/进程，如果响应太慢，那这个线程/进程就会得不到释放。而线程/进程都对应了系统资源，如果大量的线程/进程得不到释放，并且越积越多，服务资源就会被耗尽，从而导致资深服务不可用。所以必须为每个请求设置超时。

1.1.2.2 断路器模式

试想一下，家庭里如果没有断路器，电流过载了（例如功率过大、短路等），电路不断开，电路就会升温，甚至是烧断电路、起火。有了断路器之后，当电流过载时，会自动切断电路（跳闸），从而保护了整条电路与家庭的安全。当电流过载的问题被解决后，只要将关闭断路器，电路就又可以工作了。

同样的道理，当依赖的服务有大量超时时，再让新的请求去访问已经没有太大意义，只会无谓的消耗现有资源。譬如我们设置了超时时间为1秒，如果短时间内有大量的请求（譬如50个）在1秒内都得不到响应，就往往意味着异常。此时就没有必要让更多的请求去访问这个依赖了，我们应该使用断路器避免资源浪费。

断路器可以实现快速失败，如果它在一段时间内侦测到许多类似的错误（譬如超时），就会强迫其以后的多个调用快速失败，不再请求所依赖的服务，从而防止应用程序不断地尝试执行可能会失败的操作，这样应用程序可以继续执行而不用等待修正错误，或者浪费CPU时间去等待长时间的超时。断路器也可以使应用程序能够诊断错误是否已经修正，如果已经修正，应用程序会再次尝试调用操作。

断路器模式就像是那些容易导致错误的操作的一种代理。这种代理能够记录最近调用发生错误的次数，然后决定使用允许操作继续，或者立即返回错误。

1.2 Hystrix介绍

Hystix,英文意思是豪猪，全身是刺，看起来就不好惹，是一种保护机制。

Hystrix也是Netflix公司的一款组件。

Hystrix是一个用于处理分布式系统延迟和容错的开源库。分布式系统中，依赖避免不了调用失败，比如超时，异常等。Hystrix能保证在出现问题的时候，不会导致整体服务失败，避免级联故障，以提高分布式系统的弹性。
Hystrix就类似于 “断路器” 本身是一种开关装置，当某个服务单元发生故障之后，通过断路器的故障监控（类似熔断保险丝），向调用方返回一个符合预期的、可处理的备选响应（FallBack），而不是长时间的等待或者抛出调用方无法处理的异常，这样就保证了服务调用方的线程不会被长时间、不必要地占用，从而避免了故障在分布式系统中的蔓延，乃至雪崩。

那么Hystix的作用是什么呢？具体要保护什么呢？

Hystrix主要的作用就是：服务的熔断、服务降级、服务限流、近实时监控。

Hystix是Netflix开源的一个延迟和容错库，用于隔离访问远程服务、第三方库，防止出现级联失败。

1.2.1 服务熔断

这种模式主要是参考电路熔断，如果一条线路电压过高，保险丝会熔断，防止火灾。放到我们的系统中，如果某个目标服务调用慢或者有大量超时，此时，熔断该服务的调用，对于后续调用请求，不在继续调用目标服务，直接返回，快速释放资源。如果目标服务情况好转则恢复调用。

熔断机制的注解是==@HystrixCommand==
熔断机制是应对雪崩效应的一种==链路保护机制==，一般存在于服务端
当扇出链路的某个服务出现故障或响应超时，会进行==服务降级，进而熔断该节点的服务调用==，快速返回“错误”的相应信息。
Hystrix的熔断存在阈值，缺省是5秒内20次调用失败就会触发

1.2.2 线程隔离，服务降级

解读：

Hystrix为每个服务调用的功能分配一个小的线程池，如果线程池已满调用将被立即拒绝，默认不采用排队.加速失败判定时间。

用户的请求将不再直接访问服务，而是通过线程池中的空闲线程来访问服务，如果线程池已满，或者请求超时，则会进行降级处理：返回给用户一个错误提示或备选结果。

用户的请求故障时，不会被阻塞，更不会无休止的等待或者看到系统崩溃，至少可以看到一个执行结果（例如返回友好的提示信息）。

服务降级虽然会导致请求失败，但是不会导致阻塞，而且最多占用该服务的线程资源，不会导致整个容器资源耗尽，把故障的影响隔离在线程池内。

触发Hystrix服务降级的情况：

线程池已满
请求超时

1.3 Hystrix案例实现

线程隔离的完整步骤包括：

引入Hystrix的依赖
添加注解，开启Hystix功能
给业务编写降级的备用处理逻辑
给业务添加注解，开启线程隔离功能
设置触发降级的最长等待时间

现在，consumer-demo是服务的调用者，user-service是服务的提供者，因此consumer-demo需要把调用user-service的业务隔离，避免级联失败。

因此我们接下来的操作都是在consumer-demo中添加的。

1.3.1 引入依赖

在consumer-demo添加Hystix的依赖：

<dependency><groupId>org.springframework.cloud</groupId><artifactId>spring-cloud-starter-netflix-hystrix</artifactId></dependency>

1.3.2 开启熔断

在consumer-demo的启动类上添加注解：@EnableCircuitBreaker

@SpringBootApplication@EnableDiscoveryClient@EnableCircuitBreakerpublicclassConsumerApplication{// ...}

可以看到，我们类上的注解越来越多，在微服务中，经常会引入上面的三个注解，于是Spring就提供了一个组合注解：@SpringCloudApplication

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-ofgsjnlm-1607004108919)(assets/1533856086255.png)]

因此，我们可以使用这个组合注解来代替之前的3个注解。

@SpringCloudApplicationpublicclassConsumerDemoApplication{// ...}

1.3.3 编写降级逻辑

当目标服务的调用出现故障，我们希望快速失败，给用户一个友好提示。因此需要提前编写好失败时的降级处理逻辑，然后使用HystixCommond来指定降级的方法。

在consumer-demo的ConsumerController中调用user-service的方法上，添加降级逻辑：

@RestController@RequestMapping("consumer")publicclassConsumerController{@Autowired
    RestTemplate restTemplate;@GetMapping("{id}")@HystrixCommand(fallbackMethod="queryByIdFallBack")public MapqueryById(@PathVariable("id") String id){
        Map user= restTemplate.getForObject("http://user-service/user/"+id,Map.class);return user;}// 降级方法public MapqueryByIdFallBack(String id){
        Map user=newHashMap();
        user.put("msg","服务出现异常，请稍后重试");return user;}}

要注意，因为熔断的降级逻辑方法必须跟正常逻辑方法保证：相同的参数列表和返回值声明。失败逻辑中返回User对象没有太大意义，一般会返回友好提示。所以我们把queryById的方法改造为返回String，反正也是Json数据。这样失败逻辑中返回一个错误说明，会比较方便。

说明：

@HystrixCommand(fallbackMethod = "queryByIdFallBack")：用来声明一个降级逻辑的方法

1.3.4 测试

当user-service正常提供服务时，访问与以前一致。但是当我们将user-service停机时，会发现页面返回了降级处理信息：

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-mRjG8YHD-1607004108920)(assets/1606113612219.png)]

1.3.5 超时设置

在之前的案例中，请求在超过1秒后都会返回错误信息，这是因为Hystix的默认超时时长为1，我们可以通过配置修改这个值：

hystrix:command:default:execution.isolation.thread.timeoutInMilliseconds:2000

这个配置会作用于全局所有方法。

再次测试：

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-HoqpQFjb-1607004108922)(assets/image-20201105224159347.png)]

可以发现，请求的时长已经到了2.01s，证明配置生效了。

1.4 服务熔断

尽管隔离可以避免服务出现级联失败，但是对于访问**服务I（故障服务）**的其它服务，每次处理请求都要等待数秒直至fallback，显然是对系统资源的浪费。

因此，当Hystix判断一个依赖服务失败比例较高时，就会对其做熔断处理：拦截对故障服务的请求，快速失败，不再阻塞等待，就像电路的断路器断开了，保护电路。

1.4.1 熔断原理

熔断器，也叫断路器，其英文单词为：Circuit Breaker

状态机有3个状态：

Closed：关闭状态（断路器关闭），所有请求都正常访问。
Open：打开状态（断路器打开），所有请求都会被降级。Hystix会对请求情况计数，当一定时间内失败请求百分比达到阈值，则触发熔断，断路器打开。默认失败比例的阈值是50%，请求次数最少不低于20次。
Half Open：半开状态，open状态不是永久的，打开后会进入休眠时间（默认是5S）。随后断路器会自动进入半开状态。此时会释放1次请求通过，若这个请求是健康的，则会关闭断路器，否则继续保持打开，再次进行5秒休眠计时。

1.4.2 动手实践

为了能够精确控制请求的成功或失败，我们在consumer的调用业务中加入一段逻辑：

@GetMapping("{id}")@HystrixCommand(fallbackMethod="queryByIdFallback")public UserqueryById(@PathVariable("id") String username){// Ribbon 地址调用是 IP和port 替换成 服务名称
        String url="http://user-service/user/"+username;if("itheima".equals(username)){thrownewRuntimeException("itheima");}


        User userMap= restTemplate.getForObject(url, User.class);
        System.out.println(userMap);return userMap;}

这样如果参数是id为itheima，一定失败，其它情况都成功。

我们准备两个请求窗口：

一个请求：http://localhost:8080/consumer/itheima，注定失败
一个请求：http://localhost:8080/consumer/itcast，肯定成功

熔断器的默认触发阈值是20次请求，不好触发。休眠时间时5秒，时间太短，不易观察，为了测试方便，我们可以通过配置修改熔断策略：

hystrix:
  command:
    default:
      execution.isolation.thread.timeoutInMilliseconds: 2000
      circuitBreaker:
        errorThresholdPercentage: 50 # 触发熔断错误比例阈值，默认值50%
        sleepWindowInMilliseconds: 10000 # 熔断后休眠时长，默认值5秒
        requestVolumeThreshold: 10 # 触发熔断的最小请求次数，默认20

解读：

requestVolumeThreshold：触发熔断的最小请求次数，默认20，这里我们设置为10，便于触发
errorThresholdPercentage：触发熔断的失败请求最小占比，默认50%
sleepWindowInMilliseconds：休眠时长，默认是5000毫秒，这里设置为10，便于观察熔断现象

当我们疯狂访问id为itheima的请求时（10次左右），就会触发熔断。断路器会进入打开状态，一切请求都会被降级处理。

此时你访问id为itcast的请求，会发现返回的也是失败，而且失败时间很短，只有20毫秒左右

2 Feign客户端

在前面的学习中，我们使用了Ribbon的负载均衡功能，大大简化了远程调用时的代码：

String baseUrl="http://user-service/user/";
User user=this.restTemplate.getForObject(baseUrl+ id, User.class)

如果就学到这里，你可能以后需要编写类似的大量重复代码，格式基本相同，无非参数不一样。有没有更优雅的方式，来对这些代码再次优化呢？

这就是我们接下来要学的Feign的功能了。

2.1 Feign简介

Feign是一个声明式的Http客户端，使用方法时定义一个接口并在上面添加注解即可。Feign支持可拔插式的编码器和解码器。Spring Cloud对Feign进行了封装，使其支持SpringMVC和HttpMessageConverters。Feign可以与Eureka和Ribbon组合使用以支持负载均衡。

Feign 是基于Ribbon负载均衡的实现，Feign对Ribbon进行了封装。

为什么叫伪装？可以把一个远程调用的请求，伪造的像一个本地方法调用一样。

Feign可以把Rest的请求进行隐藏，伪装成类似SpringMVC的Controller一样。你不用再自己拼接url，拼接参数等等操作，一切都交给Feign去做。

2.2 Feign快速入门

2.2.1 导入依赖

在consumer_service工程中添加依赖

<dependency><groupId>org.springframework.cloud</groupId><artifactId>spring-cloud-starter-openfeign</artifactId></dependency>

2.2.2 Feign的客户端

创建接口

@FeignClient("user-service")publicinterfaceUserFeignApi{@GetMapping("/user/{id}")public MapfindById(@PathVariable("id") String username);}

首先这是一个接口，Feign会通过动态代理，帮我们生成实现类。这点跟mybatis的mapper很像
@FeignClient，声明这是一个Feign客户端，同时通过value属性指定服务名称
接口中的定义方法，完全采用SpringMVC的注解，Feign会根据注解帮我们生成URL，并访问获取结果

注意：我们需要将实体类独立出来，统一复用

在consumer工程中新建FeignController，使用userFeignApi访问：

@RestController@RequestMapping("consumer")publicclassConsumerController{@Autowired
    UserFeignApi userFeignApi;@GetMapping("{id}")public MapqueryById(@PathVariable("id") String id){return userFeignApi.findById(id);}}

2.2.3 开启Feign功能

我们在启动类上，添加注解，开启Feign功能

@SpringCloudApplication@EnableFeignClients// 开启Feign功能publicclassConsumerDemoApplication{publicstaticvoidmain(String[] args){
        SpringApplication.run(UserConsumerDemoApplication.class, args);}}

你会发现RestTemplate的注册被我删除了。Feign中已经自动集成了Ribbon负载均衡，因此我们不需要自己定义RestTemplate了

2.2.4 启动测试

启动Eureka注册中心
启动服务提供方user-service
启动服务消费方consumer-demo

访问接口：http://localhost/consumer/itcast

2.3 负载均衡的支持

Feign中本身已经集成了Ribbon依赖和自动配置：

因此我们不需要额外引入依赖，也不需要再注册RestTemplate对象。

Fegin内置的ribbon默认设置了请求超时时长，默认是1000ms，我们可以通过手动配置来修改这个超时时长：

ribbon:ReadTimeout:2000# 读取超时时长ConnectTimeout:1000# 建立链接的超时时长

因为ribbon内部有重试机制，一旦超时，会自动重新发起请求。如果不希望重试，可以添加配置：

ribbon:ConnectTimeout:500# 连接超时时长ReadTimeout:1000# 数据通信超时时长MaxAutoRetriesNextServer:2# 切换重试多少次服务MaxAutoRetries:1# 当前服务器的重试次数OkToRetryOnAllOperations:false# 是否对所有的请求方式都重试

另外，Hystix的超时时间，应该比重试的总时间要大。

2.4 Feign集成Hystix

Feign默认也有对Hystix的集成：

只不过，默认情况下是关闭的。我们需要通过下面的参数来开启：

feign:hystrix:enabled:true# 开启Feign的熔断功能

但是，Feign中的Fallback配置不像Ribbon中那样简单了。

1）首先，我们要定义一个类，实现刚才编写的UserFeignClient，作为fallback的处理类

package com.itheima.consumer.client.fallback;import com.itheima.consumer.client.UserFeignApi;import org.springframework.stereotype.Component;import java.util.HashMap;import java.util.Map;@ComponentpublicclassUserFeignFallbackimplementsUserFeignApi{@Overridepublic MapfindById(String username){
        Map map=newHashMap();
        map.put("msg","对不起，网络出现异常请稍后重试");return map;}}

2）然后在UserFeignClient中，指定刚才编写的实现类

package com.itheima.consumer.client;import com.itheima.consumer.client.fallback.UserFeignFallback;import org.springframework.cloud.openfeign.FeignClient;import org.springframework.web.bind.annotation.GetMapping;import org.springframework.web.bind.annotation.PathVariable;import java.util.Map;@FeignClient(value="user-service",fallback= UserFeignFallback.class)publicinterfaceUserFeignApi{@GetMapping("/user/{id}")public MapfindById(@PathVariable("id") String username);}

3）重启测试：

我们关闭user-service服务，然后在页面访问

2.5 调试日志的设置

使用Feign的服务调用，关于路径拼接参数的设置都由Feign来帮我们完成，如果程序员需要查看调用过程中的信息，需要配置Feign的日志打印。@FeignClient注解修饰的客户端在被代理时，都会创建一个新的Fegin.Logger实例。我们需要额外指定这个日志的级别才可以。

1）设置com.itheima.sh包下的日志级别都为debug

logging:level:com.itheima.sh: debug

2）编写配置类，定义日志级别

@ConfigurationpublicclassFeignConfig{@Bean
    Logger.LevelfeignLoggerLevel(){return Logger.Level.FULL;}}

这里指定的Level级别是FULL，Feign支持4种级别：

NONE：不记录任何日志信息，这是默认值。
BASIC：仅记录请求的方法，URL以及响应状态码和执行时间
HEADERS：在BASIC的基础上，额外记录了请求和响应的头信息
FULL：记录所有请求和响应的明细，包括头信息、请求体、元数据。

3）重启项目，即可看到每次访问的日志

2.6 Feign的最佳实践

Feign的client接口现在是由消费者自己定义的。

那么如果消费者不止一个，每个消费者都需要去编写FeignClient接口，显然是对人力资源的浪费。

正确的做法应该是：

定义一个独立的jar工程
在该工程中，编写FeignClient接口及所需要的实体类
任何消费者，只需要引入这个jar包就能直接使用。

创建service-api工程,引入Feign依赖

<dependencies><dependency><groupId>org.springframework.cloud</groupId><artifactId>spring-cloud-starter-openfeign</artifactId></dependency></dependencies>

Feign的自动配置类

package org.feign.autoconfiger;import feign.Logger;import org.springframework.cloud.openfeign.EnableFeignClients;import org.springframework.context.annotation.Bean;import org.springframework.context.annotation.ComponentScan;import org.springframework.context.annotation.Configuration;/**
 * Feign的自动配置类
 * @作者 itcast
 * @创建日期 2020/11/23 11:23
 **/@Configuration// 扫描FeignClient注解@EnableFeignClients(basePackages="org.feign")// 扫描Spring注解@ComponentScan(basePackages="org.feign")publicclassFeignConfiguration{@Beanpublic Logger.LevelloggerLevel(){// 定义feign的输出的日志级别return Logger.Level.FULL;}}

Feign接口定义

package org.feign.client;import org.feign.autoconfiger.FeignConfiguration;import org.feign.client.fallback.UserFeignFallback;import org.feign.pojo.User;import org.springframework.cloud.openfeign.FeignClient;import org.springframework.web.bind.annotation.GetMapping;import org.springframework.web.bind.annotation.PathVariable;@FeignClient(value="user-service",
             fallback= UserFeignFallback.class,
             configuration= FeignConfiguration.class)publicinterfaceUserFeignApi{@GetMapping("/user/{id}")public UserfindById(@PathVariable("id") String username);}

Feign服务降级

package org.feign.client.fallback;import org.feign.client.UserFeignApi;import org.feign.pojo.User;import org.springframework.stereotype.Component;@ComponentpublicclassUserFeignFallbackimplementsUserFeignApi{@Overridepublic UserfindById(String username){
        User user=newUser();
        user.setName("对不起，网络出现异常请稍后重试");return user;}}

spring.factories自动配置清单

# Auto Configure
org.springframework.boot.autoconfigure.EnableAutoConfiguration=\
org.feign.autoconfiger.FeignConfiguration

这样，消费者服务只要引入了这个配置，springboot的自动配置功能会让feign的配置生效，消费者可以直接使用Feign的服务接口进行使用,实现了服务接口的抽取。

consumer-demo 引入service-api依赖

<dependency><groupId>com.itheima</groupId><artifactId>service-api</artifactId><version>1.0-SNAPSHOT</version></dependency>

consumer-demo中的controller 可以直接使用Feign客户端接口

package com.itheima.consumer.controller;import org.feign.client.UserFeignApi;import org.feign.pojo.User;import org.springframework.beans.factory.annotation.Autowired;import org.springframework.web.bind.annotation.GetMapping;import org.springframework.web.bind.annotation.PathVariable;import org.springframework.web.bind.annotation.RequestMapping;import org.springframework.web.bind.annotation.RestController;import java.util.Map;@RestController@RequestMapping("consumer")publicclassConsumerController{@Autowired
    UserFeignApi userFeignApi;@GetMapping("{id}")public UserqueryById(@PathVariable("id") String id){return userFeignApi.findById(id);}}

Hystrix熔断器、Feign客户端

1 Hystrix熔断器

1.1 分布式系统面临的问题

1.1.1 服务雪崩

1.1.2 雪崩解决方案

1.1.2.1 超时机制

1.1.2.2 断路器模式

1.2 Hystrix介绍

1.2.1 服务熔断

1.2.2 线程隔离，服务降级

1.3 Hystrix案例实现

1.3.1 引入依赖

1.3.2 开启熔断

1.3.3 编写降级逻辑

1.3.4 测试

1.3.5 超时设置

1.4 服务熔断

1.4.1 熔断原理

1.4.2 动手实践

2 Feign客户端

2.1 Feign简介

2.2 Feign快速入门

2.2.1 导入依赖

2.2.2 Feign的客户端

2.2.3 开启Feign功能

2.2.4 启动测试

2.3 负载均衡的支持

2.4 Feign集成Hystix

2.5 调试日志的设置

2.6 Feign的最佳实践

热门文章

1 Hystrix熔断器

1.1 分布式系统面临的问题

1.1.1 服务雪崩

1.1.2 雪崩解决方案

1.1.2.1 超时机制

1.1.2.2 断路器模式

1.2 Hystrix介绍

1.2.1 服务熔断

1.2.2 线程隔离，服务降级

1.3 Hystrix案例实现

1.3.1 引入依赖

1.3.2 开启熔断

1.3.3 编写降级逻辑

1.3.4 测试

1.3.5 超时设置

1.4 服务熔断

1.4.1 熔断原理

1.4.2 动手实践

2 Feign客户端

2.1 Feign简介

2.2 Feign快速入门

2.2.1 导入依赖

2.2.2 Feign的客户端

2.2.3 开启Feign功能

2.2.4 启动测试

2.3 负载均衡的支持

2.4 Feign集成Hystix

2.5 调试日志的设置

2.6 Feign的最佳实践

热门文章

登录 找回密码

登录找回密码