Hystrix熔断器、Feign客户端

2022年6月3日13:55:52

1 Hystrix熔断器

1.1 分布式系统面临的问题

1.1.1 服务雪崩

微服务中,服务间调用关系错综复杂,一个服务的业务,有可能需要调用多个其它微服务,才能完成。

如图,如果说,我们需要访问的某个服务,Dependency-I发生了故障,此时,我们应用中,调用Dependency-I的服务,也会故障,造成阻塞。

此时,其它业务似乎不受影响。

例如微服务I发生异常,请求阻塞,用户不会得到响应,则tomcat的这个线程不会释放,于是越来越多的用户请求到来,越来越多的线程会阻塞:

服务器支持的线程和并发数有限,请求一直阻塞,会导致服务器资源耗尽,从而导致所有其它服务都不可用,形成雪崩效应。

这就好比,一个汽车生产线,生产不同的汽车,需要使用不同的零件,如果某个零件因为种种原因无法使用,那么就会造成整台车无法装配,陷入等待零件的状态,直到零件到位,才能继续组装。 此时如果有很多个车型都需要这个零件,那么整个工厂都将陷入等待的状态,导致所有生产都陷入瘫痪。一个零件的波及范围不断扩大。

雪崩效应产生的几种场景:

  • **流量激增:**比如异常流量、用户重试导致系统负载升高;
  • 缓存刷新:假设A为client端,B为Server端,假设A系统请求都流向B系统,请求超出了B系统的承载能力,就会造成B系统崩溃;
  • **程序有Bug:**代码循环调用的逻辑问题,资源未释放引起的内存泄漏等问题;
  • 硬件故障:比如宕机,机房断电,光纤被挖断等。
  • 数据库严重瓶颈,比如:长事务、sql超时等。
  • 线程同步等待:系统间经常采用同步服务调用模式,核心服务和非核心服务共用一个线程池和消息队列。如果一个核心业务线程调用非核心线程,这个非核心线程交由第三方系统完成,当第三方系统本身出现问题,导致核心线程阻塞,一直处于等待状态,而进程间的调用是有超时限制的,最终这条线程将断掉,也可能引发雪崩;

1.1.2 雪崩解决方案

1.1.2.1 超时机制

通过网络请求其他服务时,都必须设置超时。正常情况下,一个远程调用一般在几十毫秒内就返回了。当依赖的服务不可用,或者因为网络问题,响应时间将会变得很长(几十秒)。而通常情况下,一次远程调用对应了一个线程/进程,如果响应太慢,那这个线程/进程就会得不到释放。而线程/进程都对应了系统资源,如果大量的线程/进程得不到释放,并且越积越多,服务资源就会被耗尽,从而导致资深服务不可用。所以必须为每个请求设置超时。

1.1.2.2 断路器模式

试想一下,家庭里如果没有断路器,电流过载了(例如功率过大、短路等),电路不断开,电路就会升温,甚至是烧断电路、起火。有了断路器之后,当电流过载时,会自动切断电路(跳闸),从而保护了整条电路与家庭的安全。当电流过载的问题被解决后,只要将关闭断路器,电路就又可以工作了。

同样的道理,当依赖的服务有大量超时时,再让新的请求去访问已经没有太大意义,只会无谓的消耗现有资源。譬如我们设置了超时时间为1秒,如果短时间内有大量的请求(譬如50个)在1秒内都得不到响应,就往往意味着异常。此时就没有必要让更多的请求去访问这个依赖了,我们应该使用断路器避免资源浪费。

断路器可以实现快速失败,如果它在一段时间内侦测到许多类似的错误(譬如超时),就会强迫其以后的多个调用快速失败,不再请求所依赖的服务,从而防止应用程序不断地尝试执行可能会失败的操作,这样应用程序可以继续执行而不用等待修正错误,或者浪费CPU时间去等待长时间的超时。断路器也可以使应用程序能够诊断错误是否已经修正,如果已经修正,应用程序会再次尝试调用操作。

断路器模式就像是那些容易导致错误的操作的一种代理。这种代理能够记录最近调用发生错误的次数,然后决定使用允许操作继续,或者立即返回错误。

1.2 Hystrix介绍

Hystix,英文意思是豪猪,全身是刺,看起来就不好惹,是一种保护机制。

Hystrix也是Netflix公司的一款组件。

  • Hystrix是一个用于处理分布式系统延迟和容错的开源库。分布式系统中,依赖避免不了调用失败,比如超时,异常等。Hystrix能保证在出现问题的时候,不会导致整体服务失败,避免级联故障,以提高分布式系统的弹性
  • Hystrix就类似于 “断路器” 本身是一种开关装置,当某个服务单元发生故障之后,通过断路器的故障监控(类似熔断保险丝),向调用方返回一个符合预期的、可处理的备选响应(FallBack),而不是长时间的等待或者抛出调用方无法处理的异常,这样就保证了服务调用方的线程不会被长时间、不必要地占用,从而避免了故障在分布式系统中的蔓延,乃至雪崩。

那么Hystix的作用是什么呢?具体要保护什么呢?

Hystrix主要的作用就是:服务的熔断、服务降级、服务限流、近实时监控。

Hystix是Netflix开源的一个延迟和容错库,用于隔离访问远程服务、第三方库,防止出现级联失败。

1.2.1 服务熔断

这种模式主要是参考电路熔断,如果一条线路电压过高,保险丝会熔断,防止火灾。放到我们的系统中,如果某个目标服务调用慢或者有大量超时,此时,熔断该服务的调用,对于后续调用请求,不在继续调用目标服务,直接返回,快速释放资源。如果目标服务情况好转则恢复调用。

  • 熔断机制的注解是==@HystrixCommand==

  • 熔断机制是应对雪崩效应的一种==链路保护机制==,一般存在于服务端

  • 当扇出链路的某个服务出现故障或响应超时,会进行==服务降级,进而熔断该节点的服务调用==,快速返回“错误”的相应信息。

  • Hystrix的熔断存在阈值,缺省是5秒内20次调用失败就会触发

1.2.2 线程隔离,服务降级

解读:

Hystrix为每个服务调用的功能分配一个小的线程池,如果线程池已满调用将被立即拒绝,默认不采用排队.加速失败判定时间。

用户的请求将不再直接访问服务,而是通过线程池中的空闲线程来访问服务,如果线程池已满,或者请求超时,则会进行降级处理:返回给用户一个错误提示或备选结果

用户的请求故障时,不会被阻塞,更不会无休止的等待或者看到系统崩溃,至少可以看到一个执行结果(例如返回友好的提示信息) 。

服务降级虽然会导致请求失败,但是不会导致阻塞,而且最多占用该服务的线程资源,不会导致整个容器资源耗尽,把故障的影响隔离在线程池内。

触发Hystrix服务降级的情况:

  • 线程池已满
  • 请求超时

1.3 Hystrix案例实现

线程隔离的完整步骤包括:

  1. 引入Hystrix的依赖
  2. 添加注解,开启Hystix功能
  3. 给业务编写降级的备用处理逻辑
  4. 给业务添加注解,开启线程隔离功能
  5. 设置触发降级的最长等待时间

现在,consumer-demo是服务的调用者,user-service是服务的提供者,因此consumer-demo需要把调用user-service的业务隔离,避免级联失败。

因此我们接下来的操作都是在consumer-demo中添加的。

1.3.1 引入依赖

在consumer-demo添加Hystix的依赖:

<dependency><groupId>org.springframework.cloud</groupId><artifactId>spring-cloud-starter-netflix-hystrix</artifactId></dependency>

1.3.2 开启熔断

在consumer-demo的启动类上添加注解:@EnableCircuitBreaker

@SpringBootApplication@EnableDiscoveryClient@EnableCircuitBreakerpublicclassConsumerApplication{// ...}

可以看到,我们类上的注解越来越多,在微服务中,经常会引入上面的三个注解,于是Spring就提供了一个组合注解:@SpringCloudApplication

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-ofgsjnlm-1607004108919)(assets/1533856086255.png)]

因此,我们可以使用这个组合注解来代替之前的3个注解。

@SpringCloudApplicationpublicclassConsumerDemoApplication{// ...}

1.3.3 编写降级逻辑

当目标服务的调用出现故障,我们希望快速失败,给用户一个友好提示。因此需要提前编写好失败时的降级处理逻辑,然后使用HystixCommond来指定降级的方法。

在consumer-demo的ConsumerController中调用user-service的方法上,添加降级逻辑:

@RestController@RequestMapping("consumer")publicclassConsumerController{@Autowired
    RestTemplate restTemplate;@GetMapping("{id}")@HystrixCommand(fallbackMethod="queryByIdFallBack")public MapqueryById(@PathVariable("id") String id){
        Map user= restTemplate.getForObject("http://user-service/user/"+id,Map.class);return user;}// 降级方法public MapqueryByIdFallBack(String id){
        Map user=newHashMap();
        user.put("msg","服务出现异常,请稍后重试");return user;}}

要注意,因为熔断的降级逻辑方法必须跟正常逻辑方法保证:相同的参数列表和返回值声明。失败逻辑中返回User对象没有太大意义,一般会返回友好提示。所以我们把queryById的方法改造为返回String,反正也是Json数据。这样失败逻辑中返回一个错误说明,会比较方便。

说明:

  • @HystrixCommand(fallbackMethod = "queryByIdFallBack"):用来声明一个降级逻辑的方法

1.3.4 测试

当user-service正常提供服务时,访问与以前一致。但是当我们将user-service停机时,会发现页面返回了降级处理信息:

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-mRjG8YHD-1607004108920)(assets/1606113612219.png)]

1.3.5 超时设置

在之前的案例中,请求在超过1秒后都会返回错误信息,这是因为Hystix的默认超时时长为1,我们可以通过配置修改这个值:

hystrix:command:default:execution.isolation.thread.timeoutInMilliseconds:2000

这个配置会作用于全局所有方法。

再次测试:

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-HoqpQFjb-1607004108922)(assets/image-20201105224159347.png)]

可以发现,请求的时长已经到了2.01s,证明配置生效了。

1.4 服务熔断

尽管隔离可以避免服务出现级联失败,但是对于访问**服务I(故障服务)**的其它服务,每次处理请求都要等待数秒直至fallback,显然是对系统资源的浪费。

因此,当Hystix判断一个依赖服务失败比例较高时,就会对其做熔断处理:拦截对故障服务的请求,快速失败,不再阻塞等待,就像电路的断路器断开了,保护电路。

1.4.1 熔断原理

熔断器,也叫断路器,其英文单词为:Circuit Breaker

状态机有3个状态:

  • Closed:关闭状态(断路器关闭),所有请求都正常访问。
  • Open:打开状态(断路器打开),所有请求都会被降级。Hystix会对请求情况计数,当一定时间内失败请求百分比达到阈值,则触发熔断,断路器打开。默认失败比例的阈值是50%,请求次数最少不低于20次
  • Half Open:半开状态,open状态不是永久的,打开后会进入休眠时间(默认是5S)。随后断路器会自动进入半开状态。此时会释放1次请求通过,若这个请求是健康的,则会关闭断路器,否则继续保持打开,再次进行5秒休眠计时。

1.4.2 动手实践

为了能够精确控制请求的成功或失败,我们在consumer的调用业务中加入一段逻辑:

@GetMapping("{id}")@HystrixCommand(fallbackMethod="queryByIdFallback")public UserqueryById(@PathVariable("id") String username){// Ribbon 地址调用是 IP和port 替换成 服务名称
        String url="http://user-service/user/"+username;if("itheima".equals(username)){thrownewRuntimeException("itheima");}


        User userMap= restTemplate.getForObject(url, User.class);
        System.out.println(userMap);return userMap;}

这样如果参数是id为itheima,一定失败,其它情况都成功。

我们准备两个请求窗口:

  • 一个请求:http://localhost:8080/consumer/itheima,注定失败
  • 一个请求:http://localhost:8080/consumer/itcast,肯定成功

熔断器的默认触发阈值是20次请求,不好触发。休眠时间时5秒,时间太短,不易观察,为了测试方便,我们可以通过配置修改熔断策略:

hystrix:
  command:
    default:
      execution.isolation.thread.timeoutInMilliseconds: 2000
      circuitBreaker:
        errorThresholdPercentage: 50 # 触发熔断错误比例阈值,默认值50%
        sleepWindowInMilliseconds: 10000 # 熔断后休眠时长,默认值5秒
        requestVolumeThreshold: 10 # 触发熔断的最小请求次数,默认20

解读:

  • requestVolumeThreshold:触发熔断的最小请求次数,默认20,这里我们设置为10,便于触发
  • errorThresholdPercentage:触发熔断的失败请求最小占比,默认50%
  • sleepWindowInMilliseconds:休眠时长,默认是5000毫秒,这里设置为10,便于观察熔断现象

当我们疯狂访问id为itheima的请求时(10次左右),就会触发熔断。断路器会进入打开状态,一切请求都会被降级处理。

此时你访问id为itcast的请求,会发现返回的也是失败,而且失败时间很短,只有20毫秒左右

2 Feign客户端

在前面的学习中,我们使用了Ribbon的负载均衡功能,大大简化了远程调用时的代码:

String baseUrl="http://user-service/user/";
User user=this.restTemplate.getForObject(baseUrl+ id, User.class)

如果就学到这里,你可能以后需要编写类似的大量重复代码,格式基本相同,无非参数不一样。有没有更优雅的方式,来对这些代码再次优化呢?

这就是我们接下来要学的Feign的功能了。

2.1 Feign简介

Feign是一个声明式的Http客户端,使用方法时定义一个接口并在上面添加注解即可。Feign支持可拔插式的编码器和解码器。Spring Cloud对Feign进行了封装,使其支持SpringMVC和HttpMessageConverters。Feign可以与Eureka和Ribbon组合使用以支持负载均衡。

Feign 是基于Ribbon负载均衡的实现,Feign对Ribbon进行了封装。

为什么叫伪装?可以把一个远程调用的请求,伪造的像一个本地方法调用一样。

Feign可以把Rest的请求进行隐藏,伪装成类似SpringMVC的Controller一样。你不用再自己拼接url,拼接参数等等操作,一切都交给Feign去做。

2.2 Feign快速入门

2.2.1 导入依赖

consumer_service工程中添加依赖

<dependency><groupId>org.springframework.cloud</groupId><artifactId>spring-cloud-starter-openfeign</artifactId></dependency>

2.2.2 Feign的客户端

创建接口

@FeignClient("user-service")publicinterfaceUserFeignApi{@GetMapping("/user/{id}")public MapfindById(@PathVariable("id") String username);}
  • 首先这是一个接口,Feign会通过动态代理,帮我们生成实现类。这点跟mybatis的mapper很像
  • @FeignClient,声明这是一个Feign客户端,同时通过value属性指定服务名称
  • 接口中的定义方法,完全采用SpringMVC的注解,Feign会根据注解帮我们生成URL,并访问获取结果

注意:我们需要将实体类独立出来,统一复用

在consumer工程中新建FeignController,使用userFeignApi访问:

@RestController@RequestMapping("consumer")publicclassConsumerController{@Autowired
    UserFeignApi userFeignApi;@GetMapping("{id}")public MapqueryById(@PathVariable("id") String id){return userFeignApi.findById(id);}}

2.2.3 开启Feign功能

我们在启动类上,添加注解,开启Feign功能

@SpringCloudApplication@EnableFeignClients// 开启Feign功能publicclassConsumerDemoApplication{publicstaticvoidmain(String[] args){
        SpringApplication.run(UserConsumerDemoApplication.class, args);}}
  • 你会发现RestTemplate的注册被我删除了。Feign中已经自动集成了Ribbon负载均衡,因此我们不需要自己定义RestTemplate了

2.2.4 启动测试

  1. 启动Eureka注册中心
  2. 启动服务提供方user-service
  3. 启动服务消费方consumer-demo

访问接口:http://localhost/consumer/itcast

2.3 负载均衡的支持

Feign中本身已经集成了Ribbon依赖和自动配置:

因此我们不需要额外引入依赖,也不需要再注册RestTemplate对象。

Fegin内置的ribbon默认设置了请求超时时长,默认是1000ms,我们可以通过手动配置来修改这个超时时长:

ribbon:ReadTimeout:2000# 读取超时时长ConnectTimeout:1000# 建立链接的超时时长

因为ribbon内部有重试机制,一旦超时,会自动重新发起请求。如果不希望重试,可以添加配置:

ribbon:ConnectTimeout:500# 连接超时时长ReadTimeout:1000# 数据通信超时时长MaxAutoRetriesNextServer:2# 切换重试多少次服务MaxAutoRetries:1# 当前服务器的重试次数OkToRetryOnAllOperations:false# 是否对所有的请求方式都重试

另外,Hystix的超时时间,应该比重试的总时间要大。

2.4 Feign集成Hystix

Feign默认也有对Hystix的集成:

只不过,默认情况下是关闭的。我们需要通过下面的参数来开启:

feign:hystrix:enabled:true# 开启Feign的熔断功能

但是,Feign中的Fallback配置不像Ribbon中那样简单了。

1)首先,我们要定义一个类,实现刚才编写的UserFeignClient,作为fallback的处理类

package com.itheima.consumer.client.fallback;import com.itheima.consumer.client.UserFeignApi;import org.springframework.stereotype.Component;import java.util.HashMap;import java.util.Map;@ComponentpublicclassUserFeignFallbackimplementsUserFeignApi{@Overridepublic MapfindById(String username){
        Map map=newHashMap();
        map.put("msg","对不起,网络出现异常请稍后重试");return map;}}

2)然后在UserFeignClient中,指定刚才编写的实现类

package com.itheima.consumer.client;import com.itheima.consumer.client.fallback.UserFeignFallback;import org.springframework.cloud.openfeign.FeignClient;import org.springframework.web.bind.annotation.GetMapping;import org.springframework.web.bind.annotation.PathVariable;import java.util.Map;@FeignClient(value="user-service",fallback= UserFeignFallback.class)publicinterfaceUserFeignApi{@GetMapping("/user/{id}")public MapfindById(@PathVariable("id") String username);}

3)重启测试:

我们关闭user-service服务,然后在页面访问

2.5 调试日志的设置

使用Feign的服务调用,关于路径拼接参数的设置都由Feign来帮我们完成,如果程序员需要查看调用过程中的信息,需要配置Feign的日志打印。@FeignClient注解修饰的客户端在被代理时,都会创建一个新的Fegin.Logger实例。我们需要额外指定这个日志的级别才可以。

1)设置com.itheima.sh包下的日志级别都为debug

logging:level:com.itheima.sh: debug

2)编写配置类,定义日志级别

@ConfigurationpublicclassFeignConfig{@Bean
    Logger.LevelfeignLoggerLevel(){return Logger.Level.FULL;}}

这里指定的Level级别是FULL,Feign支持4种级别:

  • NONE:不记录任何日志信息,这是默认值。
  • BASIC:仅记录请求的方法,URL以及响应状态码和执行时间
  • HEADERS:在BASIC的基础上,额外记录了请求和响应的头信息
  • FULL:记录所有请求和响应的明细,包括头信息、请求体、元数据。

3)重启项目,即可看到每次访问的日志

2.6 Feign的最佳实践

Feign的client接口现在是由消费者自己定义的。

那么如果消费者不止一个,每个消费者都需要去编写FeignClient接口,显然是对人力资源的浪费。

正确的做法应该是:

  • 定义一个独立的jar工程
  • 在该工程中,编写FeignClient接口及所需要的实体类
  • 任何消费者,只需要引入这个jar包就能直接使用。

创建service-api工程,引入Feign依赖

<dependencies><dependency><groupId>org.springframework.cloud</groupId><artifactId>spring-cloud-starter-openfeign</artifactId></dependency></dependencies>

Feign的自动配置类

package org.feign.autoconfiger;import feign.Logger;import org.springframework.cloud.openfeign.EnableFeignClients;import org.springframework.context.annotation.Bean;import org.springframework.context.annotation.ComponentScan;import org.springframework.context.annotation.Configuration;/**
 * Feign的自动配置类
 * @作者 itcast
 * @创建日期 2020/11/23 11:23
 **/@Configuration// 扫描FeignClient注解@EnableFeignClients(basePackages="org.feign")// 扫描Spring注解@ComponentScan(basePackages="org.feign")publicclassFeignConfiguration{@Beanpublic Logger.LevelloggerLevel(){// 定义feign的输出的日志级别return Logger.Level.FULL;}}

Feign接口定义

package org.feign.client;import org.feign.autoconfiger.FeignConfiguration;import org.feign.client.fallback.UserFeignFallback;import org.feign.pojo.User;import org.springframework.cloud.openfeign.FeignClient;import org.springframework.web.bind.annotation.GetMapping;import org.springframework.web.bind.annotation.PathVariable;@FeignClient(value="user-service",
             fallback= UserFeignFallback.class,
             configuration= FeignConfiguration.class)publicinterfaceUserFeignApi{@GetMapping("/user/{id}")public UserfindById(@PathVariable("id") String username);}

Feign服务降级

package org.feign.client.fallback;import org.feign.client.UserFeignApi;import org.feign.pojo.User;import org.springframework.stereotype.Component;@ComponentpublicclassUserFeignFallbackimplementsUserFeignApi{@Overridepublic UserfindById(String username){
        User user=newUser();
        user.setName("对不起,网络出现异常请稍后重试");return user;}}

spring.factories自动配置清单

# Auto Configure
org.springframework.boot.autoconfigure.EnableAutoConfiguration=\
org.feign.autoconfiger.FeignConfiguration

这样,消费者服务只要引入了这个配置,springboot的自动配置功能会让feign的配置生效,消费者可以直接使用Feign的服务接口进行使用,实现了服务接口的抽取。

consumer-demo 引入service-api依赖

<dependency><groupId>com.itheima</groupId><artifactId>service-api</artifactId><version>1.0-SNAPSHOT</version></dependency>

consumer-demo中的controller 可以直接使用Feign客户端接口

package com.itheima.consumer.controller;import org.feign.client.UserFeignApi;import org.feign.pojo.User;import org.springframework.beans.factory.annotation.Autowired;import org.springframework.web.bind.annotation.GetMapping;import org.springframework.web.bind.annotation.PathVariable;import org.springframework.web.bind.annotation.RequestMapping;import org.springframework.web.bind.annotation.RestController;import java.util.Map;@RestController@RequestMapping("consumer")publicclassConsumerController{@Autowired
    UserFeignApi userFeignApi;@GetMapping("{id}")public UserqueryById(@PathVariable("id") String id){return userFeignApi.findById(id);}}
  • 作者:LQJ灬
  • 原文链接:https://blog.csdn.net/qq_41656303/article/details/110580409
    更新时间:2022年6月3日13:55:52 ,共 12632 字。