多个消费者订阅一个Kafka的Topic(使用KafkaConsumer和KafkaProducer)_网站优化分享

相关推荐recommended

多个消费者订阅一个Kafka的Topic(使用KafkaConsumer和KafkaProducer)

作者：mmseoamin日期：2024-01-18

记录：466

场景：一个KafkaProducer在一个Topic发布消息，多个消费者KafkaConsumer订阅Kafka的Topic。每个KafkaConsumer指定一个特定的ConsumerGroup，达到一条消息被多个不同的ConsumerGroup消费。

版本：JDK 1.8,Spring Boot 2.6.3,kafka_2.12-2.8.0,kafka-clients-3.0.0。

Kafka集群安装：https://blog.csdn.net/zhangbeizhen18/article/details/131156084

1.基础概念

Topic：Kafka根据Topic对消息进行归类，发布到Kafka的每条消息都需要指定一个Topic。

Producer：消息生产者，向Broker发送消息的客户端。

Consumer：消息消费者，从Broker读取消息的客户端。

ConsumerGroup：每个Consumer属于一个特定的ConsumerGroup，一条消息可以被多个不同的ConsumerGroup消费；但是一个ConsumerGroup中只能有一个Consumer能够消费该消息。

publish：发布，使用Producer向Kafka写入数据。

subscribe：订阅，使用Consumer从Kafka读取数据。

2.微服务中配置Kafka信息

2.1在pom.xml添加依赖

pom.xml文件：


  org.apache.kafka
  kafka-clients
  3.0.0

解析：使用原生的kafka-clients，版本：3.0.0。操作kafka集群的Topic。

3.配置Kafka生产者和消费者

使用原生的kafka-clients，需配置KafkaProducer和KafkaConsumer，把Kafka集群的配置信息注入到这两个对象，便可以操作了生产者和消费者。

配置细节在官网的configuration：https://kafka.apache.org/documentation/

3.1配置KafkaProducer生产者

(1)示例代码

@Configuration
public class KafkaClusterConfig {
  @Bean
  public KafkaProducer kafkaProducer() {
      Map configs = new HashMap<>();
      //kafka集群
      Collection cluster = Lists.newArrayList("192.168.19.161:29092",
              "192.168.19.162:29092",
              "192.168.19.163:29092");
      configs.put("bootstrap.servers", cluster);
      //客户端发送服务端失败的重试次数
      configs.put("retries", 2);
      //多个记录被发送到同一个分区时,生产者将尝试将记录一起批处理成更少的请求.
      //此设置有助于提高客户端和服务器的性能,配置控制默认批量大小(以字节为单位)
      configs.put("batch.size", 16384);
      //生产者可用于缓冲等待发送到服务器的记录的总内存字节数(以字节为单位)
      configs.put("buffer-memory", 33554432);
      //生产者producer要求leader节点在考虑完成请求之前收到的确认数,用于控制发送记录在服务端的持久化
      //acks=0,设置为0,则生产者producer将不会等待来自服务器的任何确认.该记录将立即添加到套接字(socket)缓冲区并视为已发送.在这种情况下,无法保证服务器已收到记录,并且重试配置(retries)将不会生效(因为客户端通常不会知道任何故障),每条记录返回的偏移量始终设置为-1.
      //acks=1,设置为1,leader节点会把记录写入本地日志,不需要等待所有follower节点完全确认就会立即应答producer.在这种情况下,在follower节点复制前,leader节点确认记录后立即失败的话,记录将会丢失.
      //acks=all,acks=-1,leader节点将等待所有同步复制副本完成再确认记录,这保证了只要至少有一个同步复制副本存活,记录就不会丢失.
      configs.put("acks", "-1");
      //指定key使用的序列化类
      Serializer keySerializer = new StringSerializer();
      //指定value使用的序列化类
      Serializer valueSerializer = new StringSerializer();
      //创建Kafka生产者
      KafkaProducer kafkaProducer = new KafkaProducer(configs, keySerializer, valueSerializer);
      return kafkaProducer;
  }
}

(2)解析代码

把Kafka的配置信息注入到KafkaProducer，并创建KafkaProducer对象。

使用@Configuration和@Bean注解把KafkaProducer对象注入到Spring的IOC容器，在Spring环境就可以使用KafkaProducer了。

KafkaProducer的底层使用配置类是ProducerConfig，在配置时可以参考。

全称：org.apache.kafka.clients.producer.ProducerConfig。

3.2配置KafkaConsumer的公用配置信息

(1)示例代码

@Configuration
public class KafkaClusterConfig {
  @Bean("consumerConfig")
  public Map consumerConfigs() {
    Map configs = new HashMap<>();
    //kafka集群
    Collection cluster = Lists.newArrayList("192.168.19.161:29092",
            "192.168.19.162:29092",
            "192.168.19.163:29092");
    configs.put("bootstrap.servers", cluster);
    //开启consumer的偏移量(offset)自动提交到Kafka
    configs.put("enable.auto.commit", true);
    //consumer的偏移量(offset) 自动提交的时间间隔,单位毫秒
    configs.put("auto.commit.interval", 5000);
    //在Kafka中没有初始化偏移量或者当前偏移量不存在情况
    //earliest, 在偏移量无效的情况下, 自动重置为最早的偏移量
    //latest, 在偏移量无效的情况下, 自动重置为最新的偏移量
    //none, 在偏移量无效的情况下, 抛出异常.
    configs.put("auto.offset.reset", "latest");
    //请求阻塞的最大时间(毫秒)
    configs.put("fetch.max.wait", 500);
    //请求应答的最小字节数
    configs.put("fetch.min.size", 1);
    //心跳间隔时间(毫秒)
    configs.put("heartbeat-interval", 3000);
    //一次调用poll返回的最大记录条数
    configs.put("max.poll.records", 500);
    return configs;
  }
  @Bean("keyDeserializer")
  public Deserializer consumerKeyDeserializer() {
    //指定key使用的反序列化类
    Deserializer keyDeserializer = new StringDeserializer();
    return keyDeserializer;
  }
  @Bean("valueDeserializer")
  public Deserializer consumerValueDeserializer() {
    //指定value使用的反序列化类
    Deserializer valueDeserializer = new StringDeserializer();
    return valueDeserializer;
  }
}

(2)解析代码

配置消费者KafkaConsumer公用配置信息：@Bean("consumerConfig")、 @Bean("keyDeserializer")、 @Bean("valueDeserializer")。

在创建KafkaConsumer时，只需获取公用consumerConfig、keyDeserializer、valueDeserializer设置到KafkaConsumer。

4.生产者(ZhejiangProvinceProducerController)

(1)示例代码

@RestController
@RequestMapping("/hub/example/province/producer")
@Slf4j
public class ZhejiangProvinceProducerController {
  //1.注入Kafka生产者
  @Autowired
  private KafkaProducer kafkaProducer;
  //2.定义Kafka的Topic
  private final String topicName = "hub-topic-province-notice";
  @GetMapping("/f01_1")
  public Object f01_1(String msgContent) {
    try {
        //3.获取业务数据
        String uuid = UUID.randomUUID().toString().replace("-", "");
        long now = System.currentTimeMillis();
        String msgKey = "province" + ":" + uuid + ":" + now;
        MsgDto msgDto = MsgDto.buildDto(uuid, now, msgContent);
        String msgData = JSONObject.toJSONString(msgDto);
        log.info("ZhejiangProvince生产者向Kafka集群的Topic: {},写入Key:", topicName);
        log.info(msgKey);
        log.info("ZhejiangProvince生产者向Kafka集群的Topic: {},写入Data:", topicName);
        log.info(msgData);
        //4.使用KafkaProducer向Kafka集群写入数据
        ProducerRecord producerRecord = new ProducerRecord<>(topicName, msgKey, msgData);
        kafkaProducer.send(producerRecord);
    } catch (Exception e) {
        log.info("ZhejiangProvince生产者写入Topic异常.");
        e.printStackTrace();
    }
    return "写入成功";
  }
}

(2)解析代码

使用KafkaProducer 向Kafka集群的Topic：hub-topic-province-notice写入JSON字符串数据，发布一条消息，给订阅的消费者消费。

5.消费者一(HangzhouCityConsumer)

(1)示例代码

@Component
@Slf4j
public class HangzhouCityConsumer implements CommandLineRunner {
  //1.注入消费者配置信息,key和value的序列化对象
  @Autowired
  private Deserializer keyDeserializer;
  @Autowired
  private Deserializer valueDeserializer;
  //2.定义Kafka的Topic
  private final String topicName = "hub-topic-province-notice";
  @Override
  public void run(String... args) throws Exception {
      //3.创建线程并传入线程任务执行的Runnable
      Thread thread = new Thread(new HangzhouCityConsumer.ThreadRunnable());
      //4.启动线程
      thread.start();
  }
  //在线程中使用KafkaConsumer实时监听Kafka集群的Topic
  public class ThreadRunnable implements Runnable {
      @Override
      public void run() {
          log.info("HangzhouCityConsumer启动线程监听Kafka集群的Topic: {}", topicName);
          Collection topics = Lists.newArrayList(topicName);
          //1.指定消费组(一条消息可以被多个不同的ConsumerGroup消费)
          Map configs = new HashMap<>();
          Map consumerConfig = SpringUtil.getBean("consumerConfig");
          configs.putAll(consumerConfig);
          configs.put("group.id", "hub-topic-province-notice-group-hangzhou");
          //2.创建Kafka消费者(传入消费者配置和key和value的序列化对象)
          KafkaConsumer kafkaConsumer = new KafkaConsumer(configs, keyDeserializer, valueDeserializer);
          //3.订阅Kafka的Topic
          kafkaConsumer.subscribe(topics);
          while (true) {
              //4.使用KafkaConsumer的poll按照指定周期轮询Kafka集群指定Topic的消息
              ConsumerRecords consumerRecords = kafkaConsumer.poll(Duration.ofMillis(1000));
              //5.遍历从Kafka集群中读取数据集ConsumerRecords
              for (ConsumerRecord consumerRecord : consumerRecords) {
                  //6.从ConsumerRecord中取出消费数据
                  String msgKey = (String) consumerRecord.key();
                  String msgData = (String) consumerRecord.value();
                  log.info("HangzhouCityConsumer从Kafka集群中的Topic:{},消费的原始数据的Key:", topicName);
                  log.info(msgKey);
                  log.info("HangzhouCityConsumer从Kafka集群中的Topic:{},消费的原始数据的Data:", topicName);
                  log.info(msgData);
              }
          }
      }
  }
}

(2)解析代码

从配置类中获取配置信息consumerConfig、keyDeserializer、valueDeserializer。

使用group.id属性指定消费组：hub-topic-province-notice-group-hangzhou。

使用KafkaConsumer的subscribe方法订阅Topic：hub-topic-province-notice。

使用KafkaConsumer的poll方法轮询Topic：hub-topic-province-notice，消费Topic的消息数据存入到记录结果集：ConsumerRecords。

遍历结果集ConsumerRecords获取具体数据。

6.消费者二(NingboCityConsumer)

(1)示例代码

@Component
@Slf4j
public class NingboCityConsumer implements InitializingBean {
  //1.注入消费者配置信息,key和value的序列化对象
  @Autowired
  private Deserializer keyDeserializer;
  @Autowired
  private Deserializer valueDeserializer;
  //2.定义Kafka的Topic
  private final String topicName = "hub-topic-province-notice";
  @Override
  public void afterPropertiesSet() throws Exception {
      //3.创建线程,在线程中使用KafkaConsumer实时监听Kafka集群的Topic
      Thread thread = new Thread(() -> {
          log.info("NingboCity启动线程监听Topic: {}", topicName);
          Collection topics = Lists.newArrayList(topicName);
          //1.指定消费组(一条消息可以被多个不同的ConsumerGroup消费)
          Map configs = new HashMap<>();
          Map consumerConfig = SpringUtil.getBean("consumerConfig");
          configs.putAll(consumerConfig);
          configs.put("group.id", "hub-topic-province-notice-group-ningbo");
          //2.创建Kafka消费者
          KafkaConsumer kafkaConsumer = new KafkaConsumer(configs, keyDeserializer, valueDeserializer);
          //3.订阅Kafka的Topic
          kafkaConsumer.subscribe(topics);
          while (true) {
              ThreadUtil.sleep(200);
              //4.使用KafkaConsumer的poll按照指定周期轮询Kafka集群指定Topic的消息
              ConsumerRecords consumerRecords = kafkaConsumer.poll(Duration.ofMillis(1000));
              for (ConsumerRecord consumerRecord : consumerRecords) {
                  //5.KafkaConsumer从集群中监听的消息存储在ConsumerRecord
                  String msgKey= (String) consumerRecord.key();
                  String msgData = (String) consumerRecord.value();
                  log.info("NingboCityConsumer从Kafka集群中的Topic:{},消费的原始数据的Key:",topicName);
                  log.info(msgKey);
                  log.info("NingboCityConsumer从Kafka集群中的Topic:{},消费的原始数据的Data:",topicName);
                  log.info(msgData);
              }
          }
      });
      //9.启动线程
      thread.start();
  }
}

(2)解析代码

从配置类中获取配置信息consumerConfig、keyDeserializer、valueDeserializer。

使用group.id属性指定消费组：hub-topic-province-notice-group-ningbo。

使用KafkaConsumer的subscribe方法订阅Topic：hub-topic-province-notice。

使用KafkaConsumer的poll方法轮询Topic：hub-topic-province-notice，消费Topic的消息数据存入到记录结果集：ConsumerRecords。

遍历结果集ConsumerRecords获取具体数据。

7.测试

(1)使用Postman测试，调用生产者写入数据

请求RUL：http://127.0.0.1:18210/hub-210-kafka/hub/example/province/producer/f01_1

参数：msgContent="浙江省全力发展经济"

(2)生产者日志

ZhejiangProvince生产者向Kafka集群的Topic: hub-topic-province-notice,写入Key:
province:b9418d4ae1f44a198684abfa59aaec2a:1687791091150
ZhejiangProvince生产者向Kafka集群的Topic: hub-topic-province-notice,写入Data:
{"msgContent":"浙江省全力发展经济","publicTime":"2023-06-26 22:51:31","uuid":"b9418d4ae1f44a198684abfa59aaec2a"}

(3)消费者一日志

HangzhouCityConsumer从Kafka集群中的Topic:hub-topic-province-notice,消费的原始数据的Key:
province:b9418d4ae1f44a198684abfa59aaec2a:1687791091150
HangzhouCityConsumer从Kafka集群中的Topic:hub-topic-province-notice,消费的原始数据的Data:
{"msgContent":"浙江省全力发展经济","publicTime":"2023-06-26 22:51:31","uuid":"b9418d4ae1f44a198684abfa59aaec2a"}

(4)消费者二日志

NingboCityConsumer从Kafka集群中的Topic:hub-topic-province-notice,消费的原始数据的Key:
province:b9418d4ae1f44a198684abfa59aaec2a:1687791091150
NingboCityConsumer从Kafka集群中的Topic:hub-topic-province-notice,消费的原始数据的Data:
{"msgContent":"浙江省全力发展经济","publicTime":"2023-06-26 22:51:31","uuid":"b9418d4ae1f44a198684abfa59aaec2a"}

(5)结论

每个Consumer指定一个特定的ConsumerGroup，一条消息可以被多个不同的ConsumerGroup消费。

8.辅助类

@Data
@Builder
public class MsgDto implements Serializable {
  private String uuid;
  private String publicTime;
  private String msgContent;
  public static MsgDto buildDto(String uuid,
                      long publicTime,
                      String msgContent) {
      return builder().uuid(uuid)
          .publicTime(DateUtil.formatDateTime(new Date(publicTime)))
          .msgContent(msgContent).build();
  }
}

以上，感谢。

2023年6月26日

上一篇：Hive01

下一篇：微服务: 04-springboot中rabbitmq的yml或properties配置,消息回收,序列化方式