记录:466
场景:一个KafkaProducer在一个Topic发布消息,多个消费者KafkaConsumer订阅Kafka的Topic。每个KafkaConsumer指定一个特定的ConsumerGroup,达到一条消息被多个不同的ConsumerGroup消费。
版本:JDK 1.8,Spring Boot 2.6.3,kafka_2.12-2.8.0,kafka-clients-3.0.0。
Kafka集群安装:https://blog.csdn.net/zhangbeizhen18/article/details/131156084
1.基础概念
Topic:Kafka根据Topic对消息进行归类,发布到Kafka的每条消息都需要指定一个Topic。
Producer:消息生产者,向Broker发送消息的客户端。
Consumer:消息消费者,从Broker读取消息的客户端。
ConsumerGroup:每个Consumer属于一个特定的ConsumerGroup,一条消息可以被多个不同的ConsumerGroup消费;但是一个ConsumerGroup中只能有一个Consumer能够消费该消息。
publish:发布,使用Producer向Kafka写入数据。
subscribe:订阅,使用Consumer从Kafka读取数据。
2.微服务中配置Kafka信息
2.1在pom.xml添加依赖
pom.xml文件:
org.apache.kafka kafka-clients3.0.0
解析:使用原生的kafka-clients,版本:3.0.0。操作kafka集群的Topic。
3.配置Kafka生产者和消费者
使用原生的kafka-clients,需配置KafkaProducer和KafkaConsumer,把Kafka集群的配置信息注入到这两个对象,便可以操作了生产者和消费者。
配置细节在官网的configuration:https://kafka.apache.org/documentation/
3.1配置KafkaProducer生产者
(1)示例代码
@Configuration public class KafkaClusterConfig { @Bean public KafkaProducer kafkaProducer() { Mapconfigs = new HashMap<>(); //kafka集群 Collection cluster = Lists.newArrayList("192.168.19.161:29092", "192.168.19.162:29092", "192.168.19.163:29092"); configs.put("bootstrap.servers", cluster); //客户端发送服务端失败的重试次数 configs.put("retries", 2); //多个记录被发送到同一个分区时,生产者将尝试将记录一起批处理成更少的请求. //此设置有助于提高客户端和服务器的性能,配置控制默认批量大小(以字节为单位) configs.put("batch.size", 16384); //生产者可用于缓冲等待发送到服务器的记录的总内存字节数(以字节为单位) configs.put("buffer-memory", 33554432); //生产者producer要求leader节点在考虑完成请求之前收到的确认数,用于控制发送记录在服务端的持久化 //acks=0,设置为0,则生产者producer将不会等待来自服务器的任何确认.该记录将立即添加到套接字(socket)缓冲区并视为已发送.在这种情况下,无法保证服务器已收到记录,并且重试配置(retries)将不会生效(因为客户端通常不会知道任何故障),每条记录返回的偏移量始终设置为-1. //acks=1,设置为1,leader节点会把记录写入本地日志,不需要等待所有follower节点完全确认就会立即应答producer.在这种情况下,在follower节点复制前,leader节点确认记录后立即失败的话,记录将会丢失. //acks=all,acks=-1,leader节点将等待所有同步复制副本完成再确认记录,这保证了只要至少有一个同步复制副本存活,记录就不会丢失. configs.put("acks", "-1"); //指定key使用的序列化类 Serializer keySerializer = new StringSerializer(); //指定value使用的序列化类 Serializer valueSerializer = new StringSerializer(); //创建Kafka生产者 KafkaProducer kafkaProducer = new KafkaProducer(configs, keySerializer, valueSerializer); return kafkaProducer; } }
(2)解析代码
把Kafka的配置信息注入到KafkaProducer,并创建KafkaProducer对象。
使用@Configuration和@Bean注解把KafkaProducer对象注入到Spring的IOC容器,在Spring环境就可以使用KafkaProducer了。
KafkaProducer的底层使用配置类是ProducerConfig,在配置时可以参考。
全称:org.apache.kafka.clients.producer.ProducerConfig。
3.2配置KafkaConsumer的公用配置信息
(1)示例代码
@Configuration public class KafkaClusterConfig { @Bean("consumerConfig") public MapconsumerConfigs() { Map configs = new HashMap<>(); //kafka集群 Collection cluster = Lists.newArrayList("192.168.19.161:29092", "192.168.19.162:29092", "192.168.19.163:29092"); configs.put("bootstrap.servers", cluster); //开启consumer的偏移量(offset)自动提交到Kafka configs.put("enable.auto.commit", true); //consumer的偏移量(offset) 自动提交的时间间隔,单位毫秒 configs.put("auto.commit.interval", 5000); //在Kafka中没有初始化偏移量或者当前偏移量不存在情况 //earliest, 在偏移量无效的情况下, 自动重置为最早的偏移量 //latest, 在偏移量无效的情况下, 自动重置为最新的偏移量 //none, 在偏移量无效的情况下, 抛出异常. configs.put("auto.offset.reset", "latest"); //请求阻塞的最大时间(毫秒) configs.put("fetch.max.wait", 500); //请求应答的最小字节数 configs.put("fetch.min.size", 1); //心跳间隔时间(毫秒) configs.put("heartbeat-interval", 3000); //一次调用poll返回的最大记录条数 configs.put("max.poll.records", 500); return configs; } @Bean("keyDeserializer") public Deserializer consumerKeyDeserializer() { //指定key使用的反序列化类 Deserializer keyDeserializer = new StringDeserializer(); return keyDeserializer; } @Bean("valueDeserializer") public Deserializer consumerValueDeserializer() { //指定value使用的反序列化类 Deserializer valueDeserializer = new StringDeserializer(); return valueDeserializer; } }
(2)解析代码
配置消费者KafkaConsumer公用配置信息:@Bean("consumerConfig")、 @Bean("keyDeserializer")、 @Bean("valueDeserializer")。
在创建KafkaConsumer时,只需获取公用consumerConfig、keyDeserializer、valueDeserializer设置到KafkaConsumer。
4.生产者(ZhejiangProvinceProducerController)
(1)示例代码
@RestController @RequestMapping("/hub/example/province/producer") @Slf4j public class ZhejiangProvinceProducerController { //1.注入Kafka生产者 @Autowired private KafkaProducer kafkaProducer; //2.定义Kafka的Topic private final String topicName = "hub-topic-province-notice"; @GetMapping("/f01_1") public Object f01_1(String msgContent) { try { //3.获取业务数据 String uuid = UUID.randomUUID().toString().replace("-", ""); long now = System.currentTimeMillis(); String msgKey = "province" + ":" + uuid + ":" + now; MsgDto msgDto = MsgDto.buildDto(uuid, now, msgContent); String msgData = JSONObject.toJSONString(msgDto); log.info("ZhejiangProvince生产者向Kafka集群的Topic: {},写入Key:", topicName); log.info(msgKey); log.info("ZhejiangProvince生产者向Kafka集群的Topic: {},写入Data:", topicName); log.info(msgData); //4.使用KafkaProducer向Kafka集群写入数据 ProducerRecordproducerRecord = new ProducerRecord<>(topicName, msgKey, msgData); kafkaProducer.send(producerRecord); } catch (Exception e) { log.info("ZhejiangProvince生产者写入Topic异常."); e.printStackTrace(); } return "写入成功"; } }
(2)解析代码
使用KafkaProducer 向Kafka集群的Topic:hub-topic-province-notice写入JSON字符串数据,发布一条消息,给订阅的消费者消费。
5.消费者一(HangzhouCityConsumer)
(1)示例代码
@Component @Slf4j public class HangzhouCityConsumer implements CommandLineRunner { //1.注入消费者配置信息,key和value的序列化对象 @Autowired private Deserializer keyDeserializer; @Autowired private Deserializer valueDeserializer; //2.定义Kafka的Topic private final String topicName = "hub-topic-province-notice"; @Override public void run(String... args) throws Exception { //3.创建线程并传入线程任务执行的Runnable Thread thread = new Thread(new HangzhouCityConsumer.ThreadRunnable()); //4.启动线程 thread.start(); } //在线程中使用KafkaConsumer实时监听Kafka集群的Topic public class ThreadRunnable implements Runnable { @Override public void run() { log.info("HangzhouCityConsumer启动线程监听Kafka集群的Topic: {}", topicName); Collectiontopics = Lists.newArrayList(topicName); //1.指定消费组(一条消息可以被多个不同的ConsumerGroup消费) Map configs = new HashMap<>(); Map consumerConfig = SpringUtil.getBean("consumerConfig"); configs.putAll(consumerConfig); configs.put("group.id", "hub-topic-province-notice-group-hangzhou"); //2.创建Kafka消费者(传入消费者配置和key和value的序列化对象) KafkaConsumer kafkaConsumer = new KafkaConsumer(configs, keyDeserializer, valueDeserializer); //3.订阅Kafka的Topic kafkaConsumer.subscribe(topics); while (true) { //4.使用KafkaConsumer的poll按照指定周期轮询Kafka集群指定Topic的消息 ConsumerRecords consumerRecords = kafkaConsumer.poll(Duration.ofMillis(1000)); //5.遍历从Kafka集群中读取数据集ConsumerRecords for (ConsumerRecord consumerRecord : consumerRecords) { //6.从ConsumerRecord中取出消费数据 String msgKey = (String) consumerRecord.key(); String msgData = (String) consumerRecord.value(); log.info("HangzhouCityConsumer从Kafka集群中的Topic:{},消费的原始数据的Key:", topicName); log.info(msgKey); log.info("HangzhouCityConsumer从Kafka集群中的Topic:{},消费的原始数据的Data:", topicName); log.info(msgData); } } } } }
(2)解析代码
从配置类中获取配置信息consumerConfig、keyDeserializer、valueDeserializer。
使用group.id属性指定消费组:hub-topic-province-notice-group-hangzhou。
使用KafkaConsumer的subscribe方法订阅Topic:hub-topic-province-notice。
使用KafkaConsumer的poll方法轮询Topic:hub-topic-province-notice,消费Topic的消息数据存入到记录结果集:ConsumerRecords。
遍历结果集ConsumerRecords获取具体数据。
6.消费者二(NingboCityConsumer)
(1)示例代码
@Component @Slf4j public class NingboCityConsumer implements InitializingBean { //1.注入消费者配置信息,key和value的序列化对象 @Autowired private Deserializer keyDeserializer; @Autowired private Deserializer valueDeserializer; //2.定义Kafka的Topic private final String topicName = "hub-topic-province-notice"; @Override public void afterPropertiesSet() throws Exception { //3.创建线程,在线程中使用KafkaConsumer实时监听Kafka集群的Topic Thread thread = new Thread(() -> { log.info("NingboCity启动线程监听Topic: {}", topicName); Collectiontopics = Lists.newArrayList(topicName); //1.指定消费组(一条消息可以被多个不同的ConsumerGroup消费) Map configs = new HashMap<>(); Map consumerConfig = SpringUtil.getBean("consumerConfig"); configs.putAll(consumerConfig); configs.put("group.id", "hub-topic-province-notice-group-ningbo"); //2.创建Kafka消费者 KafkaConsumer kafkaConsumer = new KafkaConsumer(configs, keyDeserializer, valueDeserializer); //3.订阅Kafka的Topic kafkaConsumer.subscribe(topics); while (true) { ThreadUtil.sleep(200); //4.使用KafkaConsumer的poll按照指定周期轮询Kafka集群指定Topic的消息 ConsumerRecords consumerRecords = kafkaConsumer.poll(Duration.ofMillis(1000)); for (ConsumerRecord consumerRecord : consumerRecords) { //5.KafkaConsumer从集群中监听的消息存储在ConsumerRecord String msgKey= (String) consumerRecord.key(); String msgData = (String) consumerRecord.value(); log.info("NingboCityConsumer从Kafka集群中的Topic:{},消费的原始数据的Key:",topicName); log.info(msgKey); log.info("NingboCityConsumer从Kafka集群中的Topic:{},消费的原始数据的Data:",topicName); log.info(msgData); } } }); //9.启动线程 thread.start(); } }
(2)解析代码
从配置类中获取配置信息consumerConfig、keyDeserializer、valueDeserializer。
使用group.id属性指定消费组:hub-topic-province-notice-group-ningbo。
使用KafkaConsumer的subscribe方法订阅Topic:hub-topic-province-notice。
使用KafkaConsumer的poll方法轮询Topic:hub-topic-province-notice,消费Topic的消息数据存入到记录结果集:ConsumerRecords。
遍历结果集ConsumerRecords获取具体数据。
7.测试
(1)使用Postman测试,调用生产者写入数据
请求RUL:http://127.0.0.1:18210/hub-210-kafka/hub/example/province/producer/f01_1
参数:msgContent="浙江省全力发展经济"
(2)生产者日志
ZhejiangProvince生产者向Kafka集群的Topic: hub-topic-province-notice,写入Key: province:b9418d4ae1f44a198684abfa59aaec2a:1687791091150 ZhejiangProvince生产者向Kafka集群的Topic: hub-topic-province-notice,写入Data: {"msgContent":"浙江省全力发展经济","publicTime":"2023-06-26 22:51:31","uuid":"b9418d4ae1f44a198684abfa59aaec2a"}
(3)消费者一日志
HangzhouCityConsumer从Kafka集群中的Topic:hub-topic-province-notice,消费的原始数据的Key: province:b9418d4ae1f44a198684abfa59aaec2a:1687791091150 HangzhouCityConsumer从Kafka集群中的Topic:hub-topic-province-notice,消费的原始数据的Data: {"msgContent":"浙江省全力发展经济","publicTime":"2023-06-26 22:51:31","uuid":"b9418d4ae1f44a198684abfa59aaec2a"}
(4)消费者二日志
NingboCityConsumer从Kafka集群中的Topic:hub-topic-province-notice,消费的原始数据的Key: province:b9418d4ae1f44a198684abfa59aaec2a:1687791091150 NingboCityConsumer从Kafka集群中的Topic:hub-topic-province-notice,消费的原始数据的Data: {"msgContent":"浙江省全力发展经济","publicTime":"2023-06-26 22:51:31","uuid":"b9418d4ae1f44a198684abfa59aaec2a"}
(5)结论
每个Consumer指定一个特定的ConsumerGroup,一条消息可以被多个不同的ConsumerGroup消费。
8.辅助类
@Data @Builder public class MsgDto implements Serializable { private String uuid; private String publicTime; private String msgContent; public static MsgDto buildDto(String uuid, long publicTime, String msgContent) { return builder().uuid(uuid) .publicTime(DateUtil.formatDateTime(new Date(publicTime))) .msgContent(msgContent).build(); } }
以上,感谢。
2023年6月26日
上一篇:Hive01