Apache Kafka 4.0重磅发布,核心特性速览!

快速了解Kafka 4 .0的主要特性:
KRaft模式:2 02 1 年发布,彻底告别ZooKeeper,简化部署和运维,运营费用降低3 0%。

新消费者组协议:2 02 2 年推出,再平衡性能将提高5 倍,停机时间将减少5 0%。

队列功能:2 02 3 年新增,支持订单处理场景,资源利用率提升2 0%。

Java版本要求:2 02 3 年升级到Java 1 1 /1 7 ,性能优化1 5 %,安全性增强。

API更新:2 02 3 年将删除1 2 个月的API,开发者体验将提升4 0%。

其他改进:2 02 3 年将引入交易服务器端防御,将“僵尸交易”的可能性降低8 0%。

实用提醒:迁移前评估现有ZooKeeper依赖关系,并优先测试KRaft模式兼容性。

什么是apache kafka数据采集

等等,昨天我路过公司一楼的咖啡馆,看到几个程序员手里拿着打印出来的架构图在讨论Kafka。
他们谈论的分区复制听起来很有趣并且可以承受停机时间。
然而,我始终相信,像这样的系统应该有自己的机房,而不应该只是坐在角落里。
不过,他们也提到了零拷贝。
听起来好像可以节省很多硬盘,但我不太明白如何节省。
我需要花时间研究这个技术细节。

Apache Kafka 4.0的全新外观和体验

这个版本的 ApacheKafka 4 .0 确实很有前途……尤其是 KRaft 和 KafkaQueues,它们简直改变了游戏规则。

我们先来说说KRaft。
到了2 02 2 年,大家还在用Zookeeper,这让事情变得复杂了。
后来才知道ZooKeeper有多贵,光是运维就很头疼。
预计到2 02 2 年,不计算人力,仅搭建一个Zookeeper集群就需要数十万的费用。
KRaFT直接内置元数据协调,架构立即清晰。
想想看,如果Zookeeper失败了,Kafka就会瘫痪。
风险有多大? KRaFT解决了这个问题,直接提高了稳定性。
另外,分区选举、复制同步等功能KRaFT都有,真正省心。

我们来谈谈Kafkakuze,这东西很解渴。
过去,将人员添加到消费者群体中会受到细分数量的限制。
如果太多的话我们就会无动于衷。
2 02 2 年,我遇到一个案例,一个项目需要1 000个消费者,但结果只有2 00个分区。
8 00有什么用?卡夫卡库斯出来之后,这个问题就消失了。
您可以毫无顾虑地添加人员,数据将从分区中“拉取”并创建 FIFO。
顺序并不重要,只要快点。
我觉得这个东西特别适合大数据量的日志处理,吞吐量可以翻倍。
也许我有偏见,但我认为这对于Kafka来说绝对是一个很大的进步。

消费者群体还有重新平衡。
以前扩容的时候,消费群体要休息一下,用户体验很差。
KIP-8 4 8 的优化,异步重新平衡,简直令人惊叹。
我在某个城市测试并添加了一个pod,其他消费者完全不受影响。
这是有效的。
与 Kubernetes 自动扩展相结合,这听起来很神奇。

代码注入和可观察性也很好。
对于代码注入,无需更改代码。
只需添加处理器包装器并放入审核和监视逻辑即可。
生长效率非常高。
以前可观测性和指标是混在一起的,现在是一体化的。
它还支持 OpenTelemetry,与 Datadog 集成,并监控整个链路,使故障排除速度更快。
2 02 2 年我们团队仅仅因为指标不符就浪费了将近一个月的时间。
现在这个问题已经基本结束了。

总的来说,Kafka 4 .0 中的这些改进,尤其是 KRaFT 和 KafkaQueues,确实使分布式事件流处理更简单、更高效、更灵活。
它在云原生环境中使用起来也很舒适,并且易于部署和监控。
只是价格……可能需要重新评估。