Kafka高频面试题总结(2022最新整理)

提问网友发布时间：2025-01-02 20:10

声明：本网页内容为用户发布，旨在传播知识，若有侵权等问题请及时与本网联系，我们将在第一时间删除处理。
E-MAIL:1656858193@qq.com

共1个回答

热心网友回答时间：2025-03-21 19:33

Kafka 的特点：

- 高并发，通过分区实现负载均衡

- 支持消息有序性

- 强大的数据复制机制，通过副本保证数据一致性

- 高吞吐率和低延迟

选择 Kafka 场景：

- 大量数据的实时处理

- 实时流式数据传输

- 高并发下的实时消息消费

Kafka 架构：

- **分区**：实现负载均衡，提高并发度

- **消费者**：高效消费消息

消息有序性：

- 每个分区内的消息顺序写入

- 单个分区由单一消费者消费，保证顺序性

- 分区间消息不保证有序

Kafka Producer 执行过程：

1. 生产消息

2. 找到分区的 Leader

3. 推送消息

4. 通过 ISR 列表通知 Follower

5. Follower 拉取消息，发送 ACK

6. Leader 收到所有副本的 ACK，更新 Offset

Kafka Consumer 线程模型：

- **Thread-Per-Consumer**：利用主题分分区机制，每个线程有自己的 Consumer 实例，消费多个分区

- **并行性**：线程间独立，无同步和通信需求

数据一致性原理：

- Leader 和 Follower 间数据一致

- ISR 列表确保一致性，避免数据丢失

ISR、OSR、AR：

- **ISR**：副本同步队列，Leader 同步数据给 Follower

- **OSR**：出同步副本，超过阈值的 Follower

- **AR**：所有副本集合

LEO、HW、LSO、LW：

- **LEO**：日志文件中下一条消息的位置

- **HW**：消费位置的标识

- **LSO**：事务中第一条消息的位置或完成事务时与 HW 相同

- **LW**：AR 集合中最小的日志文件起始位置

数据传输事务：

- **最多一次**：消息最多传输一次，可能不传输

- **最少一次**：消息不会被漏掉，可能重复

- **精确一次**：确保消息不重复、不遗漏传输

Kafka 消费指定分区消息：

- 消费者通过 offset 控制，可回滚重读

消息传输模式：

- **Pull**：消费者主动从 Broker 拉取消息，灵活批量控制

- **Push**：Broker 推送消息至消费者，受限于消费速率

高效文件存储设计：

- **分割大文件**：定期清理已消费文件，减少磁盘占用

- **索引优化**：快速定位消息，控制响应大小

- **内存映射**：减少磁盘 I/O 操作

- **稀疏存储**：降低索引文件元数据空间需求

Kafka 分区分配：

- 副本数量不超过 Broker 数量

- 首分区随机分配

- 其他分区依次循环分配

再均衡过程：

- 消费者组成员请求加入

- Leader 分配消费方案

- 方案广播至所有成员

高吞吐率实现：

- 分布式存储，优化读写性能

- 大文件分割，灵活数据管理

- 并发消费机制，提升处理速度

Kafka 缺点：

- 较高的系统开销

- 配置复杂度

- 需要较大量存储资源

新旧消费者区别：

- **旧消费者**：简单消费者，功能有限

- **新消费者**：支持消费者组，再均衡机制

分区调整限制：

- **增加分区**：使用命令支持

- **减少分区**：不支持，逻辑复杂，可能导致数据丢失或破坏有序性

通过上述内容，可以清晰地看到 Kafka 在设计上的核心优势和应用场景，以及其在消息处理、数据存储、系统管理等方面的关键机制和特性。

本文如未解决您的问题请添加抖音号：51dongshi（抖音搜索懂视），直接咨询即可。

已解决

等待解决

身上有淡白色斑点,一出汗就消失体温一下降就又出现了汗斑的问题急!!! 肚子和胸部长了大小不一的褐色斑,洗澡后颜色会浅,是什么斑有哪些果茶值得推荐呢? TALKTEA/言茶荔枝红茶花果茶类推荐如何看待云南一餐厅一个荤菜卖528的事? 八个菜仅一个荤菜卖528,明码标价就能随意定价吗? 国际电脑品牌有哪些世界十大品牌电脑排名有哪些湖南农业大学分数线为什么这么低 2022湖南农业大学最新全国排名第148名湖南设置专业级差有哪些大学我是安徽的考生,超二本线33分,报湖南农业大学会计类有把握吗紫檀手串和红酸枝有什么区别红酸枝手串有多重十二颗 2.0珠子请问有谁知道,为什么电脑在关机后隔天就开不起来? 电脑停了下电然后开机开不了电脑关机以后再开机就开不开机了怎么... win7电脑开机二次启动不了每次电脑正常关机后第二天再开机启不了秦汉监察制度史研究基本信息秦朝监察制度的目的是红薯能放冰箱储存吗红薯能不能放冰箱储存多久 Kafka为什么吞吐量大、速度快卡夫卡作品的特点常见Java面试题-Kafka、RabbitMQ、RocketMQ 之间的区别是什么?_百度... 右图中,正方形的面积是50平方厘米,求阴影部分的面积。不能用方程,不... 如图,正方形的面积是50平方厘米,阴影部分的面积是多少平方厘米? 如图正方形面积是5o平方厘米,求阴影部分的面积。求过程? 如图一显示图形中正方形的面积是五十平方厘米求阴影部分的面积 1299元Redmi Note 9评测小米note9手机好吗骁龙690和天机800哪个好霜降民间文化用白话来形容一个人买东西挑来挑去公共管理类(包括行政管理专业、公共事业管理专业方向)有哪些内容 ...牙膏还是无氟牙膏呢?宝妈圈都推荐用上儿贝贝儿童益生菌成长含氟牙 ... experiential grounding 这个专业名词是什么意思? 蝴蝶落我家教学反思(优质4篇) 2013年对应生肖介绍 13年属什么生肖 2013年属相是什么生肖电子商务新生的C2M模式是什么?因何出现?特点、优势等分析尹恩慧有多高啊她好看把?

首页

互助专区

登录

注册

Kafka高频面试题总结(2022最新整理)