kafka学习题-白红宇的个人博客

kafka学习题

发布日期：2021-06-28 21:03:45 浏览次数：4 分类：技术文章

本文共 968 字，大约阅读时间需要 3 分钟。

分区的多少和客户端的内存没太有直接的关系

buffer.memory=32M 待发送消息的BufferPool（缓冲池）对象，一个producer只有一个BufferPool（缓冲池）对象

batch.size=16kB 存储在BufferPool（缓冲池）对象的一个微批消息的大小。

linger.ms=0

max.in.flight.requests.per.connection=5

该参数指定了生产者在收到服务器响应之前可以发送多少个消息。它的值越高，就会占用越多的内存，不过也会提升吞吐量。把它设为 1 可以保证消息是按照发送的顺序写入服务器的，即使发生了重试。

broker:

num.network.threads=3

num.io.threads=8

queued.max.requests 500

共享请求队列大小 (在阻塞网络线程之前允许的排队请求的数量)，及num.network.threads和num.io.threads的缓存池的大小

num.replica.fetchers=1 副本同步线程

consumer:

根据分区数启动对应的消费者数

num.replica.fetchers=1B

默认是 1 字节，表示只要 Kafka Broker 端积攒了 1 字节的数据，就可以返回给 Consumer 端，例如可以调整为1 KB或者更大。

fetch.max.wait.ms=500ms

通过 fetch.min.bytes 告诉 Kafka，等到有足够的数据时才把它返回给消费者。而 feth.max.wait.ms 则用于指定 broker 的等待时间

注：consumer的num.replica.fetchers、fetch.max.wait.ms和producer的buffer.memory、linger.ms有异曲同工之妙

面试官问：上亿数据量下，Kafka是如何优化JVM GC问题的

转载地址：https://blog.csdn.net/yangshengwei230612/article/details/118017470 如侵犯您的版权，请留言回复原文章的地址，我们会给您删除此文章，给您带来不便请您谅解！

上一篇：spark SQL快速入门慕课网

下一篇：Spark性能调优实战--精华总结-极客时间吴磊

关于作者

喝酒易醉，品茶养心，人生如梦，品茶悟道，何以解忧？唯有杜康！

-- 愿君每日到此一游！