发表于 2025-04-24 阅读次数：

Kafka性能与Swap的关系

Kafka的内存使用模型

Kafka Broker内存布局：
┌────────────────────┐
│   JVM堆内存        │ <- 存储元数据、缓存等
├────────────────────┤
│   页面缓存         │ <- 消息数据缓存
│   (Page Cache)     │ 
└────────────────────┘

为什么Kafka依赖页面缓存

设计理念：
- 利用操作系统的页面缓存而不是JVM堆
- 避免数据在JVM堆和页面缓存的双重缓存
- 减少GC压力
- 提供快速的消息读写

Swap对性能的影响

当发生Swap时：
1. 页面缓存被换出到磁盘
   内存页 -> Swap分区 (写磁盘)
   
2. 需要数据时再换入内存
   Swap分区 -> 内存页 (读磁盘)
   
结果：一次数据访问变成多次磁盘I/O

性能下降原因

延迟增加：
- 正常：内存访问 (~100ns)
- Swap：磁盘I/O (~10ms)
- 性能差距：约10万倍
吞吐量下降：
- 频繁的页面换入换出
- 产生额外的I/O负载
- 影响正常的消息读写

实际影响示例

场景：生产者写入10MB消息

无Swap情况：
1. 数据写入页面缓存 (内存操作)
2. 异步刷盘 (后台I/O)
总耗时：约10ms

有Swap情况：
1. 换出页面缓存 (I/O)
2. 写入新数据 (内存操作)
3. 可能需要换入其他数据 (I/O)
4. 异步刷盘 (后台I/O)
总耗时：可能超过100ms

最佳实践

# 1. 设置低swappiness
vm.swappiness=1

# 2. 预留足够物理内存
# 计算公式：
需要内存 = JVM堆大小 + 
         (分区数 × segment.bytes) × 25% + 
         预留系统内存

# 3. 监控Swap使用
vmstat 1
free -m

监控指标

si (swap in)：换入数据量
so (swap out)：换出数据量
当这两个值大于0时，说明系统正在使用swap