0x0034's Blog.

内存问题排查

字数统计: 1k阅读时长: 3 min
2022/01/04

内存性能分析

性能指标

性能指标

常见内存参数

  • top
    • VIRT: 进程虚拟内存的大小,只要是进程申请过的内存,即便还没有真正分配物理内存,也会计算在内。虚拟内存通常不会全部分配为物理内存,通常情况下,没个进程的虚拟内存比常驻内存大很多.
    • RES 是常驻内存的大小,也就是进程实际使用的物理内存大小,但不包括 Swap 和共享内存。
    • SHR 是共享内存的大小,比如与其他进程共同使用的共享内存、加载的动态链接库以及程序的代码段等。
    • %MEM 是进程使用物理内存占系统总内存的百分比。
  • free
    • Buffer: 是对磁盘数据读写的缓存
    • Cache: 是文件数据读写的缓存

分析思路

主要分析思路为三块

  • 系统内存使用情况
  • 进程内存使用情况
  • Swap内存使用情况

系统内存使用情况

  • 已用内存和剩余内存: 已经使用和还未使用的内存
  • 共享内存: 共享内存是通过 tmpfs 实现的,所以它的大小也就是 tmpfs 使用的内存大小。tmpfs 其实也是一种特殊的缓存。
  • 可用内存: 是新进程可以使用的最大内存,它包括剩余内存和可回收缓存。
  • 缓存包括两部分:
    • 磁盘读取文件的页缓存: 用来缓存从磁盘读取的数据,可以加快以后再次访问的速
    • Slab 分配器中的可回收内存
  • 缓冲区: 是对原始磁盘块的临时存储,用来缓存将要写入磁盘的数据。这样,内核就可以把分散的写集中起来,统一优化磁盘写入。

进程内存使用情况

  • 虚拟内存: 包括了进程代码段、数据段、共享内存、已经申请的堆内存和已经换出的内存等。这里要注意,已经申请的内存,即使还没有分配物理内存,也算作虚拟内存。
  • 常驻内存: 是进程实际使用的物理内存,不过,它不包括 Swap 和共享内存。
  • 共享内存: 既包括与其他进程共同使用的真实的共享内存,还包括了加载的动态链接库以及程序的代码段等。
  • Swap: 是指通过 Swap 换出到磁盘的内存
  • 缺页异常: 系统调用内存分配请求后,并不会立刻为其分配物理内存,而是在请求首次访问时,通过缺页异常来分配。
    • 次缺页异常: 可以直接从物理内存中分配。
    • 主缺页异常: 需要磁盘 I/O 介入(比如 Swap)时

Swap内存使用情况

  • 已用空间和剩余空间: 已经使用和没有使用的内存空间。
  • 换入和换出速度: 表示每秒钟换入和换出内存的大小。

排查思路

  1. free,top 查看系统整体内存情况
  2. vmstat,pidstat,sar 查看一段时间内存的使用情况
  3. 详细分析,比如内存分配分析、缓存/缓冲区分析、具体进程的内存使用分析等

内存排查思路图

常见优化思路

  • 禁止 Swap。如果必须开启 Swap,降低 swappiness 的值,减少内存回收时 Swap 的使用倾向。
  • 减少内存的动态分配。比如,可以使用内存池、大页(HugePage)等。
  • 尽量使用缓存和缓冲区来访问数据。比如,可以使用堆栈明确声明内存空间,来存储需要缓存的数据;或者用 Redis 这类的外部缓存组件,优化数据的访问。
  • 使用 cgroups 等方式限制进程的内存使用情况。这样,可以确保系统内存不会被异常进程耗尽。
  • 通过 /proc/pid/oom_adj ,调整核心应用的 oom_score。这样,可以保证即使内存紧张,核心应用也不会被 OOM 杀死

注: 某些图和案例来源自倪鹏飞老师的<<linux性能优化实战>>

CATALOG
  1. 1. 内存性能分析
    1. 1.1. 性能指标
    2. 1.2. 常见内存参数
    3. 1.3. 分析思路
      1. 1.3.1. 系统内存使用情况
      2. 1.3.2. 进程内存使用情况
      3. 1.3.3. Swap内存使用情况
  2. 2. 排查思路
  3. 3. 常见优化思路