linux内存黑洞内存泄漏分析
Linux开发架构之路 2024-08-08

一、内存黑洞内存泄漏分析

1.1、page owner简介

内核中通过Slab、Vmalloc、Page Cache等接口申请的内存都会被内核统计到,而直接调用alloc_pages或__get_free_pages申请的内存不会被统计而称为所谓的内存黑洞,若在这部分中出现了内存泄漏问题该如何去定位呢?Linux提供了page owner机制用来追踪谁分配的每一个页面,它可以用来调试内存泄漏或找到内存占用者。

当分配发生时,有关分配的信息,如调用堆栈和页面的顺序被存储到每个页面的特定存储中,当我们需要了解所有页面的状态时,我们可以获得并分析这些信息。

page owner特性的总体设计思路非常简单,就是通过扩展struct page结构体,增加成员变量用于存储该page被分配的调用栈及标志位,然后hack内存页的分配和释放接口,在内存页被分配时,保存调用栈信息,设置标志位,在内存页被释放时,清除调用栈信息,清除标志位,然后,通过一个debugfs的接口,将所有读取该接口时刻已经被分配出去的内存页的调用栈信息传递给用户态,并在用户态制作了一个工具,用于统计这些调用栈的信息。

下图就是page owner中统计的信息,这里需要注意的是,记录在page owner文件中的内存页都是已经被申请的,通过这些信息就可以清晰的看到内存页的调用情况。


1.2、page owner内核使能方法

page owner在默认情况下是禁用的,内核中打开page owner的流程如下:

1.2.1、使能内核宏定义

如果内核没有打开相关宏定义的话,则需要手动使能。

CONFIG_DEBUG_FS=yCONFIG_PAGE_OWNER=y

1.2.2、启动参数中使能

在boot cmdline中新增"page_owner=on"。

1.2.3、检测使能结果

若成功使能的话,就可以查看到/sys/kernel/debug/page_owner节点,如下图所示,


1.3、page owner分析内存泄漏流程

1、在内存泄漏问题压测前后分别使用下面的命令导出系统page owner信息,操作命令如下:

// 压测前# cat /sys/kernel/debug/page_owner > page_owner_full_before.txt // 压测后# cat /sys/kernel/debug/page_owner > page_owner_full_after.txt

2、构建用户空间的处理工具

Linux下提供page_owner_sort工具用于处理page_owner信息,该工具可以在kernel/tools/vm/下使用make page_owner_sort命令生成,如下图所示:


3、将过滤后的page owner文件通过page_owner_sort进行排序,就可以根据页面调用次数进行排序,方便我们排查潜在的泄漏点,操作命令如下:


# grep -v ^PFN page_owner_full_before.txt > page_owner_before.txt# ./page_owner_sort page_owner_before.txt  sorted_page_owner_before.txt # grep -v ^PFN page_owner_full_after.txt > page_owner_after.txt# ./page_owner_sort page_owner_after.txt  sorted_page_owner_after.txt
4、打开排序后的文件查看,这里面根据每个页的申请次数进行排序,对比before、after就可以看出泄漏点。如下图,这里看到看到after中出现了5236 * 2^3 = 41888 pages的内存消耗,每个page默认是4KB,换算下就是这里有163.625 MB的内存消耗,这里只是表明这里内存消耗的比较异常,但并不一定是内存泄漏,这个还要具体去分析。


二、Slab内存泄漏分析

2.1、Slab内存泄漏定义

Linux 内核的 Slab 内存分为两块,一个是 SReclaim,另一个是 SUnreclaim,从命名就可以知道,一个是可回收的,一个是不可回收的,我们排查是否有 Slab 内存泄漏主要关注 SUnreclaim。

通过 /proc/meminfo 文件查看 SUnreclaim 数值是否有明显增大,若存在异常增加,则怀疑Slab存在内存泄漏。

2.2、Slab调试

默认情况下,slab debug是关闭的,因为这会增加内存资源的消耗,当需要调试时,可以开启下面的宏定义,

CONFIG_SLUB_DEBUG=yCONFIG_SLUB_DEBUG_ON=yCONFIG_SLABINFO=y

通过 /proc/slabinfo 来查看是具体哪个对象存在异常,如下图所示,


通常 Slab 的名字就表明了其用途,比如 "inode_cache"、"dentry" 什么的,根据发生泄露的 slab cache 的名字,大致就知道是哪个子系统或模块的问题,但从有些未明确命令的slab cache是无法知道的,如"kmalloc-128″ 的名称完全看不出 slab cache 的用途,因此,我们需要有方法来知道泄漏点具体的 calltrace。


2.3、内核提供的调试方法和工具

2.3.1、/sys/kernel/slab/{module}/alloc_calls

确定可能泄漏的调用栈信息可以使用如下命令查询:

# cat /sys/kernel/slab/{module}/alloc_calls# cat /sys/kernel/slab/{module}/free_calls

alloc_calls 和 free_calls 中的调用栈信息,可以从alloc_calls中初步看出大量申请点,如下图所示:


对比alloc_calls和free_calls后找到相关怀疑点,接着使用addr2line工具在vmlinux或者对应的ko文件中查找出来具体的函数行号,从而进一步分析内存泄漏原因。

2.3.2、/sys/kernel/slab/{module}/trace

可以将申请、释放内存的调用栈信息打印到Kernel日志中,需要注意的是,开启trace可能导致系统输入输出无响应,所以,不能一直打开,只能间隔的打开一段时间,关闭操作最好放到脚本中做。

# echo 1 > /sys/kernel/slab/{module}/trace# sleep 10# echo 0 > /sys/kernel/slab/{module}/trace


这种通过在kernel log中大量输出的calltrace的方法,在实际问题分析上使用很少,主要是分析kernel log的工作量很大,可以直接看到完整的calltrace,进而继续分析内存泄漏问题。

2.3.3、kmemleak工具

kmemleak是在 Kernel 2.6.31 中引入的工具,用于检查内存泄漏,kmemleak 可以追踪 kmalloc(),vmalloc(),kmem_cache_alloc() 等函数引起的内存泄漏,一般用于 slab 内存泄漏分析。

若要在内核中使能kmemleak工具,可以开启如下内核选项如下,

CONFIG_DEBUG_KMEMLEAK=yCONFIG_DEBUG_KMEMLEAK_DEFAULT_OFF=nCONFIG_DEBUG_KMEMLEAK_EARLY_LOG_SIZE=40000

通过查询/sys/kernel/debug/kmemleak节点来检测是否成功开启了kmemleak。


kmemleak使用方法如下:

1、第一次手动scan

# echo scan > /sys/kernel/debug/kmemleak    // 开始扫描# cat /sys/kernel/debug/kmemleak            // 拿到很多backtrace,但是这其中有些是误抓的(kmemleak存在误报情况)# echo clear > /sys/kernel/debug/kmemleak   // 清除log

2、第二次手动scan

# echo scan > /sys/kernel/debug/kmemleak // 开始扫描// 等待一段时间让泄漏累积# cat /sys/kernel/debug/kmemleak // 很多第一次误报的backtrace没有了,会得到很多重复的backtrace// 重复的backtrace会越来越多,不断增长,一般这里就是内存泄露的点# echo clear > /sys/kernel/debug/kmemleak // 清除log

注意:若不主动scan的话,在配置kmemleak后,将会有内核线程间隔10分钟扫描一次内存,并打印找到泄漏的数量。

kmemleak 只能帮助解决一些非常简单的内存泄露问题,针对较为复杂的泄露路径,kmemleak 就无法处理了,并且 kmemleak 还存在着误检测的可能性。

尽管内核提供的这些工具和方法可以调试SLAB内存泄漏问题,但是在平时的使用中依然不够好用,重点的效率并不是很高,而当调试内存黑洞内存泄漏问题时,使用page owner可以简单快捷的定位到泄漏点,那么,slab内存泄漏问题的调试能不能也做到这个效果呢?答案是可以的,不过需要修改kernel源码来支援,这就是下一节中的slabtrace工具,现在笔者对于较复杂的slab内存泄漏问题分析都会优先使用这个工具,效率杠杠的,话不多说,开始展示!

2.4、客制化好用的调试工具 - slabtrace

先展示下slabtrace的用法和效果,如下图所示,哈哈,熟悉的味道回来了,这里可以看到操作简单,只需要在压测前后获取下slabtrace内容,接着对比查看count差异较大的点即可,而且给出了每个点的完整calltrace,calltrace level也是可以自行调整,因为有些问题点需要更深的calltrace才能看到是哪个模块出现的问题。

// 压测前执行# cat /proc/slabtrace > /data/slabtrace_before.txt // 压测后执行# cat /proc/slabtrace > /data/slabtrace_after.txt


这里需要注意的是,slabtrace是依赖于slab debug,所以,在合入slabtrace patch时也需要使能slab debug选项。




声明: 本文转载自其它媒体或授权刊载,目的在于信息传递,并不代表本站赞同其观点和对其真实性负责,如有新闻稿件和图片作品的内容、版权以及其它问题的,请联系我们及时删除。(联系我们,邮箱:evan.li@aspencore.com )
0
评论
  • 【7.24 深圳】2025国际AI+IoT生态发展大会/2025全球 MCU及嵌入式技术论坛


  • 相关技术文库
  • 单片机
  • 嵌入式
  • MCU
  • STM
  • 3AT89C51单片机引脚说明及引脚图

    AT89C51是一种带4K字节闪烁可编程可擦除只读存储器的低电压,高性能CMOS8位微处理器,俗称单片机。该器件采用ATMEL高密度非易失存储器制造技术制造,与工业标准的MCS-51指令集和输出管脚相兼容。由于将多功能8位CPU...

    昨天
  • 51单片机对LCD1602液晶的驱动设计

    51单片机——LCD1602 1、1602液晶读写时序 (1)、读状态 RS=L,R/W=H,E=H。(判断忙完毕后释放总线) (2)、读数据 RS=H,R/W=H,E=H。 (3)、写指令 RS=L,R/W=L,D0~D7=指令码,E=高脉冲 (4)、写数据 RS=H,R/W=L,D0~D...

    昨天
  • 单片机串口如何接收不定长数据的?

    我们在使用其他STM32的单片机的时候,会发现有些困难,会发现常用的方法并不能用,在还没有接收完数据的时候,就解决不了。于是,只能用通用的方法来解决了。 这个通用的方法,其实原理和使用IDLE的原理一样:...

    昨天
  • ARM处理器的选型原则

    鉴于ARM微处理器的众多优点,随着国内外嵌入式应用领域的逐步发展,ARM微处理器必然会获得广泛的重视和应用。但是,由于ARM微处理器有多达十几种的内核结构,几十个芯片生产厂家,以及千变万化的内部功能配置组合,...

    前天
  • 有哪些低功耗设计方法?单片机系统低功耗设计要点介绍

    功耗,已经是一个老生常谈的话题了。对于功耗,大家多多少少有所了解。目前,很多产品的宣传里便带有低功耗噱头。为增进大家对功耗的认识,本文将基于两点介绍功耗:1.低功耗主要设计方法,2.单片机系统低功耗设计...

    前天
  • 8位32位MCU如何选择?如何选择合适的MCU?

    MCU,对于普通人而言,是一个高大上的存在。但是,在工业中,MCU确实常见产品。为增进大家对MCU的认识,本文将基于两点介绍MCU:1.8位MCU和32位MCU如何选择?2.如何选择合适的MCU。如果你对MCU具有兴趣,不妨继续往...

    07-09
  • ARM开发:一 ARM微处理器概述

    1.1ARM-Advanced RISC Machines ARM(Advanced RISC Machines),既可以认为是一个公司的名字,也可以认为是对一类微处理器的通称,还可以认为是一种技术的名字。 1991年ARM公司成立于英国剑桥,主要出售芯片设计技术...

    07-08
  • 分析C51单片机的一些误区和注意事项

    简介:常看见初学者要求使用_at_,这是一种谬误,把C当作ASM看待了。在C中变量的定位是编译器的事情,初学者只要定义变量和变量的作 用域,编译器就把一个固定地址给这个变量。怎么取得这个变量的地址?要用指针。 1) C...

    07-08
  • 51单片机几个延时程序

    简介:51单片机几个精确延时程序:在精确延时的计算当中,最容易让人忽略的是计算循环外的那部分延时,在对时间要求不高的场合,这部分对程序不会造成影响. 一. 500ms延时子程序(晶振12MHz,一个机器周期1us.) 程...

    07-08
  • 总结单片机软件抗干扰的几种办法

    简介:在提高硬件系统抗干扰能力的同时,软件抗干扰以其设计灵活、节省硬件资源、可靠性好越来越受到重视。下面以MCS-51单片机系统为例,对微机系统软件抗干扰方法进行研究。 1、软件抗干扰方法的研究 在工程实践中...

    07-08
  • 基于C51单片机实现汽车座椅自动控制系统的软硬件设计

    引言 随着人们生活水平的提高,对汽车座椅的舒适性要求也越来越高,要求对汽车座椅地调节能够更加简单、方便、快捷。目前,汽车座椅位置的调节多采用基于手动调节方式的机械和电动控制两种方式。汽车座椅位置的调节...

    07-02
  • MCS51单片机程序设计时堆栈的计算方法解析

    用C语言进行MCS51系列单片机程序设计是单片机开发和应用的必然趋势。Keil公司的C51编译器支持经典8051和8051派生产品的版本,通称为Cx51。应该说,Cx51是C语言在MCS51单片机上的扩展,既有C语言的共性,又有它自己...

    07-02
下载排行榜
更多
评测报告
更多
广告