博威---云架构决胜云计算

 找回密码
 注册

QQ登录

只需一步,快速开始

搜索
查看: 6379|回复: 1

平均查找性能提高了 715 倍,Linux 6.2 合并华为贡献的代码

[复制链接]
发表于 2022-12-14 13:46:22 | 显示全部楼层 |阅读模式
平均查找性能提高了 715 倍,Linux 6.2 合并华为贡献的代码 2022-12-14 11:01

IT之家 12 月 14 日消息,Linux 6.2 今日合并了来自华为郑磊(Zhen Lei,音译)的代码,将核心内核功能的速度提高了 715 倍。
在合并代码模块介绍中写道:“得益于 Zhen Lei 的代码,Tux(Linux 的吉祥物,这里指 Linux)在 kallsyms_lookup_name 平均查找性能提高了 715 倍,将我们的旧实现从 O (n) 升级到 O (log (n)),同时还保留了 / proc / kallsyms 上的旧实现支持”。
IT之家了解到,kallsyms_lookup_name 函数用于根据一个符号的名称查询其地址,并可用于内核符号表内任何符号的查询。
华为的 Zhen Lei 在之前的补丁贴中描述了对 kallsyms_lookup_name 的优化:
目前,为了搜索一个符号,我们需要将 'kallsyms_names' 中的符号逐一展开,然后使用展开后的字符串进行比较。这是 O (n)。
如果我们像地址一样将名字按升序排序,我们也可以使用二进制搜索。而这就是 O (log (n))。
为了不改变“/proc/ kallsyms”的实现,表 kallsyms_names [] 仍然以升序与地址一一对应的方式存储。
增加数组 kallsyms_seqs_of_names [],它以排序后的名字的序列号为索引,对应的内容是排序后的地址的序列号。
例如,假设 NameX 在数组 kallsyms_seqs_of_names [] 中的索引是 'i',kallsyms_seqs_of_names 的内容是 'k',那么 NameX 的对应地址是 kallsyms_addresses [k]。kallsyms_names [] 中的偏移是 get_symbol_offset (k)。
注意,内存使用量将增加 (4 * kallsyms_num_syms) 字节,接下来的两个补丁将减少 (1 * kallsyms_num_syms) 字节并正确处理 CONFIG_LTO_CLANG=y 的情况。
性能测试结果(在 x86 平台上):
之前:
min=234, max=10364402, avg=5206926
min=267, max=11168517, avg=5207587
之后:
min=1016, max=90894, avg=7272
min=1014, max=93470, avg=7293
kallsyms_lookup_name 的平均查询性能提高了 715 倍。这是 kallsyms_lookup_name 一次重大改进,也是 Linux 6.2 的圣诞礼物

 楼主| 发表于 2022-12-14 13:47:05 | 显示全部楼层
12 月 14 日消息,Linux 6.2 今日合并了来自华为郑磊(Zhen Lei,音译)的代码,将核心内核功能的速度提高了 715 倍。
在合并代码模块介绍中写道:“得益于 Zhen Lei 的代码,Tux(Linux 的吉祥物,这里指 Linux)在 kallsyms_lookup_name () 平均查找性能提高了 715 倍,将我们的旧实现从 O (n) 升级到 O (log (n)),同时还保留了 / proc / kallsyms 上的旧实现支持”。
IT之家了解到,kallsyms_lookup_name () 函数用于根据一个符号的名称查询其地址,并可用于内核符号表内任何符号的查询。
华为的 Zhen Lei 在之前的补丁贴中描述了对 kallsyms_lookup_name 的优化:
目前,为了搜索一个符号,我们需要将 'kallsyms_names' 中的符号逐一展开,然后使用展开后的字符串进行比较。这是 O (n)。
如果我们像地址一样将名字按升序排序,我们也可以使用二进制搜索。而这就是 O (log (n))。
为了不改变“/proc/ kallsyms”的实现,表 kallsyms_names [] 仍然以升序与地址一一对应的方式存储。
增加数组 kallsyms_seqs_of_names [],它以排序后的名字的序列号为索引,对应的内容是排序后的地址的序列号。
例如,假设 NameX 在数组 kallsyms_seqs_of_names [] 中的索引是 'i',kallsyms_seqs_of_names 的内容是 'k',那么 NameX 的对应地址是 kallsyms_addresses [k]。kallsyms_names [] 中的偏移是 get_symbol_offset (k)。
注意,内存使用量将增加 (4 * kallsyms_num_syms) 字节,接下来的两个补丁将减少 (1 * kallsyms_num_syms) 字节并正确处理 CONFIG_LTO_CLANG=y 的情况。
性能测试结果(在 x86 平台上):
之前:
min=234, max=10364402, avg=5206926
min=267, max=11168517, avg=5207587
之后:
min=1016, max=90894, avg=7272
min=1014, max=93470, avg=7293
kallsyms_lookup_name () 的平均查询性能提高了 715 倍。这是 kallsyms_lookup_name 一次重大改进,也是 Linux 6.2 的圣诞礼物。

您需要登录后才可以回帖 登录 | 注册

本版积分规则

小黑屋|手机版|Archiver|boway Inc. ( 冀ICP备10011147号 )

GMT+8, 2024-11-22 13:39 , Processed in 0.094253 second(s), 17 queries .

Powered by Discuz! X3.4

Copyright © 2001-2021, Tencent Cloud.

快速回复 返回顶部 返回列表