Linux 系统性能优化

赵小心 发表于 2023-7-8 14:41:42

一、影响 Linux 性能的各种因素
1、系统硬件资源
（1）CPU
如何判断多核 CPU 与超线程
消耗 CPU 的业务：动态 web 服务、mail 服务
（2）内存

[*]物理内存与 swap 的取舍
[*]选择 64 位 Linux 操作系统
消耗内存的业务：内存数据库（redis/hbase/mongodb）
（3）磁盘 IO

[*]RAID 技术（RAID0/1/5/01/10）
[*]SSD 磁盘
消耗磁盘的业务：数据库服务器
（4）网络带宽

[*]网卡/交换机的选择
[*]操作系统双网卡绑定
消耗带宽的业务：hadoop 平台、视频业务平台
2、操作系统相关资源
（1）系统安装优化
磁盘分区、RAID 设置、swap 设置
（2）内核参数优化
ulimit -n（最大打开文件数）
ulimit -u（最大用户数）
（3）文件系统优化

[*]ext2：Linux 下标准文件系统，无日志记录（inode）功能。
[*]ext3：在ext2 基础上增加了日志记录功能（inode），仅支持 32000 个子目录。
[*]ex4：ext3 的后续版本，Linux2.6.28 内核开始支持。无限子目录支持，快速 fsck。
[*]xfs：高性能文件系统，Linux3.10 内核开始默认支持。
建议：
读操作频繁，同时小文件众多的应用：首选 ext4 文件系统，接下来依次是 xfs、ext3
写操作频繁的应用，首选是 xfs，接下来依次是 ext4 和 ext3
对性能要求丌高、数据安全要求丌高的业务，ext3 是比较好的选择。
3、程序问题
此类问题需要开发人员查看代码，介入处理。但作为运维人员需要给出程序问题的有力证据。

二、Linux 性能优化工具
1、CPU 性能评估工具
（1）vmstat（系统默认自带）
利用 vmstat 命令可以对操作系统的内存信息、进程状态、CPU活劢等进行监视。
常用方式：vmstat 2 3
表示每 3 秒更新一次输出信息，统计 5 次后停止输出。
下面是 vmstat 命令在某个系统的输出结果：
对上面每项的输出解释如下：

[*]procs

[*]r 列表示运行和等待 cpu 时间片的进程数，这个值如果长期大于系统CPU 的个数，说明 CPU 不足，需要增加 CPU。
[*]b 列表示在等待资源的进程数，比如正在等待 I/O、或者内存交换等。

[*]memory

[*]swpd 列表示切换到内存交换区的内存数量（以 k为单位）。如果 swpd 的值不为0，或者比较大，只要 si、so 的值长期为 0，这种情况下一般不用担心，不会影响系统性能。
[*]free列表示当前空闲的物理内存数量（以 k为单位）
[*]buff 列表示 buffers cache的内存数量，一般对块设备的读写才需要缓冲。
[*]cache列表示 page cached 的内存数量，一般作为文件系统 cached，频繁访问的文件都会被 cached，如果 cache 值较大，说明 cached 的文件数较多，如果此时 IO 中 bi比较小，说明文件系统效率比较好。

[*]swap

[*]si列表示由磁盘调入内存，也就是内存进入内存交换区的数量。
[*]so 列表示由内存调入磁盘，也就是内存交换区进入内存的数量。
一般情况下， si、 so 的值都为 0，如果 si、 so 的值长期不为 0，则表示系统内存不足。需要增加系统内存。

[*]IO 项显示磁盘读写状况

[*]Bi列表示从块设备读入数据的总量（即读磁盘）（每秒 kb）。
[*]Bo 列表示写入到块设备的数据总量（即写磁盘）（每秒 kb）。
这里我们设置的 bi+bo 参考值为 1000，如果超过 1000，而且 wa值较大，则表示系统磁盘 IO 有问题，应该考虑提高磁盘的读写性能。

[*]system 显示采集间隔内发生的中断数

[*]in 列表示在某一时间间隔中观测到的每秒设备中断数。
[*]cs 列表示每秒产生的上下文切换次数。
上面这 2 个值越大，会看到由内核消耗的 CPU 时间会越多。

[*]CPU 项显示了 CPU 的使用状态，此列是我们关注的重点。

[*]us 列显示了用户进程消耗的 CPU 时间百分比。us 的值比较高时，说明用户进程消耗的 cpu 时间多，但是如果长期大于 50%，就需要考虑优化程序或算法。
[*]sy列显示了内核进程消耗的 CPU 时间百分比。Sy的值较高时，说明内核消耗的CPU 资源很多。
根据经验， us+sy的参考值为 80%，如果 us+sy大于 80%说明可能存在 CPU 资源不足。

[*]id 列显示了 CPU 处在空闲状态的时间百分比。
[*]wa 列显示了 IO 等待所占用的 CPU 时间百分比。wa 值越高，说明 IO 等待越严重，根据经验，wa 的参考值为 20%，如果 wa 超过 20%，说明 IO 等待严重，引起 IO 等待的原因可能是磁盘大量随机读写造成的，也可能是磁盘或者磁盘控制器的带宽瓶颈造成的（主要是块操作）。
综上所述，在对 CPU 的评估中，需要重点注意的是procs 项 r 列的值和 CPU 项中 us、sy和 id 列的值。
（2）iostat（需要安装 sysstat 工具包）
iostat 是 I/O statistics（输入/输出统计）的缩写，主要的功能是对系统的磁盘 I/O 操作进行监视。
常用方式：iostat -c 3 5
其中，-c 表示显示CPU 的使用情况，-d：显示磁盘的使用情况。
（3）uptime 命令
uptime 是监控系统性能最常用的一个命令，主要用来统计系统当前的运行状况，输出的信息依次为：系统现在的时间、系统从上次开机到现在运行了多长时间、系统目前有多少登陆用户、系统在一分钟内、五分钟内、十五分钟内的平均负载。
2、内存性能评估
（1）free 命令
free 命令是监控 linux 内存使用状况最常用的指令
常见用法：free –m
看下面的一个输出：
“free –m”表示以 M为单位查看内存使用情况，在这个输出中，我们重点关注的应该是 free 列与 cached 列的输出值，由输出可知，此系统共 8G 内存，系统空闲内存还有925M，其中，Buffer Cache 占用了 243M，Page Cache 占用了 6299M，由此可知系统缓存了很多的文件和目录，而对于应用程序来说，可以使用的内存还有 7468M，当然这个 7468M 包含了 Buffer Cache 和 Page Cache 的值。在 swap 项可以看出，交换分区还未使用。所以从应用的角度来说，此系统内存资源还非常充足。

一般有这样一个经验公式：应用程序可用内存/系统物理内存>70%时，表示系统内存资源非常充足，不影响系统性能，应用程序可用内存/系统物理内存

页: [1]

翼度科技's Archiver

Linux 系统性能优化