刘兆安 发表于 2023-8-20 21:33:49

Linux服务器的性能监控与分析

通过vmstat分析性能


 如上图所示,我们在命令vmstat后面添加了两个参数,1表示间隔一秒获取一次,10表示总共获取10次
我们一列一列数据来看:

[*]r:代表目前实际运行的指令队列,很高表示CPU很繁忙通常会CPU使用率过高

[*]这个数据如果高于服务器CPU核数就可能出现瓶颈(需要结合后五列CPU使用百分比)
[*]超过CPU核数的3个就比较高,超过5个已经很高,超过10个就比较危险了

[*]b:目前因为等待资源而阻塞运行指令,比如等待I/O,内存交换、CPU资源瓶颈
[*]swpd:表示虚拟内存(swap)已使用的大小。当服务器物理内存不够用时候,会把物理内存的部分空间释放出来,以供急需物理内存的来运行的程序使用,而从物理内存释放出来的一般是很长时间没有实际运行的程序。被保存到虚拟内存的内容等到运行起来,会从虚拟内存中恢复到物理内存。swpd大于0,不代表物理内存不够用了,需要结合si和so,如果si和so为0,表示物理内存是够用的
[*]free:空闲的物理内存
[*]buff:系统缓冲区的内存大小,只有对块设备读写才会需要缓冲区
[*]cache:给已经打开的文件作为缓存的内存大小
[*]si:每秒从虚拟内存读到内存中的数据大小,如果这个值长期大于0,表示物理内存不够用了
[*]so:每秒写入虚拟内存的数据内容大小
[*]bi和bo:表示每秒块设备读写,bi和bo两个值越大,CPU在I/O等待的值越大
[*]in:CPU中断次数
[*]cs:CPU每秒上下文切换次数,这值要越小越好,太大了要考虑调低线程和进程数量。上下文切换次数过多会让CPU大部分时间都浪费在上下文切换上,CPU正经运行就少了,CPU没有充分被利用。
[*]us:用户模式CPU使用时间百分比,越高越好,说明CPU被充分利用了
[*]sy:系统内核执行时间百分比,太高说明系统内核消耗CPU资源多
[*]id:表示空闲空闲CPU占比,一般id + us + sy =100
[*]wa:表示I/O等待时间百分比,越高说明I/O等待情况严重
[*]st:改值一般都是0,一般在虚拟机中才会有
通过mpstat分析性能


  如上图所示,我们在命令mpstat后面添加了两个参数,1表示间隔一秒获取一次,10表示总共获取10次

[*]%usr:用户模式下CPU使用时间的百分比,和vmstat中us数据基本一致
[*]%nice:CPU进程优先级调度占用的时间,这个值一般都是0,只有修改过默认优先级才会显示
[*]%sys:表示系统内核进程执行时间百分比(system time)。该值越高,说明系统内核消耗的CPU资源越多,和vmstat命令中的sy数据基本一致。
[*]%iowait:表示I/O等待时间的百分比。该值越高,说明IO等待越严重,和vmstat命令中的wa数据基本一致。
[*]%irq:表示用于处理系统中断的CPU百分比。和vmstat命令中的in数据的含义类似。in越高,%irq也会越高。
[*]%soft:表示用于软件中断的CPU百分比
[*]%steal:表示CPU等待虚拟机调度的时间占比。这个指标一般在虚拟机中才会有,物理机中该值一般维持为0,和vmstat命令中的st数据基本一致。
[*]%idle:表示空闲CPU时间的占比。和vmstat命令中的id数据基本一致
通过pidstat分析性能



[*]UID:用户id
[*]PID:进程id
[*]%usr:进程对用户模式CPU使用的时间
[*]%system:进程对系统模式CPU使用的时间
[*]CPU:执行指定进程的CPU编号
[*]Command:当前进程运行命令
通过free看内存



[*] total:显示系统总的物理内存和交换区大小单位是k
[*]used:显示已经被使用的物理内存和交换区大小单位是k
[*]free:显示还有多少未使用的物理内存和交换区单位是k
[*]shared:显示共享区占用的物理内存大小单位是k
[*]buff/cache:缓冲区和缓存合计使用的内存大小单位是k
[*]available列:显示的是可用物理内存的大小,单位为k。通常情况下,available的值等于free+buff/cache。
通过top系统情况


[*] 第一行显示的是系统运行信息:系统时间20:04:16秒、系统运行了12天、当前登陆用户2个、系统平均负载:4.75(1分钟平均负载压力),2.83(5分钟平均负载压力),2.02(15分钟平均负载压力)(这个数值除以CPU核数得到的值大于3-5时,系统负载就超高了)
[*]第二行显示任务信息:总进程352,1个运行状态,298个休眠中,0个停止,0个假死
[*]第3行显示的是CPU的运行信息: 11.1us表示用户模式下CPU占用比为11.1%,5.0 sy表示系统模式下CPU占用比为5.0%,0.1 ni表示改变过优先级的进程的CPU占用比为0.1%,83.2 id表示空闲状态的CPU占用比为83.2%,0.3 wa表示因为I/O等待造成的CPU占用比为0.3%,0.0 hi表示硬中断的CPU占用比,0.3 si表示软中断的CPU的占用比。0.0 st表示CPU等待虚拟机调度的时间占比,这个指标一般在虚拟机中才会有,在物理机中该值一般维持为0。
[*]第4行显示的是内存的使用信息:total表示物理内存的总量,free表示物理内存的空闲大小,198808 used表示已使用的物理内存的大小,buff/cache表示用于缓存的物理内存的大小。
[*]第5行显示的是虚拟内存(swap)的使用信息: total表示虚拟内存空间的大小, free表示空闲的虚拟内存空间的大小, used表示已使用的虚拟内存空间的大小, avail Mem表示可供使用的内存大小。
[*]第7行显示的是每个进程的资源消耗信息

[*]%CPU:进程运行时CPU占用比
[*]%MEM:进程使用的内存占用比
[*]TIME+:进程占用CPU总时长
[*]COMMAND:正在运行的命令

友情链接
https://www.cnblogs.com/yetangjian/p/15705398.html

来源:https://www.cnblogs.com/yetangjian/p/17644519.html
免责声明:由于采集信息均来自互联网,如果侵犯了您的权益,请联系我们【E-Mail:cb@itdo.tech】 我们会及时删除侵权内容,谢谢合作!
页: [1]
查看完整版本: Linux服务器的性能监控与分析