top命令参数
# top命令行参数
- -b 批处理模式(batch mode),可输出到管道、文件。默认情况下-b会一直输出,可以用-nN指定输出次数。
- -n N限制输出次数。
- -d N 刷新时间间隔。
- -p PID 监控指定进程。
- -H -p PID 监控指定进程和进行内线程信息。
# 进入top界面后的操作
# 按键说明
- c 显示完整的命令名。c为Command之意。
- d 修改刷新时间。d为Display之意。
- u 显示指定用户相关进程。u为User之意。
- P 按CPU使用排序。P为Processor(处理器)之意。
- M 按内存使用排序。M为Momery之意。
- F 排序(进入新的界面,并选择排序的目标字段)。
- R 顺序或逆序。
- H 显示线程。
- Z 以多色彩显示top。
- l/t/m toggle,load/cpu/内存信息
- 1 显示多CPU的信息(多核机器上查看每个CPU的使用率)。
- W 保存当前top的配置
# top显示内容
第一行:
10:01:23 — 当前系统时间
126 days, 14:29 — 系统已经运行了126天14小时29分钟(在这期间没有重启过)
2 users — 当前有2个用户登录系统
load average: 1.15, 1.42, 1.44 — load average后面的三个数分别是1分钟、5分钟、15分钟的负载情况。
load average数据是每隔5秒钟检查一次活跃的进程数,然后按特定算法计算出的数值。如果这个数除以逻辑CPU的数量,结果高于5的时候就表明系统在超负荷运转了。
第二行:
Tasks — 任务(进程),系统现在共有183个进程,其中处于运行中的有1个,182个在休眠(sleep),stoped状态的有0个,zombie状态(僵尸)的有0个。
第三行:cpu状态
6.7% us — 用户空间占用CPU的百分比
0.4% sy — 内核空间占用CPU的百分比
0.0% ni — 改变过优先级的进程占用CPU的百分比
92.9% id — 空闲CPU百分比
0.0% wa — IO等待占用CPU的百分比
0.0% hi — 硬中断(Hardware IRQ)占用CPU的百分比
0.0% si — 软中断(Software Interrupts)占用CPU的百分比
cpu负载过高解决思路:
用户进程占比高,wa低,说明系统缓慢的原因在于进程占用大量CPU,通常还会伴有较低的id,说明CPU空转时间很少;
wa低,id高,可以排除CPU资源瓶颈的可能。
wa高,说明I/O占用了大量的CPU时间,需要检查交换空间的使用,交换空间位于磁盘上,性能远低于内存,当内存耗尽开始使用交换空间时,将会给性能带来严重影响,所以对于性能要求较高的服务器,一般建议关闭交换空间。另一方面,如果内存充足,但wa很高,说明需要检查哪个进程占用了大量的I/O资源。
看是不是软中断,如网卡传输数据要有中断(irq)请求,一般只在CPU0
看是不是程序原因,如一些写的很烂的php,java等程序。这不说数据库(它很特殊)。
看是不是数据库的原因。如数据库做大的全表动态插值运算等。
有没有攻击,使得你的服务只对攻击程序响应。
硬件原因(主板问题,电源问题,这个在品牌上可以看到)。
其他原因(内核参数设置不当,代理程序设置不当)等
第四行:内存状态
8306544k total — 物理内存总量(8GB)
7775876k used — 使用中的内存总量(7.7GB)
530668k free — 空闲内存总量(530M)
79236k buffers — 缓存的内存量 (79M)
第五行:swap交换分区
2031608k total — 交换区总量(2GB)
2556k used — 使用的交换区总量(2.5M)
2029052k free — 空闲交换区总量(2GB)
4231276k cached — 缓冲的交换区总量(4GB)
这里要说明的是不能用windows的内存概念理解这些数据,如果按windows的方式此台服务器“危矣”:8G的内存总量只剩下530M的可用内存。Linux的内存管理有其特殊性,复杂点需要一本书来说明,这里只是简单说点和我们传统概念(windows)的不同。
第四行中使用中的内存总量(used)指的是现在系统内核控制的内存数,空闲内存总量(free)是内核还未纳入其管控范围的数量。纳入内核管理的内存不见得都在使用中,还包括过去使用过的现在可以被重复利用的内存,内核并不把这些可被重新使用的内存交还到free中去,因此在linux上free内存会越来越少,但不用为此担心。如果出于习惯去计算可用内存数,这里有个近似的计算公式:第四行的free + 第四行的buffers + 第五行的cached,按这个公式此台服务器的可用内存:530668+79236+4231276 = 4.7GB。
物理已用=实际已用-缓冲-缓存 物理空闲=总内存-实际已用+缓冲+缓存
对于内存监控,在top里我们要时刻监控第五行swap交换分区的used,如果这个数值在不断的变化,说明内核在不断进行内存和swap的数据交换,这是真正的内存不够用了。
第六行是空行
第七行以下:各进程(任务)的状态监控
- PID — 进程id
- USER — 进程所有者
- PR — 进程优先级
- NI — nice值。负值表示高优先级,正值表示低优先级
- VIRT — 进程使用的虚拟内存总量,单位kb。VIRT=SWAP+RES
- RES — 进程使用的、未被换出的物理内存大小,单位kb。RES=CODE+DATA SHR — 共享内存大小,单位kb
- S — 进程状态。D=不可中断的睡眠状态 R=运行 S=睡眠 T=跟踪/停止 Z=僵尸进程
- %CPU — 上次更新到现在的CPU时间占用百分比
- %MEM — 进程使用的物理内存百分比
- TIME+ — 进程使用的CPU时间总计,单位1/100秒
- COMMAND — 进程名称(命令名/命令行)
# 查看快捷键
# 输入1可以看到CPU各个核的CPU负载
Cpu0 : 1.0%us, 3.0%sy, 0.0%ni, 96.0%id, 0.0%wa, 0.0%hi, 0.0%si, 0.0%st
Cpu1 : 0.0%us, 0.0%sy, 0.0%ni,100.0%id, 0.0%wa, 0.0%hi, 0.0%si, 0.0%st
这里对us,sy,ni,id,wa,hi,si,st进行分别说明:
us 列显示了用户模式下所花费 CPU 时间的百分比。
us的值比较高时,说明用户进程消耗的cpu时间多,但是如果长期大于50%,需要考虑优化用户的程序。
sy 列显示了内核进程所花费的cpu时间的百分比。
这里us + sy的参考值为80%,如果us+sy 大于 80%说明可能存在CPU不足。
ni 列显示了用户进程空间内改变过优先级的进程占用CPU百分比。
id 列显示了cpu处在空闲状态的时间百分比。
wa 列显示了IO等待所占用的CPU时间的百分比。
这里wa的参考值为30%,如果wa超过30%,说明IO等待严重,这可能是磁盘大量随机访问造成的,也可能磁盘或者磁盘访问控制器的带宽瓶颈造成的(主要是块操作)。 // 这个wa和vmstat中的wa是相同含义 hi 硬件中断占用CPU si 软件中断占用CPU st 丢失时间占用CPU
在后台服务器开发中需要关注us,sy,id,wa等常用指标。
# 输入u,输入用户名,查看指定用户的进程信息
u 输入用户名 查看指定用户的进程信息(多个用户使用同一台机器开发时,非常有用)
# 按CPU占用率排序
Shift+p 按CPU排序
# 按内存占用率排序
Shift+m 按内存使用排序
# 按CPU占用时间排序
Shift+t 按CPU用时排序
# 其它:
Shift+n 按PID排序
注意:如果在命令行选项中使用了s选项,则可能其中一些命令会被屏蔽掉。