在使用top命令的時候會看到這么一行:
翻譯一下:
us:用戶態(tài)使用的cpu時間比
sy:系統(tǒng)態(tài)使用的cpu時間比
ni:用做nice加權的進程分配的用戶態(tài)cpu時間比
id:空閑的cpu時間比
wa:cpu等待磁盤寫入完成時間
hi:硬中斷消耗時間
si:軟中斷消耗時間
st:虛擬機偷取時間
如果一臺機器看到wa特別高,那么一般說明是磁盤IO出現(xiàn)問題,可以使用iostat等命令繼續(xù)進行詳細分析。
1, 安裝??iostat??
yum install sysstat
之后就可以使用?iostat 命令了,
2,入門使用
iostat -d -k 2
參數 -d 表示,顯示設備(磁盤)使用狀態(tài);-k某些使用block為單位的列強制使用Kilobytes為單位;2表示,數據顯示每隔2秒刷新一次。
?
tps:該設備每秒的傳輸次數(Indicate the number of transfers per second that were issued to the device.)。"一次傳輸"意思是"一次I/O請求"。多個邏輯請求可能會被合并為"一次I/O請求"。"一次傳輸"請求的大小是未知的。
?
kB_read/s:每秒從設備(drive expressed)讀取的數據量;
kB_wrtn/s:每秒向設備(drive expressed)寫入的數據量;
kB_read:讀取的總數據量;
kB_wrtn:寫入的總數量數據量;這些單位都為Kilobytes。
指定監(jiān)控的設備名稱為sda,該命令的輸出結果和上面命令完全相同。
?iostat -d sda 2
默認監(jiān)控所有的硬盤設備,現(xiàn)在指定只監(jiān)控sda。?
3, -x 參數
iostat還有一個比較常用的選項-x,該選項將用于顯示和io相關的擴展數據。
iostat -d -x -k 1 10
輸出信息的含義
rrqm/s:每秒這個設備相關的讀取請求有多少被Merge了(當系統(tǒng)調用需要讀取數據的時候,VFS將請求發(fā)到各個FS,如果FS發(fā)現(xiàn)不同的讀取請求讀取的是相同Block的數據,
FS會將這個請求合并Merge);
wrqm/s:每秒這個設備相關的寫入請求有多少被Merge了。
?
rsec/s:每秒讀取的扇區(qū)數;
wsec/:每秒寫入的扇區(qū)數。
rKB/s:The number of read requests that were issued to the device per second;
wKB/s:The number of write requests that were issued to the device per second;
avgrq-sz 平均請求扇區(qū)的大小
avgqu-sz 是平均請求隊列的長度。毫無疑問,隊列長度越短越好。???
await:? 每一個IO請求的處理的平均時間(單位是微秒毫秒)。這里可以理解為IO的響應時間,一般地系統(tǒng)IO響應時間應該低于5ms,如果大于10ms就比較大了。
???????? 這個時間包括了隊列時間和服務時間,也就是說,一般情況下,await大于svctm,它們的差值越小,則說明隊列時間越短,反之差值越大,隊列時間越長,說明系統(tǒng)出了問題。
svctm??? 表示平均每次設備I/O操作的服務時間(以毫秒為單位)。如果svctm的值與await很接近,表示幾乎沒有I/O等待,磁盤性能很好,如果await的值遠高于svctm的值,
則表示I/O隊列等待太長,????????
系統(tǒng)上運行的應用程序將變慢。
%util: 在統(tǒng)計時間內所有處理IO時間,除以總共統(tǒng)計時間。例如,如果統(tǒng)計間隔1秒,該設備有0.8秒在處理IO,
而0.2秒閑置,那么該設備的%util = 0.8/1 = 80%,
所以該參數暗示了設備的繁忙程度
。一般地,如果該參數是100%表示設備已經接近滿負荷運行了
?。ó斎蝗绻嵌啻疟P,即使%util是100%,因為磁盤的并發(fā)能力,所以磁盤使用未必就到了瓶頸)。
?
4,?常見用法
iostat -d -k 1 10???????? #查看TPS和吞吐量信息(磁盤讀寫速度單位為KB)
iostat -d -m 2??????????? #查看TPS和吞吐量信息(磁盤讀寫速度單位為MB)
iostat -d -x -k 1 10????? #查看設備使用率(%util)、響應時間(await) iostat -c 1 10 #查看cpu狀態(tài)
?
5, 實例分析
iostat -d -k 1 | grep vda
Device:??????????? tps??? kB_read/s??? kB_wrtn/s??? kB_read??? kB_wrtn
sda10????? ??????60.72??????? 18.95??????? 71.53? 395637647 1493241908
sda10?????????? 299.02????? 4266.67?????? 129.41?????? 4352??????? 132
sda10?????????? 483.84????? 4589.90????? 4117.17?????? 4544?????? 4076
sda10?????????? 218.00????? 3360.00?????? 100.00???? ??3360??????? 100
sda10?????????? 546.00????? 8784.00?????? 124.00?????? 8784??????? 124
sda10?????????? 827.00???? 13232.00?????? 136.00????? 13232??????? 136
上面看到,磁盤每秒傳輸次數平均約400;每秒磁盤讀取約5MB,寫入約1MB。
?
?
iostat -d -x -k 1
Device:??? rrqm/s wrqm/s?? r/s?? w/s? rsec/s? wsec/s??? rkB/s??? wkB/s avgrq-sz avgqu-sz?? await? svctm? %util
sda????????? 1.56? 28.31? 7.84 31.50?? 43.65??? 3.16??? 21.82???? 1.58???? 1.19???? 0.03??? 0.80?? 2.61? 10.29
sda????????? 1.98? 24.75 419.80? 6.93 13465.35? 253.47? 6732.67?? 126.73??? 32.15???? 2.00??? 4.70?? 2.00? 85.25
sda???????? ?3.06? 41.84 444.90 54.08 14204.08 2048.98? 7102.04? 1024.49??? 32.57???? 2.10??? 4.21?? 1.85? 92.24
可以看到磁盤的平均響應時間<5ms,磁盤使用率>80。磁盤響應正常,但是已經很繁忙了。
可以看到磁盤的平均響應時間<5ms,磁盤使用率>90。磁盤響應正常,但是已經很繁忙了。
await:? 每一個IO請求的處理的平均時間(單位是微秒毫秒)。這里可以理解為IO的響應時間,一般地系統(tǒng)IO響應時間應該低于5ms,如果大于10ms就比較大了
svctm??? 表示平均每次設備I/O操作的服務時間(以毫秒為單位)。如果svctm的值與await很接近,表示幾乎沒有I/O等待,磁盤性能很好,如果await的值遠高于svctm的值,則表示I/O隊列等待太長,? 系統(tǒng)上運行的應用程序將變慢。
%util: 在統(tǒng)計時間內所有處理IO時間,除以總共統(tǒng)計時間。所以該參數暗示了設備的繁忙程度。一般地,如果該參數是100%表示設備已經接近滿負荷運行了(當然如果是多磁盤,即使%util是100%,因為磁盤的并發(fā)能力,所以磁盤使用未必就到了瓶頸)。
也可以使用下面的命令,同時顯示cpu和磁盤的使用情況
等待時間超過5ms, 磁盤io有問題
?
?
本文摘自 :https://blog.51cto.com/u