Kinerja "statistik" tanpa PerfStat atau Ops Mgr
PerfStat adalah cara yang bagus untuk mendapatkan informasi kinerja yang cukup rinci dari filer ketika Anda memiliki kinerja atau masalah lain yang Anda tidak bisa meletakkan jari Anda pada. Anda perlu memiliki akses ke Viewer PerfStat, atau mendapatkan seseorang untuk memproses output ini untuk Anda, dan kemudian Anda perlu trawl melalui itu.
Manajer Operasional, dan lebih khusus Advisor Kinerja adalah brilian dan 99% dari waktu memberikan counter Anda perlu mendiagnosis masalah. Setelah Anda menemukan putaran jalan itu, itu benar-benar sangat diperlukan!
Tetapi bagaimana jika Anda tidak memiliki Manajer Operasional, atau Anda hanya ingin cepat menarik keluar informasi pada satu bidang sistem?
Pertama hal yang Anda ingin melihat sysstat. Teman semua orang terbaik dan cara yang bagus untuk melihat "Apakah sistem saya sibuk?". Setiap kali Anda menjalankan sysstat, pastikan untuk melalui itu pengubah "-s" sehingga Anda mendapatkan ringkasan di akhir output. Jika Anda tidak menentukan jumlah iterasi (-c <num>), kemudian ctrl + c untuk memecah output. "-X" bagus untuk memberikan semua bidang output, tetapi dapat menjadi sedikit lebar kadang-kadang. "-U" adalah favorit saya karena memberikan pembacaan pemanfaatan dan ini biasanya yang paling berguna ketika troubleshooting.
Sebagian besar kolom cukup jelas diri. CPU% sibuk, NFS, CIFS, HTTP, FCP dan iSCSI adalah operasi protokol semua counter. Bersih kB / s dalam dan keluar yang jelas (untuk referensi antarmuka gigabit tunggal dengan senang hati akan mempertahankan sekitar 80MB / s, tetapi dapat meregang untuk 110/120MB/s). Disk dan Tape dalam & luar. Saksikan usia cache ketika itu jadi sangat rendah, tapi ada counter yang lebih baik untuk itu. Cache hit adalah counter yang Anda inginkan sebagai mendekati 100% mungkin. Semakin banyak data semakin dibaca dari cache yang lebih baik! Tipe CP Poin Konsistensi, saya tidak akan pergi ke detail tentang apa ini, ada artikel KB yang sangat baik ini sudah (https://now.netapp.com/Knowledgebase/solutionarea.asp?id=kb23471) . Dan akhirnya Disk Pemanfaatan yang tampaknya menyebabkan kebingungan. Ini adalah pembacaan dari disk tersibuk tunggal dalam sistem, dan bukan rata-rata. Bacaan ini bisa menarik sekitar 100% (seperti CPU juga bisa), dan ini hanya berarti disk melakukan lebih dari yang seharusnya!
Jadi sysstat merupakan cara terbaik untuk mendapatkan tampilan tingkat tinggi "Apakah sistem saya sibuk" dan juga memberikan gambaran kasar tentang mana hambatan tersebut. Jika CPU sangat tinggi, tetapi tidak ada yang lain, maka ini adalah apa yang menahan sistem. Jika pemanfaatan disk sangat tinggi, sekali lagi, di sini adalah masalah. Tapi ini bukan angka konklusif, dan tidak menunjuk langsung pada pelakunya. Sebagai contoh jika pemanfaatan disk sangat tinggi, Anda mungkin perlu untuk menjalankan sebuah WAFL realokasi sebagaimana Anda telah menambahkan beberapa disk baru dan ini tidak memegang data apapun belum. Jika CPU Anda sangat tinggi, mungkin bahwa Anda sedang melakukan banyak pengolahan lain seperti A-SIS dan SnapVault, atau bisa juga IO sangat acak sehingga CPU bekerja lebih keras mencoba membuat perhitungan sekitar ini.
Langkah berikutnya mungkin untuk melihat statit. Sebuah "priv mengatur maju" perintah, dan bukan untuk tipuan yang tanggung, perintah yang bagus untuk mendapatkan gambaran dari rincian lebih periode. Cukup jalankan "statit-b" pada awal periode pemantauan, dan kemudian "statit-e" di akhir. Pastikan untuk login jendela output Anda karena Anda akan mendapatkan banyak dari statit (lebih dari standar Windows dan Putty penyangga akan menunjukkan). Ada banyak output statit, dan saya tidak akan masuk ke detail terlalu banyak di dalamnya semua di sini (tapi mungkin hari lain). Sebagian besar adalah cukup jelas kok.
Hal ini membawa saya ke alasan sebenarnya untuk artikel ini di tempat pertama. Salah satu perintah favorit saya, dan tentu yang terlewatkan, "statistik". Ini memiliki banyak informasi di ujung jari itu, apa pun cukup banyak yang dapat Anda lihat dari dalam Advisor Kinerja dan apapun yang Anda dapat melaporkan di PerfStats tersedia di perintah statistik. Dan mungkin banyak lagi! "Statistik" bekerja sangat mirip dengan sysstat di bahwa laporan counter berdasarkan iterasi. Jika Anda hanya menjalankannya, itu akan melaporkan sistem apa yang dilakukan pada waktu yang tepat. Jika Anda mengatakan itu untuk menjalankan setiap 5 detik, itu akan melaporkan apa yang terjadi selama lebih dari 5 detik.
Jadi pertama naik, jangan hanya di dan menjalankan "menunjukkan statistik" tanpa harus beberapa menit untuk cadangan. Output sangat lengkap! Pertama Anda ingin melihat apa yang counter yang tersedia. Statistik dibagi menjadi "Objek", "Contoh" dan "Penghitung". Untuk menampilkan masing-masing, kita dapat menggunakan "daftar statistik ..."
filer01> statistik daftar objek
Objek:
membuang
logical_replication_source
logical_replication_destination
vfiler
qtree
agregat
iscsi
FCP
cifs
volume
lun
target
NFSv3
ifnet
prosesor
disk yang
sistem
filer01> daftar statistik kasus ifnet
Contoh untuk nama objek: ifnet
B2net
Penyimpanan-101
filer01> statistik daftar counter ifnet
Counter untuk nama objek: ifnet
recv_packets
recv_errors
send_packets
send_errors
tabrakan
recv_data
send_data
recv_mcasts
send_mcasts
recv_drop_packets
Sebagai contoh di atas, saya bisa menunjukkan semua benda yang tersedia untuk saya, saya bisa query semua contoh jaringan yang saya setup (2 VIFs, 1 dengan VLAN), dan saya dapat melihat apa counter saya dapat melaporkan. Sehingga menempatkan ini bersama-sama ...
filer01> statistik menunjukkan ifnet: Penyimpanan-101: tabrakan
ifnet: Penyimpanan-101: tabrakan: 0 / s
Besar, antarmuka penyimpanan saya tidak memiliki tabrakan jaringan untuk periode ini telah lari! Itu kabar baik bagi saya!
Jika saya ingin menjalankan ini selama beberapa iterasi, saya bisa makan itu pilihan lagi. Catatan: Pilihan yang harus pergi sebelum informasi kontra!
filer01> statistik acara-n 5-i 1 ifnet: Penyimpanan-101: tabrakan
Instance tabrakan
/ S
Penyimpanan-101 0
Penyimpanan-101 0
Penyimpanan-101 0
Penyimpanan-101 0
Penyimpanan-101 0
Bagus, jadi selama 5 detik aku masih tidak mendapatkan tabrakan!
Anda akan melihat dari atas bahwa ada banyak counter kinerja tersedia, dan tidak semua dari mereka memiliki verbose paling nama. Anda dapat permintaan salah satu dengan menjalankan "statistik menjelaskan counter".
filer01> statistik menjelaskan counter ifnet tabrakan
Counter untuk nama objek: ifnet
Nama: tabrakan
Description: Tabrakan per detik pada interface CSMA
Properties: tingkat
Unit: per_sec
Jadi mari kita ambil contoh lain, saya ingin melihat pembacaan latency pada sistem Penukaran saya ...
filer01> statistik acara-n 5-i 1 volume: exch01_db: read_latency volume: exch01_db: volume write_latency: exch01_logs: volume read_latency: exch01_logs: write_latency
Instance read_latency write_latenc
ms ms
exch01_db 0 0
exch01_logs 0 0
exch01_db 0 0
exch01_logs 0 0
exch01_db 0 0
exch01_logs 0 0
exch01_db 0 0
exch01_logs 0 0
exch01_db 0 0
exch01_logs 0 0
Itu 8 pagi, tidak ada tim penjualan terjaga belum! Judul kolom mendapatkan sedikit miring, tapi kita bisa melihat latency membaca di kolom pertama, dan menulis latency di kedua.
Salah satu keluhan terbesar saya tentang sysstat adalah apa yang terjadi jika saya ingin terus berjalan ini selama periode waktu dan log output? Yah, aku dapat mengubah "autologout pilihan" dan meninggalkan laptop saya ditancapkan, tapi itu tidak pernah ide yang baik. "Statistik" memberikan anda kemampuan untuk pipa semua output statistik langsung ke sebuah file. Brilliant berita!
filer01> statistik acara-n 5-i 1-o / etc / stats.txt volume: exch01_db: read_latency volume: exch01_db: write_latency volume: exch01_logs: volume read_latency: exch01_logs: write_latency
filer01> rdfile / etc / stats.txt
Instance read_latency write_latenc
ms ms
exch01_db 0 16.00
exch01_logs 0 0
exch01_db 0 0
exch01_logs 0 0
exch01_db 0 8.00
exch01_logs 0 0
exch01_db 0 0
exch01_logs 0 0
exch01_db 0 1.00
exch01_logs 0 0
Sayangnya ini tidak membebaskan konsol, sehingga script ini dari RSH atau SSH mungkin merupakan pilihan terbaik, tapi hati-hati berapa lama Anda menjalankan iterasi untuk!
Fitur lain yang bagus adalah bahwa Anda dapat memiliki beberapa preset. Jadi jika anda memiliki 4 server Exchange masing-masing dengan 3 database, maka Anda dapat memuat semua volume: <vol_name>: membaca / perintah write_latency ke file dan masalah ini langsung dari perintah statistik. File-file preset adalah file XML, sehingga mereka mengambil sedikit pemikiran secara tertulis, tetapi jika Anda telah melihat XML sebelumnya, maka itu bukanlah yang rumit.
File XML saya terlihat seperti ini ...
<Xml VERSION = "1.0"?>
<preset>
<span name="volume">
<instance name="exch01_db">
<counter name="read_latency">
</ Counter>
<counter name="write_latency">
</ Counter>
</ Contoh>
<instance name="exch01_logs">
<counter name="read_latency">
</ Counter>
<counter name="write_latency">
</ Counter>
</ Contoh>
</ Object>
</ Ditetapkan>
Setelah tersimpan di / etc / stats / preset sebagai file "xml.", Saya dapat menyebutnya secara langsung dari perintah statistik.
filer01> statistik menunjukkan p-pertukaran-i 1-n 5
Instance read_latency write_latenc
ms ms
exch01_db 0 0
exch01_logs 0 0
exch01_db 0 0
exch01_logs 0 0
exch01_db 0 0.13
exch01_logs 0 0.12
exch01_db 0 0.00
exch01_logs 0 0.00
exch01_db 0 0
exch01_logs 0 0
Kemungkinannya besar untuk ini, tetapi ini membuka sesuatu yang lebih baik. Kami sekarang dapat menggunakan "statistik mulai" dan "statistik berhenti" untuk memicu pelaporan ini dan saya mendapatkan konsol kembali!
filer01> statistik start-p pertukaran
Nama identifier Statistik adalah 'Ind0x6920b2f0'
filer01> statistik acara-aku Ind0x6920b2f0
StatisticsID: Ind0x6920b2f0
volume: exch01_db: read_latency: 0ms
volume: exch01_db: write_latency: 5.14ms
volume: exch01_logs: read_latency: 0ms
volume: exch01_logs: write_latency: 0.00ms
filer01> statistik stop-saya Ind0x6920b2f0
StatisticsID: Ind0x6920b2f0
volume: exch01_db: read_latency: 0ms
volume: exch01_db: write_latency: 5.36ms
volume: exch01_logs: read_latency: 0ms
volume: exch01_logs: write_latency: 0.00ms
Mudah-mudahan Anda mulai menyadari mengapa saya seperti perintah ini, dan mengapa kemungkinan menggunakan ini sangat besar, dan bahwa sangat kuat memang!
Satu hal terakhir untuk menambahkan, ada banyak counter tersedia secara default pada privileged mode normal, tetapi cobalah beralih ke maju, atau bahkan diag, dan lihat berapa banyak counter yang tersedia kemudian! Ini adalah luar biasa, tetapi dengan sedikit menggali, sangat kuat.
Satu hal terakhir, Anda dapat menggunakan wildcard pada perintah "menunjukkan statistik", sehingga untuk mencabut semua counter untuk database pertukaran saya ...
filer01> statistik menunjukkan volume: exch01_db: *
volume: exch01_db: avg_latency: 0.00ms
volume: exch01_db: total_ops: 3 / s
volume: exch01_db: read_data: 0b / s
volume: exch01_db: read_latency: 0ms
volume: exch01_db: read_ops: 0 / s
volume: exch01_db: write_data: 12288b / s
volume: exch01_db: write_latency: 0.00ms
volume: exch01_db: write_ops: 3 / s
volume: exch01_db: other_latency: 0ms
volume: exch01_db: other_ops: 0 / s
Atau untuk menampilkan semua read_latency untuk semua volume saya ...
filer01> statistik menunjukkan volume: *: read_latency
volume: vol0: read_latency: 0ms
volume: exch01_db: read_latency: 0ms
volume: rumah: read_latency: 0ms
volume: cadangan: read_latency: 0ms
volume: share: read_latency: 0ms
Jika Anda memiliki pertanyaan spesifik, atau Anda ingin query bagaimana untuk mendapatkan informasi loket khusus dari sistem, jangan ragu untuk mengirim saya lebih pertanyaan. Semoga ini berguna untuk semua orang!










































statistik adalah perintah besar untuk digunakan untuk mengumpulkan data untuk jangka panjang tren juga (jika data yang sama tidak terkena dalam MIB SNMP) - misalnya, data per kinerja volume tidak tersedia melalui SNMP MIB - Aku punya blog entry tentang bagaimana saya mengumpulkan itu dan memberikan contoh beberapa grafik di http://aditya.grot.org/2009/02/netapp-ontap-per-volume-statistics.html
Beberapa besar utilitas yang tersedia untuk menerjemahkan output dari "statistik" yang tersedia di Masyarakat NetApp - http://communities.netapp.com/docs/DOC-2092
besar pasca Chris, sesuatu yang sangat informatif dan tentu saja tidak bahwa yang tercakup dalam salah satu 'fundamental' docs - atau bahkan laporan teknis saya telah membaca sejauh ini.