VMWare ESX server - je kaki strokovnjak tukaj?

raners

Majstr
4. mar 2008
2.726
369
83
Hej vsem...

Je kdo tukaj, ki se spozna na VMWare ESX server? V službi v poslovne namene uporabljamo eno "močno" mašino (server), na kateri je VMWare ESX server in na tem serverju poganjamo virtualne mašine (z dosti snapshoti). Po parih letih uporabe nam je začel ta server delovat zelo počasi.. Pred meseci smo menjali en disk in je spet deloval dokaj hitro.. Pred parimi tedni je spet začel delovat zelo počasi..

Torej, pozna kdo kakega strokovnjaka za VMWare ESX server? Ker ne najdemo nobenega res strokovnjaka... Ker so stvari kar zapletene, bi potrebovali kako svetovanje (lahko izstavi račun.. ;))
 

philips

Guru
Osebje foruma
Administrator
17. avg 2007
9.773
627
113
Sicer se ne spoznam na ESX, ampak kaj pa pravi osnovna "diagnostika"? Mislim predvsem na:
  • CPU load
  • RAM usage
  • Disk utilization (iopsi, queue length, latency)
Če je karkoli od tega povišano oz. imaš spike (in je takrat sistem počasen), potem je to tvoj "problem".
 

damirj

Guru
9. maj 2012
4.883
2.111
113
Če imaš diske v RAIDu, je lahko počasno delovanje tudi povezano z okvaro enega od diskov. Za kaj več se lahko tudi na ZS pomenimo.
 

AndrejD

Guru
20. jul 2007
6.950
1.260
113
Strojne okvare na strežnikih so ponavadni vidne po kakšni rdeči ali oranžni lučki. Samo moraš vedeti kaj gledaš.
Nekateri imajo tudi ekrane.
 

damirj

Guru
9. maj 2012
4.883
2.111
113
Izvedel sem, da je v MB za VMWare certificirano podjetje Arhides... ;)

Po mojem jih ne rabiš. Veliko denarja za malo efekta. Preveri diskovje, če imaš RAID5, 10 ipd konfiguracije, gre lahko za okvaro od enega od diskov, v teh primerih redundanca sicer deluje, samo je to računsko zahtevno in tudi če imaš kakšen zelo zmogljiv RAID kontroler, je upad performans občuten. Tudi če je polje v rebuild statusu, je enako padec performans. Lahko gre tudi za okvaro cache modula ali pa napajanja cache modula, tako da RAID polje deluje brez cachea. PAč preveri. Glede na to, da imaš ESX(i), potem poglej, če imaš RAID kontroler toolse nameščene, ker če jih nimaš, potem ti ostane jih ročno namestit ali pa pregled preko monitoringa (iLO, idrac ipd server management, če imaš) sicer ti ostane samo reboot serverja in pregled preko server toolsov. Glede na to, da si napisal, da ste podoben problem že imeli in odpravili z menajvo diska, je tudi zdaj skoraj zagotovo povezano s tem.
 
2. okt 2007
3.611
2.077
113
Pa še nekaj, omenil si, da imaš ogromno snapshotov.

Potrebno je vedeti, da ti snapshoti začnejo s časom, predvsem, če je na strežniku ogromno sprememb, zelo obremenjevati celoten sistem. Zato velja mogoče pogledati v tej smeri, če so potrebni snapshoti za daljši čas nazaj.
 

erikson

Guru
25. avg 2007
21.561
5.532
113