Stosunkowo najprostszą wysoką dostępność w środowisku wirtualnym uzyskujemy już przy wykorzystaniu jednego z najprostszych mechanizmów, które daje wirtualizacja – mianowicie – konstrukcji klastra HA. Z drugiej strony mówiąc o wysokiej dostępności najpierw należałoby zapytać – jaki jest możliwy czas przestoju – bo wtedy może okazać się, że uruchomienie maszyny wirtualnej wprost z backupu jest wystarczające.
Pojęcie wysokiej dostępności w środowiskach wirtualnych to temat szeroki. Najprostsze zagadnienie, a jednocześnie podstawowa siła wirtualizacji to właśnie klaster HA.
Zestawienie co najmniej dwóch fizycznych serwerów z jakąś liczbą wirtualnych maszyn w klaster HA zmniejsza nam czas przestoju do czasu restartu uszkodzonej/nieaktywnej maszyny wirtualnej, która świadczy jakieś usługi w sieci firmy.
Konstrukcja klastra HA wiąże się z kilkoma wymogami: współdzielonymi między serwerami zasobami dyskowymi, co najmniej jedną współdzieloną adresacją sieciową (sieć zarządzania) i systemem, który nadzoruje i monitoruje klaster i ewentualne przełączenie. I o czym nie powinniśmy zapominać – należy tak dobrać serwery (pamięć i procesory) – by każdy serwer był w stanie przejąć maszyny z serwera, który ulegnie awarii.
Drugim możliwym mechanizmem jest uruchomienie kopii maszyny wirtualnej na innym serwerze – jest to tryb można by pokusić się o analogię z systemów macierzowych: active -> passive (active). Dlaczego tak?
Po kolei:
tak jak w przypadku klastra HA, dla uproszczenia i pokazania ogólnej zasady zakładamy minimum dwa serwery – jeden z serwerów ma za zadanie utrzymywać maszynę produkcyjną, a drugi jej kopię. Wymogi, co do tego mechanizmu są podobne – współdzielony storage, współdzielona sieć i system zarządzania. I dodatkowo – zasoby serwerowe co najmniej identyczne lub zdwojone jeśli serwer tzw. zapasowy ma być produkcyjnym dla innych systemów – ponieważ kopia maszyny wirtualnej wymaga tego, by drugi serwer miał w swojej pamięci obraz pamięci maszyny produkcyjnej z serwera, nazwijmy go - podstawowego. Ta kopia jest utrzymywana stale w pamięci i aktualizowana na bieżąco w stosunku do serwera podstawowego. Nic innego jak RAID1 pamięci. Mechanizm jest prosty – następuje awaria i może utracimy jedną odpowiedź ping i system jest aktywowany na serwerze zapasowym.
W zasadzie zero przestoju. Szybko? Nawet bardzo. Konstrukcja tego typu jest również prosta, lecz wymaga nieco więcej uwagi i znajomości swoich systemów.