How To Calculate High Availability Uptime Percentage?

Dostępność jest mierzona przez to, ile czasu określony system pozostaje w pełni sprawny w danym okresie, zazwyczaj roku.

Jest wyrażana jako procent. Zauważ, że uptime niekoniecznie musi oznaczać to samo co dostępność. System może być sprawny i działający, ale niedostępny dla użytkowników. Powodem tego mogą być problemy z siecią lub równoważeniem obciążenia.

Czas sprawności jest zwykle wyrażany za pomocą stopniowania z pięcioma 9 dostępności.

Jeśli zdecydujesz się na rozwiązanie hostowane, zostanie to określone w umowie o poziomie usług (SLA). Ocena „jedna dziewiątka” oznacza, że gwarantowana dostępność wynosi 90%. Obecnie większość organizacji i firm wymaga posiadania co najmniej „trzech dziewiątek”, tj. 99,9% dostępności.

Biznesy mają różne potrzeby dostępności. Te, które muszą pozostać operacyjne przez całą dobę przez cały rok, będą dążyć do „pięciu dziewiątek”, czyli 99,999% czasu pracy. Może się wydawać, że 0,1% nie robi aż tak dużej różnicy. Jednak, gdy przeliczysz to na godziny i minuty, liczby są znaczące.

Przyjrzyj się tabeli dziewiątek, aby zobaczyć maksymalny czas przestoju na rok, jaki obejmuje każda klasa:

Poziom dostępności Maksymalny czas przestoju na rok Czas przestoju na dzień
Jedna dziewiątka: 90% 36.5 dni 2,4 godziny
Dwie Dziewiątki: 99% 3,65 dni 14 minut
Trzy Dziewiątki: 99,9% 8,76 godzin 86 sekund
Cztery Dziewiątki: 99,99% 52,6 minuty 8,6 sekundy
Pięć Dziewiątek: 99,999% 5,25 minuty 0,86 sekundy
Six Nines: 99,9999% 31,5 sekundy 8,6 milisekundy

Jak pokazuje tabela, różnica między 99% a 99,9% jest znaczna.

Zauważ, że jest ona mierzona w dniach na rok, a nie godzinach czy minutach. Im wyżej pójdziesz na skali dostępności, tym koszt usługi również wzrośnie.

Jak obliczyć czas przestoju? Istotne jest, aby mierzyć czas przestoju dla każdego elementu, który może mieć wpływ na prawidłowe funkcjonowanie części systemu lub całego systemu. Planowe utrzymanie systemu musi być częścią pomiarów dostępności. Takie planowane przestoje powodują również wstrzymanie działalności, więc należy zwrócić na to uwagę podczas konfigurowania środowiska IT.

Jak widać, 100% poziom dostępności nie pojawia się w tabeli.

Po prostu, żaden system nie jest całkowicie bezawaryjny. Dodatkowo, przełączenie na komponenty zapasowe zajmie pewien okres, czy to milisekundy, minuty, czy godziny.

Jak osiągnąć wysoką dostępność

Biznesy, które chcą wdrożyć rozwiązania wysokiej dostępności, muszą zrozumieć wiele komponentów i wymagań niezbędnych do zakwalifikowania systemu jako wysoce dostępnego. Aby zapewnić ciągłość działania i operacyjność firmy, krytyczne aplikacje i usługi muszą działać przez całą dobę. Najlepsze praktyki osiągania wysokiej dostępności obejmują pewne warunki, które muszą zostać spełnione. Oto 4 kroki do osiągnięcia 99,999% niezawodności i czasu sprawności.

Eliminate Single Points of Failure High Availability vs. Redundancy

Krytycznym elementem systemów wysokiej dostępności jest wyeliminowanie pojedynczych punktów awarii poprzez osiągnięcie redundancji na wszystkich poziomach. Bez względu na to, czy mamy do czynienia z klęską żywiołową, awarią sprzętu czy zasilania, infrastruktura IT musi mieć zapasowe komponenty, które zastąpią uszkodzony system.

Istnieją różne poziomy redundancji komponentów. Najczęściej spotykane z nich to:

  • Model N+1 obejmuje ilość sprzętu (określaną jako „N”) potrzebną do utrzymania systemu w ruchu. Działa on w oparciu o jeden niezależny element rezerwowy dla każdego z komponentów na wypadek wystąpienia awarii. Przykładem może być zastosowanie dodatkowego zasilacza dla serwera aplikacyjnego, ale może to być każdy inny komponent IT. Model ten jest zazwyczaj aktywny/pasywny. Komponenty zapasowe są w stanie gotowości, czekając na przejęcie zadań w razie awarii. Redundancja N+1 może być również aktywna/aktywna. W takim przypadku komponenty zapasowe działają nawet wtedy, gdy komponenty podstawowe działają prawidłowo. Należy pamiętać, że model N+1 nie jest całkowicie redundantnym systemem.
  • Model N+2 jest podobny do N+1. Różnica polega na tym, że system będzie w stanie wytrzymać awarię dwóch takich samych komponentów. Powinno to wystarczyć, aby utrzymać większość organizacji w wysokiej dziewiątce.
  • Model 2N zawiera podwojoną ilość każdego pojedynczego komponentu niezbędnego do działania systemu. Zaletą tego modelu jest to, że nie trzeba brać pod uwagę, czy awarii uległ pojedynczy komponent czy cały system. Można przenieść operacje w całości na komponenty zapasowe.
  • Model 2N+1 zapewnia ten sam poziom dostępności i redundancji co 2N z dodaniem kolejnego komponentu dla lepszej ochrony.

Ostateczną redundancję uzyskuje się poprzez redundancję geograficzną.

Jest to jedyny mechanizm chroniący przed klęskami żywiołowymi i innymi zdarzeniami całkowitego przestoju. W tym przypadku serwery są rozmieszczone w wielu lokalizacjach w różnych obszarach.

Miejsca te powinny być umieszczone w oddzielnych miastach, krajach, a nawet kontynentach. W ten sposób są one całkowicie niezależne. Jeśli katastrofa awarii dzieje się w jednej lokalizacji, inny byłby w stanie podnieść i utrzymać biznes running.

Ten rodzaj redundancji ma tendencję do być bardzo kosztowne. Najrozsądniejszą decyzją jest przejście na rozwiązanie hostowane od jednego z dostawców z centrów danych zlokalizowanych na całym świecie.

Następnie do awarii zasilania, awarie sieci stanowią jedną z najczęstszych przyczyn przestojów w działalności.

Z tego powodu, sieć musi być zaprojektowana w taki sposób, że pozostaje w górę 24/7/365. Aby osiągnąć 100% czasu sprawności usługi sieciowej, muszą istnieć alternatywne ścieżki sieciowe. Każda z nich powinna mieć redundantne przełączniki i routery klasy korporacyjnej.

Kopia zapasowa i odzyskiwanie danych

Bezpieczeństwo danych jest jednym z największych zmartwień dla każdej firmy. System wysokiej dostępności musi mieć solidne plany ochrony danych i odzyskiwania po awarii.

Niezbędne jest posiadanie odpowiednich kopii zapasowych. Kolejną krytyczną rzeczą jest możliwość szybkiego odzyskania danych w przypadku ich utraty, uszkodzenia lub całkowitej awarii pamięci masowej. Jeśli Twoja firma wymaga niskich wartości RTO i RPO i nie możesz sobie pozwolić na utratę danych, najlepszą opcją do rozważenia jest użycie replikacji danych. Istnieje wiele planów tworzenia kopii zapasowych do wyboru, w zależności od wielkości firmy, wymagań i budżetu.

Kopia zapasowa i replikacja danych idą w parze z wysoką dostępnością IT. Obie te czynności powinny być starannie zaplanowane. Tworzenie pełnych kopii zapasowych na redundantnej infrastrukturze jest niezbędne do zapewnienia odporności danych i nie może być pomijane.

.

admin

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany.

lg