Wie berechnet man den Prozentsatz der Hochverfügbarkeitsbetriebszeit?
Die Verfügbarkeit wird daran gemessen, wie lange ein bestimmtes System während eines bestimmten Zeitraums, in der Regel ein Jahr, voll funktionsfähig bleibt.
Sie wird in Prozent ausgedrückt. Beachten Sie, dass die Betriebszeit nicht unbedingt dasselbe bedeutet wie die Verfügbarkeit. Ein System kann zwar betriebsbereit sein, aber den Benutzern nicht zur Verfügung stehen. Die Gründe dafür können Netzwerk- oder Lastausgleichsprobleme sein.
Die Betriebszeit wird in der Regel durch die Abstufung mit fünf Neunen für die Verfügbarkeit ausgedrückt.
Wenn Sie sich für eine gehostete Lösung entscheiden, wird dies im Service Level Agreement (SLA) festgelegt. Eine Note von „einer Neun“ bedeutet, dass die garantierte Verfügbarkeit 90 % beträgt. Heute verlangen die meisten Organisationen und Unternehmen mindestens „drei Neunen“, d. h. 99,9 % Verfügbarkeit.
Unternehmen haben unterschiedliche Anforderungen an die Verfügbarkeit. Diejenigen, die das ganze Jahr über rund um die Uhr betriebsbereit sein müssen, streben „fünf Neunen“ an, also 99,999 % Betriebszeit. Es mag so aussehen, als ob 0,1 % keinen großen Unterschied machen. Wenn Sie dies jedoch in Stunden und Minuten umrechnen, sind die Zahlen signifikant.
In der Neuner-Tabelle finden Sie die maximale Ausfallzeit pro Jahr für jede Stufe:
Verfügbarkeitsstufe | Maximale Ausfallzeit pro Jahr | Ausfallzeit pro Tag |
Eine Neun: 90% | 36.5 Tage | 2,4 Stunden |
Zwei Neunen: 99% | 3,65 Tage | 14 Minuten |
Drei Neunen: 99,9% | 8,76 Stunden | 86 Sekunden |
Vier Neunen: 99,99% | 52,6 Minuten | 8,6 Sekunden |
Five Nines: 99,999% | 5,25 Minuten | 0,86 Sekunden |
Six Nines: 99,9999% | 31,5 Sekunden | 8,6 Millisekunden |
Wie die Tabelle zeigt, ist der Unterschied zwischen 99% und 99,9% beträchtlich.
Beachten Sie, dass er in Tagen pro Jahr gemessen wird, nicht in Stunden oder Minuten. Je höher man auf der Skala der Verfügbarkeit kommt, desto höher werden auch die Kosten für den Dienst.
Wie berechnet man die Ausfallzeit? Es ist wichtig, die Ausfallzeit für jede Komponente zu messen, die das ordnungsgemäße Funktionieren eines Teils des Systems oder des gesamten Systems beeinträchtigen kann. Geplante Systemwartungen müssen Teil der Verfügbarkeitsmessungen sein. Solche geplanten Ausfälle führen auch zu einer Unterbrechung Ihres Geschäftsbetriebs, so dass Sie auch darauf achten sollten, wenn Sie Ihre IT-Umgebung einrichten.
Wie Sie sehen können, erscheint die 100%ige Verfügbarkeit nicht in der Tabelle.
Einfach gesagt, ist kein System völlig ausfallsicher. Außerdem dauert die Umstellung auf Backup-Komponenten eine gewisse Zeit, sei es Millisekunden, Minuten oder Stunden.
Wie erreicht man Hochverfügbarkeit
Unternehmen, die Hochverfügbarkeitslösungen implementieren wollen, müssen die verschiedenen Komponenten und Anforderungen verstehen, die ein System erfüllen muss, um als hochverfügbar eingestuft zu werden. Um die Kontinuität und Funktionsfähigkeit des Unternehmens zu gewährleisten, müssen wichtige Anwendungen und Dienste rund um die Uhr verfügbar sein. Best Practices zur Erreichung von Hochverfügbarkeit beinhalten bestimmte Bedingungen, die erfüllt werden müssen. Hier sind 4 Schritte zum Erreichen von 99,999 % Zuverlässigkeit und Betriebszeit.
Eliminierung einzelner Ausfallpunkte Hochverfügbarkeit vs. Redundanz
Das entscheidende Element von Hochverfügbarkeitssystemen ist die Eliminierung einzelner Ausfallpunkte durch Redundanz auf allen Ebenen. Unabhängig davon, ob es sich um eine Naturkatastrophe, einen Hardware- oder Stromausfall handelt, müssen IT-Infrastrukturen über Backup-Komponenten verfügen, die das ausgefallene System ersetzen können.
Es gibt verschiedene Stufen der Komponentenredundanz. Die gebräuchlichsten sind:
- Das N+1-Modell umfasst die Anzahl der Geräte (mit „N“ bezeichnet), die für die Aufrechterhaltung des Systems erforderlich sind. Es wird mit einer unabhängigen Sicherungskomponente für jede der Komponenten betrieben, falls ein Fehler auftritt. Ein Beispiel wäre die Verwendung einer zusätzlichen Stromversorgung für einen Anwendungsserver, aber das kann auch jede andere IT-Komponente sein. Dieses Modell ist in der Regel aktiv/passiv. Die Backup-Komponenten befinden sich im Standby-Modus und warten darauf, im Falle eines Ausfalls zu übernehmen. Die N+1-Redundanz kann auch aktiv/aktiv sein. In diesem Fall arbeiten die Backup-Komponenten auch dann, wenn die primären Komponenten korrekt funktionieren. Beachten Sie, dass das N+1-Modell kein vollständig redundantes System ist.
- Das N+2-Modell ist dem N+1-Modell ähnlich. Der Unterschied besteht darin, dass das System in der Lage ist, den Ausfall von zwei gleichen Komponenten zu verkraften. Dies sollte ausreichen, um die meisten Unternehmen in den oberen Rängen zu halten.
- Das 2N-Modell enthält die doppelte Menge jeder einzelnen Komponente, die für den Betrieb des Systems erforderlich ist. Der Vorteil dieses Modells ist, dass man nicht berücksichtigen muss, ob eine einzelne Komponente oder das gesamte System ausgefallen ist. Sie können den Betrieb vollständig auf die Backup-Komponenten verlagern.
- Das 2N+1-Modell bietet dasselbe Maß an Verfügbarkeit und Redundanz wie 2N mit dem Zusatz einer weiteren Komponente für einen verbesserten Schutz.
Die ultimative Redundanz wird durch geografische Redundanz erreicht.
Das ist der einzige Mechanismus gegen Naturkatastrophen und andere Ereignisse eines vollständigen Ausfalls. In diesem Fall sind die Server auf mehrere Standorte in verschiedenen Gebieten verteilt.
Die Standorte sollten sich in verschiedenen Städten, Ländern oder sogar Kontinenten befinden. Auf diese Weise sind sie völlig unabhängig voneinander. Bei einem katastrophalen Ausfall an einem Standort könnte ein anderer den Betrieb übernehmen und aufrechterhalten.
Diese Art der Redundanz ist in der Regel sehr kostspielig. Am klügsten ist es, sich für eine gehostete Lösung eines Anbieters zu entscheiden, der über Rechenzentren auf der ganzen Welt verfügt.
Neben Stromausfällen sind Netzwerkausfälle eine der häufigsten Ursachen für Geschäftsausfälle.
Aus diesem Grund muss das Netzwerk so konzipiert sein, dass es rund um die Uhr und 365 Tage im Jahr verfügbar ist. Um eine 100-prozentige Betriebszeit des Netzes zu erreichen, muss es alternative Netzpfade geben. Jeder von ihnen sollte über redundante Switches und Router der Unternehmensklasse verfügen.
Datensicherung und -wiederherstellung
Datensicherheit ist eines der größten Anliegen für jedes Unternehmen. Ein Hochverfügbarkeitssystem muss über solide Datensicherungs- und Notfallwiederherstellungspläne verfügen.
Ein absolutes Muss sind ordnungsgemäße Backups. Ein weiterer kritischer Punkt ist die Fähigkeit zur schnellen Wiederherstellung im Falle eines Datenverlusts, einer Beschädigung oder eines kompletten Speicherausfalls. Wenn Ihr Unternehmen niedrige RTOs und RPOs benötigt und Sie es sich nicht leisten können, Daten zu verlieren, ist die beste Option, die Sie in Betracht ziehen sollten, die Datenreplikation. Je nach Größe Ihres Unternehmens, Ihren Anforderungen und Ihrem Budget können Sie aus einer Vielzahl von Datensicherungsplänen wählen.
Datensicherung und -replikation gehen Hand in Hand mit IT-Hochverfügbarkeit. Beide sollten sorgfältig geplant werden. Die Erstellung vollständiger Backups auf einer redundanten Infrastruktur ist für die Ausfallsicherheit der Daten von entscheidender Bedeutung und darf nicht außer Acht gelassen werden.