Cum se calculează procentul de timp de funcționare de înaltă disponibilitate?

Disponibilitatea se măsoară în funcție de timpul în care un anumit sistem rămâne complet operațional pe parcursul unei anumite perioade, de obicei un an.

Se exprimă ca procent. Rețineți că uptime nu trebuie să însemne neapărat același lucru cu disponibilitatea. Un sistem poate fi în funcțiune, dar nu este disponibil pentru utilizatori. Motivele pot fi probleme de rețea sau de echilibrare a încărcăturii.

Timpurile de funcționare sunt exprimate, de obicei, folosind gradația cu cinci 9 a disponibilității.

Dacă decideți să optați pentru o soluție găzduită, acest lucru va fi definit în Acordul privind nivelul serviciilor (SLA). O notă de „un nouă” înseamnă că disponibilitatea garantată este de 90%. În prezent, majoritatea organizațiilor și întreprinderilor cer să aibă cel puțin „trei nouă”, adică 99,9% de disponibilitate.

Afaceriile au nevoi diferite de disponibilitate. Cele care trebuie să rămână operaționale 24 de ore din 24, pe tot parcursul anului, vor viza „cinci nouari”, adică 99,999% de disponibilitate. Poate părea că 0,1% nu face o diferență atât de mare. Cu toate acestea, atunci când convertiți acest lucru în ore și minute, cifrele sunt semnificative.

Referiți-vă la tabelul de nouă pentru a vedea timpul maxim de nefuncționare pe an pe care îl implică fiecare grad:

Nivel de disponibilitate Timp maxim de nefuncționare pe an Timp de nefuncționare pe zi
Un nouă: 90% 36.5 zile 2,4 ore
Două Nouă: 99% 3,65 zile 14 minute
Trei Nouă: 99,9% 8,76 ore 86 secunde
Patru Nouă: 99,99% 52,6 minute 8,6 secunde
Cinci Nouă: 99,999% 5,25 minute 0,86 secunde
Six Nines: 99,9999% 31,5 secunde 8,6 milisecunde

După cum arată tabelul, diferența dintre 99% și 99,9% este substanțială.

Rețineți că este măsurată în zile pe an, nu în ore sau minute. Cu cât mergeți mai sus pe scara disponibilității, cu atât va crește și costul serviciului.

Cum se calculează timpul de nefuncționare? Este esențial să se măsoare timpul de nefuncționare pentru fiecare componentă care poate afecta buna funcționare a unei părți a sistemului, sau a întregului sistem. Întreținerea programată a sistemului trebuie să facă parte din măsurătorile de disponibilitate. Astfel de indisponibilități planificate cauzează, de asemenea, o întrerupere a activității dumneavoastră, așa că ar trebui să acordați atenție și acestui aspect atunci când vă configurați mediul IT.

După cum vă puteți da seama, nivelul de disponibilitate de 100% nu apare în tabel.

Simplu spus, niciun sistem nu este în întregime sigur împotriva defecțiunilor. În plus, trecerea la componentele de rezervă va dura o anumită perioadă, fie că este vorba de milisecunde, minute sau ore.

Cum se obține o disponibilitate ridicată

Compania de afaceri care dorește să implementeze soluții de disponibilitate ridicată trebuie să înțeleagă mai multe componente și cerințe necesare pentru ca un sistem să se califice drept disponibilitate ridicată. Pentru a asigura continuitatea și operabilitatea afacerii, aplicațiile și serviciile critice trebuie să funcționeze non-stop. Cele mai bune practici pentru obținerea unei disponibilități ridicate implică anumite condiții care trebuie îndeplinite. Iată 4 pași pentru obținerea unei fiabilități și a unui timp de funcționare de 99,999%.

Eliminarea punctelor unice de eșec Disponibilitate ridicată vs. Redundanță

Elementul critic al sistemelor cu disponibilitate ridicată este eliminarea punctelor unice de eșec prin realizarea redundanței la toate nivelurile. Indiferent dacă are loc un dezastru natural, o defecțiune hardware sau de alimentare, infrastructurile IT trebuie să aibă componente de rezervă pentru a înlocui sistemul defect.

Există diferite niveluri de redundanță a componentelor. Cele mai comune dintre ele sunt:

  • Modelul N+1 include cantitatea de echipamente (denumită „N”) necesară pentru a menține sistemul în funcțiune. Acesta este operațional cu o componentă de rezervă independentă pentru fiecare dintre componente în cazul în care apare o defecțiune. Un exemplu ar fi utilizarea unei surse de alimentare suplimentare pentru un server de aplicații, dar aceasta poate fi orice altă componentă IT. Acest model este, de obicei, activ/pasiv. Componentele de rezervă sunt în așteptare, așteptând să preia controlul atunci când se produce o defecțiune. Redundanța N+1 poate fi, de asemenea, de tip activ/activ. În acest caz, componentele de rezervă funcționează chiar și atunci când componentele primare funcționează corect. Rețineți că modelul N+1 nu este un sistem complet redundant.
  • Modelul N+2 este similar cu N+1. Diferența constă în faptul că sistemul ar fi capabil să reziste la defectarea a două componente identice. Acest lucru ar trebui să fie suficient pentru a menține majoritatea organizațiilor în funcțiune și să funcționeze la un nivel ridicat.
  • Modelul 2N conține o cantitate dublă din fiecare componentă individuală necesară pentru funcționarea sistemului. Avantajul acestui model este că nu trebuie să luați în considerare dacă a existat o defecțiune a unei singure componente sau a întregului sistem. Puteți muta operațiunile în întregime pe componentele de rezervă.
  • Modelul 2N+1 oferă același nivel de disponibilitate și redundanță ca și 2N, cu adăugarea unei alte componente pentru o protecție îmbunătățită.

Redundanța supremă se obține prin redundanță geografică.

Acesta este singurul mecanism împotriva dezastrelor naturale și a altor evenimente de întrerupere completă. În acest caz, serverele sunt distribuite în mai multe locații din zone diferite.

Situațiile ar trebui să fie plasate în orașe, țări sau chiar continente separate. În acest fel, ele sunt complet independente. Dacă o defecțiune catastrofală are loc într-o locație, o alta ar fi capabilă să preia și să mențină afacerea în funcțiune.

Acest tip de redundanță tinde să fie extrem de costisitor. Cea mai înțeleaptă decizie este să optați pentru o soluție găzduită de la unul dintre furnizorii cu centre de date localizate în întreaga lume.

După întreruperile de curent, defecțiunile de rețea reprezintă una dintre cele mai frecvente cauze ale întreruperilor de activitate.

Din acest motiv, rețeaua trebuie să fie proiectată astfel încât să rămână funcțională 24/7/365. Pentru a obține un timp de funcționare a serviciului de rețea de 100%, trebuie să existe căi alternative de rețea. Fiecare dintre acestea trebuie să aibă switch-uri și routere redundante de nivel enterprise.

Salvare și recuperare a datelor

Siguranța datelor este una dintre cele mai mari preocupări pentru fiecare afacere. Un sistem de înaltă disponibilitate trebuie să aibă planuri solide de protecție a datelor și de recuperare în caz de dezastru.

O necesitate absolută este de a avea copii de rezervă adecvate. Un alt lucru critic este capacitatea de recuperare rapidă în cazul unei pierderi de date, al unei corupții sau al unei defecțiuni complete de stocare. Dacă afacerea dvs. necesită RTO și RPO scăzute și nu vă puteți permite să pierdeți date, cea mai bună opțiune de luat în considerare este utilizarea replicării datelor. Există multe planuri de backup din care puteți alege, în funcție de dimensiunea, cerințele și bugetul afacerii dumneavoastră.

Salvarea și replicarea datelor merg mână în mână cu înalta disponibilitate IT. Ambele ar trebui să fie planificate cu atenție. Crearea de copii de rezervă complete pe o infrastructură redundantă este vitală pentru asigurarea rezilienței datelor și nu trebuie neglijată.

.

admin

Lasă un răspuns

Adresa ta de email nu va fi publicată.

lg