SLA IT
Na temat SLA, czyli Service Level Agreement wspominałem na tym blogu już niejednokrotnie. Co właściwie oznacza ta nazwa? W skrócie, jest to zdefiniowanie w jakim czasie konkretna czynność powinna zostać wykonana. Jak dobrze każdy zdaje sobie sprawę, aby zapewnić ciągłość działania biznesu konieczne jest wykonywanie pewnych prac w określonym czasie. Szczególnie jeżeli chodzi o awarie i incydenty informatyczne. SLA określa w jakim czasie problem powinien zostać usunięty.
Zapisy na kurs "Monitorowanie Windows i Active Directory z Użyciem Wazuh i Zabbix"!
Nie przegap okazji, by wzmocnić swoje umiejętności w ochronie systemów!
Zapisy przyjmujemy do 24 stycznia do 23:59! Nie czekaj!
Zapisy na: https://asdevops.pl/monitorowanie-windows/
Kto to ustala? Zarządzający biznesem wraz z przedstawicielami IT. Oczywiście, wszystko powinno być poparte odpowiednim budżetem oraz możliwościami. Przykładowo, jeżeli w firmie nie ma serwera zapasowego, na który można szybko przestawić aplikację to nie będzie możliwe odtworzenie systemu w przeciągu godziny. Jednocześnie, jeżeli korzystasz z najtańszego outsourcingu IT to również nie ma się co oszukiwać, że awaria zostanie usunięta szybko i sprawnie. Inna kwestia, że tego typu firma raczej z małym prawdopodobieństwem będzie chętna na podpisanie umowy określającej odpowiedni czas wykonania zadania.
Inne artykuły z dziedziny ITIL:
Warto tu również wyjaśnić, iż czas realizacji nie oznacza tego samego co czas reakcji. Oba pojęcia są często mylone, a w rzeczywistości to drugie oznacza jedynie okres w jakim zespół IT przystąpi do usuwania awarii. I tą reakcję może oznaczać nawet wysłanie wiadomości do klienta o treści „Przystępujemy do usunięcia awarii”. To czy na wykonanie będą potrzebować kilkunastu minut czy kilku dni to już inna sprawa.
I właśnie takie przeciąganie oraz nieporozumienia ma niwelować umowa SLA. Dokument ten jasno opisuje w jakim czasie powinna zostać wykonana odpowiednia czynność. Przykładowo, do postawienia na nogi niedziałającego systemu produkcyjnego dział IT ma 4 godziny. Przekroczenie takiego czasu oznacza wymierne kary finansowe. I właśnie przed tym chroni umowa SLA. Wszelkie problemy i incydenty mają być rozwiązywane w rozsądnym czasie i jednocześnie akceptowalnym dla obu stron. Przedstawiciele biznesu powinni ustalić jak długo są w stanie wytrzymać bez działającego systemu, a informatycy w jakim realnym czasie mogą usunąć awarię. Nie widzę w tym przypadku innej możliwości jak rozwiązanie typu „win-win”. Pojęcie to oznacza sytuację gdy obie grupy są zadowolone z umowy. Informatycy otrzymują rozsądny czas na rozwiązanie problemu, a biznes jest w stanie przeczekać ustalony czas.
Ponadto, spisanie tego typu umowy pozwala uniknąć nieporozumień. Lepiej z góry ustalić jakie są realne szanse na przywrócenie serwerów, sieci lub aplikacji do życia niż w czasie awarii nerwowo dyskutować nad obecnym etapem prac. W takiej sytuacji niepotrzebne nerwy jedynie wydłużają proces realizacji zgłoszenia.
W kontekście SLA warto również wspomnieć o odpowiednim narzędziu do rozliczania czasu opisanego w umowie. Przykładowo, można wykorzystać często opisywany przeze mnie system monitoringu ZABBIX. Zachęcam do zapoznania się ze wcześniejszymi artykułami: