Disastery recovery: cosa sono RTO e RPO
Recentemente una scimmia ha fatto notizia, meritando addirittura una pagina sul sito della Cnn. La Kenya Electricity Generating Company proprietaria di una centrale elettrica che approvvigiona circa l’80% del fabbisogno del paese africano, ha reso noto che il black out totale che ha coinvolto l’intero stato – quasi 5 milioni tra abitazioni e aziende – è stato provocato da una scimmia che si era introdotta all’interno della centrale.
La scimmia è sopravvissuta, ma nulla si sa sulla perdita dei dati che un evento simile possa aver provocato alle strutture informatiche delle aziende coinvolte. Il black out è durato da 15 minuti fino a 3 ore a seconda delle zone.
La notizia fa capire come un danno rilevante a un’azienda non sempre debba essere imputato a una catastrofe naturale, o a un evento di proporzioni notevoli e, inoltre, pone l’accento sul fatto che un’interruzione, seppur breve, può provocare danni irreparabili ai dati di un’azienda.
Uno Sla (Service Level Agreement) relativo a un managed service non prevedere ogni tipo di eventualità, piuttosto si ragiona sulle garanzie da dare in caso di interruzione, qualsiasi essa sia e sui tempi di ripristino.
Molto semplicemente, l’azienda cliente pagherà una cifra più o meno alta a seconda di quanto tempo si possa permettere di tenere inattivo un servizio (business continuity) o di quanti dati si possa permettere di perdere durante un black out dello storage.
Un piano di Disaster Recovery, dunque, non deve essere progettato considerando i possibili eventi ma, piuttosto, ragionando su cosa ci si può permettere di perdere in caso di interruzione momentanea e su quanto tempo possa passare prima di ripristinare i servizi.
È molto importante sottolineare che non si può ragionare in questi termini se non si ha una fotografia precisa dell’infrastruttura informatica aziendale, hardware e software, e una precisa ripartizione dei ruoli, garantita dal fornitore del servizio, in caso di intervento.
In questo contesto entrano in gioco due parametri fondamentali: il Recovery Point Objective (RPO) e il Recovery Time Objective (RTO).
RTO e RPO: su quale puntare
Diciamo subito che non si tratta di due caratteristiche che si escludono vicendevolmente, perché sono diverse, si applicano a ecosistemi diversi e possono aver senso per business e mercati diversi.
L’RPO definisce la perdita di dati ammissibile. Per esempio, un’azienda che concentra la sua attività in orario standard, che non ha una produzione h24, e che subisce una perdita dei dati di notte, dopo l’ultimo backup impostato dal fornitore, probabilmente non avrà conseguenze gravi dal danno.
Ripristinare l’ultimo backup permetterà all’azienda di tornare operativa (quasi) come se niente fosse.
Se, invece, il flusso di dati da memorizzare è continuo, 24×7 365 giorni all’anno, pensiamo per esempio a una realtà come Visa, allora il cliente chiederà al suo fornitore di servizi gestiti una certa business continuity perché un’interruzione equivale a una notevole perdita economica.
L’RTO, invece, considera il tempo come parametro. Molto semplicisticamente ragiona sulla continuità di un certo servizio, per esempio un servizio applicativo, sul tempo che ci si può permettere che passi da un’interruzione del servizio alla sua ripresa. Anche in questo caso molto dipende dall’attività dell’azienda, i servizi bancari, ancora una volta chiedono un RTO vicino a zero.
Quanto tempo ci si può permettere di avere un servizio bloccato? È questa la domanda che il fornitore di managed services vi farà durante la fase di progettazione del servizio di disaster recovery. Sarà la sua struttura a garantire la ripresa a seguito di un danno.
Insomma, per avere un’idea molto semplice del concetto alla base di RPO e RTO, si può pensare a un Pc, un tablet o uno smartphone e a quando il sistema operativo chiede ogni quanto effettuare il backup dei dati in cloud, Se si rompe il tablet, perderemo i dati memorizzati sullo stesso dal momento dell’ultimo backup.
ITnet è un Internet Service Provider che può contare su tre data center tra Milano e Roma, l’accesso a due backbone distinti, uno di Telecom Italia e uno di Wind e allo snodo Milan Internet eXchange (MIX), un Toc – una centrale di controllo competente e attrezzata – operativo 24x7x365 e una serie di servizi best-in-class che vanno dalle reti private (Vpn) ai firewall di ultima generazione, dai servizi cloud alla configurazione e il monitoraggio dei servizi sui server con funzionalità avanzate di Disaster Recovery e Business Continuity.