La disponibilità continua dei dati aziendali risulta essere una condizione determinante affinché le società possano raggiungere i propri obiettivi di business. Analizziamo le principali mosse da compiere per mettere al sicuro le informazioni.
In Italia, il software per il backup dei dati non è mai stato tra i componenti più "gettonati" allinterno dei sistemi informativi. I motivi sono vari e vanno dallaver sottovalutato a lungo il rischio di perdere le informazioni, alla comune concezione di un processo lento e complesso.
Fortunatamente, negli ultimi anni, limportanza dello storage è cresciuta e, di conseguenza, anche il backup ha compiuto passi in avanti verso la gestione di grandi moli di informazioni, siano esse localizzate su singoli server o distribuite in rete locale o geografica.
Anche la net economy ha dato il proprio contributo: nelle strategie delle aziende che si muovono online, il dato è un bene essenziale, da avere sempre (o quasi) a disposizione. La memorizzazione diventa, quindi, una procedura cruciale per qualsiasi impresa, indipendentemente dalle dimensioni. Parlare di backup significa, ancora oggi, parlare di sistemi a nastro: sono, infatti, questi ultimi i dispositivi che riescono a soddisfare meglio, in termini di rapporto prezzo/prestazioni, le esigenze tipiche di un utente aziendale medio. Molto è stato fatto in tale direzione. Esistono modelli a basso costo per postazioni singole e per piccoli gruppi di lavoro e, per i sistemi It più complessi, dispositivi ad alta capacità in grado di gestire un traffico di diversi Megabyte al secondo.
Oneri troppo elevati e "transfer rate" eccessivamente ridotti sono sempre stati indicati, in particolare per le Pmi, come gli ostacoli principali alla diffusione di questo tipo di procedure. Rimosse queste barriere, ogni responsabile It dovrebbe ora essere in grado di trovare la tecnologia hardware più adatta alle esigenze della propria società.
La rinnovata importanza del backup ha, tuttavia, messo in luce un aspetto prima non considerato: la longevità delle tecnologie. Se per lutente singolo può ancora essere sufficiente una soluzione qualsiasi purché funzionante, per unazienda è necessario puntare su software con una certa diffusione e un piano di sviluppo per il futuro, pena il rimanere legati a pochi vendor specifici o il non poter sfruttare soluzioni che dovessero presentarsi in futuro.
Le principali tecnologie
Le novità nel settore del backup a nastro provengono dalle tecnologie lineari, ossia quelle in cui le tracce magnetiche sono registrate parallelamente alla direzione di trazione del nastro. Hp, Ibm e Seagate hanno sviluppato la tecnologia Lto (Linear tape open) che prevede lutilizzo di una sola bobina e che garantisce, al momento, sino a 200 Gb di memoria con compressione e una velocità di trasferimento da 20 a 40 Mb/s. Il rivale per antonomasia, è SuperDlt (Digital linear tape), originariamente sviluppato da Digital. Grande diffusione hanno, poi, i drive da 35 Gb (con un transfer rate di 5 Mb/s), nonché Slr (Scalable linear recording), sistema che offre sino a 100 Gb con compressione. I dispositivi a nastro, tuttavia, non sono lunica scelta possibile: esigenze particolari possono essere soddisfatte dalle unità magneto-ottiche o dagli ormai popolari masterizzatori di Cd (e Dvd, anche se meno diffusi), riscrivibili e non. I sistemi ottici a scrittura singola, e per questo detti in alcuni casi Worm (Write once read many), costituiscono un mercato più ristretto in termini di volumi rispetto a quello dei nastri, ma comunque abbastanza stabile. Anche in questo settore levoluzione non è mancata, con dispositivi che hanno una capacità massima variabile a seconda delle dimensioni del supporto; fino a 30 Gb nei modelli da 12 pollici. Ampia scelta anche per i supporti ottici: 650 Mb per il classico Cd, un valore compreso tra 2,6 e 5 Gb per i Dvd, a seconda dei modelli e delle tecnologie adottate. Dalle applicazioni audio giungono i nastri da 4 mm meglio noti come Dat (Digital audio tape). La versione per il salvataggio dei dati è in grado di offrire 20 Gb di capacità senza compressione e un tranfer rate di oltre 2 Mb/s.
Dal mondo video deriva, invece, la tecnologia a 8 mm che, sviluppata da Sony, permette di di memorizzare su ogni cassetta una "mappa" del nastro e delle registrazioni, con tempi daccesso rapidi. La capacità è di 100 Gb non compressi, con un transfer rate di 12 Mb/s.
Il salvataggio in pratica
Le modalità operative per il backup sono, tutto sommato, abbastanza standardizzate: una volta scelta la tecnologia più indicata alle proprie esigenze, ogni azienda deve poter definire le procedure per il salvataggio dei dati, sviluppate in base alle necessità specifiche. Alcuni punti comuni possono, tuttavia, essere ugualmente evidenziati.
Il primo è la definizione della strategia da seguire, optando per salvataggi su server centrale oppure su macchine di gruppo o addirittura su singoli pc. È questa una scelta essenziale con effetto sulle attività di "capacity planning" dellazienda: il backup centralizzato richiede meno impegno da parte dello staff ma va a pesare sulloperatività dei server; i salvataggi decentralizzati occupano meno banda per il trasferimento dei dati sulla rete aziendale, ma occorrono più unità di backup e una certa "educazione" di tutti gli utenti, oltre a comportare una complessità intrinseca.
Analizzando i requisiti tipici di unazienda per la gestione dei dati, è possibile riscontrare alcune caratteristiche di base. Una di queste è la necessità di gestire un volume elevato di informazioni e di utilizzare, quindi, dispositivi autoloader o librerie di nastri. Vi è poi la richiesta del backup online per eseguire il salvataggio di applicazioni o database operativi come sistemi di posta Ms Exchange, Lotus Notes, database Sql Server e Oracle. Nasce, inoltre, lesigenza di effettuare backup e restore remoti presso sedi distaccate e supportare sistemi in ambienti misti Windows Nt, NetWare e Unix. Il tutto, stando attenti a ridurre il carico sulla rete. I vantaggi offerti dalladozione di un unico prodotto per la gestione dei backup di differenti sistemi sono diversi. È possibile ottenere un livello superiore di protezione dei dati mediante una gestione efficace dei dispositivi che possono essere associati in pool. Tra le caratteristiche disponibili, quella che permette di scrivere contemporaneamente su nastro i dati letti da dischi di più sistemi, garantendo prestazioni elevate mediante backup o restore paralleli.
La procedura di backup centralizzato prevede che un server avvii, dalla postazione client, le operazioni di copia dei dati da salvare; successivamente le informazioni vengono messe sui drive a nastro collegati al server. Di massima, tale architettura è concettualmente la meno complessa, e per questo risulta spesso la più utilizzata dalle Pmi. Va sottolineato, però, che prestazioni e convenienza variano fortemente da caso a caso.
Il backup si fa in quattro
Come accennato, se un server centrale deve svolgere sia le operazioni di backup che quelle di normale elaborazione dei dati, è possibile che il carico di lavoro si riveli in certi momenti eccessivo e, di fatto, rallenti sia le une che le altre procedure. Si cerca, quindi, ove possibile, di salvare i dati negli intervalli di tempo in cui il server centrale non deve svolgere altre operazioni, le cosiddette finestre di backup. Il problema è che la necessità di poter contare su informazioni e applicazioni sempre disponibili riduce al minimo, in certe realtà, i lassi di tempo in cui un server è "libero".
È possibile eseguire diversi tipi di backup: completo, incrementale, differenziale, online. Nel primo caso, si archiviano tutti i file, indipendentemente dal fatto che questi siano stati modificati. Per quanto riguarda lincrementale, si salvano solo i file creati o su cui si è lavorato dopo lultimo backup completo o incrementale. Il differenziale, invece, tiene conto del più recente backup completo. La differenza tra queste due ultime versioni risiede principalmente nella velocità di scrittura e di recupero dei dati. Il backup incrementale è sicuramente il più veloce, ma per ripristinare i file è necessario ricorrere allultimo backup completo e a tutti gli incrementali successivi. Risulta di fondamentale importanza porre attenzione a non mischiare backup differenziali e incrementali: il rischio è quello di non riuscire a ripristinare tutti i file dellarchivio. Il backup online, infine, si riferisce alla tecnica di salvataggio dei dati mentre gli stessi sono utilizzati da unapplicazione. Lutilizzo è indicato, soprattutto, in ambienti dove non è ammissibile prevedere uninterruzione del servizio, nemmeno durante le ore notturne.
File aperti e file chiusi
I software di salvataggio dei dati devono saper gestire anche i file in uso, ossia quelli aperti. Tipicamente ciò riguarda i database per i quali non è possibile bloccare laccesso ai dati degli archivi centralizzati, talvolta anche di qualche Terabyte, per eseguire il salvataggio, per quanto possa essere veloce. Questo aspetto diventa ancora più critico se si parla di e-business. Almeno in teoria, un database a cui accedono clienti o partner commerciali di tutto il mondo non è mai "fermo". Dunque, come comportarsi?
Due sono le strade possibili: il sistema più generico è quello del Locked File Backup (consigliato proprio per le Pmi); lalternativa è data dallutilizzo di Api messe a disposizione dai produttori di database, opzione preferibile nelle realtà di dimensioni medio-grandi, in quanto garantisce una maggiore flessibilità e disponibilità per i principali modelli in commercio (Ibm, Informix, Microsoft, Oracle, Sybase). Dal canto suo, il Locked File Backup è applicabile a qualsiasi database e opera creando, allinizio delle operazioni di salvataggio, unimmagine statica del file che è in fase di elaborazione in una cache su disco. È in pratica questultima a essere salvata, mentre le modifiche apportate dagli utenti attivi sono effettuate direttamente sul file vero e proprio. Ciò significa che il salvataggio viene eseguito sui dati così come questi appaiono allinizio della procedura di backup, tralasciando i cambiamenti intervenuti durante la procedura stessa. Ladozione di Api specifiche permette di operare in maniera opposta: il software si collega ai file che intende salvare, ne blocca laccesso ed esegue il backup completo o parziale. Nel frattempo, le modifiche immesse dagli utenti attivi restano conservate in memoria e apportate ai file veri e propri dopo il completamento del backup. Il vantaggio principale delloperare in questo modo sta nel potersi interfacciare con il database in maniera più completa e, di conseguenza, nelloperare non solo a livello di file completo, ma anche di tabella e, al limite, di singolo record.
Proteggere la protezione
Un sistema di backup serve a garantire la sicurezza dei dati anche in caso di guasto del sistema It: sarebbe quasi paradossale non considerare che anche le procedure di backup possano bloccarsi per diversi motivi. A seconda del software e dellhardware adottato, diverse funzioni possono essere impiegate per cercare una maggiore sicurezza, per esempio utilizzando drive a nastro ridondanti e software in grado di passare automaticamente al drive secondario in caso di blocco di quello principale. Può essere utile anche eseguire, tra due backup completi su nastro, altri veloci backup incrementali su disco, in modo da avere sempre una situazione più o meno aggiornata dei propri archivi. Quanto più si gestiscono dati "critici", indipendentemente dalle dimensioni dellazienda, tanto maggiore è la necessità di backup rapidi e frequenti. Un altro punto da considerare è legato a come il programma di backup gestisce i dati nelle procedure di restore. Tipicamente, i software registrano un elenco dei file salvati ed è meglio assicurarsi che questo sia conservato anche sul nastro che contiene i dati e non solo, come talvolta accade, su disco. Senza tale elenco, infatti, non è detto che la procedura di restore possa essere completata correttamente. Alcuni aspetti di sicurezza, apparentemente banali, sono demandati all"intelligenza" del software di backup, che deve saper gestire in maniera opportuna i nastri per il salvataggio dei dati, aspetto importante per chi utilizza autoloader o librerie vere e proprie. È necessario che il software sia in grado di stabilire se lo spazio su nastro è sufficiente, prima di avviare le operazioni di salvataggio, e che possa "reagire" a eventuali problemi in maniera appropriata.
Uno dei problemi che può emergere nel caso di backup centralizzato è che le operazioni di trasferimento dati tra client e server di backup occupino banda sulla Lan aziendale, rallentando le normali operazioni. Per ridurre il traffico, in alcuni casi vengono installati sui client degli "agenti" software che raccolgono i dati e li assemblano in pacchetti, che possono essere trasmessi sulla rete con maggiore efficienza a seconda della banda disponibile. Altre volte si inviano a un singolo nastro i dati di più client contemporaneamente, mentre in altri casi ancora è consentita la trasmissione di più flussi di dati verso nastri differenti, offrendo potenzialmente prestazioni migliori. Può addirittura avere senso realizzare una rete separata, installando in ogni client una seconda scheda di rete che "parli" solo con il (o i) server di backup.
Aspetti tecnici a parte, il management aziendale deve, innanzitutto, condurre una valutazione dei costi e dei benefici delle procedure di backup in sé e, più in dettaglio, di una particolare soluzione rispetto a unaltra. Se è difficile pensare a unazienda che possa operare in sicurezza senza adottare un qualche sistema di backup, più complesso ancora è stabilire quale delle soluzioni disponibili sia la più opportuna. Il backup non va più visto unicamente come problema "tecnologico" di pertinenza dellIt manager, ma come tematica legata più in generale a tutta loperatività dellazienda. I costi del software, dellhardware e delle risorse interne da dedicare a queste attività devono essere, di conseguenza, calcolati in rapporto al rischio di perdere in parte o del tutto i dati e, quindi, una parte della propria "efficacia" aziendale. È soprattutto nelle piccole-medie imprese che queste considerazioni stanno oggi prendendo piede, sulla spinta di una visione del dato come informazione da sfruttare commercialmente e non più come semplice stringa di bit.
Rotazione e archiviazione
Indipendentemente dalla tecnica di salvataggio adottata, grazie alla rotazione dei nastri è sempre possibile ripristinare un file utilizzando un nastro precedente, anche se non si tratta della versione più aggiornata. Se si esegue il backup sempre sullo stesso nastro, si corre invece il rischio di non poter ripristinare i dati perduti in caso di danneggiamento.
È importante, infine, archiviare i nastri in un luogo differente da quello in cui sono contenuti i sistemi informatici aziendali per evitare che un problema a questultimo si estenda anche ai supporti utilizzati per salvare i dati, rendendo quindi vane tutte le azioni di salvataggio effettuate.
Tra le tecniche di rotazione, può essere presa in considerazione quella in cui ciascun backup giornaliero è contenuto in un nastro distinto che viene archiviato e rimosso dalla rotazione. Nellesempio che stiamo trattando sono, quindi, utilizzati sei nastri e larchiviazione riguarda solo quello relativo al venerdì. Per le settimane successive è possibile utilizzare i nastri corrispondenti allo stesso giorno della settimana conclusa. Questi backup possono essere aggiunti oppure sostituiti ai precedenti. Unaltra tecnica possibile prevede che per i backup effettuati dal lunedì al giovedì venga impiegato un solo nastro, in cui ciascun backup segue quello precedente. Quello realtivo al venerdì è invece eseguito su un nastro distinto e archiviato. La settimana successiva le operazioni possono essere eseguite partendo dal primo nastro. In questultimo caso sono necessari solo due nastri, con lo svantaggio, però, di poter effettuare esclusivamente il restore dellultimo venerdì trascorso.