GNU/Linux >> Linux Esercitazione >  >> Linux

Storie di Linux:quando i backup hanno salvato la giornata

Questo articolo è una storia del mio passato. Lavoravo come amministratore di sistema per un'azienda che gestiva un negozio online che vendeva hardware e software per computer.

Nella parte posteriore, dozzine di dipendenti utilizzavano un terminal server per lavorare con il software ERP che gestiva tutte le merci e il commercio. Terminal server e database erano fondamentali per il processo aziendale di vendita dei nostri prodotti. Quando uno di questi sistemi si guastava, decine di dipendenti non potevano svolgere il proprio lavoro e i clienti non potevano più acquistare nulla.

Quanto tempo abbiamo?

Quindi ci siamo seduti con il proprietario del processo aziendale e gli abbiamo chiesto:"Beh, pensa a una situazione in cui il sistema è rotto e non è più utilizzabile. Quanto tempo devi recuperare prima che il danno per l'azienda sia devastante?" Il manager ci ha pensato a lungo e ha detto:"Due ore, al massimo!"

Ci siamo seduti con i ragazzi che eseguivano l'applicazione ERP e abbiamo chiesto loro:"Quanto tempo ci vorrebbe per reinstallare l'applicazione e configurare il server terminal se dovessimo eseguire il ripristino da un errore irreversibile del sistema?" La risposta è stata:"Due giorni, minimo!" Immagino che tu possa vedere il divario qui.

Per me, la prima priorità era ridurre il tempo di ripristino da due giorni a meno di due ore. La reinstallazione del sistema operativo, delle applicazioni e il ripristino dei backup dei dati non erano un'opzione perché richiede troppo tempo. Ho scelto un'applicazione di backup dell'immagine in grado di eseguire un backup completo del sistema ovvero il sistema operativo, le applicazioni installate, le librerie e i dati. Utilizzando questo software, sarei in grado di ripristinare il sistema senza alcuna attività di installazione manuale da completare.

Di cosa abbiamo bisogno?

Una configurazione classica consiste nell'eseguire il backup di notte quando nessuno lavora. In caso di guasto, dovremmo ripristinare l'immagine di ieri sera o forse una versione ancora precedente. In questo scenario, un test ha mostrato che erano necessarie cinque ore per un ripristino completo. È meglio di due giorni, ma non è ancora abbastanza. E c'è un altro problema nascosto in questo approccio. Se il sistema si è arrestato in modo anomalo la sera e dobbiamo ripristinare dal backup della scorsa notte, perderemo tutte le modifiche del giorno corrente. Non era accettabile per il nostro negozio online. Bene, il nostro primo pensiero è stato quello di eseguire un backup incrementale ogni ora. In tal caso, perderemmo solo l'ultima ora di dati. Ma cosa succede quando il problema che interrompe il nostro sistema è già nell'immagine di backup quando scopriamo il problema? Bene, ecco cosa abbiamo fatto.

Ci siamo seduti di nuovo e abbiamo discusso di quanto tempo ci vuole per scoprire un problema devastante che porterebbe a un ripristino del sistema. Abbiamo concordato un lasso di tempo di quattro ore. In sintesi, volevamo perdere meno lavoro possibile, ripristinare in massimo due ore e assicurarci che un problema non fosse già presente nel backup quando lo abbiamo scoperto. Con queste informazioni, ho impostato un approccio di backup che i fornitori di software chiamano ripristino istantaneo, ripristino shadow, ripristino preventivo o termini simili. Abbiamo eseguito processi di backup incrementali ogni ora e ripristinato i backup in background su una nuova macchina virtuale. Ogni ora intera, avevamo un sistema pronto che era indietro nel tempo di quattro ore e doveva solo essere completato. Quindi, se scelgo di ripristinare l'incremento di un'ora fa, ci vorrebbe meno tempo di un ripristino completo del sistema perché solo i piccoli incrementi dovevano essere ripristinati sulla macchina virtuale quasi pronta.

E lo sforzo è stato ripagato

Un giorno, ero in vacanza, stavo mangiando un barbecue e una birra, quando ho ricevuto una chiamata dal mio collega che mi diceva che il terminal server con l'applicazione ERP era rotto a causa di un aggiornamento fallito e il ragazzo che ha eseguito l'aggiornamento si è dimenticato di prendere prima un'istantanea.

L'unica cosa che dovevo dire al mio collega era di spegnere la macchina danneggiata, trovare l'interfaccia utente del nostro sistema di backup/ripristino e quindi identificare il processo di ripristino. Infine, gli ho detto come scegliere il timestamp dalle ultime quattro ore in cui il ripristino dovrebbe terminare. Il ripristino è terminato 30 minuti dopo e il sistema era pronto per essere riutilizzato. Siamo tornati in azione dopo un totale di 30 minuti e solo il lavoro delle ultime due ore circa è andato perso! Eccezionale! Ora, torna in vacanza.

Concludi

Quindi tieni presente che tempo e denaro per una soluzione di backup e ripristino adeguata sono ben spesi quando si tratta di un ripristino di emergenza.

[ Corso online gratuito:panoramica tecnica di Red Hat Enterprise Linux. ]


Linux
  1. Storie di Linux:quando i backup hanno salvato la giornata

  2. Addomesticare il comando tar:suggerimenti per la gestione dei backup in Linux

  3. Linux:il valore appropriato di Vm.swappiness quando si utilizza Zram?

  4. Linux:come convincere Pacman a utilizzare i Pkgbuild personalizzati durante l'aggiornamento?

  5. Accelera la sincronizzazione durante la migrazione di un server Linux dalla riga di comando

Ripristina un vecchio MacBook con Linux

Le dieci più grandi storie di Linux dell'anno 2015

Che cos'è la shell in Linux?

Come scoprire chi ha riavviato il sistema Linux e quando

Il comando timer in Linux

Ripristina le dimensioni di un'unità USB (Linux)