GNU/Linux >> Linux Esercitazione > >> Linux

Pulizia Linux:gestione di archivi e backup

Ogni amministratore di sistema sa, o dovrebbe sapere, che l'esecuzione e la gestione dei backup è una parte essenziale dell'essere un amministratore di sistema. Se leggi 5 suggerimenti per il backup e il ripristino di Linux dalle trincee, sai come eseguire e gestire i backup. Ma la gestione dello spazio richiesto per eseguire quei backup è un argomento molto diverso. Questo fa parte delle pulizie di Linux che devi considerare nel tuo flusso di lavoro quotidiano.

In questo articolo, toccherò parti critiche della gestione del backup come posizione, conservazione, smaltimento e smaltimento e automazione. Il tuo ambiente e le tue politiche determineranno le soluzioni che implementerai per la gestione dello spazio di backup, ma queste linee guida e consigli ti aiuteranno se hai difficoltà a gestire una quantità crescente di dati inattivi archiviati sulla tua rete.

Posizione, posizione, posizione

Tutti hanno sentito il vecchio detto immobiliare che afferma che la posizione è l'aspetto più importante di una proprietà. Lo spazio di archiviazione è come una proprietà immobiliare in quella posizione è molto importante. I tre valori di posizione sono elencati di seguito.

Dischi ad alta velocità:storage di backup iniziale ea breve termine
Archiviazione collegata alla rete:unità pubbliche e spazi condivisi
Archiviazione fuori sede e archiviazione basata su cloud:archiviazione a lungo termine

Dischi ad alta velocità

Lo storage su disco ad alta velocità include storage collegato localmente, flash array e storage SAN. Questa posizione è dove inizialmente atterrano i backup, ma non vengono archiviati lì a lungo termine. Questi tipi di archiviazione sono troppo costosi da utilizzare per l'archiviazione di backup. I dati devono essere spostati in uno spazio di archiviazione a basso costo subito dopo i backup.

Dovresti anche separare i backup dai dati di produzione. In altre parole, non raccogliere backup sugli stessi dischi in cui sono presenti database, registri delle transazioni o altri servizi ad alta intensità di scrittura che archiviano i dati.

Archiviazione collegata alla rete

L'archiviazione collegata alla rete è generalmente per applicazioni di dati in uso come unità pubbliche e spazi condivisi. Queste aree non sono per i backup; i set di backup sono generalmente troppo grandi per essere archiviati in spazi pubblici. Anche i drive pubblici e gli spazi condivisi devono essere sottoposti a backup, che è un altro motivo per non archiviare i set di backup in queste aree.

È possibile eseguire il provisioning di storage di backup collegato alla rete separato per archiviare i dati per l'accesso e l'utilizzo a lungo termine. Nella regola 3-2-1, questa sarebbe una delle due copie di dati archiviate su supporti diversi. Una volta che i dati sono stati trasferiti allo storage di rete, possono essere replicati su un array separato, su un supporto di archiviazione o su qualche tipo di storage fuori sede.

[ Stai pensando a una strategia cloud? Scopri perché le aziende scelgono il cloud ibrido aperto. ]

Archiviazione fuori sede

L'archiviazione dei dati fuori sede è costituita da dati che rimarranno invariati e non accessibili da utenti o amministratori. È statico e viene archiviato per scopi di ripristino di emergenza. Alcuni amministratori eseguono il backup dall'archiviazione collegata alla rete a una qualche forma di archiviazione su disco portatile per la consegna e l'archiviazione fuori sede.

In alternativa, gli amministratori possono trasferire i dati dallo storage collegato alla rete allo storage basato su cloud o ospitato per scopi di ripristino di emergenza.

Conservazione

Di tutti i problemi di pulizia che devono affrontare gli amministratori di sistema, la conservazione dei dati è la più controversa e la più scrupolosa. La conservazione del backup è sempre un ottimo foraggio per il dibattito tra gli amministratori di sistema. La conservazione si riferisce alla quantità di tempo in cui si conservano i backup in caso di un evento di emergenza o in caso di necessità di un ripristino completo. Sebbene queste istanze siano rare, è comunque necessaria una contingenza nel caso in cui si verifichino.

I miei suggerimenti sono i seguenti:

Dati critici:da 0 giorni a 6 mesi
Dati utente:da 7 a 30 giorni
Dati transazionali:3 giorni
Dati legacy:permanenti su dischi non collegati

I backup richiedono molto spazio di archiviazione e più a lungo conservi i dati, maggiore è lo spazio necessario. La conservazione è buona, ma esagerare spreca risorse. I dati a cui non si accede da più di 30 giorni devono essere archiviati dove sono ancora accessibili se necessario. Ad un certo punto, devi sentirti a tuo agio nel buttare via dati vecchi e obsoleti.

Smaltimento e smaltimento

Non so voi, ma distruggere i dati, anche con il permesso o una direttiva in tal senso, mi mette sempre un po' a disagio. Smantellare le unità utilizzate per l'archiviazione mi fa sentire uno spreco. Distruggere i nastri è forse il peggiore di tutti. Forse sono un accumulatore nel cuore, ma non posso farne a meno. Il mio istinto mi dice di proteggere tutti i dati. Questa ossessione di conservare troppi dati è quasi quanto un'ossessione di distruggere i dati.

Smaltimento e disposizione non sono la stessa cosa. C'è una distinzione. Hanno lo stesso obiettivo finale, ovvero rimuovere i dati, e possibilmente l'hardware, dalla rete.

L'eliminazione è la rimozione dei dati e dell'hardware su cui risiedono senza tener conto delle eventuali conseguenze di tale eliminazione. Vale a dire che questo tipo di rimozione non implica necessariamente la rimozione sicura di dati o hardware. A volte i dati non vengono affatto cancellati, ma l'hardware stesso viene buttato via o riciclato. Questa rimozione negligente può causare violazioni della sicurezza e impatto ambientale.

La disposizione è la rimozione responsabile di dati e hardware. Di solito è regolato dalla politica. Per dati, significa la distruzione irreversibile dei dati con mezzi che ne rendono impossibile il recupero. Per l'hardware, la disposizione si riferisce al riciclaggio responsabile, alla rimessa in servizio o alla restituzione al produttore, magari nell'ambito di una sostituzione o di un programma di aggiornamento.

Automazione

Ho impostato con successo sistemi di backup completamente automatizzati per più client. La mia automazione di solito consiste in backup automatici, set di backup automatici spostati in uno spazio di archiviazione più permanente e archiviazione automatizzata di dati a cui nessuno ha avuto accesso in più di sei mesi.

Il "trucco" per automatizzare i backup, o qualsiasi insieme complesso di attività, è il tempismo. Devi aspettare di finire il tuo primo compito prima di iniziare il secondo e così via. Ciò è particolarmente difficile con i backup perché la durata di un backup è imprevedibile. Invece di aspettare un periodo di tempo specifico per il completamento di un backup o di un'altra attività, ho impostato un controllo del processo. Se il mio processo è ancora in esecuzione, l'attività successiva non inizia. Questo metodo garantisce di non perdere mai un set di backup o di non spostare un set in un'archiviazione alternativa.

[ Cerchi un'automazione del sistema più avanzata? Inizia con The Automated Enterprise, un libro gratuito di Red Hat. ]

Conclusione

La gestione dello spazio per i backup è un punto dolente per gli amministratori di sistema. Lo spazio è sempre un problema e i dati crescono a un ritmo molto elevato. Come amministratori di sistema, siamo sempre alla ricerca di più spazio. Gli utenti richiedono più spazio. I registri crescono continuamente. I database crescono costantemente. I programmi stanno diventando più grandi. E ogni bit di hardware invia, riceve o archivia dati. È necessario conservare i dati in base alle policy ed eseguire backup, ma è anche responsabilità di preservare prezioso spazio su disco.

I veri amministratori di sistema non sudo

Un'introduzione a Cockpit, uno strumento di amministrazione basato su browser per Linux

Linux

Installa e usa MEGA Cloud Storage in Linux

Come eseguire il backup e il ripristino dei dati utilizzando Restic in Linux

Come installare e utilizzare Okteta per file di dati RAW in Linux

Come connettere e condividere dati tra due sistemi Linux

Come configurare la destinazione di archiviazione iSCSI Linux e l'accesso client remoto

I 15 migliori software econometrico e statistico per sistemi Linux