GNU/Linux >> Linux Esercitazione >  >> Linux

Tolleranza ai guasti di Linux:alta disponibilità di Linux

I tempi di inattività dell'IT sono costosi per qualsiasi azienda. Gartner[I] stima che ogni minuto di inattività costi in media $ 5.600, con costi effettivi che dipendono dal verticale, dalle dimensioni dell'azienda e da altri fattori. Il costo può essere ampiamente evitato, tuttavia, con sistemi progettati per un'elevata disponibilità e tolleranza ai guasti.

Definizione:High AvailabilityOracle[II] definisce l'alta disponibilità come "ambienti informatici configurati per fornire disponibilità quasi a tempo pieno". Uno standard comune per l'alta disponibilità è "cinque nove" o tempo di attività del 99,999%.

Non tutti i fornitori di servizi sono in grado di soddisfare questo solido standard, che rende consentiti poco più di 5 minuti di fermo macchina all'anno.

Per le organizzazioni che si avvicinerebbero al costo medio dei tempi di inattività, ottenere una disponibilità persino superiore a "cinque nove" è importante per la redditività e persino per la sopravvivenza. Atlantic.net offre una garanzia di uptime di rete del 100% leader del settore, in parte sfruttando l'elevata disponibilità di Linux (Linux-HA).

Introduzione all'alta disponibilità

Come spiega Oracle, le reti sono configurate per l'elevata disponibilità utilizzando hardware e software ridondanti ed evitando singoli "punti di errore" per mantenere il sistema in funzione in caso di problemi. I carichi di lavoro sono distribuiti tra le parti della rete dal sistema di bilanciamento del carico, che reindirizza il traffico lontano da qualsiasi componente che abbia avuto problemi o sia stato portato offline.

I server raggruppati per il funzionamento unificato dal servizio di bilanciamento del carico sono noti come cluster. Un sistema che continua a funzionare correttamente quando uno dei suoi componenti si guasta è considerato a tolleranza di errore. Lo spostamento automatico del traffico o di un carico di lavoro all'interno del cluster per evitare un errore è chiamato processo di failover e, quando viene utilizzato, un utente finale può continuare a utilizzare un'applicazione anche se il server su cui si trova si arresta in modo anomalo.

Il vantaggio principale dei sistemi ad alta disponibilità è la riduzione dei costi dovuti ai tempi di inattività non pianificati. Il bilanciamento del carico non solo aumenta l'affidabilità, ma può anche migliorare la velocità di ripristino tramite l'automazione e il rilevamento degli errori. Inoltre, può anche migliorare le prestazioni dell'applicazione.

"Anche se un'applicazione è scritta male o presenta problemi con il ridimensionamento, un sistema di bilanciamento del carico può migliorare l'esperienza dell'utente senza altre modifiche".

NGINX [III]

La possibilità di aggiornare i componenti del sistema senza portare l'intero sistema offline aiuta anche a garantire che le attività di manutenzione come backup e aggiornamenti vengano eseguite correttamente e non affrettate a tornare in funzione. I sistemi ad alta disponibilità forniscono ulteriore protezione consentendo alle organizzazioni di monitorare in modo proattivo la propria rete e riducendo il rischio di perdita di dati con l'archiviazione ridondante.

L'elevata disponibilità può anche essere preziosa, o addirittura necessaria, per garantire la conformità alle normative, come l'hosting conforme a HIPAA. La norma di sicurezza HIPAA[IV] richiede che "le informazioni siano accessibili e utilizzabili su richiesta", nonché un piano di emergenza per garantire che rimangano tali "durante eventi negativi imprevisti", come richieste impreviste o guasti hardware.

Costruire la tolleranza ai guasti nella tua rete

Alcuni prodotti di bilanciamento del carico comunemente usati che possono fornire tolleranza agli errori includono Apache Zookeeper, Pacemaker e HAProxy. Zookeeper[V] è un servizio di coordinamento open source per sistemi distribuiti che fornisce alta disponibilità quando viene eseguito su più server. Funziona su nodi di rete in "insiemi" di numero dispari e li coordina attraverso uno spazio dei nomi di registri di dati che crea. Pacemaker[VI] è un gestore di risorse cluster, è anche open-source e originariamente faceva parte del progetto Linux-HA, ma da allora è diventato proprio. Anch'esso funziona sui nodi e li coordina tramite il servizio di infrastruttura del cluster, come Heartbeat o OpenAIS.

HAProxy[VII], al contrario, è incluso nell'appliance Managed Firewall di Atlantic.Net.

La tolleranza ai guasti è fornita dal controllo di HAProxy delle risorse di rete ridondanti. Se un server si guasta, HAProxy utilizza uno dei numerosi algoritmi inclusi per reindirizzare il traffico lontano dal problema e verso il server ridondante, che ha mantenuto pronto per questo scopo. Il passaggio al nuovo server richiede circa un secondo, mentre possono essere necessarie ore per portare online un server bloccato. Il costo di quel server ridondante viene generalmente risparmiato in tempi di inattività ridotti in pochi minuti da quando ciò si verifica.

HAProxy non solo funziona per assistere il tuo sito nel caso in cui un server si guasti o debba essere spento per manutenzione, ma può anche essere configurato per bilanciare il carico del traffico web quando entrambi i server sono attivi, aumentando i tempi di risposta ai tuoi clienti.

HAProxy è anche open-source e ora viene fornito con molte distribuzioni Linux popolari. La comunità HAProxy attiva aggiorna continuamente il software e le nuove versioni possono essere implementate senza riconfigurazione. HAProxy serve miliardi di pagine Web al giorno e sposta ingenti somme di denaro per le aziende Fortune 500 ed è stato senza bug in una versione stabile (completata) o una singola intrusione nota per 13 anni.

Migliori pratiche correlate

In uno scenario in cui il traffico di rete dannoso provoca un errore, il bilanciamento del carico generalmente non risolve il problema da solo. Il firewall, che filtra il traffico, impedisce al problema di seguire semplicemente il carico di lavoro sul nuovo server. Allo stesso modo, il filtraggio del traffico del firewall fa ben poco per ridurre la vulnerabilità della rete a guasti hardware o bug software al suo interno. L'utilizzo di un potente firewall e di un sistema ad alta disponibilità fornisce un notevole miglioramento della protezione complessiva.

Una rete con ridondanza integrata, con carichi di lavoro controllati da un sistema di bilanciamento del carico, tollera anche gli errori peggiori e offre la massima disponibilità. Proprio come il giusto mix di diversi componenti garantisce l'affidabilità della rete, le organizzazioni che trarrebbero vantaggio dall'elevata disponibilità li raggiungeranno utilizzando un sistema di bilanciamento del carico come HAProxy, insieme a un set completo di componenti di rete ridondanti.

Con le soluzioni di hosting VPS di Atlantic.Net, ci assicuriamo che i tuoi server siano configurati per l'alta disponibilità su richiesta. In combinazione con il nostro dispositivo Managed Firewall, questo fornisce una soluzione affidabile per evitare che il tuo sito si interrompa quando ne hai più bisogno. Per assistenza o ulteriori informazioni, inviaci un'e-mail all'indirizzo [email protected]. Il nostro team di vendita può aiutarti a guidarti rapidamente e facilmente attraverso il processo.

[I] http://blogs.gartner.com/andrew-lerner/2014/07/16/the-cost-of-downtime/

[II] https://docs.oracle.com/cd/A91202_01/901_doc/rac.901/a89867/pshavdtl.htm

[III] https://www.nginx.com/blog/10-tips-for-10x-application-performance/

[IV]https://www.hhs.gov/sites/default/files/ocr/privacy/hipaa/administrative/securityrule/securityrulepdf.pdf?language=es

[V] https://cwiki.apache.org/confluence/display/ZOOKEEPER/ProjectDescription

[VI] http://wiki.clusterlabs.org/wiki/Pacemaker

[VII] http://www.haproxy.org/


Linux
  1. Linux – Determinazione di file specifici responsabili di I/o elevati?

  2. Linux:cosa sono la memoria alta e la memoria insufficiente su Linux?

  3. Comando Linux mv

  4. Linux du comando

  5. RCRON – Imposta l'alta disponibilità dei lavori cron

Come distribuire un cluster a tolleranza di errore con disponibilità continua o elevata

Conservazione e disponibilità elevata:argomenti avanzati

Come configurare un cluster Pacemaker per Linux ad alta disponibilità

Pfsense alta disponibilità

Linux vs Unix

Hosting Humor:il ruolo della tolleranza agli errori nella vita coniugale