Perché non usare cose che sono state controllate da migliaia di utenti e hanno dimostrato la loro affidabilità? Puoi semplicemente distribuire il server Hyper-V gratuito con, ad esempio, StarWind VSAN Free e ottenere un vero HA senza problemi. Dai un'occhiata a questo manuale:https://www.starwindsoftware.com/resource-library/starwind-virtual-san- scenario-iperconvergente-a-2-nodi-con-iper-v-server-2016
Ho un'installazione molto simile con la configurazione che hai descritto:un server KVM con una replica stanby tramite DRBD attivo/passivo. Per avere un sistema il più semplice possibile (e per evitare qualsiasi scissione automatica, ad esempio a causa del fatto che il mio cliente interferisce con la rete del cluster), ho anche abbandonato il failover automatico del cluster.
Il sistema ha più di 5 anni e non mi ha mai dato alcun problema. La mia impostazione del volume è la seguente:
- un volume RAID dedicato per l'archiviazione delle VM;
- un piccolo volume di sovrapposizione contenente i file di configurazione QEMU/KVM;
- volumi maggiori per i dischi virtuali;
- una risorsa DRBD che gestisce l'intero dispositivo a blocchi dell'array dedicato.
Ho scritto alcuni script di shell per aiutarmi in caso di failover. Puoi trovarli qui
Tieni presente che il sistema è stato progettato per le massime prestazioni, anche a scapito di funzionalità come istantanee veloci e dischi virtuali basati su file (anziché basati su volume).
Ricostruendo ora una configurazione attiva/passiva simile, propenderei fortemente per l'utilizzo di ZFS e della replica asincrona continua tramite send/recv
. Non è una replica basata su blocchi in tempo reale, ma è più che sufficiente per oltre il 90% dei casi.
Se la replica in tempo reale è davvero necessario, userei DRBD sopra a ZVOL + XFS; Ho testato una tale configurazione + pacemaker automatico nel mio laboratorio con grande soddisfazione, infatti. Se l'utilizzo di moduli di terze parti (come lo è ZoL) non è possibile, utilizzerei una risorsa DRBD sopra un lvmthin
volume + XFS.
Puoi configurare totalmente DRBD e usarlo in modo puramente manuale. Il processo non dovrebbe essere affatto complesso. Faresti semplicemente ciò che fa un cluster Pacemaker o Rgmanager, ma a mano. Essenzialmente:
- Arresta la VM sul nodo attivo
- Declassare DRBD sul nodo attivo
- Promuovi DRBD sul nodo peer
- Avvia la VM sul nodo peer
Naturalmente, ciò richiederà che entrambi i nodi abbiano i pacchetti corretti installati e che le configurazioni e la definizione della VM esistano su entrambi i nodi.
Posso assicurare che lo stack Linux HA (corosync e pacemaker) è ancora attivamente sviluppato e supportato. Molte guide sono vecchie, il software esiste da 10 anni. Se fatto correttamente, non ci sono grossi problemi o problemi. Non è abbandonato, ma non è più "nuovo ed eccitante".