GNU/Linux >> Linux Esercitazione >  >> Cent OS

Come funziona Sanlock nella virtualizzazione di RedHat

In RHV, KVM Host utilizza Sanlock per rilevare la connettività con il dominio di archiviazione. Quando Sanlock abilita, aprirà wdmd daemon (watchdog multiplexing daemon) e invierà keepalive con un certo battito cardiaco. sanlock IO allo storage non viene completato entro un tempo prestabilito, sanlock interrompe l'invio di keepalive a wdmd. Quando è scaduto, il demone wdmd che controlla /dev/watchdog registrerà gli errori, avvertendo che il watchdog non viene mantenuto attivo e scadrà presto, quindi si attiverà e reimposterà l'host KVM.

$ systemctl status sanlock
● sanlock.service - Shared Storage Lease Manager
Loaded: loaded (/usr/lib/systemd/system/sanlock.service; disabled; vendor preset: disabled)
Active: active (running) since Mon 2020-07-13 15:03:26 NZST; 1 months 19 days ago
Process: 1041 ExecStart=/usr/sbin/sanlock daemon (code=exited, status=0/SUCCESS)
Main PID: 1044 (sanlock)
Tasks: 7
Memory: 18.6M
CGroup: /system.slice/sanlock.service
├─1044 /usr/sbin/sanlock daemon
└─1045 /usr/sbin/sanlock daemon

Warning: Journal has been rotated since unit was started. Log output is incomplete or unavailable.
$ systemctl status wdmd
● wdmd.service - Watchdog Multiplexing Daemon
Loaded: loaded (/usr/lib/systemd/system/wdmd.service; disabled; vendor preset: disabled)
Active: active (running) since Mon 2020-07-13 15:03:26 NZST; 1 months 19 days ago
Process: 1131 ExecStart=/usr/sbin/wdmd (code=exited, status=0/SUCCESS)
Process: 1112 ExecStartPre=/lib/systemd/systemd-wdmd watchdog-check (code=exited, status=0/SUCCESS)
Main PID: 1133 (wdmd)
Tasks: 1
Memory: 2.3M
CGroup: /system.slice/wdmd.service
└─1133 /usr/sbin/wdmd

Warning: Journal has been rotated since unit was started. Log output is incomplete or unavailable.

Il demone sanlock scrive continuamente nella memoria a intervalli prestabiliti per rinnovare i suoi contratti di locazione. Sanlock contrassegnerà l'host KVM come stato SCONOSCIUTO, FREE, LIVE, FAIL e DEAD in base all'IO di sanlock sul risultato di archiviazione.

sconosciuto:

L'host KVM ha un contratto di locazione sullo storage, ma il clusterlock non può dire se l'host è ancora attivo o morto. In genere durerebbe 10-20 secondi, ma è possibile che persista fino a 80 secondi prima che l'host KVM venga considerato attivo o guasto.

Gratuito:

Non esiste alcun contratto di locazione per questo ID host.

In diretta:

L'host KVM ha rinnovato il contratto di locazione negli ultimi 80 secondi. Potrebbe rinnovare il contratto di locazione ora o meno, possiamo dirlo solo controllando di nuovo più tardi.

Fallito:

L'host non ha rinnovato il contratto di locazione per 80 secondi. Durerebbe per 60 secondi prima che l'host sia considerato morto. Quando lo stato dell'host KVM è contrassegnato come "Fallito", sotto i registri correlati:

2020-08-31 21:35:01 1665117 [1044]: s1 check_our_lease warning 72 last_success 1665045
2020-08-31 21:35:02 1665118 [1044]: s1 check_our_lease warning 73 last_success 1665045
2020-08-31 21:35:03 1665119 [1044]: s1 check_our_lease warning 74 last_success 1665045
2020-08-31 21:35:04 1665120 [1044]: s1 check_our_lease warning 75 last_success 1665045
2020-08-31 21:35:05 1665121 [1044]: s1 check_our_lease warning 76 last_success 1665045
2020-08-31 21:35:06 1665122 [1044]: s1 check_our_lease warning 77 last_success 1665045
2020-08-31 21:35:07 1665123 [1044]: s1 check_our_lease warning 78 last_success 1665045
2020-08-31 21:35:08 1665124 [1044]: s1 check_our_lease warning 79 last_success 1665045
2020-08-31 21:35:09 1665125 [1044]: s1 check_our_lease failed 80
2020-08-31 21:35:10 1665125 [1044]: s1 all pids clear
2020-08-31 21:35:21 1665137 [3859]: 8d627013 aio timeout RD 0x7f56e00009b0:0x7f56e00009c0:0x7f56f0299000 ioto 10 to_count 4
2020-08-31 21:35:21 1665137 [3859]: s1 delta_renew read timeout 10 sec offset 0 /rhev/data-center/mnt/[mountpoint]/[SD_UUID]/dom_md/ids
2020-08-31 21:35:21 1665137 [3859]: s1 renewal error -202 delta_length 20 last_success 1665045

Morto:

L'host non ha rinnovato il contratto di locazione per 140 secondi.

Se sanlock IO to storage non viene completato entro un tempo prestabilito, il daemon sanlock entrerà in recovery. Il ripristino inizia con il demone sanlock che tenta di uccidere (SIGTERM) qualsiasi pid utilizzando i lease sullo storage interessato. Se un qualsiasi pid non esce dopo 10 SIGTERM in 10 secondi, sanlock tenterà quindi di uccidere (SIGKILL). Se i pid continuano a non uscire entro un tempo prestabilito, il watchdog si attiverà, ripristinando l'host. Se tutti i pid escono entro il tempo necessario, il watchdog verrà rinnovato e non si attiverà.


Cent OS
  1. Cos'è NGINX? Come funziona?

  2. Come funziona il bit appiccicoso?

  3. Ssh – Come funziona Tcp-keepalive in Ssh?

  4. Come funziona effettivamente sig_atomic_t?

  5. Come funziona il comando ps?

Come funziona SFTP?

Che cos'è VDI e come funziona?

Cos'è Docker? Come funziona?

Come funziona la memoria di scambio in Linux?

Come modificare l'hardware della macchina virtuale in RedHat Virtualization

Come funziona il display di Linux?