Nella serie dei thread di Linux, abbiamo discusso sui modi in cui un thread può terminare e su come lo stato di ritorno viene passato dal thread di terminazione al suo thread padre. In questo articolo faremo luce su un aspetto importante noto come sincronizzazione dei thread.
Serie Linux Threads:parte 1, parte 2, parte 3, parte 4 (questo articolo).
Problemi di sincronizzazione dei thread
Prendiamo un codice di esempio per studiare i problemi di sincronizzazione :
#include<stdio.h> #include<string.h> #include<pthread.h> #include<stdlib.h> #include<unistd.h> pthread_t tid[2]; int counter; void* doSomeThing(void *arg) { unsigned long i = 0; counter += 1; printf("\n Job %d started\n", counter); for(i=0; i<(0xFFFFFFFF);i++); printf("\n Job %d finished\n", counter); return NULL; } int main(void) { int i = 0; int err; while(i < 2) { err = pthread_create(&(tid[i]), NULL, &doSomeThing, NULL); if (err != 0) printf("\ncan't create thread :[%s]", strerror(err)); i++; } pthread_join(tid[0], NULL); pthread_join(tid[1], NULL); return 0; }
Il codice sopra è semplice in cui vengono creati due thread (lavori) e nella funzione di avvio di questi thread viene mantenuto un contatore attraverso il quale l'utente ottiene i registri sul numero del lavoro che viene avviato e quando viene completato. Il codice e il flusso sembrano a posto ma quando vediamo l'output:
$ ./tgsthreads Job 1 started Job 2 started Job 2 finished Job 2 finished
Se ti concentri sugli ultimi due registri, vedrai che il registro "Lavoro 2 terminato" viene ripetuto due volte mentre non viene visualizzato alcun registro per "Lavoro 1 terminato".
Ora, se torni al codice e provi a trovare qualsiasi difetto logico, probabilmente non troverai facilmente alcun difetto. Ma se osserverai più da vicino e visualizzerai l'esecuzione del codice, scoprirai che:
- Il registro "Lavoro 2 avviato" viene stampato subito dopo "Lavoro 1 avviato" quindi si può facilmente concludere che mentre il thread 1 stava elaborando, lo scheduler ha pianificato il thread 2.
- Se l'ipotesi di cui sopra era vera, il valore della variabile "contatore" è stato nuovamente incrementato prima che il lavoro 1 fosse terminato.
- Quindi, quando il lavoro 1 è stato effettivamente terminato, il valore errato del contatore ha prodotto il registro "Lavoro 2 terminato" seguito da "Lavoro 2 terminato" per il lavoro effettivo 2 o viceversa poiché dipende dallo scheduler.
- Quindi vediamo che il problema non è il registro ripetitivo ma il valore sbagliato della variabile "contatore".
Il vero problema era l'utilizzo della variabile "contatore" da parte del secondo thread quando il primo thread lo stava usando o stava per usarlo. In altre parole possiamo dire che la mancanza di sincronizzazione tra i thread durante l'utilizzo del "contatore" di risorse condivise ha causato i problemi o in una parola possiamo dire che questo problema si è verificato a causa di un "problema di sincronizzazione" tra due thread.
Mutex
Ora, poiché abbiamo compreso il problema di base, discutiamo la soluzione ad esso. Il modo più diffuso per ottenere la sincronizzazione dei thread è utilizzare Mutex.
Un Mutex è un blocco che impostiamo prima di utilizzare una risorsa condivisa e rilasciamo dopo averlo utilizzato. Quando il blocco è impostato, nessun altro thread può accedere alla regione bloccata del codice. Quindi vediamo che anche se il thread 2 è pianificato mentre il thread 1 non ha avuto accesso alla risorsa condivisa e il codice è bloccato dal thread 1 utilizzando mutex, il thread 2 non può nemmeno accedere a quella regione di codice. Quindi questo garantisce un accesso sincronizzato delle risorse condivise nel codice.
Internamente funziona come segue:
- Supponiamo che un thread abbia bloccato una regione di codice utilizzando mutex e stia eseguendo quella parte di codice.
- Ora, se lo scheduler decide di effettuare un cambio di contesto, tutti gli altri thread pronti per essere eseguiti nella stessa regione vengono sbloccati.
- Solo uno di tutti i thread arriverebbe all'esecuzione, ma se questo thread tenta di eseguire la stessa regione di codice che è già bloccata, andrà di nuovo in modalità di sospensione.
- Il cambio di contesto avverrà ancora e ancora, ma nessun thread sarà in grado di eseguire la regione bloccata del codice fino a quando il blocco mutex su di essa non verrà rilasciato.
- Il blocco mutex verrà rilasciato solo dal thread che lo ha bloccato.
- Quindi questo garantisce che una volta che un thread ha bloccato un pezzo di codice, nessun altro thread può eseguire la stessa regione finché non viene sbloccato dal thread che lo ha bloccato.
- Quindi, questo sistema garantisce la sincronizzazione tra i thread mentre si lavora su risorse condivise.
Viene inizializzato un mutex e quindi si ottiene un blocco chiamando le seguenti due funzioni:
int pthread_mutex_init(pthread_mutex_t *restrict mutex, const pthread_mutexattr_t *restrict attr); int pthread_mutex_lock(pthread_mutex_t *mutex);
La prima funzione inizializza un mutex e tramite la seconda funzione è possibile bloccare qualsiasi regione critica nel codice.
Il mutex può essere sbloccato e distrutto chiamando le seguenti funzioni:
int pthread_mutex_unlock(pthread_mutex_t *mutex); int pthread_mutex_destroy(pthread_mutex_t *mutex);
La prima funzione sopra rilascia il blocco e la seconda funzione distrugge il blocco in modo che non possa essere utilizzato da nessuna parte in futuro.
Un esempio pratico
Vediamo un pezzo di codice in cui i mutex sono usati per la sincronizzazione dei thread
#include<stdio.h> #include<string.h> #include<pthread.h> #include<stdlib.h> #include<unistd.h> pthread_t tid[2]; int counter; pthread_mutex_t lock; void* doSomeThing(void *arg) { pthread_mutex_lock(&lock); unsigned long i = 0; counter += 1; printf("\n Job %d started\n", counter); for(i=0; i<(0xFFFFFFFF);i++); printf("\n Job %d finished\n", counter); pthread_mutex_unlock(&lock); return NULL; } int main(void) { int i = 0; int err; if (pthread_mutex_init(&lock, NULL) != 0) { printf("\n mutex init failed\n"); return 1; } while(i < 2) { err = pthread_create(&(tid[i]), NULL, &doSomeThing, NULL); if (err != 0) printf("\ncan't create thread :[%s]", strerror(err)); i++; } pthread_join(tid[0], NULL); pthread_join(tid[1], NULL); pthread_mutex_destroy(&lock); return 0; }
Nel codice sopra :
- Un mutex viene inizializzato all'inizio della funzione principale.
- Lo stesso mutex è bloccato nella funzione 'doSomeThing()' durante l'utilizzo della risorsa condivisa 'counter'
- Alla fine della funzione 'doSomeThing()' lo stesso mutex è sbloccato.
- Alla fine della funzione principale, quando entrambi i thread sono terminati, il mutex viene distrutto.
Ora se guardiamo l'output, troviamo:
$ ./threads Job 1 started Job 1 finished Job 2 started Job 2 finished
Quindi vediamo che questa volta erano presenti i log di inizio e fine di entrambi i lavori. Quindi la sincronizzazione dei thread è avvenuta tramite l'uso di Mutex.