C'è la distribuzione Rocks Linux creata per il clustering e basata su CentOS/RHEL.
Il punto di forza delle rocce è che per la maggior parte gestirà e farà molte minuzie per te.
- Effettuerà l'installazione e la reinstallazione automatiche e, se i tuoi computer possono avviarsi tramite PXE, l'installazione iniziale consisterà nell'avvio PXE dei tuoi nodi. Se disponi di un numero elevato di nodi di calcolo, usano bittorrent internamente per la distribuzione dei pacchetti, il che rimuove un collo di bottiglia significativo per la (ri)installazione dell'intero sistema.
- Ti fornirà un ambiente di elaborazione molto omogeneo per impostazione predefinita.
- Per impostazione predefinita, configurerà e utilizzerà NFS internamente e ci sono opzioni per l'utilizzo di PVFS2 (che non ho provato).
- Per quanto riguarda i sistemi di accodamento/batch, dovrebbe configurarlo e gestirlo per te, per impostazione predefinita penso che utilizzi SGE, c'è anche un roll (il loro formato di raggruppamento del software) per la coppia.
- Garantirà coerenza in utenti/gruppi/ecc. nel tuo cluster
- Graficherà l'utilizzo delle risorse attraverso i gangli
Se dovessi scoprire i lati negativi
- L'aggiunta/rimozione di software dai nodi di calcolo comporta la loro reinstallazione (sebbene garantisca omogeneità).
- L'aggiunta/rimozione di software comporta l'aggiunta di aroll (il loro modo di raggruppare rpm/appliance) o la modifica di file xml. Tuttavia, è abbastanza ben documentato, quindi se sei disposto a fare uno sforzo per leggere la documentazione dovresti essere ok. In più c'è una mailing list se rimani bloccato.
- Si basa su CentOS/RHEL, che è un po' indietro rispetto a "bleedingedge"
- Ti costringerà (principalmente) a fare le cose "a modo loro", modifiche minori che potresti farla franca magari modificando alcuni dei file xml-config, modifiche importanti potrebbero dover essere implementate facendo, aggiungendo o modificando rotoli (il loro formato sw/addon)
Abbiamo un piccolo cluster che ha openSUSE come distribuzione di base, ma non credo sia troppo importante. Ubuntu sembra una valida alternativa e ha un bel po' di documentazione e supporto da parte della comunità. Oltre a Linux, eseguiamo Sun Grid Engine (e il nostro cluster include anche macchine Mac OS in modo abbastanza fluido), ma slurm probabilmente funzionerebbe per una configurazione semplice. Condividiamo home directory e /usr/local via NFS da un server centrale. Funziona bene per noi. Maggiori dettagli sono disponibili sul nostro sito Web (tramite Internet Archive).