Apache Cassandra è un database distribuito NoSQL open source che offre scalabilità e disponibilità elevata senza compromettere le prestazioni ed è considerato affidabile da migliaia di aziende. La scalabilità lineare e la comprovata tolleranza ai guasti su hardware di base e infrastruttura cloud ne fanno una piattaforma ideale per i dati mission-critical. Questo tutorial descrive come installare Apache Cassandra su un server Ubuntu 20.04.
Prerequisiti#
- Un server Ubuntu 20.04
- Crea un utente non root con accesso sudo.
- Per usare cqlsh, l'ultima versione di Python 2.7 o Python 3.6+. Per verificare di avere la versione corretta di Python installata, digita
python --version
Installa Apache Cassandra#
-
Installa Java 8
Installa l'ultima versione di Java 8, Oracle Java Standard Edition 8 o OpenJDK 8.
$ sudo apt install openjdk-8-jdk -y
Per verificare di avere la versione corretta di java installata, digitare
java -version
.$ java -version
L'uscita potrebbe essere:
openjdk version "1.8.0_222" OpenJDK Runtime Environment (build 1.8.0_222-8u222-b10-1ubuntu1~16.04.1-b10) OpenJDK 64-Bit Server VM (build 25.222-b10, mixed mode)
-
Installa le dipendenze richieste.
$ sudo apt install apt-transport-https gnupg2 -y
-
Scarica e aggiungi la chiave GPG di Apache Cassandra.
$ sudo wget -q -O - https://www.apache.org/dist/cassandra/KEYS | sudo apt-key add -
Potresti vedere l'output:
% Total % Received % Xferd Average Speed Time Time Time Current Dload Upload Total Spent Left Speed 100 266k 100 266k 0 0 320k 0 --:--:-- --:--:-- --:--:-- 320k OK
-
Aggiungi il repository Apache Cassandra al tuo sistema.
$ echo "deb http://www.apache.org/dist/cassandra/debian 40x main" | sudo tee -a /etc/apt/sources.list.d/cassandra.sources.list
-
Aggiorna l'indice del pacchetto.
$ sudo apt-get update
-
Installa Apache Cassandra.
$ sudo apt-get install cassandra -y
-
Verifica che Apache Cassandra sia installato.
$ dpkg -l | grep cassandra
-
Verifica che Apache Cassandra sia in esecuzione.
$ sudo systemctl status cassandra
-
Verifica le statistiche del tuo nodo.
$ sudo nodetool status
La colonna dello stato nell'output dovrebbe riportare UN che sta per "Up/Normal".
In alternativa, connettiti al database con:
$ cqlsh
L'output dovrebbe assomigliare a questo:
Connected to Test Cluster at localhost:9042. [cqlsh 5.0.1 | Cassandra 3.8 | CQL spec 3.4.2 | Native protocol v4] Use HELP for help.
Configurazione di Apache Cassandra#
La Cassandra la posizione dei file di configurazione varia a seconda del tipo di installazione:
- tarball:
conf
directory all'interno del percorso di installazione del tarball - pacchetto:
/etc/cassandra
cartella
Dato che stiamo installando usando un pacchetto, useremo il /etc/cassandra
cartella.
-
Modifica il
cassandra.yaml
file.$ sudo nano /etc/cassandra/cassandra.yaml
Il file è un file YAML che contiene la configurazione per Apache Cassandra.
Il file è diviso in sezioni. Le sezioni sono separate da una riga che inizia con un
#
carattere.Aggiorniamo il
cluster_name
sezione.# cluster_name: The name of the cluster. cluster_name: My First Cluster
L'
cluster_name
viene utilizzata per identificare il cluster. -
Svuota la cache di sistema
$ nodetool flush system
Il
flush system
comando cancella la cache di sistema.La cache di sistema viene utilizzata per memorizzare le informazioni sul cluster. Queste informazioni vengono utilizzate per velocizzare l'avvio del cluster. La cache di sistema viene cancellata eseguendo
flush system
comando. Questo comando è utile quando si desidera avviare il cluster con una configurazione diversa. Ad esempio, potresti voler avviare il cluster con un numero diverso di nodi. -
Riavvia il servizio Cassandra.
$ sudo systemctl restart cassandra
Il
systemctl
Il comando viene utilizzato per avviare, arrestare, riavviare e abilitare/disabilitare il servizio. -
Verifica la modifica
$ cqlsh