spark-submit
stampa la maggior parte dell'output su STDERR
Per reindirizzare l'intero output a un file, puoi usare:
spark-submit something.py > results.txt 2>&1
Oppure
spark-submit something.py &> results.txt
Se esegui spark-submit su un cluster, i log vengono archiviati con l'ID applicazione. Puoi vedere i log al termine dell'applicazione.
yarn logs --applicationId <your applicationId> > myfile.txt
Dovrebbe procurarti il registro del tuo lavoro
L'ID applicazione del tuo lavoro viene fornito quando invii il lavoro Spark. Sarai in grado di vederlo nella console in cui stai inviando o dall'interfaccia utente di Hadoop.