Utilizzando Linux (Fedora, in particolare) come workstation principale, ho notato, a volte, strani caratteri non stampabili come negli screenshot seguenti (in basso a sinistra nella prima immagine e in alto a sinistra nella seconda immagine):
Nell'immagine sopra, i caratteri non stampabili sono apparsi in gnome-terminal con bash shell. Stavo uscendo dalla shell interattiva ipython da un sys.stdin.close()
hacking.
Nell'immagine sopra, il personaggio è apparso in una pagina web aperta in Firefox, in particolare nel file di testo RFC 822, appena prima del sommario di questa RFC.
Sono curioso e voglio sapere quali sono. Deduco che queste sono una sorta di rappresentazione di Unicode. Ho ragione? Se sì, dove viene definito questo tipo di notazione? Come si chiama?
Risposta accettata:
La casella quadrata è solitamente per i caratteri che sono assenti nel font corrente. Il codice all'interno è un codice di caratteri UTF-8 a due byte. I terminali moderni sono UTF8, quindi potresti ottenerlo se provi a inviare alcuni dati binari al tuo terminale. Sembra che tu abbia fatto qualcosa di veramente strano con il tuo python e python ha prodotto spazzatura sullo schermo, che sono stati interpretati come personaggi sconosciuti e hai ottenuto un po' di spazzatura utf-8. Puoi sempre ottenere spazzatura casuale simile con "cat /dev/urandom".