GNU/Linux >> Linux Esercitazione >  >> Linux

Come convertire HTML in testo?

Non credo che curl abbia un processore HTML integrato. Tuttavia:

lynx --dump <URL>

fa il trucco.

Se vuoi ancora usare curl, puoi usare html2text (disponibile in Ubuntu).


Puoi installare html2text (un convertitore avanzato da HTML a testo) e l'utilizzo è semplice:

$ html2text http://example.com/
$ cat file.html | html2text -o file.txt

Installa entro:

  • Linux:apt-get install html2text
  • OS X:brew install html2text

Esempio con curl :

$ curl -sL google.com | html2text
Search Images Maps Play YouTube News Gmail Drive More ?
Web History | Settings | Sign in
     A better way to browse the web
       Get Google Chrome

          Advanced search Language tools

        [Google Search][I'm Feeling Lucky]

     Advertising Programmes Business Solutions+GoogleAbout GoogleGoogle.com
                           ? 2016 - Privacy - Terms

Linux
  1. Come convertire l'output della shell di Linux in HTML?

  2. Come si aggiunge del testo a un file?

  3. Converti una stringa di testo in bash in array

  4. Come convertire PDF in scala di grigi

  5. Come scartare un testo di 80 caratteri

Come convertire un file Windows in un file UNIX

Come convertire i formati di file con Pandoc in Linux [Guida rapida]

Come convertire una pagina Web in PDF in Linux

Come installare Vim (vi) su Windows 10

Modificare una posta in arrivo da testo/normale a testo/html?

Come convertire un documento di testo in voce su Ubuntu usando eSpeak