Come convertire HTML in testo?

Non credo che curl abbia un processore HTML integrato. Tuttavia:

lynx --dump <URL>

fa il trucco.

Se vuoi ancora usare curl, puoi usare html2text (disponibile in Ubuntu).

Puoi installare html2text (un convertitore avanzato da HTML a testo) e l'utilizzo è semplice:

$ html2text
$ cat file.html | html2text -o file.txt

Installa entro:

  • Linux:apt-get install html2text
  • OS X:brew install html2text

Esempio con curl :

$ curl -sL | html2text
Search Images Maps Play YouTube News Gmail Drive More ?
Web History | Settings | Sign in
     A better way to browse the web
       Get Google Chrome

          Advanced search Language tools

        [Google Search][I'm Feeling Lucky]

     Advertising Programmes Business Solutions+GoogleAbout
                           ? 2016 - Privacy - Terms

