html2text

html2text

html2text ist ein in C ++ geschriebenes Befehlszeilendienstprogramm, das HTML-Dokumente in einfachen Text konvertiert.
html2text ist ein in C ++ geschriebenes Befehlszeilendienstprogramm, das HTML-Dokumente in einfachen Text konvertiert.Jedes HTML-Dokument wird von einem Ort geladen, der durch einen URI angegeben ist, oder von der Standardeingabe gelesen und in einen Strom von Klartextzeichen formatiert, der in die Standardausgabe oder in eine Ausgabedatei geschrieben wird.Der Eingabe-URI kann eine entfernte Site angeben, von der die Dokumente über das Hypertext Transfer Protocol (HTTP) geladen werden.Das Programm ist in der Lage, die ursprünglichen Positionen der Tabellenfelder beizubehalten, die Bildschirmbreite einzustellen (auf eine bestimmte Anzahl von Ausgabezeichen) und auch syntaktisch falsche Eingaben zu akzeptieren (wobei versucht wird, diese "vernünftig" zu interpretieren).Fettgedruckter und unterstrichener Text wird standardmäßig mit Backspace-Sequenzen gerendert (was besonders nützlich ist, wenn die Programmausgabe in "less" oder einen anderen Pager umgeleitet wird).Alle Rendereigenschaften können weitgehend über eine RC-Datei eingestellt werden.
html2text

Kategorien

Alternativen zu html2text für Web mit kostenloser Lizenz