Newspaper

Newspaper

Zeitung ist eine mit Python 3 erstellte Extraktion von Nachrichten-, Volltext- und Artikel-Metadaten. FUNKTIONEN - Funktioniert in mehr als 10 Sprachen (Englisch, Chinesisch, Deutsch, Arabisch, ...) - Multithread-Framework zum Herunterladen von Artikeln - URL-Identifizierung für Nachrichten -Textextraktion aus HTML - Extraktion von Top-Bildern aus HTML - Extraktion aller Bilder aus HTML - Extraktion von Schlüsselwörtern aus Text - Extraktion einer Zusammenfassung aus Text - Extraktion von Autoren aus Text - Extraktion von Begriffen aus Google-Trends
newspaper-metadata-extractor-

Kategorien

Alternativen zu Newspaper für alle Plattformen mit Open Source-Lizenz