Heritrix

Heritrix

Heritrix ist das Open-Source-Webcrawler-Projekt von Internet Archive, das erweiterbar und in Webgröße in Archivqualität ist.Heritrix (manchmal buchstabiert Heretrix oder falsch geschrieben oder falsch als Heratrix / Heritix / Heretix / Heratix) ist ein archaisches Wort für Erbin (Frau, die erbt).Da unser Crawler versucht, die digitalen Artefakte unserer Kultur zum Nutzen zukünftiger Forscher und Generationen zu sammeln und zu bewahren, schien dieser Name passend.
heritrix

Kategorien

Heritrix-Alternativen für Self-Hosted

Apisearch

Apisearch

Durchsuchen Sie Millionen von Dokumenten und geben Sie Ihren Benutzern einzigartige, erstaunliche und unvergessliche Erlebnisse.