Tesseract

Tesseract

Tesseract.js ist eine Javascript-Bibliothek, die Wörter in fast jeder Sprache aus Bildern herausholt.
Tesseract.js ist eine Javascript-Bibliothek, die Wörter in fast jeder Sprache aus Bildern herausholt.Das Tesseract OCR-Triebwerk war eines der Top-3-Triebwerke im UNLV-Genauigkeitstest 1995.Zwischen 1995 und 2006 wurde wenig daran gearbeitet, aber es ist wahrscheinlich eine der genauesten Open-Source-OCR-Engines, die es gibt.Der Quellcode liest ein Binär-, Grau- oder Farbbild und gibt Text aus.Ein eingebauter TIFF-Reader liest unkomprimierte TIFF-Bilder, oder es kann ein Libtiff hinzugefügt werden, um komprimierte Bilder zu lesen.Es gibt Sprachdateien für viele Sprachen, auch für Texte, die in Fraktur- und Blackletter-Schriften geschrieben sind.

Eigenschaften

Tesseract-Alternativen für Chrome

CopyFish

CopyFish

Extrahieren und übersetzen Sie Text aus Bildern / Videos / PDFs auf jeder Website.