Zu Inhalt springen

fraktur und nichtlateinische alphabete und ocr

Hervorgehobene Antworten

moin,

ich gehe mit dem gedanken schwanger, ein buch einzuscannen und durch eine texterkennung zu jagen, damit ich mir die abtipperei sparen kann. das buch ist in fraktur, polytonischen griechisch und antiqua gesetzt (hebräisch ist nicht ausgeschlossen).

habt ihr erfahrung mit derlei problemen?

welche programme (macos oder windows) könnt ihr empfehlen?

was verwendet google für seine büchersammlung (das von mir gewünschte ist leider nicht dabei)?

soweit ich mich erinnere, gab es von abby mal eine spezielle frakturlösung, habe die jedoch nicht auf deren website gefunden.

ciao

phoibos

Keine eigene Erfahrung damit, aber wie wär’s mit http://code.google.com/p/ocropus/?

OCRopus is a state-of-the-art document analysis and OCR system, featuring pluggable layout analysis, pluggable character recognition, statistical natural language modeling, and multi-lingual capabilities.

Da solltest du die Fraktur-Erkennung »reinpluggen« (dieses Denglisch immer! :neenee:) können.

Für tesseract gibt es auch ein Fraktur-Plugin. Nur sollten die Bilder schon sehr scharf sein, sonst kommt da viel Unsinn raus.

Da solltest du die Fraktur-Erkennung »reinpluggen« (dieses Denglisch immer! :neenee:) können.

„einklinken“? :tuschel:

Erstelle ein Konto, um zu kommentieren

Wichtige Informationen

Wir setzen Cookies, um die Benutzung der Seite zu verbessern. Du kannst die zugehörigen Einstellungen jederzeit anpassen. Ansonsten akzeptiere bitte diese Nutzung.

Konto

Navigation

Browser-Push-Nachrichten konfigurieren

Chrome (Android)
  1. Klicke das Schloss-Symbol neben der Adressleiste.
  2. Klicke Berechtigungen → Benachrichtigungen.
  3. Passe die Einstellungen nach deinen Wünschen an.
Chrome (Desktop)
  1. Klicke das Schloss-Symbol in der Adresszeile.
  2. Klicke Seiteneinstellungen.
  3. Finde Benachrichtigungen und passe sie nach deinen Wünschen an.