DE102018119908A1 - Optical Character Recognition (OCR) system - Google Patents
Optical Character Recognition (OCR) system Download PDFInfo
- Publication number
- DE102018119908A1 DE102018119908A1 DE102018119908.2A DE102018119908A DE102018119908A1 DE 102018119908 A1 DE102018119908 A1 DE 102018119908A1 DE 102018119908 A DE102018119908 A DE 102018119908A DE 102018119908 A1 DE102018119908 A1 DE 102018119908A1
- Authority
- DE
- Germany
- Prior art keywords
- module
- text
- mtr
- image
- segments
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
- 238000012015 optical character recognition Methods 0.000 title claims abstract description 42
- 238000012552 review Methods 0.000 claims abstract description 4
- 101150114464 ATRN gene Proteins 0.000 claims abstract 6
- 238000012937 correction Methods 0.000 claims description 13
- 238000004590 computer program Methods 0.000 claims description 5
- 238000007781 pre-processing Methods 0.000 claims description 5
- 230000011218 segmentation Effects 0.000 claims description 5
- 230000006870 function Effects 0.000 claims description 3
- 238000002360 preparation method Methods 0.000 claims description 2
- 238000013518 transcription Methods 0.000 abstract description 35
- 230000035897 transcription Effects 0.000 abstract description 35
- 101100328463 Mus musculus Cmya5 gene Proteins 0.000 description 9
- 238000000176 thermal ionisation mass spectrometry Methods 0.000 description 9
- 238000013055 trapped ion mobility spectrometry Methods 0.000 description 9
- 238000012805 post-processing Methods 0.000 description 8
- 238000004458 analytical method Methods 0.000 description 4
- 238000010200 validation analysis Methods 0.000 description 4
- 238000011156 evaluation Methods 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 101150069942 ATR2 gene Proteins 0.000 description 2
- 101100459266 Arabidopsis thaliana MYC3 gene Proteins 0.000 description 2
- 101000981773 Arabidopsis thaliana Transcription factor MYB34 Proteins 0.000 description 2
- 102100027936 Attractin Human genes 0.000 description 2
- 101000697936 Homo sapiens Attractin Proteins 0.000 description 2
- 101000651887 Homo sapiens Neutral and basic amino acid transport protein rBAT Proteins 0.000 description 2
- 101100194350 Mus musculus Rere gene Proteins 0.000 description 2
- 102100027341 Neutral and basic amino acid transport protein rBAT Human genes 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000000034 method Methods 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000001149 cognitive effect Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 238000003909 pattern recognition Methods 0.000 description 1
- 238000000275 quality assurance Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000010561 standard procedure Methods 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
- 230000002747 voluntary effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/98—Detection or correction of errors, e.g. by rescanning the pattern or by human intervention; Evaluation of the quality of the acquired patterns
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/40—Software arrangements specially adapted for pattern recognition, e.g. user interfaces or toolboxes therefor
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/413—Classification of content, e.g. text, photographs or tables
Abstract
Ein System (1) zur optischen Zeichenerkennung (OCR) aus einem Text enthaltenden Bild, soll Transkriptionsfehler minimieren und die Qualität des resultierenden maschinencodierten Textes verbessern. Dazu umfasst es:
- ein Textbereich-Dispatcher-Modul (6), das mit zumindest einer OCR-Engine (aTR1, aTR2,...aTRn) verbunden ist und so konfiguriert ist, dass es das Bild als Eingangsdaten zu der OCR-Engine (aTR1, aTR2,...aTRn) zuweist und maschinencodierte Texte als Ausgangsdaten von der OCR-Engine (aTR1, aTR2,...aTRn) empfängt, und
- ein Textinformations-Verwaltungssystem-Modul (14), das so konfiguriert ist, dass es das Bild und den maschinencodierten Text in Paare von entsprechenden Bildsegmenten und Textsegmenten segmentiert, die Paare einer Vielzahl von Benutzern (mTR) zur Überprüfung zuweist und korrigierte Textsegmente von den Benutzern (mTR) empfängt.
A system (1) for optical character recognition (OCR) from an image containing text is intended to minimize transcription errors and to improve the quality of the resulting machine-coded text. It includes:
- A text area dispatcher module (6) which is connected to at least one OCR engine (aTR1, aTR2, ... aTRn) and is configured such that it uses the image as input data to the OCR engine (aTR1, aTR2 , ... aTRn) and receives machine-coded texts as output data from the OCR engine (aTR1, aTR2, ... aTRn), and
- a text information management system module (14) configured to segment the image and machine-coded text into pairs of corresponding image segments and text segments, assign the pairs to a plurality of users (mTR) for review, and corrected text segments from those Users (mTR) receives.
Description
Die Erfindung betrifft ein System zur optischen Zeichenerkennung (OCR) aus einem Bild, das Text enthält.The invention relates to a system for optical character recognition (OCR) from an image that contains text.
Optische Zeichenerkennung (auch Optical Character Reader, OCR) ist die mechanische oder elektronische Umwandlung von Bildern von getipptem, handgeschriebenem oder gedrucktem Text in maschinenkodierten Text, sei es von einem gescannten Dokument, einem Foto eines Dokuments, einem Szenenfoto (z.B. der Text auf Schildern und Plakaten in einem Landschaftsfoto) oder von einem Untertiteltext, der einem Bild überlagert ist (z.B. aus einer Fernsehsendung).Optical character recognition (also Optical Character Reader, OCR) is the mechanical or electronic conversion of images from typed, handwritten or printed text into machine-coded text, be it from a scanned document, a photo of a document, a scene photo (e.g. the text on signs and Posters in a landscape photo) or from a subtitle text that is superimposed on a picture (e.g. from a television program).
OCR ist eine gängige Methode, gedruckte Texte zu digitalisieren, so dass sie elektronisch bearbeitet, durchsucht, kompakter gespeichert, online angezeigt und in maschinellen Prozessen wie kognitiven Berechnungen, maschineller Übersetzung, (extrahiertem) Text-to-Speech, Schlüsseldaten und Text-Mining verwendet werden können. OCR ist ein Forschungsgebiet in den Bereichen Mustererkennung, künstliche Intelligenz und Computer Vision.OCR is a common way to digitize printed text so that it is electronically edited, searched, stored more compactly, displayed online and used in machine processes such as cognitive calculations, machine translation, (extracted) text-to-speech, key data and text mining can be. OCR is a research area in the fields of pattern recognition, artificial intelligence and computer vision.
Aktuelle OCR-Systeme sind in der Lage, eine hohe Erkennungsgenauigkeit für die meisten Schriften zu erzielen und unterstützen eine Vielzahl von digitalen Bilddateiformaten. Einige Systeme sind in der Lage, formatierte Ausgaben zu reproduzieren, die der Originalseite mit Bildern, Spalten und anderen nicht-textuellen Komponenten sehr nahe kommen.Current OCR systems are able to achieve high recognition accuracy for most fonts and support a large number of digital image file formats. Some systems are able to reproduce formatted output that comes very close to the original page with images, columns and other non-textual components.
Obwohl die Technologie in den letzten Jahren sehr weit fortgeschritten ist, sind Transkriptionsfehler dennoch unvermeidlich. Dies gilt insbesondere bei exotischen Schriften oder schlechter Scanqualität. Handschrift kann nur mit Einschränkungen mit hohem Lernaufwand und hoher Fehlerquote per OCR verarbeitet werden. Transkriptionsfehler werden manchmal einfach akzeptiert, da die manuelle Korrektur eine langwierige, zeitraubende und teure Aufgabe ist.Although the technology has advanced a lot in recent years, transcription errors are still inevitable. This applies in particular to exotic fonts or poor scan quality. Handwriting can only be processed via OCR with restrictions with a high learning effort and a high error rate. Transcription errors are sometimes simply accepted because manual correction is a lengthy, time-consuming and expensive task.
Aufgabe der vorliegenden Erfindung ist es daher, ein System zur optischen Zeichenerkennung aus einem Bild mit Text bereitzustellen, das Transkriptionsfehler minimiert und die Qualität des resultierenden maschinencodierten Textes verbessert.The object of the present invention is therefore to provide a system for optical character recognition from an image with text, which minimizes transcription errors and improves the quality of the resulting machine-coded text.
Diese Aufgabe wird erfindungsgemäß gelöst, indem das System umfasst:
- - ein Textbereich-Dispatcher-Modul, das mit zumindest einer OCR-Engine verbunden ist und so konfiguriert ist, dass es das Bild als Eingangsdaten zu der OCR-Engine zuweist und maschinencodierte Texte als Ausgangsdaten von der OCR-Engine empfängt, und
- - ein Textinformations-Verwaltungssystem-Modul, das so konfiguriert ist, dass es das Bild und den maschinencodierten Text in Paare von entsprechenden Bildsegmenten und Textsegmenten segmentiert, die Paare einer Vielzahl von Benutzern zur Überprüfung zuweist und korrigierte Textsegmente von den Benutzern empfängt.
- a text area dispatcher module which is connected to at least one OCR engine and is configured such that it assigns the image as input data to the OCR engine and receives machine-coded texts as output data from the OCR engine, and
- a text information management system module configured to segment the image and machine-coded text into pairs of corresponding image segments and text segments, assigning pairs to a plurality of users for review, and receiving corrected text segments from the users.
Die Erfindung geht dabei von der Überlegung aus, dass eine manuelle Nachbearbeitung automatisch erkannter OCR-Resultate erfolgen sollte. Hierbei ergibt sich aber das Problem, dass die manuelle Nachbearbeitung eines vollständigen Dokuments zwar qualitativ hochwertig, aber aufwändig und teuer ist. Ein Rückgriff auf freiwillige Nutzer ist zwar günstiger, die Qualität wird jedoch schlechter sein. Zudem ergeben sich Probleme urheberrechtlicher Natur sowie hinsichtlich der Vertraulichkeit. Zur Lösung der oben genannten Probleme wird eine Segmentierung der Bild- und Textsegmente durchgeführt, d.h. Bild und Text werden in jeweils zusammengehörige Teile unterteilt, wobei jedes Paar einen Ausschnitt des bildlichen Textes sowie die maschinenlesbare Transkription dieses Ausschnittes enthält. Diese segmentierten Paare werden dann auf eine Vielzahl von Benutzern zur manuellen Nachüberprüfung verteilt und von diesen korrigiert.The invention is based on the consideration that manual processing of automatically recognized OCR results should take place. However, the problem arises here that the manual post-processing of a complete document is of high quality, but is complex and expensive. Using voluntary users is cheaper, but the quality will be worse. There are also problems of copyright and confidentiality. To solve the problems mentioned above, segmentation of the image and text segments is carried out, i.e. Image and text are divided into parts that belong together, with each pair containing a section of the pictorial text and the machine-readable transcription of this section. These segmented pairs are then distributed to and corrected by a large number of users for manual review.
In vorteilhafter Ausgestaltung erfolgt das Segmentieren dabei auf Satzebene. Eine derartige Segmentierung ist zum Einen technisch gut zu bewerkstelligen, zum Anderen erleichtert sie die Überprüfung für die verteilten Benutzer.In an advantageous embodiment, the segmentation takes place at the sentence level. Such a segmentation is technically easy to do, on the one hand, and on the other hand it makes it easier for the distributed users to check it.
In weiterer vorteilhafter Ausgestaltung umfasst das System ferner ein Wörterbuch-Modul, wobei das Textinformations-Verwaltungssystem-Modul weiter konfiguriert ist, um die korrigierten Textsegmente in dem Wörterbuch-Modul zu überprüfen. Hierdurch wird eine doppelte Überprüfung der Texterkennung erreicht: Die automatisch von der OCR-Engine erkannten Segmente werden manuell durch die Benutzer überprüft, und die Korrekturen der Benutzer werden anhand eines umfassenden Wörterbuchs erneut überprüft, d.h. es wird abgeglichen, ob die von den Benutzern ermittelten Wörter im Wörterbuch existieren. Ist dies nicht der Fall, kann ggf. eine weitere Überprüfung, z.B. durch einen weiteren, anderen Benutzer angestoßen werden.In a further advantageous embodiment, the system further comprises a dictionary module, the text information management system module being further configured to check the corrected text segments in the dictionary module. This achieves a double check of the text recognition: the segments automatically recognized by the OCR engine are checked manually by the users, and the corrections of the users are checked again using a comprehensive dictionary, i.e. it is compared whether the words determined by the users exist in the dictionary. If this is not the case, a further check, e.g. be triggered by another, different user.
In einer ersten Ausführungsform umfasst das System ein Schnittstellen-Modul, welches eine Mensch-Maschine-Schnittstelle bereitstellt, auf welchem die Benutzer ihnen zugewiesene Paare anzeigen und Korrekturen eingeben können. Ein solches Schnittstellen-Modul kann beispielsweise auf einem Desktop-Computer installiert sein, empfängt die Bild- und Textsegmente und stellt sie dem Benutzer auf der lokal erzeugten Mensch-Maschine-Schnittstelle zur Verfügung. Besonders vorteilhaft ist das Schnittstellen-Modul dabei aber ein Webserver-Modul und die Mensch-Maschine-Schnittstelle eine Web-Schnittstelle. Das System ist also für einen Online-Zugang ausgestaltet, so dass Benutzer sich z.B. mit Namen und Passwort auf der Web-Schnittstelle anmelden können und dort online die Bild- und Textsegmente anzeigen können. Für die Korrektur sind entsprechende Eingabefelder vorgesehen.In a first embodiment, the system comprises an interface module which provides a human-machine interface on which the users can display pairs assigned to them and enter corrections. Such an interface module can be installed on a desktop computer, for example, receives the image and text segments and makes them available to the user on the locally generated human-machine interface. It is particularly advantageous the interface module is a web server module and the human-machine interface is a web interface. The system is therefore designed for online access, so that users can log on to the web interface with their name and password, for example, and can display the image and text segments there online. Corresponding input fields are provided for the correction.
In einer zweiten, alternativen oder zusätzlichen Ausführungsform umfasst das System ein Schnittstellen-Modul, welches so konfiguriert ist, dass es eine Mehrzahl von jeweils einem Benutzer zugewiesenen Paaren an ein mobiles Endgerät des Benutzers überträgt, und auf dem mobilen Endgerät erzeugte korrigierte Textsegmente empfängt. In dieser Ausführungsform kann die Korrektur offline erfolgen, d.h. auf dem Endgerät des Benutzers, d.h. einen Smartphone, Tablet, Laptop o.Ä. ist eine geeignete App installiert, die eine Mehrzahl von Textsegmenten vom Schnittstellen-Modul empfängt und speichert. Der Benutzer kann die oben zur Mensch-Maschine-Schnittstelle beschriebenen Funktionen dann offline in der App ausführen, wobei die App die Mensch-Maschine-Schnittstelle erzeugt und das Schnittstellen-Modul in diesem Fall die Kommunikation mit der App übernimmt. Auch in diesem Fall erfolgt die Kommunikation vorteilhaft über das Internet, so dass das Schnittstellen-Modul hier auch vorteilhafterweise als Webserver-Modul ausgestaltet ist. Die Korrekturen werden in der App gespeichert und zu einem späteren Zeitpunkt gesammelt an das Schnittstellen-Modul übertragen. Hierdurch kann die Arbeit der Benutzer auch erfolgen, wenn keine durchgehende Online-Konnektivität besteht.In a second, alternative or additional embodiment, the system comprises an interface module, which is configured in such a way that it transmits a plurality of pairs, each assigned to a user, to a mobile terminal of the user and receives corrected text segments generated on the mobile terminal. In this embodiment, the correction can be done offline, i.e. on the user's terminal, i.e. a smartphone, tablet, laptop or similar a suitable app is installed that receives and stores a plurality of text segments from the interface module. The user can then carry out the functions described above for the human-machine interface offline in the app, the app generating the human-machine interface and in this case the interface module taking over the communication with the app. In this case, too, the communication advantageously takes place via the Internet, so that the interface module here is also advantageously designed as a web server module. The corrections are saved in the app and later transferred to the interface module. This allows users to work even when there is no continuous online connectivity.
Die eingangs genannte Aufgabe wird dementsprechend weiterhin gelöst durch ein Computerprogrammprodukt, d.h. beispielsweise eine App für ein Smartphone, Tablet oder Laptop, das in den Speicher mindestens eines mobilen Endgeräts ladbar ist und Software-Codeabschnitte enthält, die das mobile Endgerät veranlassen, eine Mehrzahl von dem Benutzer des Endgeräts zugewiesenen Paaren von Bildsegmenten und Textsegmenten von einem Schnittstellen-Modul zu empfangen und auf einem Anzeigeelement des Endgeräts darzustellen, Korrekturen des Textsegments durch eine Benutzerschnittstelle des Endgeräts zu empfangen und korrigierte Textsegmente an das Schnittstellen-Modul zu senden.Accordingly, the above-mentioned object is still achieved by a computer program product, i.e. For example, an app for a smartphone, tablet or laptop that can be loaded into the memory of at least one mobile terminal and contains software code sections that cause the mobile terminal to display a plurality of pairs of image segments and text segments assigned to the user of the terminal by an interface. Receive module and display on a display element of the terminal, receive corrections to the text segment through a user interface of the terminal and send corrected text segments to the interface module.
In weiterer vorteilhafter Ausgestaltung umfasst das System nach einem der vorhergehenden Ansprüche, weiter
- - ein Textbereich-Vorverarbeitungsmodul, das konfiguriert ist, um dem Bild eine Anzahl von Attributen zuzuweisen,
- - ein Benutzerverwaltungsmodul, in dem Profile einer Mehrzahl von Benutzern gespeichert sind,
- a text area preprocessing module configured to assign a number of attributes to the image,
- a user management module in which profiles of a plurality of users are stored,
Die Profile enthalten dabei vorteilhafterweise eine oder mehrere Informationen aus der folgenden Gruppe: Sprachniveau, Fähigkeit, spezielle Schriftarten zu lesen, bevorzugte Arbeitszeit und Qualitätsbewertung. Hierdurch lassen sich Benutzer ermitteln, die die entsprechende Sprache des Textes beherrschen (dies auch in einem geeigneten Niveau), die die Schriftart des Textes gut lesen können, deren Arbeitszeiten so sind, dass eine baldige Überprüfung gewährleistet ist, etc. Zudem können Benutzer, die eine bessere Qualität von Transkriptionen abliefern, bei der Zuweisung bevorzugt werden.The profiles advantageously contain one or more information from the following group: language level, ability to read special fonts, preferred working hours and quality rating. In this way, users can be identified who speak the appropriate language of the text (even at a suitable level), who can read the font of the text well, whose working hours are such that a quick check is guaranteed, etc. In addition, users who deliver a better quality of transcriptions, with preference given to assignment.
In weiterer vorteilhafter Ausgestaltung des Systems ist das Textinformations-Verwaltungssystem-Modul weiterhin so konfiguriert, dass es ein Paar einer Mehrzahl von Benutzern zuweist, und auf Basis eines Abgleichs der Mehrzahl von korrigierten Textsegmenten der Mehrzahl von Benutzern eine Qualitätsbewertung im Profil verändert. Durch die Zuweisung eines Paars an mehrere Benutzer kann zum Einen beispielsweise die Konfidenz bezüglich der Transkription weiter erhöht werden. Wenn mehrere Benutzer bestätigen, dass eine Transkription korrekt ist, steigt nämlich entsprechend die Wahrscheinlichkeit, dass dies tatsächlich auch so ist. Darüber hinaus kann durch eine mehrfache Verteilung die Qualität von Benutzern überprüft werden: Haben Benutzer die so ermittelte richtige Transkription bestätigt oder eine falsche Transkription richtig korrigiert, so kann deren Qualitätsniveau im Profil erhöht werden. Umgekehrt kann das Qualitätsniveau eines Benutzers gesenkt werden, wenn dieser eine falsche Transkription nicht erkannt hat.In a further advantageous embodiment of the system, the text information management system module is further configured such that it assigns a pair to a plurality of users and changes a quality rating in the profile on the basis of a comparison of the plurality of corrected text segments of the plurality of users. By assigning a pair to several users, on the one hand, for example, the confidence regarding the transcription can be further increased. If several users confirm that a transcription is correct, the probability increases that this is actually the case. In addition, the quality of users can be checked by multiple distribution: If users have confirmed the correct transcription determined in this way or corrected an incorrect transcription correctly, their quality level in the profile can be increased. Conversely, the quality level of a user can be reduced if the user has not recognized an incorrect transcription.
Ein Computerprogrammprodukt ist vorteilhafterweise in den Speicher mindestens eines Computers ladbar und enthält Software-Codeabschnitte, die den Computer veranlassen, die Funktion eines oben beschriebenen Systemsauszuführen.A computer program product is advantageously loadable into the memory of at least one computer and contains pieces of software code that cause the computer to perform the function of a system described above.
Die Vorteile der Erfindung liegen insbesondere darin, dass durch die Verteilung einer automatisierten Aufgabe, nämlich der OCR-Transkription auf mehrere Systeme und/oder Personen, Fehler einzelner Systeme eliminiert und ein Konfidenzniveau der resultierenden Stimme abgezogen werden kann. Die Qualität der Transkription wird erhöht. The advantages of the invention are, in particular, that by distributing an automated task, namely the OCR transcription over several systems and / or persons, errors of individual systems can be eliminated and a confidence level of the resulting voice can be deducted. The quality of the transcription is increased.
Ausführungsformen der Erfindung werden in Bezug auf Zeichnungen näher beschrieben, in denen die einzigeEmbodiments of the invention are described in more detail with reference to drawings, in which the only one
FIG eine schematische Darstellung eines beispielhaften Systems zur optischen Zeichenerkennung zeigt.FIG shows a schematic representation of an exemplary system for optical character recognition.
Das in der FIG dargestellte Diagramm zeigt ein System zur optischen Zeichenerkennung
Beim System
In einem ersten Schritt der Texterkennung wird eine Voranalyse in einem Textbereich-Analysator-Modul
In alternativen Ausführungen ist das TAA-Modul
In der in der FIG gezeigten Ausführungsform wird ein nachfolgendes Textbereich-Vorverarbeitungsmodul
Ein nachfolgendes Textbereich-Dispatcher-Modul
Die aTR-Engines sind verschiedene OCR-Engines in Industriequalität. Auf dem Markt gibt es mehrere Systeme, die eine breite Palette von Schriften, Sprachen und Layouts abdecken (z.B. Tesseract, ABBYY Fine Reader). Andere Systeme wurden für sehr spezifischen Input (Eingangsdaten) entwickelt, z.B. Chinesisch, Arabisch, Mittelalterliches Latein, etc. Typischerweise sind die OCR-Engines selbst komplexe Systeme mit ihren eigenen Stärken und Schwächen. Daher führt die Verarbeitung desselben Inputs durch verschiedene Systeme in der Regel nicht zu einem identischen Output (Ausgangsdaten).The aTR engines are various industrial quality OCR engines. There are several systems on the market that cover a wide range of fonts, languages and layouts (e.g. Tesseract, ABBYY Fine Reader). Other systems have been developed for very specific input (input data), e.g. Chinese, Arabic, Medieval Latin, etc. Typically, the OCR engines themselves are complex systems with their own strengths and weaknesses. Therefore, processing the same input by different systems does not usually lead to an identical output (output data).
Nachdem die Texterkennung in einer oder mehreren OCR-Engines aus der Sammlung
In einem Bewertungsschritt des OVE-Moduls
Das OVE-Modul
In einer alternativen Ausführungsform verwendet das OVE-Modul
In einer weiteren alternativen Ausgestaltung des Systems
In einer weiteren Variante von OVE-Modul
Das OVE-Modul
Transkriptionen, die für die manuelle Nachbearbeitung markiert sind, werden einem Textinformations-Verwaltungssystem-Modul
Das TIMS-Modul
In vorteilhafter Ausführung arbeiten die mTRs mobil, z.B. von zu Hause aus, auf Reisen oder zur Nutzung kurzer Wartezeiten. Ein Stapel von Sätzen wird pro mTR bereitgestellt und lokal in einer mobilen Anwendung gespeichert, während die Konnektivität verfügbar ist. Ein mTR kann an der Transkription des gesamten Stapels in einer Offline-Umgebung arbeiten. Die Ergebnisse werden an das TIMS-Modul
Das TIMS-Modul
In einer alternativen Ausführungsform werden Aufgaben zunächst mehreren mTRs zugeordnet, um eine bessere Bewertung durch Vergleich der Ergebnisse mehrerer mTR-Korrekturen zu ermöglichen.In an alternative embodiment, tasks are initially assigned to several mTRs in order to enable a better evaluation by comparing the results of several mTR corrections.
Ist ein zufriedenstellendes Konfidenzniveau für eine Aufgabe erreicht, gibt das TIMS-Modul
Das UM-Modul
BezugszeichenlisteLIST OF REFERENCE NUMBERS
- 11
- System zur optischen ZeichenerkennungOptical character recognition system
- 22
- Textbereich-Analysator-ModulText Area Analyzer Module
- 44
- Textbereich-VorverarbeitungsmodulText Area preprocessing
- 66
- Textbereich-Dispatcher-ModulText Area dispatcher module
- 88th
- Sammlung optischer Zeichenerkennungs-EnginesCollection of optical character recognition engines
- 1010
- OCR-Validierungs-Engine-ModulOCR validation engine module
- 1212
- Wörterbuch-ModulDictionary module
- 1414
- Textinformations-Verwaltungssystem-ModulText information management system module
- 1616
- Gruppe manueller ÜbersetzerGroup of manual translators
- 1818
- BenutzerverwaltungsmodulUser management module
- 2020
- Web-SchnittstelleWeb interface
- 2222
- Webserver-ModulWeb server module
Claims (10)
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE102018119908.2A DE102018119908A1 (en) | 2018-08-16 | 2018-08-16 | Optical Character Recognition (OCR) system |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE102018119908.2A DE102018119908A1 (en) | 2018-08-16 | 2018-08-16 | Optical Character Recognition (OCR) system |
Publications (1)
Publication Number | Publication Date |
---|---|
DE102018119908A1 true DE102018119908A1 (en) | 2020-02-20 |
Family
ID=69320282
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE102018119908.2A Withdrawn DE102018119908A1 (en) | 2018-08-16 | 2018-08-16 | Optical Character Recognition (OCR) system |
Country Status (1)
Country | Link |
---|---|
DE (1) | DE102018119908A1 (en) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20110280481A1 (en) * | 2010-05-17 | 2011-11-17 | Microsoft Corporation | User correction of errors arising in a textual document undergoing optical character recognition (ocr) process |
US8249399B2 (en) * | 2008-09-16 | 2012-08-21 | International Business Machines Corporation | Optical character recognition verification |
US8331739B1 (en) * | 2009-01-21 | 2012-12-11 | Google Inc. | Efficient identification and correction of optical character recognition errors through learning in a multi-engine environment |
-
2018
- 2018-08-16 DE DE102018119908.2A patent/DE102018119908A1/en not_active Withdrawn
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8249399B2 (en) * | 2008-09-16 | 2012-08-21 | International Business Machines Corporation | Optical character recognition verification |
US8331739B1 (en) * | 2009-01-21 | 2012-12-11 | Google Inc. | Efficient identification and correction of optical character recognition errors through learning in a multi-engine environment |
US20110280481A1 (en) * | 2010-05-17 | 2011-11-17 | Microsoft Corporation | User correction of errors arising in a textual document undergoing optical character recognition (ocr) process |
Non-Patent Citations (2)
Title |
---|
ALAM, Sultana Lubna, et al. Crowdsourcing motivations in a not-for-profit GLAM context: the Australian newspapers digitisation program. Australasian Conference on Information Systems, 2012 * |
Wikipedia, „Optical character recognition". Bearbeitungsstand: 13. August 2018. URL: https://en.wikipedia.org/w/index.php?title=Optical_character_recognition&oldid=854723713 [abgerufen am 28.05.2019] * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DE60217299T2 (en) | HOLISTIC-ANALYTICAL DETECTION OF HAND-WRITTEN TEXT | |
DE102017126380A1 (en) | Production of presentation slides with distilled content | |
DE112009002000B4 (en) | Adaptive method and device for converting messages between different data formats | |
DE10342594B4 (en) | Method and system for collecting data from a plurality of machine readable documents | |
DE10321944A1 (en) | Devices and methods for processing text-based electronic documents | |
DE60204005T2 (en) | METHOD AND DEVICE FOR RECOGNIZING A HANDWRITTEN PATTERN | |
DE102005032734B4 (en) | Index extraction of documents | |
DE102011079443A1 (en) | Learning weights of typed font fonts in handwriting keyword retrieval | |
DE102021209201A1 (en) | Scene text recognition method and system based on sequential deformation | |
DE102005032744A1 (en) | Index extraction of documents | |
DE10317234A1 (en) | Systems and methods for improved accuracy from extracted digital content | |
DE102011005579A1 (en) | Image processing apparatus, image processing method and storage medium | |
DE102019004300A1 (en) | USE OF A DYNAMIC STORAGE NETWORK TO TRACK DIGITAL DIALOG STATES AND GENERATE ANSWERS | |
DE112015005985T5 (en) | CLASSIFICATION AND STORAGE OF DOCUMENTS | |
DE102007052622A1 (en) | Method for image analysis, in particular for a mobile radio device | |
DE60005293T2 (en) | Method and device for processing electronic documents | |
DE112016002275T5 (en) | COORDINATED USER WORD SELECTION FOR TRANSLATING AND RECEIVING CONTEXT INFORMATION FOR THE SELECTED WORD | |
DE112021000371T5 (en) | DIGITAL IMAGE EDITING | |
WO2005119580A1 (en) | Method and device for the structural analysis of a document | |
DE202022002902U1 (en) | Iterative training for a text-image layout transformer | |
EP3410324B1 (en) | Determining an anonymous dose report image | |
DE102012025350A1 (en) | Processing an electronic document | |
DE102018119908A1 (en) | Optical Character Recognition (OCR) system | |
DE102005032733A1 (en) | Index extraction of documents | |
DE102021108675A1 (en) | WEAKLY MONITORED DETECTION OF A SEMANTIC UNIT USING COMMON KNOWLEDGE AND TARGET DOMAIN KNOWLEDGE |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
R079 | Amendment of ipc main class |
Free format text: PREVIOUS MAIN CLASS: G06Q0010100000 Ipc: G06K0009030000 |
|
R163 | Identified publications notified | ||
R119 | Application deemed withdrawn, or ip right lapsed, due to non-payment of renewal fee |