DE60224128T2 - Apparatus and method for recognizing characters and mathematical expressions - Google Patents
Apparatus and method for recognizing characters and mathematical expressions Download PDFInfo
- Publication number
- DE60224128T2 DE60224128T2 DE60224128T DE60224128T DE60224128T2 DE 60224128 T2 DE60224128 T2 DE 60224128T2 DE 60224128 T DE60224128 T DE 60224128T DE 60224128 T DE60224128 T DE 60224128T DE 60224128 T2 DE60224128 T2 DE 60224128T2
- Authority
- DE
- Germany
- Prior art keywords
- character
- characters
- relationship
- mathematical expression
- text
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/24—Character recognition characterised by the processing or recognition method
- G06V30/242—Division of the character sequences into groups prior to recognition; Selection of dictionaries
- G06V30/244—Division of the character sequences into groups prior to recognition; Selection of dictionaries using graphical properties, e.g. alphabet type or font
- G06V30/2455—Discrimination between machine-print, hand-print and cursive writing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/26—Techniques for post-processing, e.g. correcting the recognition result
- G06V30/262—Techniques for post-processing, e.g. correcting the recognition result using context analysis, e.g. lexical, syntactic or semantic context
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Computational Linguistics (AREA)
- Character Discrimination (AREA)
Description
Diese Erfindung betrifft eine Erkennungsvorrichtung mathematischer Ausdrücke und ein Erkennungsverfahren mathematischer Ausdrücke sowie eine Zeichenerkennungsvorrichtung und ein Zeichenerkennungsverfahren, die verwendet werden können zum Erkennen eines mathematische Ausdrücke enthaltenden Dokumentenabbilds.These The invention relates to a recognition device of mathematical expressions and a mathematical expression recognition method and a character recognition device and a character recognition method that can be used for Recognizing a document image containing mathematical expressions.
Berichte über Zeichenerkennung für mathematische Ausdrücke enthaltende bedruckte Elemente, oder mathematische Ausdrücke und die Erkennung der Strukturen von mathematischen Ausdrücken sind eine Zeitlang erzeugt worden, obwohl die Zahl solcher Berichte nicht sehr groß ist. Die zu erkennenden Zeichen sind nicht notwendigerweise eindimensional angeordnet. Vielmehr sind Anordnungen von zu erkennenden Zeichen öfter als nicht zweidimensional wie mit Indizes, Exponenten, Bruchzahlen und so weiter in der gewöhnlichen Praxis zweidimensional angeordnet. Daher muss eine Einrichtung zum Erkennen (Bestimmen) nicht nur der in mathematischen Eindrücken enthaltenen Zeichen oder sich auf diese beziehenden Zeichen bereitstellen, sondern auch die Strukturen (Positionsinformation) mathematischer Ausdrücke, um zu wissen, ob jedes der Zeichen als ein Index, ein Exponent, ein Nenner, ein Zähler oder irgendetwas Anderes angeordnet ist. Demnach ist zum Erkennen eines mathematischen Ausdrucks mit Hilfe eines Computers die Zeit, die für die Verarbeitungsoperation erforderlich ist, viel länger als die Zeit, die zum Verarbeiten gewöhnlicher Zeichen benötigt wird.Reports about character recognition for mathematical expressions containing printed elements, or mathematical expressions and the recognition of the structures of mathematical expressions are has been generated for a while, although the number of such reports is not is very big. The signs to be recognized are not necessarily one-dimensional arranged. Rather, arrangements of signs to be recognized are more frequent than not two-dimensional as with indices, exponents, fractions and so on in the ordinary Practice arranged two-dimensionally. Therefore, a facility for Recognizing (determining) not only those contained in mathematical impressions Provide characters or signs based on these, but also the structures (position information) of mathematical expressions, um to know if each of the characters as an index, an exponent, an Denominator, a counter or anything else is arranged. Accordingly, to recognize a mathematical expression with the help of a computer the time the for the Processing operation is required much longer than the time required for Processing ordinary signs needed becomes.
Berichte über Ergebnisse, die es ermöglicht haben, die Struktur einer mathematischen Darstellung innerhalb einer praktikablen Verarbeitungszeit zu erkennen, schließt die nachstehend aufgelisteten Dokumente [1], [2] und [3] ein. Gemäß den Dokumenten wird eine Regel zum Bestimmen des Positionszusammenhangs der Zeichen ein einem mathematischen Ausdruck, der hochgestellte und tiefgestellte Zeichen einschließt, definiert und jedes Zeichen wird als ein gewöhnliches Zeichen, ein Index, ein Exponent, ein Nenner, ein Zähler oder irgendetwas Anderes beurteilt in Übereinstimmung mit seiner Position durch Bezugnahme auf die Regel, um die Struktur des mathematischen Ausdrucks zu erkennen.
- Dokument [1]: Masayuki Okamoto, Hashim Msafire Twaayondo, "Structure Recognition of Mathematical Expressions Using Peripheral Distribution Features" (Strukturerkennung mathematischer Ausdrücke unter Verwendung peripherer Verteilungsmerkmale), Transaction for the Institute of Electronics, Information and Communication, D-II, Band J78-D-II, Nr. 2, Seiten 366–370 (1995).
- Dokument [2]: Masayuki Okamoto, Hiroyuki Azuma, "Recognition of Mathematical Expressions with Emphasis an the Layout of Signs" (Erkennung mathematischer Ausdrücke mit der Betonung auf das Layout von Symbol"), Transaction for the Institute of Electronics, Information and Communication, D-II, Band J78-D-II, Nr. 3, Seiten 434–482 (1995).
- Dokument [3]: R. J. Fateman, T. Tokuyasu, B. P. Berman and N. Mitchell, "Optical Character Recognition and Parsing of Typeset Methematics" ("Optische Zeichenerkennung und Syntax-Analyse von Typensatz-Mathematik"), Journal of Visual Communication and Image Representation, Bd. 7, Nr. 1, Seiten 2–15 (1995).
- Document [1]: Masayuki Okamoto, Hashim Msafire Twaayondo, "Structure Recognition of Mathematical Expressions Using Peripheral Distribution Features", Transaction for the Institute of Electronics, Information and Communication, D-II, Volume J78 -D-II, No. 2, pp. 366-370 (1995).
- Document [2]: Masayuki Okamoto, Hiroyuki Azuma, "Recognition of Mathematical Expressions with Emphasis on the Layout of Signs", Transaction for the Institute of Electronics, Information and Communication, D-II, Vol. J78-D-II, No. 3, pp. 434-482 (1995).
- Document [3]: RJ Fateman, T. Tokuyasu, BP Berman and N. Mitchell, "Optical Character Recognition and Parsing of Typeset Methematics", Journal of Visual Communication and Image Representation, Vol. 7, No. 1, pages 2-15 (1995).
Jedoch wird beim Stand der Technik einschließlich der bekannten Techniken der oben aufgelisteten Dokumente jedes Zeichen als ein gewöhnliches Zeichen, ein Index, ein Exponent, ein Nenner, ein Zähler oder irgendetwas Anderes basierend auf der Ortseigenschaft beurteilt. Wenn die Position eines Zeichens falsch beurteilt wird, beeinträchtigt es demnach alle nachfolgenden Beurteilungen in signifikantem Umfang in negativer Weise. Wenn beispielsweise ein gewöhnliches Zeichen als ein Index fehlinterpretiert wird, werden alle ihm nachfolgenden Zeichen, die auf demselben Level angeordnet sind wie dem des fehlinterpretierten Zeichens als so viele Indizes fehlinterpretiert. Kurz gesagt, eine lokale Fehlerkennung eines mathematischen Ausdrucks kann die Erkennung seiner Gesamtstruktur stark verunstalten.however is in the prior art including the known techniques of the above listed documents every character as a common one Characters, an index, an exponent, a denominator, a counter or judged anything else based on the location characteristic. Accordingly, if the position of a character is misjudged, it interferes all subsequent assessments to a significant extent in negative Wise. For example, if a common character is an index is misinterpreted, all characters following it, the arranged on the same level as that of the misinterpreted one Signed as so many indices misinterpreted. In short, one Local misrecognition of a mathematical expression may be the detection severely deface its overall structure.
Zudem beziehen sich die bekannten Techniken der oben aufgelisteten Dokumente nur auf Zeichenerkennung innerhalb eines mathematischen Ausdrucks und zeigen keinerlei Technik zum Erfassen eines mathematischen Ausdrucks in einem Text.moreover refer to the known techniques of the above-listed documents only on character recognition within a mathematical expression and do not show any technique for detecting a mathematical expression in a text.
Ein Artikel "Incorporating Syntactic Constraints in Recognising Handwritten Sentences" ("Einarbeiten syntaktischer Einschränkungen in die Erkennung von handgeschriebenen Sätzen") von Srihari et al., Center for Document Analysis and Recognition, State University of New York, offenbart ein Verfahren der linguistischen Analyse, das das Versehen von Kandidatenerkennungsergebnissen mit Wahrscheinlichkeiten teilt und die gegebene Priorität dem wahrscheinlichsten Kandidaten verleiht. Ein Verzeichnis, das Wahrscheinlichkeiten zum Kombinieren von Zeichen und Wörtern enthält, wird verwendet.One Article "Incorporating Syntactic Constraints in Recognition Handwritten Sentences "(" Incorporating Syntactic restrictions in the Recognition of Handwritten Sentences ") by Srihari et al., Center for Document Analysis and Recognition, State University of New York a method of linguistic analysis that provides candidate recognition results with probabilities and the given priority most likely Awards candidates. A directory that has chances to Combine characters and words contains is used.
Ein anderer Artikel "Computing Graphs and Graph Transformations" ("Berechnen von Graphen und Graphentransformationen") von Blostein et al., Software Practice & Experience, Bd. 29, Nr. 3, John Wiley & Sons, Seiten 197–217, März 1999, offenbart Graphen-Modifikationen, die eine Graphenreduzierung, ein Graphenneuschreiben und eine Graphentransformation einbezieht. Das Verfahren wird zum Analysieren optischer Zeichenerkennungsbenutzung in einem mathematischen Erkenner verwendet. Ein Prozess erstellt Anmerkungen, die für praktische räumliche Zusammenhänge analysiert werden. Zusammenhänge werden in einem Graphen präsentiert.Another article, "Computing Graphs and Graph Transformations," by Blostein et al., Software Practice & Experience, Vol. 29, No. 3, John Wiley & Sons, pp. 197-217, March 1999 discloses graphene modifications involving graph reduction, graph rewriting, and graph transformation. The method is used to analyze optical character recognition usage in a mathematical recognizer. One Process creates annotations that are analyzed for practical spatial relationships. Connections are presented in a graph.
Wenn daher die Position eines Zeichens fehlbeurteilt wird, beeinträchtigt dies negativ alle nachfolgenden Beurteilungen in signifikantem Umfang. Wenn beispielsweise ein gewöhnliches Zeichen als ein Index fehlbeurteilt wird, werden alle gewöhnlichen Zeichen, die nach ihm auf demselben Level angeordnet sind mit dem des fehlbeurteilten Zeichens, als so viele Indizes fehlbeurteilt. Kurz gesagt, eine lokale Fehlerkennung des mathematischen Ausdrucks kann stark die Erkennung seiner Gesamtstruktur schädigen.If Therefore, the position of a character is misjudged, this affects negative all subsequent assessments to a significant extent. For example, if a common Characters are misjudged as an index, all become ordinary Characters that are placed after him on the same level with the of the misjudged character, as so many indices misjudged. In short, a local misrecognition of mathematical expression can severely damage the recognition of its overall structure.
Zudem beziehen sich die bekannten Techniken der oben aufgelisteten Dokumente nur auf Zeichenerkennung innerhalb eines mathematischen Ausdrucks und zeigen keinerlei Technik zum Erfassen eines mathematischen Ausdrucks in einem Text.moreover refer to the known techniques of the above-listed documents only on character recognition within a mathematical expression and do not show any technique for detecting a mathematical expression in a text.
Ein anderer Artikel "Structure Analysis and Recognition of Mathematical Expressions" ("Strukturanalyse und Erkennung mathematischer Ausdrücke") von Twaakyondo et al., Abteilung für Informations-Ingenieurwissenschaften, Shinshu Universität, Japan, offenbart die Erkennung von gedruckten mathematischen Ausdrücken unter Verwendung zweidimensionaler Strukturanalyse, die "Von unten nach oben"- und "Von oben nach unten"-Strategien verwendet. Vor dem Verarbeiten werden individuelle Symbole erkannt und eine Schätzung der normalen Größe eines Zentralsymbols wird vorgenommen. Daraufhin wird der Text einer Wurzelausdrucksanalyse unterzogen und die Überschrift einer Überschriftsausdrucksanalyse und Matrixausdrucksanalyse. Die Analyse des gewöhnlichen nicht mathematischen Textes wird nicht beachtet.One other article "Structure Analysis and Recognition of Mathematical Expressions "(" Structure Analysis and Detection of mathematical expressions ") by Twaakyondo et al., Department of Information Engineering, Shinshu University, Japan, discloses the recognition of printed mathematical expressions under Using two-dimensional structural analysis that uses "bottom-up" and "top-down" strategies. Before processing, individual symbols are recognized and one estimate the normal size of a Central symbol is made. The text is then subjected to a root expression analysis and the headline a heading expression analysis and matrix expression analysis. The analysis of the ordinary non-mathematical text will not be considered.
Die vorliegende Erfindung richtet sich auf eine Vorrichtung gemäß Anspruch 1 und ein Verfahren gemäß Anspruch 6. Bevorzugte Ausführungsformen werden in den abhängigen Ansprüchen erläutert.The The present invention is directed to an apparatus according to claim 1 and a method according to claim 6. Preferred embodiments become dependent claims explained.
Die Erfindung kann vollständiger aus der folgenden detaillierten Beschreibung verstanden werden, wenn diese in Verbindung den beiliegenden Zeichnungen betrachtet wird, in denen zeigt:The Invention can be more complete be understood from the following detailed description, when considered in conjunction with the accompanying drawings becomes, in which shows:
Eine Ausführungsform einer Vorrichtung und eines Verfahrens zum Erkennen mathematischer Ausdrücke und eine Vorrichtung und ein Verfahren zum Erkennen von Zeichen in Übereinstimmung mit der vorliegenden Erfindung werden nun unter Bezugnahme auf die beiliegenden Zeichnungen beschrieben.A embodiment a device and a method for recognizing mathematical expressions and an apparatus and method for recognizing characters in accordance with Present invention will now be with reference to the accompanying Drawings described.
Das
OCR-System
Die Verarbeitungsoperation zum Erkennen eines Documents läuft in einer Abfolge ab von 1) Abtasten des Dokumentbildes, 2) Analysieren des Entwurfs, 3) Erkennen gewöhnlicher Zeichen, 4) Erfassen mathematischer Ausdrücke, 5) Erkennen mathematischer Ausdrücke und 6) Umwandeln der erhaltenen Daten in elektrische Ausgangsdaten. Nun wird die Verarbeitungsoperation speziell im Hinblick auf das Verfahren zum Ausführen des Schrittes 4) des Erfassens mathematischer Ausdrücke und des Schrittes 5) des Erkennens mathematischer Ausdrücke beschrieben.The Processing operation for recognizing a document runs in one Sequence from 1) scanning the document image, 2) analyzing the Design, 3) Recognition of ordinary Characters, 4) capture mathematical expressions, 5) recognize mathematical expressions and 6) converting the obtained data into electrical output data. Now, the processing operation becomes special with respect to Method of execution of step 4) of acquiring mathematical expressions and of step 5) of recognizing mathematical expressions.
Vor dem detaillierteren Beschreiben der Schritte des Erfassens mathematischer Ausdrücke und des Erkennens mathematischer Ausdrücke wird der Ablauf der Verarbeitungsoperation nachstehend zusammenfassend beschrieben.In front to describe in more detail the steps of detecting mathematical Expressions and the recognition of mathematical expressions becomes the flow of the processing operation summarized below.
Zuerst
wird ein Seitenbild des gedruckten Dokumentes erhalten, wenn der
Scanner
Das
Verzeichnis zum Beurteilen mathematischer Ausdrücke/Texte
Das
Verzeichnis zum Verbinden von Sprachteilen
Alle
zu Mathematik-Ausdrucksregionen (Regionen für mathematische Ausdrücke) gehörenden Zeichen
und Symbol werden zu dem Erkennungsabschnitt
Die Bedingungen globaler Evaluierung werden als Bedingungsmathematische Ausdrücke ausgedrückt zum angemessenen Bestimmen der Inter-Zeichenstruktur basierend auf der globalen Evaluierung aller in einem mathematischen Ausdruck enthaltenen Zeichen. Durch das verwenden der globalen Evaluierung ist es möglich, einen optimalen Pfad zu finden zum schlüssigen zueinander in Bezugsetzen der Zeichen in einen mathematischen Ausdruck ohne irgendeinen Widerspruch durch Bezugnahme zum Bestimmen lokaler Inter-Zeichenzusammenhänge.The Conditions of global evaluation are considered conditional expressions expressed to appropriately determine the inter-character structure based on the global evaluation of all contained in a mathematical expression Character. By using the global evaluation, it is possible to use a find the optimal path to conclusively relate to each other the sign into a mathematical expression without any contradiction by referring to determining local inter-character relationships.
Der
Ausgabeumwandlungsabschnitt
FormelbestimmungsverfahrenForm same mood procedures
Nun wird nachstehend ein spezifisches Verfahren zum Erfassen eines mathematischen Ausdrucks beschrieben.Now Hereinafter, a specific method for detecting a mathematical will be described Expression described.
In
dieser Ausführungsform
wird wie in
<Schritt A1: Evaluierung von mathematischem Ausdruck/Text><step A1: Evaluation of Mathematical Expression / Text>
In
Schritt A1 wird jedes Wort entweder als mathematischer Ausdruck
(Math) oder als Text (Text) basierend auf gewöhnlicher Zeichenerkennung evaluiert.
Ein Wort, wie es hier verwendet wird, bezieht sich auf eine Zeichenkette,
die von anderen Zeichen durch Leerzeichen getrennt ist und wird
als ein Ergebnis der Zeichenerkennung erfasst.
Es
wird Bezug genommen auf
Es
wird Bezug genommen auf
Zudem ist diese Ausführungsform eingerichtet zum flexiblen Unterbringen verschiedener Zeichenketten von Symbolen mit Hilfe normaler Ausdrücke in Hinblick auf die Tatsache, dass mathematische Ausdrücke als so viele unerwartete Ketten von Symbolen erkannt werden können. Normale Ausdrücke werden verwendet zum Ausdrücken der Buchstabierungen von Wörtern in flexibler Weise in Zeichensuchsystemen. Die Bedeutung von einigen der in normalen Ausdrücken verwendeten Symbole sind nachstehend gezeigt.
- . stellt irgend ein Zeichen dar.
- * stellt 0 oder mehr Wiederholungen des unmittelbar vorangehenden Zeichens dar (z. B. stellt .* irgendeine Zeichenkette dar).
- [] stellt irgendeines von spezifizierten Zeichen in einer eckigen Klammer dar (z. B. stellt [a-z] irgendein alphabetisches Zeichen von "a" bis "z" dar).
- ^ stellt Zeichen dar, die von jenen als Nächstes spezifizierten abweichen (z. B. repräsentiert [^a-z] irgendein Zeichen, das von "a" bis "z" abweicht).
- , represents any sign.
- * represents 0 or more repetitions of the immediately preceding character (for example,. * represents any string).
- [] represents any of specified characters in square brackets (e.g., [az] represents some alphabetic character from "a" to "z").
- ^ represents characters that differ from those specified next (for example, [^ az] represents any character that differs from "a" to "z").
Demnach
zeigt die Zeile mit der Zeilennummer 5 der
Demnach
ist es möglich,
den Teil der Sprache und die Evaluierungsbewertungen als Math und als
Text jeweils von jedem als ein Ergebnis einer Operation der Zeichenerkennung,
die unter Bezugnahme auf das Verzeichnis zum Beurteilen eines mathematischen
Ausdrucks/Textes
Genauer,
wie in
<Schritt A2: Suche nach optimalem Pfad><step A2: Search for optimal path>
Dann
wird in dem nächsten
Schritt von Schritt A2 eine Verarbeitungsoperation zum Suchen eines
optimalen Pfades von dem Evaluierungsbewertung und zum Koppeln der
Evaluierungsbewertung durchgeführt.
Es
wird Bezug genommen auf
Das
Verzeichnis zum Verbinden von Sprachteilen
In
einem Betrieb des Suchens nach einem optimalen Pfad wird entweder
ein mathematischer Ausdruck oder Text für jedes Wort unter Bezugnahme
auf seine Evaluierungsbewertungen gesucht und die nur zulässigen Verbindungen
werden nach erfassten Wörtern
nachverfolgt in Übereinstimmung
mit den in dem Verzeichnis zum Verbinden von Sprachteilen
Dieser Suchalgorithmus kann mit Hilfe einer Strahlsuchtechnik realisiert werden (welche auch als weitenpriorisierte Suche bezeichnet wird). Das Strahlsuchen ist auf dem Gebiet der dynamischen Programmierung ein wohlbekannter Algorithmus. Er ist entworfen, um Pfade zu eliminieren, die als kaum möglich beurteilt werden, ausgewählt zu werden als optimaler Pfad, um die Dimensionen des zu durchsuchenden Raums und auch sowohl den Umfang an Berechnungen und die Speicherkapazität, die zum Suchen eines optimalen Pfads erforderlich sind, zu reduzieren.This Search algorithm can be realized by means of a beam search technique (which is also referred to as a prioritized search). The beam search is in the field of dynamic programming a well-known algorithm. It's designed to eliminate paths as hardly possible be judged to be the optimal path to the dimensions of the search Space and also both the amount of calculations and the storage capacity needed to search an optimal path are required to reduce.
Als
ein Ergebnis der oben beschriebenen Suchoperation wird jedes der
Wörter
als entweder zu einem mathematischen Ausdruck oder einem Text gehörend beurteilt
und Mathematikausdrucksregionen und Textregionen werden erfasst.
In dem Fall der
Es sollte bemerkt werden, dass höher entwickelte formative Grammatik wie eine kontextfreie Grammatik definiert werden kann zum Beschreiben von Verbindungszusammenhängen, um die Verbindungen von Sprachteilen zum Zwecke dieser Erfindung zu prüfen. Eine solche Grammatik ist äquivalent einer normalen Grammatik aber höher entwickelt als die Letztere.It should be noticed that higher developed formative grammar as a context-free grammar can be defined to describe connection contexts the connections of language parts for the purpose of this invention check. Such a grammar is equivalent to one normal grammar but higher developed as the latter.
Konventionelle Systeme des betrachteten Typs sind angepasst, um einfache Regeln zum Erfassen mathematischer Ausdrücke zu verwenden. Wenn beispielsweise eine oder mehrere Klammern und/oder Schrägschriftbuchstaben in einer Gruppe von Wörtern erkannt werden, bestimmen sie normalerweise derart, dass die Gruppe von Wörtern jene eines mathematischen Ausdrucks ist. Solche Systeme können normalerweise nicht verschiedenartige Symbole handhaben, die in einem erkannten mathematischen Ausdruck eingeschlossen sind. Wenn ein Wort "a" ("ein") in einem Text gefunden wird, kann das System nicht bestimmen, ob es sich um einen unbestimmten englischsprachigen Artikel handelt oder ein Schriftzeichen in einem mathematischen Ausdruck. Demgegenüber kann diese Ausführungsform exakter bestimmen, ob jedes Wort zu einem mathematischen Ausdruck oder Text gehört, durch Bezugnahme auf die Evaluierungsbewertungen des Wortes in einer oben beschriebenen Weise. Zudem ist es, da die Ausführungsform eine formative Grammatik zum Prüfen jedes Wortes verwendet, möglich, zu bestimmen, dass ein Wort "a", dem nicht unmittelbar ein Nomen folgt, zu einem mathematischen Ausdruck gehört, basierend auf der Regel, dass nur ein Nomen direkt "a" folgen kann, wenn das Letztere ein englischsprachiger Artikel ist.Conventional systems of the type considered are adapted to use simple rules for acquiring mathematical expressions. For example, when one or more parentheses and / or slashed letters are recognized in a group of words, they usually determine such that the group of words is that of a mathematical expression. Such systems usually can not handle disparate symbols that are identified in a mathematical formula term are included. If a word "a" is found in a text, the system can not determine whether it is an indefinite English-language article or a character in a mathematical expression. In contrast, this embodiment can more accurately determine whether each word belongs to a mathematical expression or text by referring to the evaluation scores of the word in a manner described above. In addition, since the embodiment uses a formative grammar to check each word, it is possible to determine that a word "a" not immediately followed by a noun belongs to a mathematical expression based on the rule that only one noun can directly follow "a" if the latter is an English-language article.
(Mathematikausdruckserkennungsverfahren)(Math expression recognizing method)
Zum
Erkennen eines mathematischen Ausdrucks ist es notwendig, eine Technik
zum Prüfen
der Struktur des Ausdrucks im Hinblick auf Indizes, Exponenten,
Nenner/Zähler
und so weiter zu überprüfen zusätzlich zu
dem Erkennen der Zeichen. Daher ist in diesem Sinne die Erkennung
eines mathematischen Ausdrucks komplizierter als die Erkennung eines
gewöhnlichen
Zeichens. In dieser Ausführungsform werden
Zeichen mit Hilfe einer bekannten Zeichenerkennungstechnik erkannt
wohingegen die Struktur eines mathematischen Ausdrucks durch ein
Verfahren geprüft
wird, das vier Schritte von Schritt B1, Schritt B2, Schritt B3 und
Schritt Band umfasst, die nachstehend unter Bezugnahme auf
<Schritt B1: Erfassen der Struktur in Hinblick auf Zähler/Nenner, Indizes, Betonungsmarkierungen, Wurzelzeichen, Punkte und so weiter><step B1: acquiring the structure in terms of numerator / denominator, indices, stress marks, Root signs, points and so on>
In Schritt B1 werden Bruchstriche, Wurzelzeichen und so weiter von Mathematikausdrucksregionen erfasst und Nenner und Zähler und Wörter in Wurzelzeichen werden isoliert. In ähnlicher Weise werden wenn es irgendwelche Indizes, Betonungszeichen, Wurzelzeichen, Punkte und so weiter gibt, diese erfasst und von den Bilddaten der Mathematikausdrucksregionen gelöscht.In Step B1 becomes break lines, root signs and so on Math expression regions are recorded and denominators and counters and words in root signs are isolated. Similarly, if there are any indices, stress marks, root signs, points and so forth, these are captured and from the image data of the math expression regions deleted.
Wenn
beispielsweise ein in
Mathematische Elemente wie Nenner/Zähler, Indizes, Betonungszeichen, Wurzelzeichen und Punkte können relativ exakt in Übereinstimmung mit den oben angeführten Dokumenten [1], [2] und [3] erfasst werden. In vielen Fällen können sie durch ein einfaches Verfahren erfasst werden, das sich auf lokale Positionszusammenhänge solcher Elemente bezieht. Daher können die nachfolgenden Schritte von Schritt B2 bis Schritt B4 eingeschränkt werden auf Tiefschriften und Hochschriften (Exponenten) unter Verwendung des einfachen Erfassungsverfahrens des Erfassens anderer mathematischer Elemente wie sie oben aufgelistet worden sind, um die für sie erforderliche Zeit zu reduzieren.mathematical Elements like denominator / counter, Indices, stress marks, root signs and points can be relative exactly in agreement with the above Documents [1], [2] and [3]. In many cases they can be captured by a simple procedure that focuses on local Position relationships relates to such elements. Therefore, the subsequent steps of Step B2 to step B4 are limited to subscriptions and citations (exponents) using the simple detection method of the Capture other mathematical elements as listed above have been for the to reduce the time required.
<Schritt B2: Zeichenerkennung><step B2: Character recognition>
In den nachfolgenden Schritten von Schritt B2 bis Schritt B4 werden die Mathematikausdruckskomponenten, die von Bruchstrichen, Betonungszeichen, Indizes, Wurzelzeichen und Punkten in Schritt B1 befreit worden sind, verarbeitet.In the subsequent steps from step B2 to step B4 the mathematical expression components that are punctuated by fractional lines, stress signs, Indices, root signs and points have been freed in step B1 are, processed.
In
Schritt B2 werden verknüpfte
schwarze Elemente von den Mathematikausdruckskomponenten für die Bilddaten
der Mathematikausdruckskomponenten extrahiert, die im Schritt B1
erhalten worden sind und werden einem Prozess der Zeichenerkennung
unterzogen. Als ein Ergebnis werden die in der unteren Hälfte der
<Schritt B3: Erzeugen von Verknüpfungskandidaten><step B3: Creating Link Candidates>
In
Schritt B3 wird die Möglichkeit
des Verbindens irgendwelcher zwei Zeichen an allen erhaltenen Kandidatenzeichen
unter Verwendung des in
Beachte,
dass die Größe der Normalisierung sich
hier auf die Höhe
von dem höchsten
Punkt von Buchstaben mit Oberlänge
(z. B. dem höchsten Punkt
von dem Buchstaben "d") bis zu dem tiefsten Punkt
von Buchstaben mit Unterlänge
(z. B. dem tiefsten Punkt des Buchstaben "y")
bezieht. Mit anderen Worten, der Wert von h1 zeigt die Höhe von zwei kombinierten
Buchstaben von "d" und "y", die übereinander getippt sind. "d" ist ein Zeichen, bei dem ein schwarzes
Verknüpfungsliniensegment
sich bis zum höchsten
Punkt des Buchstabens mit Oberlänge
erstreckt und "y" ist ein Zeichen,
bei dem ein schwarzes Verknüpfungsliniensegment
sich bis zu dem tiefsten Punkt des Buchstabens mit Unterlänge erstreckt. Beispielsweise
hat der Buchstabe "x" in
In ähnlicher Weise wird die tatsächliche Größe des Zeichens "2", das sich in einer Indexregion befindet, mit einem Multiplizierer multipliziert, der speziell definiert ist um es die Normalisierungsgröße von h2 zu zeigen, die für Indizes zu verwenden ist. Da Zeichen, die sich in Indexregionen befinden, eine kleine tatsächliche Größe haben, wird die für das sich in einer Indexregion befindende Zeichen "2" verwendete Normalisierungsgröße h2 kleiner gemacht als die Normalisierungsgröße h1, die für das sich auf der Grundlinie befindende Zeichen "x" zu verwenden ist.In similar Way becomes the actual Size of the character "2", which is in an index region, multiplied by a multiplier that is specifically defined around it the normalization size of h2 to show that for To use indexes. Because characters that are in index regions are a small actual Have size, will the for the normalization quantity h2 used in an index region "2" becomes smaller made as the normalization size h1 for that yourself on the baseline characters "x" use is.
In
Die
vier Streudiagramme (Probeninformation) der
Demnach
ist es nun möglich,
die Inter-Zeichenstrukturkandidaten
zu bestimmen, von denen jeder einen horizontalen Positionszusammenhang
zeigen kann, einen Zeichen/Tiefschrift-Zusammenhang oder einen Zeichen/Hochschrift-Zusammenhang, und
ihre jeweiligen Sätze
von Evaluierungsbewertungen auf nachstehend als Verknüpfungskandidaten bezeichnet)
durch rechenmäßiges Bestimmen
der Werte von H und D für
jedes Paar von im Schritt B2 erhaltenen Kandidatenzeichen und Beurteilen,
der Polygonalregion in dem Streudiagramm der entsprechenden Kombination
von Zeichentypen, zu denen das Paar gehört. Wenn beispielsweise der
Zusammenhang der Normalisierungsgröße H und der des Normalisierungszentrums
D eines Paares aufeinander folgend angeordneter Zeichen in der Polygonalregion
P1 oder P2 in
Wie
in
(c, x, horizontal,
100),
(c, X, tief, 60) und
(C, X, horizontal, 100).As in
(c, x, horizontal, 100),
(c, X, deep, 60) and
(C, X, horizontal, 100).
Es ist einzusehen, dass die Kombination von (C, x) nicht existieren kann, weil der Zusammenhang von H und D nicht in irgendeiner Region der Streudiagramme gefunden werden kann.It it can be seen that the combination of (C, x) does not exist can because the connection of H and D is not in any region the scatterplots can be found.
Die
folgenden Verknüpfungskandidaten
werden für
die Zeichen "x" und "2", die ein Index ist, unter Bezugnahme
auf das Streudiagramm der
(X,
2, hoch, 60),
(x, 2, hoch, 100) und
(x, 2, horizontal,
20).The following join candidates are for the characters "x" and "2", which is an index, with reference to the scatter plot of
(X, 2, high, 60),
(x, 2, high, 100) and
(x, 2, horizontal, 20).
Die
folgenden Verknüpfungskandidaten
werden für
die Zeichen von "x" und "y" unter Bezugnahme auf das in
(x,
y, horizontal 100),
(x, Y, tief, 60)
(X, y, horizontal
60),
(2, y, tief 10) und
(2, Y, tief, 50).The following link candidates are used for the characters of "x" and "y" with reference to the in
(x, y, horizontal 100),
(x, y, deep, 60)
(X, Y, horizontal 60),
(2, y, deep 10) and
(2, Y, deep, 50).
Schließlich werden
die folgenden Verknüpfungskandidaten
für die
Zeichen "y" und "3", welches ein Index ist, unter Bezugnahme
auf das Streudiagramm der
(y,
3, hoch, 100) und
(Y, 3, hoch, 50).Finally, the following link candidates for the characters "y" and "3", which is an index, will be described with reference to the scattergram of FIG
(y, 3, high, 100) and
(Y, 3, high, 50).
In
einem Aspekt verwendet diese Ausführungsform vier Streudiagramme,
wie sie in
Gemäß irgendeinem
oben herangezogenen Diagramm [1], [2] und [3] wird ein Index durch
Untersuchen erfasst, ob sein Normalisierungszentrum aufwärts oder
abwärts
von dem Horizontalzentrum des Elternzeichens angezeigt wird oder
nicht. Vom Gesichtspunkt der Streudiagramme der
Nun wird vor dem Beschreiben des nächsten Schrittes der Grund, weshalb das Erkennen mathematischer Ausdrucksstrukturen ein Problem des Erkennens eines optimalen Pfades ist, nachstehend beschrieben.Now will be before describing the next step the reason why the recognition of mathematical structures of expression a problem of recognizing an optimal path is described below.
Ein mathematischer Ausdruck hat eine Baumstruktur und Symbole werden nicht auf einer selben Linie angeordnet. Dies ist der Grund, warum die Tatsache, dass es ein Problem darstellt beim Erfassen eines optimalen Pfades von vielen Leuten nicht verstanden wird. erfindungsgemäß wird ein optimaler Pfad durch zeichnen eines Gesamtbaums, der optimale mathematische Ausdrucksstrukturen zeigt, unter Verwendung des in Schritt B3 vorbereiteten Verknüpfungsnetzes erhalten. Die Verbindung jedes Zeichens mit seinem Elternzeichen kann durch Zeichnen eines Gesamtbaums beurteilt werden. Demnach wird ein Satz von (Elternkandidatenzeichen (links), Tochterkandidatenzeichen (rechts), Verbindungstyp, Evaluierungsbewertung)) als Verknüpfungskandidat bezeichnet und jedes Zeichenrechteck wird ausgeführt, um alle Verknüpfungskandidaten in Bezug auf das Tochterzeichen in dem Rechteck zu tragen. Dann wird ein Gesamtbaum definiert durch Auswählen eines einzelnen Verknüpfungskandidaten aus jedem Rechteck. Solche Auswahlen können als Aufspüroperation von Pfaden angesehen werden. Daher ist das Erkennen mathematischer Ausdrucksstrukturen ein Problem des Erfassens eines optimalen Pfads.A mathematical expression has a tree structure and symbols are not arranged on the same line. This is why the fact that it is a problem in grasping an optimal path is not understood by many people. According to the present invention, an optimal path is obtained by drawing a whole tree showing optimal mathematical expression structures using the link mesh prepared in step B3. The connection of each character with its parent character can be judged by drawing a whole tree. Thus, a set of (parent candidate character (left), subsidiary candidate character (right), connection type, evaluation score) is referred to as a link candidate, and each character rectangle is executed to match all candidate links in the right to wear. Then, a whole tree is defined by selecting a single link candidate from each rectangle. Such selections may be considered as a tracking operation of paths. Therefore, recognizing mathematical expression structures is a problem of detecting an optimal path.
Solche Pfade können jedoch nicht insgesamt als ein Baum mathematischer Ausdrucksstrukturen angesehen werden. Beispielsweise kann ein Zeichen nur ein Tochterzeichen horizontal auf derselben Linie angeordnet haben oder als eine Hochschrift oder eine Tiefschrift angeordnet haben (Nichtvorhandensein duplizierter Verknüpfungen). Zudem müssen alle als basierend auf rechter oder linker Verbindung oder Indexverbindung in ihrem Zeichenrechteck ausgewählt erkannten Kandidaten eines Zeichens miteinander übereinstimmen, damit sie ein Teil des mathematischen Ausdrucks sind (Auswahl eines Einzigartigkeits-Kandidaten). Ein Gesamtbaum, der diese beiden Erfordernisse erfüllt, wird als widerspruchsfreier Mathematikausdruckssyntaxbaum bezeichnet und die einen solchen Gesamtbaum bildenden Pfade werden als anwendbare Pfade bezeichnet. Ein optimaler Pfad wird, von jenen anwendbaren Pfaden ausgewählt. In der folgenden Beschreibung bezieht sich der einfache Ausdruck eines Pfades auf eine von dem widerspruchsfreien Gesamtbaum erhaltene Anwendung.Such Paths can however, not altogether regarded as a tree of mathematical expression structures become. For example, a character can only have one child character horizontally arranged on the same line or as a capital or a Subscript (absence of duplicated links). In addition, everyone must as based on right or left connection or index connection selected in their drawing rectangle Recognized candidates of a sign agree with each other, so they one Part of the mathematical expression are (selection of a uniqueness candidate). An overall tree that fulfills both these requirements becomes denoted as non-contradictory mathematical expression syntax tree and the paths forming such a tree are considered applicable Called paths. An optimal path becomes applicable from those Paths selected. In the following description, the simple expression refers a path to a preserved from the consistent total tree Application.
<Schritt B4: Suche nach optimalem Pfad><step B4: Search for optimal path>
Dann wird im Schritt B4 durch rückwärtiges (oder vorwärtiges) Nachverfolgen der zwischen Zeichenpaaren im Schritt B4 erzeugten Verknüpfungskandidaten nach einem optimalen Pfad gesucht, um die Verknüpfungskandidaten zu verbinden. Genauer, der die größten gemeinsamen Evaluierungsbewertungen zeigende Pfad wird unter den Pfaden gesucht, die die Zeichen widerspruchsfrei verbinden können durch Berücksichtigen der Verbindungszusammenhänge zwischen irgendwelchen zwei aufeinander folgenden Zeichen (Horizontalpositionszusammenhänge, Zeichen/Tiefschrift-Zusammenhänge und Zeichen/Hochschrift-Zusammenhänge) und Auswählen eines der Verbindungskandidaten jedes Paares von aufeinander folgend angeordneten Zeichen. Zudem wird in dieser Ausführungsform der Gesamtwert der lokalen Evaluierungsbewertungen der jeweiligen Zeichenpaare, die durch ihre Verknüpfungskandidaten gegeben sind, basierend auf den drei Bedingungen für die globale Evaluierung korrigiert, die wiederum definiert werden basierend auf der Verteilung der Höhen der in der mathematischen Ausdruckskomponente enthaltenen Zeichen. Der optimale Pfad wird auch durch Bezugnahme auf die korrigierte Gesamtevaluierungsbewertung gesucht.Then is in step B4 by backward (or vorwärtiges) Tracking the between pairs of characters generated in step B4 link candidates searched for an optimal path to connect the link candidates. Specifically, the largest common Evaluation evaluation pointing path is searched among the paths which can connect the characters without contradiction by considering the connection contexts between any two consecutive characters (horizontal positional contexts, character / subscriptions and Character / superscript relationships) and selecting one of the connection candidates of each pair of consecutive arranged signs. In addition, in this embodiment, the total value of local evaluation evaluations of the respective character pairs, the through their affiliation candidates are given based on the three conditions for the global Evaluation corrected, which in turn are defined based on the distribution of heights the character contained in the mathematical expression component. The optimal path is also corrected by reference to the Overall evaluation evaluation wanted.
Wenn
die Normalisierungsgröße des Zeichens
in der Indexregion jedes Elternzeichens größer ist als die Normalisierungsgröße des Elterzeichens,
wie in
Wenn
zwei aufeinander folgend angeordnete Zeichen auf derselben Linie
gefunden werden und das nachfolgende der zwei Zeichen sich in der
Indexregion des vorangehenden Zeichens befindet, wie in
Die
Gesamtevaluierungsbewertung wird ebenfalls reduziert, die Normalisierungsgröße von auf
der Grundlinie angeordneten alphabetischen Zeichen differenziert
sind jenseits eines gewissen Grenzbereichs, wie in
Demnach sind die Bedingungen für globale Evaluierung die, die erfüllt werden müssen, um die Gesamtevaluierungsbewertung des Pfades, der die Zeichen in einem mathematischen Ausdruck ohne irgendeinen Widerspruch verbinden kann, das Auswählen eines der Verknüpfungskandidaten jedes Zeichenpaares vom Gesichtspunkt eines Horizontalpositionszusammenhangs, eines Zeichen/Tiefschrift-Zusammenhangs und eines Zeichen/Hochschrift-Zusammenhangs. Der Betrieb zum Suchen nach einem optimalen Pfad, der die größte Gesamtevaluierungsbewertung erzeugt, kann mit hoher Geschwindigkeit auch unter Verwendung einer Technik der Strahlsuche durchgeführt werden (welche auch als weitenpriorisierte Suche bezeichnet wird).Therefore are the conditions for global evaluation the one that meets Need to become, to the overall evaluation score of the path containing the characters in to connect a mathematical expression without any contradiction can, selecting one of the link candidates each pair of characters from the point of view of a horizontal position context, a sign / collocation context and a sign / collocation context. The operation to search for an optimal path, the largest overall evaluation evaluation can also be generated at high speed using a Technique of beam search performed (which is also referred to as a prioritized search).
Den in den obigen herangezogenen Dokumenten [1], [2] und [3] beschriebenen Techniken fehlt es an dem Konzept der globalen Evaluierung. Wenn daher ein einzelnes Zeichen auf der Grundlinie fehlerhaft als ein Index genommen wird, werden alle folgenden Zeichen fehlerhaft als entsprechend viele Indizes angenommen. Dies tritt auf, wenn teilweise weil jedes Zeichen als ein Index oder ein Exponent basierend auf einer unter Verwendung lokal charakteristischer Aspekte des Zeichens durchgeführter Rechenoperation beurteilt wird. Im Gegensatz hierzu wird durch die vorliegende Erfindung das Konzept der globalen Evaluierung übernommen für die folgenden Pfade, so dass, wenn ein Zeichen fehlerhaft als ein Index angenommen wird, das Problem, dass alle folgenden Zeichen fehlerhaft angenommen werden, nicht auftritt. Dann ist es möglich, das Ergebnis der Operation einer externen Vorrichtung zum Erkennen eines mathematischen Ausdrucks unter Verwendung der Technik der globalen Evaluierung zu evaluieren. Es ist auch möglich, die Technik auf eine komplexe Beurteilungsoperation anzuwenden.The in the above referenced documents [1], [2] and [3] Techniques lack the concept of global evaluation. If so a single character on the baseline is faulty as an index is taken, all the following characters become erroneous as appropriate many indices have been adopted. This occurs when in part because each Characters as an index or an exponent based on an under Use of locally characteristic aspects of the character performed arithmetic operation is judged. In contrast, by the present invention the concept of global evaluation is adopted for the following paths, so that if a character is erroneously assumed as an index, the problem not all subsequent characters are accepted incorrectly occurs. Then it is possible the result of the operation of an external device for detecting a mathematical expression using the technique of global Evaluate evaluation. It is also possible to put the technique on one apply complex assessment operation.
Dann wird das letztendliche Ergebnis der Erkennung für die Mathematik-Ausdruckskomponente durch Zurückgeben der Indizes, der Betonungsmarkierungen, der Wurzelzeichen und so weiter, sofern vorhanden, die in Schritt B1 temporär entfernt worden sind, zu der Zeichenkette, die optimal verknüpft ist, erhalten. Dann wird das letztendliche Ergebnis der Erkennung für die Mathematik-Ausdrucksregion durch Durchführen der Verarbeitungsoperation der Schritte B2 bis B4 auf jede der Mathematik-Ausdruckskomponenten erhalten. Die Daten des Erkennungsergebnisses der Textregion und Mathematik-Ausdrucksregionen enthaltenden Dokumentes werden durch synthetisches Kombinieren der Ergebnisse der Erkennung der Textregionen und der Mathematik-Ausdrucksregionen erhalten.Then becomes the final result of the recognition for the math expression component Hand back indices, stress marks, root signs, and so on continue, if available, temporarily removed in step B1 have been added to the string that is optimally linked, receive. Then, the final result of the recognition for the mathematical expression region becomes Carry out the processing operation of steps B2 to B4 on each of the math expressing components receive. The data of the recognition result of the text region and Math expression Regions document containing by synthetically combining the Results of recognition of text regions and math expression regions receive.
Demnach umfasst eine Mathematik-Ausdruckserkennungsvorrichtung eine Zeichenerkennungseinheit, die konfiguriert ist zum Erkennen von Zeichen in einem Dokumentbild, das einen Text und einen mathematischen Ausdruck enthält, ein erstes Verzeichnis, das konfiguriert ist zum Speichern eines Evaluierungsbewertungspfads für jeden Worttyp, der mit Hilfe eines normalen Ausdrucks identifiziert werden kann, wobei die Bewertung die Wahrscheinlichkeit zeigt, zu Text zu gehören und die, zu einem mathematischen Ausdruck zu gehören, eine Evaluierungseinheit, die konfiguriert ist, um die Evaluierungsbewertungen zu erhalten, die die Wahrscheinlichkeit zu dem Text zu gehören und die zu dem mathematischen Ausdruck zu gehören, für jedes der in den durch die Zeichenerkennungseinheit erkannten Zeichen eingeschlossenen Wörter zeigt unter Bezugnahme auf das erste Verzeichnis, und eine Mathematikausdrucks-Erfassungseinheit, die konfiguriert ist um nach einem Wörter verbindenden optimalen Pfad zu suchen durch Auswählen eines von Text und mathematischem Ausdruck basierend auf einer formativen Grammatik und die Wahrscheinlichkeit, zu dem Text zu gehören und die, zu einem mathematischen Ausdruck zu gehören zeigenden Evaluierungsbewertungen für jedes der Wörter, hierdurch Zeichen, die zu dem automatischen Ausdruck gehören, erfassend.Therefore includes a mathematical expression recognition device a character recognition unit configured to recognize of characters in a document image that has a text and a mathematical Contains expression a first directory configured to store an evaluation evaluation path for each Word type identified by a normal expression can, where the rating shows the probability to text To belong and, belonging to a mathematical expression, an evaluation unit, which is configured to receive the evaluation ratings, the probability to belong to the text and that to the mathematical one To be an expression for each in the characters recognized by the character recognition unit included words Referring to the first directory, and a math expression detecting unit, FIG. which is configured to be optimal for connecting words Path to search by selecting one of text and mathematical expression based on a formative Grammar and the probability to belong to the text and the evaluation evaluations that belong to a mathematical expression for each of the words, thereby detecting characters belonging to the automatic expression.
Da eine Mathematik-Ausdrucksregion mit Hilfe einer gewöhnlichen Operation der Zeichenerkennung erkannt wird, können unerwartete Zeichen im Erkennungsergebnis auftreten. Im Hinblick auf dieses Problem umfasst die Mathematik-Ausdruckserkennungsvorrichtung ein Verzeichnis, das zu verwenden ist zum Klassifizieren der in dem Ergebnis einer Operation der Zeichenerkennung, die unter Verwendung normaler Ausdrücke in unterschiedliche Typen ausgeführt worden ist, und Erhalten von Evaluierungsbewertungen für jeden Worttyp, welche verwendet werden zur Klassifizierung, die jeweils die Wahrscheinlichkeit zeigt, zu einem Text zu gehören und die zu einem mathematischen Ausdruck zu gehören. Daher ist es möglich, jedem Wort in flexible Weise unter Bezugnahme auf das Verzeichnis Evaluierungsbewertungen zu verleihen. Jeder mathematische Ausdruck wird durch Suchen eines optimalen jedes aufeinander folgend angeordnete Wörterpaar verbindenden Pfades für sowohl den Text als auch den mathematischen Ausdruck erfasst auf der Band der für jedes Wort jeweils in Hinblick auf Text und mathematischen Ausdruck rechnerisch beurteilten Evaluierungsbewertungen. Mit dieser Anordnung ist es möglich, eine Mathematik-Ausdrucksregion exakt zu erfassen und demnach die in einem Dokument enthaltenen mathematischen Ausdrücke zu erkennen.There a mathematical expression region using a commonplace Can recognize unexpected characters in the character recognition operation Recognition result occur. With regard to this problem includes the math expression recognition device a directory to use to classify the in the result of a character recognition operation using normal expressions executed in different types and getting evaluation ratings for each Word type, which are used for classification, respectively the probability shows to belong to a text and to belong to a mathematical expression. Therefore it is possible to everyone Word in a flexible way with reference to the directory evaluation ratings to rent. Every mathematical expression is determined by looking for a optimally connecting each successively arranged pair of words Path for captures both the text and the mathematical expression the band for each word respectively in terms of text and mathematical expression arithmetically assessed evaluation evaluations. With this arrangement Is it possible, to accurately grasp a mathematical expression region and therefore the recognize mathematical expressions contained in a document.
Gemäß der vorliegenden Ausführungsform umfasst eine Mathematik-Ausdruckserkennungsvorrichtung eine Zeichenerkennungseinheit, die konfiguriert ist zum Erkennen von Zeichen in einem einen Text und einen mathematischen Ausdruck enthaltenden Dokumentenbildes, einer Erfassungseinheit, die konfiguriert ist zum Erfassen einer Mathematik-Ausdrucksregion aus den durch die Zeichenerkennungseinheit erkannten Zeichen, einem Speicher, der konfiguriert ist zum Speichern einer Vielzahl von Informationsproben, die einen Zusammenhang einer Normalisierungsgröße und einer Mittelposition zwischen jedem aufeinander folgend angeordneten Zeichenpaar im Hinblick auf Zeichentypen angibt einschließlich eines horizontalen Positionszusammenhangs, eines Zeichen/Tiefschrift-Zusammenhangs und eines Zeichen/Hochschrift-Zusammenhangs, und einer Einheit, die konfiguriert ist zum Berechnen des Verhältnisses der Normalisierungsgröße und der Mittelposition zwischen jedem Paar aufeinander folgend angeordneter Zeichen, das in der Mathematik-Ausdrucksregion enthalten ist, und zum Erhalten von Verknüpfungskandidaten für den Horizontalpositions-Zusammenhang, den Zeichen/Tiefschrift-Zusammenhang und den Zeichen/Hochschrift-Zusammenhang basierend auf den berechneten Verhältnis der Normalisierungsgröße und der Mittelposition und der dem berechneten Zusammenhang des Typs der beiden aufeinander folgend angeordneten Zeichen entsprechenden Probeninformation.According to the present embodiment, a mathematical expression recognition apparatus comprises a character recognition unit configured to recognize characters in a document image including a text and a mathematical expression, a detection unit configured to acquire a mathematical expression region from the characters recognized by the character recognition unit, a memory configured to store a plurality of information samples having a relationship of a normalization amount and a center position between each consecutively arranged character pair in terms of character types including a horizontal positional relationship, a character / subscript relationship and a character / capitalization relationship, and a unit configured to calculate the ratio of the normalization size and the center position between each pair of consecutively arranged characters included in of the mathematical expression region, and obtaining link candidates for the horizontal position relationship, the character / subscript-related and the character / superscript relationship, based on the calculated ratio of the normalization amount and the center position and the calculated relationship of the type of the two consecutively arranged characters corresponding sample information.
Die Mathematik-Ausdruckserkennungsvorrichtung umfasst eine Vielzahl von Probeninformationen für unterschiedliche Kombinationstypen von zwei aufeinander folgend angeordneten Zeichen und es ist demnach möglich, den Inter-Zeichenzusammenhang von jedem erfassten aufeinander folgend angeordneten Zeichenpaar als ein horizontaler Positionszusammenhang, ein Zeichen/Tiefschrift-Zusammenhang oder ein Zeichen/Hochschrift-Zusammenhang zu erkennen unter Bezugnahme auf die Probeninformationen, die den Typen der Zeichen entsprechen, für die der Inter-Zeichenzusammenhang zu beurteilen ist. Mit dieser Anordnung ist es möglich, die Betriebsfehlerrate des Bestimmens der Positionen von Zeichen in einem mathematischen Ausdruck zu reduzieren und die Betriebseffizienz des Erkennens der Struktur mathematischer Ausdrücke zu verbessern.The Mathematical expression recognition apparatus includes a variety of sample information for different combination types of two consecutive arranged characters and it is therefore possible, the inter-character context from each detected consecutively arranged character pair as a horizontal positional context, a sign / collocation context or to recognize a sign / capital letter relationship by reference on the sample information corresponding to the type of characters for which the Inter-sign context is to be judged. With this arrangement Is it possible, the operation error rate of determining the positions of characters in a mathematical expression to reduce and operational efficiency of recognizing the structure of mathematical expressions.
Gemäß der vorliegenden Ausführungsform umfasst eine Mathematik-Ausdruckserkennungsvorrichtung eine Zeichenerkennungseinheit, die konfiguriert ist zum Erkennen von Zeichen in einem Dokumentenbild, das einen mathematischen Ausdruck einschließt, eine Einheit, die konfiguriert ist zum Erfassen einer Mathematik-Ausdrucksregion von dem Ergebnis einer durch die Zeichenerkennungseinrichtung erhaltenen Zeichenerkennung, eine Einheit, die konfiguriert ist zum Speichern einer Vielzahl von Probeninformationen in Bezug auf den Inter-Zeichenzusammenhang der Normalisierungsgrößen und dem der Zentralpositionen jedes Paars von aufeinander folgend angeordneten Zeichen in Hinblick auf die Zeichentypen und die Positionszusammenhänge des Horizontalpositionszusammenhangs, eine Inter-Zeichenzusammenhangsbestimmungseinheit, die konfiguriert ist zum rechenmäßigen Bestimmen des Zusammenhangs der Normalisierungsgrößen und des der Zentralpositionen jedes der Paare aufeinander folgend angeordneter Zeichen in einer Mathematik-Ausdrucksregion und zum Erhalten von Verknüpfungskandidaten als Kombinationen von Inter-Zeichenstrukturkandidaten, die die jeweiligen Wahrscheinlichkeiten zeigen, einen Horizontalpositionszusammenhang, einen Zeichen/Tiefschrift-Zusammenhang oder einen Zeichen/Hochschrift-Zusammenhang zu haben, basierend auf dem Rechenergebnis und der Probeninformation und ihrer jeweiligen Evaluierungsbewertungen, eine Einheit, die konfiguriert ist zum Speichern der Bedingungen zur globalen Evaluierung, die basierend auf der Verteilung der Höhen der in den Mathematik-Ausdrucksregionen enthaltenen Zeichen vorbeurteilt ist, und eine Einheit, die konfiguriert ist zum Suchen nach einem optimalen Pfad zum widerspruchsfreien Verbinden der Zeichen in jeder der Mathematik-Ausdrucksregionen, zum Auswählen eines Inter-Zeichenstrukturkandidaten mit einem horizontalen Positionszusammenhang, einem Zeichen/Tiefschrift-Zusammenhang oder einem Zeichen/Hochschrift-Zusammenhang für jedes Paar aufeinander folgend angeordneter Zeichen, und zum Erkennen des Horizontalpositionszusammenhangs, des Zeichen/Tiefschrift-Zusammenhangs oder des Zeichen/Hochschrift-Zusammenhangs des Paares aufeinander folgend angeordneter Zeichen basierend auf dem Ergebnis der Suchoperation.According to the present Embodiment comprises a math expression recognition device a character recognition unit, which is configured to recognize characters in a document image, which includes a mathematical expression, a unit that configures is to capture a math expression region from the result a character recognition obtained by the character recognition device, a unit configured to store a plurality sample information relating to the inter-character context the normalization quantities and that of the central positions of each pair of successive ones Characters with regard to the character types and the positional relationships of the horizontal position context, an inter-character relationship determination unit that configures is to computationally determine the Correlation of the normalization quantities and of the central positions each of the pairs of consecutively arranged characters in one Mathematics expression region and obtaining candidate links as combinations of inter-character structure candidates containing the respective probabilities show a horizontal position context, a character / collocation context or to have a sign / capital letter relationship based on the Calculation result and the sample information and their respective evaluation ratings, a unit configured to save the conditions for global evaluation, based on the distribution of heights of in the math expression regions contained characters, and a unit that is configured is to search for an optimal path to consistency Joining the characters in each of the math expression regions, to choose an inter-character structure candidate with a horizontal positional relationship, a sign / collocation context or a sign / collocation context for each Pair of consecutively arranged characters, and to recognize of the horizontal position context, of the character / subscript-context or the sign / capital letter relationship of the couple following characters based on the result of the search operation.
Demnach ist es möglich, nicht nur den lokalen Zusammenhang jedes Paares aufeinander folgend angeordneter Zeichen zu bestimmen, sondern auch einen optimalen Pfad zu suchen, der die Zeichen in einer Mathematik-Ausdrucksregion widerspruchsfrei verbinden kann, um die Gesamtevaluierungsbewertungen ultimativ zu maximieren, die Bedingungen zur globalen Evaluierung berücksichtigend. Wenn demnach der Positionszusammenhang eines Paars von aufeinander folgend angeordneten Zeichen fehlbeurteilt wird, wird vermieden, dass die Fehlbeurteilung den Betrieb des Bestimmens der Gesamtstruktur eines mathematischen Ausdrucks beeinträchtigt.Therefore Is it possible, not just following each couple's local context arranged characters, but also an optimal Path to search the characters in a math expressions region without contradiction, to the overall evaluation evaluations Ultimately, to maximize the conditions for global evaluation Taking into account. Thus, if the positional relationship of a pair of successive following misaligned characters is misjudged, it is avoided that misjudgment the operation of determining the forest affected by a mathematical expression.
Wie oben beschrieben, stellt die vorliegende Ausführungsform die folgenden Vorteile bereit.As As described above, the present embodiment provides the following advantages ready.
Es ist möglich, effizient Mathematik-Ausdrucksregionen durch Beurteilen jedes Wortes als ein solches eines Textes oder eines mathematischen Ausdrucks zu beurteilen und durch Suchen nach einem optimalen Pfad zum Verbinden von Wörtern basierend auf der formativen Grammatik und den jedem Wort in Hinblick auf Text und mathematischen Ausdruck verliehenen Evaluierungsbewertung.It is possible, efficient math expression regions by judging each word as such a text or a mathematical expression to judge and search for an optimal path to connect of words based on the formative grammar and the every word in terms textual and mathematical evaluation evaluation evaluation.
Es ist möglich, exakt den Positionszusammenhang jedes Paares aufeinander folgend angeordneter Zeichen als horizontaler Positionszusammenhang, als Zeichen/Tiefschrift-Zusammenhang oder als Zeichen/Hochschrift-Zusammenhang zu bestimmen durch Vorbereiten einer Vielzahl von Streudiagrammen, die Normalisierungsgrößen und Normalisierungszentren von Paaren aufeinander folgend angeordneter Zeichen zeigt.It is possible to accurately determine the positional relationship of each pair of consecutively arranged characters as a horizontal positional relationship, a character / subscriptive relationship, or a character / heading relationship by preparing a plurality of scattergrams sequencing the normalization magnitudes and normalization centers of pairs arranged characters shows.
Es ist möglich, zu verhindern, dass irgendeine Fehlbeurteilung eines Positionszusammenhangs eines Paares aufeinander folgend angeordneter Zeichen die Operation des Bestimmens der Gesamtstruktur eines mathematischen Ausdrucks beeinträchtigt nicht nur durch Bestimmen des Orts-Zusammenhangs jedes Paares aufeinander folgend angeordneter Zeichen, sondern auch des Suchens nach einem optimalen Pfad, die Bedingungen für globale Evaluierung berücksichtigend.It is possible, to prevent any misjudgment of a positional context of a Pair of consecutively arranged characters the operation of Determining the overall structure of a mathematical expression does not affect only by determining the location relationship each pair of consecutively arranged characters, but also of searching for an optimal path, the conditions for global evaluation Taking into account.
Es ist möglich, die Anzahl der zum Erzeugen von Verknüpfungskandidaten zu verwendenden Zeichen zu reduzieren um die Effizienz der Gesamtverarbeitungsoperation zu verbessern durch Ausführen einer Vorverarbeitungsoperation des Zerlegens mathematischer Ausdrücke in Komponenten und des Erfassens von Indizes, Betonungsmarkierungen, Wurzelzeichen und so weiter vor dem Erzeugen von Verknüpfungskandidaten und dem Suchen nach optimalen Pfaden.It is possible, the number of links to use to create link candidates Signs to reduce the efficiency of the overall processing operation to improve by running a Preprocessing operation of decomposing mathematical expressions into components and capturing indices, stress marks, root signs and so on, before creating link candidates and searching for optimal paths.
Während die
vorstehende Beschreibung auf spezielle Ausführungsformen der vorliegenden
Erfindung Bezug nimmt, wird verstanden werden, dass viele Modifikationen
vorgenommen werden können. Die
beiliegenden Ansprüche
sind dazu gedacht, solche Modifikationen abzudecken, als würden sie
in den tatsächlichen
Schutzbereich der vorliegenden Erfindung fallen. Die derzeit offenbarten
Ausführungsformen
sind demnach in jeder Hinsicht als den Schutzbereich der vorliegenden
Erfindung, der durch die beiliegenden Ansprüche angegeben wird, erläuternd und
nicht einschränkend
zu verstehen, vielmehr ist die vorangehende Beschreibung und sind alle Änderungen,
die in den Bedeutungsbereich von Äquivalenten der Ansprüche kommen,
demnach dazu gedacht, im Schutzbereich enthalten zu sein. Beispielsweise
kann die vorliegende Erfindung als ein computer-lesbares Aufzeichnungsmedium
in die Praxis umgesetzt werden, welches ein Programm enthält, um es
einem Computer zu ermöglichen,
als Vorbeurteilungsvorrichtung zu funktionieren, es dem Computer
zu ermöglichen,
eine Vorbeurteilungsfunktion zu realisieren oder es dem Computer
zu ermöglichen,
eine Vorbeurteilungseinrichtung auszuführen. Beispielsweise kann das
OCR-System
Claims (10)
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2001063968A JP4181310B2 (en) | 2001-03-07 | 2001-03-07 | Formula recognition apparatus and formula recognition method |
JP2001063968 | 2001-03-07 |
Publications (2)
Publication Number | Publication Date |
---|---|
DE60224128D1 DE60224128D1 (en) | 2008-01-31 |
DE60224128T2 true DE60224128T2 (en) | 2008-12-04 |
Family
ID=18922868
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE60224128T Expired - Lifetime DE60224128T2 (en) | 2001-03-07 | 2002-03-05 | Apparatus and method for recognizing characters and mathematical expressions |
Country Status (4)
Country | Link |
---|---|
US (1) | US7181068B2 (en) |
EP (1) | EP1239406B1 (en) |
JP (1) | JP4181310B2 (en) |
DE (1) | DE60224128T2 (en) |
Families Citing this family (69)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9514181B2 (en) * | 2004-03-23 | 2016-12-06 | Linguaversal, SL | Calculation expression management |
US7698638B2 (en) * | 2004-09-15 | 2010-04-13 | Microsoft Corporation | Systems and methods for automated equation buildup |
US7561737B2 (en) * | 2004-09-22 | 2009-07-14 | Microsoft Corporation | Mathematical expression recognition |
US7929767B2 (en) * | 2004-09-22 | 2011-04-19 | Microsoft Corporation | Analyzing subordinate sub-expressions in expression recognition |
US7561739B2 (en) * | 2004-09-22 | 2009-07-14 | Microsoft Corporation | Analyzing scripts and determining characters in expression recognition |
US8989431B1 (en) | 2007-07-11 | 2015-03-24 | Ricoh Co., Ltd. | Ad hoc paper-based networking with mixed media reality |
US9405751B2 (en) | 2005-08-23 | 2016-08-02 | Ricoh Co., Ltd. | Database for mixed media document system |
US9384619B2 (en) | 2006-07-31 | 2016-07-05 | Ricoh Co., Ltd. | Searching media content for objects specified using identifiers |
US8176054B2 (en) * | 2007-07-12 | 2012-05-08 | Ricoh Co. Ltd | Retrieving electronic documents by converting them to synthetic text |
US7812986B2 (en) | 2005-08-23 | 2010-10-12 | Ricoh Co. Ltd. | System and methods for use of voice mail and email in a mixed media environment |
US8965145B2 (en) | 2006-07-31 | 2015-02-24 | Ricoh Co., Ltd. | Mixed media reality recognition using multiple specialized indexes |
US9171202B2 (en) | 2005-08-23 | 2015-10-27 | Ricoh Co., Ltd. | Data organization and access for mixed media document system |
US8156116B2 (en) | 2006-07-31 | 2012-04-10 | Ricoh Co., Ltd | Dynamic presentation of targeted information in a mixed media reality recognition system |
US7702673B2 (en) | 2004-10-01 | 2010-04-20 | Ricoh Co., Ltd. | System and methods for creation and use of a mixed media environment |
US9373029B2 (en) | 2007-07-11 | 2016-06-21 | Ricoh Co., Ltd. | Invisible junction feature recognition for document security or annotation |
US9530050B1 (en) | 2007-07-11 | 2016-12-27 | Ricoh Co., Ltd. | Document annotation sharing |
US8249344B2 (en) | 2005-07-01 | 2012-08-21 | Microsoft Corporation | Grammatical parsing of document visual structures |
US8020091B2 (en) * | 2005-07-15 | 2011-09-13 | Microsoft Corporation | Alignment and breaking of mathematical expressions in documents |
KR100630200B1 (en) * | 2005-08-24 | 2006-10-02 | 삼성전자주식회사 | Method for operating calculator mode in the portable terminal |
JP2007072718A (en) * | 2005-09-06 | 2007-03-22 | Univ Of Tokyo | Handwritten mathematical expression recognizing device and recognizing method |
RU2309456C2 (en) * | 2005-12-08 | 2007-10-27 | "Аби Софтвер Лтд." | Method for recognizing text information in vector-raster image |
US20100254606A1 (en) * | 2005-12-08 | 2010-10-07 | Abbyy Software Ltd | Method of recognizing text information from a vector/raster image |
US8509563B2 (en) | 2006-02-02 | 2013-08-13 | Microsoft Corporation | Generation of documents from images |
JP2009526327A (en) | 2006-02-10 | 2009-07-16 | メタカータ・インコーポレーテッド | System and method for spatial thumbnails and companion maps for media objects |
WO2007094684A2 (en) | 2006-02-17 | 2007-08-23 | Lumex As | Method and system for verification of uncertainly recognized words in an ocr system |
US9721157B2 (en) * | 2006-08-04 | 2017-08-01 | Nokia Technologies Oy | Systems and methods for obtaining and using information from map images |
US9176984B2 (en) | 2006-07-31 | 2015-11-03 | Ricoh Co., Ltd | Mixed media reality retrieval of differentially-weighted links |
US8201076B2 (en) | 2006-07-31 | 2012-06-12 | Ricoh Co., Ltd. | Capturing symbolic information from documents upon printing |
US8489987B2 (en) | 2006-07-31 | 2013-07-16 | Ricoh Co., Ltd. | Monitoring and analyzing creation and usage of visual content using image and hotspot interaction |
US9063952B2 (en) | 2006-07-31 | 2015-06-23 | Ricoh Co., Ltd. | Mixed media reality recognition with image tracking |
US9020966B2 (en) | 2006-07-31 | 2015-04-28 | Ricoh Co., Ltd. | Client device for interacting with a mixed media reality recognition system |
WO2009075689A2 (en) | 2006-12-21 | 2009-06-18 | Metacarta, Inc. | Methods of systems of using geographic meta-metadata in information retrieval and document displays |
US7885456B2 (en) * | 2007-03-29 | 2011-02-08 | Microsoft Corporation | Symbol graph generation in handwritten mathematical expression recognition |
US8009915B2 (en) * | 2007-04-19 | 2011-08-30 | Microsoft Corporation | Recognition of mathematical expressions |
US8116570B2 (en) * | 2007-04-19 | 2012-02-14 | Microsoft Corporation | User interface for providing digital ink input and correcting recognition errors |
US8073258B2 (en) * | 2007-08-22 | 2011-12-06 | Microsoft Corporation | Using handwriting recognition in computer algebra |
US20090245646A1 (en) * | 2008-03-28 | 2009-10-01 | Microsoft Corporation | Online Handwriting Expression Recognition |
US8121412B2 (en) * | 2008-06-06 | 2012-02-21 | Microsoft Corporation | Recognition of tabular structures |
US20100115403A1 (en) * | 2008-11-06 | 2010-05-06 | Microsoft Corporation | Transforming math text objects using build down and build up |
US20100166314A1 (en) * | 2008-12-30 | 2010-07-01 | Microsoft Corporation | Segment Sequence-Based Handwritten Expression Recognition |
JP4775462B2 (en) * | 2009-03-12 | 2011-09-21 | カシオ計算機株式会社 | Computer and program |
JP5471126B2 (en) * | 2009-07-31 | 2014-04-16 | カシオ計算機株式会社 | Electronic device and program |
US8571270B2 (en) | 2010-05-10 | 2013-10-29 | Microsoft Corporation | Segmentation of a word bitmap into individual characters or glyphs during an OCR process |
US8751550B2 (en) | 2010-06-09 | 2014-06-10 | Microsoft Corporation | Freeform mathematical computations |
JP5790070B2 (en) * | 2010-08-26 | 2015-10-07 | カシオ計算機株式会社 | Display control apparatus and program |
CN103250149B (en) * | 2010-12-07 | 2015-11-25 | Sk电信有限公司 | For extracting semantic distance and according to the method for semantic distance to mathematics statement classification and the device for the method from mathematics statement |
JP5267546B2 (en) | 2010-12-22 | 2013-08-21 | カシオ計算機株式会社 | Electronic computer and program with handwritten mathematical expression recognition function |
US8943113B2 (en) * | 2011-07-21 | 2015-01-27 | Xiaohua Yi | Methods and systems for parsing and interpretation of mathematical statements |
US9058331B2 (en) | 2011-07-27 | 2015-06-16 | Ricoh Co., Ltd. | Generating a conversation in a social network based on visual search results |
US9208218B2 (en) * | 2011-10-19 | 2015-12-08 | Zalag Corporation | Methods and apparatuses for generating search expressions from content, for applying search expressions to content collections, and/or for analyzing corresponding search results |
US9600587B2 (en) | 2011-10-19 | 2017-03-21 | Zalag Corporation | Methods and apparatuses for generating search expressions from content, for applying search expressions to content collections, and/or for analyzing corresponding search results |
KR101812380B1 (en) | 2012-01-23 | 2017-12-26 | 마이크로소프트 테크놀로지 라이센싱, 엘엘씨 | Formula detection engine |
JP5950700B2 (en) * | 2012-06-06 | 2016-07-13 | キヤノン株式会社 | Image processing apparatus, image processing method, and program |
CN103679129A (en) * | 2012-09-21 | 2014-03-26 | 中兴通讯股份有限公司 | Method and device for identifying object in image |
JP2014127188A (en) * | 2012-12-27 | 2014-07-07 | Toshiba Corp | Shaping device and method |
US9330070B2 (en) | 2013-03-11 | 2016-05-03 | Microsoft Technology Licensing, Llc | Detection and reconstruction of east asian layout features in a fixed format document |
JP2014203393A (en) * | 2013-04-09 | 2014-10-27 | 株式会社東芝 | Electronic apparatus, handwritten document processing method, and handwritten document processing program |
CN103996055B (en) * | 2014-06-13 | 2017-06-09 | 上海珉智信息科技有限公司 | Recognition methods based on grader in image file electronic bits of data identifying system |
RU2596600C2 (en) * | 2014-09-02 | 2016-09-10 | Общество с ограниченной ответственностью "Аби Девелопмент" | Methods and systems for processing images of mathematical expressions |
CN107092902B (en) * | 2016-02-18 | 2021-04-06 | 富士通株式会社 | Character string recognition method and system |
US10025976B1 (en) * | 2016-12-28 | 2018-07-17 | Konica Minolta Laboratory U.S.A., Inc. | Data normalization for handwriting recognition |
CN108038441B (en) * | 2017-12-07 | 2021-03-16 | 潘晓梅 | System and method based on image recognition |
JP2019168935A (en) * | 2018-03-23 | 2019-10-03 | カシオ計算機株式会社 | Input device, input method and program |
US11610502B2 (en) | 2018-11-28 | 2023-03-21 | Kyndryl, Inc. | Portable computing device for learning mathematical concepts |
CN110796137A (en) * | 2019-10-10 | 2020-02-14 | 中国建设银行股份有限公司 | Method and device for identifying image |
KR20210061523A (en) * | 2019-11-19 | 2021-05-28 | 삼성전자주식회사 | Electronic device and operating method for converting from handwriting input to text |
CN112712075B (en) * | 2020-12-30 | 2023-12-01 | 科大讯飞股份有限公司 | Arithmetic detection method, electronic equipment and storage device |
KR102449336B1 (en) * | 2021-09-23 | 2022-09-30 | (주)웅진씽크빅 | Apparatus and method for recommending learning using optical character recognition |
US11961316B2 (en) * | 2022-05-10 | 2024-04-16 | Capital One Services, Llc | Text extraction using optical character recognition |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
IL109268A (en) * | 1994-04-10 | 1999-01-26 | Advanced Recognition Tech | Pattern recognition method and system |
-
2001
- 2001-03-07 JP JP2001063968A patent/JP4181310B2/en not_active Expired - Lifetime
-
2002
- 2002-03-05 EP EP02004377A patent/EP1239406B1/en not_active Expired - Lifetime
- 2002-03-05 DE DE60224128T patent/DE60224128T2/en not_active Expired - Lifetime
- 2002-03-05 US US10/087,772 patent/US7181068B2/en not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
DE60224128D1 (en) | 2008-01-31 |
EP1239406A3 (en) | 2005-03-16 |
JP4181310B2 (en) | 2008-11-12 |
EP1239406A2 (en) | 2002-09-11 |
US20020126905A1 (en) | 2002-09-12 |
JP2002269499A (en) | 2002-09-20 |
EP1239406B1 (en) | 2007-12-19 |
US7181068B2 (en) | 2007-02-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DE60224128T2 (en) | Apparatus and method for recognizing characters and mathematical expressions | |
Hao et al. | A table detection method for pdf documents based on convolutional neural networks | |
DE60217299T2 (en) | HOLISTIC-ANALYTICAL DETECTION OF HAND-WRITTEN TEXT | |
DE69428527T2 (en) | Kritzlervergleich | |
DE69730930T2 (en) | Method and device for character recognition | |
DE69429301T2 (en) | Speech processing system | |
DE69229536T2 (en) | Method and device for selecting linguistically significant images in a document image without decoding the image content | |
EP1665132B1 (en) | Method and system for collecting data from a plurality of machine readable documents | |
DE60129872T2 (en) | Method for extracting titles from numerical images | |
DE69230632T2 (en) | Optical word recognition through word shape analysis | |
DE60225317T2 (en) | STRING IDENTIFICATION | |
DE69528023T2 (en) | System and method for automatic interpretation of input printouts using new a posteriori probability mass and optimally trained data processing networks | |
DE60204005T2 (en) | METHOD AND DEVICE FOR RECOGNIZING A HANDWRITTEN PATTERN | |
DE69329330T2 (en) | Text recognition | |
DE102017008430A1 (en) | Methods and systems for generating virtual reality environments from electronic documents | |
DE69230127T2 (en) | Diagram recognition system | |
DE69616246T2 (en) | Automatic procedure for identifying omission words in the image of a document without using the OCR | |
DE102011079443A1 (en) | Learning weights of typed font fonts in handwriting keyword retrieval | |
DE69130535T2 (en) | CHARACTER RECOGNITION METHOD AND DEVICE FOR LOCALIZING AND DETERMINING PRE-DETERMINED DATA OF A DOCUMENT | |
Rahman et al. | Bn-htrd: A benchmark dataset for document level offline bangla handwritten text recognition (htr) and line segmentation | |
ALshebeili et al. | Arabic character recognition using 1-D slices of the character spectrum | |
Meddeb et al. | Hybrid modelling of an off line Arabic handwriting recognition system: results and evaluation | |
Pourreza et al. | Sub-word based Persian OCR using auto-encoder features and cascade classifier | |
EP2315159A2 (en) | Method and device for recognising and classifying sections of a document which can be accessed on a computer by means of step-by-step learning during training sessions | |
DE69734507T2 (en) | METHOD FOR OPTIMIZING AN IDENTIFICATION DOCUMENT SO THAT THE SIMILAR PATTERN CAN BE BETTERLY DISTINCTED |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
8364 | No opposition during term of opposition | ||
8320 | Willingness to grant licences declared (paragraph 23) |