DE69519256T2 - Verfahrenund Gerät zur Informationsverarbeitung und rechnerlesbares Speichermedium - Google Patents

Verfahrenund Gerät zur Informationsverarbeitung und rechnerlesbares Speichermedium

Info

Publication number
DE69519256T2
DE69519256T2 DE69519256T DE69519256T DE69519256T2 DE 69519256 T2 DE69519256 T2 DE 69519256T2 DE 69519256 T DE69519256 T DE 69519256T DE 69519256 T DE69519256 T DE 69519256T DE 69519256 T2 DE69519256 T2 DE 69519256T2
Authority
DE
Germany
Prior art keywords
character
image data
character codes
codes
candidate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
DE69519256T
Other languages
English (en)
Other versions
DE69519256D1 (de
Inventor
Katsumi Masaki
Hirotaka Shiiyama
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Application granted granted Critical
Publication of DE69519256D1 publication Critical patent/DE69519256D1/de
Publication of DE69519256T2 publication Critical patent/DE69519256T2/de
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/26Techniques for post-processing, e.g. correcting the recognition result
    • G06V30/262Techniques for post-processing, e.g. correcting the recognition result using context analysis, e.g. lexical, syntactic or semantic context
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Discrimination (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

    HINTERGRUND DER ERFINDUNG Gebiet der Erfindung
  • Die Erfindung bezieht sich auf ein Bilddatenverarbeitungsverfahren, ein Bilddatenverarbeitungsgerät und ein computerlesbares Speichermedium zur Speicherung von einem Computer ausführbarer Verarbeitungsschritte zur Verarbeitung von Bilddaten, wobei die Bilddaten Zeichenbilddaten enthalten.
  • Relevanter Stand der Technik
  • Bei der Erkennung eines eingegebenen Bildes durch eine optische Zeichenerkennung (OCR) oder dergleichen und der Umwandlung des Bildes in einen Text wurde bezüglich eines eingegebenen Zeichens, bei dem lediglich ein Kandidatenzeichen mit geringer Ähnlichkeit erhalten wurde, bisher als Gegenmaßnahme einer fehlerhaften Erkennung die Tatsache, dass die Ähnlichkeit niedrig ist, dem Bediener mitgeteilt, und er beurteilt, ob das Kandidatenwort richtig oder falsch ist. Ist es falsch, muss der Bediener das falsche Zeichen manuell korrigieren und ein richtiges Zeichen eingeben.
  • Bei diesem Verfahren muss der Bediener allerdings nicht nur ein in einen Text zu konvertierendes Bild eingeben, sondern auch den Korrekturvorgang vornehmen, woraus sich eine nachteilige Belastung des Bedieners ergibt.
  • Es gibt auch ein Verfahren, bei dem nicht nur ein Ergebnis der Zeichenerkennung ausgegeben wird, sondern auch ein durch die Zeichenerkennung erhaltenes Kandidatenzeichen mit einem Wörterbuch oder einer Wissensbasis verglichen wird, wodurch ein fehlerhaft erkanntes Zeichen ohne die Hilfe des Bedieners korrigiert wird.
  • Mit den vorstehend angeführten Verfahren sind allerdings Nachteile verbunden, dass das Wörterbuch oder die Wissensbasis für den Korrekturvorgang in einem Speicher vorhanden sein muss, und dass der Korrekturvorgang unter Verwendung des Wörterbuchs oder der Wissensbasis kompliziert ist und lange dauert und eine Belastung für das Gerät darstellt.
  • Die Druckschrift 3rd International Joint Conference on Pattern Recognition, Coronado, CA, USA, 8.-11. November, 1976, New York, NY, USA, IEEE, USA, Seiten 658-662, Shurmann J, "Multifont word recognition system with application to postal address reading" offenbart ein Multifont-Worterkennungssystem, das auf dem Gebiet des Postadressenlesens angewendet wird. Es sind Sätze alternativer Zeichen für einzelne Zeichenbilder vorgesehen. Die unterschiedlichen Sätze sind als jeweilige einzelne Ketten dargestellt.
  • Kurzzusammenfassung der Erfindung
  • Gemäß einer Ausgestaltung der Erfindung ist ein Bilddatenverarbeitungsverfahren gemäß dem Patentanspruch 1 ausgebildet.
  • Gemäß einer weiteren Ausgestaltung der Erfindung ist ein Bilddatenverarbeitungsgerät gemäß dem Patentanspruch 14 ausgebildet.
  • Gemäß einer weiteren Ausgestaltung der Erfindung ist ein computerlesbares Speichermedium nach Patentanspruch 27 ausgebildet.
  • Weitere Ausgestaltungen der Erfindung sind aus den Unteransprüchen ersichtlich.
  • Kurzbeschreibung der Zeichnung
  • Fig. 1 zeigt ein Ablaufdiagramm für einen OCR-Prozess.
  • Fig. 2 zeigt ein Ablaufdiagramm für einen Suchdatei- Ausbildungsprozess für eine Dokumentensuche.
  • Fig. 3 zeigt ein Ablaufdiagramm für einen Dokumentensuchprozess.
  • Fig. 4 zeigt ein schematisches Blockschaltbild eines Informationsverarbeitungsgeräts gemäß einem Ausführungsbeispiel.
  • Fig. 5 zeigt ein Ablaufdiagramm für einen Prozess zur Suche ohne vorherige Ausbildung einer Suchdatei.
  • AUSFÜHRLICHE BESCHREIBUNG DES BEVORZUGTEN AUSFÜHRUNGSBEISPIELS
  • Nachstehend wird ein Ausführungsbeispiel der Erfindung näher beschrieben.
  • Fig. 4 zeigt ein schematisches Blockschaltbild eines Verarbeitungssystems gemäß dem Ausführungsbeispiel.
  • Eine Bildabtasteinrichtung 1 stellt eine Bildeingabeeinrichtung zum optischen Auslesen eines Originalbildes eines als Erkennungsobjekt dienenden Dokuments dar. Ein Verfahren zur Eingabe eines Bildes ist nicht auf dieses Verfahren des optischen Lesens eines Bildes durch die Bildabtasteinrichtung oder dergleichen beschränkt, sondern es ist auch möglich, ein Bild eines handgeschriebenen Zeichens einzugeben, das durch eine Eingabeeinrichtung wie einen Digitalisierer, eine Maus oder dergleichen eingegeben wird, mittels der Koordinaten eingegeben werden können. Eine Tastatur/Maus 5 ist eine Eingabeeinrichtung zur Eingabe verschiedener Befehle oder Anweisungsinformationen durch den Bediener. Ein Suchwort und eine Suchbedingung zum Zeitpunkt des Suchprozesses werden auch durch die Tastatur oder die Maus eingegeben. Eine Anzeige 6 ist eine Anzeigeeinrichtung wie eine Kathodenstrahlröhre (CRT) oder eine Flüssigkristallanzeige zum Anzeigen der von der Tastatur/Maus 5 eingegebenen Informationen, der von der Bildabtasteinrichtung 1 oder dergleichen eingegebenen Informationen, des Fortschritts der Prozesse, und eines Ergebnisses des Prozesses. Ein externer Speicher 4 ist eine Speichereinrichtung zur Speicherung von Bilddaten, Textinformationen und einer von der Bildabtasteinrichtung eingegebenen Suchdatei. Ein Computer 10 führt verschiedene Arten von Informationsverarbeitungen durch die Steuerung einer CPU 10&supmin;¹ durch. Steuerprogramme verschiedener Informationsverarbeitungsarten, wie in den nachstehend beschriebenen Ablaufdiagrammen gezeigt, wurden in einem Speicher 10-2 gespeichert. Die CPU 10-1 führt verschiedene Prozesse aus und steuert diese entsprechend den Steuerprogrammen. Ein Wörterbuch, das für eine Zeichenerkennung verwendet wird, wurde auch in dem Speicher 10-2 gespeichert. Als in dem Speicher 10-2 gespeichertes Steuerprogramm kann auch ein Steuerprogramm, das bei Bedarf durch eine externe Speichereinrichtung oder dergleichen gelesen wird, verwendet werden. Bei dem Ausführungsbeispiel sind ein OCR-Prozessor 2 und eine Dokumentensucheinrichtung 3 zur Ausführung von Hauptprozessen vorgesehen, die durch den Computer 10 ausgeführt werden, und nunmehr wird das Ausführungsbeispiel beschrieben. Ein Verfahren der Zeichenerkennung ist nicht auf den OCR-Prozess beschränkt. Solange ein Zeichen ein handschriftliches Zeichen aus durch einen Digitalisierer, eine Maus oder dergleichen eingegebenen Strichen ist, reicht es aus, eine Verarbeitungseinheit zur Durchführung einer On-Line- Zeichenerkennung vorzusehen, die für ein derartiges Zeichen geeignet ist.
  • Ein Prozess zur Umwandlung der Bilddaten eines durch die Bildabtasteinrichtung 1 oder dergleichen eingegebenen ursprünglichen bzw. originalen Bildes in Textinformationen ist in einem Ablaufdiagramm in Fig. 1 gezeigt und wird nachstehend beschrieben.
  • Die in dem externen Speicher 4 gespeicherten und durch die Bildabtasteinrichtung oder dergleichen eingegebenen Bilddaten werden in den OCR-Prozessor 2 eingegeben (S1) Dann wird überprüft, ob Zeichendaten in den eingegebenen Bilddaten vorhanden sind oder nicht (S2). Ist die Antwort JA, werden die Bilddaten eines Zeichens extrahiert (S3). Das extrahierte Zeichen wird mit dem Wörterbuch verglichen, wodurch eine Vielzahl von Zeichenkodes als Erkennungsergebnisse und eine Wahrscheinlichkeit LH als Ähnlichkeit mit den Wörterbuchdaten erhalten wird, die durch jeden Zeichenkode angezeigt wird (S4). Unter den als Erkennungsergebnisse in S4 erhaltenen Zeichenkodes wird die maximale Wahrscheinlichkeit LHMAx mit einem vorbestimmten, in dem Speicher 10-2 gespeicherten Signifikanz- Wahrscheinlichkeitsbeurteilungs-Schwellenwert Th1 verglichen (S5). Ist die Wahrscheinlichkeit größer oder gleich Th1, wird geurteilt, dass das Erkennungsergebnis richtig ist, und ein derartiger Zeichenkode unter der Vielzahl der Zeichenkodes wird als Erkennungsergebnis ausgegeben (S6). Ist die Wahrscheinlichkeit kleiner als Th1 in S5, wird zur Speicherung einer Vielzahl von Erkennungsergebnissen für die Bilddaten eines Zeichenkodes eine Begrenzung als (nachstehend als ID bezeichnete) Identifizierungsinformationen ausgegeben (S7). In S8 schreitet die Verarbeitungsroutine zu Schritt S9 oder S11 entsprechend einem durch den Bediener bestimmten Modus oder einem durch das System oder die in S4 erhaltene Wahrscheinlichkeit eingestellten Modus vor. In S9 wird unter der Vielzahl der in Schritt S9 erhaltenen Wahrscheinlichkeiten ein Zeichenkode, der einer Wahrscheinlichkeit entspricht, die größer als ein vorbestimmter, in dem Speicher 10-2 gespeicherter niedriger Erkennungs-Wahrscheinlichkeitsbeurteilungs-Schwellenwert Th2 ist, als Ergebnis entsprechend den Bilddaten eines Zeichenkodes ausgegeben. In S11 werden unter der Vielzahl der in S4 erhaltenen Zeichenkodes die Zeichenkodes der Anzahl Nmax maximaler Erkennungskandidaten aufeinanderfolgend in der Reihenfolge vom Zeichenkode mit der größten Wahrscheinlichkeit an als Ergebnis entsprechend den Bilddaten eines Zeichenkodes ausgegeben. Wurde das den Bilddaten eines Zeichenkodes entsprechende Ergebnis ausgegeben, wird eine Begrenzung als ID-Informationen ausgegeben, die das Ende des Ergebnisses der Zeichen anzeigen (S10).
  • Sind die Erkennung der Bilddaten eines Zeichenkodes und die Ausgabe des Ergebnisses beendet, werden die Prozesse der Schritte S3 bis S11 wiederholt, während die als Objekt dienenden Bilddaten solange aktualisiert werden, bis in S2 festgestellt wird, dass keine Zeichendaten mehr enthalten sind.
  • Diese in den Schritten S6 bis S11 ausgegebenen Kodeinformationen werden sequentiell als Textinformationen in dem externen Speicher 4 gespeichert.
  • Durch diese Prozesse kann eine Situation vermieden werden, dass die Erkennungsergebnisse auf eins in dem Fall eingeengt werden, dass eine OCR- Erkennungswahrscheinlichkeit niedrig ist und auf die Erkennung kein Verlass ist, eine Vielzahl optimaler, den Erkennungswahrscheinlichkeiten entsprechenden Erkennungskandidaten können ausgewählt werden, und die wirksamen Erkennungskandidateninformationen können effektiv gespeichert und ohne Verwerfen verwendet werden. Ein Suchdateiausbildungsprozess im Fall des Befehls zur Ausbildung einer Suchdatei derart, dass die durch die vorstehend beschriebenen Prozesse gespeicherten Textinformationen für eine nachfolgende Suche verwendet werden können, ist im Ablaufdiagramm in Fig. 2 gezeigt und wird nachstehend beschrieben.
  • Im Fall des Befehls zur Ausbildung der Suchdatei für die in dem externen Speicher 4 gespeicherten Textinformationen wird ein Typ eines Zeichenschlüssels für einen Index bestimmt (S21), wenn die bestimmten Textdaten in der Suchdatei registriert werden. Die bestimmten Textinformationen werden aus dem externen Speicher 4 in die Dokumentensucheinrichtung 3 geladen (S22). Daten eines Zeichenkodes werden aus den geladenen Textinformationen ausgelesen (S24). Wird festgestellt, dass der Zeichenkode eine Begrenzung darstellt (S25), wird eine Vielzahl von Kandidaten bis zur nächsten Begrenzung mit der bisherigen Zeichenkette kombiniert, wodurch eine Vielzahl von Zeichenschlüsseln entwickelt werden. Wird festgestellt, dass der Zeichenkode keine Begrenzung im Schritt S25 darstellt, wird dieser eine Zeichenkode zu der Zeichenkette des Zeichenschlüssels an ihrem Ende hinzugefügt (S27). Die Prozesse in S25 bis S27 werden solange wiederholt, bis die Vollständigkeit des Zeichenschlüssels in S28 festgestellt wird.
  • Wird in S28 festgestellt, dass der Zeichenschlüssel vollständig ist, wird der ausgebildete Zeichenschlüssel (einer oder viele) zu den Indexinformationen in der Suchdatei in dem externen Speicher 4 hinzugefügt (S29).
  • Die Prozesse in S24 bis S29 werden solange wiederholt, bis alle Zeichendaten in S23 verarbeitet sind, wodurch die Ausbildung der Suchdatei der geladenen Textinformationen abgeschlossen ist.
  • Durch diese Prozesse werden eine Vielzahl von Erkennungskandidatenzeichen mit Zeichen vor und nach diesen Zeichen aus den durch Erkennung des eingegebenen Bildes erhaltenen Textinformationen kombiniert und die Zeichenkette wird entsprechend der Art des Zeichenschlüssels des zu verwendenden Index entwickelt, wodurch vorab ein Index ausgebildet wird. Dadurch wird das Fehlschlagen der Suche aufgrund der Fehlererkennung verringert.
  • Ein Suchprozess, der unter Verwendung der wie vorstehend beschrieben ausgebildeten Suchdatei ausgeführt wird, ist in dem Ablaufdiagramm in Fig. 3 gezeigt und wird nachstehend beschrieben.
  • Ein Suchwort wird entsprechend einem Befehl des Suchprozesses eingegeben (S31). Das eingegebene Suchwort wird als Suchschlüssel bzw. Suchkode analysiert, der für den Suchprozess geeignet ist (S32). Der Suchkode wird mit der Suchdatei in dem externen Speicher 4 verglichen (S33). Wird ein Index, der mit dem Suchkode übereinstimmt, gefunden, werden diesem Index entsprechende Dokumentenadressinformationen zur Anwendungsseite zurückgegeben (S34).
  • Die durch die Dokumentenadressinformationen bestimmten und in dem externen Speicher 4 gespeicherten Bilddaten werden als Suchergebnis auf der Anzeige 6 angezeigt.
  • Ein Ablaufdiagramm in Fig. 5 zeigt Prozesse, bei denen Zeichen mit den Zeichen vor und nach der Erkennungskandidaten-Zeichengruppe aus den Textinformationen kombiniert werden und jedes Mal dann entwickelt werden, wenn der Suchprozess befohlen wird, wodurch ein Vergleich mit dem eingegebenen Suchwort ohne das vorherige Ausbilden der Suchdatei bewirkt wird.
  • Im Fall des Befehls der Ausbildung der Suchdatei für die in dem externen Speicher 4 gespeicherten Textinformationen wird die Art des Zeichenkodes für den Index, wenn die instruierten Textdaten in der Suchdatei registriert werden, bestimmt (S41), und ein Suchwort wird eingegeben (S42). Das eingegebene Suchwort wird als Suchschlüssel bzw. Suchkode analysiert, der für den Suchprozess geeignet ist (S43). Die instruierten Textinformationen werden in die Dokumentensucheinrichtung 3 aus dem externen Speicher 4 geladen (S44). Daten eines Zeichens werden aus den geladenen Textinformationen ausgelesen (S46). Wird festgestellt, dass der Zeichenschlüssel die Begrenzung anzeigt (S47), werden eine Vielzahl von Kandidaten bis zur nächsten Begrenzung und die bisherige Zeichenkette kombiniert, wodurch eine Vielzahl von Zeichenschlüsseln entwickelt wird. Wird in S47 festgestellt, dass keine Begrenzung enthalten ist, wird dieses eine Zeichen zu der Zeichenkette des Zeichenschlüssel an seinem Ende hinzugefügt (S49). Die Prozesse von S47 bis S49 werden solange wiederholt, bis festgestellt wird, dass der Zeichenschlüssel vollständig ist (S50).
  • Wird in S50 festgestellt, dass der Zeichenschlüssel vollständig ist, werden der ausgebildete Zeichenschlüssel (ein einzelner oder viele) und der in S43 erhaltene Suchkode verglichen (S51). Sind sie identisch (S52), wird eine Dokumentenadresse, an der die Bilddaten des Dokuments gespeichert sind, als Suchergebnis ausgegeben (S53).
  • Für die Datenbank wird eine Vielzahl von Einträgen bzw. Datensätzen auch durch Prozesse wie die vorstehend beschriebenen Prozesse ausgebildet, sodass eine Suche mit geringem Verlust unter Verwendung der Datenbank möglich ist.
  • Nachstehend wird ein bestimmtes Beispiel beschrieben.
  • Es wird angenommen, dass ein Satz wie "DATA" in einem Dokument enthalten ist.
  • Es wird angenommen, dass bei der Eingabe dieses Satzes durch die Bildabtasteinrichtung 1 und bei der Erkennung von "T" in einem Anfangserkennungsschritt S4 durch den OCR- Prozessor 2 die Erkennungswahrscheinlichkeit für dieses Zeichen geringer als Th1 trotz der Tatsache ist, dass die Erkennungswahrscheinlichkeiten der anderen Zeichen größer oder gleich Th1 sind. Es wird weiter angenommen, dass die Erkennungskandidaten ähnliche Wahrscheinlichkeiten kleiner als Th2 haben. Infolgedessen wird der Prozess S11 in S8 ausgewählt und Nmax Kandidaten werden aufeinanderfolgend entsprechend der Reihenfolge ab dem Kandidaten mit der größten Wahrscheinlichkeit ausgegeben.
  • Es wird angenommen, dass vier Kandidaten I, T, Y und J aufeinanderfolgend ausgegeben werden.
  • Der OCR-Prozessor 2 beschreibt die vorstehend angeführte Vielzahl der Kandidatenzeichen in dem folgenden Format. Bei diesem Beispiel wird mit der in S7 und S10 auszugebenden Begrenzung "*" das folgende Format erhalten.
  • * [Anzahl der Kandidaten] [Kandidatenzeichen 1]
  • [Kandidatenzeichen 2] [Kandidatenzeichen 3]
  • ...*
  • Daher werden die vorstehend beschriebenen vier Kandidaten in Übereinstimmung mit T bei diesem Beispiel ausgegeben, und es in S5 wird festgestellt, dass die Wahrscheinlichkeiten der anderen Zeichen größer als Th1 sind. Ein Ausdruck für "DATA" in dem Fall, dass ein Zeichen der größten Wahrscheinlichkeit als Kandidatenzeichen in S6 ausgegeben wird, ergibt sich wie folgt.
  • "DA*4ITYJ*A"
  • Eine derartige Zeichenkodegruppe wird als Textinformationen in dem externen Speicher 4 gespeichert.
  • Andererseits interpretiert die Dokumentensucheinrichtung 3 das Format und bildet eine Suchdatei entsprechend dem Ablaufdiagramm in Fig. 2.
  • DAIA
  • DATA
  • DAYA
  • DAJA
  • Wird daher das Suchwort wie "DATA" über die Tastatur eingegeben und führt die Dokumentensucheinrichtung 3 den Dokumentensuchprozess entsprechend diesem Suchwort aus, kann das Dokument auch gefunden werden.
  • Obwohl bei dem Ausführungsbeispiel das Beispiel zur Verwendung bei der Dokumentensuche beschrieben wurde, kann die Erfindung auch bei der Suche unter Verwendung einer Datenbank angewendet werden.
  • Die Erfindung kann auch bei der Extraktion eines Dokumentenschlüsselworts, eines Seitenschlüsselworts oder dergleichen durch die OCR angewendet werden.
  • Des Weiteren kann die Erfindung auch durch ein ähnliches Verfahren für den Fall angewendet werden, dass die Erkennungswahrscheinlichkeit von Teilinformationen eines optischen Lesegeräts durch eine OMR oder Strichkodes gering ist.
  • Erfindungsgemäß kann eine Situation vermieden werden, dass in dem Fall, wenn die OCR-Erkennungswahrscheinlichkeit niedrig ist und nicht festgestellt werden kann, dass das Ergebnis sicher ist, die Erkennungskandidaten auf einen eingeengt werden, eine Vielzahl optimaler Erkennungskandidaten, die der Erkennungswahrscheinlichkeit entsprechen, werden ausgewählt, und die effektiven Erkennungskandidateninformationen können gespeichert und ohne Verwerfen effektiv verwendet werden.
  • Wie vorstehend beschrieben wird erfindungsgemäß der manuelle Korrekturvorgang des Erkennungsergebnisses beseitigt, die Prozesse von der Bildeingabe bis zur Speicherung der Bilddaten und Textdaten über die OCR können ohne Einflussnahme durch den Bediener durchgeführt werden, eine Verarbeitungsbelastung des Geräts kann verringert werden, die Verarbeitungsgeschwindigkeit kann erhöht werden, und ein kostengünstiges Gerät kann bereitgestellt werden.
  • Wie vorstehend beschrieben werden erfindungsgemäß in dem Fall, dass es eine Vielzahl von Erkennungskandidaten für ein eingegebenes Bild eines Zeichens gibt, Zeichen mit den Zeichen vor und nach diesen Zeichen kombiniert, und sie können entwickelt werden und eine Vielzahl von Indizes können ausgebildet werden, sodass das Fehlschlagen der Suche aufgrund der falschen Erkennung verringert werden kann.

Claims (28)

1. Bliddatenverarbeitungsverfahren mit den Schritten
Eingeben von Zeichenbilddaten enthaltenden Daten,
Extrahieren eines Zeichenbildes aus den eingegebenen Bilddaten und
Bestimmen einer Vielzahl von Zeichencodes als wahrscheinliche Kandidaten für das extrahierte Zeichenbild,
gekennzeichnet durch den Schritt
Erzeugen einer linearen Kette von Zeichencodes mit der Vielzahl von Kandidatenzeichencodes und einem Zeichencode für ein Zeichenbild, das an das extrahierte Zeichenbild angrenzt.
2. Verfahren nach Anspruch 1, wobei es eine Vielzahl von Zeichenbildern gibt, die an das extrahierte Zeichenbild angrenzen, und die erzeugte lineare Kette der Zeichencodes einen Zeichencode für jedes angrenzende Zeichenbild aufweist.
3. Verfahren nach Anspruch 1 oder 2, ferner mit dem Schritt Speichern der erzeugten linearen Kette der Zeichen zur Verwendung in einem Suchprozess, der für die eingegebenen Bilddaten auszuführen ist.
4. Verfahren nach einem der vorhergehenden Ansprüche, wobei die Vielzahl der Kandidatenzeichencodes entsprechend einem Ergebnis bestimmt wird, das durch den Vergleich von Wahrscheinlichkeiten jeweiliger Zeichencodes mit einem Schwellenwert erhalten wird.
5. Verfahren nach einem der vorhergehenden Ansprüche, ferner mit dem Schritt Erzeugen von Informationen bezüglich der Anzahl der Zeichencodes in der Vielzahl der Kandidatenzeichencodes.
6. Verfahren nach einem der vorhergehenden Ansprüche, wobei die Vielzahl der Kandidatenzeichencodes in der linearen Kette der Zeichencodes durch ID-Informationen unterschieden wird, die dem extrahierten Zeichenbild entsprechende Informationen identifizieren können.
7. Verfahren nach einem der vorhergehenden Ansprüche, ferner mit den Schritten
Kombinieren jedes der Vielzahl der Kandidatenzeichencodes mit dem Zeichencode der an das extrahierte Zeichenbild angrenzenden Zeichenbilder zur Ausbildung jeweiliger Kandidatenworte,
Vergleichen der jeweiligen Kandidatenworte mit einem bestimmten Suchwort und
Identifizieren der eingegebenen Bilddaten, die dem jeweiligen Kandidatenwort entsprechen, das dem bestimmten Suchwort entspricht.
8. Verfahren nach einem der vorhergehenden Ansprüche, wobei die eingegebenen Bilddaten durch eine Abtasteinrichtung eingegeben werden.
9. Verfahren nach einem der Ansprüche 1 bis 7, wobei die eingegebenen Bilddaten durch ein Koordinateneingabegerät eingegeben werden.
10. Verfahren nach Anspruch 7, wobei die identifizierten eingegebenen Bilddaten durch einen Drucker ausgegeben werden.
11. Verfahren nach Anspruch 7 oder 10, wobei die identifizierten eingegebenen Bilddaten durch eine Anzeigeeinrichtung ausgegeben werden.
12. Verfahren nach einem der vorhergehenden Ansprüche, wobei die Vielzahl der Zeichencodes als wahrscheinliche Kandidaten durch ein optisches Zeichenerkennungsverfahren bestimmt wird.
13. Verfahren nach einem der Ansprüche 1 bis 11, wobei die Vielzahl der Zeichencodes als wahrscheinliche Kandidaten durch ein Ein-Zeilen-Zeichenerkennungsverfahren bestimmt wird.
14. Bilddatenverarbeitungsgerät mit
einer Eingabeeinrichtung (1) zur Eingabe von Zeichenbilddaten enthaltenden Bilddaten,
einer Extrahiereinrichtung zur Extraktion eines Zeichenbildes aus den eingegebenen Bilddaten und einer Bestimmungseinrichtung zur Bestimmung einer Vielzahl von Zeichencodes als wahrscheinliche Kandidaten für das extrahierte Zeichenbild,
gekennzeichnet durch
eine Erzeugungseinrichtung zur Erzeugung einer linearen Kette von Zeichencodes mit der Vielzahl der Kandidatenzeichencodes und einem Zeichencode für ein Zeichenbild, das an das extrahierte Zeichen angrenzt.
15. Gerät nach Anspruch 14, wobei die Erzeugungseinrichtung eine lineare Kette von Zeichencodes mit der Vielzahl der Kandidatenzeichencodes und einem Zeichencode für jedes der Vielzahl der Zeichenbilder erzeugt, die an das extrahierte Zeichenbild angrenzen.
16. Gerät nach Anspruch 14 oder 15, ferner mit einer Speichereinrichtung (4) zur Speicherung der erzeugten linearen Kette von Zeichen zur Verwendung in einem Suchprozess, der für die eingegebenen Bilddaten auszuführen ist.
17. Gerät nach einem der Ansprüche 14 bis 16, wobei die Bestimmungseinrichtung die Vielzahl der Kandidatenzeichencodes entsprechend einem Ergebnis bestimmt, das durch den Vergleich der Wahrscheinlichkeiten jeweiliger Zeichencodes mit Schwellenwerten erhalten wird.
18. Gerät nach einem der Ansprüche 14 bis 17, ferner mit einer Einrichtung zur Erzeugung von Informationen bezüglich der Anzahl der Zeichencodes in der Vielzahl der Kandidatenzeichencodes.
19. Gerät nach einem der Ansprüche 14 bis 18, ferner mit einer Einrichtung zur Unterscheidung der Vielzahl der Kandidatenzeichencodes in der linearen Kette der Zeichencodes durch ID-Informationen, die dem extrahierten Zeichenbild entsprechende Informationen identifizieren können.
20. Gerät nach einem der Ansprüche 14 bis 19, ferner mit
einer Einrichtung zur Kombination jedes der Vielzahl der Kandidatenzeichencodes mit den Zeichencodes der an das extrahierte Zeichenbild angrenzenden Zeichenbilder zur Ausbildung jeweiliger Kandidatenworte,
einer Einrichtung zum Vergleich der jeweiligen Kandidatenworte mit einem bestimmten Suchwort, und
einer Einrichtung zur Identifizierung der eingegebenen Bilddaten, die dem jeweiligen Kandidatenwort entsprechen, das dem bestimmten Suchwort entspricht.
21. Gerät nach einem der Ansprüche 14 bis 20, ferner mit einer Abtasteinrichtung (1) zur Eingabe der Bilddaten.
22. Gerät nach einem der Ansprüche 14 bis 20, ferner mit einer Koordinateneingabeeinrichtung zur Eingabe der Bilddaten.
23. Gerät nach einem der Ansprüche 14 bis 22, ferner mit einem Drucker zur Ausgabe der identifizierten eingegebenen Bildinformationen.
24. Gerät nach einem der Ansprüche 14 bis 23, mit einer Anzeigeeinrichtung (6) zur Ausgabe der identifizierten eingegebenen Bildinformationen.
25. Gerät nach einem der Ansprüche 14 bis 24, ferner mit einer optischen Zeichenerkennungseinrichtung (2) zur Bestimmung der Vielzahl der Zeichencodes.
26. Gerät nach einem der Ansprüche 14 bis 24, ferner mit einer Ein-Zeilen-Zeichenerkennungseinrichtung zur Bestimmung der Vielzahl der Zeichencodes.
27. Computerlesbarer Speicherträger, der von einem Computer ausführbare Verarbeitungsschritte zur Verarbeitung von Bilddaten speichert, wobei die Schritte umfassen
einen Eingabeschritt zur Eingabe von Zeichenbilddaten enthaltenden Bilddaten,
einen Extrahierschritt zur Extraktion eines Zeichenbildes aus den eingegebenen Bilddaten und einen Bestimmungsschritt zur Bestimmung einer Vielzahl von Zeichencodes als wahrscheinliche Kandidaten für das extrahierte Zeichenbild,
gekennzeichnet durch
einen Erzeugungsschritt zur Erzeugung einer linearen Kette von Zeichencodes mit der Vielzahl der Kandidatenzeichencodes und einem Zeichencode für ein an das extrahierte Zeichenbild angrenzendes Zeichenbild.
28. Computerlesbarer Speicherträger nach Anspruch 27, ferner mit einem Speicherschritt zur Speicherung der erzeugten linearen Kette der Zeichen zur Verwendung in einem Suchprozess, der für die eingegebenen Bilddaten auszuführen ist.
DE69519256T 1994-06-16 1995-06-14 Verfahrenund Gerät zur Informationsverarbeitung und rechnerlesbares Speichermedium Expired - Lifetime DE69519256T2 (de)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP6134194A JPH087033A (ja) 1994-06-16 1994-06-16 情報処理方法及び装置

Publications (2)

Publication Number Publication Date
DE69519256D1 DE69519256D1 (de) 2000-12-07
DE69519256T2 true DE69519256T2 (de) 2001-04-05

Family

ID=15122638

Family Applications (1)

Application Number Title Priority Date Filing Date
DE69519256T Expired - Lifetime DE69519256T2 (de) 1994-06-16 1995-06-14 Verfahrenund Gerät zur Informationsverarbeitung und rechnerlesbares Speichermedium

Country Status (5)

Country Link
US (1) US5905811A (de)
EP (1) EP0687991B1 (de)
JP (1) JPH087033A (de)
CN (1) CN1106620C (de)
DE (1) DE69519256T2 (de)

Families Citing this family (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3566478B2 (ja) * 1996-12-27 2004-09-15 キヤノン株式会社 文書セキュリティ管理システム、文書セキュリティ管理方法および文書検索装置
US6678683B1 (en) 1996-12-27 2004-01-13 Canon Kabushiki Kaisha Document management system using an access-limited character train and password, and a method and computer-readable medium therefor
US6327387B1 (en) * 1996-12-27 2001-12-04 Fujitsu Limited Apparatus and method for extracting management information from image
US6269188B1 (en) * 1998-03-12 2001-07-31 Canon Kabushiki Kaisha Word grouping accuracy value generation
US6243501B1 (en) 1998-05-20 2001-06-05 Canon Kabushiki Kaisha Adaptive recognition of documents using layout attributes
JP4421134B2 (ja) * 2001-04-18 2010-02-24 富士通株式会社 文書画像検索装置
JP4125273B2 (ja) * 2004-08-24 2008-07-30 キヤノン株式会社 画像処理装置及びその方法、プログラム
JP4561474B2 (ja) * 2005-05-24 2010-10-13 株式会社日立製作所 電子化文書保管システム
CN100356392C (zh) * 2005-08-18 2007-12-19 北大方正集团有限公司 一种字符识别的后处理方法
US8155444B2 (en) * 2007-01-15 2012-04-10 Microsoft Corporation Image text to character information conversion
JP2010146185A (ja) * 2008-12-17 2010-07-01 Sharp Corp 画像処理装置、画像読取装置、画像送信装置、画像処理方法、プログラムおよびその記録媒体
US8280196B2 (en) * 2009-05-12 2012-10-02 Canon Kabushiki Kaisha Image retrieval apparatus, control method for the same, and storage medium
JP5230525B2 (ja) * 2009-05-25 2013-07-10 キヤノン株式会社 画像検索装置およびその方法
JP5507962B2 (ja) * 2009-11-05 2014-05-28 キヤノン株式会社 情報処理装置及びその制御方法、プログラム
CN101788849B (zh) * 2009-12-31 2011-11-16 优视科技有限公司 一种用于移动通讯设备系统的光学字符识别输入方法
JP5820236B2 (ja) 2011-10-28 2015-11-24 キヤノン株式会社 画像処理装置及びその制御方法
CN103697838A (zh) * 2013-12-24 2014-04-02 天津森宇科技发展有限公司 一种基于机器视觉技术的贴片件pin针平整度检测设备
JP7017027B2 (ja) 2017-03-17 2022-02-08 富士フイルムビジネスイノベーション株式会社 検索装置、検索プログラム、および検索システム

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4930077A (en) * 1987-04-06 1990-05-29 Fan David P Information processing expert system for text analysis and predicting public opinion based information available to the public
EP0381773B1 (de) * 1988-07-20 1998-06-10 Fujitsu Limited Buchstabenerkennungsvorrichtung
US5265174A (en) * 1989-03-03 1993-11-23 Canon Kabushiki Kaisha Pattern recognition apparatus
US5261112A (en) * 1989-09-08 1993-11-09 Casio Computer Co., Ltd. Spelling check apparatus including simple and quick similar word retrieval operation
US5134669A (en) * 1990-06-13 1992-07-28 National Computer Systems Image processing system for documentary data
US5369577A (en) * 1991-02-01 1994-11-29 Wang Laboratories, Inc. Text searching system
US5237627A (en) * 1991-06-27 1993-08-17 Hewlett-Packard Company Noise tolerant optical character recognition system
US5703962A (en) * 1991-08-29 1997-12-30 Canon Kabushiki Kaisha Image processing method and apparatus
JP3190074B2 (ja) * 1991-09-11 2001-07-16 株式会社東芝 手書き入力装置
US5315668A (en) * 1991-11-27 1994-05-24 The United States Of America As Represented By The Secretary Of The Air Force Offline text recognition without intraword character segmentation based on two-dimensional low frequency discrete Fourier transforms
DE69328640T2 (de) * 1992-02-07 2000-09-28 Canon K.K., Tokio/Tokyo Verfahren und Einrichtung zur Mustererkennung
US5454046A (en) * 1993-09-17 1995-09-26 Penkey Corporation Universal symbolic handwriting recognition system
US5524066A (en) * 1994-03-31 1996-06-04 Xerox Corporation Text recognition by predictive composed shapes

Also Published As

Publication number Publication date
US5905811A (en) 1999-05-18
EP0687991A2 (de) 1995-12-20
EP0687991A3 (de) 1996-01-03
DE69519256D1 (de) 2000-12-07
CN1106620C (zh) 2003-04-23
EP0687991B1 (de) 2000-11-02
CN1121605A (zh) 1996-05-01
JPH087033A (ja) 1996-01-12

Similar Documents

Publication Publication Date Title
DE69519256T2 (de) Verfahrenund Gerät zur Informationsverarbeitung und rechnerlesbares Speichermedium
DE69637025T2 (de) Informationsverarbeitungsverfahren und -vorrichtung zum Suchen von Bild- oder Textinformation
EP1665132B1 (de) Verfahren und system zum erfassen von daten aus mehreren maschinell lesbaren dokumenten
DE69428590T2 (de) Auf kombiniertem lexikon und zeichenreihenwahrscheinlichkeit basierte handschrifterkennung
DE69517564T2 (de) Verfahren und Gerät zur Erzeugung einer hybriden Datenstruktur zur Anzeige eines Rasterbildes
DE69428621T2 (de) Anlage und Verfahren zur Steigerung der Zeichenerkennungsgenauigkeit durch anpassungsfähige Wahrscheinlichkeitsgewichtung
DE69302003T2 (de) Dateneingabeanlage
DE69033042T2 (de) Datenverarbeitung
DE69730930T2 (de) Verfahren und Gerät zur Zeichenerkennung
DE69029251T2 (de) System zur Ueberprüfung von Dokumenten, zur Verwendung mit einem Lese- und Uebersetzungssystem
DE69616153T2 (de) Verfahren und System zur automatischen Korrektur von Transkriptionen
DE69610243T2 (de) Verfahren zum Trainieren einer Erkennungsanlage mit Zeichenmustern
DE69230632T2 (de) Optische Worterkennung durch Wortgestaltuntersuchung
DE69610478T2 (de) Zeichenerkennungssystembestimmung von abgetasteten und "echtzeit"-handgeschriebenen zeichen
DE3782447T2 (de) Dokumentverarbeitungsapparat.
DE3926327C2 (de) Verfahren und System zum Erkennen von Zeichen auf einem Medium
DE102011079443A1 (de) Lerngewichtungen von Schriftarten für getippte Proben bei der Handschriftenschlüsselwortauffindung
DE2640537A1 (de) Verfahren und vorrichtung zum unterscheiden zwischen n groesser als 2 alphabeten angehoerenden zeichen
DE3425449A1 (de) Verfahren und vorrichtung zur alphanumerischen handschriftenerkennung
EP1671262B1 (de) Verfahren und system zum erfassen von daten aus maschinell lesbaren dokumenten
DE4119091C2 (de) Verfahren zum Erkennen von Zeichen, insbesondere Schriftzeichen und Einrichtung zur Durchführung des Verfahrens
DE69610520T2 (de) Handgeschriebene Daten und Befehlgesteneingabemethode und Gerät
DE2435889B2 (de) Verfahren und einrichtung zur unterscheidung von zeichengruppen
CN113255583A (zh) 数据标注方法、装置、计算机设备和存储介质
DE60123730T2 (de) Gerät und Verfahren zur Bestimmung des Formats von Dokumenten

Legal Events

Date Code Title Description
8364 No opposition during term of opposition