DE69519256T2 - Verfahrenund Gerät zur Informationsverarbeitung und rechnerlesbares Speichermedium - Google Patents
Verfahrenund Gerät zur Informationsverarbeitung und rechnerlesbares SpeichermediumInfo
- Publication number
- DE69519256T2 DE69519256T2 DE69519256T DE69519256T DE69519256T2 DE 69519256 T2 DE69519256 T2 DE 69519256T2 DE 69519256 T DE69519256 T DE 69519256T DE 69519256 T DE69519256 T DE 69519256T DE 69519256 T2 DE69519256 T2 DE 69519256T2
- Authority
- DE
- Germany
- Prior art keywords
- character
- image data
- character codes
- codes
- candidate
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
- 238000000034 method Methods 0.000 title claims description 59
- 230000010365 information processing Effects 0.000 title description 4
- 238000012015 optical character recognition Methods 0.000 claims description 14
- 238000000605 extraction Methods 0.000 claims description 2
- 230000015572 biosynthetic process Effects 0.000 description 3
- 238000010586 diagram Methods 0.000 description 2
- 238000003672 processing method Methods 0.000 description 2
- 230000002411 adverse Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000003909 pattern recognition Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/26—Techniques for post-processing, e.g. correcting the recognition result
- G06V30/262—Techniques for post-processing, e.g. correcting the recognition result using context analysis, e.g. lexical, syntactic or semantic context
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Character Discrimination (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
- Die Erfindung bezieht sich auf ein Bilddatenverarbeitungsverfahren, ein Bilddatenverarbeitungsgerät und ein computerlesbares Speichermedium zur Speicherung von einem Computer ausführbarer Verarbeitungsschritte zur Verarbeitung von Bilddaten, wobei die Bilddaten Zeichenbilddaten enthalten.
- Bei der Erkennung eines eingegebenen Bildes durch eine optische Zeichenerkennung (OCR) oder dergleichen und der Umwandlung des Bildes in einen Text wurde bezüglich eines eingegebenen Zeichens, bei dem lediglich ein Kandidatenzeichen mit geringer Ähnlichkeit erhalten wurde, bisher als Gegenmaßnahme einer fehlerhaften Erkennung die Tatsache, dass die Ähnlichkeit niedrig ist, dem Bediener mitgeteilt, und er beurteilt, ob das Kandidatenwort richtig oder falsch ist. Ist es falsch, muss der Bediener das falsche Zeichen manuell korrigieren und ein richtiges Zeichen eingeben.
- Bei diesem Verfahren muss der Bediener allerdings nicht nur ein in einen Text zu konvertierendes Bild eingeben, sondern auch den Korrekturvorgang vornehmen, woraus sich eine nachteilige Belastung des Bedieners ergibt.
- Es gibt auch ein Verfahren, bei dem nicht nur ein Ergebnis der Zeichenerkennung ausgegeben wird, sondern auch ein durch die Zeichenerkennung erhaltenes Kandidatenzeichen mit einem Wörterbuch oder einer Wissensbasis verglichen wird, wodurch ein fehlerhaft erkanntes Zeichen ohne die Hilfe des Bedieners korrigiert wird.
- Mit den vorstehend angeführten Verfahren sind allerdings Nachteile verbunden, dass das Wörterbuch oder die Wissensbasis für den Korrekturvorgang in einem Speicher vorhanden sein muss, und dass der Korrekturvorgang unter Verwendung des Wörterbuchs oder der Wissensbasis kompliziert ist und lange dauert und eine Belastung für das Gerät darstellt.
- Die Druckschrift 3rd International Joint Conference on Pattern Recognition, Coronado, CA, USA, 8.-11. November, 1976, New York, NY, USA, IEEE, USA, Seiten 658-662, Shurmann J, "Multifont word recognition system with application to postal address reading" offenbart ein Multifont-Worterkennungssystem, das auf dem Gebiet des Postadressenlesens angewendet wird. Es sind Sätze alternativer Zeichen für einzelne Zeichenbilder vorgesehen. Die unterschiedlichen Sätze sind als jeweilige einzelne Ketten dargestellt.
- Gemäß einer Ausgestaltung der Erfindung ist ein Bilddatenverarbeitungsverfahren gemäß dem Patentanspruch 1 ausgebildet.
- Gemäß einer weiteren Ausgestaltung der Erfindung ist ein Bilddatenverarbeitungsgerät gemäß dem Patentanspruch 14 ausgebildet.
- Gemäß einer weiteren Ausgestaltung der Erfindung ist ein computerlesbares Speichermedium nach Patentanspruch 27 ausgebildet.
- Weitere Ausgestaltungen der Erfindung sind aus den Unteransprüchen ersichtlich.
- Fig. 1 zeigt ein Ablaufdiagramm für einen OCR-Prozess.
- Fig. 2 zeigt ein Ablaufdiagramm für einen Suchdatei- Ausbildungsprozess für eine Dokumentensuche.
- Fig. 3 zeigt ein Ablaufdiagramm für einen Dokumentensuchprozess.
- Fig. 4 zeigt ein schematisches Blockschaltbild eines Informationsverarbeitungsgeräts gemäß einem Ausführungsbeispiel.
- Fig. 5 zeigt ein Ablaufdiagramm für einen Prozess zur Suche ohne vorherige Ausbildung einer Suchdatei.
- Nachstehend wird ein Ausführungsbeispiel der Erfindung näher beschrieben.
- Fig. 4 zeigt ein schematisches Blockschaltbild eines Verarbeitungssystems gemäß dem Ausführungsbeispiel.
- Eine Bildabtasteinrichtung 1 stellt eine Bildeingabeeinrichtung zum optischen Auslesen eines Originalbildes eines als Erkennungsobjekt dienenden Dokuments dar. Ein Verfahren zur Eingabe eines Bildes ist nicht auf dieses Verfahren des optischen Lesens eines Bildes durch die Bildabtasteinrichtung oder dergleichen beschränkt, sondern es ist auch möglich, ein Bild eines handgeschriebenen Zeichens einzugeben, das durch eine Eingabeeinrichtung wie einen Digitalisierer, eine Maus oder dergleichen eingegeben wird, mittels der Koordinaten eingegeben werden können. Eine Tastatur/Maus 5 ist eine Eingabeeinrichtung zur Eingabe verschiedener Befehle oder Anweisungsinformationen durch den Bediener. Ein Suchwort und eine Suchbedingung zum Zeitpunkt des Suchprozesses werden auch durch die Tastatur oder die Maus eingegeben. Eine Anzeige 6 ist eine Anzeigeeinrichtung wie eine Kathodenstrahlröhre (CRT) oder eine Flüssigkristallanzeige zum Anzeigen der von der Tastatur/Maus 5 eingegebenen Informationen, der von der Bildabtasteinrichtung 1 oder dergleichen eingegebenen Informationen, des Fortschritts der Prozesse, und eines Ergebnisses des Prozesses. Ein externer Speicher 4 ist eine Speichereinrichtung zur Speicherung von Bilddaten, Textinformationen und einer von der Bildabtasteinrichtung eingegebenen Suchdatei. Ein Computer 10 führt verschiedene Arten von Informationsverarbeitungen durch die Steuerung einer CPU 10&supmin;¹ durch. Steuerprogramme verschiedener Informationsverarbeitungsarten, wie in den nachstehend beschriebenen Ablaufdiagrammen gezeigt, wurden in einem Speicher 10-2 gespeichert. Die CPU 10-1 führt verschiedene Prozesse aus und steuert diese entsprechend den Steuerprogrammen. Ein Wörterbuch, das für eine Zeichenerkennung verwendet wird, wurde auch in dem Speicher 10-2 gespeichert. Als in dem Speicher 10-2 gespeichertes Steuerprogramm kann auch ein Steuerprogramm, das bei Bedarf durch eine externe Speichereinrichtung oder dergleichen gelesen wird, verwendet werden. Bei dem Ausführungsbeispiel sind ein OCR-Prozessor 2 und eine Dokumentensucheinrichtung 3 zur Ausführung von Hauptprozessen vorgesehen, die durch den Computer 10 ausgeführt werden, und nunmehr wird das Ausführungsbeispiel beschrieben. Ein Verfahren der Zeichenerkennung ist nicht auf den OCR-Prozess beschränkt. Solange ein Zeichen ein handschriftliches Zeichen aus durch einen Digitalisierer, eine Maus oder dergleichen eingegebenen Strichen ist, reicht es aus, eine Verarbeitungseinheit zur Durchführung einer On-Line- Zeichenerkennung vorzusehen, die für ein derartiges Zeichen geeignet ist.
- Ein Prozess zur Umwandlung der Bilddaten eines durch die Bildabtasteinrichtung 1 oder dergleichen eingegebenen ursprünglichen bzw. originalen Bildes in Textinformationen ist in einem Ablaufdiagramm in Fig. 1 gezeigt und wird nachstehend beschrieben.
- Die in dem externen Speicher 4 gespeicherten und durch die Bildabtasteinrichtung oder dergleichen eingegebenen Bilddaten werden in den OCR-Prozessor 2 eingegeben (S1) Dann wird überprüft, ob Zeichendaten in den eingegebenen Bilddaten vorhanden sind oder nicht (S2). Ist die Antwort JA, werden die Bilddaten eines Zeichens extrahiert (S3). Das extrahierte Zeichen wird mit dem Wörterbuch verglichen, wodurch eine Vielzahl von Zeichenkodes als Erkennungsergebnisse und eine Wahrscheinlichkeit LH als Ähnlichkeit mit den Wörterbuchdaten erhalten wird, die durch jeden Zeichenkode angezeigt wird (S4). Unter den als Erkennungsergebnisse in S4 erhaltenen Zeichenkodes wird die maximale Wahrscheinlichkeit LHMAx mit einem vorbestimmten, in dem Speicher 10-2 gespeicherten Signifikanz- Wahrscheinlichkeitsbeurteilungs-Schwellenwert Th1 verglichen (S5). Ist die Wahrscheinlichkeit größer oder gleich Th1, wird geurteilt, dass das Erkennungsergebnis richtig ist, und ein derartiger Zeichenkode unter der Vielzahl der Zeichenkodes wird als Erkennungsergebnis ausgegeben (S6). Ist die Wahrscheinlichkeit kleiner als Th1 in S5, wird zur Speicherung einer Vielzahl von Erkennungsergebnissen für die Bilddaten eines Zeichenkodes eine Begrenzung als (nachstehend als ID bezeichnete) Identifizierungsinformationen ausgegeben (S7). In S8 schreitet die Verarbeitungsroutine zu Schritt S9 oder S11 entsprechend einem durch den Bediener bestimmten Modus oder einem durch das System oder die in S4 erhaltene Wahrscheinlichkeit eingestellten Modus vor. In S9 wird unter der Vielzahl der in Schritt S9 erhaltenen Wahrscheinlichkeiten ein Zeichenkode, der einer Wahrscheinlichkeit entspricht, die größer als ein vorbestimmter, in dem Speicher 10-2 gespeicherter niedriger Erkennungs-Wahrscheinlichkeitsbeurteilungs-Schwellenwert Th2 ist, als Ergebnis entsprechend den Bilddaten eines Zeichenkodes ausgegeben. In S11 werden unter der Vielzahl der in S4 erhaltenen Zeichenkodes die Zeichenkodes der Anzahl Nmax maximaler Erkennungskandidaten aufeinanderfolgend in der Reihenfolge vom Zeichenkode mit der größten Wahrscheinlichkeit an als Ergebnis entsprechend den Bilddaten eines Zeichenkodes ausgegeben. Wurde das den Bilddaten eines Zeichenkodes entsprechende Ergebnis ausgegeben, wird eine Begrenzung als ID-Informationen ausgegeben, die das Ende des Ergebnisses der Zeichen anzeigen (S10).
- Sind die Erkennung der Bilddaten eines Zeichenkodes und die Ausgabe des Ergebnisses beendet, werden die Prozesse der Schritte S3 bis S11 wiederholt, während die als Objekt dienenden Bilddaten solange aktualisiert werden, bis in S2 festgestellt wird, dass keine Zeichendaten mehr enthalten sind.
- Diese in den Schritten S6 bis S11 ausgegebenen Kodeinformationen werden sequentiell als Textinformationen in dem externen Speicher 4 gespeichert.
- Durch diese Prozesse kann eine Situation vermieden werden, dass die Erkennungsergebnisse auf eins in dem Fall eingeengt werden, dass eine OCR- Erkennungswahrscheinlichkeit niedrig ist und auf die Erkennung kein Verlass ist, eine Vielzahl optimaler, den Erkennungswahrscheinlichkeiten entsprechenden Erkennungskandidaten können ausgewählt werden, und die wirksamen Erkennungskandidateninformationen können effektiv gespeichert und ohne Verwerfen verwendet werden. Ein Suchdateiausbildungsprozess im Fall des Befehls zur Ausbildung einer Suchdatei derart, dass die durch die vorstehend beschriebenen Prozesse gespeicherten Textinformationen für eine nachfolgende Suche verwendet werden können, ist im Ablaufdiagramm in Fig. 2 gezeigt und wird nachstehend beschrieben.
- Im Fall des Befehls zur Ausbildung der Suchdatei für die in dem externen Speicher 4 gespeicherten Textinformationen wird ein Typ eines Zeichenschlüssels für einen Index bestimmt (S21), wenn die bestimmten Textdaten in der Suchdatei registriert werden. Die bestimmten Textinformationen werden aus dem externen Speicher 4 in die Dokumentensucheinrichtung 3 geladen (S22). Daten eines Zeichenkodes werden aus den geladenen Textinformationen ausgelesen (S24). Wird festgestellt, dass der Zeichenkode eine Begrenzung darstellt (S25), wird eine Vielzahl von Kandidaten bis zur nächsten Begrenzung mit der bisherigen Zeichenkette kombiniert, wodurch eine Vielzahl von Zeichenschlüsseln entwickelt werden. Wird festgestellt, dass der Zeichenkode keine Begrenzung im Schritt S25 darstellt, wird dieser eine Zeichenkode zu der Zeichenkette des Zeichenschlüssels an ihrem Ende hinzugefügt (S27). Die Prozesse in S25 bis S27 werden solange wiederholt, bis die Vollständigkeit des Zeichenschlüssels in S28 festgestellt wird.
- Wird in S28 festgestellt, dass der Zeichenschlüssel vollständig ist, wird der ausgebildete Zeichenschlüssel (einer oder viele) zu den Indexinformationen in der Suchdatei in dem externen Speicher 4 hinzugefügt (S29).
- Die Prozesse in S24 bis S29 werden solange wiederholt, bis alle Zeichendaten in S23 verarbeitet sind, wodurch die Ausbildung der Suchdatei der geladenen Textinformationen abgeschlossen ist.
- Durch diese Prozesse werden eine Vielzahl von Erkennungskandidatenzeichen mit Zeichen vor und nach diesen Zeichen aus den durch Erkennung des eingegebenen Bildes erhaltenen Textinformationen kombiniert und die Zeichenkette wird entsprechend der Art des Zeichenschlüssels des zu verwendenden Index entwickelt, wodurch vorab ein Index ausgebildet wird. Dadurch wird das Fehlschlagen der Suche aufgrund der Fehlererkennung verringert.
- Ein Suchprozess, der unter Verwendung der wie vorstehend beschrieben ausgebildeten Suchdatei ausgeführt wird, ist in dem Ablaufdiagramm in Fig. 3 gezeigt und wird nachstehend beschrieben.
- Ein Suchwort wird entsprechend einem Befehl des Suchprozesses eingegeben (S31). Das eingegebene Suchwort wird als Suchschlüssel bzw. Suchkode analysiert, der für den Suchprozess geeignet ist (S32). Der Suchkode wird mit der Suchdatei in dem externen Speicher 4 verglichen (S33). Wird ein Index, der mit dem Suchkode übereinstimmt, gefunden, werden diesem Index entsprechende Dokumentenadressinformationen zur Anwendungsseite zurückgegeben (S34).
- Die durch die Dokumentenadressinformationen bestimmten und in dem externen Speicher 4 gespeicherten Bilddaten werden als Suchergebnis auf der Anzeige 6 angezeigt.
- Ein Ablaufdiagramm in Fig. 5 zeigt Prozesse, bei denen Zeichen mit den Zeichen vor und nach der Erkennungskandidaten-Zeichengruppe aus den Textinformationen kombiniert werden und jedes Mal dann entwickelt werden, wenn der Suchprozess befohlen wird, wodurch ein Vergleich mit dem eingegebenen Suchwort ohne das vorherige Ausbilden der Suchdatei bewirkt wird.
- Im Fall des Befehls der Ausbildung der Suchdatei für die in dem externen Speicher 4 gespeicherten Textinformationen wird die Art des Zeichenkodes für den Index, wenn die instruierten Textdaten in der Suchdatei registriert werden, bestimmt (S41), und ein Suchwort wird eingegeben (S42). Das eingegebene Suchwort wird als Suchschlüssel bzw. Suchkode analysiert, der für den Suchprozess geeignet ist (S43). Die instruierten Textinformationen werden in die Dokumentensucheinrichtung 3 aus dem externen Speicher 4 geladen (S44). Daten eines Zeichens werden aus den geladenen Textinformationen ausgelesen (S46). Wird festgestellt, dass der Zeichenschlüssel die Begrenzung anzeigt (S47), werden eine Vielzahl von Kandidaten bis zur nächsten Begrenzung und die bisherige Zeichenkette kombiniert, wodurch eine Vielzahl von Zeichenschlüsseln entwickelt wird. Wird in S47 festgestellt, dass keine Begrenzung enthalten ist, wird dieses eine Zeichen zu der Zeichenkette des Zeichenschlüssel an seinem Ende hinzugefügt (S49). Die Prozesse von S47 bis S49 werden solange wiederholt, bis festgestellt wird, dass der Zeichenschlüssel vollständig ist (S50).
- Wird in S50 festgestellt, dass der Zeichenschlüssel vollständig ist, werden der ausgebildete Zeichenschlüssel (ein einzelner oder viele) und der in S43 erhaltene Suchkode verglichen (S51). Sind sie identisch (S52), wird eine Dokumentenadresse, an der die Bilddaten des Dokuments gespeichert sind, als Suchergebnis ausgegeben (S53).
- Für die Datenbank wird eine Vielzahl von Einträgen bzw. Datensätzen auch durch Prozesse wie die vorstehend beschriebenen Prozesse ausgebildet, sodass eine Suche mit geringem Verlust unter Verwendung der Datenbank möglich ist.
- Nachstehend wird ein bestimmtes Beispiel beschrieben.
- Es wird angenommen, dass ein Satz wie "DATA" in einem Dokument enthalten ist.
- Es wird angenommen, dass bei der Eingabe dieses Satzes durch die Bildabtasteinrichtung 1 und bei der Erkennung von "T" in einem Anfangserkennungsschritt S4 durch den OCR- Prozessor 2 die Erkennungswahrscheinlichkeit für dieses Zeichen geringer als Th1 trotz der Tatsache ist, dass die Erkennungswahrscheinlichkeiten der anderen Zeichen größer oder gleich Th1 sind. Es wird weiter angenommen, dass die Erkennungskandidaten ähnliche Wahrscheinlichkeiten kleiner als Th2 haben. Infolgedessen wird der Prozess S11 in S8 ausgewählt und Nmax Kandidaten werden aufeinanderfolgend entsprechend der Reihenfolge ab dem Kandidaten mit der größten Wahrscheinlichkeit ausgegeben.
- Es wird angenommen, dass vier Kandidaten I, T, Y und J aufeinanderfolgend ausgegeben werden.
- Der OCR-Prozessor 2 beschreibt die vorstehend angeführte Vielzahl der Kandidatenzeichen in dem folgenden Format. Bei diesem Beispiel wird mit der in S7 und S10 auszugebenden Begrenzung "*" das folgende Format erhalten.
- * [Anzahl der Kandidaten] [Kandidatenzeichen 1]
- [Kandidatenzeichen 2] [Kandidatenzeichen 3]
- ...*
- Daher werden die vorstehend beschriebenen vier Kandidaten in Übereinstimmung mit T bei diesem Beispiel ausgegeben, und es in S5 wird festgestellt, dass die Wahrscheinlichkeiten der anderen Zeichen größer als Th1 sind. Ein Ausdruck für "DATA" in dem Fall, dass ein Zeichen der größten Wahrscheinlichkeit als Kandidatenzeichen in S6 ausgegeben wird, ergibt sich wie folgt.
- "DA*4ITYJ*A"
- Eine derartige Zeichenkodegruppe wird als Textinformationen in dem externen Speicher 4 gespeichert.
- Andererseits interpretiert die Dokumentensucheinrichtung 3 das Format und bildet eine Suchdatei entsprechend dem Ablaufdiagramm in Fig. 2.
- DAIA
- DATA
- DAYA
- DAJA
- Wird daher das Suchwort wie "DATA" über die Tastatur eingegeben und führt die Dokumentensucheinrichtung 3 den Dokumentensuchprozess entsprechend diesem Suchwort aus, kann das Dokument auch gefunden werden.
- Obwohl bei dem Ausführungsbeispiel das Beispiel zur Verwendung bei der Dokumentensuche beschrieben wurde, kann die Erfindung auch bei der Suche unter Verwendung einer Datenbank angewendet werden.
- Die Erfindung kann auch bei der Extraktion eines Dokumentenschlüsselworts, eines Seitenschlüsselworts oder dergleichen durch die OCR angewendet werden.
- Des Weiteren kann die Erfindung auch durch ein ähnliches Verfahren für den Fall angewendet werden, dass die Erkennungswahrscheinlichkeit von Teilinformationen eines optischen Lesegeräts durch eine OMR oder Strichkodes gering ist.
- Erfindungsgemäß kann eine Situation vermieden werden, dass in dem Fall, wenn die OCR-Erkennungswahrscheinlichkeit niedrig ist und nicht festgestellt werden kann, dass das Ergebnis sicher ist, die Erkennungskandidaten auf einen eingeengt werden, eine Vielzahl optimaler Erkennungskandidaten, die der Erkennungswahrscheinlichkeit entsprechen, werden ausgewählt, und die effektiven Erkennungskandidateninformationen können gespeichert und ohne Verwerfen effektiv verwendet werden.
- Wie vorstehend beschrieben wird erfindungsgemäß der manuelle Korrekturvorgang des Erkennungsergebnisses beseitigt, die Prozesse von der Bildeingabe bis zur Speicherung der Bilddaten und Textdaten über die OCR können ohne Einflussnahme durch den Bediener durchgeführt werden, eine Verarbeitungsbelastung des Geräts kann verringert werden, die Verarbeitungsgeschwindigkeit kann erhöht werden, und ein kostengünstiges Gerät kann bereitgestellt werden.
- Wie vorstehend beschrieben werden erfindungsgemäß in dem Fall, dass es eine Vielzahl von Erkennungskandidaten für ein eingegebenes Bild eines Zeichens gibt, Zeichen mit den Zeichen vor und nach diesen Zeichen kombiniert, und sie können entwickelt werden und eine Vielzahl von Indizes können ausgebildet werden, sodass das Fehlschlagen der Suche aufgrund der falschen Erkennung verringert werden kann.
Claims (28)
1. Bliddatenverarbeitungsverfahren mit den Schritten
Eingeben von Zeichenbilddaten enthaltenden Daten,
Extrahieren eines Zeichenbildes aus den eingegebenen
Bilddaten und
Bestimmen einer Vielzahl von Zeichencodes als
wahrscheinliche Kandidaten für das extrahierte Zeichenbild,
gekennzeichnet durch den Schritt
Erzeugen einer linearen Kette von Zeichencodes mit der
Vielzahl von Kandidatenzeichencodes und einem Zeichencode
für ein Zeichenbild, das an das extrahierte Zeichenbild
angrenzt.
2. Verfahren nach Anspruch 1, wobei es eine Vielzahl
von Zeichenbildern gibt, die an das extrahierte Zeichenbild
angrenzen, und die erzeugte lineare Kette der Zeichencodes
einen Zeichencode für jedes angrenzende Zeichenbild
aufweist.
3. Verfahren nach Anspruch 1 oder 2, ferner mit dem
Schritt
Speichern der erzeugten linearen Kette der Zeichen zur
Verwendung in einem Suchprozess, der für die eingegebenen
Bilddaten auszuführen ist.
4. Verfahren nach einem der vorhergehenden Ansprüche,
wobei die Vielzahl der Kandidatenzeichencodes entsprechend
einem Ergebnis bestimmt wird, das durch den Vergleich von
Wahrscheinlichkeiten jeweiliger Zeichencodes mit einem
Schwellenwert erhalten wird.
5. Verfahren nach einem der vorhergehenden Ansprüche,
ferner mit dem Schritt
Erzeugen von Informationen bezüglich der Anzahl der
Zeichencodes in der Vielzahl der Kandidatenzeichencodes.
6. Verfahren nach einem der vorhergehenden Ansprüche,
wobei die Vielzahl der Kandidatenzeichencodes in der
linearen Kette der Zeichencodes durch ID-Informationen
unterschieden wird, die dem extrahierten Zeichenbild
entsprechende Informationen identifizieren können.
7. Verfahren nach einem der vorhergehenden Ansprüche,
ferner mit den Schritten
Kombinieren jedes der Vielzahl der
Kandidatenzeichencodes mit dem Zeichencode der an das
extrahierte Zeichenbild angrenzenden Zeichenbilder zur
Ausbildung jeweiliger Kandidatenworte,
Vergleichen der jeweiligen Kandidatenworte mit einem
bestimmten Suchwort und
Identifizieren der eingegebenen Bilddaten, die dem
jeweiligen Kandidatenwort entsprechen, das dem bestimmten
Suchwort entspricht.
8. Verfahren nach einem der vorhergehenden Ansprüche,
wobei die eingegebenen Bilddaten durch eine
Abtasteinrichtung eingegeben werden.
9. Verfahren nach einem der Ansprüche 1 bis 7, wobei
die eingegebenen Bilddaten durch ein
Koordinateneingabegerät eingegeben werden.
10. Verfahren nach Anspruch 7, wobei die
identifizierten eingegebenen Bilddaten durch einen Drucker
ausgegeben werden.
11. Verfahren nach Anspruch 7 oder 10, wobei die
identifizierten eingegebenen Bilddaten durch eine
Anzeigeeinrichtung ausgegeben werden.
12. Verfahren nach einem der vorhergehenden Ansprüche,
wobei die Vielzahl der Zeichencodes als wahrscheinliche
Kandidaten durch ein optisches Zeichenerkennungsverfahren
bestimmt wird.
13. Verfahren nach einem der Ansprüche 1 bis 11, wobei
die Vielzahl der Zeichencodes als wahrscheinliche
Kandidaten durch ein Ein-Zeilen-Zeichenerkennungsverfahren
bestimmt wird.
14. Bilddatenverarbeitungsgerät mit
einer Eingabeeinrichtung (1) zur Eingabe von
Zeichenbilddaten enthaltenden Bilddaten,
einer Extrahiereinrichtung zur Extraktion eines
Zeichenbildes aus den eingegebenen Bilddaten und
einer Bestimmungseinrichtung zur Bestimmung einer
Vielzahl von Zeichencodes als wahrscheinliche Kandidaten
für das extrahierte Zeichenbild,
gekennzeichnet durch
eine Erzeugungseinrichtung zur Erzeugung einer
linearen Kette von Zeichencodes mit der Vielzahl der
Kandidatenzeichencodes und einem Zeichencode für ein
Zeichenbild, das an das extrahierte Zeichen angrenzt.
15. Gerät nach Anspruch 14, wobei die
Erzeugungseinrichtung eine lineare Kette von Zeichencodes
mit der Vielzahl der Kandidatenzeichencodes und einem
Zeichencode für jedes der Vielzahl der Zeichenbilder
erzeugt, die an das extrahierte Zeichenbild angrenzen.
16. Gerät nach Anspruch 14 oder 15, ferner mit einer
Speichereinrichtung (4) zur Speicherung der erzeugten
linearen Kette von Zeichen zur Verwendung in einem
Suchprozess, der für die eingegebenen Bilddaten auszuführen
ist.
17. Gerät nach einem der Ansprüche 14 bis 16, wobei
die Bestimmungseinrichtung die Vielzahl der
Kandidatenzeichencodes entsprechend einem Ergebnis
bestimmt, das durch den Vergleich der Wahrscheinlichkeiten
jeweiliger Zeichencodes mit Schwellenwerten erhalten wird.
18. Gerät nach einem der Ansprüche 14 bis 17, ferner
mit einer Einrichtung zur Erzeugung von Informationen
bezüglich der Anzahl der Zeichencodes in der Vielzahl der
Kandidatenzeichencodes.
19. Gerät nach einem der Ansprüche 14 bis 18, ferner
mit einer Einrichtung zur Unterscheidung der Vielzahl der
Kandidatenzeichencodes in der linearen Kette der
Zeichencodes durch ID-Informationen, die dem extrahierten
Zeichenbild entsprechende Informationen identifizieren
können.
20. Gerät nach einem der Ansprüche 14 bis 19, ferner
mit
einer Einrichtung zur Kombination jedes der Vielzahl
der Kandidatenzeichencodes mit den Zeichencodes der an das
extrahierte Zeichenbild angrenzenden Zeichenbilder zur
Ausbildung jeweiliger Kandidatenworte,
einer Einrichtung zum Vergleich der jeweiligen
Kandidatenworte mit einem bestimmten Suchwort, und
einer Einrichtung zur Identifizierung der eingegebenen
Bilddaten, die dem jeweiligen Kandidatenwort entsprechen,
das dem bestimmten Suchwort entspricht.
21. Gerät nach einem der Ansprüche 14 bis 20, ferner
mit einer Abtasteinrichtung (1) zur Eingabe der Bilddaten.
22. Gerät nach einem der Ansprüche 14 bis 20, ferner
mit einer Koordinateneingabeeinrichtung zur Eingabe der
Bilddaten.
23. Gerät nach einem der Ansprüche 14 bis 22, ferner
mit einem Drucker zur Ausgabe der identifizierten
eingegebenen Bildinformationen.
24. Gerät nach einem der Ansprüche 14 bis 23, mit
einer Anzeigeeinrichtung (6) zur Ausgabe der
identifizierten eingegebenen Bildinformationen.
25. Gerät nach einem der Ansprüche 14 bis 24, ferner
mit einer optischen Zeichenerkennungseinrichtung (2) zur
Bestimmung der Vielzahl der Zeichencodes.
26. Gerät nach einem der Ansprüche 14 bis 24, ferner
mit einer Ein-Zeilen-Zeichenerkennungseinrichtung zur
Bestimmung der Vielzahl der Zeichencodes.
27. Computerlesbarer Speicherträger, der von einem
Computer ausführbare Verarbeitungsschritte zur Verarbeitung
von Bilddaten speichert, wobei die Schritte umfassen
einen Eingabeschritt zur Eingabe von Zeichenbilddaten
enthaltenden Bilddaten,
einen Extrahierschritt zur Extraktion eines
Zeichenbildes aus den eingegebenen Bilddaten und
einen Bestimmungsschritt zur Bestimmung einer Vielzahl
von Zeichencodes als wahrscheinliche Kandidaten für das
extrahierte Zeichenbild,
gekennzeichnet durch
einen Erzeugungsschritt zur Erzeugung einer linearen
Kette von Zeichencodes mit der Vielzahl der
Kandidatenzeichencodes und einem Zeichencode für ein an das
extrahierte Zeichenbild angrenzendes Zeichenbild.
28. Computerlesbarer Speicherträger nach Anspruch 27,
ferner mit einem Speicherschritt zur Speicherung der
erzeugten linearen Kette der Zeichen zur Verwendung in
einem Suchprozess, der für die eingegebenen Bilddaten
auszuführen ist.
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP6134194A JPH087033A (ja) | 1994-06-16 | 1994-06-16 | 情報処理方法及び装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
DE69519256D1 DE69519256D1 (de) | 2000-12-07 |
DE69519256T2 true DE69519256T2 (de) | 2001-04-05 |
Family
ID=15122638
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE69519256T Expired - Lifetime DE69519256T2 (de) | 1994-06-16 | 1995-06-14 | Verfahrenund Gerät zur Informationsverarbeitung und rechnerlesbares Speichermedium |
Country Status (5)
Country | Link |
---|---|
US (1) | US5905811A (de) |
EP (1) | EP0687991B1 (de) |
JP (1) | JPH087033A (de) |
CN (1) | CN1106620C (de) |
DE (1) | DE69519256T2 (de) |
Families Citing this family (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3566478B2 (ja) * | 1996-12-27 | 2004-09-15 | キヤノン株式会社 | 文書セキュリティ管理システム、文書セキュリティ管理方法および文書検索装置 |
US6678683B1 (en) | 1996-12-27 | 2004-01-13 | Canon Kabushiki Kaisha | Document management system using an access-limited character train and password, and a method and computer-readable medium therefor |
US6327387B1 (en) * | 1996-12-27 | 2001-12-04 | Fujitsu Limited | Apparatus and method for extracting management information from image |
US6269188B1 (en) * | 1998-03-12 | 2001-07-31 | Canon Kabushiki Kaisha | Word grouping accuracy value generation |
US6243501B1 (en) | 1998-05-20 | 2001-06-05 | Canon Kabushiki Kaisha | Adaptive recognition of documents using layout attributes |
JP4421134B2 (ja) * | 2001-04-18 | 2010-02-24 | 富士通株式会社 | 文書画像検索装置 |
JP4125273B2 (ja) * | 2004-08-24 | 2008-07-30 | キヤノン株式会社 | 画像処理装置及びその方法、プログラム |
JP4561474B2 (ja) * | 2005-05-24 | 2010-10-13 | 株式会社日立製作所 | 電子化文書保管システム |
CN100356392C (zh) * | 2005-08-18 | 2007-12-19 | 北大方正集团有限公司 | 一种字符识别的后处理方法 |
US8155444B2 (en) * | 2007-01-15 | 2012-04-10 | Microsoft Corporation | Image text to character information conversion |
JP2010146185A (ja) * | 2008-12-17 | 2010-07-01 | Sharp Corp | 画像処理装置、画像読取装置、画像送信装置、画像処理方法、プログラムおよびその記録媒体 |
US8280196B2 (en) * | 2009-05-12 | 2012-10-02 | Canon Kabushiki Kaisha | Image retrieval apparatus, control method for the same, and storage medium |
JP5230525B2 (ja) * | 2009-05-25 | 2013-07-10 | キヤノン株式会社 | 画像検索装置およびその方法 |
JP5507962B2 (ja) * | 2009-11-05 | 2014-05-28 | キヤノン株式会社 | 情報処理装置及びその制御方法、プログラム |
CN101788849B (zh) * | 2009-12-31 | 2011-11-16 | 优视科技有限公司 | 一种用于移动通讯设备系统的光学字符识别输入方法 |
JP5820236B2 (ja) | 2011-10-28 | 2015-11-24 | キヤノン株式会社 | 画像処理装置及びその制御方法 |
CN103697838A (zh) * | 2013-12-24 | 2014-04-02 | 天津森宇科技发展有限公司 | 一种基于机器视觉技术的贴片件pin针平整度检测设备 |
JP7017027B2 (ja) | 2017-03-17 | 2022-02-08 | 富士フイルムビジネスイノベーション株式会社 | 検索装置、検索プログラム、および検索システム |
Family Cites Families (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4930077A (en) * | 1987-04-06 | 1990-05-29 | Fan David P | Information processing expert system for text analysis and predicting public opinion based information available to the public |
EP0381773B1 (de) * | 1988-07-20 | 1998-06-10 | Fujitsu Limited | Buchstabenerkennungsvorrichtung |
US5265174A (en) * | 1989-03-03 | 1993-11-23 | Canon Kabushiki Kaisha | Pattern recognition apparatus |
US5261112A (en) * | 1989-09-08 | 1993-11-09 | Casio Computer Co., Ltd. | Spelling check apparatus including simple and quick similar word retrieval operation |
US5134669A (en) * | 1990-06-13 | 1992-07-28 | National Computer Systems | Image processing system for documentary data |
US5369577A (en) * | 1991-02-01 | 1994-11-29 | Wang Laboratories, Inc. | Text searching system |
US5237627A (en) * | 1991-06-27 | 1993-08-17 | Hewlett-Packard Company | Noise tolerant optical character recognition system |
US5703962A (en) * | 1991-08-29 | 1997-12-30 | Canon Kabushiki Kaisha | Image processing method and apparatus |
JP3190074B2 (ja) * | 1991-09-11 | 2001-07-16 | 株式会社東芝 | 手書き入力装置 |
US5315668A (en) * | 1991-11-27 | 1994-05-24 | The United States Of America As Represented By The Secretary Of The Air Force | Offline text recognition without intraword character segmentation based on two-dimensional low frequency discrete Fourier transforms |
DE69328640T2 (de) * | 1992-02-07 | 2000-09-28 | Canon K.K., Tokio/Tokyo | Verfahren und Einrichtung zur Mustererkennung |
US5454046A (en) * | 1993-09-17 | 1995-09-26 | Penkey Corporation | Universal symbolic handwriting recognition system |
US5524066A (en) * | 1994-03-31 | 1996-06-04 | Xerox Corporation | Text recognition by predictive composed shapes |
-
1994
- 1994-06-16 JP JP6134194A patent/JPH087033A/ja active Pending
-
1995
- 1995-06-14 EP EP95304095A patent/EP0687991B1/de not_active Expired - Lifetime
- 1995-06-14 DE DE69519256T patent/DE69519256T2/de not_active Expired - Lifetime
- 1995-06-15 US US08/490,739 patent/US5905811A/en not_active Expired - Lifetime
- 1995-06-16 CN CN95107055A patent/CN1106620C/zh not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
US5905811A (en) | 1999-05-18 |
EP0687991A2 (de) | 1995-12-20 |
EP0687991A3 (de) | 1996-01-03 |
DE69519256D1 (de) | 2000-12-07 |
CN1106620C (zh) | 2003-04-23 |
EP0687991B1 (de) | 2000-11-02 |
CN1121605A (zh) | 1996-05-01 |
JPH087033A (ja) | 1996-01-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DE69519256T2 (de) | Verfahrenund Gerät zur Informationsverarbeitung und rechnerlesbares Speichermedium | |
DE69637025T2 (de) | Informationsverarbeitungsverfahren und -vorrichtung zum Suchen von Bild- oder Textinformation | |
EP1665132B1 (de) | Verfahren und system zum erfassen von daten aus mehreren maschinell lesbaren dokumenten | |
DE69428590T2 (de) | Auf kombiniertem lexikon und zeichenreihenwahrscheinlichkeit basierte handschrifterkennung | |
DE69517564T2 (de) | Verfahren und Gerät zur Erzeugung einer hybriden Datenstruktur zur Anzeige eines Rasterbildes | |
DE69428621T2 (de) | Anlage und Verfahren zur Steigerung der Zeichenerkennungsgenauigkeit durch anpassungsfähige Wahrscheinlichkeitsgewichtung | |
DE69302003T2 (de) | Dateneingabeanlage | |
DE69033042T2 (de) | Datenverarbeitung | |
DE69730930T2 (de) | Verfahren und Gerät zur Zeichenerkennung | |
DE69029251T2 (de) | System zur Ueberprüfung von Dokumenten, zur Verwendung mit einem Lese- und Uebersetzungssystem | |
DE69616153T2 (de) | Verfahren und System zur automatischen Korrektur von Transkriptionen | |
DE69610243T2 (de) | Verfahren zum Trainieren einer Erkennungsanlage mit Zeichenmustern | |
DE69230632T2 (de) | Optische Worterkennung durch Wortgestaltuntersuchung | |
DE69610478T2 (de) | Zeichenerkennungssystembestimmung von abgetasteten und "echtzeit"-handgeschriebenen zeichen | |
DE3782447T2 (de) | Dokumentverarbeitungsapparat. | |
DE3926327C2 (de) | Verfahren und System zum Erkennen von Zeichen auf einem Medium | |
DE102011079443A1 (de) | Lerngewichtungen von Schriftarten für getippte Proben bei der Handschriftenschlüsselwortauffindung | |
DE2640537A1 (de) | Verfahren und vorrichtung zum unterscheiden zwischen n groesser als 2 alphabeten angehoerenden zeichen | |
DE3425449A1 (de) | Verfahren und vorrichtung zur alphanumerischen handschriftenerkennung | |
EP1671262B1 (de) | Verfahren und system zum erfassen von daten aus maschinell lesbaren dokumenten | |
DE4119091C2 (de) | Verfahren zum Erkennen von Zeichen, insbesondere Schriftzeichen und Einrichtung zur Durchführung des Verfahrens | |
DE69610520T2 (de) | Handgeschriebene Daten und Befehlgesteneingabemethode und Gerät | |
DE2435889B2 (de) | Verfahren und einrichtung zur unterscheidung von zeichengruppen | |
CN113255583A (zh) | 数据标注方法、装置、计算机设备和存储介质 | |
DE60123730T2 (de) | Gerät und Verfahren zur Bestimmung des Formats von Dokumenten |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
8364 | No opposition during term of opposition |