DE69519256T2

DE69519256T2 - Verfahrenund Gerät zur Informationsverarbeitung und rechnerlesbares Speichermedium

Info

Publication number: DE69519256T2
Application number: DE69519256T
Authority: DE
Inventors: Katsumi Masaki; Hirotaka Shiiyama
Original assignee: Canon Inc
Current assignee: Canon Inc
Priority date: 1994-06-16
Filing date: 1995-06-14
Publication date: 2001-04-05
Anticipated expiration: 2015-06-15
Also published as: US5905811A; EP0687991A2; EP0687991A3; DE69519256D1; CN1106620C; EP0687991B1; CN1121605A; JPH087033A

Description

HINTERGRUND DER ERFINDUNG

Gebiet der Erfindung

Die Erfindung bezieht sich auf ein Bilddatenverarbeitungsverfahren, ein Bilddatenverarbeitungsgerät und ein computerlesbares Speichermedium zur Speicherung von einem Computer ausführbarer Verarbeitungsschritte zur Verarbeitung von Bilddaten, wobei die Bilddaten Zeichenbilddaten enthalten.

Relevanter Stand der Technik

Bei der Erkennung eines eingegebenen Bildes durch eine optische Zeichenerkennung (OCR) oder dergleichen und der Umwandlung des Bildes in einen Text wurde bezüglich eines eingegebenen Zeichens, bei dem lediglich ein Kandidatenzeichen mit geringer Ähnlichkeit erhalten wurde, bisher als Gegenmaßnahme einer fehlerhaften Erkennung die Tatsache, dass die Ähnlichkeit niedrig ist, dem Bediener mitgeteilt, und er beurteilt, ob das Kandidatenwort richtig oder falsch ist. Ist es falsch, muss der Bediener das falsche Zeichen manuell korrigieren und ein richtiges Zeichen eingeben.
Bei diesem Verfahren muss der Bediener allerdings nicht nur ein in einen Text zu konvertierendes Bild eingeben, sondern auch den Korrekturvorgang vornehmen, woraus sich eine nachteilige Belastung des Bedieners ergibt.
Es gibt auch ein Verfahren, bei dem nicht nur ein Ergebnis der Zeichenerkennung ausgegeben wird, sondern auch ein durch die Zeichenerkennung erhaltenes Kandidatenzeichen mit einem Wörterbuch oder einer Wissensbasis verglichen wird, wodurch ein fehlerhaft erkanntes Zeichen ohne die Hilfe des Bedieners korrigiert wird.
Mit den vorstehend angeführten Verfahren sind allerdings Nachteile verbunden, dass das Wörterbuch oder die Wissensbasis für den Korrekturvorgang in einem Speicher vorhanden sein muss, und dass der Korrekturvorgang unter Verwendung des Wörterbuchs oder der Wissensbasis kompliziert ist und lange dauert und eine Belastung für das Gerät darstellt.
Die Druckschrift 3rd International Joint Conference on Pattern Recognition, Coronado, CA, USA, 8.-11. November, 1976, New York, NY, USA, IEEE, USA, Seiten 658-662, Shurmann J, "Multifont word recognition system with application to postal address reading" offenbart ein Multifont-Worterkennungssystem, das auf dem Gebiet des Postadressenlesens angewendet wird. Es sind Sätze alternativer Zeichen für einzelne Zeichenbilder vorgesehen. Die unterschiedlichen Sätze sind als jeweilige einzelne Ketten dargestellt.

Kurzzusammenfassung der Erfindung

Gemäß einer Ausgestaltung der Erfindung ist ein Bilddatenverarbeitungsverfahren gemäß dem Patentanspruch 1 ausgebildet.
Gemäß einer weiteren Ausgestaltung der Erfindung ist ein Bilddatenverarbeitungsgerät gemäß dem Patentanspruch 14 ausgebildet.
Gemäß einer weiteren Ausgestaltung der Erfindung ist ein computerlesbares Speichermedium nach Patentanspruch 27 ausgebildet.
Weitere Ausgestaltungen der Erfindung sind aus den Unteransprüchen ersichtlich.

Kurzbeschreibung der Zeichnung

Fig. 1 zeigt ein Ablaufdiagramm für einen OCR-Prozess.
Fig. 2 zeigt ein Ablaufdiagramm für einen Suchdatei- Ausbildungsprozess für eine Dokumentensuche.
Fig. 3 zeigt ein Ablaufdiagramm für einen Dokumentensuchprozess.
Fig. 4 zeigt ein schematisches Blockschaltbild eines Informationsverarbeitungsgeräts gemäß einem Ausführungsbeispiel.
Fig. 5 zeigt ein Ablaufdiagramm für einen Prozess zur Suche ohne vorherige Ausbildung einer Suchdatei.

AUSFÜHRLICHE BESCHREIBUNG DES BEVORZUGTEN AUSFÜHRUNGSBEISPIELS

Nachstehend wird ein Ausführungsbeispiel der Erfindung näher beschrieben.
Fig. 4 zeigt ein schematisches Blockschaltbild eines Verarbeitungssystems gemäß dem Ausführungsbeispiel.
Eine Bildabtasteinrichtung 1 stellt eine Bildeingabeeinrichtung zum optischen Auslesen eines Originalbildes eines als Erkennungsobjekt dienenden Dokuments dar. Ein Verfahren zur Eingabe eines Bildes ist nicht auf dieses Verfahren des optischen Lesens eines Bildes durch die Bildabtasteinrichtung oder dergleichen beschränkt, sondern es ist auch möglich, ein Bild eines handgeschriebenen Zeichens einzugeben, das durch eine Eingabeeinrichtung wie einen Digitalisierer, eine Maus oder dergleichen eingegeben wird, mittels der Koordinaten eingegeben werden können. Eine Tastatur/Maus 5 ist eine Eingabeeinrichtung zur Eingabe verschiedener Befehle oder Anweisungsinformationen durch den Bediener. Ein Suchwort und eine Suchbedingung zum Zeitpunkt des Suchprozesses werden auch durch die Tastatur oder die Maus eingegeben. Eine Anzeige 6 ist eine Anzeigeeinrichtung wie eine Kathodenstrahlröhre (CRT) oder eine Flüssigkristallanzeige zum Anzeigen der von der Tastatur/Maus 5 eingegebenen Informationen, der von der Bildabtasteinrichtung 1 oder dergleichen eingegebenen Informationen, des Fortschritts der Prozesse, und eines Ergebnisses des Prozesses. Ein externer Speicher 4 ist eine Speichereinrichtung zur Speicherung von Bilddaten, Textinformationen und einer von der Bildabtasteinrichtung eingegebenen Suchdatei. Ein Computer 10 führt verschiedene Arten von Informationsverarbeitungen durch die Steuerung einer CPU 10&supmin;¹ durch. Steuerprogramme verschiedener Informationsverarbeitungsarten, wie in den nachstehend beschriebenen Ablaufdiagrammen gezeigt, wurden in einem Speicher 10-2 gespeichert. Die CPU 10-1 führt verschiedene Prozesse aus und steuert diese entsprechend den Steuerprogrammen. Ein Wörterbuch, das für eine Zeichenerkennung verwendet wird, wurde auch in dem Speicher 10-2 gespeichert. Als in dem Speicher 10-2 gespeichertes Steuerprogramm kann auch ein Steuerprogramm, das bei Bedarf durch eine externe Speichereinrichtung oder dergleichen gelesen wird, verwendet werden. Bei dem Ausführungsbeispiel sind ein OCR-Prozessor 2 und eine Dokumentensucheinrichtung 3 zur Ausführung von Hauptprozessen vorgesehen, die durch den Computer 10 ausgeführt werden, und nunmehr wird das Ausführungsbeispiel beschrieben. Ein Verfahren der Zeichenerkennung ist nicht auf den OCR-Prozess beschränkt. Solange ein Zeichen ein handschriftliches Zeichen aus durch einen Digitalisierer, eine Maus oder dergleichen eingegebenen Strichen ist, reicht es aus, eine Verarbeitungseinheit zur Durchführung einer On-Line- Zeichenerkennung vorzusehen, die für ein derartiges Zeichen geeignet ist.
Ein Prozess zur Umwandlung der Bilddaten eines durch die Bildabtasteinrichtung 1 oder dergleichen eingegebenen ursprünglichen bzw. originalen Bildes in Textinformationen ist in einem Ablaufdiagramm in Fig. 1 gezeigt und wird nachstehend beschrieben.
Die in dem externen Speicher 4 gespeicherten und durch die Bildabtasteinrichtung oder dergleichen eingegebenen Bilddaten werden in den OCR-Prozessor 2 eingegeben (S1) Dann wird überprüft, ob Zeichendaten in den eingegebenen Bilddaten vorhanden sind oder nicht (S2). Ist die Antwort JA, werden die Bilddaten eines Zeichens extrahiert (S3). Das extrahierte Zeichen wird mit dem Wörterbuch verglichen, wodurch eine Vielzahl von Zeichenkodes als Erkennungsergebnisse und eine Wahrscheinlichkeit LH als Ähnlichkeit mit den Wörterbuchdaten erhalten wird, die durch jeden Zeichenkode angezeigt wird (S4). Unter den als Erkennungsergebnisse in S4 erhaltenen Zeichenkodes wird die maximale Wahrscheinlichkeit LHMAx mit einem vorbestimmten, in dem Speicher 10-2 gespeicherten Signifikanz- Wahrscheinlichkeitsbeurteilungs-Schwellenwert Th1 verglichen (S5). Ist die Wahrscheinlichkeit größer oder gleich Th1, wird geurteilt, dass das Erkennungsergebnis richtig ist, und ein derartiger Zeichenkode unter der Vielzahl der Zeichenkodes wird als Erkennungsergebnis ausgegeben (S6). Ist die Wahrscheinlichkeit kleiner als Th1 in S5, wird zur Speicherung einer Vielzahl von Erkennungsergebnissen für die Bilddaten eines Zeichenkodes eine Begrenzung als (nachstehend als ID bezeichnete) Identifizierungsinformationen ausgegeben (S7). In S8 schreitet die Verarbeitungsroutine zu Schritt S9 oder S11 entsprechend einem durch den Bediener bestimmten Modus oder einem durch das System oder die in S4 erhaltene Wahrscheinlichkeit eingestellten Modus vor. In S9 wird unter der Vielzahl der in Schritt S9 erhaltenen Wahrscheinlichkeiten ein Zeichenkode, der einer Wahrscheinlichkeit entspricht, die größer als ein vorbestimmter, in dem Speicher 10-2 gespeicherter niedriger Erkennungs-Wahrscheinlichkeitsbeurteilungs-Schwellenwert Th2 ist, als Ergebnis entsprechend den Bilddaten eines Zeichenkodes ausgegeben. In S11 werden unter der Vielzahl der in S4 erhaltenen Zeichenkodes die Zeichenkodes der Anzahl Nmax maximaler Erkennungskandidaten aufeinanderfolgend in der Reihenfolge vom Zeichenkode mit der größten Wahrscheinlichkeit an als Ergebnis entsprechend den Bilddaten eines Zeichenkodes ausgegeben. Wurde das den Bilddaten eines Zeichenkodes entsprechende Ergebnis ausgegeben, wird eine Begrenzung als ID-Informationen ausgegeben, die das Ende des Ergebnisses der Zeichen anzeigen (S10).
Sind die Erkennung der Bilddaten eines Zeichenkodes und die Ausgabe des Ergebnisses beendet, werden die Prozesse der Schritte S3 bis S11 wiederholt, während die als Objekt dienenden Bilddaten solange aktualisiert werden, bis in S2 festgestellt wird, dass keine Zeichendaten mehr enthalten sind.
Diese in den Schritten S6 bis S11 ausgegebenen Kodeinformationen werden sequentiell als Textinformationen in dem externen Speicher 4 gespeichert.
Durch diese Prozesse kann eine Situation vermieden werden, dass die Erkennungsergebnisse auf eins in dem Fall eingeengt werden, dass eine OCR- Erkennungswahrscheinlichkeit niedrig ist und auf die Erkennung kein Verlass ist, eine Vielzahl optimaler, den Erkennungswahrscheinlichkeiten entsprechenden Erkennungskandidaten können ausgewählt werden, und die wirksamen Erkennungskandidateninformationen können effektiv gespeichert und ohne Verwerfen verwendet werden. Ein Suchdateiausbildungsprozess im Fall des Befehls zur Ausbildung einer Suchdatei derart, dass die durch die vorstehend beschriebenen Prozesse gespeicherten Textinformationen für eine nachfolgende Suche verwendet werden können, ist im Ablaufdiagramm in Fig. 2 gezeigt und wird nachstehend beschrieben.
Im Fall des Befehls zur Ausbildung der Suchdatei für die in dem externen Speicher 4 gespeicherten Textinformationen wird ein Typ eines Zeichenschlüssels für einen Index bestimmt (S21), wenn die bestimmten Textdaten in der Suchdatei registriert werden. Die bestimmten Textinformationen werden aus dem externen Speicher 4 in die Dokumentensucheinrichtung 3 geladen (S22). Daten eines Zeichenkodes werden aus den geladenen Textinformationen ausgelesen (S24). Wird festgestellt, dass der Zeichenkode eine Begrenzung darstellt (S25), wird eine Vielzahl von Kandidaten bis zur nächsten Begrenzung mit der bisherigen Zeichenkette kombiniert, wodurch eine Vielzahl von Zeichenschlüsseln entwickelt werden. Wird festgestellt, dass der Zeichenkode keine Begrenzung im Schritt S25 darstellt, wird dieser eine Zeichenkode zu der Zeichenkette des Zeichenschlüssels an ihrem Ende hinzugefügt (S27). Die Prozesse in S25 bis S27 werden solange wiederholt, bis die Vollständigkeit des Zeichenschlüssels in S28 festgestellt wird.
Wird in S28 festgestellt, dass der Zeichenschlüssel vollständig ist, wird der ausgebildete Zeichenschlüssel (einer oder viele) zu den Indexinformationen in der Suchdatei in dem externen Speicher 4 hinzugefügt (S29).
Die Prozesse in S24 bis S29 werden solange wiederholt, bis alle Zeichendaten in S23 verarbeitet sind, wodurch die Ausbildung der Suchdatei der geladenen Textinformationen abgeschlossen ist.
Durch diese Prozesse werden eine Vielzahl von Erkennungskandidatenzeichen mit Zeichen vor und nach diesen Zeichen aus den durch Erkennung des eingegebenen Bildes erhaltenen Textinformationen kombiniert und die Zeichenkette wird entsprechend der Art des Zeichenschlüssels des zu verwendenden Index entwickelt, wodurch vorab ein Index ausgebildet wird. Dadurch wird das Fehlschlagen der Suche aufgrund der Fehlererkennung verringert.
Ein Suchprozess, der unter Verwendung der wie vorstehend beschrieben ausgebildeten Suchdatei ausgeführt wird, ist in dem Ablaufdiagramm in Fig. 3 gezeigt und wird nachstehend beschrieben.
Ein Suchwort wird entsprechend einem Befehl des Suchprozesses eingegeben (S31). Das eingegebene Suchwort wird als Suchschlüssel bzw. Suchkode analysiert, der für den Suchprozess geeignet ist (S32). Der Suchkode wird mit der Suchdatei in dem externen Speicher 4 verglichen (S33). Wird ein Index, der mit dem Suchkode übereinstimmt, gefunden, werden diesem Index entsprechende Dokumentenadressinformationen zur Anwendungsseite zurückgegeben (S34).
Die durch die Dokumentenadressinformationen bestimmten und in dem externen Speicher 4 gespeicherten Bilddaten werden als Suchergebnis auf der Anzeige 6 angezeigt.
Ein Ablaufdiagramm in Fig. 5 zeigt Prozesse, bei denen Zeichen mit den Zeichen vor und nach der Erkennungskandidaten-Zeichengruppe aus den Textinformationen kombiniert werden und jedes Mal dann entwickelt werden, wenn der Suchprozess befohlen wird, wodurch ein Vergleich mit dem eingegebenen Suchwort ohne das vorherige Ausbilden der Suchdatei bewirkt wird.
Im Fall des Befehls der Ausbildung der Suchdatei für die in dem externen Speicher 4 gespeicherten Textinformationen wird die Art des Zeichenkodes für den Index, wenn die instruierten Textdaten in der Suchdatei registriert werden, bestimmt (S41), und ein Suchwort wird eingegeben (S42). Das eingegebene Suchwort wird als Suchschlüssel bzw. Suchkode analysiert, der für den Suchprozess geeignet ist (S43). Die instruierten Textinformationen werden in die Dokumentensucheinrichtung 3 aus dem externen Speicher 4 geladen (S44). Daten eines Zeichens werden aus den geladenen Textinformationen ausgelesen (S46). Wird festgestellt, dass der Zeichenschlüssel die Begrenzung anzeigt (S47), werden eine Vielzahl von Kandidaten bis zur nächsten Begrenzung und die bisherige Zeichenkette kombiniert, wodurch eine Vielzahl von Zeichenschlüsseln entwickelt wird. Wird in S47 festgestellt, dass keine Begrenzung enthalten ist, wird dieses eine Zeichen zu der Zeichenkette des Zeichenschlüssel an seinem Ende hinzugefügt (S49). Die Prozesse von S47 bis S49 werden solange wiederholt, bis festgestellt wird, dass der Zeichenschlüssel vollständig ist (S50).
Wird in S50 festgestellt, dass der Zeichenschlüssel vollständig ist, werden der ausgebildete Zeichenschlüssel (ein einzelner oder viele) und der in S43 erhaltene Suchkode verglichen (S51). Sind sie identisch (S52), wird eine Dokumentenadresse, an der die Bilddaten des Dokuments gespeichert sind, als Suchergebnis ausgegeben (S53).
Für die Datenbank wird eine Vielzahl von Einträgen bzw. Datensätzen auch durch Prozesse wie die vorstehend beschriebenen Prozesse ausgebildet, sodass eine Suche mit geringem Verlust unter Verwendung der Datenbank möglich ist.
Nachstehend wird ein bestimmtes Beispiel beschrieben.
Es wird angenommen, dass ein Satz wie "DATA" in einem Dokument enthalten ist.
Es wird angenommen, dass bei der Eingabe dieses Satzes durch die Bildabtasteinrichtung 1 und bei der Erkennung von "T" in einem Anfangserkennungsschritt S4 durch den OCR- Prozessor 2 die Erkennungswahrscheinlichkeit für dieses Zeichen geringer als Th1 trotz der Tatsache ist, dass die Erkennungswahrscheinlichkeiten der anderen Zeichen größer oder gleich Th1 sind. Es wird weiter angenommen, dass die Erkennungskandidaten ähnliche Wahrscheinlichkeiten kleiner als Th2 haben. Infolgedessen wird der Prozess S11 in S8 ausgewählt und Nmax Kandidaten werden aufeinanderfolgend entsprechend der Reihenfolge ab dem Kandidaten mit der größten Wahrscheinlichkeit ausgegeben.
Es wird angenommen, dass vier Kandidaten I, T, Y und J aufeinanderfolgend ausgegeben werden.
Der OCR-Prozessor 2 beschreibt die vorstehend angeführte Vielzahl der Kandidatenzeichen in dem folgenden Format. Bei diesem Beispiel wird mit der in S7 und S10 auszugebenden Begrenzung "*" das folgende Format erhalten.
* [Anzahl der Kandidaten] [Kandidatenzeichen 1]
[Kandidatenzeichen 2] [Kandidatenzeichen 3]
...*
Daher werden die vorstehend beschriebenen vier Kandidaten in Übereinstimmung mit T bei diesem Beispiel ausgegeben, und es in S5 wird festgestellt, dass die Wahrscheinlichkeiten der anderen Zeichen größer als Th1 sind. Ein Ausdruck für "DATA" in dem Fall, dass ein Zeichen der größten Wahrscheinlichkeit als Kandidatenzeichen in S6 ausgegeben wird, ergibt sich wie folgt.
"DA*4ITYJ*A"
Eine derartige Zeichenkodegruppe wird als Textinformationen in dem externen Speicher 4 gespeichert.
Andererseits interpretiert die Dokumentensucheinrichtung 3 das Format und bildet eine Suchdatei entsprechend dem Ablaufdiagramm in Fig. 2.
DAIA
DATA
DAYA
DAJA
Wird daher das Suchwort wie "DATA" über die Tastatur eingegeben und führt die Dokumentensucheinrichtung 3 den Dokumentensuchprozess entsprechend diesem Suchwort aus, kann das Dokument auch gefunden werden.
Obwohl bei dem Ausführungsbeispiel das Beispiel zur Verwendung bei der Dokumentensuche beschrieben wurde, kann die Erfindung auch bei der Suche unter Verwendung einer Datenbank angewendet werden.
Die Erfindung kann auch bei der Extraktion eines Dokumentenschlüsselworts, eines Seitenschlüsselworts oder dergleichen durch die OCR angewendet werden.
Des Weiteren kann die Erfindung auch durch ein ähnliches Verfahren für den Fall angewendet werden, dass die Erkennungswahrscheinlichkeit von Teilinformationen eines optischen Lesegeräts durch eine OMR oder Strichkodes gering ist.
Erfindungsgemäß kann eine Situation vermieden werden, dass in dem Fall, wenn die OCR-Erkennungswahrscheinlichkeit niedrig ist und nicht festgestellt werden kann, dass das Ergebnis sicher ist, die Erkennungskandidaten auf einen eingeengt werden, eine Vielzahl optimaler Erkennungskandidaten, die der Erkennungswahrscheinlichkeit entsprechen, werden ausgewählt, und die effektiven Erkennungskandidateninformationen können gespeichert und ohne Verwerfen effektiv verwendet werden.
Wie vorstehend beschrieben wird erfindungsgemäß der manuelle Korrekturvorgang des Erkennungsergebnisses beseitigt, die Prozesse von der Bildeingabe bis zur Speicherung der Bilddaten und Textdaten über die OCR können ohne Einflussnahme durch den Bediener durchgeführt werden, eine Verarbeitungsbelastung des Geräts kann verringert werden, die Verarbeitungsgeschwindigkeit kann erhöht werden, und ein kostengünstiges Gerät kann bereitgestellt werden.
Wie vorstehend beschrieben werden erfindungsgemäß in dem Fall, dass es eine Vielzahl von Erkennungskandidaten für ein eingegebenes Bild eines Zeichens gibt, Zeichen mit den Zeichen vor und nach diesen Zeichen kombiniert, und sie können entwickelt werden und eine Vielzahl von Indizes können ausgebildet werden, sodass das Fehlschlagen der Suche aufgrund der falschen Erkennung verringert werden kann.

Claims

1. Bliddatenverarbeitungsverfahren mit den Schritten

Eingeben von Zeichenbilddaten enthaltenden Daten,

Extrahieren eines Zeichenbildes aus den eingegebenen Bilddaten und

Bestimmen einer Vielzahl von Zeichencodes als wahrscheinliche Kandidaten für das extrahierte Zeichenbild,

gekennzeichnet durch den Schritt

Erzeugen einer linearen Kette von Zeichencodes mit der Vielzahl von Kandidatenzeichencodes und einem Zeichencode für ein Zeichenbild, das an das extrahierte Zeichenbild angrenzt.

2. Verfahren nach Anspruch 1, wobei es eine Vielzahl von Zeichenbildern gibt, die an das extrahierte Zeichenbild angrenzen, und die erzeugte lineare Kette der Zeichencodes einen Zeichencode für jedes angrenzende Zeichenbild aufweist.

3. Verfahren nach Anspruch 1 oder 2, ferner mit dem Schritt Speichern der erzeugten linearen Kette der Zeichen zur Verwendung in einem Suchprozess, der für die eingegebenen Bilddaten auszuführen ist.

4. Verfahren nach einem der vorhergehenden Ansprüche, wobei die Vielzahl der Kandidatenzeichencodes entsprechend einem Ergebnis bestimmt wird, das durch den Vergleich von Wahrscheinlichkeiten jeweiliger Zeichencodes mit einem Schwellenwert erhalten wird.

5. Verfahren nach einem der vorhergehenden Ansprüche, ferner mit dem Schritt Erzeugen von Informationen bezüglich der Anzahl der Zeichencodes in der Vielzahl der Kandidatenzeichencodes.

6. Verfahren nach einem der vorhergehenden Ansprüche, wobei die Vielzahl der Kandidatenzeichencodes in der linearen Kette der Zeichencodes durch ID-Informationen unterschieden wird, die dem extrahierten Zeichenbild entsprechende Informationen identifizieren können.

7. Verfahren nach einem der vorhergehenden Ansprüche, ferner mit den Schritten

Kombinieren jedes der Vielzahl der Kandidatenzeichencodes mit dem Zeichencode der an das extrahierte Zeichenbild angrenzenden Zeichenbilder zur Ausbildung jeweiliger Kandidatenworte,

Vergleichen der jeweiligen Kandidatenworte mit einem bestimmten Suchwort und

Identifizieren der eingegebenen Bilddaten, die dem jeweiligen Kandidatenwort entsprechen, das dem bestimmten Suchwort entspricht.

8. Verfahren nach einem der vorhergehenden Ansprüche, wobei die eingegebenen Bilddaten durch eine Abtasteinrichtung eingegeben werden.

9. Verfahren nach einem der Ansprüche 1 bis 7, wobei die eingegebenen Bilddaten durch ein Koordinateneingabegerät eingegeben werden.

10. Verfahren nach Anspruch 7, wobei die identifizierten eingegebenen Bilddaten durch einen Drucker ausgegeben werden.

11. Verfahren nach Anspruch 7 oder 10, wobei die identifizierten eingegebenen Bilddaten durch eine Anzeigeeinrichtung ausgegeben werden.

12. Verfahren nach einem der vorhergehenden Ansprüche, wobei die Vielzahl der Zeichencodes als wahrscheinliche Kandidaten durch ein optisches Zeichenerkennungsverfahren bestimmt wird.

13. Verfahren nach einem der Ansprüche 1 bis 11, wobei die Vielzahl der Zeichencodes als wahrscheinliche Kandidaten durch ein Ein-Zeilen-Zeichenerkennungsverfahren bestimmt wird.

14. Bilddatenverarbeitungsgerät mit

einer Eingabeeinrichtung (1) zur Eingabe von Zeichenbilddaten enthaltenden Bilddaten,

einer Extrahiereinrichtung zur Extraktion eines Zeichenbildes aus den eingegebenen Bilddaten und einer Bestimmungseinrichtung zur Bestimmung einer Vielzahl von Zeichencodes als wahrscheinliche Kandidaten für das extrahierte Zeichenbild,

gekennzeichnet durch

eine Erzeugungseinrichtung zur Erzeugung einer linearen Kette von Zeichencodes mit der Vielzahl der Kandidatenzeichencodes und einem Zeichencode für ein Zeichenbild, das an das extrahierte Zeichen angrenzt.

15. Gerät nach Anspruch 14, wobei die Erzeugungseinrichtung eine lineare Kette von Zeichencodes mit der Vielzahl der Kandidatenzeichencodes und einem Zeichencode für jedes der Vielzahl der Zeichenbilder erzeugt, die an das extrahierte Zeichenbild angrenzen.

16. Gerät nach Anspruch 14 oder 15, ferner mit einer Speichereinrichtung (4) zur Speicherung der erzeugten linearen Kette von Zeichen zur Verwendung in einem Suchprozess, der für die eingegebenen Bilddaten auszuführen ist.

17. Gerät nach einem der Ansprüche 14 bis 16, wobei die Bestimmungseinrichtung die Vielzahl der Kandidatenzeichencodes entsprechend einem Ergebnis bestimmt, das durch den Vergleich der Wahrscheinlichkeiten jeweiliger Zeichencodes mit Schwellenwerten erhalten wird.

18. Gerät nach einem der Ansprüche 14 bis 17, ferner mit einer Einrichtung zur Erzeugung von Informationen bezüglich der Anzahl der Zeichencodes in der Vielzahl der Kandidatenzeichencodes.

19. Gerät nach einem der Ansprüche 14 bis 18, ferner mit einer Einrichtung zur Unterscheidung der Vielzahl der Kandidatenzeichencodes in der linearen Kette der Zeichencodes durch ID-Informationen, die dem extrahierten Zeichenbild entsprechende Informationen identifizieren können.

20. Gerät nach einem der Ansprüche 14 bis 19, ferner mit

einer Einrichtung zur Kombination jedes der Vielzahl der Kandidatenzeichencodes mit den Zeichencodes der an das extrahierte Zeichenbild angrenzenden Zeichenbilder zur Ausbildung jeweiliger Kandidatenworte,

einer Einrichtung zum Vergleich der jeweiligen Kandidatenworte mit einem bestimmten Suchwort, und

einer Einrichtung zur Identifizierung der eingegebenen Bilddaten, die dem jeweiligen Kandidatenwort entsprechen, das dem bestimmten Suchwort entspricht.

21. Gerät nach einem der Ansprüche 14 bis 20, ferner mit einer Abtasteinrichtung (1) zur Eingabe der Bilddaten.

22. Gerät nach einem der Ansprüche 14 bis 20, ferner mit einer Koordinateneingabeeinrichtung zur Eingabe der Bilddaten.

23. Gerät nach einem der Ansprüche 14 bis 22, ferner mit einem Drucker zur Ausgabe der identifizierten eingegebenen Bildinformationen.

24. Gerät nach einem der Ansprüche 14 bis 23, mit einer Anzeigeeinrichtung (6) zur Ausgabe der identifizierten eingegebenen Bildinformationen.

25. Gerät nach einem der Ansprüche 14 bis 24, ferner mit einer optischen Zeichenerkennungseinrichtung (2) zur Bestimmung der Vielzahl der Zeichencodes.

26. Gerät nach einem der Ansprüche 14 bis 24, ferner mit einer Ein-Zeilen-Zeichenerkennungseinrichtung zur Bestimmung der Vielzahl der Zeichencodes.

27. Computerlesbarer Speicherträger, der von einem Computer ausführbare Verarbeitungsschritte zur Verarbeitung von Bilddaten speichert, wobei die Schritte umfassen

einen Eingabeschritt zur Eingabe von Zeichenbilddaten enthaltenden Bilddaten,

einen Extrahierschritt zur Extraktion eines Zeichenbildes aus den eingegebenen Bilddaten und einen Bestimmungsschritt zur Bestimmung einer Vielzahl von Zeichencodes als wahrscheinliche Kandidaten für das extrahierte Zeichenbild,

gekennzeichnet durch

einen Erzeugungsschritt zur Erzeugung einer linearen Kette von Zeichencodes mit der Vielzahl der Kandidatenzeichencodes und einem Zeichencode für ein an das extrahierte Zeichenbild angrenzendes Zeichenbild.

28. Computerlesbarer Speicherträger nach Anspruch 27, ferner mit einem Speicherschritt zur Speicherung der erzeugten linearen Kette der Zeichen zur Verwendung in einem Suchprozess, der für die eingegebenen Bilddaten auszuführen ist.