DE69330378T2 - Mustererkennung - Google Patents

Mustererkennung

Info

Publication number
DE69330378T2
DE69330378T2 DE69330378T DE69330378T DE69330378T2 DE 69330378 T2 DE69330378 T2 DE 69330378T2 DE 69330378 T DE69330378 T DE 69330378T DE 69330378 T DE69330378 T DE 69330378T DE 69330378 T2 DE69330378 T2 DE 69330378T2
Authority
DE
Germany
Prior art keywords
pattern
pattern recognition
recognition
patterns
dictionary
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
DE69330378T
Other languages
English (en)
Other versions
DE69330378D1 (de
Inventor
Toshiaki Yagasaki
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Application granted granted Critical
Publication of DE69330378D1 publication Critical patent/DE69330378D1/de
Publication of DE69330378T2 publication Critical patent/DE69330378T2/de
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/24Character recognition characterised by the processing or recognition method
    • G06V30/242Division of the character sequences into groups prior to recognition; Selection of dictionaries

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Discrimination (AREA)
  • Image Analysis (AREA)

Description

  • Die vorliegende Erfindung betrifft ein Verfahren zur Mustererkennung und ein Gerät zum Erkennen von Mustern. Insbesondere betrifft die vorliegende Erfindung ein Verfahren und ein Gerät, das sich den Eigenschaften eines unbekannten Musters anpaßt, wobei gefordert ist, das Muster zu erkennen.
  • In einem Mustererkennungssystem wird ein unbekanntes Muster, beispielsweise ein Muster, das aus einem Bildscanner hergeleitet oder durch eine Faksimileübertragung empfangen wird, analysiert, um die Identität des Musters zu bestimmen. Fig. 16 veranschaulicht einen typischen Mustererkennungsprozeß, der individuelle Zeichen in einem Bild identifiziert, das eine Vielzahl derartiger Zeichen enthält.
  • Wie in Fig. 16 gezeigt, wird ein Bild, das beispielsweise aus einem Bildscanner hergeleitet ist, in Schritt S1601 eingegeben, und die individuellen Zeichen im Bild werden in Schritt S1602 segmentiert. Schritte S1601 und S1602 werden typischerweise von einem Vielzweck-Hauptcomputer ausgeführt, der die in Schritt S1602 segmentierten Zeichen an eine anwendungsspezifische optische Zeichenerkennungseinrichtung sendet. In Schritt S1603 unterzieht die optische Zeichenerkennungseinrichtung die segmentierten Zeichen der Merkmalsauslese, wodurch ein Merkmalsvektor für ein unbekanntes Muster hergeleitet wird. Der Merkmalsvektor stellt verschiedene Merkmale dar, die das Muster betreffen, wie eine Strichposition, Richtung, Länge und so weiter. Dann wird in einem groben Klassifizierungsschritt 1604 der Merkmalsvektor für das unbekannte Muster mit einem Wörterbuch verglichen, das eine Vielzahl von Merkmalsvektoren für Standardmuster enthält. Insbesondere wird der Merkmalsvektor für das unbekannte Muster mit jedem Merkmalsvektor im Standardmusterwörterbuch verglichen, und ein Abstandswert wird errechnet, der den mathematischen Abstand zwischen dem Merkmalsvektor für das unbekannte Muster und dem Merkmalsvektor für das Normmuster darstellt. Die Abstandswerte werden sortiert, und die besten Kandidaten, beispielsweise die 52 Kandidaten, die dem Merkmalsvektor für das unbekannte Muster am nächsten sind, werden ausgewählt. In Schritt S1605 werden die besten Kandidaten der detaillierten Klassifizierung unterzogen. In der detaillierten Klassifizierung werden zusätzlich Diskriminantenfunktionen verwendet, beispielsweise eine Pseudo-Bayes-Diskriminantenfunktion, um den besten Kandidaten oder die besten Kandidaten aus jenen auszuwählen, die im groben Klassifizierungsschritt bestimmt wurden. Der beste Kandidat oder die besten Kandidaten für das unbekannte Muster werden dann zum Vielzweck-Hauptcomputer zurückgesandt, bei dem sie in Schritt S1606 der Nachverarbeitung unterzogen werden. Die Nachverarbeitung erfordert typischerweise eine Rechtschreibprüfung, eine Kontextüberprüfung und eine Syntaxverarbeitung und führt zu einer Auswahl eines Kandidaten für das unbekannte Muster.
  • Während der in Fig. 16 dargestellte Prozeß die Identifikation unbekannter Muster mit hoher Genauigkeit zuläßt, bleibt noch ein Problem übrig. Insbesondere haben zu erkennende Muster üblicherweise keine einheitliche Qualität oder Eigenschaften, und es nicht immer möglich, die unbekannten Muster zu erkennen, die andere Eigenschaften als jene erwarteten haben.
  • Es ist daher eine Aufgabe der vorliegenden Erfindung, ein Zeichenerkennungssystem zu schaffen, das sich den Eigenschaften des zu erkennenden Musters anpaßt.
  • Die japanische Patentzusammenfassung Nr. JP-A-59 045 585 offenbart eine Zeichenerkennungseinrichtung, bei der zur Verbesserung der Abtasteffizienz in einem Hauptwörterbuchspeicher gespeicherte Wörterbuchdaten durch Wörterbuchdaten ersetzt werden, die in einem Zusatzwörterbuchspeicher gespeichert sind, wenn eine vorbestimmte Anzahl von zurückgewiesenen Zeichen von einem Zähler gezählt worden sind.
  • Ein Artikel mit dem Titel "Specimen Identification Device" in IBM Technical Disclosure Bulletin in Band 6, Nr. 1, Juni 1963, New York, Seite 111, von J. Reines et al., offenbart einen automatischen Schriftart-Auswahlalgorithmus zum Optimieren der Zeichenerkennung, in der eine Varianz von Abständen zwischen Mitten segmentierter Zeichen in einer Zeichenspalte und eine Durchschnittsbreite und -höhe der Zeichen festgestellt werden zur Auswahl eines Entscheidungsbaumes verschiedener Schriftarten, die zur Erkennung der Zeichen in der Zeichenzeile verwendet werden.
  • Es ist zu würdigen, daß keines dieser Dokumente die Auswahl unter verschiedenen Modi der Mustererkennung abhandelt. Im ersten Dokument ist der Erkennungsmodus immer derselbe, und nur das Wörterbuch wird geändert. Das zweite Dokument führt einen äquivalenten Prozeß durch Ändern von Schriftarten aus.
  • In einem Aspekt der vorliegenden Erfindung ist ein Mustererkennungsgerät vorgesehen, wie es im Patentanspruch 1 angegeben ist.
  • In einem anderen Aspekt der vorliegenden Erfindung ist ein Verfahren der Mustererkennung vorgesehen, wie es im Patentanspruch 11 angegeben ist.
  • Diese kurze Zusammenfassung der Erfindung ist vorgesehen, um so die Natur der Erfindung schnell verstehen zu können. Ein genaueres und vollständiges Verstehen der Erfindung kann durch Bezug auf die nachstehende detaillierte Beschreibung in Verbindung mit der beiliegenden Zeichnung erzielt werden.
  • Fig. 1 ist ein Gesamtblockdiagramm eines Mustererkennungsgerätes nach der vorliegenden Erfindung;
  • Fig. 2 ist ein detailliertes Blockdiagramm der optischen Zeichenerkennungseinrichtung, die in Fig. 1 dargestellt ist;
  • Fig. 3 ist ein detailliertes Blockdiagramm der Grobklassifiziereinrichtung, die in Fig. 2 dargestellt ist;
  • Fig. 4 ist ein Ablaufdiagramm zum Beschreiben einer Operation des Grobklassifizierers, der in Fig. 3 gezeigt ist;
  • Fig. 5 ist ein Diagramm zur Erläuterung eines Steuerwortes, das im Grobklassifizierer von Fig. 3 verwendet wird;
  • Fig. 6 und 7 sind Ablaufdiagramme zur Erläuterung der Mustererkennung nach der Erfindung;
  • Fig. 8 ist eine Abwandlung der Zeichenerkennungseinrichtung von Fig. 2, die zur Erläuterung eines anderen Ausführungsbeispiels der Erfindung dient;
  • Fig. 9 ist ein Ablaufdiagramm zur Erläuterung der Arbeitsweise des Ausführungsbeispiels von Fig. 8;
  • Fig. 10 und 11 sind Blockdiagramme zum Darstellen alternativer Ausführungsbeispiele des Mustererkennungsgerätes nach der Erfindung;
  • Fig. 12 mit den Fig. 12(a) und 12(b) zeigt Ansichten zur Erläuterung von Beispielen der Mustererkennung nach der vorliegenden Erfindung;
  • Fig. 13 ist ein Ablaufdiagramm, das zur Erläuterung der Mustererkennung nach Fig. 12 verwendet wird;
  • Fig. 14 ist ein funktionales Blockdiagramm zur Erläuterung eines anderen Mustererkennungssystems nach der Erfindung;
  • Fig. 15 ist eine Ansicht, die ein Mustererkennungsergebnis nach dem System von Fig. 14 zeigt; und
  • Fig. 16 ist ein Ablaufdiagramm zur Erläuterung eines bekannten Mustererkennungsprozesses.
  • DETAILLIERTE BESCHREIBUNG DES BEVORZUGTEN AUSFÜHRUNGSBEISPIELS
  • Fig. 1 ist ein Gesamtblockdiagramm eines Mustererkennungsgerätes nach der vorliegenden Erfindung.
  • Wie in Fig. 1 gezeigt, enthält das Mustererkennungssystem eine Haupt-CPU 10, wie einen programmierbaren Mikroprozessor EZPS3500, eine Bilddateneingabeeinrichtung 11, wie einen Bildscanner oder eine Faksimileempfangseinheit, einen Bildspeicher 12 zum Speichern von durch die Eingabeeinrichtung eingegebene Bilddaten, eine Zeichenerkennungseinrichtung 14 zum Erkennen unbekannter Muster, die von der Haupt-CPU 10 über eine SCSI-Schnittstelle 13 übertragen werden und die Kandidaten für das unbekannte Muster zurück zur Haupt-CPU über die Schnittstelle 13 überträgt, einen Zeilenspeicher 15 zum Speichern, der Kandidaten, die von der Zeichenerkennungseinrichtung gesandt werden, und eine Anzeige 16 zum Anzeigen der Ergebnisse aus der Mustererkennung.
  • Fig. 2 ist ein detailliertes Blockdiagramm der Zeichenerkennungseinrichtung 14.
  • Wie in Fig. 2 gezeigt, enthält die Zeichenerkennungseinrichtung 14 einen Kommunikationsteil und einen Erkennungsteil. Der Kommunikationsteil enthält: einen Übertragungsbus 20, mit dem ein Mikroprozessor 21 verbunden ist, beispielsweise ein programmierbarer Mikroprozessor 68000, einen programmierbarer Nurlesespeicher ("PROM") 22 zum Speichern von Prozeßschritten, die vom Mikroprozessor 21 auszuführen sind, einen Pufferspeicher 24 zum Puffern der Übertragung an und von einer Haupt-CPU 10, eine DMA-Steuerung 25 zum Steuern des direkten Speicherzugriffs mit der Haupt-CPU 10, eine SCSI- Steuerung 26 zur Kommunikation mit der Haupt-CPU 10 über die Schnittstelle 13 und einen internen Pufferspeicher 27 zum Bereitstellen innerer Pufferungen zwischen dem Kommunikationsteil und dem Erkennungsteil. Der Erkennungsteil enthält einen Erkennungsbus 29, mit dem der zuvor genannte interne Pufferspeicher 27 sowie ein digitaler Signalprozessor ("DSP") 30 verbunden sind, wie beispielsweise der digitale Signalprozessor von Texas Instruments TMS320C25, einen PROM 31 zum Speichern von Prozeßschritten, die vom DSP 30 auszuführen sind, eine Merkmalsausleseeinrichtung zum Auslesen eines Merkmalsvektors aus einem unbekannten Muster, eine Grobklassifiziereinrichtung 34 zum Bereitstellen mehrerer Kandidaten, die aus Wörterbuch-ROM 35a und 35b für ein unbekanntes Muster ausgewählt werden, und einen detaillierten Wörterbuch-ROM 36 zum Bereitstellen detaillierter Wörterbuchdaten, durch die die Grobklassifizierungskandidaten angenähert werden und die der Haupt-CPU 10 zur Nachverarbeitung bereitgestellt werden.
  • Fig. 3 ist ein detailliertes Blockdiagramm der Grobklassifiziereinrichtung 34.
  • Wie in Fig. 3 gezeigt, enthält die Grobklassifiziereinrichtung 34 eine Hauptsteuerlogik 37 zum Steuern verschiedener Komponenten innerhalb der Grobklassifiziereinrichtung. Insbesondere steuert die Hauptsteuerlogik 37 die Wörterbuchsteuerung 39, den Klassifizierer 40, Sortierer 41 und die RAM-Steuerung 42, die wiederum den Daten-RAM 44 steuert. Die Hauptsteuerlogik 37 fügt auch ein "neu vorgeschlagenes Ausgangs"-Kennzeichen ("NPO"- Kennzeichen) dem DSP 30 hinzu, wenn ein neues Ausgangssignal verfügbar ist.
  • Genauer gesagt, die Wörterbuchsteuerung 39 stellt eine Steuerung für Wörterbuch-ROM 35a und 35b bereit. Wie in Fig. 3 gezeigt, stellt die Wörterbuchsteuerung 39 ein Verschachtelungssteuersignal 45 und ein Wörterbuchadressensignal 46 bereit. Diese Signale ermöglichen das parallele Lesen der Wörterbuch-ROM 35a und 35b, um so Merkmalsvektoren im Wörterbuch für den Klassifizierer 40 mit höherer Geschwindigkeit bereitzustellen, als wenn die Wörterbuch-ROM nacheinander ausgelesen würden. Falls erwünscht, können diese Signale zum Lesen von mehr als zwei Wörterbuch-ROM verwendet werden, obwohl dies nicht so dargestellt ist.
  • Der Klassifizierer 40 enthält zwei Recheneinheiten (eine für jeden Wörterbuch-ROM) zum Errechnen des Abstands zwischen einem Wörterbuchmerkmalsvektor und dem Merkmalsvektor für das unbekannte Muster. Unter Steuerung aus der Hauptsteuerlogik 37 errechnet der Klassifizierer 40 den Abstand gemäß einem der drei Abstandsfunktionen, nämlich der Mahalanobis-Abstandsfunktion, der Mittelwert-Abstandsfunktion und der Abstandsfunktion mittleren Quadrats. Genauer gesagt, die Mahalanobis- Abstandsfunktion errechnet das Produkt aus dem Merkmalsvektor X vom unbekannten Muster und dem Merkmalsvektor W aus dem Wörterbuch-ROM folgendermaßen:
  • (Xk * Zk) ... (1)
  • Wobei kmax die Dimensionalität des Merkmalsvektors ist, Z = -2C&supmin;¹ W (C ist die Durchschnittskovarianzmatrix von den Wörterbuchvektoren), X&sub0; = 1 und W&sub0; = WT C&supmin;¹ W.
  • Die mittlere absolute Abstandsfunktion summiert alle die absoluten Abstände zwischen dem Merkmalsvektor des unbekannten Muster und dem Merkmalsvektor aus dem Wörterbuch-ROM folgendermaßen:
  • Xk - Wk ... (2)
  • Die Abstandsfunktion mittleren Quadrats summiert das Quadrat des Abstands zwischen dem Merkmalsvektor des unbekannten Musters und dem Merkmalsvektor aus dem Wörterbuch-ROM folgendermaßen:
  • (Xk - Wk)² ... (3)
  • Der solchermaßen errechnet Abstandswert wird gemeinsam mit der Identität des Kandidaten, der dem Abstandswert entspricht, für den Sortierer 41 bereitgestellt. Der Sortierer 41 sortiert die Abstandswerte, die vom Klassifizierer 40 bereitgestellt werden, in eine aufsteigende oder abfallende Reihenfolge gemäß einem Steuersignal aus der Hauptsteuerlogik 37. Ein Sortierer, der als Sortierer 41 geeignet ist, wurde detailliert beschrieben in der Anmeldung mit Seriennummer 07/554 384, angemeldet am 19. Juli 1990, vom Erfinder der vorliegenden Anmeldung. Die Inhalte der Anmeldung mit der Seriennummer 07/554 384 sind hiermit als Bezug enthalten, wie nachstehend dargelegt.
  • Wenn der Klassifizierer 40 jeden Merkmalsvektor in den Wörterbuch-ROM 35a und 35b verarbeitet hat, veranlaßt die Hauptsteuerlogik 37 den Sortierer 41, sortierte Abstandswerte zu senden und zugehörige Kandidatenidentitäten an den Daten-ROM 44 zu übertragen. Unter Steuerung vom RAM 42 und der Hauptsteuerlogik 37 speichert der Daten-RAM 44 die sortierten Abstandswerte und die zugehörigen Kandidatenidentitäten in aufeinanderfolgenden Speicherorten. Um Speicherplatz im Daten- RAM 44 freizuhalten, ist es für den Daten-RAM vorzuziehen, nur einen der Abstandswerte von den Kandidatenidentitäten zu speichern, und diese Auswahl erfolgt gemäß der Steuerung aus der RAM-Steuerung 42.
  • Fig. 4 ist ein Ablaufdiagramm zum Erläutern der Arbeitsweise der Grobklassifiziereinrichtung 34.
  • In Schritt S41 schreibt der DSP 30 ein Steuerwort in ein Steuerregister 42a in der RAM-Steuerung 42. Bitzuordnungen für das Steuerwort sind in Fig. 5 gezeigt. Wie dort gezeigt, wird Bit 15 ein Startbit zum Anweisen der Grobklassifiziereinrichtung 34, die Klassifizierung und/oder Sortieraufgaben zu beginnen. Bit 14 ist ein Kennzeichenbit, das zum Anweisen der Einrichtung verwendet wird, ob die Abstandswerte aus dem Sortierer 41 im Daten-RAM 44 oder die Kandidatenidentitäten aus dem Sortierer 4 gespeichert werden sollen 1. Bit 13 zeigt auf, ob in aufsteigender oder absteigender Reihenfolge zu sortieren ist. Die Bits 9 und 10 zeigen auf, ob die Grobklassifiziereinrichtung einfach Abstandswerte errechnet ohne zu sortieren, einfach Daten im Daten-RAM 44 sortiert oder sowohl Abstandswerte errechnet als auch die errechneten Abstandswerte sortiert. Bits 7 und 8 spezifizieren, welche der Abstandsfunktionen vom Klassifizierer 40 verwendet werden, nämlich die zuvor genannte Mahalanobis- Abstandsfunktion, die Abstandsfunktion mittleren Absolutwertes oder die Abstandsfunktion mittleren Quadratwertes. Bit, 6 zeigt auf, ob die oberen 100 oder die oberen 52 Kandidaten im Daten- RAM 44 zu speichern sind. Bit 5 zeigt auf, wo der Datenzugriff in den Wörterbuch-ROM 35a und 35b beginnt. Wenn Bit 5 auf 1 ist, erfolgt der Zugriff auf die Wörterbuch-ROM vom Anfang an; wenn andererseits Bit 5 auf 0 ist, dann wird auf die Wörterbuch-ROM beginnend mit der letzten Zugriffsadresse zugegriffen. Bits 0, 1 und 2 zeigen den Wörterbuch-ROM-Modus auf, das heißt, die Anzahl von Wörterbuch-ROM, die in der Einrichtung vorgesehen sind, und die Verschachtelungskoordination für diese Wörterbuch-ROM.
  • Zurück zu Fig. 4: In Schritt S42 gibt der DSP 30 den Merkmalsrektor für das unbekannte Muster auf den Erkennungsbus 29, und die RAM-Steuerung 42 speichert den Merkmalsvektor in aufeinanderfolgenden Orten des Daten-RAM 44. In Schritt S43 wird der Sortierspeicher 41 auf einen vorbestimmten Wert beim Vorbereiten zu Sortieroperationen initialisiert. Wie in Seriennummer 07/554 384 beschrieben, kann der vorbestimmte Wert der maximal erwartete Abstandswert oder der minimal erwartete Abstandswert gemäß der Tatsache sein, ob eine aufsteigende oder eine abfallende Sortierung gewünscht ist. Wie ausführlicher beschrieben in Verbindung mit der Anmeldung der Bezeichnung "Method And Apparatus For Pattern Recognition", mit der vorliegenden Anmeldung am selben Tage vom selben Erfinder angemeldet, können andere Initialisierungswerte verwendet werden.
  • In Schritt S44 stellt der Daten-RAM 44 gemäß Startbit 15 den Merkmalsvektor des unbekannten Musters für den Klassifizierer 40 bereit. Die Wörterbuchsteuerung 39 greift dann auf die Wörterbuch-ROM 35a und 35b in der Sequenz zu, die vom ROM- Startadressenbit 5 bestimmt ist, und veranlaßt Merkmalsvektoren gemäß den Kandidatenmustern in den Wörterbuch-ROM, ebenfalls für den Klassifizierer 40 bereitgestellt zu werden. Im Falle der Mahalanobis-Funktion muß der Wörterbuchmerkmalsvektor W vorverarbeitet werden, wie oben für Gleichung (1) gezeigt. Obwohl nicht dargestellt, kann alternativ ein separates Wörterbuch vorgesehen sein lediglich zur Verwendung, wenn die Mahalanobis-Funktion ausgewählt ist. Das separate Wörterbuch könnte Merkmalsvektoren enthalten, die gemäß Gleichung (1) vorverarbeitet sind, und die direkt mit dem unbekannten Merkmalsvektor verwendet werden können.
  • In Schritt S45 errechnet der Klassifizierer 40 den Abstandswert zwischen dem unbekannten Merkmalsvektor und dem Kandidatenmerkmalsvektor. Die Auswahl der Abstandsfunktion, die zur Errechnung des Abstandswertes verwendet wird, erfolgt gemäß den Bits 7 und 8 des Steuerwortes, das im Steuerregister 42a gespeichert ist. Im Schritt S46 wird der neuerlich errechnete Abstandswert dem Sortierer 41 bereitgestellt. Der Sortierer 41 sortiert den neuen Abstandswert in die zuvor errechneten Abstandswerte, wie in der zuvor genannten U.S. Anmeldung mit der Seriennummer 07/554 384 beschrieben. Das Sortieren wird durchgeführt unter Verwendung von den oberen 100 oder den oberen 52 Kandidaten gemäß Bit 6 des Steuerwortes, das im Steuerregister 42a gespeichert ist, und wird gemäß Bit 13 in ansteigender oder abfallender Reihenfolge ausgeführt.
  • Wenn es zusätzliche Merkmalsvektoren gibt, die in die Wörterbuch-ROM 35a und 35b eingespeichert sind, dann kehrt die Steuerung in Schritt S47 zu Schritt S43 zurück. Wenn andererseits alle Merkmalsvektoren verarbeitet worden sind, dann schreitet der Ablauf fort zu Schritt S48, in dem die sortierten Abstandswerte gemeinsam mit den sortierten Kandidatenidentitäten dem Daten-RAM 44 bereitgestellt werden. Der RAM 44 speichert entweder die Abstandswerte oder die Kandidatenidentitäten gemäß Bit 14 des Steuerwortes, das im Steuerregister 42a gespeichert ist. Die Daten werden in aufeinanderfolgende Stellen des Daten- RAM 44 geschrieben und überschreiben die Daten des unbekannten Merkmalsvektors, der in Schritt S42 gespeichert wurde.
  • In Schritt S49 stellt die Grobklassifiziereinrichtung 34 ein NPO-Kennzeichen (siehe Fig. 3) auf den Signal-DSP 30, daß ein neu vorgeschlagenes Ausgangssignal fertig ist. Der digitale Signalprozessor 30 liest über den Erkennbus 29 den Daten-RAM 44 und verarbeitet die sortierten Daten, wie nachstehend detaillierter beschrieben ist.
  • Fig. 6 ist ein Ablaufdiagramm zur Erläuterung der Arbeitsweise des Mustererkennungsgerätes, das in den Fig. 1, 2 und 3 gezeigt ist. Die Verarbeitungsschritte, die in Fig. 6 dargestellt sind, werden in Form von Computerprogrammen in einem nicht dargestellten Speicher für die Haupt-CPU 10 gespeichert, im PROM 22 für den Mikroprozessor 21 und im PROM 31 für den DSP 30, und dies wird ausgeführt von der Haupt-CPU 10, dem Mikroprozessor 21 beziehungsweise dem digitalen Signalprozessor 30, wie aus der nachstehenden Beschreibung deutlich wird.
  • Bei der in Fig. 6 dargestellten Operation wird einer der Vielzahl unterschiedlicher Erkennungsmodi zum Erkennen eines unbekannten Musters gemäß den Eigenschaften des unbekannten Musters ausgewählt. Insbesondere wird die Diskriminantenfunktion ausgewählt, durch die das Muster erkannt wird, gemäß den Eigenschaften vom Muster. Im Falle, bei dem das zu erkennende Muster ein Zeichenmuster ist, enthalten die Bildeigenschaften die Bildqualität, die Schriftart und die Größe vom Schriftbild.
  • Somit werden in Schritt S601 Daten aus der Eingabeeinrichtung 11 in die Haupt-CPU 10 eingegeben. Die Haupt- CPU 10 speichert die Bilddaten im Bildspeicher 12.
  • In Schritt S602 wird die Diskriminantenfunktion, durch die das unbekannte Muster zu erkennen ist, manuell über eine Bedienschnittstelle auf der Haupt-CPU 10 bestimmt und auf Schnittstelle 13 zur Zeichenerkennungseinrichtung 14 übertragen. Die Bestimmung erfolgt in Abhängigkeit von der Qualität, der Schriftart und der Größe des Schriftbildes.
  • Tabelle 1 zeigt Diskriminantenfunktionen, die als zuverlässige Zeichenerkennungsergebnisse basierend auf der Bildqualität, der Schriftart und der Größe des Schriftbildes herausgefunden wurden. Wie in Tabelle 1 gezeigt, sollte somit in Schritt 8602 für gute Bilder großen Schriftbildes die mittlere absolute Abstandsdiskriminantenfunktion bestimmt werden. Für verschlechterte Bilder kleinen Schriftbildes sollte andererseits in Schritt S602 die Mahalanobis-Diskriminantenfunktion bestimmt werden. Zwischen diesen beiden Extremen sollte die spezielle Diskriminantenfunktion, die in Schritt S602 benannt werden sollte, manuell über die Bedienschnittstelle auf der Haupt-CPU gemäß der Bildqualität, der Schriftart und der Größe des Schriftbildes ausgewählt werden, wie in Tabelle 1 gezeigt. In Situationen, wie für die 9-Punkt-Standardschriftartenzeichen guter Bildqualität gezeigten, zeigt der Eintrag "MSD/MAD" sowohl die Abstandsfunktion mittleren Quadrats als auch die mittlere absolute Abstandsfunktion, die zuverlässige Zeichenerkennungsergebnisse bereitstellen, und jede Diskriminantenfunktion kann in Schritt S602 bestimmt werden.
  • In Schritt S603 segmentiert die Haupt-CPU 10 das Bild in individuelle Muster und überträgt die segmentierten Muster sequentiell zur Zeichenerkennungseinrichtung 14 über die Schnittstelle 13.
  • In Schritt S604 akzeptiert die Zeichenerkennungseinrichtung ein unbekanntes Muster über die SCSI-Steuerung 26 und speichert das unbekannte Muster in den Pufferspeicher 24. Der Pufferspeicher 24 wird vom Mikroprozessor 21 gesteuert, so daß er Muster speichert, die von der Haupt-CPU 10 kommen, umso einen kontinuierlichen Strom von Mustern auf den Erkennungsbus 29 zu liefern. Tabelle 1
  • Mahal = Mahalanobis-Abstandsfunktion
  • MSD = Abstandsfunktion mittleren Quadrats
  • MAD = mittlere absolute Abstandsfunktion
  • Die Schnittstelle zwischen dem Kommunikationsbus 20 und dem Erkennungsbus 29 wird bereitgestellt durch den internen Pufferspeicher 27.
  • In Schritt S605 wird das unbekannte Muster, das zum Erkennungsbus 29 über den internen Pufferspeicher 27 übertragen wurde, vom digitalen Signalprozessor 30 zur Merkmalsausleseeinrichtung 32 übertragen. Wie bekannt ist, bestimmt die Merkmalsausleseeinrichtung 32 einen Merkmalsvektor aus dem unbekannten Muster, in dem jede Komponente des Vektors ein anderes Merkmal des unbekannten Musters darstellt, wie eine Strichposition, Richtung, Länge und so weiter. Typischerweise werden etwa bis zu 200 unterschiedliche Merkmale für jedes unbekannte Muster ausgelesen.
  • In Schritt S606 schreibt der digitale Signalprozessor 30 ein · Steuerwort in das Steuerregister der Grobklassifiziereinrichtung 34, das die Grobklassifizierungseinrichtung anweist, sortierte Kandidatenidentitäten zurückzugeben, besser als sortierte Abstandswerte (das heißt, Bit 14 wird auf "0" gesetzt). Ein Untersatz des in Schritt S605 bestimmten Merkmalsvektors wird zum Daten-RAM 44 in der Grobklassifizierungseinrichtung übertragen. Das Startbit wird in die Grobklassifizierungseinrichtung gesetzt, um die Grobklassifizierungseinrichtung anzuweisen, den Merkmalsvektor vom unbekannten Muster mit den Merkmalsvektoren zu vergleichen, die in den Wörterbuch-ROM 35a und 35b gespeichert sind, wie zuvor anhand Fig. 4 beschrieben.
  • Nach Feststellung des NPO-Signals in Schritt S607 aus der Grobklassifiziereinrichtung 34 werden die sortierten Kandidatenidentitäten der Detailverarbeitung unterzogen, wodurch der in Schritt S605 ausgelesene Vollmerkmalsvektor verglichen wird mit den Vollmerkmalsvektoren, die im detaillierten Wörterbuch-ROM 36 gespeichert sind. Für diese detaillierte Verarbeitung können andere Diskriminantenfunktionen, wie die Pseudo-Bayes'sche Diskriminantenfunktion zusätzlich oder anstelle von der Mahalanobis-Abstandsfunktion oder der Abstandsfunktion mittleren quadratischen Wertes oder die Abstandsfunktion mittleren Absolutwertes verwendet werden. Bei der Pseudo-Bayes'schen Diskriminantenfunktionsverfahren werden die ersten k Elemente des Merkmalsvektors zur Abstandsberechnung verwendet. Dann wird durch Annahme, daß der Mittelwert der restlichen Elemente h ist, und unter Verwendung h anstelle der restlichen Elemente der Abstand errechnet. Ein derartiges Verfahren gestattet in kurzer Zeit die Abstandsberechnung für große Merkmalsvektoren. Wegen der in Schritt S606 ausgeführten Grobklassifizierung bedarf es keines Errechnens von Abstandsfunktionen für jede der Einträge in den detaillierten Wörterbuch-ROM 36; vielmehr müssen nur die Kandidatenidentitäten, die zum Grobklassifizierungsschritt zurückgegeben wurden, untersucht werden.
  • Die Kandidatenidentitäten, die als die besten für das unbekannte Muster im Detailverarbeitungsschritt S607 bestimmt sind, werden vom Erkennungsbus 29 zum Kommunikationsbus 20 über den internen Pufferspeicher 27 gesendet und von daher zur Haupt- CPU 10 über den Pufferspeicher 24 und die SCSI-Steuerung 26 über die Schnittstelle 13. In Schritt S608 führt die Haupt-CPU 10 eine Nachverarbeitung bezüglich der Kandidatenidentitäten durch, um die Identität für das unbekannte Muster zu bestimmen. Insbesondere, kann die Nachverarbeitung aus Rechtschreibprüfung, Syntaxüberprüfung, Kontextüberprüfung (beispielsweise Zurückweisen von Buchstaben, die in Zahlen eingebettet sind oder umgekehrt) und so weiter bestehen. Die Identität, die dem unbekannten Muster zugeordnet ist, wird im Zeichenspeicher 15 gespeichert und auf der Anzeige 16 angezeigt (Schritt S609).
  • In Schritt S610 wird bestimmt, ob es zusätzliche unbekannte Muster gibt, für die Identitäten gefordert sind. Wenn es zusätzliche Muster gibt, kehrt der Ablauf zu Schritt S604 zurück; wenn andererseits keine zusätzlichen Muster vorhanden sind, wird die Operation abgeschlossen.
  • Fig. 7 ist ein Ablaufdiagramm, das einen zweiten Operationsmodus für die in den Fig. 1, 2 und 3 gezeigte Mustererkennungseinrichtung darstellt, in der die zur Mustererkennung verwendete Diskriminantenfunktion gemäß den Bildeigenschaften ausgewählt wird. In Fig. 7 werden die Bilddaten auf der Grundlage der Anzahl von Zurückweisungen (das heißt, der Anzahl nicht erkennbarer Zeichen) gefolgert, mit denen während der Mustererkennung zu rechnen ist.
  • In Schritt S701 werden somit Bilddaten aus der Eingabeeinrichtung 11 in die Haupt-CPU 10 gegeben, die die Bilddaten im Bildspeicher 12 speichert. In Schritt S702 wird die Abstandsfunktion mittleren Absolutwertes in Vorbereitung zur Zeichenerkennung bestimmt.
  • Die Schritte S703 bis S708 sind im wesentlichen den Schritten S603 bis S609 gleich, und eine detaillierte Beschreibung dieser ist hier fortgelassen. In Schritt S709 wird die Identität im Zeichenspeicher 15 von der Haupt-CPU 10 gespeichert, die dem unbekannten Muster zugewiesen ist.
  • In Schritt S710 bestimmt die Haupt-CPU 10, ob eine vorbestimmte Anzahl von Mustern der Mustererkennung unterzogen worden ist. Im Falle der Zeichenerkennung entspricht die Anzahl vorbestimmter Zeichen etwa einer Seite an Zeicheninformation. Wenn eine bestimmte Anzahl von Muster noch nicht verarbeitet worden ist, kehrt der Ablauf zu Schritt S704 zurück, bis eine vorbestimmte Anzahl von Mustern der Mustererkennung unterzogen worden ist.
  • Wenn eine vorbestimmte Anzahl von Mustern der Mustererkennung unterzogen worden ist, dann schreitet der Ablauf fort zu Schritt S711, in dem die CPU 10 die Anzahl von Zurückweisungen zählt, die während der Mustererkennung auftreten. Eine Zurückweisung kann identifiziert werden beispielsweise durch die Technik, die in der zuvor zitierten U.S.-Anmeldung mit dem Titel "Method And Apparatus For Pattern Recognition" beschrieben worden ist.
  • Wenn in Schritt S712 die Anzahl von Zurückweisungen größer als ein vorbestimmter Pegel ist, dann wird bedacht, daß die Bildzeichen so sind, daß die mittlere absolute Abstandsfunktion zur Mustererkennung nicht geeignet ist. Folglich schreitet der Ablauf fort zu Schritt S713, in dem die Abstandsfunktion des mittleren Quadrats bestimmt wird, und die Mustererkennung wird wiederholt für die vorbestimmte Anzahl von Mustern, die in den Schritten. S703 bis S708 verarbeitet worden sind (Schritt S714).
  • In Schritt S715 wird die Anzahl von Zurückweisungen erneut gezählt, und wenn in Schritt S716 die Anzahl von Zurückweisungen größer als eine vorbestimmte Anzahl ist, dann wird in Betracht gezogen, daß die Bildqualität eine solche ist, daß die Abstandsfunktion mittleren Quadrats nicht passend für die Mustererkennung ist. Folglich wird die Mahalanobis- Abstandsfunktion für die Mustererkennung bestimmt (Schritt S717), und die Mustererkennung wird für die vorbestimmte Anzahl an Mustern wiederholt, die in Schritt S714 verarbeitet wurden (Schritt S718).
  • Wenn die Anzahl von Zurückweisungen nicht größer als eine vorbestimmte Anzahl ist (oder nachdem die Mahalanobis- Abstandsfunktion bestimmt worden ist), schreitet der Ablauf fort zu Schritt S719, in dem bestimmt wird, ob es zusätzliche unbekannte Muster gibt, für die die Identität gefordert wird. Wenn es zusätzliche Muster gibt, dann schreitet der Ablauf fort zu Schritt S720, in dem der Mustererkennungsprozeß fortgesetzt wird mit der Diskriminantenfunktion, die zuvor bestimmt worden war, das heißt, mit der Diskriminantenfunktion, die in Schritt S702, S713 oder in Schritt S717 bestimmt worden ist. Wenn es andererseits keine zusätzlichen Muster gibt, dann wird die Operation abgeschlossen.
  • Figur. 8 ist ein Blockdiagramm, das eine Abwandlung der in Fig. 2 gezeigten Mustererkennungseinrichtung darstellt. Im Blockdiagramm von Fig. 8 ist die Grobklassifiziereinrichtung 34 mit zwei unterschiedlichen Sätzen von Wörterbuch-ROM vorgesehen. Der Wörterbuch-ROM-Satz 135a und 135b stellt ein Wörterbuch von Merkmalsvektoren bereit, die passend sind für Bilder guter Qualität, wohingegen Wörterbuch-ROM-Satz 235a und 235b Wörterbuchvektoren bereitstellt, die passend sind, wenn die Bildqualität verschlechtert ist. Welcher der beiden Wörterbuch- ROM-Sätze während der Mustererkennung verwendet wird, erfolgt durch Steuerung gemäß Bits 2 bis 0 im Steuerwort, das in Fig. 5 gezeigt und im Steuerregister 42a gespeichert ist, und diese Bits werden in der nachstehend genauer beschriebenen Weise eingesetzt.
  • Fig. 9 ist ein Ablaufdiagramm zur Erläuterung der Operation vom Gerät in Fig. 8.
  • In Schritt S901 werden Bilddaten aus der Eingabeeinrichtung 11 in die Haupt-CPU 10 eingegeben, die die Bilddaten im Bildspeicher 12 speichert. In Schritt S902 wird ein Steuerwort in das Steuerregister 42a geschrieben, um so die Wörterbuchsätze 135a und 135b zu bestimmen, nämlich Wörterbuch-ROM, die Merkmalsrektoren enthalten, die zur Erkennung von Bildern guter Qualität geeignet sind.
  • In Schritt S903 wird die Mustererkennung ausgeführt, beispielsweise in der zuvor anhand der Schritte S603 bis S609 beschriebenen Weise, aber durch Bezug auf den Wörterbuch-ROM- Satz 135a und 135b, wie zuvor beschrieben.
  • In Schritt S904 wird bestimmt, ob die Erkennung für eine vorbestimmte Anzahl von Mustern ausgeführt worden ist, beispielsweise eine Anzahl von Zeichen gemäß einer Seite von Zeicheninformationen. Wenn nicht, kehrt der Ablauf zu Schritt S903 zurück, bis eine vorbestimmte Anzahl von Zeichen erkennungsverarbeitet worden ist.
  • Wenn eine vorbestimmte Anzahl von Zeichen erkennungsverarbeitet worden ist, schreitet der Ablauf fort zu Schritt S905, in dem die CPU 10 die Anzahl von Zurückweisungszeichen zählt (das heißt, die Anzahl von Mustern, die nicht erkennbar sind), die aufgekommen sind. Die Zurückweisungsverarbeitung kann durchgeführt werden gemäß der zuvor genannten Anmeldung mit dem Titel "Method And Apparatus For Pattern Recognition", gleichzeitig angemeldet vom hiesigen Erfinder.
  • Wenn in Schritt S906 die Anzahl von Zurückweisungen größer als die vorbestimmte Anzahl ist, dann schreitet der Ablauf fort zu Schritt S907, in dem der Wörterbuch-ROM-Satz 235a und 235b bestimmt wird. Wenn insbesondere die Anzahl von Zurückweisungen größer als eine vorbestimmte Anzahl ist, dann wird in Betracht gezogen, daß die Zeichen des zu erkennenden Musters so sind, daß die Wörterbuch-ROM für Bilder guter Qualität ungeeignet sind, und daß die Bildeigenschaften denjenigen eines verschlechterten Bildes entsprechen müssen. In Schritt S908 wird die Erkennung wiederholt für die vorbestimmte Anzahl von Zeichen, woraufhin der Ablauf fortschreitet zu Schritt S909. In Schritt S909 wird bestimmt, ob es zusätzliche Zeichen gibt, die eine Zeichenerkennung erfordern. Wenn es zusätzliche Zeichen gibt, dann schreitet der Ablauf fort zu Schritt S910, in dem die Zeichenerkennung unter Verwendung des Wörterbuch-ROM-Satzes ausgeführt wird, der zuvor bestimmt worden war. Wenn es keine zusätzlichen Zeichen zur Verarbeitung gibt, dann endet der Ablauf.
  • Fig. 10 veranschaulicht ein weiteres Ausführungsbeispiel eines Gerätes zur Mustererkennung nach der vorliegenden Erfindung. In Fig. 10 tragen Komponenten mit gleichen Funktionen wie jene zuvor beschriebenen dieselben Bezugszeichen.
  • Im Mustererkennungsgerät von Fig. 10 erzielt eine Haupt-CPU 10 Bilddaten aus einer Bilddateneingabeeinrichtung 11 und speichert die Bilddaten im Bildspeicher 12. Die Bilddaten im Bildspeicher werden von der CPU 10 in individuelle unbekannte Muster segmentiert, die über die Schnittstelle 13 zum Zeichenerkennungsgerät 14 gesendet werden. Die Zeichenerkennungseinrichtung 14 führt das Merkmalsauslesen aus, um einen Merkmalsvektor für das unbekannte Muster herzuleiten, führt eine Grobklassifizierung auf der Grundlage des Merkmalsvektors aus und eine detaillierte Klassifizierung auf der Grundlage der Ergebnisse der Grobklassifizierung. Dies alles ist bereits zuvor in Verbindung mit den Fig. 1 bis 9 beschrieben worden. Die Identitäten der Kandidaten aus der Detailverarbeitung werden zur Haupt-CPU 10 über Bus 13 zurückgesandt, woraufhin die Haupt-CPU die Nachverarbeitung ausgeführt, um die Identität des unbekannten Musters zu benennen.
  • Die Identitäten, die den unbekannten Mustern zugewiesen sind, werden über den Bus 51 in einen Lokalbereichsnetzbus 52 übertragen. Auf den Lokalbereichsnetzbus 52 wird zugegriffen durch eine Vielzahl alleinstehender Computer 53, wodurch jeder der alleinstehenden Computer selbst die Mustererkennungsfähigkeiten des Erkennungsgerätes nutzt.
  • Die Arbeitsweise des in Fig. 10 gezeigten Ausführungsbeispiels ist in allen anderen Punkten identisch mit der Operation der obigen Ausführungsbeispiele.
  • Fig. 11 veranschaulicht ein anderes Ausführungsbeispiel des Mustererkennungsgerätes nach der vorliegenden Erfindung. In Fig. 11 sind Elemente mit den Funktionen und Strukturen, die jenen zuvor beschriebenen gleichen, mit denselben Bezugszeichen versehen.
  • Wie in Fig. 11 gezeigt, ist ein Lokalbereichsnetzbus 52 vorgesehen mit einer Bilddateneingabeeinrichtung 11, einer Zeichenerkennungseinrichtung 14 und mehreren alleinstehenden Computern 53. Mit dieser Struktur ist jeder der alleinstehenden Computer 53 in der Lage, auf die Bilddateneingabefähigkeiten der Bilddateneingabeeinrichtung 11 zuzugreifen und die so empfangenen Bilddaten zu zur Zeichenerkennungseinrichtung 14 kanalisieren, um so die Identitäten von Kandidaten für unbekannte Muster zu bekommen. Diese Struktur beseitigt das Erfordernis des Bereitstellens einer Haupt-CPU und eines Bildspeichers; die von der Haupt-CPU 10 und vom Bildspeicher 12 in den vorherigen Ausführungsbeispielen ausgeführten Prozesse können durch die alleinstehenden Computer 53 ausgeführt werden.
  • Fig. 12 und 13 sind Ansichten zur Erläuterung einer Operation eines beliebigen der vorstehenden Ausführungsbeispiele für den Fall, bei dem die von der Eingabeeinrichtung 11 eingegebenen Bilddaten solche enthalten, die Zeichen darstellen, die gemischt sind mit Bilddaten, die Bilder darstellen. Wie insbesondere in Fig. 12(a) gezeigt, enthalten Bilddaten typischerweise Bereiche 61, die Bilder von Zeichen oder Textdaten darstellen, sowie Bereiche 62, die Nichtzeichenbilddaten darstellen, beispielsweise Graphen, Bilder, Tafeln und dergleichen. Für ein derartiges Bild ist es vorteilhaft, zwischen Zeichenbereichen 61 und Nichtzeichenbereichen 62 zu unterscheiden, um die Zeichenerkennung auf den Zeichenbereichen 61 auszuführen und die Darstellung des eingegebenen Bildes zu speichern, so daß Zeichenbereiche in die Identität der Zeichen decodiert werden, wohingegen die Bildbereiche als Bildinformation zurückgehalten werden, wie beispielsweise in Fig. 12(b) gezeigt.
  • Fig. 13 ist ein Ablaufdiagramm, das diesen Betriebsmodus veranschaulicht. In Schritt S1301 werden Bilddaten eingegeben. Die Bilddaten werden zum Identifizieren individueller Blöcke der Information inspiziert, und jeder individuelle Block an Information wird selektiert, ob der Block eine Zeicheninformation oder ob er eine Nichtzeicheninformation enthält (Schritt S1302). Ein derartiges Selektieren ist im Stand der Technik bekannt, wie beispielsweise beschrieben in den U.S.- Patenten 4 701 807 und 4 729 035.
  • Der Schritt S1303 bestimmt, ob der Zeichenblock in Schritt S1302 selektiert worden ist. Wenn ein Zeichenblock nicht selektiert worden ist, dann werden in Schritt S1304 die Bilddaten ohne Verarbeitung gespeichert. Wenn andererseits ein Zeichenblock selektiert worden ist, dann wird in Schritt S1305 die Zeichenerkennungsverarbeitung gemäß irgendeiner der zuvor beschriebenen Techniken ausgeführt. In Schritt S1306 wird die Identität erkannter Zeichen gespeichert.
  • In Schritt S1307 werden die gespeicherten Daten, ob nun Bild oder Zeichen, ausgegeben. In dieser Hinsicht können die gespeicherten Daten über ein Modem an eine Telefonschnittstelle ausgegeben werden. In diesem Falle werden Zeichendaten in Codeform ausgegeben, beispielsweise im ASCII-Code, während Bilddaten in Bildform ausgegeben werden, beispielsweise gemäß CCITT-Normen für die G3-Faksimileübertragung.
  • Fig. 14 und 15 sind Ansichten zur Erläuterung eines weiteren Ausführungsbeispiels der Erfindung, wobei es möglich ist, die Ergebnisse der Zeichenerkennung für wortverarbeiteten Text vorauszuschauen. Vorausschauen stellt eine Sicherheit bereit, daß die ursprüngliche wortverarbeitete Textdatei durch Mustererkennung aus einem Bild des wortverarbeiteten Textes wiederhergestellt werden kann. Im Falle, bei dem beispielsweise der wortverarbeitete Text ein an einen fernen Ort faksimileübertragener ist (beispielsweise durch "PC-Fax" direkt aus der Wortverarbeitungseinrichtung), stellt Vorausschauen sicher, daß das empfangene Bild am fernen Ort der Zeichenerkennung zum Zwecke des Wiederherstellens der ursprünglichen wortverarbeiteten Textdatei unterzogen wird.
  • Wie in Fig. 14 gezeigt, wird eine Textdatei 70 bei 71 ausgedruckt und per Faksimile bei 72 übertragen. Alternativ wird ein Ausdrucken vermieden unter Verwendung von "PC-Fax", und gezeigt durch den Punktepfeil wird die Textdatei 70 zu einem Druckbild unter 76 wiederhergestellt und unter 72 per Faksimile übertragen. Das beim Faksimileempfang 73 empfangene Bild wird der Zeichenerkennung bei 74 unterzogen, um bei 75 eine Textdatei zu schaffen. Die Zeichenerkennung 74 kann durch Mustererkennungssysteme ausgeführt werden, wie sie zuvor bei den Ausführungsbeispielen beschrieben worden sind.
  • Zur Sicherstellung, daß die Textdatei 75 dieselbe Information wie die Textdatei 70 enthält, sind die Ergebnisse der Bildumsetzung, des Übertragens und der Mustererkennung vorhergesehen. Somit wird die Textdatei 70 der elektronischen Bildumsetzung 76 unterzogen. Das so geschaffene Bild gibt verschiedene Schriftarten und Schriftgrößen wieder, die beim Ausdruck 71 verwendet werden. Das bei 76 umgesetzte Bild wird bei 77 der Zeichenerkennung unterzogen, um bei 78 eine Textdatei zu erstellen.
  • Die ursprüngliche Textdatei 70 wird bei 79 angezeigt, und die mustererkannte Textdatei 78 wird bei 80 angezeigt. Die Anzeigen können nebeneinander erfolgen, wie in Fig. 25 gezeigt, die das Auftreten von Daten auf der Anzeige darstellt. Darüber hinaus werden die Textdateien verglichen und Diskreganzen zwischen zwei Textdateien werden gemeldet. Solcherlei Diskrepanzen, wie jene, die in den umgekehrten Graphiken unter 90 aufgezeigt sind, zeigen an, daß der Übertragungsprozeß, der unter 71, 72, 73, 74 und 75 dargestellt ist, die Textdatei bei 75 erfolglos wiederherstellen wird. Folglich können Einstellungen in der Textdatei erfolgen oder die Textdatei kann ausgedruckt werden unter Verwendung unterschiedlicher Schriftarten, Stil, Größe und so weiter. Derartige Abwandlungen werden durchgeführt, falls erforderlich, bis die Textdatei 78 mit der Textdatei 70 identisch ist. An diesem Punkt kann sichergestellt werden, daß der Übertragungsprozeß 72 zu einer Textdatei 78 führt, die identisch mit der Textdatei 70 ist.

Claims (21)

1. Mustererkennungsgerät, mit:
einem Segmentierungsmittel (CPU 10) zum Segmentieren von Bildinformationen in Mustersegmente; und
einem Mustererkennungsmittel (14) zum Bereitstellen eines Kandidaten für ein Mustersegment, wobei das Mustererkennungsmittel über eine Vielzahl von Erkennungsmodi verfügt, von denen eines der Vielzahl von Erkennungsmodi anfänglich bestimmt wird in einem ersten Erkennungsverarbeitungsschritt zum Bereitstellen von Kandidaten für Mustersegmente; dadurch gekennzeichnet, daß des weiteren vorgesehen sind:
ein Bestimmungsmittel zum Bestimmen, ob eine erste vorbestimmte Anzahl von Mustern der Mustererkennung (CPU 10, S710, S904) unterzogen worden sind, und
ein Zurückweisungszeichen-Untersuchungsmittel (CPU 10, S712, S906), das betriebsbereit ist, nachdem das Bestimmungsmittel bestimmt hat, daß eine vorbestimmte Anzahl von Mustern der Mustererkennung unterzogen worden sind, um die Anzahl von Zurückweisungszeichen in erkennungsverarbeiteten Mustersegmenten mit einer zweiten vorbestimmten Anzahl zu vergleichen,
wobei des Mustererkennungsmittels eingerichtet ist zum Bestimmen eines anderen der Vielzahl von Mustererkennungsmodi in einem zweiten Erkennungsverarbeitungsschritt, wenn die Anzahl von Zurückweisungszeichen größer als die zweite vorbestimmte Anzahl ist.
2. Gerät nach Anspruch 1, mit einem Merkmalsauslesemittel zum Auslesen eines Merkmalsvektors aus dem unbekannten Muster, wobei das Mustererkennungsmittel ein Merkmal der Vektoren vom unbekannten Muster mit Merkmalsvektoren bekannter Muster vergleicht.
3. Gerät nach Anspruch 1 oder 2, bei dem das Mustererkennungsmittel ein erstes und ein zweites Wörterbuch enthält, und wobei die Vielzahl von Erkennungsmodi einen ersten Modus enthält, der das erste Wörterbuch verwendet, und einen zweiten Modus, der das zweite Wörterbuch verwendet, und wobei das Mustererkennungsmittel eingerichtet ist, anfänglich den ersten Modus auszusuchen, und bei dem der Wähler eingerichtet ist zur Auswahl des zweiten Modus, wenn das Zurückweisungszählmittel einen Zählstand erreicht, der größer als die vorbestimmte Anzahl von Zurückweisungen ist.
4. Gerät nach Anspruch 3, bei dem das erste Wörterbuch Mustern guter Qualität entspricht und bei dem das zweite Muster schlechteren Mustern entspricht.
5. Gerät nach einem der vorstehenden Ansprüche, bei dem jede der Vielzahl von Erkennungsmodi eine unterschiedliche Entscheidungsfunktion zum Erkennen von Mustern verwendet.
6. Gerät nach Anspruch 5. bei dem das Mustererkennungsmittel eingerichtet ist zur Auswahl einer Mahalanobis- Entscheidungsfunktion für ein schlechteres Muster und für ein Muster mit kleinem Schriftbild.
7. Gerät nach Anspruch 5 oder 6, bei dem das Mustererkennungsmittel eingerichtet ist zur Auswahl einer Entscheidungsfunktion mittleren absoluten Abstands für ein klares Muster und für ein Muster mit einem großen Schriftbild.
8. Gerät nach einem der vorstehenden Ansprüche, mit einem Netzwerkbus, an den ein Hauptcomputer angeschlossen ist, und wobei der Hauptcomputer auf Befehle auf dem Netzwerkbus zur Mustererkennung anspricht.
9. Gerät nach einem der vorstehenden Ansprüche, das des weiteren über ein Unterscheidungsmittel verfügt, um zwischen Zeichenmustern und Nichtzeichenmustern in der Bildinformation zu unterscheiden, und wobei das Mustererkennungsmittel eingerichtet ist, einen Kandidaten dann bereitzustellen, wenn ein Zeichenmuster vom Unterscheidungsmittel unterschieden ist.
10. Gerät nach einem der vorstehenden Ansprüche, mit:
einem Lokalbereichs-Netzwerkbus (52);
einer Bildeingabeeinrichtung (11), die mit dem Netzwerkbus verbunden ist, wobei die Bildeingabeeinrichtung der Eingabe von Bildinformationen dient; und wobei
Mustererkennungsmittel mit dem Netzwerkbus verbunden sind;
eine Mehrzahl von Verarbeitungsmitteln (53) mit dem Netzwerkbus verbunden ist, wobei jedes Verarbeitungsmittel in der Lage ist, das Ausgangssignal vom Mustererkennungsmittel zu verwenden.
11. Verfahren zur Mustererkennung, mit den Verfahrensschritten:
Segmentieren von Bildinformationen in Mustersegmente; und
Anwenden eines Mustererkennungsmittels (14) zum Bereitstellen eines Kandidaten für ein Mustersegment, wobei das Mustererkennungsmittel über eine Vielzahl von Erkennungsmodi verfügt, von denen eines der Vielzahl von Erkennungsmodi anfänglich in einem ersten Verarbeitungsschritt der Erkennung bestimmt wird, um Kandidaten für Mustersegmente bereitzustellen;
gekennzeichnet durch die weiteren Verfahrensschritte:
Bestimmen, ob eine erste Anzahl von Mustern der Mustererkennung (CPU 10, 5710, 5904) unterzogen worden ist;
Vergleichen der Anzahl von Zurückweisungszeichen in den erkennungsverarbeiteten Mustersegmenten mit einer zweiten vorbestimmten Anzahl, nachdem bestimmt ist, daß eine vorbestimmte Anzahl von Mustern der Mustererkennung unterzogen worden ist, und
Bestimmen eines anderen der mehreren Mustererkennungsmodi in einem zweiten Erkennungsverarbeitungsprozeß, wenn die Anzahl von Zurückweisungszeichen größer als die zweite vorbestimmte Anzahl ist.
12. Verfahren nach Anspruch 11, mit dem weiteren Verfahrensschritt des Auslesens eines Merkmalvektors aus dem unbekannten Muster; wobei das Mustererkennungsmittel ein Merkmal der Vektoren vom unbekannten Muster mit Merkmalsvektoren bekannter Muster vergleicht.
13. Verfahren nach Anspruch 11 oder 12, bei dem das Mustererkennungsmittel über ein erstes und ein zweites Wörterbuch verfügt, und wobei die Vielzahl von Erkennungsmodi einen ersten Modus enthält, der das erste Wörterbuch verwendet, und einen zweiten Modus, der das zweite Wörterbuch verwendet, und wobei das Mustererkennungsmuster eingerichtet ist, anfangs den ersten Modus auszuwählen, und im Falle, bei dem das Zurückweisungszählmittel einen Zählwert erreicht, der größer als eine vorbestimmte Anzahl von Zurückweisungen ist, dann ist der Wähler eingerichtet zur Auswahl des zweiten Modus.
14. Verfahren nach Anspruch 13, bei dem das erste Wörterbuch Mustern guter Qualität entspricht, und bei dem das zweite Wörterbuch Mustern schlechterer Qualität entspricht.
15. Verfahren nach einem der Ansprüche 11 bis 14, bei dem die Vielzahl von Erkennungsmodi eine unterschiedliche Entscheidungsfunktion zur Erkennung von Mustern verwendet.
16. Verfahren nach Anspruch 15, bei dem das Mustererkennungsmittel eingerichtet ist zur Auswahl einer Mehalanobis-Entscheidungsfunktion für ein schlechteres Muster und für ein Muster mit kleinem Schriftbild.
17. Verfahren nach Anspruch 15 oder 16, bei dem das Mustererkennungsmittel eingerichtet ist zur Auswahl einer Entscheidungsfunktion des mittleren absoluten Abstands für ein klares Muster und für ein Muster mit großem Schriftbild.
18. Verfahren nach einem der Ansprüche 11 bis 17, mit einem Netzwerkbus, an den ein Hauptcomputer angeschlossen ist, und wobei der Hauptcomputer auf Befehle auf dem Netzwerkbus zur Mustererkennung anspricht.
19. Verfahren nach einem der Ansprüche 11 bis 18, mit dem weiteren Verfahrensschritt des Verwendens eines Unterscheidungsmittels, um zwischen Zeichenmustern und Nichtzeichenmustern in der Bildinformation zu unterscheiden, und wobei das Mustererkennungsmittel eingerichtet ist, einen Kandidaten dann bereitzustellen, wenn ein Zeichenmuster vom Unterscheidungsmittel herausgefunden ist.
20. Verfahren nach einem der Ansprüche 11 bis 19, mit den Verfahrensschritten des Verwendens von:
einer Bildeingabeeinrichtung (11), die mit einem Lokalbereichs-Netzwerkbus (52) verbunden ist;
Eingeben der Bildinformation; und wobei
Mustererkennungsmittel mit dem Netzwerkbus verbunden sind;
und wobei
eine Vielzahl von Verarbeitungsmitteln (53) mit dem Netzwerkbus verbunden sind, wobei jedes Verarbeitungsmittel in der Lage ist, das Ausgangssignal vom Mustererkennungsmittel zu verwenden.
21. Speicherträger, der prozessorrealisierbare Befehle zum Steuern eines Prozessors speichert, um das Verfahren nach einem der Ansprüche 10 bis 20 auszuführen.
DE69330378T 1992-02-07 1993-01-29 Mustererkennung Expired - Lifetime DE69330378T2 (de)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US07/832,725 US5901255A (en) 1992-02-07 1992-02-07 Pattern recognition method and apparatus capable of selecting another one of plural pattern recognition modes in response to a number of rejects of recognition-processed pattern segments

Publications (2)

Publication Number Publication Date
DE69330378D1 DE69330378D1 (de) 2001-08-02
DE69330378T2 true DE69330378T2 (de) 2002-05-16

Family

ID=25262460

Family Applications (1)

Application Number Title Priority Date Filing Date
DE69330378T Expired - Lifetime DE69330378T2 (de) 1992-02-07 1993-01-29 Mustererkennung

Country Status (4)

Country Link
US (1) US5901255A (de)
EP (1) EP0555023B1 (de)
JP (1) JPH05282452A (de)
DE (1) DE69330378T2 (de)

Families Citing this family (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6400996B1 (en) 1999-02-01 2002-06-04 Steven M. Hoffberg Adaptive pattern recognition based control system and method
US6418424B1 (en) 1991-12-23 2002-07-09 Steven M. Hoffberg Ergonomic man-machine interface incorporating adaptive pattern recognition based control system
US6850252B1 (en) 1999-10-05 2005-02-01 Steven M. Hoffberg Intelligent electronic appliance system and method
US10361802B1 (en) 1999-02-01 2019-07-23 Blanding Hovenweep, Llc Adaptive pattern recognition based control system and method
US8352400B2 (en) 1991-12-23 2013-01-08 Hoffberg Steven M Adaptive pattern recognition based controller apparatus and method and human-factored interface therefore
DE69519323T2 (de) * 1994-04-15 2001-04-12 Canon Kk System zur Seitensegmentierung und Zeichenerkennung
US5835633A (en) * 1995-11-20 1998-11-10 International Business Machines Corporation Concurrent two-stage multi-network optical character recognition system
US6370269B1 (en) * 1997-01-21 2002-04-09 International Business Machines Corporation Optical character recognition of handwritten or cursive text in multiple languages
US7904187B2 (en) 1999-02-01 2011-03-08 Hoffberg Steven M Internet appliance system and method
US6567547B1 (en) * 1999-03-05 2003-05-20 Hewlett-Packard Company System and method for dynamically switching OCR packages
US6616704B1 (en) * 2000-09-20 2003-09-09 International Business Machines Corporation Two step method for correcting spelling of a word or phrase in a document
SE521911C2 (sv) 2001-01-15 2003-12-16 Decuma Ab Ideon Res Park Metod, anordning och datorprogram för igenkänning av ett handskrivet tecken
US9065727B1 (en) 2012-08-31 2015-06-23 Google Inc. Device identifier similarity models derived from online event signals
US20070226321A1 (en) * 2006-03-23 2007-09-27 R R Donnelley & Sons Company Image based document access and related systems, methods, and devices
JP5361174B2 (ja) * 2007-11-30 2013-12-04 キヤノン株式会社 表示制御装置、表示制御方法、およびプログラム
JP5202148B2 (ja) * 2008-07-15 2013-06-05 キヤノン株式会社 画像処理装置、画像処理方法、及びコンピュータプログラム
JP5228872B2 (ja) * 2008-12-16 2013-07-03 富士通株式会社 生体認証装置、生体認証方法及び生体認証用コンピュータプログラムならびにコンピュータシステム
KR100984721B1 (ko) * 2009-12-04 2010-10-01 장진혁 멀티미디어 재생 시스템, 장치 및 방법
JP5814700B2 (ja) * 2011-08-25 2015-11-17 キヤノン株式会社 画像処理システム及び画像処理方法
US9053185B1 (en) 2012-04-30 2015-06-09 Google Inc. Generating a representative model for a plurality of models identified by similar feature data
US8914500B1 (en) 2012-05-21 2014-12-16 Google Inc. Creating a classifier model to determine whether a network user should be added to a list
US8886575B1 (en) 2012-06-27 2014-11-11 Google Inc. Selecting an algorithm for identifying similar user identifiers based on predicted click-through-rate
US8874589B1 (en) 2012-07-16 2014-10-28 Google Inc. Adjust similar users identification based on performance feedback
US8782197B1 (en) 2012-07-17 2014-07-15 Google, Inc. Determining a model refresh rate
US8886799B1 (en) 2012-08-29 2014-11-11 Google Inc. Identifying a similar user identifier
JP2014215877A (ja) * 2013-04-26 2014-11-17 株式会社デンソー 物体検出装置
JP6812387B2 (ja) * 2018-07-02 2021-01-13 キヤノン株式会社 画像処理装置及び画像処理方法、プログラム、記憶媒体
CN111429511B (zh) * 2020-04-02 2023-11-03 京东科技信息技术有限公司 机柜中设备位置确定方法、故障检测方法、装置及系统

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE3026055C2 (de) * 1980-07-09 1984-01-12 Computer Gesellschaft Konstanz Mbh, 7750 Konstanz Schaltungsanordnung zur maschinellen Zeichererkennung
JPS5945585A (ja) * 1982-09-06 1984-03-14 Ricoh Co Ltd 文字認識装置
JPS5971581A (ja) * 1982-10-05 1984-04-23 Fujitsu Ltd 画像認識方法
JPS59223073A (ja) 1983-06-01 1984-12-14 Canon Inc 画像処理装置
US4701807A (en) * 1983-09-22 1987-10-20 Canon Kabushiki Kaisha Method and apparatus for processing an image
US4521909A (en) * 1983-10-04 1985-06-04 Wang Laboratories, Inc. Dual level pattern recognition system
JPH0650538B2 (ja) * 1984-03-28 1994-06-29 株式会社日立製作所 手書き文字・図形認識の認識モード指定方法
US5077807A (en) * 1985-10-10 1991-12-31 Palantir Corp. Preprocessing means for use in a pattern classification system
JPS63311583A (ja) * 1987-06-15 1988-12-20 Fuji Xerox Co Ltd 手書き文字認識システム
US5191622A (en) * 1987-07-17 1993-03-02 Hitachi, Ltd. Hand-written character recognition apparatus with a personal dictionary preparation function
US5040223A (en) * 1988-02-17 1991-08-13 Nippondenso Co., Ltd. Fingerprint verification method employing plural correlation judgement levels and sequential judgement stages
JPH01246678A (ja) * 1988-03-29 1989-10-02 Toshiba Corp パターン認識装置
JPH02202689A (ja) * 1989-02-01 1990-08-10 Fujitsu Ltd 文字認識装置
JPH0821065B2 (ja) * 1989-03-13 1996-03-04 シャープ株式会社 文字認識装置
JP2930612B2 (ja) * 1989-10-05 1999-08-03 株式会社リコー 画像形成装置
US5303381A (en) * 1990-07-19 1994-04-12 Canon Kabushiki Kaisha Method and apparatus for sorting sequential input signals by concurrently comparing successive input signals among signals in first and second memory sections

Also Published As

Publication number Publication date
JPH05282452A (ja) 1993-10-29
US5901255A (en) 1999-05-04
EP0555023A2 (de) 1993-08-11
DE69330378D1 (de) 2001-08-02
EP0555023A3 (de) 1994-03-09
EP0555023B1 (de) 2001-06-27

Similar Documents

Publication Publication Date Title
DE69330378T2 (de) Mustererkennung
DE69328640T2 (de) Verfahren und Einrichtung zur Mustererkennung
DE69517564T2 (de) Verfahren und Gerät zur Erzeugung einer hybriden Datenstruktur zur Anzeige eines Rasterbildes
DE69230632T2 (de) Optische Worterkennung durch Wortgestaltuntersuchung
DE69604481T2 (de) Verfahren und gerät zum trennen des vordergrunds und hintergrunds in textenthaltenden bildern
DE69519323T2 (de) System zur Seitensegmentierung und Zeichenerkennung
DE69516751T2 (de) Bildvorverarbeitung für Zeichenerkennungsanlage
DE69430685T2 (de) Zur Erkennung farbiger Zeichen geeignetes Bildverarbeitungssystem
DE69523970T2 (de) Dokumentspeicher- und Wiederauffindungssystem
DE69226846T2 (de) Verfahren zur Bestimmung von Wortgrenzen im Text
DE69230633T2 (de) Verfahren zur Ermittlung von Wortformen zum folgenden Vergleich
DE69414530T2 (de) Bildkompression von Dokumenten mit Aufgeben des Formblattes
DE69722971T2 (de) Automatisches sprachenerkennungssystem für die mehrsprachige optische zeichenerkennung
DE69230631T2 (de) Verfahren zum Vergleichen von Wortgestalten
DE3851867T2 (de) Zeichenerkennungsgerät.
DE19705757C2 (de) Verfahren zum Erkennen eines Eingabemusters und zum Erzeugen einer Datenbank sowie Zeichenerkennungssystem
DE69228895T2 (de) Auswahlvorrichtung für ein Symbolermittlungssystem mit mehreren Zeichenerkennungsprozessoren
DE69130469T2 (de) Gerät und Verfahren zur Bildverarbeitung
DE69721941T2 (de) Gerät und Verfahren zum Extrahieren von Mustern
DE69506610T2 (de) Programmierbare Funktionstasten für vernetzten persönlichen Bildcomputer
DE68928703T2 (de) Buchstabenerkennungsvorrichtung
DE69920296T2 (de) Verfahren und Vorrichtung zum Registrieren und Vergleichen von Handflächenabdrücken
DE69610230T2 (de) Verfahren und Gerät zur Bildverarbeitung
DE2640537A1 (de) Verfahren und vorrichtung zum unterscheiden zwischen n groesser als 2 alphabeten angehoerenden zeichen
DE4311172A1 (de) Verfahren und Einrichtung zum Korrigieren der Schräge eines Vorlagenbildes sowie Vorlagensegmentierungssystem

Legal Events

Date Code Title Description
8364 No opposition during term of opposition
R071 Expiry of right

Ref document number: 555023

Country of ref document: EP