DE3632832A1 - Zeichenerkennungssystem - Google Patents

Zeichenerkennungssystem

Info

Publication number
DE3632832A1
DE3632832A1 DE19863632832 DE3632832A DE3632832A1 DE 3632832 A1 DE3632832 A1 DE 3632832A1 DE 19863632832 DE19863632832 DE 19863632832 DE 3632832 A DE3632832 A DE 3632832A DE 3632832 A1 DE3632832 A1 DE 3632832A1
Authority
DE
Germany
Prior art keywords
character
block
blocks
level
segmentation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
DE19863632832
Other languages
English (en)
Inventor
Keiko Abe
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Publication of DE3632832A1 publication Critical patent/DE3632832A1/de
Withdrawn legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/158Segmentation of character regions using character size, text spacings or pitch estimation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Multimedia (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Character Input (AREA)
  • Character Discrimination (AREA)

Description

Die vorliegende Erfindung bezieht sich allgemein auf ein Zeichenerkennungssystem zum Erkennen von Zeichen, z. B. Schriftzeichen, in einer Dokumentvorlage. Insbesondere bezieht sich die Erfindung auf ein Zeichenerkennungssystem, das speziell zum Erkennen von Zeichen bestimmt ist, die voneinander getrennte Zeichenkomponenten aufweisen, wie beispielsweise chinesische Schriftzeichen, japanische "Hiragana"- u. "Katakana"-Schriftzeichen usw.. Außerdem bezieht sich die Erfindung auf ein Zeichenerkennungssystem, das für das Aufnehmen von Zeichendaten von einer Dokumentvorlage geeignet ist, die ein Gemisch aus japanischen oder chinesischen und alphabetischen Schriftzeichen, wie beispielsweise aus dem Englischen, dem Deutschen usw., enthält.
In den vergangenen Jahren sind verschiedenartige Zeichenerkennungssysteme zum Aufnehmen von Zeichendaten von einer Dokumentvorlage entwickelt und vorgeschlagen worden. In solchen Zeichenerkennungssystemen besteht eine Schwierigkeit in dem Aufnehmen von Zeichendaten von der Dokumentvorlage, die in Japanisch, Chinesisch usw. geschrieben ist. Die Schwierigkeit ergibt sich aus dem Vorhandensein von einigen Zeichen im Japanischen, Chinesischen oder anderen vergleichbaren Sprachen, die Unterbrechungsstellen oder voneinander getrennte Zeichenkomponenten aufweisen. Beispielsweise hat das japanische Kanji-Schriftzeichen, das die Bedeutung "Fluß" hat, drei sich im wesentlichen senkrecht erstreckende und voneinander getrennte Zeichenkomponenten, und das japanische Hiragana-Schriftzeichen, das etwa wie "ei" ausgesprochen wird, hat zwei im wesentlichen sich vertikal erstreckende und voneinander getrennte Zeichenkomponenten. In der vorliegenden Beschreibung werden solche Zeichen, die voneinander getrennte Zeichenkomponenten aufweisen, durchwegs als "trennende" Zeichen bezeichnet.
Das Zeichenerkennungssystem extrahiert oder segmentiert im allgemeinen jedes Zeichen in der Dokumentvorlage und vergleicht die Zeichenstruktur mit voreingestellten Daten, um so das Zeichen zu erkennen. Das erkannte Zeichen wird üblicherweise in einen computergerechten Code, beispielsweise den ASCII-Code oder einen ähnlichen Code, umgesetzt. Ein genaues Extrahieren der "trennenden" Zeichen war bisher sehr schwierig, und zwar wegen des Vorhandenseins des Zwischenraums oder der Diskontinuität zwischen den Zeichenkomponenten.
Andererseits ist im Englischen, im Deutschen oder einer anderen mit alphabetischen Zeichen (in den angenommenen Fällen lateinischen Schriftzeichen) geschriebenen Sprache der Zwischenraum zwischen den Zeichen in einem Wort wesentlich enger als derjenige zwischen den Wörtern. Wegen des engen Zwischenraums zwischen den alphabetischen Zeichen in dem Wort kann, wenn ein entsprechendes, alphabetische Zeichen verwendendes Dokument durch ein Zeichenerkennungssystem gelesen wird, das dazu bestimmt ist, Daten von japanischen oder chinesischen Dokumenten aufzunehmen, der Zwischenraum zwischen den Zeichen in einem Wort fälschlicherweise übergangen werden. Dies führt zu einem Aufnehmen eines Bildes des gesamten Wortes als eine Einheit. Aus diesem Grunde ist es unmöglich, jedes alphabetische Zeichen in einem derartigen Dokument mit einem derartigen System zu erkennen.
Dieses Problem beim Erkennen von Zeichen tritt besonders dann auf, wenn das Zeichenerkennungssystem zum Lesen einer Dokumentvorlage, die ein Gemisch aus japanischen oder chinesischen und alphabetischen Zeichen enthält, und zum Aufnehmen von Zeichendaten von derselben benutzt wird.
Desweiteren werden in den bereits früher vorgeschlagenen Systemen das Extrahieren des Zeichens, das zu erkennen ist, und das eigentliche Erkennen des Zeichens in voneinander unabhängigen Schritten ausgeführt. Im allgemeinen wird der Schritt zum Extrahieren eines Zeichens vor dem Schritt zum Erkennen des Zeichens ausgeführt. Wenn die Struktur des extrahierten Zeichens nicht mit irgendeinem vorgegebenen Zeichenmuster zusammenpaßt, wird ein betreffendes Zeichen als nichterkennbares Zeichen behandelt. Dieser Umstand setzt die Zeichenerkennungsrate derartiger Zeichenerkennungssysteme deutlich herab.
Der vorliegenden Erfindung liegt daher die Aufgabe zugrunde, ein Zeichenerkennungssystem zu schaffen, das die genannten Schwierigkeiten, die in herkömmlichen Systemen bestehen, beseitigen kann und eine wesentlich höhere Erkennungsrate bietet. Ferner besteht die Aufgabe für die vorliegende Erfindung darin, ein Zeichenerkennungssystem zu schaffen, das Zeichen-Daten selbst dann von einem Dokument akkurat aufnehmen kann, wenn dieses ein Gemisch von japanischen oder chinesischen und alphabetischen Zeichen darstellt. Desweiteren besteht die Aufgabe für die vorliegende Erfindung darin, ein Zeichenerkennungssystem zu schaffen, das eine Kombination von voneinander getrennten Bild-Daten, eine erneute Trennung der Bild-Daten usw. gestattet, um das Erkennen der Zeichen in der Dokumentvorlage sicherzustellen.
Um die zuvor genannten Aufgaben zu lösen, extrahiert ein Zeichenerkennungssystem gemäß der vorliegenden Erfindung Zeichenblöcke in einer Weise, daß in diesen jeweils eine minimale Zeicheneinheit enthalten ist. Das Zeichenerkennungssystem besitzt die Fähigkeit der erneuten Zusammenfügung (Rekombination) und/oder des erneuten Extrahierens (Reextraktion) von Zeichenblöcken während eines Zeichenerkennungsprozesses. Das erneute Zusammenfügen und die erneute Extraktion von Zeichenblöcken wird auf der Grundlage der Extraktionshysterese jedes Zeichenblocks gesteuert, so daß das erneute Zusammenfügen und die erneute Extraktion wirksam durchgeführt werden können.
In dem bevorzugten Prozeß zum Extrahieren der Zeichenblöcke werden im wesentlichen aneinander grenzende, voneinander unabhängige Zeichen in einem einzigen Zeichenblock geprüft und auf zwei oder mehr Zeichenblöcke aufgeteilt, um die Zeicheneinheit, die in jedem Zeichenblock enthalten ist, zu minimieren.
Das Zeichenerkennungssystem gemäß der vorliegenden Erfindung besitzt desweiteren die Fähigkeit, japanische Schriftzeichen und Kanji-Schriftzeichen von alphabetischen Schriftzeichen auf der Grundlage der besonderen Proportionen der japanischen Schriftzeichen und der Kanji-Schriftzeichen zu unterscheiden, welche Proportionen sich wesentlich von denen der alphabetischen Schriftzeichen unterscheiden.
Zur Lösung der genannten Aufgabe wird ein Zeichenerkennungssystem vorgeschlagen, das ein erstes Mittel zum Gewinnen eines Videosignals, das Bild-Daten eines Dokuments enthält, ein zweites Mittel zum Extrahieren von Zeichenblöcken, wobei jeder dieser Zeichenblöcke Bild-Daten individueller Zeichen in dem Dokument enthält, ein drittes Mittel zum Rekombinieren zweier oder mehrerer Zeichenblöcke zum Bilden eines kombinierten Zeichenblocks, ein viertes Mittel zum Reextrahieren eines Zeichenblocks zum Bilden eines reextrahierten Zeichenblocks, ein fünftes Mittel zum Durchführen einer Zeichenerkennung gemäß einem vorbestimmten Algorithmus und zum Ausgeben eines das erkannte Zeichen kennzeichnenden Signals sowie ein sechstes Mittel zum Steuern des Betriebs des dritten, des vierten und des fünften Mittels in einer derartigen Weise, daß das sechste Mittel wahlweise eines der dritten und vierten Mittel betreibt, wenn das fünfte Mittel nicht in der Lage ist, ein Zeichen in dem Zeichenblock zu erkennen, um auf diese Weise das Erkennen von Zeichen in dem fünften Mittel mit dem Zeichenblock sicherzustellen, der durch ein ausgewähltes aus den dritten und vierten Mitteln gebildet ist, enthält.
Gemäß einer bevorzugten Ausführungsform extrahiert das zweite Mittel den Zeichenblock derart, daß er eine minimale Zeicheneinheit enthält. Das zweite Mittel definiert den Zeichenbereich derart, daß er Ränder hat, die gegen obere, untere und seitliche Konturen der minimalen Zeicheneinheit stoßen. Das zweite Mittel erfaßt eine Überlappung zwischen benachbarten individuellen Zeichen zum getrennten Bilden der Zeichenblöcke für jeweilige individuelle Zeichen. Außerdem beseitigt das zweite Mittel Rausch- oder Störanteile in den Zeichenbild-Daten für jeden der Zeichenblöcke.
In der bevorzugten Ausführungsform der Erfindung ist desweiteren ein siebtes Mittel zum Erfassen eines vorbestimmten Zeichens vorgesehen. Das System steuert vorteilhafterweise die Zeichenerkennungsoperation des fünften Mittels für das vorbestimmte Zeichen durch Auswählen eines Hilfsalgorithmus, der einfacher als der Algorithmus ist, der für andere Zeichen neben dem vorbestimmten Zeichen benutzt wird.
Für ein weiteres Ausführungsbeispiel ist vorgesehen, daß das sechste Mittel mit dem zweiten Mittel zum Gewinnen von Historie- Daten jedes der Zeichenblöcke, die kennzeichnend für den Verlauf des Prozesses der Extraktion des Zeichenblocks sind, zum Steuern der Rekombination des Zeichenblocks in dem dritten Mittel auf der Grundlage der Historie-Daten zusammenwirkt. Das zweite Mittel enthält dazu eine Vielzahl von Stufen zum Extrahieren der Zeichenblöcke aus den Dokumentbild- Daten, und das sechste Mittel enthält Daten, die kennzeichnend für den Verlauf des Extraktionsprozesses in jedem aus einer Vielzahl von Zeichenextraktions-Schritten sind. Außerdem enthält das zweite Mittel eine Stufe zum Segmentieren jedes von Zeichenfolgenblöcken, eine Stufe zum Segmentieren jedes der Zeichenblöcke sowie eine Stufe zum Erfassen von mehr als einer von getrennten, jedoch dicht in einem einzigen Zeichenblock beieinander liegenden Zeicheneinheiten zum jeweiligen Zerlegen des Zeichenblocks in mehrere Zeichenblöcke, die getrennte individuelle Zeicheneinheiten enthalten. Die Stufe zum Zeichenfolgen-Segmentieren prüft y-Projektionsprofile der Dokumentbild-Daten zum Auswählen von Horizontalabtastlinien, die jeweils in einem der Zeichenfolgenblöcke enthalten sein sollen. Die Stufe zum Zeichenfolgen-Segmentieren prüft x-Projektionsprofile mit Bezug auf einen vorbestimmten Schwellenpegel zum Auswählen von Vertikalabtastlinien, die in dem Zeichenblock enthalten sein sollen.
Desweiteren ist bevorzugterweise vorgesehen, daß die Stufe zum Zeichenblock-Segmentieren eine Vielzahl von voneinander verschiedenen Schwellenpegeln zum Segmentieren des Zeichenblocks bei unterschiedlichen Genauigkeitsstufen im Segmentieren der Zeichenblöcke mit einer minimalen Zeicheneinheit verwendet. Die Stufe zum Trennen der Zeichenblöcke überprüft die Kontinuität der Zeicheneinheit, die in dem Zeichenblock enthalten ist, um eine Diskontinuität in der Zeicheneinheit zum Zerlegen des Zeichenblocks erfassen zu können. Die Stufe zum Trennen der Zeichenblöcke überprüft die Kontinuität zwischen benachbarten Bild-Daten, die Bits zum Erfassen einer Diskontinuität der Zeicheneinheit in dem Zeichenblock enthalten.
Das zweite Mittel enthält desweiteren vorteilhafterweise eine Stufe zum Prüfen von y-Projektionsprofilen für die Zeichenbild- Daten in dem Zeichenblock zum Bestimmen der Höhe des Zeichenblocks derart, daß obere und untere Ränder des Zeichenblocks an die oberen und unteren Konturen der Zeicheneinheit in dem Zeichenblock stoßen.
In Weiterbildung der Erfindung ist ein Zeichenerkennungssystem vorgesehen, daß ein erstes Mittel zum Gewinnen eines Videosignals, das Bild-Daten eines Dokuments enthält, ein zweites Mittel zum Segmentieren von Zeichenblöcken, wobei jeder dieser Zeichenblöcke Bild-Daten individueller Zeicheneinheiten enthält und wobei das zweite Mittel eine Vielzahl von Segmentierungsstufen mit einer ersten Stufe zum Segmentieren von Zeichenfolgenblöcken und einer zweiten Stufe zum Segmentieren jedes der Zeichenblöcke, die Zeichenbild- Daten einer Zeicheneinheit enthalten, aufweist, ein drittes Mittel zum Rekombinieren zweier oder mehrerer Zeichenblöcke zum Bilden eines kombinierten Zeichenblocks, ein viertes Mittel zum Reextrahieren eines Zeichenblocks zum Bilden eines reextrahierten Zeichenblocks, ein fünftes Mittel zum Durchführen einer Zeichenerkennung gemäß einem vorbestimmten Algorithmus und zum Ausgeben eines das erkannte Zeichen kennzeichnenden Signals sowie ein sechstes Mittel, das dem zweiten Mittel zum Gewinnen von Segmentierungs- Daten in bezug auf jeden der Zeichenblöcke, die durch das zweite Mittel segmentiert wurden, zugeordnet ist, zum Steuern des Betriebs des dritten, des vierten und des fünften Mittels auf der Grundlage der Segmentierungs-Daten in einer derartigen Weise, daß das sechste Mittel wahlweise eines der dritten und vierten Mittel in Betrieb setzt, wenn das fünfte Mittel nicht in der Lage ist, ein Zeichen in dem Zeichenblock zu erkennen, um auf diese Weise das Erkennen von Zeichen in dem fünften Mittel mit dem Zeichenblock sicherzustellen, der durch ein ausgewähltes der dritten und vierten Mittel gebildet ist, enthält.
Gemäß einer anderen Weiterbildung der Erfindung ist ein Zeichenerkennungssystem vorgesehen, das ein erstes Mittel Aufnehmen eines Bildes von einem Dokument und Erzeugen eines Videosignals, das Bild-Daten des Dokuments enthält, ein zweites Mittel zum Gewinnen einer Vielzahl von Zeichenblöcken, wobei jeder dieser Zeichenblöcke Bild-Daten eines individuellen Zeichens in dem Dokument enthält und wobei das zweite Mittel eine Vielzahl von Segmentierungsstufen mit einer ersten Stufe zum Segmentieren von Zeichenfolgenblöcken, einer zweiten Stufe zum Segementieren jedes Zeichenblocks, der Zeichenbild-Daten einer Zeicheneinheit enthält, und einer dritten Stufe zum Überprüfen der Kontinuität von Bild-Daten, die Bits in jedem Zeichenblock zum Erfassen einer Diskontinuität enthalten, um die Zeichenblöcke in mehrere Zeichenblöcke zu zerlegen, um so Zeichenblöcke zu erhalten, die jeweils eine minimale Zeicheneinheit enthalten, aufweist, ein drittes Mittel zum Rekombinieren zweier oder mehrerer Zeichenblöcke zum Bilden eines kombinierten Zeichenblocks, ein viertes Mittel zum Reextrahieren eines Zeichenblocks zum Bilden eines reextrahierten Zeichenblocks, ein fünftes Mittel zum Durchführen einer Zeichenerkennung gemäß einem vorbestimmten Algorithmus und zum Ausgeben eines das erkannte Zeichen kennzeichnenden Signals sowie ein sechstes Mittel zum Steuern des Betriebs des dritten, des vierten und des fünften Mittels in einer derartigen Weise, daß das sechste Mittel wahlweise eines der dritten und vierten Mittel in Betrieb setzt, wenn das fünfte Mittel nicht in der Lage ist, ein Zeichen in dem Zeichenblock zu erkennen, um auf diese Weise das Erkennen von Zeichen in dem fünften Mittel mit dem Zeichenblock sicherzustellen, der durch ein ausgewähltes der dritten und vierten Mittel gebildet ist, enthält.
Gemäß einer anderen Weiterbildung der Erfindung ist ein Zeichenerkennungssystem vorgesehen, das ein erstes Mittel zum Aufnehmen des Bildes eines Dokuments und Erzeugen eines Videosignals, das Bild-Daten des Dokuments enthält, ein zweites Mittel zum Gewinnen einer Vielzahl von Zeichenblöcken, wobei jeder dieser Zeichenblöcke Bild-Daten individueller Zeichen in dem Dokument enthält und wobei das zweite Mittel eine Vielzahl von Segmentierungsstufen mit einer ersten Stufe zum Segmentieren von Zeichenfolgenblöcken, einer zweiten Stufe zum Segmentieren jedes Zeichenblocks, der Zeichenbild-Daten einer Zeicheneinheit enthält, und einer dritten Stufe zum Überprüfen der Kontinuität von Bild-Daten, die Bits innerhalb jedes Zeichenblocks zum Erfassen einer Diskontinuität enthalten, um Zeichenblöcke in mehrere Zeichenblöcke zu zerlegen, die jeweils eine minimale Zeicheneinheit enthalten, aufweist, ein drittes Mittel zum Rekombinieren zweier oder mehrerer Zeichenblöcke zum Bilden eines kombinierten Zeichenblocks, ein viertes Mittel zum Reextrahieren eines Zeichenblocks zum Bilden eines reextrahierten Zeichenblocks, ein fünftes Mittel zum Durchführen einer Zeichenerkennung gemäß einem vorbestimmten Algorithmus und zum Ausgeben eines das erkannte Zeichen kennzeichnenden Signals sowie ein sechstes Mittel, das dem zweiten Mittel zum Gewinnen von Segmentierungshistorie-Daten in bezug auf zumindest die zweite und die dritte Segmentierungsstufe, die durch das zweite Mittel ausgeführt werden, zugeordnet ist, welche Segmentierungshistorie-Daten kennzeichnend für den Verlauf der Segmentierung der Zeichenblöcke in jeder der zweiten und dritten Stufen sind, zum Steuern des Betriebs des dritten, des vierten und des fünften Mittels auf der Grundlage der Segmentierungs-Daten in einer derartigen Weise, daß das sechste Mittel wahlweise eines der dritten und vierten Mittel in Betrieb setzt, wenn das fünfte Mittel nicht in der Lage ist, ein Zeichen in dem Zeichenblock zu erkennen, um auf diese Weise das Erkennen von Zeichen in dem fünften Mittel mit dem Zeichenblock sicherzustellen, der durch ein ausgewähltes der dritten und vierten Mittel gebildet ist, enthält.
In einem bevorzugten Verfahren zum Betrieb des erfindungsgemäßen Zeichenerkennungssystems ist vorgesehen, daß das sechste Mittel abwechselnd hohe logische Pegel (HIGH) und niedrige logische Pegel (LOW) für Zeichenblöcke setzt, die durch jede der zweiten und dritten Segmentierungsstufen segmentiert werden, um Daten für die Segmentierungshistorie zu bilden.
Gemäß einer anderen Weiterbildung der Erfindung ist ein Verfahren zum Erkennen von Zeichen, die in einem Dokument enthalten sind, vorgesehen, das Schritte zum Aufnehmen des Bildes eines Dokuments und Erzeugen eines Videosignals, das Bild-Daten des Dokuments enthält, zum Extrahieren von Zeichenblöcken, von denen jeder Bild-Daten von individuellen Zeichen in dem Dokument enthält, zum Rekombinieren zweier oder mehrerer Zeichenblöcke zum Bilden eines kombinierten Zeichenblocks, zum Reextrahieren eines Zeichenblocks zum Bilden eines reextrahierten Zeichenblocks, zum Durchführen einer Zeichenerkennung gemäß einem vorbestimmten Algorithmus und Ausgeben eines das erkannte Zeichen kennzeichnenden Signals sowie zum Steuern des Betriebs in dem Schritt zum Rekombinieren, in dem Schritt zum Reextrahieren und in dem Schritt zum Zeichenerkennen in einer Weise, daß der Schritt zum Rekombinieren, der Schritt zum Reextrahieren und der Schritt zum Zeichenerkennen wahlweise durchgeführt wird, um ein Erkennen von Zeichen durch Wiederholen des Schritts zum Rekombinieren, des Schritts zum Reextrahieren und des Schritts zum Zeichenerkennen sicherzustellen, enthält.
Gemäß einer anderen Weiterbildung der Erfindung ist ein Zeichenerkennungssystem mit Mitteln zum Gewinnen eines Videosignals, das Bild-Daten eines Dokuments enthält, Mitteln zum Extrahieren von Zeichenblöcken, wovon jeder Bild-Daten eines individuellen Zeichens in dem Dokument enthält, und Mitteln zum Durchführen einer Zeichenerkennung auf der Grundlage von Extraktions-Daten, die durch die Zeichenblock- Extraktionsmittel gewonnen wurden, gemäß einem vorbestimmten Algorithmus und zum Ausgeben eines das erkannte Zeichen kennzeichnenden Signals vorgesehen, das durch Zeichenblock- Extraktionsmittel mit einem ersten Mittel zum Extrahieren jedes der Zeichenblöcke bei einer ersten Genauigkeitstufe zum Gewinnen von ersten Extraktions-Daten und einem zweiten Mittel zum Extrahieren jedes der Zeichenblöcke bei einer zweiten Genauigkeitsstufe zum Gewinnen von zweiten Extraktions-Daten, wobei die zweite Genauigkeitsstufe eine höhere Genauigkeit als die erste Genauigkeitsstufe hat, gekennzeichnet ist.
In einer bevorzugten erfindungsgemäßen Anordnung ist vorgesehen, daß das erste Mittel den Pegel eines x-Projektionsprofils jeder von Zeichenfolgen mit einem ersten Schwellenpegel zum Extrahieren jedes der Zeichenblöcke bei einer ersten Genauigkeitsstufe vergleicht und daß das zweite Mittel den Pegel des x-Projektionsprofils mit einem zweiten Schwellenpegel, der höher als der erste Schwellenpegel liegt, zum Extrahieren der Zeichenblöcke bei einer zweiten Genauigkeitsstufe vergleicht.
Gemäß einer anderen Weiterbildung der Erfindung ist ein Zeichenerkennungssystem mit Mitteln zum Gewinnen eines Videosignals, das Bild-Daten eines Dokuments enthält, Mitteln zum Extrahieren von Zeichenblöcken, wovon jeder Bild- Daten eines individuellen Zeichens in dem Dokument enthält, und Mitteln zum Durchführen einer Zeichenerkennung auf der Grundlage von Extraktions-Daten, die durch die Zeichenblock- Extraktionsmittel gewonnen wurden, gemäß einem vorbestimmten Algorithmus und zum Ausgeben eines das erkannte Zeichen kennzeichnenden Signals vorgesehen, das durch Zeichenblock- Extraktionsmittel mit einem ersten Mittel zum Extrahieren jedes der Zeichenblöcke und einem zweiten Mittel zum Überprüfen der Kontinuität von Bild-Daten, die Bits mit dem Pegel HIGH ("1") enthalten, in jedem der Zeichenblöcke zum Erfassen einer Diskontinuität der Bits mit dem Pegel HIGH ("1") zu benachbarten Bits mit dem Pegel HIGH ("1"), um den Zeichenblock, der in dem ersten Mittel extrahiert wurde, in eine Vielzahl von Blöcken zu zerlegen, wovon jeder Zeichenbild- Daten enthält, die Bits mit dem Pegel HIGH ("1") aufweisen, die eine Kontinuität mit benachbarten Bits mit dem Pegel HIGH ("1") haben, gekennzeichnet ist.
Gemäß einer anderen Weiterbildung der Erfindung ist ein Zeichenerkennungssystem mit Mitteln zum Gewinnen eines Videosignals, das Bild-Daten eines Dokuments enthält, Mitteln zum Extrahieren von Zeichenblöcken, wovon jeder Bild- Daten eines individuellen Zeichens in dem Dokument enthält, und Mitteln zum Durchführen einer Zeichenerkennung auf der Grundlage von Extraktions-Daten, die durch die Zeichenblock- Extraktionsmittel gewonnen wurden, gemäß einem vorbestimmten Algorithmus und zum Ausgeben eines das erkannte Zeichen kennzeichnenden Signals vorgesehen, das durch Zeichenblock- Extraktionsmittel mit einem ersten Mittel zum Extrahieren jedes der Zeichenblöcke bei einer ersten Genauigkeitsstufe, einem zweiten Mittel zum Extrahieren jedes der Zeichenblöcke bei einer zweiten Genauigkeitsstufe, die eine höhere Genauigkeit als die erste Genauigkeitsstufe hat, und einem dritten Mittel zum Aufzeichnen oder Speichern von Extraktionshysterese-Daten in bezug auf jeden der Zeichenblöcke während der Extraktionsoperation in dem ersten und dem zweiten Mittel, welche Extraktionshysterese-Daten bei der Zeichenerkennung durch das Zeichenerkennungsmittel benutzt werden, gekennzeichnet ist.
Gemäß der bevorzugten Anordnung ist vorgesehen, daß das erste Mittel den Pegel eines x-Projektionsprofils jeder von Zeichenfolgen mit einem ersten Schwellenpegel zum Extrahieren jedes der Zeichenblöcke bei einer ersten Genauigkeitsstufe vergleicht und daß das zweite Mittel den Pegel des x-Projektionsprofils mit einem zweiten Schwellenpegel, der höher als der erste Schwellenpegel liegt, zum Extrahieren der Zeichenblöcke bei einer zweiten Genauigkeitsstufe vergleicht. Die Extraktionshysterese-Daten, die durch das dritte Mittel aufgezeichnet oder gespeichert werden, sind kennzeichnend für den Verlauf der Extraktion in jedem der ersten und zweiten Mittel. Das dritte Mittel weist jeweils einen Speicherplatz für jedes Bit zum Speichern der Extraktionshysterese- Daten in jedem der ersten und zweiten Mittel in Form eines Binärcodes auf.
Gemäß einer anderen Weiterbildung der Erfindung ist ein Zeichenerkennungssystem mit Mitteln zum Gewinnen eines Videosignals, das Bild-Daten eines Dokuments enthält, Mitteln zum Extrahieren von Zeichenblöcken, wovon jeder Bild- Daten eines individuellen Zeichens in dem Dokument enthält, und Mitteln zum Durchführen einer Zeichenerkennung auf der Grundlage von Extraktions-Daten, die durch die Zeichenblock- Extraktionsmittel gewonnen wurden, gemäß einem vorbestimmten Algorithmus und zum Ausgeben eines das erkannte Zeichen kennzeichnenden Signals vorgesehen, das durch ein Verfahren zum Extrahieren der Zeichenblöcke, wovon jeder Bild-Daten betreffend ein Einheitszeichen enthält, mit einem ersten Schritt zum Extrahieren jedes der Zeichenblöcke bei einer ersten Genauigkeitsstufe zum Gewinnen von ersten Extraktions- Daten und einem zweiten Schritt zum Extrahieren jedes der Zeichenblöcke bei einer zweiten Genauigkeitsstufe zum Gewinnen von zweiten Extraktions-Daten, wobei die zweite Genauigkeitsstufe eine höhere Genauigkeit als die erste Genauigkeitsstufe hat, gekennzeichnet ist.
Eine andere Weiterbildung der Erfindung sieht ein Zeichenerkennungssystem mit Mitteln zum Gewinnen eines Videosignals, das Bild-Daten eines Dokuments enthält, Mitteln zum Extrahieren von Zeichenblöcken, wovon jeder Bild-Daten eines individuellen Zeichens in dem Dokument enthält, und Mitteln zum Durchführen einer Zeichenerkennung auf der Grundlage von Extraktionsdaten, die durch die Zeichenblock-Extraktionsmittel gewonnen wurden, gemäß einem vorbestimmten Algorithmus und zum Ausgeben eines das erkannte Zeichen kennzeichnenden Signals vor, das durch ein Verfahren zum Extrahieren der Zeichenblöcke, wovon jeder Bild-Daten betreffend ein Einheitszeichen enthält, mit einem ersten Schritt zum Extrahieren jedes der Zeichenblöcke und einem zweiten Schritt zum Überprüfen der Kontinuität von Bild-Daten, die Bits mit dem Pegel HIGH ("1") enthalten, in jedem Zeichenblock zum Erfassen einer Diskontinuität der Bits mit dem Pegel HIGH ("1") zu benachbarten Bits mit dem Pegel HIGH ("1"), um den betreffenden Zeichenblock, der in dem ersten Schritt extrahiert wurde, in eine Vielzahl von Blöcken zu zerlegen, wovon jeder Zeichenbild-Daten enthält, die aus Bits mit dem Pegel HIGH ("1") bestehen, die eine Kontinuität mit benachbarten Bits mit dem Pegel HIGH ("1") aufweisen, gekennzeichnet ist.
Gemäß einer anderen Weiterbildung der Erfindung ist ein Zeichenerkennungssystem mit Mitteln zum Gewinnen eines Videosignals, das Bild-Daten eines Dokuments enthält, Mitteln zum Extrahieren von Zeichenblöcken, wovon jeder Bild- Daten eines individuellen Zeichens in dem Dokument enthält, und Mitteln zum Durchführen einer Zeichenerkennung auf der Grundlage von Extraktions-Daten, die durch die Zeichenblock- Extraktionsmittel gewonnen wurden, gemäß einem vorbestimmten Algorithmus und zum Ausgeben eines das erkannte Zeichen kennzeichnenden Signals vorgesehen, das durch ein Verfahren zum Extrahieren der Zeichenblöcke, wovon jeder Bild-Daten entsprechend einem Einheitszeichen enthält, mit einem ersten Schritt zum Extrahieren jedes der Zeichenblöcke bei einer ersten Genauigkeitstufe, einem zweiten Schritt zum Extrahieren jedes der Zeichenblöcke bei einer zweiten Genauigkeitsstufe, die eine höhere Genauigkeit als die der ersten Genauigkeitsstufe aufweist, und einem dritten Schritt zum Aufzeichnen oder Speichern von Extraktions-hysterese- Daten in bezug auf jeden Zeichenblock während der Extraktionsoperation in dem ersten und dem zweiten Schritt gekennzeichnet ist, wobei die Extraktionshysterese-Daten in dem Zeichenerkennungsprozeß, der durch das Zeichenerkennungsmittel ausgeführt wird, benutzt werden.
Die Extraktionshysterese-Daten, die in dem dritten Schritt aufgezeichnet oder gespeichert werden, sind kennzeichnend für den Verlauf der Extraktion in jedem der ersten und zweiten Schritte. In dem dritten Schritt werden alle der Extraktionshysterese-Daten in jedem der ersten und zweiten Schritte in jeweils einem Speicherplatz für jedes der Bits dieser Daten in Form eines Binärcodes gespeichert.
Die vorliegende Erfindung wird zu ihrem besseren Verständnis im folgenden anhand mehrerer Figuren, die bevorzugte Ausführungsbeispiele für die Erfindung betreffen, im einzelnen beschrieben, wobei die Erfindung keinesfalls auf die gezeigten und beschriebenen Ausführungsbeispiele beschränkt ist.
Fig. 1 zeigt ein schematisches Blockschaltbild, das den allgemeinen Aufbau eines Zeichenerkennungssystems gemäß der vorliegenden Erfindung verdeutlicht.
Fig. 2 zeigt eine erläuternde Darstellung, aus der die Art und Weise der Abtrennung von Zeichenfolgen zum Aufnehmen von Zeichenfolgen-Daten von einer Dokumentvorlage hervorgeht.
Fig. 3 (A) u. 3 (B) zeigen eine Darstellung der Art und Weise einer Zeichenfolgenblock-Segmentierung, die in einer Bereichssegmentierungs-Stufe in dem bevorzugten Ausführungsbeispiel für das Zeichenerkennungssystem gemäß Fig. 1 durchzuführen ist, wobei Fig. 3 (A) ein y-Projektionsprofil eines Textbereichs AR gemäß Fig. 2 und Fig. 3 (B) Zeichenfolgenblock- Segmentierungs-Daten, die aus dem y-Projektions-Profil gemäß Fig. 3 (A) gewonnen worden sind, zeigt.
Fig. 4 zeigt ein Blockschaltbild einer Zeichenerkennungs- Stufe in dem bevorzugten Ausführungsbeispiel für das Zeichenerkennungssystem gemäß der vorliegenden Erfindung.
Fig. 5 (A), 5 (B1), 5 (B2), 5 (C1) u. 5 (C2) zeigen Darstellungen der Art einer vorläufigen Zeichenblock- Segmentierung, die in einer ersten Unterstufe in der Zeichenerkennungs-Stufe gemäß Fig. 4 durchzuführen ist, wobei Fig. 5 (A) Beispiele für Zeichen zeigt, die in einem Zeichenfolgenblock enthalten sind, Fig. 5 (B1) u. 5 (C1) identische x-Projektionsprofile zeigen und Fig. 5 (B2) u. 5 (C2) jeweils einen Segmentierungsblock kennzeichnende Signale zeigen, die in einer Grob-Segmentierung und einer Fein-Segmentierung gewonnen wurden, welche in der ersten Unterstufe ausgeführt wurde.
Fig. 6 (A) u. 6 (B) zeigen ein Beispiel für ein überlappendes Zeichen und das x-Projektionsprofil desselben.
Fig. 7 (A) u. 7 (B) zeigen eine Darstellung der Art und Weise der Trennung von Zeichenblöcken, die ein überlappendes Zeichen enthalten.
Fig. 8 (A) u. 8 (B) zeigen eine Darstellung, aus der die Arbeitsweise einer dritten Unterstufe in der Zeichenblocksegmentierungs-Stufe innerhalb der Zeichenerkennungs- Stufe gemäß Fig. 4 hervorgeht.
Fig. 9 zeigt ein Flußdiagramm, aus dem die Art und Weise der Kombination von voneinander getrennten Zeichenkomponenten beim Erkennen von japanischen oder chinesischen Schriftzeichen hervorgeht.
Fig. 10 u. Fig. 11 zeigen Darstellungen der Art und Weise, wie japanische Schriftzeichen und alphabetische, im vorliegenden Fall lateinische Schriftzeichen voneinander getrennt werden.
Fig. 12 zeigt eine Darstellung, aus der der Aufbau von voneinander getrennten Daten hervorgeht, die in einem Speicher für solche Daten in einer Zeichenerkennungs- Stufe gemäß Fig. 2 gespeichert sind.
Fig. 13 zeigt eine Darstellung, aus der das Verhältnis von vertikalen zu horizontalen Längen eines Abtrennungsbereichs zum Trennen individueller Zeichen voneinander hervorgeht.
Fig. 14 zeigt eine Darstellung, aus der der Aufbau von Abtrennungspositions- Daten hervorgeht.
Fig. 15 u. Fig. 16 zeigen jeweils eine Darstellung, aus der Abtrennungs- oder Segmentierungshistorie-Daten bzw. ein schematisches Bild derselben hervorgeht.
Fig. 17 zeigt ein Flußdiagramm, aus dem die Prozedur der Zeichenerkennung hervorgeht, die durch die Zeichenerkennungs- Stufe auszuführen ist.
Wie Fig. 1 zeigt, ist das bevorzugte Ausführungsbeispiel für das erfindungsgemäße Zeichenerkennungssystem mit einem Dokumentleser 2 versehen, der ein Dokument optisch abtastet oder liest und Dokumentbild-Daten S 1 erzeugt. Das Zeichenerkennungssystem ist mit dem Dokumentleser zum Aufnehmen der Dokumentbild-Daten verbunden, um die Dokumentbild-Daten zu verarbeiten, um auf diese Weise die Bild-Daten der betreffenden Zeichen in einen computergerechten Code, beispielsweise den ASCII-Code, umzusetzen. Das Zeichenerkennungssystem enthält einen Bereichssegmentierungs-Abschnitt 3, der mit dem Dokumentleser 2 verbunden ist. Daher können die Dokumentbild-Daten S 1, die von dem Dokumentleser erzeugt werden, zu dem Bereichssegmentierungs-Abschnitt 3 übertragen werden.
Der Bereichssegmentierungs-Abschnitt 3 enthält eine Schräglagennormalisierungs- Stufe 4. In der Schräglagennormalisierungs- Stufe 4 werden Rausch- oder Störanteile in den Dokumentbild- Daten S 1 ausgefiltert, und eine ggf. vorhandene Schräglage des Dokuments in bezug auf ein x-/y-Achsen-Koordinatensystem des Zeichenerkennungssystems wird normalisiert oder kompensiert. In dem gezeigten Ausführungsbeispiel erstreckt sich die x-Achse des Koordinatenssystems des Zeichenerkennungssystems in horizontaler Richtung, und die y- Achse desselben erstreckt sich in vertikaler Richtung. Das bedeutet, daß sich die x-Achse des Koordinatensystems parallel zu horizontalen Abtastlinien und die y-Achse parallel zu vertikalen Abtastlinien erstreckt, wenn die Schräglage des Dokumentbildes normalisiert worden ist.
In der Schräglagennormalisierungs-Stufe werden schräglagennormalisierte Bilddaten S 2 erzeugt, die zu einer Zeichenfolgen- Blocksegmentierungs-Stufe 5 übertragen werden. In der Zeichenfolgen-Blocksegmentierungs-Stufe 5 wird ein Textbereich oder werden Textbereiche zunächst von einem Graphikbereich, der Graphikbilder enthält, oder Graphikbereichen, wie beispielsweise Photographien, Illustrationen, Zeichnungen usw., unterschieden. Da ein Graphikbild in dem Dokumentbild in Form von Rausch- oder Störanteilen bei der Zeichenerkennung wirken kann, müssen die entsprechenden Graphikbild- Daten vor dem Eingeben von Daten in eine Zeichenerkennungs- Stufe beseitigt werden. Eine erforderliche Textbereichsextraktion wird in einer an sich bekannten Art und Weise durchgeführt, um Textbereiche AR (wie in Fig. 2 gezeigt) zu extrahieren. Daher wird in einer Textbereichsextraktions- Operation, die in der Zeichenfolgen-Blocksegmentierungs- Stufe 5 durchgeführt wird, der Textbereich AR, der ein Textbild enthält, definiert, und es werden die entsprechenden Bild-Daten in dem Textbereich extrahiert. Auf diese Weise werden Textbild-Daten erzeugt.
Die Textbild-Daten werden dann zum Zwecke einer Zeichenfolgen- Blocksegmentierung in der Zeichenfolgen-Blocksegmentierungs- Stufe 5 verarbeitet. In der vorliegenden Beschreibung wird das Wort "Zeichenfolge" verwendet, um eine Folge von Zeichen, die horizontal in einer einzigen Zeile des Textes enthalten sind, zu bezeichnen. Zum Segmentieren von Zeichenfolgenblöcken AR 1, AR 2 . . . werden Vertikalprojektionsprofile (wie in Fig. 3 gezeigt) gewonnen. Im folgenden Beschreibungsteil werden die Vertikalprojektionsprofile, die in Fig. 3 (A) gezeigt sind, als "y-Projektionssignal S y " bezeichnet. Wie ersichtlich, enthält das y-Projektionssignal S y einen Signalwert oder Signalinhalt, der repräsentativ für eine Anzahl von "schwarzen" Bits oder Bits mit dem logischen Pegel HIGH ("1") ist, die ein "Schwarzbild" beinhaltet, auf der korrespondierenden Horizontalabtastlinie. Daher wird der Wert des y-Projektionssignals S y , das mit den Horizontalabtastlinien korrespondiert, die in einem Zeilenzwischenraum zwischen Zeichenfolgen positioniert ist und demzufolge kein Bit mit dem logischen Pegel HIGH ("1") aufweist, Null, um es von Horizontalabtastlinien, die in dem Zeichenfolgenbereich liegen, und denjenigen, die in einem Leerstellenbereich, wie beispielsweise in Zeilenzwischenräumen, liegen, unterscheiden zu können. In der Zeichenfolgen-Blocksegmentierungs- Stufe 5 wird daher der y-Projektionssignal-Wert geprüft. Eine Reihe von Horizontallinien, die mit y-Projektionssignalen S y korrespondieren, welche Werte größer Null haben, wird beispielsweise als ein Zeichenfolgenblock AR 1, AR 2. . . betrachtet. Auf der Grundlage dieser Voraussetzung werden Zeichenfolgen-Blocksegmentierungs-Daten CL (wie in Fig. 3 (B) gezeigt) durch die Zeichenfolgen-Blocksegmentierungs- Stufe 5 erzeugt. Die Zeichenfolgen-Blocksegmentierungs-Daten CL haben den logischen Pegel HIGH (logische "1") in dem Bereich, der mit dem Zeichenfolgenblock korrespondiert, und den logischen Pegel LOW (logische "0") in dem Bereich, der mit dem Zeilenzwischenraum zwischen Zeichenfolgenblöcken korrespondiert. In der Zeichenfolgen-Blocksegmentierungs- Stufe 5 werden daher die Horizontalabtastlinien, die Textbild- Daten enthalten, welche mit den Zeichenfolgenblöcken korrespondieren, extrahiert und als Zeichenfolgenblockbild- Daten S 3 basierend auf den Zeichenfolgen-Blocksegmentierungs- Daten CL ausgegeben.
Die Zeichenfolgenblockbild-Daten S 3 werden in einer Feinjustierungs- Stufe 6 verarbeitet. In der Feinjustierungs-Stufe 6 wird eine Feinjustierung der Zeichenorientierung zum Zwecke einer Schräglagennormalisierung und eine erneute Rausch- oder Störanteilausfilterung durchgeführt. Die Zeichenfolgenblockbild- Daten S 3, für die die Feinjustierung und die Rausch- oder Störanteilausfilterung ausgeführt wird, werden an einen Zeichenerkennungs-Abschnitt 7, der weiter unten hauptsächlich anhand von Fig. 4 beschrieben wird, als Bereichssegmentierungs-Daten S 4 ausgegeben.
Es ist ersichtlich, daß die Bereichssegmentierungs-Daten S 4 im wesentlichen Bild-Daten in den Horizontalabtastlinien in den Zeichenfolgenblöcken enthalten, die in der Zeichenfolgen- Blocksegmentierungs-Stufe 5 segmentiert wurden. Jeder Zeichenfolgenblock AR 1, AR 2 . . . hat eine Höhe, die durch die höchste grobdefinierte obere Kontur und die niedrigste grobdefinierte untere Kontur der Zeichen darin bestimmt ist. Die Höhe des Zeichenfolgenblocks AR 1, AR 2 . . ., der auf diese Weise definiert ist, wird im folgenden als "Zeichenfolgenhöhe" bezeichnet.
Die Struktur des Zeichenerkennungs-Abschnitts 7 ist im einzelnen in Fig. 4 gezeigt. Der Zeichenerkennungs-Abschnitt 7 führt allgemein eine Segmentierung zum Extrahieren von Bilddaten jedes der individuellen Zeichen und eine Zeichenerkennung durch Vergleichen der Struktur, die durch die Bild-Daten des segmentierten Zeichens gekennzeichnet ist, mit vorhandenen Zeichendaten aus. In dem bevorzugten Ausführungsbeispiel für das Zeichenerkennungssystem gemäß der vorliegenden Erfindung kann eine Resegmentierung des Zeichens oder ein Kombinieren zweier oder mehrerer Zeichenblöcke zum Erkennen von getrennten Zeichen durchgeführt werden. Um ein Resegmentieren und/oder Kombinieren zweier oder mehrerer Zeichenblöcke zu ermöglichen, wird die Segmentierungshistorie des betreffenden Zeichensegmentierungsprozesses gespeichert.
Wie in Fig. 4 gezeigt, enthält der Zeichenerkennungs-Abschnitt 7 eine Zeichenblocksegmentierungs-Stufe 11, eine Zeichenblockkombinierungs-Stufe 18, eine Zeichenerkennungs- Stufe 23, eine Parametercodierungs-Stufe 30, eine Segmentierungshistoriecodierungs- Stufe 35 und eine Resegmentierungs- Stufe 40. In dem Zeichenerkennungs-Abschnitt 7 ist ein Datenspeicher 25 zum Speichern der Segmentierungs-Daten enthalten. Auf der Grundlage der Segmentierungs-Daten, die in dem Datenspeicher 25 gespeichert sind, werden Operationen der Zeichenblockkombinierungs-Stufe 18, der Zeichenerkennungs- Stufe 23 und der Resegmentierungs-Stufe 40 gesteuert.
Die Zeichenblocksegmentierungs-Stufe 11 enthält eine erste, eine zweite und eine dritte Unterstufen 12, 13 u. 14. Die Zeichenblocksegmentierung wird durch diese ersten, zweiten und dritten Unterstufen 12, 13 u. 14 zum Extrahieren von Zeichenbild-Daten durchgeführt. Im wesentlichen werden die Zeichenbild-Daten, die in der Zeichenblocksegmentierungs- Stufe 11 extrahiert werden, zur Zeichenerkennung in der Zeichenerkennungs-Stufe 23 verwendet. Wenn eine Zeichenerkennung nicht durchgeführt werden kann, nachdem die Zeichenbild- Daten in der Zeichensegmentierungs-Stufe 11 extrahiert wurden, wird ein Kombinieren von Zeichenblöcken zum erneuten Durchführen einer Zeichenerkennung in der Zeichenerkennungs- Stufe 23 unter Verwendung des Zeichenbildes der kombinierten Zeichenblöcke vorgenommen. Andererseits wird, wenn die Zeichenerkennung nicht vorgenommen werden kann, eine Resegmentierung des Zeichenblocks in der Resegmentierungs- Stufe 40 durchgeführt.
Im folgenden wird jeder Teil des Zeichenerkennungs-Abschnitts 7 in getrennten Beschreibungsteilen im einzelnen beschrieben.
Zeichenblocksegmentierung - Erste Unterstufe 12
Der Zeichenerkennungs-Abschnitt 7 ist mit dem Bereichssegmentierungs- Abschnitt 3 durch die erste Unterstufe 12 der Zeichenblocksegmentierungs-Stufe 11 verbunden. Daher werden die Bereichssegmentierungs-Daten S 4 in die erste Unterstufe 12 eingegeben. In der ersten Unterstufe 12 findet als erstes eine vorläufige Zeichenblocksegmentierung statt. Um zuerst die Blocksegmentierung in der ersten Unterstufe 12 der Zeichenblocksegmentierungs- Stufe 11 durchzuführen, wird ein Vertikalprojektionsprofil, das im folgenden als "x-Projektionsprofil" oder "x-Projektionssignal S x " bezeichnet wird, gewonnen. Die Art des x-Projektionssignals S x und dessen Wellenform ist beispielsweise Fig. 5 zu entnehmen. Ähnlich dem zuvor in bezug auf die Zeichenfolgenblocksegmentierung erläuterten y-Projektionssignal S y hat das x-Projektionssignal S x einen Wert, der mit der Anzahl der Bits mit dem logischen Pegel HIGH ("1") auf der entsprechenden vertikalen Abtastlinie korrespondiert. Daher wird, wenn die vertikale Abtastlinie Zeichenbild-Daten enthält und demzufolge ein Bit oder Bits aufweist, das oder die den logischen Pegel HIGH ("1") aufweist oder aufweisen, der Wert des x-Projektionssignals S x in diesem Fall größer Null. Andererseits existiert, wenn sich die vertikale Abtastlinie durch den Zwischenraum zwischen individuellen Zeichen erstreckt, kein Bit mit dem logischen Pegel HIGH. Daher wird der Wert des x- Projektionssignals S x Null.
In dem Beispiel gemäß Fig. 5 sind ein Kanji-Zeichen (chinesisches Schriftzeichen) auf der linken Seite und japanische Schriftzeichen, vergl. Fig. 5 (A), in dem n-ten Zeichenfolgenblock ARN enthalten. Diese Zeichen bilden in Kombination ein japanisches Wort der Bedeutung "geeignet" oder "angepaßt". x-Projektionssignale S x dieser Zeichen sind in Fig. 5 (B1) u. Fig. 5 (C1) gezeigt. Gemäß der vorliegenden Erfindung wird empfohlen, eine Vielzahl von Schwellenpegeln zum Durchführen von vorläufigen Zeichenblocksegmentierungen bei verschiedenen Segmentierungs-Genauigkeitsstufen durchzuführen. Im allgemeinen ist der Pegel des x-Projektionssignals in dem horizontalen Mittenabschnitt jedes Zeichenblocks höher als in den horizontalen Endabschnitten. Demzufolge verringert sich der Pegel des x-Projektionssignals S x in Richtung auf die Seitenkonturen der Zeichen. Daher ändert sich durch das Durchführen der vorläufigen Zeichenblocksegmentierung mit unterschiedlichen Schwellenpegeln die Breite des extrahierten Zeichenblocks. Dieser Umstand wird vorteilhafterweise ausgenutzt, wenn die Zwischenräume zwischen benachbarten individuellen Zeichen besonders schmal sind. In anderen Worten ausgedrückt heißt dies, daß wenn Zeichen besonders dicht beieinander angeordnet sind, zwei oder mehr Zeichen in dem vorläufig segmentierten Zeichenblock enthalten sein können, wenn die Segmentierung nur mit dem Schwellenpegel des Wertes Null durchgeführt wird. Die Zeichen, die in dichter Anordnung stehen und sehr schmale oder im wesentlichen keine Abstände zwischen sich aufweisen, werden im folgenden als "überlappende Zeichen" bezeichnet. Durch Verwendung eines Schwellenpegels, der größer Null ist, hat ein Abschnitt des Zeichens, dessen korrespondieres Bit oder dessen korrespondierende Bits auf der vertikalen Abtastlinie liegt oder liegen, einen x-Projektionssignalwert, der kleiner als oder gleich dem Schwellenpegel ist.
In dem gezeigten Ausführungsbeispiel werden höhere und niedrigere Schwellenpegel TH 1 und TH 0 für die Blocksegmentierung verwendet. Der höhere Schwellenpegel TH 1 ist auf den Wert "1" eingestellt. Andererseits hat der Schwellenpegel TH 0 den Wert "0". Daher findet in dem gezeigten Ausführungsbeispiel die vorläufige Zeichenblocksegmentierung bei den höheren und den niedrigeren Schwellenpegeln TH 1 und TH 0 statt. In dem folgenden Beschreibungsteil wird der Zeichenblock, der durch eine Zeichenblocksegmentierung segmentiert wird, die den niedrigeren Schwellenpegel TH 0 verwendet, als "Block mit breiterem Zeichen" bezeichnet. In ähnlicher Weise wird der Zeichenblock, der durch eine Zeichensegmentierung mit dem höheren Schwellenpegel TH 1 segmentiert wird, im folgenden als "Block mit schmalerem Zeichen" bezeichnet. Es sei ferner angemerkt, daß die vorläufige Zeichenblocksegmentierung, die den unteren Schwellenpegel TH 0 verwendet, im folgenden als "grobe Segmentierung" bezeichnet wird. Außerdem wird die vorläufige Zeichensegmentierung mit dem höheren Schwellenpegel TH 1 im folgenden als "genaue Segmentierung" bezeichnet.
Bei der groben Segmentierung für den Zeichenfolgenblock ARN gemäß Fig. 5 wird das x-Projektionssignal S x mit dem niedrigeren Schwellenpegel TH 0 verglichen. Als Ergebnis wird ein die grobe Blocksegmentierung kennzeichnendes Signal DT 1, vergl. Fig. 5 (B2), erzeugt. Das die grobe Blocksegmentierung kennzeichnende Signal DT 1 hat den logischen Pegel HIGH in einem Bereich, der mit der Zeichenblockbreite korrespondiert, in welcher der x-Projektionssignalwert größer Null ist. Daher grenzen die seitlichen Ränder jedes Zeichenblocks an die seitlichen Konturen des korrespondierenden Zeichens.
Andererseits wird bei der genauen Segmentierung das x-Projektionssignal S x mit dem höheren Schwellenpegel TH 1 verglichen. Als Ergebnis wird ein die genaue Blocksegmentierung kennzeichnendes Signals DT 2, vergl. Fig. 5 (C2), erzeugt. Auf ähnliche Weise wie bei dem zuvor erläuterten, die grobe Blocksegmentierung kennzeichnenden Signal DT 1 hat das die genaue Blocksegmentierung kennzeichnende Signal DT 2 den logischen Pegel HIGH in einem Bereich, der mit dem entsprechenden schmaleren Zeichenblock korrespondiert, in welchem das x-Projektionssignal S x einen Wert hat, der größer als der höhere Schwellenpegel TH 1 ist. Da der höhere Schwellenpegel TH 1 in dem gezeigten Ausführungsbeispiel auf "1" gesetzt ist, wird die vertikale Abtastlinie oder werden die vertikalen Abtastlinien, die nur einen einzigen Block aufweisen oder Bits mit dem logischen Pegel HIGH hat bzw. haben, vernachlässigt und außerhalb des Blocks mit schmalerem Zeichen plaziert, der zu segmentieren ist. Daher hat jeder Block mit schmalerem Zeichen, der bei der genauen Segmentierung segmentiert wurde, eine allgemein geringere Blockbreite im Vergleich mit derjenigen des breiteren Blocks, der bei der groben Segmentierung segmentiert wurde.
Wie ausgeführt wurde, ist das bevorzugte Ausführungsbeispiel für ein Zeichenerkennungssystem gemäß der vorliegenden Erfindung insbesondere für das Erkennen von Zeichen in Texten bestimmt, die ein Gemisch aus japanischen Schriftzeichen und alphabetischen, z. B. lateinischen Schriftzeichen, beispielsweise in englischen, deutschen, französischen Wörtern, Sätzen oder Absätzen enthalten. Um die japanischen Schriftzeichen oder Kanji-Schriftzeichen zu erkennen, wird im allgemeinen eine grobe Segmentierung zu bevorzugen sein, da die Gesamtbreite des Zeichens innerhalb des korrespondierenden Zeichenblocks enthalten sein kann. Andererseits wird wegen der höheren Genauigkeit der Segmentierung zu bevorzugen sein, für die alphabetischen Schriftzeichen die Zeichenblöcke, die mit einem einzigen Zeichen korrespondieren, akkurat zu segmentieren. Wie ausgeführt, können durch Verwendung der genauen Segmentierung die überlappenden Zeichen in korrespondierende Zeichenblöcke zerlegt werden. Andererseits werden im Falle des in Fig. 5 (A) an zweiter Stelle von rechts dargestellten japanischen Schriftzeichens, das ein Schriftzeichen mit voneinander getrennten Komponenten ist, diese Komponenten in getrennte Zeichenblöcke segmentiert, und zwar sowohl bei der groben Segmentierung als auch bei der genauen Segmentierung. Derartige getrennte Zeichenkomponenten enthaltende Zeichenblöcke können durch die Zeichenblockkombinierungs- Stufe 18 kombiniert werden, die weiter unten beschrieben wird.
Wie zuvor ausgeführt, werden das Kombinieren zweier oder mehrerer Zeichenblöcke in der Zeichenblockkombinierungs- Stufe 18 oder das Resegmentieren, das in der Resegmentierungs- Stufe 40 auszuführen ist, auf der Grundlage der Historie der Segmentierung gesteuert. (Die Art und Weise der Verwendung der Segmentierungshistorie oder der Segmentierungshysterese jedes der Zeichenblöcke wird weiter unten beschrieben). Daher werden, um ein Kombinieren von zwei oder mehr Zeichen und ein Resegmentieren in der Resegmentierungs- Stufe 40 zu ermöglichen oder freizugeben, das die grobe Blocksegmentierung kennzeichnende Signal DT 1 und die Daten sowie das die genaue Blocksegmentierung kennzeichnende Signal DT 2 in die Segmentierungshistoriecodierungs-Stufe 35 eingegeben, die ebenfalls weiter unten beschrieben wird. Die Historie-Daten, wie sie durch die Segmentierungshistoriecodierungs- Stufe 35 codiert wurden, werden in den Datenspeicher eingegeben. Andererseits werden Videobild-Daten, die in den segmentierten Zeichenblöcken aufgrund der genauen Segmentierung enthalten sind, d. h. in einem Block mit schmalerem Zeichen, in die zweite Unterstufe 13 als vorläufig segmentierte, den Zeichenblock kennzeichnende Daten S 5 eingegeben.
Zeichenblocksegmentierung - Zweite Unterstufe 13
Die vorläufig segmentierten Zeichen-Daten, die auf diese Weise in der ersten Unterstufe 12 erzeugt werden, enthalten Videobild-Daten eines Zeichens, von Zeichen oder Zeichenkomponenten in dem segmentierten Zeichenblock. Wie aus Fig. 5 ersichtlich, hat der Zeichenblock, der in der ersten Unterstufe 12 segmentiert wurde, eine veränderliche Breite, die von der Breite der darin befindlichen Zeichen abhängt, und eine Höhe, die mit der Zeichenfolgenhöhe korrespondiert. Die vorläufig segmentierten Zeichen-Daten S 5 werden in die zweite Unterstufe 13 eingegeben. Die zweite Unterstufe 13 ist zum Trennen überlappender Zeichen bestimmt, die in dem einzigen Zeichenblock enthalten sind, der entweder durch grobe Segmentierung oder durch genaue Segmentierung gewonnen wurde.
Ein Beispiel für überlappende Zeichen, die als ein einziges Zeichen zu segmentieren sind, ist in Fig. 6 (A) gezeigt. In diesem Beispiel enthält ein einziger Zeichenblock, der durch die erste Unterstufe 12 segmentiert wurde, alphabetische Schriftzeichen, nämlich "f" u. "o". Wie aus Fig. 6 (A) ersichtlich, grenzen die vertikalen Abtastlinien, die auf der x-Koordinatenlinie X +1 liegen, nämlich in der rechten Seitenkontur des "f" und in der linken Seitenkontur des "o", aneinander. Daher weist das x-Projektionssignal S x keinen Punkt auf, in dem der Signalpegel unter den niedrigeren bzw. den höheren Schwellenpegel TH 0 bzw. TH 1 bei der groben Segmentierung bzw. der genauen Segmentierung in der ersten Unterstufe fällt. Das bedeutet, daß in dem gezeigten Beispiel der minimale x-Projektionssignalwert bei der vertikalen Abtastlinie gewonnen wird, die auf der x-Koordinatenlinie x 0 liegt. Wie zu erkennen, befinden sich bei der vertikalen Abtastlinie, die auf der Koordinatenlinie x 0 liegt, vier Bits mit dem logischen Pegel HIGH oder vier "schwarze" Bits in den betreffenden Koordinatenpositionen x 0, y 3; x 0, y 4; x 0, y 5; x 0, y 6. Um daher zu erfassen, daß mehr als ein Zeichen in dem vorläufig segmentierten Zeichenblock enthalten ist, wird die Kontinuität der Bits des logischen Pegels HIGH um die vertikale Abtastlinie herum, bei der der minimale x-Projektionssignalwert gewonnen wurde, geprüft. In dem gezeigten Ausführungsbeispiel werden die Kontinuitäten der Bits mit logischem Pegel HIGH auf der vertikalen x -1-Abtastlinie, der vertikalen x 0-Abtastlinie und der vertikalen x +1-Abtastlinie geprüft. Wie aus Fig. 6 (A) ersichtlich, enthält die vertikale x -1-Abtastlinie fünf Bits mit dem logischen Pegel HIGH, die jeweils bei Koordinatenpositionen x -1, y 2; x -1, y 3; x -1, y 4; x -1, y 5; x -1, y 6 liegen. Wie ausgeführt, weist die vertikale x 0-Abtastlinie Bits mit dem logischen Pegel HIGH bei x 0, y 3; x 0, y 4; x 0, y 5; x 0, y 6 auf. Andererseits weist die vertikale x +1-Abtastlinie Bits mit dem logischen Pegel HIGH bei x +1, y 4; x +1, y 5; x +1, y 6; x +1, y 18; x +1, y 19; x +1, x 20; x +1, y 21; x +1, y 22 auf.
Die Art und Weise der Erfassung einer Diskontinuität in dem einzigen Zeichenblock kann anhand von Fig. 7 (A) u. Fig. 7 (B) erläutert werden. In dem in Fig. 7 (A) gezeigten Beispiel liegen Bits mit dem logischen Pegel HIGH jeweils bei x a1, y a2; x a1, y a3; x a1, y a4; x a2, y a3; x a2, y a4; x a3, y a4; x a3, y a5; x a3, y a6 vor. In diesem Fall hat jede Abtastlinie x a1, x a2 u. x a3 zumindest ein Bit mit dem logischen Pegel HIGH in Kontinuität mit den benachbarten Bits in den benachbarten vertikalen Abtastlinien. In einem derartigen Fall wird das Zeichen in dem Zeichenblock so behandelt, als hätte es Kontinuität, und es wird demzufolge als ein einziges Zeichen betrachtet. Andererseits sind in dem Beispiel gemäß Fig. 7 (B) Bits mit dem logischen Pegel HIGH bei x b1, y b3; x b1, y b4; x b1, y b5; x b2, y b4; x b2, y b5; x b3, y b6; x b4, y b1; x b4, y b2; x b5, y b1; x b5, y b2; x b5, y b3; x b6, y b2; x b6, y b3 vorhanden. In diesem Fall bilden die Bits mit dem logischen Pegel HIGH bei x b1, y b3; x b1, y b4; x b1, y b5; x b2, y b4; x b2, y b5; x b3, y b6 eine erste Zeichenkomponente, und die Bits mit dem logischen Pegel HIGH bei x b4, y b1; x b4, y b2; x b5, y b1; x b5, y b2; x b5, y b3; x b6, y b2; x b6, y b3 bilden eine zweite Zeichenkomponente in dem Zeichenblock. Wie hieraus zu ersehen, haben die Bits mit dem logischen Pegel HIGH auf der vertikalen Abtastlinie x b3 keine Verbindung mit den Bits mit dem logischen Pegel HIGH auf der benachbarten vertikalen Abtastlinie x b4. Daher wird die Behandlung des Zeichenblocks so vorgenommen, daß die erste Zeichenblockkomponente und die zweite Zeichenblockkomponente getrennt werden. Dazu ist es erforderlich, daß um die Diskontinuität der Komponenten zu erfassen, benachbarte Bits der benachbarten Abtastlinien in bezug auf jedes Bit, das den logischen Pegel HIGH hat, überprüft werden. In dem Beispiel gemäß Fig. 7 (B) hat das Bit bei x b3, y b5 kein benachbartes Bit mit dem logischen Pegel HIGH auf der vertikalen x b4-Abtastlinie. Andererseits hat das Bit mit dem logischen Pegel HIGH bei x b4, y b2 ebenfalls kein benachbartes Bit mit dem logischen Pegel HIGH auf der vertikalen x b3-Abtastlinie. Daher hat eine Trennung zwischen der ersten und der zweiten Zeichenblockkomponente zwischen den ver 66587 00070 552 001000280000000200012000285916647600040 0002003632832 00004 66468tikalen x b3- und x b4-Abtastlinien zu erfolgen.
Zurückkommend auf Fig. 6 (A) ist festzustellen, daß in dem Fall des gezeigten Beispiels keine Bits mit dem logischen Pegel HIGH auf der vertikalen x 0-Abtastlinie benachbart zu den Bits mit dem logischen Pegel HIGH bei x +1, y 18; x +1, y 19; x +1, y 20; x +1, y 22; x +1, y 22 vorliegen. Zusätzlich kann eine Diskontinuität zwischen den Bits bei x +1, y 6 und x +1, y 18 festgestellt werden. Daher wird der vorläufig segmentierte Zeichenblock in zwei getrennte Blöcke bei der vertikalen x +1-Abtastlinie zerlegt.
Wie zuvor ausgeführt, wird in der zweiten Unterstufe 13 der vorläufig mittels der groben Segmentierung und der genauen Segmentierung in der ersten Unterstufe 12 segmentierte Zeichenblock wiederumin schmälere Blöcke segmentiert, um so die Unmöglichkeit einer Zeichenerkennung aufgrund des Vorhandenseins von mehr als einem Zeichen in einem einzigen Zeichenblock zu verhindern.
Es ist ersichtlich, daß ein Bildleser, wie ihn der Dokumentleser 2 darstellt, der in dem Zeichenerkennungssystem gemäß der vorliegenden Erfindung benutzt wird, dem Einfluß einer Modulationsverstärkung ausgesetzt ist, die einen Schwund (fading) bei der Kontur eines Zeichens bewirken kann, der zu einer Zeichenblocksegmentierung führen kann. Insbesondere dann, wenn der Text alphabetische Zeichen enthält, die in einer relativ dichten Anordnung stehen, kann ein Schwund (fading) der Konturen der Zeichen eine Segmentierung dahingehend bewirken, daß mehr als ein Zeichen in einem einzigen Zeichenblock enthalten ist. Dies verursacht offensichtlich Schwierigkeiten bei der Zeichenerkennung in der Zeichenerkennungs-Stufe 23. Gemäß dem bevorzugten Ausführungsbeispiel kann eine derartige Schwierigkeit durch Ausführen einer trennenden Segmentierung der zweiten Unterstufe zum Trennen der Zeichenblöcke mittels Überprüfen auf eine Diskontinuität des Zeichens oder der Zeichenkomponenten in dem Zeichenblock umgangen werden. Daher wirkt sich die Benutzung der zweiten Unterstufe in dem bevorzugten Ausführungsbeispiel für das Zeichenerkennungssystem gemäß der vorliegenden Erfindung vorteilhaft aus.
Es ist ersichtlich, daß die Kanji-Schriftzeichen und die japanischen Schriftzeichen von einer Art sind, bei der eine Diskontinuität in einem einzigen Zeichen gegeben ist, selbst wenn ein solches Zeichen einen "nichtseparierten" Charakter hat. Beispielsweise kann das in Fig. 5 (A) auf der linken Seite gezeigt Kanji-Schriftzeichen offensichtlich in zwei getrennte Komponenten zerlegt aufgefaßt werden, obwohl sie zum Zwecke der Zeichenerkennung nicht zu trennen sind. Tatsächlich werden derartige getrennte Komponenten des Zeichens in der zweiten Unterstufe 12 getrennt. Indessen können in dem bevorzugten Ausführungsbeispiel für das erfindungsgemäße Zeichenerkennungssystem die getrennten Zeichenkomponenten durch die Zeichenblockkombinierungs-Stufe 18 rekombiniert werden, die weiter unten beschrieben wird. Daher tritt keine Schwierigkeit beim Erkennen eines Zeichens durch ein Zerlegen dieses einzigen Zeichens in zwei oder mehr Zeichenkomponenten auf.
Auf der Grundlage des Ergebnisses der den Zeichenblock zerlegenden Segmentierung, die durchgeführt wurde, werden sekundäre Zeichenbild-Daten S 6 durch die zweite Unterstufe 13 extrahiert. Die sekundären Zeichenbild-Daten S 6 enthalten Bild-Daten in dem Zeichenblock, der durch die trennende Segmentierung in der Breite definiert ist. Der Zeichenblock, der durch die zweite Unterstufe definiert ist, hat eine Höhe, die mit der Zeichenfolgenhöhe korrespondiert, wie dies weiter oben ausgeführt wurde.
Während der zuvor erläuterten trennenden Segmentierung in der zweiten Unterstufe werden die Segmentierungshistorie- Daten fortlaufend zu der Segmentierungshistoriecodierungs- Stufe 35 übertragen und in dem Datenspeicher 25 gespeichert.
Zeichenblocksegmentierung - Dritte Unterstufe 14
Die sekundären Zeichenbild-Daten S 6, die in der zweiten Unterstufe 13 gewonnen wurden, werden zu der dritten Unterstufe übertragen. In der dritten Unterstufe wird eine weitere Segmentierung zum Bestimmen des oberen und des unteren Randes des Zeichenblocks bei den Positionen durchgeführt, die im wesentlichen mit den grobdefinierten oberen und unteren Konturen jedes individuellen Zeichens korrespondieren. Um die Segmentierung in der dritten Unterstufe durchzuführen, wird wiederum ein y-Projektionsprofil PR y mit Bezug auf jeden individuellen Zeichenblock gewonnen, wie dies in Fig. 8 (A) gezeigt ist. Wie zuvor ausgeführt, hat der Zeichenblock, wie er durch die zweite Unterstufe 13 definiert ist, eine Breite, die mit der Breite W x des betreffenden Zeichens oder der betreffenden Zeichenkomponente korrespondiert, und eine Höhe W y1, die mit der Zeichenfolgenhöhe korrespondiert. Um einen Rausch- oder Störanteil auf den vertikalen Abtastlinien zu beseitigen, wird das y-Projektionsprofil PR y mit einem gegebenen Schwellenpegel PR th verglichen. In der Praxis kann der Schwellenpegel PR th in Beziehung zu der Dicke der Linie bestimmt werden, die das Zeichen darstellt. Beispielsweise kann der Schwellenpegel PR th ungefähr auf die Hälfte der Liniendicke des Zeichens eingestellt sein. Als ein Ergebnis des Vergleichsvorgangs kann in der dritten Unterstufe ein modifizierter Zeichenblock, der die Breite W x und die Höhe W y2 hat, die mit der Höhe des Zeichens korrespondiert, gewonnen werden.
Daher werden die Bild-Daten in dem modifizierten Zeichenblock im wesentlichen identisch mit denjenigen gehalten, die in den sekundären Zeichenbild-Daten S 6 enthalten sind, die durch die zweite Unterstufe gewonnen wurden, ausgenommen betreffend die Bits für die Leerstelle, in der nur "weiße" Bits und einen Rausch- oder Störanteil beinhaltende Bits in oberen und/oder unteren Sonderbereichen in dem Zeichenblock vorliegen, der durch die zweite Unterstufe segmentiert wurde.
Es sei angemerkt, daß der Zeichenblock, der in der dritten Unterstufe 14 der Zeichenblocksegmentierungs-Stufe 11 bestimmt wurde, einen Basiszeichenblock für den Zeichenerkennungsprozeß bildet, der weiter unten beschrieben wird. Die Bild-Daten, die in dem Basiszeichenblock enthalten sind, werden im folgenden als "Basiszeichenbild-Daten S 7" bezeichnet. Im allgemeinen wird der Zeichenerkennungsprozeß unter Verwendung der Basiszeichenbild-Daten S 7 in der Zeichenerkennungs- Stufe 23 durchgeführt.
Zeichenblockkombinierungs-Stufe 18
Die Zeichenblockkombinierungs-Stufe 18 ist zwischen die Zeichenblocksegmentierungs-Stufe 11, die zuvor beschrieben wurde, und die Zeichenerkennungs-Stufe 23 eingefügt. Die Zeichenblockkombinierungs-Stufe 18 enthält eine Diskriminator- Stufe 20 zum Diskriminieren von Kanji-Schriftzeichen oder japanischen Schriftzeichen und alphabetischen Schriftzeichen. Es sei angemerkt, daß arabische Ziffern (1, 2, 3 . . .) und arabische oder oder vergleichbare Schriftzeichen in dem gezeigten Ausführungsbeispiel für das erfindungsgemäße Zeichenerkennungssystem wie alphabetische Schriftzeichen behandelt werden. Die Diskriminator-Stufe 20 ist einer Schalt-Stufe 21 zugeordnet. Wenn die Beurteilung in der Diskriminator-Stufe 20 ergibt, daß das durch die Zeichenerkennungs- Stufe 23 zu erkennende Zeichen ein Kanji-Schriftzeichen oder ein japanisches Schriftzeichen ist, wird ein Schalter in der Schalt-Stufe zu einer Klemme SW 1 umgelegt, um die dritte Unterstufe 14 der Zeichenblocksegmentierungs- Stufe 11 mit einer Kombinator-Stufe 22 zu verbinden. In der Kombinator-Stufe 22 wird eine Kombinierungsoperation für die Basiszeichenblöcke in einer Art und Weise durchgeführt, wie sie weiter unten beschrieben wird. Als Ergebnis der Kombinierungsoperation in der Kombinator-Stufe 22 werden kombinierte Bild-Daten S 8 in die Zeichenerkennungs-Stufe 23 eingegeben. Andererseits wird, wenn die Beurteilung in der Diskriminator-Stufe 20 ergibt, daß das Zeichen, das zu erkennen ist, ein alphabetisches Schriftzeichen ist, der Schalter in der Schalt-Stufe 21 zu einer Klemme SW 2 umgelegt, um die dritte Unterstufe 14 der Zeichenblocksegmentierungs- Stufe 11 direkt mit der Zeichenerkennungs-Stufe 23 zu verbinden. Daher werden in diesem Fall die Basiszeichenbild- Daten S 7 in die Zeichenerkennungs-Stufe 23 eingegeben.
Die Diskriminator-Stufe 20 ist dazu bestimmt, ein Signal DTE, das kennzeichnend für die Art des Zeichens (Kanji- Schriftzeichen oder japanisches Schriftzeichen oder alphabetisches Schriftzeichen) ist, das in der Zeichenerkennungs- Stufe 23 erkannt wurde, von der Zeichenerkennungs- Stufe aufzunehmen. Mit Bezug auf das Signal DTE aus der Zeichenerkennungs-Stufe 23 wird ein Schaltsteuersignal in der Diskriminator-Stufe 20 zum Ändern der Schalterstellung in der Schalt-Stufe 21 erzeugt.
In der Kombinator-Stufe 22 findet eine Basiszeichenblock- Kombinierungsoperation statt, die in Fig. 9 dargestellt ist. Grundsätzlich wird die Basiszeichenblock-Kombinierungsoperation auf der Grundlage der allgemeinen Logik durchgeführt, daß die Kanji-Schriftzeichen und die japanischen Schriftzeichen vertikale und horizontale Proportionen, die im folgenden als "H/W-Verhältnis" bezeichnet werden, aufweisen, die im wesentlichen oder angenähert den Wert "1" haben. Das bedeutet, daß wenn der Basiszeichenblock, der durch die Zeichenblocksegmentierungs-Stufe 11 definiert wurde, ein H/W-Verhältnis von angenähert 1 hat, die Beurteilung dahingehend ausfällt, daß der Basiszeichenblock ein einziges, d. h. ein "Vollkomponenten"-Zeichen enthält. Andererseits fällt, wenn der Basiszeichenblock, der durch die Zeichenblocksegmentierungs- Stufe 11 definiert wurde, ein H/W-Verhältnis hat, das weit größer als 1 ist, die Beurteilung dahingehend aus, daß der Basiszeichenblock nur eine Zeichenkomponente enthält, die mit einer anderen in einem folgenden Basiszeichenblock zu kombinieren ist.
Fig. 9 zeigt den Kombinierungsoperationsprozeß, der in der Kombinator-Stufe 22 auszuführen ist. Das Programm, das gemäß dem Flußdiagramm in Fig. 9 ablaufen soll, wird in Reaktion auf die Basiszeichenbild-Daten S 7 aus der Zeichenblocksegmentierungs- Stufe 11 inganggesetzt. Nach dem Starten des Programms in einem Schritt SP 1 wird das H/W-Verhältnis des Basiszeichenblocks, der durch die Basiszeichenbild-Daten S 7 definiert ist, in einem Schritt SP 2 geprüft. Wenn das H/W- Verhältnis des Basiszeichenblocks angenähert 1 ist, setzt sich das Programm zu seinem Ende in einem Schritt SP 3 fort. Andererseits wird, wenn der Basiszeichenblock ein H/W-Verhältnis hat, das sich von 1 stark unterscheidet, wie dies in dem Schritt SP 2 geprüft wurde, der Prozeß in einem Wartezustand zum Warten auf die nächste Eingabe von Basiszeichenbild- Daten S 7 aus der Zeichenblocksegmentierungs-Stufe 11 in einem Schritt SP 4 gehalten. Die Prozeßoperation wird in Reaktion auf die Eingabe nachfolgender Basiszeichenbild- Daten S 7 wiederholt, um die zuletzt eingegebenen Zeichenbild- Daten mit den unmittelbar vorhergehenden Basiszeichenbild- Daten in dem Schritt SP 4 zu kombinieren. Desweiteren wird in dem Schritt SP 4 die Höhe h 0 des kombinierten Zeichenblocks gewonnen. In einem Schritt SP 5 wird das H/W- Verhältnis des neu kombinierten Zeichenblocks unter Verwendung der Breite w 0 und der Höhe h 0, die in dem Schritt Sp 4 gewonnen wurde, geprüft. Wenn das H/W-Verhältnis des kombinierten Zeichenblocks angenähert oder nahezu 1 ist, setzt sich der Prozeß zu dem Schritt SP 3 fort, um das Kombinierungsprogramm zu beenden. Daher werden in diesem Fall die kombinierten Bild-Daten S 8 zu der Zeichenerkennungs-Stufe 23 übertragen, wobei diese kombinierten Bild-Daten S 8 Bild- Daten der kombinierten Zeichenblöcke enthalten. Andererseits wird, wenn das H/W-Verhältnis immer noch stark verschieden von 1 ist, das H/W-Verhältnis, das auf der Grundlage der Breite w 0 und der Höhe h 0 gewonnen wurde, dahingehend in einem Schritt SP 6 geprüft, ob es größer als 1 ist. Wenn dies der Fall ist, kehrt der Prozeß zu dem Schritt SP 4 zurück, um nachfolgend eingegebene weitere Basiszeichenbild-Daten mit den vorhergehenden zu kombinieren. Der Prozeß in den Schritten SP 4 und Sp 5 wird solange wiederholt, bis das H/W- Verhältnis angenähert 1 ist oder bis das H/W-Verhältnis größer als 1 ist. Wenn das H/W-Verhältnis zu kleiner als 1 erfaßt wird, wie dies in dem Schritt SP 6 geprüft wird, setzt sich der Prozeß zu einem Schritt SP 7 fort, um den kombinierten Zeichenblock auszuwählen, der in der unmittelbar vorhergehenden Kombinierungsoperation in der Schleife der Schritte gewonnen wurde, um ihn als kombinierte Bild-Daten S 8 auszugeben. Nach dem Schritt SP 7 setzt sich der Prozeß zu dem Schritt SP 3 fort, um den Kombinierungsprozeß zu beenden.
Ein Beispiel für die Kombinierungsoperation für Zeichenblöcke, die in der Zeichenblockkombinierungs-Stufe 18 durchzuführen ist, wird im folgenden anhand von Fig. 10 erläutert. In Fig. 10 sind die oberen rechteckförmigen Blöcke 0 bis 22 Zeichenblöcke, wie sie in der Zeichenblocksegmentierungs- Stufe 11 als Basiszeichenblöcke segmentiert wurden. In den Basiszeichenblöcken 0 bis 22 werden die Zeichenblöcke 0, 1, 4, 5, 9, 10, 13, 14, 17, 18, 21 u. 22, die jeweils Zeichenbilddaten einer ersten Kategorie aufweisen, als ein H/W-Verhältnis von angenähert 1 aufweisend beurteilt. Andererseits sind die H/W-Verhältnisse der Zeichenblöcke 2, 3, 6, 7, 8, 11, 12, 15, 16, 19 u. 20 kleiner als 1. Jeder der Zeichenblöcke 2, 3, 6, 7, 8, 11, 12, 15, 16, 19 u. 20 enthält jeweils Zeichenbild-Daten einer zweiten Kategorie. Beim Prüfen des H/W-Verhältnisses in dem Schritt SP 2 in dem zuvor beschriebenen Programmablauf gemäß Fig. 9, fällt daher die Beurteilung dahingehend aus, daß die Basiszeichenblöcke 2, 3, 6, 7, 8, 11, 12, 15, 16, 19 u. 20 Zeichenkomponenten enthalten, die einen Trennungscharakter aufweisen, vergl. Fig. 10. Daher werden die Schritte SP 4 bis SP 6 ausgeführt, um benachbarte Zeichen zu kombinieren, wie dies durch entsprechende waagerechte Striche unter den betreffenden Zeichenblöcken in Fig. 10 angedeutet ist. In bezug auf den Zeichenblock 8 fällt die Beurteilung so aus, daß der Zeichenblock mit dem nachfolgenden Zeichenblock in dem Schritt SP 2 zu kombinieren ist. Indessen wird nach dem Kombinieren dieses Zeichenblocks 8 mit dem nachfolgenden Zeichenblock 9 das H/W-Verhältnis größer als 1. Daher wird in dem Schritt SP 7 der Zeichenblock 8 als alleinstehender Zeichenblock bewertet, der ein Zeichenbild enthält, das in seiner Form etwa dem Spiegelbild eines Komma entspricht.
Andererseits hat im Falle eines mit alphabetischen Schriftzeichen ausgeführten Textes (in Englisch), wie dies in Fig. 11 gezeigt ist, jeder Zeichenblock 0 bis 27 ein H/W-Verhältnis, das kleiner als 1 ist. Indessen wird die Schalt- Stufe 21 durch das Schaltersteuersignal aus der Diskriminator- Stufe 20 betätigt, das in Reaktion auf das Signal DTE aus der Zeichenerkennungs-Stufe 23 erzeugt wird, um den Schalter der Schalt-Stufe zu der Klemme SW 2 umzulegen, womit die Zeichenblocksegmentierungs-Stufe 11 direkt mit der Zeichenerkennungs- Stufe 23 verbunden wird. Daher werden die Zeichenblöcke 0 bis 27, die der Reihe nach Zeichenbilder für "s", "o", "o", "n", ")", "a", "r", "e", "o", "u", "t", "s", "i", "d", "e", "t", "h", "e", "s", "c", "o", "p", "e", "o", "f", "t", "h" u. "e" enthalten, zu der Zeichenerkennungs- Stufe 23 direkt von der Zeichenblocksegmentierungs-Stufe 11 in der genannten Reihenfolge übertragen. Wie ausgeführt, wird, da die alphabetischen Schriftzeichen in sich keine Trennung aufweisen, die Zeichenblockkombinierungs-Stufe 18 beim Übertragen der Zeichenbild-Daten S 7 zu dem Zeichenerkennungssystem umgangen.
Datenspeicher 25
Der Datenspeicher speichert verschiedene Daten, die in der zuvor beschriebenen Zeichenkombinierungsoperation in der Zeichenblockkombinierungs-Stufe 18 verwendet werden können.
Jede Speicheradresse zum Speichern von Daten über den Zeichenblock hat eine Struktur, wie sie beispielsweise in Fig. 12 gezeigt ist. Wie aus Fig. 12 ersichtlich, hat die Speicheradresse des Datenspeichers 25 ein Datenformat, das einen ersten Datenblock DATA1, der Daten D w speichert, die kennzeichnend für die Breite des korrespondierenden Basiszeichenblocks ist, einen zweiten Datenblock DATA2, der Daten D h speichert, die kennzeichnend für die Höhe des korrespondiernden Basiszeichenblocks sind, einen dritten Datenblock DATA3 zum Setzen/Rücksetzen von Kennzeichnungsbits (flags) FLG1, FLG2, FLG3 u. FLG4 und einen vierten Datenblock DATA4 umfaßt, der Positionsdaten D ps , H/W-Verhältnis-Daten D vh , Daten für die relative Höhe D szv und Daten für die relative Breite D szh speichert. Der erste Datenblock DATA1 hat 8 Bits zum Speichern der 8 Bits der Zeichenblockbreiten-Daten D w . In ähnlicher Weise besteht der Datenblock DATA2 aus einem 8-Bit-Speicherblock zum Speichern der 8 Bits von Zeichenblockhöhen- Daten D h . In dem dritten Datenblock DATA3 ist jedes Bit der zuvor genannten Kennzeichnungsbits FLG1, FLG2, FLG3 u. FLG4 zu setzen. Das Kennzeichnungsbit FLG1 kennzeichnet die Segmentierungshistorie in der ersten Unterstufe 12 unter Verwendung des unteren Schwellenpegels TH 0. Das Kennzeichnungsbit FLG1 wird jedesmal dann gesetzt bzw. rückgesetzt, wenn die grobe Segmentierung in der ersten Unterstufe 12 stattfindet. Beispielsweise hat das Kennzeichnungsbit FLG1 den logischen Pegel LOW ("0") für den ersten Zeichenblock und den logischen Pegel HIGH ("1") für den darauffolgenden zweiten Zeichenblock. Auf ähnliche kennzeichnen die Kennzeichnungsbits FLG2 die Segmentierungshistorie in der ersten Unterstufe 12 unter Verwendung des höheren Schwellenpegels TH 1. Dabei wird das Kennzeichnungsbit FLG2 abwechselnd jedesmal dann gesetzt bzw. rückgesetzt, wenn die genaue Segmentierung durch die erste Unterstufe 12 stattfindet. Daher kennzeichnet auf ähnliche Weise das Kennzeichnungsbit FLG3 die Segmentierungshistorie in der zweiten Unterstufe 13 und wird abwechselnd jedesmal dann gesetzt bzw. rückgesetzt, wenn die Segmentierung in der zweiten Unterstufe 13 stattfindet. Das Kennzeichnungsbit FLG4 wird gesetzt, wenn eine Rausch- oder Störanteil-Beseitigung unter Verwendung des y-Projektionsprofils in der dritten Unterstufe 14 durchgeführt wird. Weitere Einzelheiten der Prozedur beim Codieren der Segmentierungshistorie in der der Zeichenblocksegmentierungs-Stufe werden weiter unten beschrieben.
Andererseits sind die Positionsdaten D ps , die H/W-Verhältnis- Daten D vh , die Daten für die relative Höhe D szv und die Daten für die relative Breite D szh jeweils 2-Bit-Daten, die in dem vierten 8-Bit-Datenblock DATA4 zu speichern sind. Die Daten für die relative Höhe D szv kennzeichnen die relative Höhe des Basiszeichenblocks relativ zu der Höhe h R eines Standard-Basiszeichenblocks. Auf ähnliche Weise kennzeichnen die Daten für die relative Breite D szh die relative Breite des Basiszeichenblocks bezogen auf eine Breite w R eines Standard-Basiszeichenblocks.
Die Zeichenblockbreiten-Daten D w werden durch die Parametercodierungs- Stufe 30 gewonnen, die weiter unten beschrieben wird, und zwar relativ zu dem Zeichenblock, der in der zweiten Unterstufe 13 in der Zeichenblocksegmentierungs- Stufe 11 segmentiert wird. In der Praxis wird die Breite des Zeichenblocks, der in der zweiten Unterstufe 13 segmentiert wird, durch eine H/W-Verhältnis- u. Zeichengrößendetektor- Stufe 31 innerhalb der Parametercodierungs-Stufe 30 erfaßt. Die Zeichenblockhöhen-Daten D h werden ebenso durch die Parametercodierungs- Stufe 30, insbesondere durch die H/W- Verhältnis- u. Zeichengrößendetektor-Stufe 31 mit Bezug auf den Basiszeichenblock gewonnen, der durch die dritte Unterstufe 14 der Zeichenblocksegmentierungs-Stufe 11 segmentiert wird. Die H/W-Verhältnis- u. Zeichengrößendetektor-Stufe 31 innerhalb der Parametercodierungs-Stufe 30 bestimmt außerdem das H/W-Verhältnis auf der Grundlage der Zeichenblockbreite und der Zeichenblockhöhe, die wie zuvor ausgeführt gewonnen werden. Die H/W-Verhältnis- Daten D vh werden dann in dem vierten Datenblock DATA4 gespeichert. Desweiteren gewinnt die H/W-Verhältnis- u. Zeichengrößendetektor-Stufe 31 die relativen Zeichenbreiten-Daten D szh und die relativen Zeichenhöhen- Daten D szv durch Vergleichen der gewonnenen Zeichenbreite und der gewonnenen Zeichenhöhe mit einer Standardbreite und einer Standardhöhe w R bzw. h R . Wie zuvor ausgeführt, werden diese relativen Zeichenbreiten-Daten D dzh und relativen Zeichenhöhen-Daten D szv ebenfalls in dem vierten Datenblock DATA4 gespeichert.
Die relativen Zeichenbreiten-Daten D szh und die relativen Zeichenhöhen-Daten D szv werden zum Unterscheiden von Klein- und Großbuchstaben gleicher Zeichenmuster verwendet. Beispielsweise besteht bei japanischen Schriftzeichen eine unterschiedliche Größe der Schriftzeichen für formgleiche Schriftzeichenmuster, wie beispielsweise "" u. ""; "" u. ""; "" u. "". Unter diesen Schriftzeichen, die formgleiche Schriftzeichen haben, haben die jeweils zuerst genannten gegenüber den jeweils an zweiter Stelle genannten eine unterschiedliche Größe. Solche Schriftzeichen, die formgleiche Zeichenmuster in bezug auf die normale Größe haben und kleiner als die zuerst genannten sind, dienen als silbenhafte Nasallaute in japanischen Texten und werden im folgend als "kleine Zeichen" bezeichnet. Wegen des Vorhandenseins solcher kleiner Schriftzeichen im Japanischen ist es notwendig, solche kleinen Schriftzeichen von den Schriftzeichen normaler Größe zu unterscheiden. Die relativen Zeichenbreiten-Daten D szh und die relativen Zeichenhöhen- Daten D szv sind notwendig, um die Zeichenerkennungs- Stufe in die Lage zu versetzen, die kleinen Schriftzeichen von den korrespondieren Schriftzeichen normaler Größe zu unterscheiden. Desweiteren wird ein derartiger Größenfaktor zum Unterscheiden von Kleinbuchstaben und Großbuchstaben mit im wesentlichen identischen Zeichenmusterformen bei alphabetischen Schriftzeichen, wie beispielsweise "C" u. "c", "S" u. "s", "Z" u. "z" usw..
Die Positionsdaten D ps sind repräsentativ für die Position des Zeichens innerhalb eines Standard-Zeichenblocks P R , der eine Standardbreite w R und eine Standardhöhe h R hat, wie dies in Fig. 14 gezeigt ist. In dem gezeigten Ausführungsbeispiel repräsentieren die Positionsdaten D ps die Tatsache, daß das Zeichen den oberen Bereich P RU oder den unteren Bereich P RD des Standardzeichenblocks P R besetzt hat. Das erste Bit der 2-Bit-Positionsdaten D ps nimmt den logischen Pegel HIGH ("1") an, wenn der obere Bereich P RU durch das Zeichen besetzt ist, und es nimmt den logischen Pegel LOW ("0") im anderen Fall an. Auf ähnliche Weise nimmt das zweite Bit der 2-Bit-Positionsdaten D ps den logischen Pegel HIGH ("0") an, wenn der untere Bereich P RD durch das Zeichen besetzt ist, und den logischen Pegel LOW ("0") im anderen Fall. Daher kennzeichnen die Positionsdaten D ps , wenn deren Bits den Wert "1, 1" haben, daß das Zeichen sowohl den oberen als auch den unteren Bereich P RU und P RD besetzt. Wenn die Positionsdaten D ps Bits mit den Werten "1, 0" haben, kennzeichnet dies die Tatsache, daß das Zeichen nur den oberen Bereich P RU des Standard-Zeichenblocks P R besetzt. Solche Zeichen sind beispielsweise das Apostroph (′), das Zeichen für Grad (°), hochgestellte Buchstaben usw.. Andererseits kennzeichnen die Positionsdaten D ps , wenn deren Bits die Werte "0, 1" haben, daß das Zeichen nur den unteren Bereich P RU des Standard-Zeichenblocks P R besetzt. Solche Zeichen können beispielsweise der Punkt (.), das Komma (,), das japanische Ende-Zeichen (o), ein weiteres japanisches Sonderzeichen (bressing mark) (in der Form des Spiegelbilds des Komma), tiefgestellte Buchstaben usw. sein. Die Zeichen, die nur den oberen oder nur den unteren Bereich P RU oder P RD des Standard-Zeichenblocks P R besetzen, sind spezielle Zeichen. Da die Anzahl solcher spezieller Zeichen begrenzt ist, kann die Erkennung dieser speziellen Zeichen unter Benutzung von speziellen und vereinfachten Zeichenerkennungs-Algorithmen, die verschieden von denen zur Erkennung normaler Zeichen sind, durchgeführt werden. Daher werden die Positionsdaten D ps zum Erfassen derartiger spezieller Zeichen verwendet.
Segmentierungshistoriecodierungs-Stufe 35
Wie kurz in dem vorhergehenden Abschnitt ausgeführt, steuert die Segmentierungshistoriecodierungs-Stufe 35 das Setzen und Rücksetzen der Kennzeichnungsbits FLG1, FLG2, FLG3, FLG4 in dem dritten Datenblock DATA3 des Datenspeichers. Wie ebenfalls zuvor ausgeführt, kennzeichnen diese Kennzeichnungsbits FLG1, FLG2, FLG3 u. FLG4 in Kombination die Historie der Segmentierung, die in der Zeichenblocksegmentierungs- Stufe 11 durchgeführt wurde. Da jeweils ein Bit für den Zustand "Gesetzt" oder "Rückgesetzt" jedes der Kennzeichnungsbits FLG1, FLG2, FLG3 u. FLG4 vorgesehen ist, wird die Segmentierungshistorie durch einen 4-Bit-Binärcode dargestellt. Der Prozeß zum Codieren der Segmentierungshistorie wird weiter unten anhand von Fig. 15 beschrieben.
Wie in Fig. 15 gezeigt, werden währen einer Zeichenblocksegmentierung in der ersten Unterstufe 12 unter Verwendung des unteren Schwellenpegels TH 0 durchgeführt wird, die Werte des Kennzeichnungsbits FLG1 für die betreffenden Zeichenblöcke SQ 1, SQ 2, SQ 3, SQ 4 abwechselnd auf "0", "1", "0", "1" . . . gesetzt. Daher werden in diesem Beispiel für die Zeichenblöcke SQ 1, SQ 3 . . ., die in ungeradzahligen Zyklen der Segmentierungsoperation segmentiert werden, die Kennzeichnungsbits FLG1 auf "0" gesetzt, und für die Zeichenblöcke SQ 2, SQ 4 . . ., die in geradzahligen Zyklen der Segmentierungsoperation segmentiert werden, werden die Kennzeichnungsbits FLG1 auf "1" gesetzt. Auf ähnliche Weise wird, während die Zeichenblocksegmentierung in der ersten Unterstufe 12 unter Verwendung des höheren Schwellenpegels TH 1 durchgeführt wird, der Wert des Kennzeichnungsbits FLG2 für die betreffenden Zeichenblöcke SQ 11, SQ 12, SQ 21, SQ 31, SQ 41, SQ 42 . . . abwechselnd auf "0", "1", "0", "1", "0", "1" . . . gesetzt. Daher werden in diesem Beispiel für die Zeichenblöcke SQ 11, SQ 21, SQ 41 . . ., die in ungeradzahligen Zyklen der Segmentierungsoperation segmentiert werden, die Kennzeichnungsbits FLG2 auf "0" und für die Zeichenblöcke SQ 12, SQ 31, SQ 42 . . ., die in geradzahligen Zyklen der Segmentierungsoperation segmentiert werden, die Kennzeichnungsbits FLG2 auf "1" gesetzt. Wie aus Fig. 15 ersichtlich, sind die Zeichenblöcke SQ 11, SQ 12 u. SQ 41 und SQ 42 bei der genauen Segmentierung aus denbetreffenden einzigen Zeichenblöcken SQ 1 u. SQ 4, wie sie in der groben Segmentierung segmentiert würden, hervorgegangen.
Das Kennzeichnungsbit FLG3 wird gemäß der Reihenfolge oder des Ablaufs der Segmentierung, die in der zweiten Unterstufe 13 durchgeführt wird, gesetzt/rückgesetzt. In dem gezeigten Beispiel werden die Zeichenblöcke SQ 111, SQ 121, SQ 211, SQ 212, SQ 311, SQ 411, SQ 412, SQ 421. . . in der zweiten Unterstufe 13 segmentiert, vergl. auch Fig. 16. Das Kennzeichnungsbit FLG3 wird jeweils auf "0", "1", "0", "1", "0", "1", "0" . . . für die Zeichenblöcke SQ 111, SQ 121, SQ 211, SQ 212, SQ 311, SQ 411, SQ 412, SQ 421 . . . gesetzt. Wie ersichtlich, wird der Zeichenblock SQ 21, der in der genauen Segmentierung segmentiert wird, in zwei separate Zeichenblöcke SQ 211 u. SQ 212 unterteilt. Außerdem wird der Zeichenblock SQ 41, der ursprünglich als einziger Zeichenblock mit dem Zeichenblock SQ 42 in der groben Segmentierung in der ersten Unterstufe 12 segmentiert und von dem Zeichenblock SQ 42 in der genauen Segmentierung in der ersten Unterstufe getrennt wurde, wiederum in zwei Zeichenblöcke SQ 411 u. SQ 412 in der zweiten Unterstufe 13 zerlegt.
Wie zuvor ausgeführt, wird das Kennzeichnungsbit FLG4 abhängig davon gesetzt oder rückgesetzt, ob die Segmentierung zum Entfernen des einen Rausch- oder Störanteil enthaltenen Bereichs in dem Zeichenblock, der in der zweiten Unterstufe 13 gewonnen wurde, in der dritten Unterstufe 14 durchgeführt wird oder nicht durchgeführt wird. Das bedeutet, daß wenn ein bestimmter Bereich von dem Zeichenblock entfernt wird, um den Basis-Zeichenblock in der dritten Unterstufe zu bilden, das Kennzeichnungsbit FLG4 auf den logischen Pegel HIGH "1" gesetzt wird. Im anderen Falle wird das Kennzeichnungsbit FLG4 auf den logischen Pegel LOW ("0") gesetzt.
Daher werden während der Segmentierung in der ersten bis dritten Unterstufe 11, 12, 13 der Zeichenblocksegmentierungs- Stufe 11 die Kennzeichnungsbits FLG1, FLG2, FLG3 u. FLG4 in dem dritten Datenblock DATA3 jeder Speicheradresse in dem Datenspeicher 25 gesetzt. Die Kennzeichnungsbits FLG1 bis FLG4 in dem Datenspeicher 25 kennzeichnen die Historie der Segmentierung des jeweiligen Bais-Zeichenblocks, der durch die Zeichenerkennungs-Stufe 23 erkannt werden soll. Im einzelnen werden die Kennzeichnungsbits FLG1, FLG2 u. FLG3 kombiniert, um die Historie der Segmentierung mit Bezug auf die Zeichenblöck SQ 111, SQ 121, SQ 211 . . . darzustellen. In anderen Worten ausgedrückt heißt dies, daß durch Prüfen der kombinierten Kennzeichnungsbits FLG1, FLG2 u. FLG3 erkannt werden kann, wie die Zeichenblöcke gewonnen wurden.
Fig. 16 zeigt die kombinierten Werte der Kennzeichnungsbits FLG1, FLG2, FLG3, die mit Bezug auf die Zeichenblöcke SQ 111, SQ 121, SQ 211, SQ 212, SQ 311, SQ 411, SQ 412, SQ 421 gesetzt sind. Wie zuvor ausgeführt, kennzeichnen die kombinierten Kennzeichnungsbits FLG1, FLG2, FLG3 die Segmentierungshistorie des korrespondierenden Zeichenblocks. Wenn die Segmentierungshistorie geprüft wird, werden daher die logischen Pegel dieser Kennzeichnungsbits für aufeinanderfolgende Zeichenblöcke geprüft. Beispielsweise sind mit Bezug auf die aufeinanderfolgenden Zeichenblöcke SQ 111, SQ 121 die logischen Pegel der Kennzeichnungsbits FLG1 jeweils "0". Dies bedeutet, daß die Zeichenblöcke SQ 111, SQ 121 als ein einziger Zeichenblock in der groben Segmentierung segmentiert wurden, die in der ersten Unterstufe 12 der Zeichenblocksegmentierungs- Stufe 11 durchgeführt wurde. Beim Prüfen des Kennzeichnungsbits FLG2 mit Bezug auf die Zeichenblöcke SQ 111 u. SQ 121 sind die betreffenden logischen Pegel "0" u. "1". Dies bedeutet, daß die Zeichenblöcke SQ 111, SQ 121 als separate Zeichenblöcke in der genauen Segmentierung innerhalb der ersten Unterstufe 12 segmentiert wurden. Hieraus ergibt sich, daß die Zeichenblöcke SQ 111, SQ 121 als einziger Zeichenblock betrachtet wurden, als sie unter Verwendung des niedrigen Schwellenpegels TH 0 segmentiert wurden. Dies bedeutet, daß eine Möglichkeit besteht, daß ein einziges Zeichen in zwei Zeichenkomponenten in der genauen Segmentierung zerlegt werden kann. Dies bedeutet wiederum, daß die Zeichenblöcke SQ 111 u. SQ 121 kombiniert werden können, um Bild-Daten zu bilden, die in der Zeichenerkennungs-Stufe 23 durch die Zeichenblockkombinierungs-Stufe 18 erkannt werden können.
Andererseits sind mit Bezug auf die Zeichenblöcke SQ 112 u. SQ 211 die betreffenden logischen Pegel der Kennzeichnungsbits FLG1 "0" und "1". Dies bedeutet, daß diese beiden Zeichenblöcke SQ 121 u. SQ 211 ursprünglich als getrennte Blöcke in der groben Segmentierung segmentiert wurden. Daraus ergibt sich, daß eine Beurteilung dahingehend erfolgen kann, daß die Zeichen, die in den Zeichenblöcken SQ 121 u. SQ 211 enthalten sind, unterschiedliche und getrennte Zeichen sind und daher nicht in der Zeichenblockkombinierungs-Stufe 18 kombiniert werden sollten.
In gleicher Weise kann eine Beurteilung mit Bezug auf die Zeichenblöcke SQ 411, SQ 412 u. SQ 421 vorgenommen werden. Beim Prüfen des Kennzeichnungsbits FLG1 sind die betreffenden logischen Pegel "1". Daher ergibt sich, daß alle dieser drei Zeichenblöcke SQ 411, SQ 412 u. SQ 421 ursprünglich als ein einziger Zeichenblock SQ 4 segmentiert wurde, vergl. Fig. 15. Dies eröffnet die Möglichkeit des Kombinierens dieser drei Zeichenblöcke in der Zeichenblockkombinierungs-Stufe 18 zum Bilden eines einzigen Zeichenbildes für die Zeichenerkennung. Beim Prüfen des Kennzeichnungsbits FLG2 der Zeichenblöcke SQ 411, Sq 412 u. SQ 421 sind deren betreffenden logischen Pegel "0", "0" u. "1". Daraus ist ersichtlich, daß die Zeichenblöcke SQ 411 u. SQ 412 als ein einziger Zeichenblock segmentiert wurden, und zwar selbst in der genauen Segmentierung in der ersten Unterstufe 12. Andererseits ist zu erkennen, daß die Zeichenblöcke SQ 412 u. SQ 421 als separate Zeichenblöcke in der genauen Segmentierung segmentiert wurden. Obgleich die Zeichenblöcke SQ 411 u. SQ 412 in zwei Zeichenblöcke in der genauen Segmentierung zerlegt wurden, besteht eine Möglichkeit, daß jeder dieser Zeichenblöcke Zeichenkomponenten enthält, die zu kombinieren sind. Daher können die Zeichenblöcke SQ 411 u. SQ 412 ebenfalls in der Zeichenblockkombinierungs-Stufe 18, wie zuvor ausgeführt, kombiniert werden.
In bezug auf den Zeichenblock SQ 311 ist kein gemeinsamer logischer Pegel für die aufeinanderfolgenden Zeichenblöcke SQ 212 u. SQ 411 gegeben, wie aus Fig. 16 ersichtlich. Dies bedeutet, daß das Zeichen in dem Zeichenblock SQ 311 ein unabhängiges und getrenntes Zeichen von den Zeichen in den Zeichenblöcken SQ 212 u. SQ 411 ist. Daher wird die Erkennung des Zeichens für den Zeichenblock SQ 311 in bezug auf das Zeichen in dem Zeichenblock SQ 311 allein durchgeführt.
Wie ausgeführt, sagt das Kennzeichnungsbit FLG4 aus, ob ein bestimmter Bereich in dem Zeichenblock in der Segmentierung, die in der dritten Unterstufe 14 durchgeführt wurde, entfernt wurde. Daher sind Segmentierungshistorie-Daten D hs über alles beim Steuern der Kombinierungsoperation nützlich, die in der Zeichenblockkombinierungs-Stufe 18 durchgeführt wird, welche zuvor erläutert wurde, und ebenso bei der Resegmentierungs-Operation, die in der Resegmentierungs- Stufe 40 durchgeführt wird, welche weiter unten beschrieben wird.
Um die logischen Pegel "0" u. "1" für die jeweiligen Kennzeichnungsbits FLG1, FLG2, FLG3 u. FLG4 in der Segmentierungshistoriecodierungsoperation, die in der Segmentierungshistoriecodierungs- Stufe 35 stattfindet, abwechselnd zu setzen, wird eine Speicheradresse, die mit dem Zeichenblock korrespondiert, aufgesucht. Unter der aufgesuchten Speicheradresse wird auf jedes Bit zum Speichern der Kennzeichnungsbits FLG1, FLG2, FLG3 u. FLG4 in der betreffenden Reihenfolge entsprechend dem Fortschreiten der Zeichensegmentierung, die in der ersten, der zweiten und der dritten Unterstufe 12, 13 bzw. 14 der Zeichenblocksegmentierungs- Stufe 11 stattfindet, zugegriffen.
Zeichenerkennungs-Stufe 23
In der Zeichenerkennungs-Stufe 23 wird eine Zeichenerkennung für die Zeichenbild-Daten S 7 oder S 8, die von der Zeichenblockkombinierungs- Stufe 18 übertragen werden, gemäß dem Prozeß, der in Fig. 17 gezeigt ist, ausgeführt. Es werden, um den Zeichenerkennungsprozeß wirksam durchzuführen, nicht nur die Zeichenbild-Daten S 7 oder S 8, sondern auch die Daten, die in dem Datenspeicher 25 gespeichert sind, wie dies zuvor erläutert wurde, in dem Prozeß der Zeichenerkennung in der Zeichenerkennungs-Stufe verwendet.
In dem Prozeß gemäß Fig. 17 wird unmittelbar nach dem Start des Prozesses in einem Schritt SP 11 der vierte Datenblock DATA4 der korrespondierenden Speicheradresse in einem Schritt SP 12 geprüft. Insbesondere die Positions-Daten D ps werden daraufhin überprüft, ob das Zeichen, das zu erkennen ist, ein spezielles Zeichen, beispielsweise "′", "″", "- (chinesisches Zeichen, das für "1" steht)", "°", das in der oberen Hälfte P RU des Standard-Zeichenblocks P R positioniert ist, oder eines der Zeichen "o" (japanisches Ende-Zeichen)", ".", ",", "", welche in der unteren Hälfte P RD des Standard- Zeichenblocks P R positioniert sind, ist. Daher wird in dem Schritt SP 12 eine Prüfung dahingehend durchgeführt, ob die Positions-Daten D ps von der Form "1, 0" oder "0, 1" sind. Wenn nämlich die Positions-Daten D ps von der Form "1, 0" sind, zeigt dies an, daß das Zeichen ein spezielles Zeichen ist, das in der oberen Hälfte P RU des Standard-Zeichenblocks P R zu positionieren ist. Auf ähnliche Weise ergibt sich, wenn die Positionsdaten D ps von der Form "0, 1" sind, daß das Zeichen ein spezielles Zeichen ist, das in der unteren Hälfte P RD des Standard-Zeichenblocks P R zu positionieren ist. Wenn die Beurteilung derart ausfällt, daß das Zeichen, das zu erkennen ist, ein spezielles Zeichen ist, setzt sich der Prozeß zu einem Schritt SP 13 fort.
In dem Schritt SP 13 wird ein spezieller Algorithmus für das Erkennen des speziellen Zeichens zum Durchführen der Erkennung des Zeichens benutzt. Vorzugsweise ist der Algorithmus zum Erkennen von speziellen Zeichen, die in der oberen Hälfte P RU zu positionieren sind, unterschiedlich von dem für spezielle Zeichen, die in der unteren Hälfte P RD zu positionieren sind. Der spezielle Algorithmus zum Erkennen der speziellen oder spezifischen Zeichen ist an sich bekannt.
Nach dem Zeichenerkennungsprozeß in dem Schritt SP 13 wird in einem Schritt SP 14 eine Prüfung vorgenommen, ob das Zeichen erkannt ist. Wenn das Zeichen, das in dem Schritt SP 13 erkannt ist, bestätigt wird, setzt sich der Prozeß zu einem Schritt SP 15 fort, um das Ergebnis auszugeben. Ein Ausgangssignal S 10 der Zeichenerkennungs-Stufe 23, wie es in dem Schritt S 15 ausgegeben wird, kann ein an sich bekannter Zeichencode, beispielsweise der ASCII-Code oder ein ähnlicher Code, sein. Das Ausgangssignal S 10 in Form eines Zeichencodes wird im folgenden als "Zeichencode-Daten S 10" bezeichnet.
Wie ausgeführt, können unter Verwendung der Positions-Daten D ps zum Unterscheiden der speziellen Zeichen von normalen Zeichen spezielle und vereinfacht Algorithmen in dem Schritt SP 13 zur Verringerung der notwendigen Dauer zum Erkennen der Zeichen benutzt werden.
Andererseits wird, wenn das Zeichen, das zu erkennen ist, ein normales Zeichen ist, das Zeichensegment sowohl die obere als auch die untere Hälfte P RU bzw. P RD des Zeichenblocks P R besetzen. Daher werden die Positionsdaten D ps , die ein normales Zeichen kennzeichnen, zu "1, 1". Wenn die Positions- Daten D ps den logischen Pegel HIGH ("1") für beide Bits aufweisen, wird eine Beurteilung dahingehend getroffen, daß das Zeichen, das zu erkennen ist, nicht eines der speziellen Zeichen ist, und zwar in dem Schritt SP 12. Dann setzt sich der Prozeß zu einem Schritt SP 16 fort. Außerdem setzt sich, wenn das Zeichen nicht in dem Schritt SP 13 erkannt wird und eine Unmöglichkeit der Erkennung in dem Schritt SP 14 erfaßt wird, der Prozeß ebenfalls zu dem Schritt SP 16 fort. In dem Schritt SP 16 werden die H/W-Verhältnis- Daten D vh , die relativen Höhen-Daten D scv und die relativen Breiten-Daten D szh in dem vierten Datenblock DATA4 der korrespondierenden Speicheradresse des Datenspeichers 25 geprüft. Daher werden in diesem Schritt SP 16 das Vertikal/ Horizontal-Verhältnis und die Größe des Zeichens geprüft, um so zu beurteilen, ob das Zeichen, das zu erkennen ist, ein Zeichen ist, das ein besonderes H/W-Verhältnis oder eine besondere Zeichengröße aufweist.
In dem bevorzugten Ausführungsbeispiel wird, um zu prüfen, ob das Zeichen, das zu erkennen ist, das besondere H/W-Verhältnis hat, eine Prüfung durchgeführt, ob die Bedingung erfüllt ist oder ob die Bedingung erfüllt ist.
Zeichen, die die zuvor angegebene Bedeutung erfüllen, sind z. B. "=", "-", "→", "←", "∼" usw.. Andererseits sind Zeichen, die die Bedingung (2) erfüllen, beispielsweise ":", ";", "0" bis "9", "", "", "", "I", "", "", "f", "i" usw..
Andererseits werden, um zu prüfen, ob das Zeichen das zu erkennen ist, eine besondere Größe hat, die relativen Höhen- Daten D szv (h/h R (h ist eine Höhe des Zeichenblocks; und h R ist eine Höhe des Standard-Zeichenblocks), dahingehend geprüft, ob die Bedingung
erfüllt ist oder nicht erfüllt ist. Zeichen, die die vorstehende Bedingung (3) erfüllen, sind z. B. "mm", "cm", "o (japanisches Ende-Zeichen)", "", "", "", "", "a", "e", "C", "T" usw..
Desweiteren werden, um zu prüfen, ob das Zeichen, das zu erkennen ist, eine besondere Größe aufweist, die relativen Breiten-Daten D szh (w/w R : w ist eine Breite des Zeichenblocks; und w R ist eine Breite des Standard-Zeichenblocks) dahingehend geprüft, ob die Bedingung
erfüllt ist. Zeichen, die diese Bedingung (4) erfüllen, sind beispielsweise "′", "″", "o (japanisches Ende-Zeichen)", ":", ";", "0" bis "9", "", "", "", "a", "c", "e" usw..
Wenn das Zeichen, das zu erkennen ist, ein besonderes Höhen/ Breiten-Verhältnis oder eine besondere Zeichengröße aufweist, das oder die eine der Bedingungen (1) bis (4) erfüllt, setzt sich der Prozeß zu einem Schritt SP 17 fort, um eine Zeichenerkennung unter Benutzung eines Algorithmus durchzuführen, der einfacher ist, als der, der für eine Zeichenerkennung für normale Zeichen zu benutzen ist. Da die Zeichen, die eine der vorhergehenden Bedingungen erfüllen, absolut begrenzt sind, können die Algorithmen, die zu benutzen sind, um derartige Zeichen zu erkennen, wesentlich vereinfacht sein. Daher kann die Prozeßdauer, die zum Erkennen der Zeichen notwendig ist, verkürzt sein. Nach dem Zeichenerkennungs-Prozeß in dem Schritt SP 17 wird eine Prüfung durchgeführt, ob das Zeichen während des Prozesses in dem Schritt SP 17 erkannt wurde. Wenn die Erkennung des Zeichens in einem Schritt SP 18 bestätigt wird, setzt sich der Prozeß zu dem Schritt SP 15 fort, um die Zeichencode-Daten S 10 auszugeben.
Andererseits setzt sich, wenn das Zeichen, das zu erkennen ist, keine der zuvor genannten Bedingungen (1) bis (4) erfüllt, wie dies in dem Schritt SP 16 geprüft wird, der Prozeß zu einem Schritt SP 19 fort, um eine Zeichenerkennung unter Benutzung eines Standard-Algorithmus durchzuführen. Auf ähnliche Weise wird, wenn das Zeichen nicht in dem Schritt SP 17 erkannt werden kann und wenn eine Unmöglichkeit der Erkennung des Zeichens in dem Schritt SP 18 erfaßt wird, der Prozeß ebenfalls zu dem Schritt SP 19 fort. In dem Zeichenerkennungsprozeß in dem Schritt SP 19 werden die Zeichenbild- Daten mit Standard-Zeichen-Daten verglichen, die in dem Zeichenerkennungssystem vorgegeben sind. Wenn die Zeichenbild- Daten im wesentlichen mit den vorgegebenen Standard- Zeichen-Daten übereinstimmen, wird das Zeichen erkannt, das durch die vorgegebenen Standard-Zeichen-Daten repräsentiert wird. Das Erkennen des Zeichens wird durch einen Schritt SP 20 bestätigt. Auf der Grundlage des Ergebnisses der Zeichenerkennung in dem Schritt SP 19 werden die Zeichencode- Daten S 10 in dem Schritt SP 15 ausgegeben.
Andererseits wird, wenn die Zeichenbild-Daten S 7 oder S 8 nicht mit irgendeinem der Standard-Zeichendatensätze übereinstimmt, die Unmöglichkeit der Zeichenerkennung in dem Schritt SP 20 erfaßt. In diesem Fall wird eine Resegmentierung in einem Schritt SP 21 durchgeführt. Die Resegmentierung in dem Schritt SP 21 enthält eine Rekombination der Zeichenblöcke und eine Reseparation der Zeichenblöcke. Während des Resegmentierungsprozesses in dem Schritt SP 21 werden die Historie-Daten D hs in Form der Kennzeichnungsbits FLG1, FLG2, FLG3 u. FLG4 des dritten Datenblocks DATA3 unter der korrespondierenden Speicheradresse in dem Datenspeicher 25 gesetzt. Nach dem Resegmentierungsprozeß, der in dem Schritt SP 21 durchgeführt wird, kehrt der Prozeß zu dem Schritt SP 19 zurück, um eine Zeichenerkennung unter Benutzung des Standard-Algorithmus in dem Schritt SP 19 durchzuführen.
Es ist ersichtlich, daß wenn die Resegmentierung des Zeichenblocks, der nicht in dem Schritt SP 19 erkannt werden kann, freigegeben wird, die Resegmentierung unter Benutzung der Historie-Daten wirksam durchzuführen ist. Mit diesem Prozeß kann die Erkennungsrate der Zeichen wesentlich angehoben oder verbessert werden.
Arbeitsweise des gesamten Zeichenerkennungssystems
Wie zuvor ausgeführt, wird in dem bevorzugten Ausführungsbeispiel für das Zeichenerkennungssystem gemäß der vorliegenden Erfindung das Dokumentbild durch den Dokumentleser 2 aufgenommen und zu dem Bereichssegmentierungs-Abschnitt 3 übertragen. In dem Bereichssegmentierungs-Abschnitt wird eine Schräglagen-Normalisierung und eine Rausch- oder Störanteilbeseitigung zusätzlich zu der Segmentierung für die Zeichenfolgen AR 1, AR 2 . . . durchgeführt, wie dies in Fig. 2 gezeigt ist.
Die Art und Weise der Schräglagen-Normalisierung und der Rausch- oder Störanteilbeseitigung ist bereits in "IEEE", CH2145-1/85/0000/055, veröffentlicht 1985, S. 550 bis 575 offenbart. Auf die Offenbarung in dieser Veröffentlichung wird hierin aus Gründen der Einfachheit der Beschreibung Bezug genommen.
In dem Bereichssegmentierungs-Abschnitt 3 startet eine Segmentierungsprozeß vom Definieren eines Textbereichs an für die Dokumentbild-Daten aus dem Dokumentleser. Dann werden Zeichenfolgenblöcke auf der Grundlage des y-Projektionsprofils des Textbereichs segmentiert. Das bedeutet, daß in dem Bereichssegmentierungsprozeß horizontale Abtastlinien, die Zeichenbild-Daten enthalten, zum weiteren Verarbeiten zum Zwecke der Zeichenerkennung ausgewählt werden, wodurch die Zeichenbild-Daten extrahiert werden. Daher werden Bereichssegmentierungs- Daten S 4 erzeugt, die die Bild-Daten auf den horizontalen Abtastlinien in jeder der segmentierten Zeichenfolgen enthalten.
Die Bereichssegmentierungs-Daten S 4 werden zu dem Zeichenerkennungs- Abschnitt 7 übertragen. Eine Zeichenblocksegmentierung wird durch die Zeichenblocksegmentierungs-Stufe 11 in dem Zeichenerkennungs-Abschnitt 7 durchgeführt. In der Zeichenblocksegmentierungs-Stufe 11 wird eine vorläufige Zeichenblocksegmentierung in der ersten Unterstufe 12 auf der Grundlage des x-Projektionsprofils durchgeführt. In der vorläufigen Zeichenblocksegmentierung in der ersten Unterstufe 12 wird eine grobe Segmentierung unter Benutzung des niedrigeren Schwellenpegels TH 0 und eine genaue Segmentierung unter Benutzung des höheren Schwellenpegels TH 1 durchgeführt. Während dieser groben Segmentierung wird das Kennzeichnungsbit FLG1 in dem dritten Datenblock DATA3 der korrespondierenden Speicheradresse abwechselnd der Reihe nach auf die logischen Pegel "0" u. "1" nach gesetzt. Auf ähnliche Weise wird das Kennzeichnungsbit FLG2 in dem dritten Datenblock DATA3 der korrespondierenden Speicheradresse abwechselnd der Reihe nach auf die logischen Pegel "0" u. "1" gesetzt.
Die Zeichenbild-Daten, die durch die genaue Segmentierung in der ersten Unterstufe 12 extrahiert wurden, werden zu der zweiten Unterstufe übertragen. In der zweiten Unterstufe wird die Kontinuität des Zeichens in dem vorläufig segmentierten Zeichenblock mit Bezug auf das x-Projektionsprofil geprüft. Wenn eine Diskontinuität in den Zeichen oder Zeichenkomponenten in dem Zeichenblock vorgefunden wird, werden die Zeichen oder Zeichenkomponenten mit dieser Diskontinuität in separate Zeichenblöcke unterteilt. In diesem Prozeß wird das Kennzeichnungsbit FLG3 in dem dritten Datenblock DATA3 der korrespondierenden Speicheradresse abwechselnd der Reihe nach auf die logischen Pegel "0" u. "1" gesetzt. Die Zeichenbild-Daten, die in der zweiten Unterstufe 13 extrahiert wurden, werden in der dritten Unterstufe 14 verarbeitet. In der dritten Unterstufe wird die Höhe des Zeichenblocks so modifiziert, daß die oberen und unteren horizontalen Ränder der Zeichenblöcke im wesentlichen in Nachbarschaft der oberen und unteren Konturen des betreffenden Zeichens liegen. Dieser Prozeß wird durch Prüfen des y- Projektionsprofils des Zeichens in dem Zeichenblock durchgeführt. Gleichzeitig werden vertikal hintereinanderliegende Rausch- oder Störanteile aus den Zeichenbild-Daten durch Vergleichen des y-Projektionsprofils mit dem gegebenen Schwellenpegel beseitigt.
Während dieses Prozesses in der dritten Unterstufe 14 wird das Kennzeichnungsbit FLG4 in dem dritten Datenblock DATA3 auf den logischen Pegel "0" oder "1" abhängig von dem Ergebnis der Vergleichsoperation des y-Projektionsprofils mit dem Schwellenpegel gesetzt. Wenn beispielsweise irgendein Bereich des Zeichenblocks als Ergebnis der Vergleichsoperation entfernt wird, wird das Kennzeichnungsbit FLG4 auf den logischen Pegel HIGH ("1") und andernfalls auf den logischen Pegel LOW ("0") gesetzt.
Daher haben in der Zeichenblocksegmentierungs-Stufe 11 die Basis-Zeichenblöcke Ränder, die an oberen, unteren und seitlichen Konturen des Zeichens in dem Zeichenblock liegen. Obgleich die Zeichenblöcke segmentiert werden, um im Endeffekt den Basis-Zeichenblock durch die erste, die zweite und die dritte Unterstufe 12, 13 bzw. 14 zu gewinnen, werden die Zeichenbild-Daten, die in dem Zeichenblock enthalten sind, aufrechterhalten, um die besonderen Eigenschaften der Zeichen darin darzustellen zu können.
Grundsätzlich wird der Basis-Zeichenblock zu einem minimalen Block segmentiert, so daß er eine Zeicheneinheit minimaler Größe enthält, um so eine Erkennung der Zeichen durch Kombinieren von zwei oder mehr Zeichenblöcken sicherzustellen und die Möglichkeit eines Fehlers in der Erkennung zu vermeiden, die durch das Vorhandensein von mehr als einem Zeichen in einem einzigen Zeichenblock gegeben wäre. Während die Zeichenblocksegmentierung in der Zeichenblocksegmentierungs- Stufe 11 durchgeführt wird, werden Daten, die für die Segmentierungshistorie kennzeichnend sind, in dem Datenspeicher 25 in Form der Kennzeichnungsbits FLG1, FLG2, FLG3 u. FLG4 gespeichert. Desweiteren werden in dem Datenspeicher Daten D w , die kennzeichnend für die Breite des korrespondierenden Basis-Zeichenblocks sind, in dem ersten Datenblock DATA1, Daten D h , die kennzeichnend für die Höhe des korrespondierenden Basis-Zeichenblocks sind, in dem zweiten Datenblock DATA2 sowie Positions-Daten D ps , H/W-Verhältnis- Daten D vh , relative Höhen-Daten D szv und relative Breiten- Daten D szh in dem vierten Datenblock DATA4 gespeichert. Diese Daten in dem Datenspeicher sind hilfreich für eine wirksame Durchführung der Kombination von Zeichenblöcken in der Zeichenblockkombinierungs-Stufe 18 und in der Zeichenerkennung in der Zeichenerkennungs-Stufe 23. Die die Segmentierungshistorie kennzeichnenden Kennzeichnungsbits FLG1, FLG2, FLG3 u. FLG4 sind hilfreich für das Kombinieren von Zeichenblöcken für solche Zeichenblöcke, die Zeichenkomponenten enthalten. Andererseits sind die Positions-Daten D ps , die H/W-Verhältnis-Daten D vh , die relativen Höhen-Daten D szv und die relativen Breiten-Daten D szh hilfreich für das Erfassen spezieller Zeichen, die durch Benutzung vereinfachter Algorithmen erkannt werden können. Durch Unterscheiden der besonderen Zeichen von anderen, normalen Zeichen, was einen Zeichenerkennungsprozeß unter Benutzung normaler oder Standard- Algorithmen erfordert, wird die Anzahl von Zeichen, die durch Benutzung des Standard-Algorithmus erkannt werden, verringert, um so eine Verkürung der Prozeßdauer zu begünstigen, die für das Erkennen des Textes erforderlich ist.
Es ist ersichtlich, daß die Zeichenerkennung in der Zeichenerkennungs- Stufe 23 im allgemeinen in einem an sich bekannten Prozeß durchgeführt wird. Beispielsweise kann die Zeichenerkennung gemäß dem Algorithmus durchgeführt werden, der in "CLASSIFCATION OF MIXED FONT ALPHABETICS BY CHARACTERISTIC LOCI", eingesandt von Herbert. A. Glucksman et al und veröffentlicht in "DIG FIRST IEEE COMPUTER CONFERENCE, 1967" offenbart ist. Die Offenbarung des Inhalts der zuvor genannten Veröffentlichung ist in der vorliegenden Beschreibung durch die Bezugnahme darauf enthalten und wird nicht wiederholt, um die Beschreibung nicht zu umfangreich werden zu lassen.
Es ist ersichtlich, daß obwohl das bevorzugte Ausführungsbeispiel eine Reextrahierungs-Stufe und eine Rekombinierungs- Stufe zum Reextrahieren und Rekombinieren der Zeichenblöcke zur Sicherstellung der Erkennung der Zeichen benutzt, das bevorzugte Ausführungsbeispiel für die vorliegende Erfindung auf ein beliebiges Zeichenerkennungssystem anwendbar ist, das eine Segmentierung der Zeichenblöcke erfordert. Insbesondere die Zeichenblock-Segmentierungstechnik, die in dem bevorzugten Ausführungsbeispiel für die vorliegende Erfindung benutzt wird, könnte in irgendeinem Typ von Zeichenerkennungssystem nutzvoll sein. Desweiteren kann die Benutzung der Segmentierungshistorie- oder -hysterese- Daten in dem Zeichenerkennungsprozeß die Zeichenerkennung in irgendeinem Zeichenerkennungssystem sicherstellen. Daher würden Zeichenerkennungssysteme, die die Segmentierungstechnik verwenden, wie sie durch die Ansprüche bestimmt wird, als innerhalb des Schutzumfangs für die vorliegenden Erfindung liegend zu betrachten sein.
Desweiteren können die Segmentierungshistorie-Daten, die durch die Kennzeichnungsbits gekennzeichnet sind, zum Steuern der Resegmentierung, die auszuführen ist, wenn die Zeichenerkennung in bezug auf den Zeichenblock versagt, benutzt werden.
Obgleich das spezielle Ausführungsbeispiel zuvor lediglich anhand mehrerer Figuren beschrieben worden ist, kann die vorliegende Erfindung darüber hinaus in verschiedener Weise ausgeführt werden. Beispielsweise kann, obwohl die Erfindung lediglich anhand eines Beispiels für eine Zeichenerkennung in einem Text offenbart ist, in dem sich horizontal erstreckende Zeichenfolgen enthalten sind, die Zeichenerkennung auch für einen Text durchgeführt werden, der sich vertikal erstreckende Zeichenfolgen enthält. Außerdem kann der Inhalt des Datenspeichers 25 nicht nur zum Steuern des Kombinierens von Zeichenblöcken, der Zeichenerkennung und der Resegmentierung der Zeichenblöcke, sondern auch für andere Prozesse verwendet werden. Desweiteren wird in dem gezeigten Ausführungsbeispiel die Zeichenblocksegmentierung in der ersten Unterstufe der Zeichenblocksegmentierungs-Stufe mit unterschiedlichen Pegeln der Schwellen durchgeführt. Ein ähnlicher Effekt kann durch wiederholtes Segmentieren der identischen Zeichenfolgenblöcke erreicht werden.
Während die vorliegende Erfindung anhand eines bevorzugten Ausführungsbeispiels beschrieben wurde, um ein besseres Verständnis der Erfindung zu erreichen, ist ersichtlich, daß die Erfindung in unterschiedlicher Weise angewendet werden kann, ohne daß dazu Erfindungsprinzip verlassen werden müßte. Daher ist die Erfindung so zu verstehen, daß sie alle möglichen Ausführungsbeispiele und Modifikationen der gezeigten Ausführungsbeispiele enthält, die ausgeführt werden können, ohne daß dazu der Schutzumfang für die vorliegende Erfindung verlassen werden müßte.

Claims (73)

1. Zeichenerkennungssystem, gekennzeichnet durch
ein erstes Mittel (3) zum Gewinnen eines Videosignals, das Bilddaten eines Dokuments enthält,
ein zweites Mittel (7/11) zum Extrahieren von Zeichenblöcken, wobei jeder dieser Zeichenblöcke Bild-Daten individueller Zeichen in dem Dokument enthält,
ein drittes Mittel (7/18) zum Rekombinieren zweier oder mehrerer Zeichenblöcke zum Bilden eines kombinierten Zeichenblocks,
ein viertes Mittel (7/40) zum Reextrahieren eines Zeichenblocks zum Bilden eines reextrahierten Zeichenblocks,
ein fünftes Mittel (7/23) zum Durchführen einer Zeichenerkennung gemäß einem vorbestimmten Algorithmus und zum Ausgeben eines das erkannte Zeichen kennzeichnenden Signals (S 10) sowie
ein sechstes Mittel (7/25) zum Steuern des Betriebs des dritten, vierten und fünften Mittels (7/18, 7/40, 7/23) in einer derartigen Weise, daß das sechste Mittel (7/25) wahlweise eines der dritten und vierten Mittel (7/18, 7/40) in Betrieb setzt, wenn das fünfte Mittel (7/23) nicht in der Lage ist, ein Zeichen in dem Zeichenblock zu erkennen, um auf diese Weise das Erkennen von Zeichen in dem fünften Mittel (7/23) mit dem Zeichenblock sicherzustellen, der durch ein ausgewähltes aus den dritten und vierten Mitteln (7/18, 7/40) gebildet ist.
2. Zeichenerkennungssystem nach Anspruch 1, dadurch gekennzeichnet, daß das zweite Mittel (7/11) den Zeichenblock mit einer minimalen Zeicheneinheit als dessen Inhalt extrahiert.
3. Zeichenerkennungssystem nach Anspruch 2, dadurch gekennzeichnet, daß das zweite Mittel (7/11) den Zeichenbereich derart definiert, daß er Ränder hat, die an obere, untere und seitliche Konturen der minimalen Zeicheneinheit grenzen.
4. Zeichenerkennungssystem nach Anspruch 2, dadurch gekennzeichnet, daß das zweite Mittel (7/11) eine Überlappung zwischen benachbarten individuellen Zeichen zum separaten Bilden der Zeichenblöcke für jeweilige individuelle Zeichen erfaßt.
5. Zeichenerkennungssystem nach Anspruch 4, dadurch gekennzeichnet, daß das zweite Mittel (7/11) Rausch- oder Störanteile in den Zeichenbild-Daten in jedem der Zeichenblöcke beseitigt.
6. Zeichenerkennungssystem nach Anspruch 1, dadurch gekennzeichnet, daß desweiteren ein siebtes Mittel (7/30) zum Erfassen eines vorbestimmten Zeichens vorgesehen ist und daß das Zeichenerkennungssystem (7) die Zeichenerkennungsoperation des fünften Mittels (7/23) für das vorbestimmte Zeichen durch Auswählen eines Hilfsalgorithmus steuert, der einfacher als der Algorithmus ist, welcher für die Zeichen außer dem vorbestimmten Zeichen vorgesehen ist.
7. Zeichenerkennungssystem nach Anspruch 1, dadurch gekennzeichnet, daß das sechste Mittel (7/25) mit dem zweiten Mittel (7/11) zum Gewinnen von Historie-Daten jedes der Zeichenblöcke, die kennzeichnend für den Verlauf der Extraktion des Zeichenblocks sind, zum Steuern der Rekombination des Zeichenblocks in dem dritten Mittel (7/18) auf der Grundlage der Historie-Daten zusammenwirkt.
8. Zeichenerkennungssystem nach Anspruch 7, dadurch gekennzeichnet, daß das zweite Mittel (7/11) eine Vielzahl von Stufen (7/12, 7/13, 7/14) zum Extrahieren der Zeichenblöcke aus den Dokumentbild-Daten enthält und daß das sechste Mittel (7/25) Daten enthält, die kennzeichnend für den Verlauf des Extraktionsprozesses in jedem aus einer Vielzahl von Zeichenextraktions-Schritten sind.
9. Zeichenerkennungssystem nach Anspruch 8, dadurch gekennzeichnet, daß das zweite Mittel (7/11) eine Stufe zum Segmentieren jedes von Zeichenfolgenblöcken, eine Stufe zum Segmentieren jedes der Zeichenblöcke und eine Stufe zum Erfassen von mehr als einer von getrennten, jedoch dicht in einem einzigen Zeichenblock beieinander liegenden individuellen Zeicheneinheiten zum jeweiligen Zerlegen des Zeichenblocks in mehrere Zeichenblöcke, die getrennte individuelle Zeicheneinheiten aufweisen, enthält.
10. Zeichenerkennungssystem nach Anspruch 9, dadurch gekennzeichnet, daß die Stufe zum Zeichenfolgensegmentieren y-Projektionsprofile der Dokumentbild-Daten zum Auswählen von Horizontalabtastlinien überprüft, die in jedem der Zeichenfolgenblöcke enthalten sein sollen.
11. Zeichenerkennungssystem nach Anspruch 9, dadurch gekennzeichnet, daß die Stufe zum Zeichenfolgensegmentieren x-Projektionsprofile mit Bezug auf einen vorbestimmten Schwellenpegel (TH 0, TH 1) zum Auswählen von Vertikalabtastlinien überprüft, die in dem Zeichenblock enthalten sein sollen.
12. Zeichenerkennungssystem nach Anspruch 11, dadurch gekennzeichnet, daß die Stufe zum Zeichenblocksegmentieren eine Vielzahl von unterschiedlichen Schwellenpegeln zum Segmentieren des Zeichenblocks für unterschiedliche Genauigkeitsstufen beim Segmentieren der Zeichenblöcke mit einer minimalen Zeicheneinheit verwendet.
13. Zeichenerkennungssystem nach Anspruch 9, dadurch gekennzeichnet, daß die Stufe zum Segmentieren oder Zerlegen der Zeichenblöcke die Kontinuität der Zeicheneinheit überprüft, die in dem Zeichenblock enthalten ist, um eine Diskontinuität in der Zeicheneinheit zum Zerlegen des Zeichenblocks zu erfassen.
14. Zeichenerkennungssystem nach Anspruch 13, dadurch gekennzeichnet, daß die Stufe zum Zerlegen der Zeichenblöcke die Kontinuität zwischen benachbarten Bild- Daten überprüft, die Bits zum Erfassen einer Diskontinuität der Zeicheneinheit in dem Zeichenblock enthalten.
15. Zeichenerkennungssystem nach Anspruch 9, dadurch gekennzeichnet, daß das zweite Mittel (7/11) eine Stufe zum Überprüfen von y-Projektions-Profilen für die Zeichenbild-Daten in dem Zeichenblock zum Bestimmen der Höhe des Zeichenblocks enthält, so daß obere und untere Ränder des Zeichenblocks an die oberen und unteren Konturen der Zeicheneinheit in dem Zeichenblock grenzen.
16. Zeichenerkennungssystem, gekennzeichnet durch
ein erstes Mittel (3) zum Gewinnen eines Videosignals, das Bild-Daten eines Dokuments enthält,
ein zweites Mittel (7/11) zum Segmentieren von Zeichenblöcken, wobei jeder dieser Zeichenblöcke Bild-Daten einer individuellen Zeicheneinheit enthält und wobei das zweite Mittel (7/11) eine Vielzahl von Segmentierungsstufen mit einer ersten Segmentierungsstufe zum Segmentieren von Zeichenblöcken und einer zweiten Segmentierungsstufe zum Segmentieren jedes von Zeichenblöcken, die Zeichenbild-Daten enthalten, aufweist,
ein drittes Mittel (7/18) zum Rekombinieren zweier oder mehrerer Zeichenblöcke zum Bilden eines kombinierten Zeichenblocks,
ein viertes Mittel (7/40) zum Reextrahieren eines Zeichenblocks zum Bilden eines reextrahierten Zeichenblocks,
ein fünftes Mittel (7/23) zum Durchführen einer Zeichenerkennung gemäß einem vorbestimmten Algorithmus und zum Ausgeben eines das erkannte Zeichen kennzeichnenden Signals (S 10) sowie
ein sechstes Mittel (7/25), das dem zweiten Mittel (7/11) zum Gewinnen von Segmentierungs-Daten in bezug auf jeden der Zeichenblöcke, die durch das zweite Mittel (7/11) segmentiert wurden, zugeordnet ist, zum Steuern des Betriebs der dritten, vierten und fünften Mittel (7/18, 7/40, 7/23) auf der Grundlage der Segmentierungs-Daten in einer derartigen Weise, daß das sechste Mittel (7/25) wahlweise eines der dritten und vierten Mittel (7/18, 7/40) in Betrieb setzt, wenn das fünfte Mittel (7/23) nicht in der Lage ist, ein Zeichen in dem Zeichenblock zu erkennen, um auf diese Weise das Erkennen von Zeichen in dem fünften Mittel (7/23) mit dem Zeichenblock sicherzustellen, der durch ein ausgewähltes der dritten und vierten Mittel (7/18, 7/40) gebildet ist.
17. Zeichenerkennungssystem nach Anspruch 16, dadurch gekennzeichnet, daß das zweite Mittel (7/11) den Zeichenblock mit einer minimalen Zeicheneinheit als dessen Inhalt extrahiert.
18. Zeichenerkennungssystem nach Anspruch 17, dadurch gekennzeichnet, daß das zweite Mittel (7/11) eine dritte Stufe zum Erfassen von Überlappungen benachbarter Zeicheneinheiten, die in einem einzigen Zeichenblock enthalten sind, zum getrennten Bilden von Zeichenblöcken für die jeweiligen Zeicheneinheiten enthält.
19. Zeichenerkennungssystem nach Anspruch 18, dadurch gekennzeichnet, daß das zweite Mittel (7/11) desweiteren eine vierte Segmentierungsstufe zum Beseitigen von Rausch- oder Störanteilen in den Zeichenbild-Daten jedes der Zeichenblöcke enthält.
20. Zeichenerkennungssystem nach Anspruch 16, dadurch gekennzeichnet, daß desweiteren ein siebtes Mittel (7/30) zum Erfassen eines vorbestimmten Zeichens vorgesehen ist und daß das Zeichenerkennungssystem (7) die Erkennungsoperation des fünften Mittels (7/23) für das vorbestimmte Zeichen durch Auswählen eines Hilfsalgorithmus steuert, der einfacher als der Algorithmus ist, welcher für die Zeichen außerdem dem vorbestimmten Zeichen vorgesehen ist.
21. Zeichenerkennungssystem nach Anspruch 19, dadurch gekennzeichnet, daß die erste Segmentierungsstufe y-Projektionsprofile der Dokumentbild-Daten zum Auswählen von Horizontalabtastlinien überprüft, die in jedem der Zeichenfolgenblöcke enthalten sein sollen.
22. Zeichenerkennungssystem nach Anspruch 21, dadurch gekennzeichnet, daß die zweite Segmentierungsstufe x-Projektionsprofile mit Bezug auf einen vorbestimmten Schwellenpegel (TH 0, TH 1) zum Auswählen von Vertikalabtastlinien überprüft, die in dem Zeichenblock enthalten sein sollen.
23. Zeichenerkennungssystem nach Anspruch 22, dadurch gekennzeichnet, daß die zweite Segmentierungsstufe eine Vielzahl von unterschiedlichen Schwellenpegeln zum Segmentieren des Zeichenblocks für unterschiedlichen Genauigkeitsstufen beim Segmentieren von Zeichenblöcken mit einer minimalen Zeicheneinheit als deren Inhalt verwendet.
24. Zeichenerkennungssystem nach Anspruch 23, dadurch gekennzeichnet, daß die dritte Segmentierungsstufe die Kontinuität der Zeicheneinheit, die in dem Zeichenblock enthalten ist, zum Erfassen einer Diskontinuität in der Zeicheneinheit zum Zerlegen des Zeichenblocks überprüft.
25. Zeichenerkennungssystem nach Anspruch 24, dadurch gekennzeichnet, daß die dritte Segmentierungs- oder Zerlegungsstufe die Kontinuität zwischen benachbarten Bild-Daten, die Bits zum Erfassen einer Diskontinuität der Zeicheneinheit in dem Zeichenblock enthalten, überprüft.
26. Zeichenerkennungssystem nach Anspruch 25, dadurch gekennzeichnet, daß das sechste Mittel (7/25) Segmentierungs-Daten mit Bezug auf die zweite, die dritte und die vierte der Segmentierungsstufen enthält.
27. Zeichenerkennungssystem nach Anspruch 26, dadurch gekennzeichnet, daß das sechste Mittel (7/25) Segmentierungshistorie- Daten mit Bezug auf jeden Zeichenblock in den jeweiligen zweiten, dritten und vierten Segmentierungsstufen erhält.
28. Zeichenerkennungssystem, gekennzeichnet durch
ein erstes Mittel (3) zum Gewinnen eines Videosignals, das Bild-Daten eines Dokuments enthält,
ein zweites Mittel (7/11) zum Gewinnen einer Vielzahl von Zeichenblöcken, wobei jeder dieser Zeichenblöcke Bild- Daten individueller Zeichen in dem Dokument enthält und wobei das zweite Mittel (7/11) eine Vielzahl von Segmentierungsstufen mit einer ersten Segmentierungsstufe zum Segmentieren von Zeichenfolgenblöcken, einer zweiten Segmentierungsstufe zum Segmentieren jedes von Zeichenblöcken, die Zeichenbild-Daten einer Zeicheneinheit enthalten, sowie einer dritten Segmentierungsstufe zum Überprüfen der Kontinuität von Bild-Daten, die innerhalb jedes Zeichenblocks Bits zum Erfassen einer Diskontinuität enthalten, zum Zerlegen der Zeichenblöcke in mehr als einen Zeichenblock derart, daß Zeichenblöcke gewonnen werden, die jeweils eine minimale Zeicheneinheit beinhalten, aufweist,
ein drittes Mittel (7/18) zum Rekombinieren zweier oder mehrerer Zeichenblöcke zum Bilden eines kombinierten Zeichenblocks,
ein viertes Mittel (7/40) zum Reextrahieren eines Zeichenblocks zum Bilden eines reextrahierten Zeichenblocks,
ein fünftes Mittel (7/23) zum Durchführen einer Zeichenerkennung gemäß einem vorbestimmten Algorithmus und zum Ausgeben eines das erkannte Zeichen kennzeichnenden Signals (S 10) sowie
ein sechstes Mittel (7/25) zum Steuern des Betriebs des dritten, des vierten und des fünften Mittels (7/18, 7/40, 7/23) in einer derartigen Weise, daß das sechste Mittel (7/25) wahlweise eines der dritten und vierten Mittel (7/18, 7/40) in Betrieb setzt, wenn das fünfte Mittel (7/23) nicht in der Lage ist, ein Zeichen in dem Zeichenblock zu erkennen, um auf diese Weise das Erkennen von Zeichen in dem fünften Mittel (7/23) mit dem Zeichenblock sicherzustellen, der durch ein ausgewähltes der dritten und vierten Mittel (7/18, 7/40) gebildet ist.
29. Zeichenerkennungssystem nach Anspruch 28, dadurch gekennzeichnet, daß das zweite Mittel (7/11) den Zeichenbereich derart definiert, daß er Ränder hat, die an obere, untere und seitliche Konturen der minimalen Zeicheneinheit grenzen, die darin enthalten ist.
30. Zeichenerkennungssystem nach Anspruch 28, dadurch gekennzeichnet, daß das zweite Mittel (7/11) desweiteren eine vierte Stufe zum Beseitigen eines Rausch- oder Störanteils in den Bild-Daten der Zeicheneinheit enthält.
31. Zeichenerkennungssystem nach Anspruch 28, dadurch gekennzeichnet, daß desweiteren ein siebtes Mittel (7/30) zum Erfassen eines vorbestimmten Zeichens vorgesehen ist und daß das Zeichenerkennungssystem (7) die Erkennungsoperation des fünften Mittels (7/23) für das vorbestimmte Zeichen durch Auswählen eines Hilfsalgorithmus steuert, der einfacher als der Algorithmus ist, welcher für die Zeichen außer dem vorbestimmten Zeichen vorgesehen ist.
32. Zeichenerkennungssystem nach Anspruch 28, dadurch gekennzeichnet, daß die erste Segmentierungsstufe y-Projektionsprofile der Dokumentbild-Daten zum Auswählen von Horizontalabtastlinien überprüft, die in jedem der Zeichenfolgenblöcke enthalten sein sollen.
33. Zeichenerkennungssystem nach Anspruch 32, dadurch gekennzeichnet, daß die zweite Segmentierungsstufe x-Projektionsprofile mit Bezug auf einen vorbestimmten Schwellenpegel (TH 0, TH 1) zum Auswählen von Vertikalabtastlinien überprüft, die in dem Zeichenblock enthalten sein sollen.
34. Zeichenerkennungssystem nach Anspruch 33, dadurch gekennzeichnet, daß die zweite Segmentierungsstufe eine Vielzahl von unterschiedlichen Schwellenpegeln zum Segmentieren des Zeichenblocks für unterschiedliche Genauigkeitsstufen beim Segmentieren von Zeichenblöcken mit einer minimalen Zeicheneinheit als deren Inhalt verwendet.
35. Zeichenerkennungssystem nach Anspruch 28, dadurch gekennzeichnet, daß das sechste Mittel (7/25) Segmentierungs-Daten mit Bezug auf die zweite, die dritte und die vierte der Segmentierungsstufen erhält.
36. Zeichenerkennungssystem nach Anspruch 35, dadurch gekennzeichnet, daß das sechste Mittel (7/25) Segmentierungshistorie- Daten mit Bezug auf jeden Zeichenblock in den jeweiligen zweiten, dritten und vierten Segmentierungsstufen erhält.
37. Zeichenerkennungssystem, gekennzeichnet durch
ein erstes Mittel (3) zum Gewinnen eines Videosignals, das Bild-Daten eines Dokuments enthält,
ein zweites Mittel (7/11) zum Gewinnen einer Vielzahl von Zeichenblöcken, wobei jeder dieser Zeichenblöcke Bild- Daten individueller Zeichen in dem Dokument enthält und wobei das zweite Mittel (7/11) eine Vielzahl von Segmentierungsstufen mit einer ersten Segmentierungsstufe zum Segmentieren von Zeichenfolgenblöcken, einer zweiten Segmentierungsstufe zum Segmentieren jedes von Zeichenblöcken, die Zeichenbild-Daten einer Zeicheneinheit enthalten, sowie einer dritten Segmentierungsstufe zum Überprüfen der Kontinuität von Bild-Daten, die Bits innerhalb jedes Zeichenblocks zum Erfassen einer Diskontinuität aufweisen, zum Zerlegen der Zeichenblöcke in mehr als einen Zeichenblock, um so Zeichenblöcke zu gewinnen, die eine minimale Zeicheneinheit enthalten, aufweist,
ein drittes Mittel (7/18) zum Rekombinieren zweier oder mehrerer Zeichenblöcke zum Bilden eines kombinierten Zeichenblocks,
ein viertes Mittel (7/40) zum Reextrahieren eines Zeichenblocks zum Bilden eines reextrahierten Zeichenblocks,
ein fünftes Mittel (7/23) zum Durchführen einer Zeichenerkennung gemäß einem vorbestimmten Algorithmus und zum Ausgeben eines das erkannte Zeichen kennzeichnenden Signals (S 10) sowie
ein sechstes Mittel (7/25), das dem zweiten Mittel (7/11) zum Übernehmen von Segmentierungshistorie-Daten in bezug auf zumindest die zweite und die dritte der Segmentierungsstufen, was durch das zweite Mittel (7/11) bewirkt wird, zugeordnet ist, wobei die Segmentierungshistorie-Daten kennzeichnend für den Verlauf der Segmentierung von Zeichenblöcken in jeder der ersten und dritten Stufen sind, zum Steuern des Betriebs des dritten, des vierten und des fünften Mittels (7/18, 7/40, 7/23) in einer derartigen Weise, daß das sechste Mittel (7/25) wahlweise eines der dritten und vierten Mittel (7/18, 7/40) in Betrieb setzt, wenn das fünfte Mittel (7/23) nicht in der Lage ist, ein Zeichen in dem Zeichenblock zu erkennen, um auf diese Weise das Erkennen von Zeichen in dem fünften Mittel (7/23) mit dem Zeichenblock sicherzustellen, der durch ein ausgewähltes der dritten und vierten Mittel (7/18, 7/40) gebildet wurde.
38. Zeichenerkennungssystem nach Anspruch 37, dadurch gekennzeichnet, daß das zweite Mittel (7/11) eine dritte Stufe zum Erfassen von Überlappungen benachbarter Zeicheneinheiten, die in einem einzigen Zeichenblock enthalten sind, zum getrennten Bilden von Zeichenblöcken für die jeweiligen Zeicheneinheiten enthält.
39. Zeichenerkennungssystem nach Anspruch 38, dadurch gekennzeichnet, daß das zweite Mittel (7/11) desweiteren eine vierte Segmentierungsstufe zum Beseitigen von Rausch- oder Störanteilen in den Zeichenbild-Daten jedes der Zeichenblöcke enthält.
40. Zeichenerkennungssystem nach Anspruch 37, dadurch gekennzeichnet, daß desweiteren ein siebtes Mittel (7/30) zum Erfassen eines vorbestimmten Zeichens vorgesehen ist und daß das Zeichenerkennungssystem (7) die Erkennungsoperation des fünften Mittels (7/23) für das vorbestimmte Zeichen durch Auswählen eines Hilfsalgorithmus steuert, der einfacher als der Algorithmus ist, welcher für die Zeichen außer dem vorbestimmten Zeichen vorgesehen ist.
41. Zeichenerkennungssystem nach Anspruch 37, dadurch gekennzeichnet, daß die erste Segmentierungsstufe y-Projektionsprofile der Dokumentbild-Daten zum Auswählen von Horizontalabtastlinien überprüft, die in jedem der Zeichenfolgenblöcke enthalten sein sollen.
42. Zeichenerkennungssystem nach Anspruch 41, dadurch gekennzeichnet, daß die zweite Segmentierungsstufe x-Projektionsprofile mit Bezug auf einen vorbestimmten Schwellenpegel (TH 0, TH 1) zum Auswählen von Vertikalabtastlinien überprüft, die in dem Zeichenblock enthalten sein sollen.
43. Zeichenerkennungssystem nach Anspruch 42, dadurch gekennzeichnet, daß die zweite Segmentierungsstufe eine Vielzahl von unterschiedlichen Schwellenpegeln zum Segmentieren des Zeichenblocks für unterschiedliche Genauigkeitsstufen beim Segmentieren von Zeichenblöcken mit einer minimalen Zeicheneinheit als deren Inhalt verwendet.
44. Zeichenerkennungssystem nach Anspruch 37, dadurch gekennzeichnet, daß in dem sechsten Mittel (7/25) abwechselnd hohe logische Pegel (HIGH) und niedrige logische Pegel (LOW) für Zeichenblöcke gesetzt werden, die durch jede der zweiten und dritten Segmentierungsstufen segmentiert werden, um Segmentierungshistorie-Daten zu bilden.
45. Verfahren zum Erkennen von Zeichen, die in einem Dokument enthalten sind, gekennzeichnet durch Schritte zum
Gewinnen eines Videosignals, das Bild-Daten des Dokuments enthält,
Extrahieren von Zeichenblöcken, von denen jeder Bild- Daten von individuellen Zeichen in dem Dokument enthält,
Rekombinieren zweier oder mehrerer Zeichenblöcke zum Bilden eines kombinierten Zeichenblocks,
Reextrahieren eines Zeichenblocks zum Bilden eines reextrahierten Zeichenblocks,
Durchführen einer Zeichenerkennung gemäß einem vorbestimmten Algorithmus und Ausgeben eines das erkannte Zeichen kennzeichnenden Signals (S 10) sowie
Steuern der Operationen in dem Schritt zum Rekombinieren, in dem Schritt zum Reextrahieren und in dem Schritt zum Zeichenerkennen in einer Weise, daß der Schritt zum Rekombinieren, der Schritt zum Reextrahieren und der Schritt zum Zeichenerkennen wahlweise durchgeführt wird, um eine Erkennung von Zeichen durch Wiederholen des Schritts zum Rekombinieren, des Schritts zum Reextrahieren und des Schritts zum Zeichenerkennen sicherzustellen.
46. Zeichenerkennungsverfahren nach Anspruch 45, dadurch gekennzeichnet, daß der Schritt zum Extrahieren der Zeichenblöcke ausgeführt wird, um den Zeichenblock so zu extrahieren, daß er eine minimale Zeicheneinheit enthält.
47. Zeichenerkennungsverfahren nach Anspruch 46, dadurch gekennzeichnet, daß in dem Zeichenblock-Extraktionsschritt ein Zeichenblock so definiert wird, daß er Ränder aufweist, die an obere, untere und seitliche Konturen der minimalen Zeicheneinheit grenzen.
48. Zeichenerkennungsverfahren nach Anspruch 46, dadurch gekennzeichnet, daß in dem Zeichenblock-Extraktionsschritt eine Überlappung benachbarter individueller Zeichen zum Bilden separater Zeichenblöcke für jeweilige individuelle Zeichen erfaßt wird.
49. Zeichenerkennungsverfahren nach Anspruch 48, dadurch gekennzeichnet, daß in dem Zeichenblock-Extraktionsschritt ein Rausch- oder Störanteil in den Zeichenbild- Daten jedes der Zeichenblöcke beseitigt wird.
50. Zeichenerkennungsverfahren nach Anspruch 45, dadurch gekennzeichnet, daß desweiteren ein Schritt zum Erfassen eines vorbestimmten Zeichens vorgesehen ist und daß bei dem Verfahren die Zeichenerkennungsoperation für das vorbestimmte Zeichen durch Auswählen eines Hilfsalgorithmus gesteuert wird, der einfacher als der Algorithmus ist, welcher für die Zeichen außer dem vorbestimmten Zeichen benutzt wird.
51. Zeichenerkennungsverfahren nach Anspruch 45, dadurch gekennzeichnet, daß der Schritt zum Steuern des Rekombinationsschritts, des Reextraktionsschritts und des Zeichenerkennungsschritts einen Schritt zum Gewinnen von Historie-Daten von jedem Zeichenblock, die kennzeichnend für den Ablauf der Extraktion des Zeichenblocks sind, zum Steuern der Rekombination des Zeichenblocks in dem Rekombinationsschritt auf der Grundlage der Historie-Daten enthält.
52. Zeichenerkennungsverfahren nach Anspruch 51, dadurch gekennzeichnet, daß der Zeichenblock-Extraktionsschritt eine Vielzahl von Stufen zum Extrahieren der Zeichenblöcke aus den Dokumentbild-Daten enthält und daß die Historie-Daten während des Prozesses der Extraktion gewonnen werden, der in jeder aus der Vielzahl von Zeichenblock- Extraktionsstufen ausgeführt wird.
53. Zeichenerkennungsverfahren nach Anspruch 52, dadurch gekennzeichnet, daß der Zeichenblock-Extraktionsschritt eine Stufe zum Segmentieren jedes der Zeichenfolgenblöcke, eine Stufe zum Segmentieren jedes Zeichenblocks und eine Stufe zum Erfassen von mehr als einer trennbar einem einzigen Zeichenblock zugeordneten Zeicheneinheit zum jeweiligen Zerlegen des Zeichenblocks in mehrere Zeichenblöcke, die voneinander getrennte individuelle Zeicheneinheiten enthalten, aufweist.
54. Zeichenerkennungsverfahren nach Anspruch 53, dadurch gekennzeichnet, daß die Zeichenfolgensegmentierungs- Stufe y-Projektionsprofile der Dokumentbild- Daten zum Auswählen von Horizontalabtastlinien überprüft, die in jedem der Zeichenfolgenblöcke enthalten sein sollen.
55. Zeichenerkennungsverfahren nach Anspruch 53, dadurch gekennzeichnet, daß die Zeichenblocksegmentierungs- Stufe x-Projektionsprofile mit Bezug auf einen vorbestimmten Schwellenpegel (TH 0, TH 1) zum Auswählen von Vertikalabtastlinien überprüft, die in dem Zeichenblock enthalten sein sollen.
56. Zeichenerkennungsverfahren nach Anspruch 55, dadurch gekennzeichnet, daß die Zeichenblocksegmentierungs- Stufe eine Vielzahl von unterschiedlichen Schwellenpegeln zum Segmentieren von Zeichenblöcken mit einer minimalen Zeicheneinheit als deren Inhalt bei unterschiedlichen Genauigkeitsstufen verwendet.
57. Zeichenerkennungsverfahren nach Anspruch 53, dadurch gekennzeichnet, daß die Zeichenblocksegmentierungs- oder -zerlegungs-Stufe die Kontinuität der Zeicheneinheit, die in einem Zeichenblock enthalten ist, zum Erfassen einer Diskontinuität in der Zeicheneinheit zum Zerlegen des Zeichenblocks überprüft.
58. Zeichenerkennungsverfahren nach Anspruch 57, dadurch gekennzeichnet, daß die Zeichenblock-zerlegungs- Stufe die Kontinuität zwischen benachbarten Bilddaten, die Bits zum Erfassen einer Diskontinuität der Zeicheneinheit in dem Zeichenblock enthalten, überprüft.
59. Zeichenerkennungsverfahren nach Anspruch 53, dadurch gekennzeichnet, daß der Zeichenblock-Extraktionsschritt desweiteren eine Stufe zum Überprüfen eines y- Projektionsprofils für die Zeichenbild-Daten in dem Zeichenblock zum Bestimmen der Höhe des Zeichenblocks enthält, so daß obere und untere Ränder des Zeichenblocks an die oberen und unteren Konturen der Zeicheneinheit in dem Zeichenblock stoßen.
60. Zeichenerkennungssystem mit Mitteln zum Gewinnen eines Videosignals, das Bilddaten eines Dokuments enthält, Mitteln zum Extrahieren von Zeichenblöcken, wovon jeder Bild-Daten eines individuellen Zeichens in dem Dokument enthält, und Mitteln zum Durchführen einer Zeichenerkennung auf der Grundlage von Extraktions-Daten, die durch die Zeichenblock- Extraktionsmittel gewonnen wurden, gemäß einem vorbestimmten Algorithmus und zum Ausgeben eines das erkannte Zeichen kennzeichnenden Signals, gekennzeichnet durch Zeichenblock-Extraktionsmittel mit
einem ersten Mittel zum Extrahieren jedes der Zeichenblöcke bei einer ersten Genauigkeitsstufe zum Gewinnen von ersten Extraktions-Daten und
einem zweiten Mittel zum Extrahieren jedes der Zeichenblöcke bei einer zweiten Genauigkeitsstufe zum Gewinnen von zweiten Extraktions-Daten, wobei die zweite Genauigkeitsstufe eine höhere Genauigkeit als die erste Genauigkeitsstufe repräsentiert.
61. Zeichenerkennungssystem nach Anspruch 61, dadurch gekennzeichnet, daß das erste Mittel den Pegel eines x-Projektionsprofils jeder Folge von Zeichenfolgen mit einem ersten Schwellenpegel (TH 0) zum Extrahieren jedes der Zeichenblöcke bei einer ersten Genauigkeitsstufe vergleicht und daß das zweite Mittel den Pegel des x-Projektionsprofils mit einem zweiten Schwellenpegel (TH 1), der höher als der erste Schwellenpegel (TH 0) liegt, zum Extrahieren der Zeichenblöcke bei einer zweiten Genauigkeitsstufe vergleicht.
62. Zeichenerkennungssystem mit Mitteln zum Gewinnen eines Videosignals, das Bild-Daten eines Dokuments enthält, Mitteln zum Extrahieren von Zeichenblöcken, wovon jeder Bild- Daten eines individuellen Zeichens in dem Dokument enthält, und Mitteln zum Durchführen einer Zeichenerkennung auf der Grundlage von Extraktions-Daten, die durch die Zeichenblock- Extraktionsmittel gewonnen wurden, gemäß einem vorbestimmten Algorithmus und zum Ausgeben eines das erkannte Zeichen kennzeichnenden Signals, gekennzeichnet durch Zeichenblock-Extraktionsmittel mit
einem ersten Mittel zum Extrahieren jedes der Zeichenblöcke und
einem zweiten Mittel zum Prüfen der Kontinuität von Bild-Daten, die Bits mit dem Pegel HIGH ("1") enthalten, in jedem der Zeichenblöcke zum Erfassen einer Diskontinuität der Bits mit dem Pegel HIGH ("1") zu benachbarten Bits mit dem Pegel HIGH ("1"), um den Zeichenblock, der in dem ersten Mittel extrahiert wurde, in eine Vielzahl von Blöcken zu zerlegen, wovon jeder Zeichenbild-Daten enthält, die aus Bits mit dem Pegel HIGH ("1") bestehen, die eine Kontinuität zu benachbarten Bits mit dem Pegel HIGH ("1") haben.
63. Zeichenerkennungssystem mit Mitteln zum Gewinnen eines Videosignals, das Bild-Daten eines Dokuments enthält, Mitteln zum Extrahieren von Zeichenblöcken, wovon jeder Bild- Daten eines individuellen Zeichens in dem Dokument enthält, und Mitteln zum Durchführen einer Zeichenerkennung auf der Grundlage von Extraktions-Daten, die durch die Zeichenblock- Extraktionsmittel gewonnen wurden, gemäß einem vorbestimmten Algorithmus und zum Ausgeben eines das erkannte Zeichen kennzeichnenden Signals, gekennzeichnet durch Zeichenblock-Extraktionsmittel mit
einem ersten Mittel zum Extrahieren jedes der Zeichenblöcke bei einer ersten Genauigkeitsstufe,
einem zweiten Mittel zum Extrahieren jedes der Zeichenblöcke bei einer zweiten Genauigkeitsstufe, die eine höhere Genauigkeit als die erste Genauigkeitsstufe repräsentiert, und
einem dritten Mittel zum Aufzeichnen oder Speichern von Extraktionshysterese-Daten in bezug auf jeden der Zeichenblöcke während der Extraktionsoperation in dem ersten und dem zweiten Mittel, welche Extraktionshysterese-Daten bei der Zeichenerkennung durch das Zeichenerkennungsmittel benutzt werden.
64. Zeichenerkennungssystem nach Anspruch 63, dadurch gekennzeichnet, daß das erste Mittel den Pegel eines x-Projektionsprofils jeder Folge von Zeichenfolgen mit einem ersten Schwellenpegel (TH 0) zum Extrahieren jedes der Zeichenblöcke bei einer ersten Genauigkeitsstufe vergleicht und daß das zweite Mittel den Pegel des x-Projektionsprofils mit einem zweiten Schwellenpegel (TH 1), der höher als der erste Schwellenpegel (TH 0) liegt, zum Extrahieren der Zeichenblöcke bei einer zweiten Genauigkeitsstufe vergleicht.
65. Zeichenerkennungssystem nach Anspruch 63, dadurch gekennzeichnet, daß die Extraktionshysterese- Daten, die durch das dritte Mittel gespeichert werden, kennzeichnend für den Ablauf der Extraktion in jedem der ersten und zweiten Mittel sind.
66. Zeichenerkennungssystem nach Anspruch 65, dadurch gekennzeichnet, daß das dritte Mittel jeweils einen Speicherplatz für jedes Bit der Extraktionshysterese- Daten in jedem der ersten und zweiten Mittel zum Speichern dieser Bits in Form eines Binärcodes aufweist.
67. Zeichenerkennungssystem mit Mitteln zum Gewinnen eines Videosignals, das Bild-Daten eines Dokuments enthält, Mitteln zum Extrahieren von Zeichenblöcken, wovon jeder Bild- Daten eines individuellen Zeichens in dem Dokument enthält, und Mitteln zum Durchführen einer Zeichenerkennung auf der Grundlage von Extraktions-Daten, die durch die Zeichenblock- Extraktionsmittel gewonnen wurden, gemäß einem vorbestimmten Algorithmus und zum Ausgeben eines das erkannte Zeichen kennzeichnenden Signals, gekennzeichnet durch ein Verfahren zum Extrahieren der Zeichenblöcke, wovon jeder Bild-Daten einer Zeicheneinheit enthält, mit
einem ersten Schritt zum Extrahieren jedes der Zeichenblöcke bei einer ersten Genauigkeitsstufe zum Gewinnen von ersten Extraktions-Daten und
einem zweiten Schritt zum Extrahieren jedes der Zeichenblöcke bei einer zweiten Genauigkeitsstufe zum Gewinnen von zweiten Extraktions-Daten, wobei die zweite Genauigkeitsstufe eine höhere Genauigkeit als die erste Genauigkeitsstufe repräsentiert.
68. Verfahren nach Anspruch 67, dadurch gekennzeichnet, daß in dem ersten Schritt der Pegel eines x-Projektionsprofils jeder Folge von Zeichenfolgen mit einem ersten Schwellenpegel (TH 0) zum Extrahieren jedes der Zeichenblöcke bei einer ersten Genauigkeitsstufe verglichen wird und daß in dem zweiten Schritt der Pegel des x-Projektionsprofils mit einem zweiten Schwellenpegel (TH 1), der höher als der erste Schwellenpegel (TH 0) liegt, zum Extrahieren der Zeichenblöcke bei einer zweiten Genauigkeitsstufe verglichen wird.
69. Zeichenerkennungssystem mit Mitteln zum Gewinnen eines Videosignals, das Bild-Daten eines Dokuments enthält, Mitteln zum Extrahieren von Zeichenblöcken, wovon jeder Bild- Daten eines individuellen Zeichens in dem Dokument enthält, und Mitteln zum Durchführen einer Zeichenerkennung auf der Grundlage von Extraktions-Daten, die durch die Zeichenblock- Extraktionsmittel gewonnen wurden, gemäß einem vorbestimmten Algorithmus und zum Ausgeben eines das erkannte Zeichen kennzeichnenden Signals, gekennzeichnet durch ein Verfahren zum Extrahieren der Zeichenblöcke, wovon jeder Bild-Daten betreffend ein Einheitszeichen enthält, mit
einem ersten Schritt zum Extrahieren jedes der Zeichenblöcke und
einem zweiten Schritt zum Prüfen der Kontinuität von Bild-Daten, die Bits mit dem Pegel HIGH ("1") enthalten, in jedem Zeichenblock zum Erfassen einer Diskontinuität der Bits mit dem Pegel HIGH ("1") zu benachbarten Bits mit dem Pegel HIGH ("1"), um den betreffenden Zeichenblock, der in dem ersten Schritt extrahiert wurde, in eine Vielzahl von Blöcken zu zerlegen, wovon jeder Zeichenbild-Daten enthält, die aus Bits mit dem Pegel HIGH ("1") bestehen, die eine Kontinuität zu benachbarten Bits mit dem Pegel HIGH ("1") aufweisen.
70. Zeichenerkennungssystem mit Mitteln zum Gewinnen eines Videosignals, das Bild-Daten eines Dokuments enthält, Mitteln zum Extrahieren von Zeichenblöcken, wovon jeder Bild- Daten eines individuellen Zeichens in dem Dokument enthält, und Mitteln zum Durchführen einer Zeichenerkennung auf der Grundlage von Extraktions-Daten, die durch die Zeichenblock- Extraktionsmittel gewonnen wurden, gemäß einem vorbestimmten Algorithmus und zum Ausgeben eines das erkannte Zeichen kennzeichnenden Signals, gekennzeichnet durch ein Verfahren zum Extrahieren der Zeichenblöcke, wovon jeder Bild-Daten einer Zeicheneinheit enthält, mit
einem ersten Schritt zum Extrahieren jedes der Zeichenblöcke bei einer ersten Genauigkeitsstufe,
einem zweiten Schritt zum Extrahieren jedes der Zeichenblöcke bei einer zweiten Genauigkeitsstufe, die eine höhere Genauigkeit als die der ersten Genauigkeitsstufe repräsentiert, und
einem dritten Schritt zum Aufzeichnen oder Speichern von Extraktionshysterese-Daten in bezug auf jeden Zeichenblock während der Extraktionsoperation in dem ersten und dem zweiten Schritt, welche Extraktionshysterese-Daten in dem Zeichenerkennungsprozeß, der durch das Zeichenerkennungsmittel ausgeführt wird, benutzt werden.
71. Verfahren nach Anspruch 70, dadurch gekennzeichnet, daß der Pegel eines x-Projektionsprofil jeder Folge von Zeichenfolgen mit einem ersten Schwellenpegel (TH 0) zum Extrahieren jedes der Zeichenblöcke bei einer ersten Genauigkeitsstufe in dem ersten Schritt verglichen wird und daß der Pegel des x-Projektionsprofils mit einem zweiten Schwellenpegel (TH 1), der höher als der erste Schwellenpegel (TH 0) liegt, zum Extrahieren der Zeichenblöcke bei einer zweiten Genauigkeitsstufe in dem zweiten Schritt verglichen wird.
72. Zeichenerkennungssystem, betrieben durch ein Verfahren nach Anspruch 70, dadurch gekennzeichnet, daß die Extraktionshysterese-Daten, die in dem dritten Schritt aufgezeichnet oder gespeichert wurden, kennzeichnend für die Reihenfolge der Schritte oder den Verlauf der Extraktion in jedem der ersten und zweiten Schritte sind.
73. Zeichenerkennungssystem nach Anspruch 72, dadurch gekennzeichnet, daß in dem dritten Schritt alle der Extraktionshysterese-Daten in jedem der ersten und zweiten Schritte in jeweils einem Speicherplatz für jedes der Bits dieser Daten in Form eines Binärcodes gespeichert werden.
DE19863632832 1985-09-27 1986-09-26 Zeichenerkennungssystem Withdrawn DE3632832A1 (de)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP60213755A JPS6274181A (ja) 1985-09-27 1985-09-27 文字認識装置

Publications (1)

Publication Number Publication Date
DE3632832A1 true DE3632832A1 (de) 1987-05-07

Family

ID=16644487

Family Applications (1)

Application Number Title Priority Date Filing Date
DE19863632832 Withdrawn DE3632832A1 (de) 1985-09-27 1986-09-26 Zeichenerkennungssystem

Country Status (8)

Country Link
US (1) US4850025A (de)
JP (1) JPS6274181A (de)
KR (1) KR870003439A (de)
CN (1) CN1008022B (de)
CA (1) CA1273110A (de)
DE (1) DE3632832A1 (de)
FR (1) FR2588104B1 (de)
GB (3) GB2182796B (de)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE19508135A1 (de) * 1995-03-08 1996-09-12 Licentia Gmbh Verfahren zur Verbesserung der Erkennung von Maschinenschriften mit fester Schriftteilung
DE19522394A1 (de) * 1995-06-23 1997-01-02 Licentia Gmbh Verfahren und Vorrichtung zur Bestimmung der Teilung bei Schriften mit fester Teilung

Families Citing this family (52)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2212636A (en) * 1987-11-17 1989-07-26 Amoco Corp Identifying data format
JP2822189B2 (ja) * 1988-05-19 1998-11-11 ソニー株式会社 文字認識装置及び方法
US5131053A (en) * 1988-08-10 1992-07-14 Caere Corporation Optical character recognition method and apparatus
JP3017740B2 (ja) * 1988-08-23 2000-03-13 ソニー株式会社 オンライン文字認識装置およびオンライン文字認識方法
JP2847715B2 (ja) * 1988-08-30 1999-01-20 ソニー株式会社 文字認識装置及び文字認識方法
US5295198A (en) * 1988-10-14 1994-03-15 Harris Corporation Pattern identification by analysis of digital words
JPH07101441B2 (ja) * 1989-02-21 1995-11-01 富士電機株式会社 文字認識方法
JP2597006B2 (ja) * 1989-04-18 1997-04-02 シャープ株式会社 矩形座標抽出方法
US5361309A (en) * 1989-09-07 1994-11-01 Canon Kabushiki Kaisha Character recognition apparatus and method with low-resolution storage for character extraction
US5048109A (en) * 1989-12-08 1991-09-10 Xerox Corporation Detection of highlighted regions
US5272764A (en) * 1989-12-08 1993-12-21 Xerox Corporation Detection of highlighted regions
US5119433A (en) * 1990-03-12 1992-06-02 International Business Machines Corporation Method and system for locating the amount field on a document
CA2037173C (en) * 1990-03-30 1996-01-09 Hirofumi Kameyama Character recognizing system
US5101439A (en) * 1990-08-31 1992-03-31 At&T Bell Laboratories Segmentation process for machine reading of handwritten information
JP2821285B2 (ja) * 1991-07-23 1998-11-05 キヤノン株式会社 画像処理方法及び装置
DE69232493T2 (de) * 1991-10-21 2003-01-09 Canon K.K., Tokio/Tokyo Verfahren und Gerät zur Zeichenerkennung
US5305396A (en) * 1992-04-17 1994-04-19 International Business Machines Corporation Data processing system and method for selecting customized character recognition processes and coded data repair processes for scanned images of document forms
US6212299B1 (en) * 1992-12-11 2001-04-03 Matsushita Electric Industrial Co., Ltd. Method and apparatus for recognizing a character
US6535897B1 (en) * 1993-05-20 2003-03-18 Microsoft Corporation System and methods for spacing, storing and recognizing electronic representations of handwriting printing and drawings
JPH07288722A (ja) * 1994-04-15 1995-10-31 Canon Inc 撮像装置
US5600735A (en) * 1994-05-10 1997-02-04 Motorola, Inc. Method of recognizing handwritten input
GB2289969A (en) * 1994-05-24 1995-12-06 Ibm Character segmentation
US5675665A (en) * 1994-09-30 1997-10-07 Apple Computer, Inc. System and method for word recognition using size and placement models
CA2178959C (en) * 1994-11-14 2000-05-16 Kenneth J. Guzik Method of splitting handwritten input
US5737443A (en) * 1994-11-14 1998-04-07 Motorola, Inc. Method of joining handwritten input
JPH08235310A (ja) * 1995-02-24 1996-09-13 Nec Corp 接触文字切り出し装置
JP3606500B2 (ja) * 1997-01-31 2005-01-05 株式会社リコー 矩形分類方法
SG71018A1 (en) * 1997-03-01 2000-03-21 Inst Of Systems Science Nat Un Robust identification code recognition system
GB9808712D0 (en) 1997-11-05 1998-06-24 British Aerospace Automatic target recognition apparatus and process
US6445834B1 (en) 1998-10-19 2002-09-03 Sony Corporation Modular image query system
US6256409B1 (en) 1998-10-19 2001-07-03 Sony Corporation Method for determining a correlation between images using multi-element image descriptors
JP2000163044A (ja) * 1998-11-30 2000-06-16 Sharp Corp 画像表示装置
US6473517B1 (en) * 1999-09-15 2002-10-29 Siemens Corporate Research, Inc. Character segmentation method for vehicle license plate recognition
US6674915B1 (en) 1999-10-07 2004-01-06 Sony Corporation Descriptors adjustment when using steerable pyramid to extract features for content based search
US7305617B2 (en) * 2000-02-12 2007-12-04 Adobe Systems Incorporated Method for aligning text to baseline grids and to CJK character grids
US6725218B1 (en) 2000-04-28 2004-04-20 Cisco Technology, Inc. Computerized database system and method
JP4613397B2 (ja) * 2000-06-28 2011-01-19 コニカミノルタビジネステクノロジーズ株式会社 画像認識装置、画像認識方法および画像認識プログラムを記録したコンピュータ読取可能な記録媒体
EP2317458A1 (de) 2000-07-28 2011-05-04 RAF Technology, Inc. Orthogonale Technologie für mehrzeilige Zeichenerkennung
US8682077B1 (en) 2000-11-28 2014-03-25 Hand Held Products, Inc. Method for omnidirectional processing of 2D images including recognizable characters
US6735337B2 (en) * 2001-02-02 2004-05-11 Shih-Jong J. Lee Robust method for automatic reading of skewed, rotated or partially obscured characters
US8144988B2 (en) * 2007-09-06 2012-03-27 Ricoh Company, Ltd. Document-image-data providing system, document-image-data providing device, information processing device, document-image-data providing method, information processing method, document-image-data providing program, and information processing program
US8194982B2 (en) * 2007-09-18 2012-06-05 Ricoh Company, Ltd. Document-image-data providing system, document-image-data providing device, information processing device, document-image-data providing method, information processing method, document-image-data providing program, and information processing program
KR101035744B1 (ko) * 2008-12-08 2011-05-20 삼성전자주식회사 카메라를 이용한 문자 인식 장치 및 방법
CN102081736B (zh) * 2009-11-27 2014-11-26 株式会社理光 从可移植电子文档中提取字符外接矩形的设备和方法
JP5508953B2 (ja) * 2010-06-28 2014-06-04 株式会社日立ソリューションズ 文書処理装置及びプログラム
TWI478074B (zh) * 2010-12-01 2015-03-21 Inst Information Industry 文字辨識方法、裝置以及儲存其之電腦可讀取紀錄媒體
US9082339B2 (en) * 2011-11-04 2015-07-14 Facebook, Inc. Rendering texts on electronic devices
US8818030B2 (en) * 2011-12-13 2014-08-26 Xerox Corporation Post-processing a multi-spectral image for enhanced object identification
JP6078953B2 (ja) * 2012-02-17 2017-02-15 オムロン株式会社 文字認識方法、およびこの方法を用いた文字認識装置およびプログラム
JP6286866B2 (ja) * 2013-05-20 2018-03-07 オムロン株式会社 画像処理装置および画像処理方法
SG11202008145YA (en) * 2018-02-26 2020-09-29 Videonetics Tech Private Limited A system for real-time automated segmentation and recognition of vehicle's license plates characters from vehicle's image and a method thereof.
CN112307820B (zh) * 2019-07-29 2022-03-22 北京易真学思教育科技有限公司 文本识别方法、装置、设备和计算机可读介质

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3517387A (en) * 1965-10-24 1970-06-23 Ibm Character isolation apparatus
US3526876A (en) * 1965-10-24 1970-09-01 Ibm Character separation apparatus for character recognition machines
US3662341A (en) * 1970-09-25 1972-05-09 Ibm Video-derived segmentation-gating apparatus for optical character recognition
US3846752A (en) * 1972-10-02 1974-11-05 Hitachi Ltd Character recognition apparatus
NL160408C (nl) * 1973-02-21 1979-10-15 Nederlanden Staat Inrichting voor het lezen van tekens, bij voorkeur van cijfers.
FR2267590B1 (de) * 1974-04-10 1977-05-20 Ibm
JPS5156139A (en) * 1974-11-13 1976-05-17 Hitachi Ltd Mojomitorisochi niokeru kiridashihoshiki
US4087790A (en) * 1977-08-22 1978-05-02 Recognition Equipment Incorporated Character presence processor
US4379282A (en) * 1979-06-01 1983-04-05 Dest Corporation Apparatus and method for separation of optical character recognition data
JPS6043555B2 (ja) * 1980-02-26 1985-09-28 株式会社トキメック 印字文字切出し装置
US4377803A (en) * 1980-07-02 1983-03-22 International Business Machines Corporation Algorithm for the segmentation of printed fixed pitch documents
JPS5998283A (ja) * 1982-11-27 1984-06-06 Hitachi Ltd パターン切出しおよび認識方法、ならびにそのシステム
EP0120334B1 (de) * 1983-03-01 1989-12-06 Nec Corporation System zum Bestimmen des Zeichenabstandes
US4610025A (en) * 1984-06-22 1986-09-02 Champollion Incorporated Cryptographic analysis system
JPH0610829B2 (ja) * 1984-06-29 1994-02-09 インタ−ナショナル ビジネス マシ−ンズ コ−ポレ−ション 手書き文字認識方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE19508135A1 (de) * 1995-03-08 1996-09-12 Licentia Gmbh Verfahren zur Verbesserung der Erkennung von Maschinenschriften mit fester Schriftteilung
DE19522394A1 (de) * 1995-06-23 1997-01-02 Licentia Gmbh Verfahren und Vorrichtung zur Bestimmung der Teilung bei Schriften mit fester Teilung

Also Published As

Publication number Publication date
JPS6274181A (ja) 1987-04-04
GB2182796B (en) 1990-04-18
CN86107537A (zh) 1987-04-22
KR870003439A (ko) 1987-04-17
GB2208735B (en) 1990-04-18
FR2588104B1 (fr) 1992-09-04
FR2588104A1 (fr) 1987-04-03
CN1008022B (zh) 1990-05-16
US4850025A (en) 1989-07-18
GB8824148D0 (en) 1988-11-23
GB8623049D0 (en) 1986-10-29
GB2208736A (en) 1989-04-12
GB2182796A (en) 1987-05-20
GB2208735A (en) 1989-04-12
GB8824149D0 (en) 1988-11-23
GB2208736B (en) 1990-04-18
CA1273110A (en) 1990-08-21

Similar Documents

Publication Publication Date Title
DE3632832A1 (de) Zeichenerkennungssystem
DE3926327C2 (de) Verfahren und System zum Erkennen von Zeichen auf einem Medium
DE69421255T2 (de) Dokumentkopierabwehrverfahren
DE69230632T2 (de) Optische Worterkennung durch Wortgestaltuntersuchung
DE3850595T2 (de) Dokumentverarbeitungssystem.
DE69722971T2 (de) Automatisches sprachenerkennungssystem für die mehrsprachige optische zeichenerkennung
DE69332459T2 (de) Verfahren und Vorrichtung zur Zeichenerkennung
DE69230633T2 (de) Verfahren zur Ermittlung von Wortformen zum folgenden Vergleich
DE3716787C2 (de)
DE3851867T2 (de) Zeichenerkennungsgerät.
DE69232493T2 (de) Verfahren und Gerät zur Zeichenerkennung
DE4311172C2 (de) Verfahren und Einrichtung zum Identifizieren eines Schrägenwinkels eines Vorlagenbildes
DE69423254T2 (de) Verfahren und Gerät zur automatischen Spracherkennung von Dokumenten
DE3916323A1 (de) Verfahren zum erkennen eines zeichens und dabei verwendbares zeichenerkennungssystem
DE69329380T2 (de) Verfahren zum Segmentieren von Bildern und Klassifizieren von Bildelementen zur Dokumentverarbeitung
DE69132206T2 (de) Verfahren und Gerät zur Bildverarbeitung
DE69230631T2 (de) Verfahren zum Vergleichen von Wortgestalten
DE69231923T2 (de) System mit Annäherungsmittel zur Erkennung von graphischen Elementen in einer Zeichnung
DE69226609T2 (de) Verfahren und Gerät zur Dokumentbildverarbeitung
DE69230031T2 (de) Mustererkennung und -echtheitsprüfung, insbesondere für handgeschriebene Unterschriften
DE69329330T2 (de) Texterkennung
DE69721941T2 (de) Gerät und Verfahren zum Extrahieren von Mustern
DE2640537A1 (de) Verfahren und vorrichtung zum unterscheiden zwischen n groesser als 2 alphabeten angehoerenden zeichen
DE3342947C2 (de) System zur Verarbeitung eines grafischen Musters
EP0550511B1 (de) Verfahren zur extrahierung von einzelzeichen aus rasterbildvorlagen einer gelesenen hand- oder maschinenschriftlichen zeichenfolge freier teilung

Legal Events

Date Code Title Description
8110 Request for examination paragraph 44
8139 Disposal/non-payment of the annual fee