<Desc/Clms Page number 1>
Verfahren zum Erkennen von Schriftzeichen, z. B. Druckbuchstaben
Die Erfindung bezieht sich auf ein Verfahren zum Erkennen von Schriftzeichen, z. B. von Druckbuchstaben, einer Schriftklas3e, aber auch von Schriftzeichen verschiedenartiger Schriftgarnituren sowie handschriftlicherZeichen, die einer Druckschrift ähnlich sind. Dabei wird die von dem zu erkennenden Zeichen bewirkte Überschattung von Feldern eines zweidimensionalen Rasters zur Gewinnung einer Information ausgenutzt.
Es ist allgemein bekannt, dass eines der wichtigsten Probleme der Rechentechnik das Ablesen eines Schrifttextes ist, d. h. das unmittelbare Abnehmen einer Information von einem Original und deren Einführung in eine Rechenanlage.
Es ist bekannt, jedem einzelnen aus einer Anzahl zu erkennender Zeichen eine oder mehrere insbesondere binäre Codezahlen zuzuordnen. Es versteht sich, dass die Sicherheit der Identifizierung eines bestimmten Zeichens von der Vorschrift nicht unabhängig ist, nach welcher die Codezahlen ermittelt werden. Ein bekanntgewordener Vorschlag (österr. Patentschrift Nr. 222193) geht dahin, zur maschinellen Auswertung eines Schriftzeichens auf digitaler Basis die Codierung innerhalb dieses Zeichens vorzusehen, wobei die Auswertung durch gleichzeitiges Abtasten mehrerer horizontal über das Zeichen hinwegführender Bereiche erfolgt und die dabei ermittelten Codeelemente gemeinsam das Erkennungskriterium für das jeweilige Zeichen bilden. Zwischen diesen Bereichen können tote Zonen angeordnet sein, die zur Erkennung allerdings nichts beitragen.
Diese Erkennungsmethode erfordert die Verwendung bestimmt gestalteter Zeichen, welche das Codierungsschema in sich tragen, ist demnach nicht allgemein anwendbar und verhältnismässig roh.
Zur Erkennung von Zeichen können auch statistische Methoden herangezogen werden. Bei diesen (vgl. USA-Patentschrift Nr. 2, 978, ( ; 75), wird die von jedem Zeichen eingenommene Fläche in kleinere Flächen zerlegt, die in einer Matrix angeordnet sind. Die Bewertung dieser einzelnen Flächenelemente geschieht nun nach der Wahrscheinlichkeit, mit der jedes Flächenelement bei einem bestimmten Zeichen von diesem überdeckt ist. Für die Zeichen eines zu erkennenden Alphabets werden die Wahrscheinlichkeiten mit vielen Versuchen für jeden einzelnen Buchstaben festgestellt und die für jeden dieser Buchstaben gewonnene Wahrscheinlichkeitsmatrix gespeichert. Das Erkennen eines vorgelegten Buchstabens geschieht durch Vergleichen einer von diesem gewonnenen Matrix mit den gespeicherten Matrizen.
Es erhellt ohne weiters, dass dieses Verfahren komplizierter Vorrichtungen bedarf und überdies an jene Zeichen gebunden ist, von welchen Wahrscheinlichkeitsmatrizen aufgespeichert vorliegen.
Überdies ist die Aufnahmefähigkeit jedes Speichers begrenzt.
Es ist auch vorgeschlagen worden (österr. Patentschrift Nr. 206023), zu erkennende Zeichen in einem Rasterschema je nach Art ihrer Aufbringung auf einen Zeichenträger optisch, magnetisch, galvanisch oder elektrostatisch abzutasten und die Abtastsignale in einem zweidimensionalen Schieberegi- ster zu speichern, dessen Speicherzellen in der gleichen räumlichen Anordnung den Rasterfeldern des Abtastrasterschemas zugeordnet sind, und das eine Verschiebung der eingespeicherten Information in allen vier Richtungen gestattet. Für jedes zu erkennende Zeichen ist eine Koinzidenzschaltung vorgesehen, in welcher die Ausgänge. jener Speicherzellen die für dieses Zeichen das Kriterium"schwarz" und jener Speicherzellen, die das Kriterium "weiss" gespeichert haben sollen, untereinander verbunden sind.
Das Erkennen eines Zeichens ergibt sich aus der Erfüllung der Koinzidenzbedingung. Nach diesem
<Desc/Clms Page number 2>
Verfahren lassen sich nur normalisierte Zeichen erkennen und die Leistungsfähigkeit ist wegen der bescheidenen aufgenommenen Information beschränkt.
Es ist ferner ein Verfahren zum Erkennen von Schriftzeichen bekanntgeworden, welches darin besteht, mit jedem Schriftzeichen zwei binäre Codekombinationen zu vergleichen, die sich bei der Projektion einzelner Fragmente des Schriftzeichens auf die horizontale und die vertikale Achse ergeben.
Auch dieses Verfahren ist jedoch von wesentlichen Mängeln begleitet, von denen der Informationsver- lustüberVerbindungselemente des Schriftzeichens der wichtigste ist, so dass in praxi nur ein bestimmter Schrifttyp erkannt werden kann.
Zielder Erfindung ist es, der erwähnten Schwierigkeiten Herr zu werden, realisierbare Massnahmen zur Automatisierung des Prozesses der Schriftzeichenerkennung zu entwickeln und anzugeben, insbesondere aus der Nichtbeachtung von Verbindungselementen eines Schriftzeichens entspringende Informationsverluste zu vermeiden, sowie Einflüsse von Ausmassen und Eigenheit der Schrift, wie Zierformen u. dgl., bei deren Ablesen zu beseitigen.
Um dieses Ziel zu erreichen, wird bei dem eingangs umrissenen Verfahren erfindungsgemäss das jedem dieser Schriftzeichen zugeordnete Raster mit einer Anzahl von in Z Zeilen und S Spalten angeordneten Rasterfeldern der von dem Schriftzeichen eingenommenen Flächen angepasst. Die Zeilen werden in eine Anzahl h Horizontalzonen ,H,... Hh mit hl tL... hh Spalten, die Spalten in eine Anzahl v Vertikalzonen V, V... Vv mit v, v... Vy Zeilen aufgeteilt. Bei den Horizon- talzonen wird jeder Spalte und bei den Vertikalzonen jeder Zeile je nachdem ob diese Spalte bzw. Zeile wenigstens ein in vorgegebenem Ausmass von dem Schriftzeichen überschattetes oder kein solches Rasterfeld enthält, das Zeichen 1 oder 0 zugeordnet.
Hiedurch werden h S-stellige Horizontalbinärcodezahlen und v Z-stellige Vertikalbinärcodezahlen gebildet. Die Horizontaleodezahlen werden in eine Anzahl s, und die Vertikalcodezahlen in eine Anzahl z, sI s -, ... ss-stellige bzw. zul-, z-,.... zz-stellige Gruppen unter-
EMI2.1
zahlig gewählt. Jeder der mittleren Gruppen wird jenes der Zeichen l oder 0 zugeordnet, das in dieser Gruppe überwiegend vertreten ist. Der ersten bzw. der letzten Gruppe der Horizontal- und der Vertikalcodezahlen wird jedoch jenes Zeichen zugeordnet, das überwiegend in einer Untergruppe am Anfang der ersten bzw. am Ende der letzten Gruppe auftritt, z. B. das erste bzw. letzte Zeichen einer Horizontal-odereiner Vertikalcodezahl.
Die auf diese Weise ermittelten reduzierten, s-bzw. z-stelligen Codezahlen werden für jedes Schriftzeichen einer Schriftklasse in einer vorbestimmten Reihenfolge zu einer (hs+vz)-stelligen Kenncodezahl für dieses Schriftzeichen in einer Zeile aneinandergereiht.
Der Raster kann die Gestalt eines rechtwinkeligen oder eines schiefwinkeligen Parallelogramms, z. B.
EMI2.2
der Bestimmung der jeder Zeile bzw. jeder Spalte zugeordneten Binärcodezahl ist festzulegen, welche Rasterfelder beschattet und welche unbeschattet und demgemäss mit dem Gewicht 1 bzw. 0 zu versehen sind. Zu diesem Zweck ist vorher eine generelle Vorschrift aufzustellen. Als beschattet werden alle jene Rasterfelder gezählt, deren Fläche zu mehr als 50 % von einem Teil des zu erkennenden Zeichens bedeckt ist. Die freibleibenden oder weniger bedeckten Felder gelten als unbeschattet, beispielsweise könnte aber auch eine Grenze von 60 % vorgeschrieben werden.
Die Zuordnung der Gewichte 0 oder 1 zu den einzelnen Rasterfeldern geschieht bei Photodiodenmatrizenflächen nach Massgabe der Amplitude des Ausgangssignals der die einzelnen Felder bildenden Photodioden, oder die Gewichte werden aus dem an dem betreffenden Feld des Schriftzeichens reflektierten Licht ermittelt. Beide Methoden sind an sich bekannt. Zur Gewinnung der S-stelligenHorizontaleodezahlen, also der Code- zahlen, die einer Horizontalzone zugeordnet sind, wird diese in Richtung ihrer Spalten projiziert, wobei jede Spalte als undurchlässig gilt, die wenigstens ein beschattetes Rasterfeld aufweist. Diese Spalten erhalten das Zeichen 0, die andern das Zeichen 1. Analog wird mit den Vertikalzonen bei Ermittlung der Z-stelligen Vertika1codezahlen verfahren.
Bei quadratischen Rastern wird es meistens zweckmässig sein, ebensoviele Horizontal- wie Vertikalzonen vorzusehen, also h=v-g zu wählen.
Nach einem Merkmal der Erfindung können die zu erkennenden Zeichen unabhängig von ihren Ausmassen in die gleiche Anzahl von Feldern, unterteilt werden.
Ein praktisch durchaus brauchbares Erkennungsverfahren lässt sich schon auf eine Aufteilung der Zeilen auf nur drei Horizontalzonen und der Spalten auf ebenfalls drei Vertikalzonen gründen. Es empfiehlt sich dann, die innere Horizontalzone und die beiden äusseren Vertikalzonen zur Sicherung einer ausreichenden Information über die Verbindungselemente des zu erkennenden Schriftzeichens breiter, z. B.
<Desc/Clms Page number 3>
zwei-oder dreimal so breit zu wählen, wie die übrigen Horizontal-bzw. Vertikalzonen.
Bei der Zusammenfassung nebeneinander stehender Zeichen der Horizontal- bzw. der Vertikalcodezahlen zu Gruppen ergeben sich je eine Anfangsgruppe, eine Anzahl mittlerer Gruppen und eine Endgruppe. Vertikal- und Horizontaleodezahlen können, vorzugsweise bei quadratischen Rastern, in die gleiche Zahl, z. B. in fünf Gruppen geteilt werden. Aus diesen Gruppen werden die reduzierten Codezahlen nach folgender Vorschrift gewonnen :
Den mittleren Gruppen wird jenes Zeichen, also 0 oder 1 zugeordnet, das innerhalb der Gruppe überwiegend vertreten ist. Um dieser Regel jede Unbestimmtheit zu nehmen, muss jede innere Gruppe eine ungerade Zahl von Stellen aufweisen. Die Stellenzahlen sämtlicher inneren Gruppen können unter- einander gleich sein:s. = s-... =s = 2K+l, z -z=... =z -2n + 1 und überdies kann K = n sein.
Soll mit inneren Gruppen gleicher Stellenzahl gearbeitet werden, so lässt sich bei vorher bestimm- ter Zahl der Gruppen zur Ermittlung dieser Stellenzahl, z. B. folgendermassen verfahren. Es wird die Anzahl Z der Zeilen durch die Anzahl h der Horizontalgruppen und die Anzahl S der Spalten
EMI3.1
Zahlen entsprechende Anzahl von Stellen.
Der ersten und der letzten Gruppe wird jenes Zeichen zugeordnet, das in einer Randgruppe dieser Gruppen vorwiegend auftritt, die vorweg festgelegt wird und jedenfalls nur wenige, z. B. die ersten bzw. letzten drei Zeichen der ersten bzw. letzten Gruppe enthält, oder auch lediglich das erste bzw. das letzte Zeichen dieser Gruppen. Die Konstruktion des Zerlegungsschemas eines vorgegebenen Rasters nach den gegebenen Regeln sei an Hand zweier Beispiele erläutert, u. zw. zunächst an Hand eines Rasters mit 37 Spalten und 57 Zeilen. In diesem Fall ergibt sich, wenn h=v=5 gewählt wird, 37 : 5 = 7, 4 ; 57 : 5 = 11, 4. Die nächsten ungeraden Zahlen sind 7 bzw. 11 und dementsprechend ergeben sich für die Vertikalcodezahlen drei mittlere Gruppen mit je 7 Stellen sowie eine Anfangs- und eine Endgruppe mit 8 Stellen.
Für die Horizontalcodezahl ergibt sich eine Zusammenfassung in drei mittlere, elfstellige Gruppen und eine Anfangs- bzw. eine Endgruppe von je 12 Stellen.
Als zweites Beispiel sei ein Raster mit 30 x 30 Feldern betrachtet, dessen Horizontal- bzw. Vertikalcodezahlen wieder je in 5 Gruppen unterteilt werden sollen. Es gilt 30 : 5 = 6. Die nächst höhere ungerade Zahl ist 7. Demgemäss werden drei mittlere Gruppen mit je 7 Stellen gebildet, denen eine vierstellige Anfangsgruppe vorgesetzt und eine fünfstellige Endgruppe nachgereiht wird.
Die Erfindung ist im folgenden an Hand beispielsweiser Ausführungsformen näher beschrieben, wobei zum besseren Verständnis die Zeichnungen herangezogen sind und sich weitere Merkmale und Vorteile ergeben werden Diese Beschreibung ist als die Erfindung erklärend und nicht beschränkend aufzufassen, denn bei konkreten Realisierungen sind Abweichungen möglich, ohne den Erfindungsbereich zu verlassen.
In den Zeichnungen zeigt Fig. 1 mögliche Aufstellungen des zu erkennenden Zeichens H im Kontrollrechteck. Fig. 2 zeigt ein Beispiel der Einordnung des zu erkennenden Zeichens A in einen Raster mit 625 Feldern und der Wahl vertikaler und horizontaler Zonen. Fig. 3 zeigt eine Abbildung des Zeitungsschriftzeichens B im Binärcode auf einem Oszillographenschirm und Fig. 4 stellt eine Abbildung des maschinengeschriebenen Zeichens Y im Binärcode auf einem Oszillographenschirm dar.
Zum Erkennen von Schriftzeichen wird jedes Zeichen, auf die Z. S. Felder aufweisende Matrize 1 projiziert, z. B. eine Photodiodenmatrize. Auf der Matrize 1 (Fig. 1) ist ein Rechteck 2 angedeutet, welches zur Kontrolle der optischen Einstellung der minimalen Aussenmasse der zu erkennenden Zeichen 3 dient. Dabei wird ein z. B. über 50 % beschattetes Feld für eine "Eins" und ein
EMI3.2
diodenmatrize ein Auftastimpuls der entsprechenden Spalten und Zeilen benutzt.
Die gewonnene Aussenmassmatrize wird in Zonen unterteilt, z. B. in drei horizontale und drei vertikale, wobei die innere horizontale Zone und die äusseren vertikalen Zonen je nach der Garniturenklasse um das Zwei- oder Dreifache grösser genommen werden. Nach einem Merkmal der Erfindung wird dabei für jedes Zeichen das gleiche entsprechend verkleinerte oder vergrösserte Raster verwendet.
Hierauf wird in binärer Rechnung das logische Addieren der Codes vorgenommen, welche den Zeilen und den Spalten entnommen werden, die sich in entsprechenden Zonen befinden. Auf diese Weise erhält man für jedes zu erkennende Zeichen sechs Codes, von welchen drei Codes die Stellenanzahl S und drei die Stellenzahl Z besitzen, und im vorliegenden Beispiel Z = S = 25 gilt. Aus jeder dieser drei Horizontal- bzw. Vertikalcodezahlen wird der die wesentlichen geometrischen Informationen
<Desc/Clms Page number 4>
dieser Codezahlen der jeweiligen Zone kennzeichnende z. B. fünfstellige reduzierte Code nach folgender Regel gewonnen. Die Stellenzahl der Horizontal- und der Vertikalcodezahlen beträgt 25.
Da die reduzierte Codezahl fünfstellig sein soll, ist die Anzahl der Gruppen gleich 5 und für die Stellenzahl der mittleren Gruppen folgt 25 = 5. " : 5, also eine ungerade Zahl, so dass ein Übergehen auf nächstliegende ungerade Zahlen entfällt.
Des weiteren werden drei Gruppen mit je 5 Stellen als mittlere Gruppen nacheinander derart geordnet, dass die Mitte der zweiten Gruppe bis auf eine Stelle genau mit der Symmetrieachse der Horizontal-bzw. der Vertikalcodezahl zusammenfällt, und die an den Rändern gebliebenen Stellen werden in die erste die Anfangs- und die fünfte, die Endgruppe eingegliedert.
Aus jeder Horizontal-und jeder Vertikalcodezahl ergibt sich je eine reduzierte Codezahl, so dass für jedes zu erkennende Alphahetzeichen schliesslich sechs fünfstellige Zahlen erhalten werden, welche, in Reihe geschrieben, eine dreissigstellige Codezahl bilden, nämlich den Erkennungscode des jeweils vorliegenden Zeichens. Dieser erhaltene Kenneode wird in den Speicher der Rechenanlage eingegeben und mit seiner Hilfe werden Zeichen der vorliegenden Schriftenklasse bestimmt.
Beim Erkennen von Zeichen, die paarweise gleiche Erkennungscoden haben (z. B. im russischen Alphabet die Zeichen für den Vokal I und den Konsonanten J oder das Zeichen für den Konsonanten Z und die Ziffer : j, im lateinischen Q und 0), wird das Gewinnen zusätzlicher Information von entsprechenden Spalten und Zeilen vorgesehen, beispielsweise haben die Zeichen für den Konsonanten Z und
EMI4.1
Über die Art des Aneinanderfügens der reduzierten Codezahlen ist noch eine Vorschrift festzulegen. Man kann beispielsweise festsetzen, der Reihe nach die reduzierten Codezahlen der Horizontalzonen anzuschreiben und an diese der Reihe nach die reduzierten Codezahlen der Vertikalzonen anzuschliessen.
Bei der Prüfkontrolle wird ein Befehl zum Prüfen der äusseren rechten vertikalen Spalten zur Ermittlung der Nullen in der Mitte des Codes gegeben. Das Vorhandensein von Nullen entspricht dem Zeichen 3 und deren Fehlen entspricht dem Zeichen für den Konsonanten Z.
Das gleiche gilt beim Bestimmen eines diakritischen Zeichens und der unteren Elemente von Buchstaben. Diese Prüfmethode lässt sich übrigens auch für alle andern Fälle verallgemeinern.
Zum besseren Verständnis sei ein Beispiel angeführt : es werde angenommen, dass das Zeichen A (Fig. 2) zu erkennen sei. Das Gewinnen der Information über das zu erkennende Zeichen erfolgt nach einer der bekannten Methoden, z. B. mittels eines"Abtastlichtstrahles". Auf einer Elektronenstrahlröhre entsteht :. in Raster, z. B. zu 25 Zeilen, die durch ein Objektiv auf die zu erkennende Abbildung des Zeichens A projiziert werden.
Um die Bestimmung der Aussenmasse des zu erkennenden Zeichens A zu ermöglichen, wird der grösser oder gleich dem grössten der zu erkennenden Zeichen eingestellte Raster nach jedem Kader in den Horizontalen und den Vertikalen abwechselnd abgetastet. Bei der ersten Abtastung des Rasters in der horizontalen Richtung wird die vertikale Grösse des Zeichens nach der Anzahl der vom Zeichen besetzten Zeilen bestimmt und dementsprechend die vertikale Grösse des Kaders korrigiert ; bei vertikaler Abtastung des Rasters wird die horizontale Grösse des Zeichens bestimmt und die horizontale Grösse des Kaders korrigiert. Die Rückstrahlung von der Abbildung des Zeichens A wird mittels eines Photo- elektronenvervielfachers erfasst.
Das Ausgangssignal des Photoelektronenvervielfachers wird mittels eines Verstärkers verstärkt und an einen Modulator zum Gewinnen des Binärcodes übertragen. Dabei wird jede Zeile beispielsweise in 25 Felder geteilt. Unabhängig von der Grösse des zu erkennenden Zeichens (Aa) wird also das Zeichen mit 25 Zeilen geschnitten und die Aussenfläche des Zeichens auf 625 Felder aufgeteilt sein. Dies ist in den Fig. 3 und 4 anschaulich gezeigt, wo die Abbildungen der Zeichen B und Y als beschattete und beleuchtete Punkte auf dem nach dem Modulator eingeschalteten Kontroll-Oszillographenschirm gezeigt sind.
Bei vielen Schriften, einschliesslich der russischen, lateinischen usw. tibursteigen Abweichungen der Höhenlage beim Aufzeichnen horizontaler Verbindungslinien nicht 5u der Zeichenhöhe ; mittlere vertikale Linien, falls vorhanden, verlaufen meist genau oder sehr annähernd in der Symmetrieachse des Zeichens. Hiedurch wird die Wahl der Breite der Zonen massgeblich beeinflusst. Aus diesen Gründen empfiehlt sich der folgende Zonenaufbau, der das Gewinnen der vollständigen Information bei eventuellen Abweichungen der vertikalen und horizontalen Verbindungslinien von deren vorgeschriebenen Lage gestattet. Von den drei Horizontalzonen umfasst die erste 5, die zweite 15 und die dritte wieder 5 Zeilen.
In der ersten Vertikalzone sind 10, in der zweiten 5 und in der dritten leu Spalten zusammen-
EMI4.2
<Desc/Clms Page number 5>
gesendet, die das logische Addieren der Coden der einzelnen Zonen ausführt.
Auf diese Weise ergeben sich nach dem logischen Addieren von Codes der Spalten und Zeilen in
EMI5.1
EMI5.2
<tb>
<tb>
Zonen <SEP> folgende <SEP> sechs <SEP> Codes. <SEP> Für <SEP> die <SEP> Horizontalzonen <SEP> H'H,. <SEP> HH <SEP> : <SEP> 00000 <SEP> 00000 <SEP> HIII <SEP> 00000 <SEP> 00000
<tb> H1 <SEP> : <SEP> 000II <SEP> IIIII <SEP> IIIII <SEP> IIIII <SEP> II000
<tb> H2 <SEP> : <SEP> IIII0 <SEP> 00000 <SEP> 00000 <SEP> 00000 <SEP> 0IIII
<tb> v <SEP> : <SEP> 00000 <SEP> oiIi <SEP> 11111 <SEP> InI <SEP> i <SEP> nin <SEP>
<tb> v <SEP> : <SEP> IIII <SEP> 1 <SEP> I00 <SEP> 01110 <SEP> 00000 <SEP> 00000 <SEP>
<tb> Vs <SEP> : <SEP> 00000 <SEP> 0IIII <SEP> IIIII <SEP> IIIII <SEP> IIIII
<tb>
Diegewonnenenfünfundzwanzigstelligen Coden werden in die fünfstelligen reduzierten Codezahlen nach der oben angegebenen Regel umgewandelt. Diese reduzierten Codezahlen lauten :
H : 00I00, H2 : 0III0, H3 : I000I, V1 : 0IIII, V2 : moo, V : 0III1.
Die gewonnenen fünfstelligen Coden, in einer Zeile hintereinander angeordnet, ergeben die dreissigstellige Kenncodezahl : 00100, OHI0, 10001, 01111, m00, Omi.
Aus dem angeführten Beispiel ist zu ersehen, dass für das Erkennen des vorliegenden Zeichens A oder eines beliebigen andern, die Breite bzw. Dicke der Schrift, Brüche in einem Buchstaben, Unreinheiten im Druck usw, keine Bedeutung haben, falls diese Abweichungen nicht über die Grenzen der gewählten Zone hinausgehen, da sie nach den Umwandlungen das endgültige Ergebnis nicht beeinflussen.
Zwecks Gewinnung eindeutiger Kenncodezahlen für die Zeichen, die verschiedene Gestalt (Aa) haben, sind die entsprechenden erkennenden Zellen im Speicher der Rechenanlage auf einen gemeinsamen Ausgang angeschlossen, an welchen die Vorrichtung angeschlossen wird, welche die Kenncodezahl herstellt.
Wie zu ersehen ist, ermöglicht das erfindungsgemässe Verfahren die Herstellung einer Erkennungseinrichtung nach dem System des Selbstunterrichtes und kann gegebenenfalls in verschiedenartigen Spezialausführungen angewendet werden.
PATENTANSPRÜCHE :
1. Verfahren zum Erkennen von Schriftzeichen, z. B. Druckbuchstaben, bei welchem die von dem zu erkennenden Zeichen bewirkte Überschattung von Feldern eines zweidimensionalen Rasters zur Gewinnung einer Information ausgenutzt wird, dadurch gekennzeichnet, dass jedem dieser Schriftzeichen ein dieses überdeckendes Raster mit einer Anzahl von in Z Zeilen und S Spalten angeordneten Rasterfeldern zugeordnet wird, die Zeilen ineineAnzahlhHorizontalzonenH,H ... Hh mit h, h... hh Spalten, die Spalten in eine Anzahl v Vertikalzonen V1, V2...Vv mit v1,v2...vV Zeilen aufgeteilt werden, bei den Horizontalzonen jeder Spalte und bei den Vertikalzonen jeder Zeile, je nachdem ob diese Spalte bzw.
Zeile wenigstens ein in vorgegebenem Ausmass von dem Schriftzeichen überschattetes oder kein solches Rasterfeld enthält, das Zeichen 1 oder 0 zugeordnet wird und hiedurch h S-stellige Horizontalbinärcodezahlen und v Z-stellige Vertikalbinärcodezahlen gebildet werden, die HorizontalcodezahlenineineAnzahl, s, und die Vertikaleodezahlen in eine Anzahl z,s-,s-... ss-stellige bzw. ,z-,...z -stellige Gruppen unterteilt werden, und hiebei die Stellenzahl s, s... s 1 bzw. z1,z2...zZ-1 der mittleren Gruppen ungeradzählig gewählt wird, jeder der mittleren Gruppen das Zeichen 1 oder 0 zugeordnet wird, wenn dieses Zeichen überwiegend vertreten ist, der ersten bzw. der letzten Gruppe der Horizontal- und der Vertikalcodezahlen jedoch jenes Zeichen zugeordnet wird, das überwiegend in einer Untergruppe am Anfang der ersten bzw.
am Ende der letzten Gruppe auftritt, z. B. das erste bzw. letzte Zeichen einer Horizontal- oder einer Vertikalcodezahl, und die auf diese Weise ermittelten reduzierten, s-bzw. z-stelligen Codezahlen für jedes Schriftzeichen einer Schriftklasse in einer vorbestimmten Reihenfolge zu einer (hs + vz)-stelligen Kenncodezahl für dieses Schriftzeichen in einer Zeile aneinandergereiht werden.