DE1549893A1 - Verfahren und Anordnung zur elektronischen Klassierung von Bildvorlagen - Google Patents

Verfahren und Anordnung zur elektronischen Klassierung von Bildvorlagen

Info

Publication number
DE1549893A1
DE1549893A1 DE19671549893 DE1549893A DE1549893A1 DE 1549893 A1 DE1549893 A1 DE 1549893A1 DE 19671549893 DE19671549893 DE 19671549893 DE 1549893 A DE1549893 A DE 1549893A DE 1549893 A1 DE1549893 A1 DE 1549893A1
Authority
DE
Germany
Prior art keywords
image
class
components
signals
memory
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
DE19671549893
Other languages
English (en)
Inventor
Lasalle Michel Marie Joseph
Jourdan Gerard Charles Maurice
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alcatel Lucent SAS
Original Assignee
Alcatel SA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alcatel SA filed Critical Alcatel SA
Publication of DE1549893A1 publication Critical patent/DE1549893A1/de
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/74Image or video pattern matching; Proximity measures in feature spaces
    • G06V10/75Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries
    • G06V10/751Comparing pixel values or logical combinations thereof, or feature values having positional relevance, e.g. template matching
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/19Recognition using electronic means
    • G06V30/192Recognition using electronic means using simultaneous comparisons or correlations of the image signals with a plurality of references
    • G06V30/194References adjustable by an adaptive method, e.g. learning

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Databases & Information Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Computing Systems (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Image Analysis (AREA)

Description

Beschreibung zum Patentgesuch
der Firma Societe Anonyme dite: SOGIETE ALSAGIEINE DE CONSTEUGTIOUS ATOMIQUES DE TELECÜMMUNIGATIONS ET D'ELECTHHIQUE "ALCATEL", 32, rue de Lisbonne, Paris/Frankreich
betreffend:
"Verfahren und Anordnung zur elektronischen Klassierung von Bildvorlagen"
Die Erfindung betrifft ein Verfahren zur elektronischen Klassierung von Bildvorlagen sowie eine Anordnung zur Durchführung des Verfahrens.
Man kennt Maschinen zur Klassierung von beleuchteten Bildvorlagen. Bei einer Bauart dieser Maschinen teilt man die Bildfläche in eine bestimmte Anzahl von Bildelementen und leitet analoge Kennsignale proportional der Beleuchtungsstärke der betreffenden Bildelemente ab. Man leitet bspw. die von jedem Bildelement ausgestrahlte oder reflektierte Lichtintensität auf eine fotoelektrische Nachweiseinrichtung, die einen elektrischen Strom erzeugt.
109822/ U22
Zur Zuordnung der Bildvorlage in eine Klasse benutzt man eine bestimmte Anzahl dieser Kennsignale oder eine bestimmte Anzahl von Kombinationen (bspw. linearen Kombinationen)zwischen mehreren' Kennsignalen. Die dadurch erhaltenen Kennsignale lasser, sich als Komponenten der zu klassierenden Bildvorlage bezeichnen, so daß man jeder Bildvorlage einen Vektor zuordnen kann, dessen η Komponenten durch die η Komponenten der Bildvorlage ausgedrückt werden.
Man hat versucht, einen für jede Bildvorlage repräsentativen Vektor festzulegen, der gegenüber bestimmten geometrischen Transformationen invariant ist, bspw. Translationen,.Drehungen, Gleichförmigkeiten und Ähnlichkeiten. Ein derartiges Verfahren kann bspw. darin bestehen, die zu untersuchende Bildvorlage durch eine Fouriertransformation (Fraunhofer1sehes Beugungsbild) darzustellen oder durch gegenüber einer Verschiebung der Vorlage invariante Autokorrelationsfunktionen; die ouche nach Invarianten gegenüber anderen Transformationen führt zu sehr '' komplizierten Berechnungen über die Maßverhältnisse (z.B. Hu1sehe Methode).
Jede Klasse ist durch eine gleiche Anzahl von Kennsignalen der gleichen Art wie die vorgenannten gekennzeichnet. Diese Bezugskennsignale der Klassen kann man ausgehend von einem Urbild jeder Klasse oder einer Gruppe von einander mehr oder weniger unähnlichen Urbildern erhalten, die unzweideutig der Klasse zugeordnet sind; in den umfangreicheren Maschinen mit Selbstausrichtung nutzt man die Einwirkung der Maschine selbst auf die Bildgruppe der Klassen aus. Die so erhaltenen Bezugskennsignale stellen Gewichte der Klassen dar, in Abhängigkeit von denen man einem solchen Kennsignal eine größere
109822/1422 _ 5 _ BAD original
_ 3 —
oder kleinere Wertigkeit gegenüber den anderen zuordnet? die Gesamtheit der Gewichte bildet das Profil der Klasse.
Die Feststellung der Zugehörigkeit einer Bildvorlage zu einer bestimmten Klasse ergibt sich beim Vergleich der jeweiligen Komponenten der Bildvorlage mit den Gewichten der Klassen und durch Zuordnung der Bildvorlage zu derjenigen Klasse, der die Bildvorlage im Rahmen dieses Vergleichs am nächsten kommt.
Ein vergleichsweise einfaches Verfahren besteht in der schrittweisen Multiplikation der Komponenten und der Gewichte gleicher Dimension und in der Summierung der so erhaltenen Teilprodukte. Man vergleicht die mit den Gewichten der verschiedenen Klassen erhaltenen Ergebnisse und ordnet die Bildvorlage in diejenige Klasse ein, für die man eine maximale Gesamtsumme erhält.
vVenn auch die Grundlagen für die Funktionsweise derartiger Maschinen klar sind und die geometrischen Axiomeji, die die Anwendung erleichtern, bereits ausgearbeitet und beschrieben sind, bringen die Auswahl der Bildkomponenten und die Festlegung der Bezugsgewichte der Klasse große Schwierigkeiten mit sich, da die Klassen im Sinne der genannten Theorien nicht eindeutig gegeneinander abgegrenzt sind.
Wenn bspw. die zu klassierenden Bildvorlagen, die zwar für die menschliche Betrachtung und Wahrnehmung deutlich voneinander unterscheidbar sind, innerhalb der Klassen voneinander merklich abweichen können (bspw. bereitet bei der.Erkennung von Schriften und beschriebenen Buchstaben die Stellung und Ausrichtung derselben der menschlichen Wahrnehmung keine Schwierigkeiten) , muß man in der Maschine eine große Anzahl von Komponen-
109822/1 -i* 2 7 _ > '
BAD ORK3INAL4 -
ten "bereithalten, bei deren Auswahl es in die Irre führen würde, wenn man sich von an die sinnliche Wahrnehmung der Bildvorlagen anknüpfenden Gesichtspunkten leiten lassen würde. Man kommt dazu, wichtige Komponenten auf einer gewissen Zufallsbasis auszuwählen. Folglich wird man zu sehr umfangreichen und wenig wirtschaftlichen Maschinen kommen.
Eine Maschine wird für die Behandlung einer großen Anzahl von Komponenten um/so umfangreicher sein müssen, wenn man eine Klassierung sehr unterschiedlicher Bildvorlagen durchführen will. Man will bspw. soviel Schriftzeichen, soviel Maschinenbilder, Bilder von Flugzeugen unterschiden, und man kann eine große Anzahl anderer Anwendungen nennen, Ortung, Sortierung, Stellwerktechnik usw. in verschiedenen technischen Sachgebieten,
Das Klassierungsverfahren von Bildvorlagen und die Maschine, die zur Durchführung dieses Verfahrens bestimmt ist, ermöglichen eine besonders eindeutige Zuordnung der Vorlagen unter Zulassung von Transformationen und vergleichsweise beträchtlichen Verschiebungen. Außerdem kann die dargestellte Maschine mit jeder elektronischen Rechenmaschine verbunden werden, so daß die Leseergebnisse unmittelbar weiterverarbeitet werden können. Auch die Vorbereitung^er Maschine zur Durchführung der Leseaufgabe können mit Hilfe einer elektronischen Rechenmaschine leicht gesteuert werden.
Die Erfindung ermöglicht somit die Klassierung und Erkennung von Bildvorlagen aus sehr unterschiedlichen Bereichen, sowie die Erkennung von Fotografien, von Bildvorlagen oder von im Flug befindlichen Flugkörperansichten sowie anderen Vorlagen, handgeschriebenen oder gedruckten Schriftzeichen und Ziffern,
109822/U22
"M) OFtiQiNAL
1S49893
Gruppen von Schriftzeichen und Ziffern. Hinsichtlich der Vereinfachung bringt die Erfindung einen überraschenden Fortschritt in der Lesetechnik und für die Erkennung von Bildvorlagen.
Das Verfahren nach der Erfindung ist dadurch gekennzeichnet, daß man zunächst zur Bestimmung der Bildkomponenten jede Bildvorlage in eine große Anzahl von jeweils nach der Belichtung einer lichtempfindlichen Zelle verarbeiteten Bildelementen aufteilt, die anfanrieh zufällig miteinander kombiniert werden und darauf nach Prüfung des Ergebnisses gegebenenfalls nach einem Programm neu geordnet werden, wobei die Kombination der Bildelemente jeweils innerhalb kleiner Gruppen aus paarweise derart angeordneten Zellen erfolgt, daß die Hälfte der Zellen bei Belichtung ein positives elektrisches Signal abgibt, daß diese Signale zur Bildung einer Bildkomponente des Werts +1, -1 oder 0 kombiniert werden in Abhängigkeit davon, ob der Signalwert eine vorgegebene positive Schwelle überschreitet oder sich zwischen diesen beiden Schwellenwerten befindet, daß die Bildkomponentenreihe (Profil] nacheinander mit zuvor durch Auswertung' einer Anzahl von Urbildern jeder Klasse gewonnenen Klassierungsprofilen, deren Komponenten summiert, sodann erforderlichenfalls normiert und komponentenweise in einen Speicher unter der Adresse der betreffenden Klasse eingeschrieben sind, daß der Vergleich nacheinander für jede Klasse unter Produktbildung gleichdimensionierter Bild- und Klassierungskomponenten erfolgt, daß sodann die Teilprodukte aufsummiert werden und schließlich die Gesamtsummen miteinander verglichen werden, wobei die Klasse mit der höchsten Gesamtsumme die Klassen-
109822/ U2 2
Zugehörigkeit der Bildvorlage festlegt, wenn der Summenwert
/als einen bestimmten Schwellenwert übersteigt, und die Bildvorlage keiner der in Betracht kommenden Klassen zugehörig eingestuft wird, wenn die Gesamtsumme unterhalb des genannten Schwellenwerts liegt.
Zum besseren Verständnis des erfindungsgemäßen Verfahrens dient die folgende Einzelbeschreibung.
Die zu klassierende Bildvorlage wird mittels einer Leseanordnung gelesen, die hier nur zusammenfassend erläutert isto Diese Leseanordnung umfaßt ein Beleuchtungslichtbündel innerhalb von Lichtleitern aus Glasfasern oder Glasfaserlitzen, das mit einem Betrachtungslichtbündel zusammenwirkt, welches ebenfalls in Lichtleitern geführt ist, womit man in unmittelbarer Nähe der Bildebene einen festen Block von Glasfasern oder Glasfaserlitzen senkrecht zur Bildebene erhält. Die Beleuchtungs lichtleiter konvergieren vonseiten der Lichtquelle gegen den genannten Block, wogegen die Betrachtungslichtleiter von diesem Block aus gegen die lichtempfindlichen Zellen divergieren, die jeweils an eine Glasfaser oder eine Glasfaserlitze angeschlossen sind und deren Anzahl der gewünschten Bildauflösung für die Erkennung entspricht. Die Bildvorlage wird somit in so viele Bildelemente zerlegt als Glasfaser-Empfangslitzen bzw» lichtempfindliche Zellen jeweils am Ende der genannten Litzen vorhanden sind, womit die Anzahl der Bildelemente im allgemeinen bei einer Maschine für normale Verwendung sehr groß ist und eini ge Hundert beträgt. Die bei der vorliegenden Maschine benutzten lichtempfindlichen Zellen sind Fotodioden, die in kleine Gruppen aus je einer Anzahl paarig angeordneter Zellen bestehen; jede Gruppe enthält bspw. zwei bis zwölf Zellen. Man kann
109822/14 2 2 ?
unter diesen Umständen eine außerordentlich große Anzahl von Kombinationen erhalten, die /umso größer ist, je mehr Zejillen jede kleine Gruppe enthält. Unter den möglichen Kombinationen wird zunächst zufällig eine Anzahl gleich der gewünschten Anzahl der Bildkomponenten ausgewählt, die in manchen Fällen einige Hundert beträgt und bis zu einigen Tausend in anderen lallen betragen kann, entsprechend der jeweiligen Art der zu klassierenden Bildern. In jeder kleinen Fotodiodengruppe sind dieselben so geschaltet, daß jeweils die Hälfte bei Belichtung ein positives elektrisches Signal abgibt, während die andere Hälfte bei Belichtung ein negatives elektrisches Signal abgibt. Man erhält so die der betreffenden Zellengruppe entsprechende Komponente, die den Wert +1, -1 oder 0 erhält, in Abhängigkeit davon, ob die Signalkombination der betreffenden Schwellengruppe einen positiven Schwellenwert überschreitet, einen negativen Schwellenwert überschreitet oder sich zwischen den beiden Schwellenwerten bewegt. Man erhält so schließlich die gewünschte Anzahl von Komponenten der untersuchten Bildvorlage, die jeweils den Wert +1, -1 oder 0 haben«
Zunächst ist ein Lernvorgang für die Maschine erfordere lieh. Aus einer bestimmten Klasse legt man in die Maschine eine gewisse Anzahl von Probestücken dieser Klasse. Die Untersuchung jedes Probestücks gibt ein Komponentenprofil, das komponentenweise im Speicher unter der Adresse der betrachteten Klasse eingeschrieben wird. Man erhält so im Speicher unter der Adresse dieser Klasse ein charakteristisches Profil dieser Klasse; man kann dieses Profil als Vektordarstellung in einem Raum mit soviel Dimensionen, als es Komponenten gibt, auffassen. Derselbe Vorgang wird für alle zu erfassenden Klassen mit der
1 0 9 8 2 2 / U 2 2 - β - ■
1649893
gleichen Anzahl Probestücke wiederholt. Wenn die verschiedenen Profile der Klassen bestimmt sind, schreitet man zu zwei Operationen, die für das erfindungsgemäße Verfahren besonders kennzeichnend sind.
Man vergleicht zuerst die Komponenten der gleichen Dimension für alle Klassen. Jeweils wenn man Komponenten auffindet, die in allen Klassen gleich sind, scheidet man dieselben aus und verringert so die Anzahl der notwendigen Komponenten; oder besser ersetzt man diese Komponenten von Fall zu Fall durch Zellengruppen, die unter Aufhebung der Zufallsauswahl in Abhängigkeit von der bereits erhaltenen Information bestimmt sind oder durch zufällig ausgewählte Zellengruppen.
Ein zweiter wichtiger Arbeitsschritt besteht in der Überprüfung, ob die Formen der Vektoren, die das Profil jeder Klasse festlegen, gleich oder im wesentlichen ähnlich sind. Wenn eine Klasse vorhanden ist, deren Vektorform oder Vektorprofil kleiner ist als bei den andern, vollzieht man in dieser Klasse neue Untersuchungen der Probestücke und zwar solange, bis die Form des abgeänderten Vektors denselben Wert wie bei den andern repräsentativen Vektoren hat. Wenn mehrere Klassen vorhanden sind, wo die Formwerte der repräsentativen Vektoren sich deutlich von den Formwerten der anderen Vektoren unterscheiden, bewichtet man die Profile verschiedener Klassen gesondert, indem man alle Komponenten jedes Vektors mit einem entsprechenden Skalar multipliziert.
Diese ziemlich zeitaufwendigen Arbeitsgänge werden, wie man erkennt, nur einmal für eine bestimmte Maschine und für jedes Anwendungsgebiet durchgeführt. Die für diese Arbeitsvorgänge erforderliche Zeit ist durch die Einfachheit des
109822/U22
1S49893
Aufbaus und der Anwendung der Maschine bei weitem aufgewogen. Schließlich zeigt die Erfahrung, die man aus der Arbeit an einer derartigen Maschine gewonnen hat, daß das beschriebene Bewichtungsverfahren nur selten ausgeführt wird.
Wenn die Kombinationen der zunächst zufällig ausgewählten Zellengruppe umgeordnet worden sind, wie dies oben beschrieben ist, und wenn man sichergestellt hat, daß die repräsentativen Vektoren jeder Klasse den gleichen Formwert haben, kann man die Maschine zum Lesen von Bildvorlagen im Rahmen der betreffenden Klassen einsetzen. Die au klassierende Bildvorlage wird in die Maschine eingelegt, die die Komponenten festlegt und damit das Vektorprofil der betreffenden Bildvorlage und die die Bildvorlage mit verschiedenen Klassen vergleicht. Dieser Vergleich erfolgt durch schrittweise Bildung des Skalarprodukts. des Vorlagenvektors mit dem Vektorprofil jeder Klasse. Man erreicht so eine Multiplikation der Komponenten der Bildvorlage mit den entsprechenden Komponenten des Vektorprofils jeder Klasseο Man 'bildet die Summe der Teilprodukte für jede Klasse und vergleicht die erhaltenen Gesamtwerte. Der größte Summenwert entspricht dem Vektor derjenigen Klasse, die dem repräsentativen Vektor der Bildvorlage am nächsten kommt. Wenn diese Summe einen vorgegebenen Schwellenwert entsprechend der Erkennungsschwelle überschreitet, wird die Bildvorlage in die betreffende Klasse eingeordnet; andernfalls gehört die Bildvorlage nicht zu den ausgewählten Klassen.
Die Durchführung des oben beschriebenen.Verfahrens erfordert die Beschreibung und Erläuterung einer Maschine gemäß dem in Figur 1 gezeigten Blockbild.
109822/1422
- 10 -
Diese Maschine umfaßt folgende Baugruppen: ein Lesegerät 1, wie es oben zusammenfassend erläutert ist; einen Speicher 6, vorzugsweise einen Trommelspeicher zur Einschreibung digitaler Informationen und von Adreßplätzen, zu dem außerdem Lese- und Schreibverstärker sowie ein Rechenwerk gehören, das die Einschreibung der jeweiligen Zahlenwerte in die betreffenden Speicherplätze zur Darstellung der Bildkomponenten ermöglicht; eine Austauschstufe 5 zwischen dem Speicher 6 und dem Lesegerät 1, die zur Gruppierung der durch die Adressen bestimmten Zellen dj.ent, einen Schwellenwertwähler 2 für die Fotodioden, der die von den Fotodioden abgegebenen Informationswerte kombiniert und aus einer Additionsstufe, einem Differentialverstärker, zwei gleichen Spannungsquellen, einem Vorwärts-Rückwärts-Zähler besteht und die Wertstufen -1,0, +1 entsprechend den Informationswerten des Lesegerätes ableitet und diese Wertzahlen in Digitalform zu dem Speicher schickt; ein Multiplizierwerk, das mit dem Schwellenwertwähler 2 verbunden ist und einerseits die Wertstufen +1, 0 oder -1 entsprechend den Adreßplätzen sowie andererseits die in den zugehörigen Speicherplätzen des Speichers eingeschriebenen Vektorkomponenten aufnimmt; einen Auswerterechner 4 mit einem Sammler und einem Vergleicherteil, sowie schließlich Betriebsschaltstufen, nämlich ein Steuerpult, Anzeige- und Druckwerke.
Die nach dem oben beschriebenen Verfahren arbeitende und in der dargestellten Weise aufgebaute Maschine arbeitet nach den durchgeführten Versuchen voll befriedigend. Die Störsignale, die auftreten können, beruhen auf zwc·-:5. Ursachen:
Die erste Quelle von Störsignalen rührt von der Streuung
der Empfindlichkeit der ,Fotodioden bei der großen Anzahl der
109822/U22 11
benutzen Zellen innerhalb einer solchen Maschine her· Diese Störgeräusche können jedoch praktisch völlig ausgeschieden werden, indem man zuvor Fotodioden auswählt, sodann durch Ausscheidung von Gruppierungen, die innerhalb aller Profile gleiche Komponenten liefern, wie dies bereits bei der Erläuterung des Lernvorgangs für die Maschine beschrieben ist.
Die zweite Quelle von Störgeräuschen statistischer Art rührt von der Differenz, die man zwischen dem positiven Schwellenwert und dem negativen Schwellenwert bei der Einstellung der Maschine eingestellt hat, her. Die betreffenden Störgeräusche können beträchtlich verringert und praktisch ausgeschaltet werden, wenn man einen geeigneten Schwellenwert festlegt.
Im folgenden wird eine Ausführungsform der erfindungsgemäßen Maschine im Rahmen einer Einzelbeschreibung erläutert0
In Figur 2 sind folgende Baugruppen dargestellt: ein Lesegerät 7, Fotodioden 8, die an das Lesegerät angeschlossen sind, Austauschstufen 9a, °/b und 9c, zur Ordnung der Informationssignale von den Fotodioden 8, ein Hauptspeicher 10, der an die Austauschstufen 9 angekoppelt ist, ein Differentialverstärker 11, der jeweils die von den Fotodioden 8 herkommenden Informationssignale verstärkt, ein Schwellenwertwähler 12, der die Informationssignalgruppen in drei Wertigkeitsstufen +1, 0, -1 einordnet, eine Austauschstufe 13 verbindet den Ausgang des Schwellenwertwählers 12 mit dem Eingang eines achtstufigen Vor« wärts-Kückwärts-Zählers 14; eine Leseverstärkeranordnung 15 ist eingangsseitig an den Speicher 10 und ausgangsseitig an den Vorwärts-Rückwärts-Zähler 14 über einen bei der Bilderkennung eingeschalteten Klassenwähler 16 sowie einen Komponentenwähler 17 angeschlossen; eine Austauschstufe 18 verbindet die Ausgänge
109822/1422 ^
- 12BAD OPJGIMAL
des Vorwärts-Rückwärts-Zählers 14 mit einem acht stuf igen Speicher 19; ein Hilfsschreibverstärker 20 ist eingangsseitig an den Speicher 19 und ausgangsseitig an Hilfsspuren des Speichers 10 angeschlossen; ein Hilfsleseverstärker 21 speist seine Ausgangssignale in den Speicher 19 über eine tJbertragungsstufe 22 ein. Die in dem Speicher 19 enthaltenen Informationen werden sodann mittels des Schreibverstärkers 23 und des Klassenwählers 24 für den Lernvorgang in den Speicher 10 eingeschrieben. Ein Produktwerk 25 bestimmt das Vorzeichen des Produkts aus dem Signal am Ausgang des Schwellenwertwählers 12 und der Komponente des Vektorprofils in dem Vorwärts-Rückwärts-Zähler 14. Austauschstufen 26 und 27 sorgen für die Übertragung der Komponente des Vektorprofils oder von deren Komplementärwert vom Ausgang des Vorwärts-Rückwärts-Zählers 14 in einen 18-stelligen Sammler 28; eine Austauschstufe 29 überträgt den Inhalt des Sammlers 28 in einen 18-stelligen Speicher 30; eine Austauschstufe 31 dient zum Durchgang des Inhalts des Speichers 30 in einen andern 18-stelligen Speicher 32; ein Anzeigegerät 33 bringt den Inhalt des Speichers 32 zur Anzeige; eine Austauschstufe 34- leitet den Inhalt des Speichers 32 in den Sammler 28; eine Anzeigestufe dient zur BinärÜarstellung der als Schwellenwert für den Vergleich benut2ten Zahl, eine Austauschstufe 36 überträgt die Elemente der Anzeigestufe 35 in den Sammler 38, ein Taktimpulsgenerator 37 empfängt Steuerbefehle von dem Speicher 10 und steuert seinerseits einen Klassenanzeiger 38. Eine Austauschstufe 39 überträgt den Inhalt des Klassenanzeigers in einen dreistelligen Klassenspeicher 40. Der Inhalt des Speichers 40 wird in einer. Dekodierungs schaltung 41 entschlüsselt und in
- 13 - ' 109822/U22
1543893
einer Anzeigestufe 42 angezeigt. Ein Steuerpult 43 ist mit einer Schaltung 44 für den automatischen Lernvorgang und einer Leseautomatik 45 verbunden. Alle in dem Schaltblock 46 enthaltenen Baugruppen bilden eine Koppelautomatik für das Banddruck-Lesegerät 48.
In der Einstellung für den Lernvorgang werden die Probestücke einer Klasse in das Lesegerät 7 gelegt. Die Fotodioden 6 sind gruppenweise nach einem Programm zusammengeschaltet, das durch die in dem Speicher 10 festgehaltenen Adressen der Fotodioden vorgegeben ist, die Informationssignale über dieses Programm werden über die Austauschstufen 9a, 9b und 9c übertragen. Der Differentialverstärker 11 verstärkt nacheinander die von 1000 Gruppen zu je 6 Fotodioden abgeleiteten Signale; in jeder Gruppe sind drei Dioden an einen Eingang und die drei anderen Dioden an den anderen Eingang des Differentialverstärkers 11 angeschaltet, der damit gleichzeitig die algebraische Summe der Ströme der sechs Dioden einer jeden Gruppe bildet. Das Ergebnis wird an einem Ladewiderstand in Form einer Spannung abgenommen, die um einen festen Mittelwert schwankt. In dem Schwellenwertwähler 12 stellt man zwei Schwellenspannungen ein. Wenn die Ausgangsspannung des Differentialverstärkers unterhalb der niedersten Schwellenspannung liegt, gibt der Schwellenwertwähler das Signal -1 ab. Wenn die Ausgangsspannung zwischen den beiden eingestellten Spannungsschwellen liegt, erhält man das Signal 0. Wenn schließlich die Ausgangsspannung oberhalb des oberen Schwellenwertes liegt, ergibt sich der Signalwert +1:.·-. ,
- 14 10 9822/1422
Im Lernbetrieb laufen die Arbeitsvorgänge in folgender Weise
ab: für ein zu einer bestimmten Klasse gehöriges Probestück
verarbeitet man nacheinander jeweils 1000 Gruppen durch
Auslesen einer Komponente des Vektorprofils von dem Speicher
mit Hilfe des Leseverstärkers 15, durch Einschreiben dieser
Komponente in den Vorwärts-Rückwärts-Zähler 14 über den Klassenwähler 16 und den Komponentenwähler 17; durch Lesen der dieser Komponente entsprechenden Gruppenadresse zum Abrufen der betreffenden Fotodioden; durch Ermittlung der Wertigkeit +1, 0
oder -1 der betreffenden Gruppe in dem Schwellenwertwähler 12, damit der betreffende Wert der in dem Vorwärts-Rückwärts-Zähler enthaltenen Komponente zugefügt werden kann; durch Übertragung viä in dem Vorwärts-Rückwärts-Zähler erhaltenen Ergebnisses
in den achtstelligen Hilfsspeicher 19; durch Einschreiben des
in dem Speicher 19 gespeicherten Wertes in Hilfsspuren des
Hauptspeichers 10, wobei dieser Vorgang sich mit dem Lesen und Eingeben des Koeffizienten der jeweils folgenden Gruppe in den Vorwärts-Rückwärts-Zähler 14 über-lappt. Sobald diese Arbeitsfolge für die 1000 Gruppen abgeschlossen ist, schreibt man die neuen Koeffizienten wieder in die ursprüngliche Speicherstelle
/vor
ein, wofür 1000-mal die folgenden Arbeitsgänge erforderlich
sind: Ablesen eines Koeffizienten auf den Hilfsspuren des
Hauptspeichers 10 mittels des Leseverstärkers 21; Einschreiben dieses Koeffizienten in den Hilfsspeicher 19 mittels der Übertragungsschaltung 22; Einschreiben dieses Koeffizienten in
die ursprüngliche Speicherstelle mit Hilfe des SchreibVerstärkers 2$ und des Wählers 24.
- 15 109822/U22
1649893
Diese beiden Arbeitsfolgen werden so oft wiederholt, als man Probestücke in einer Klasse vorgibt. Sobald alle Probestücke einer Klasse abgefragt sind, ist der Lernvorgäng beendet; man wiederholt diese Arbeitsfolge für alle sechs Klassen, die mit einem Prototyp der erfindungsgemäßen Maschine erkannt werden sollen. Die Folge der verschiedenen Lernvorgänge wird durch die Lernautomatik -44 gesteuert.
Der Bandlocher und -leser ermöglicht mittels der Koppelautomatik 46 einen Zugang zum Hauptspeicher und zur Änderung oder Entnahme der Komponenten unter der Steuerung einer Bedienungsperson oder eines angeschlossenen elektronischen Rechners. Man kann bspw. leicht einige kleine Zellengruppen abwandeln, wodurch man zufällig oder in Abhängigkeit von der bereits erhaltenen Information Bildkomponenten herausstellt und auswählt.
Beim Erkennungsbetrieb geht man in gleicher Weise wie beim Lernvorgang hinsichtlich der Gruppierung der Fotodioden vor, und der Schwellenwertwähler 12 liefert ebenfalls die jeder Gruppe entsprechenden Wertigkeiten -1, 0 oder +1. Man führt sodann für die 1000 einer- Klasse entsprechenden Gruppen jeweils nacheinander die folgenden Operationen durch: Lesen einer Komponente aus dem Hauptspeicher 10 mit Hilfe der Leseverstärker 15 und Übertragung in den als Speicher dienenden Vorwärts-Hückwärts-Zahler 14; Lesen der Adressen der dieser Komponente entsprechenden Gruppe zum Abruf der Signale der Fotodioden; Bildung des Ausgangssignals des Schwellenwertwählers 12 mit Hilfe des Rechenwerks 25, das die Übertragsvorgänge zum Einschreiben der Komponente in den Sammler 28 bestimmt (der Rechenvorgang entspricht der algebraischen Produktbildung der Komponente am Ausgang des Schwellenwertwählers 12);
109822/1422
- 16 -
■ - 16 - ■
1649893
Einschreiben des Ergebnisses in den Sammler 28, der nacheinander die 1000 Werte aufsummiert und die Endsumme speichert; Übertragung dieser Summe in den Speicher 50, wenn sie positiv ist; nach Beendigung dieses ersten Unterprogramms, das für jede Klasse gleich ist (die Auswahl der Komponenten je Klasse erfolgt automatisch mit Hilfe des Klassenzählers 38), vergleicht man die sechs Summen untereinander, indem man nacheinander die sechs Klassen in folgender Weise behandelt: Vergleich zweier positiver, nacheinander erhaltener Summen; Einschreiben des größeren Wertes in den Speicher 32; parallele Beaufschlagung des Speichers 40, der nach jedem Vergleich die Klassennummer des höchsten Summenwertes enthält; Vergleich des höchsten Summenwertes mit dem Wert der Schwellenwertstufe 35; Auswertung die- ses Vergleichs, damit in Abhängigkeit davon, ob der Summenwert den Schwellenwert übersteigt oder nicht, auf dem Anzeigegerät 42 eine Anzeige der entsprechenden Klasse oder der Nichterkennung erfolgen kann. Die Operationen dieses zweiten Unterprogramms werden durch den Programmgenerator 47 gesteuert. Die Gesamtheit der Bilderkennungsoperationen wird mittels der Erkennungsautomatik 45 gesteuert»
109822/U22

Claims (2)

  1. Patentansprüche;
    Verfahren zur elektronischen Klassierung von Bildvorlagen, dadurch gekennzeichnet, daß man zunächst zur Bestimmung der Bildkomponenten jede Bildvorlage in eine große Anzahl von jeweils nach der Belichtung einer lichtempfindlichen Zelle verarbeiteten Bildelementen aufteilt, die anfänglich zufällig miteinander kombiniert werden und darauf nach Prüfung des Ergebnisses gegebenenfalls nach einem Programm neu geordnet werden, wobei die Kombination der Bildelemente jeweils innerhalb kleiner Gruppen aus paarweise derart angeordneten Zellen erfolgt, daß die Hälfte der Zellen bei Belichtung ein positives elektrisches Signal und die £weils andere Hälfte ein negatives elektrisches Signal abgibt, daß diese Signale zur Bildung einer Bildkomponente des Werts +1, -1 oder 0 kombiniert werden in Abhängigkeit davon, ob der Signal wert r^ine vorgegebene negative Schwelle überschreitet oder sich zwischen diesen beiden Schwellenwerten befindet, daß die Bildkomponentenreihe (Profil) nacheinander mit zuvor durch Auswertung einer Anzahl von Urbildern jeder Klasse gewonnenen Klassierungsprofilen, deren Komponenten summiert, sodann erforderlichenfalls normiert und komponentenweise in einen Speicher unter der Adresse der betreffenden Klasse
    /verglichen wird
    eingeschrieben sind, daß der Vergleich nacheinander für jede Klasse unter Produktbildung gleichdimensionierter Bild- und Klassierungskomponenten erfolgt, daß sodann die Teilprodukte aufsummiert werden und schließlich die Gesamtsummen miteinander verglichen werden, wobei die Klasse mit der höchstem
    109822/U22 - 18 -
    I649893
    Gesamtsumme die Klassenzugehörigkeit der Bildvorlage festlegt, wenn der Summenwert einen bestimmten Schwellenwert übersteigt, und die Bildvorlage als keiner der in Betracht kommenden Klassen zugehörig eingestuft wird, wenn die Gesamtsumme unterhalb des genannten Schwellenwerts liegt.
  2. 2. Anordnung zur Durchführung des Verfahrens nach Anspruch 1, gekennzeichnet durch folgende Baugruppen: eine optische Leseeinrichtung mit einer Vielzahl, jeweils in kleinen Gruppen angeordneter lichtempfindlicher Zellen, Kombinationsstufen zur Bestimmung der Bildkomponenten aus den Lesesignalen und zur Ableitung positiv-, negativ- oder nullwertiger Signale aus diesen Komponenten, einen Speicher zum Festhalten von diesen durch Urbildlesevorgänge gewonnenen Signale entsprechenden tferten, Torschaltstufen zum Anlegen der Speichersignale an eine Vergleicherschaltung, die die im Laufe eines Lesevorgangs gewonnenen Signale aufnimmt und mit den Speichersignalen vergleicht, und Auswertesehaltstufen für das Vergleichsergebnis„
    109822/U22
    Leerseite
DE19671549893 1966-11-30 1967-11-28 Verfahren und Anordnung zur elektronischen Klassierung von Bildvorlagen Pending DE1549893A1 (de)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
FR85705A FR1523180A (fr) 1966-11-30 1966-11-30 Machines à classer électroniquement des images

Publications (1)

Publication Number Publication Date
DE1549893A1 true DE1549893A1 (de) 1971-05-27

Family

ID=8621814

Family Applications (1)

Application Number Title Priority Date Filing Date
DE19671549893 Pending DE1549893A1 (de) 1966-11-30 1967-11-28 Verfahren und Anordnung zur elektronischen Klassierung von Bildvorlagen

Country Status (7)

Country Link
US (1) US3588821A (de)
BE (1) BE706949A (de)
CH (1) CH466618A (de)
DE (1) DE1549893A1 (de)
FR (1) FR1523180A (de)
GB (1) GB1208126A (de)
NL (1) NL6716248A (de)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE2026033C3 (de) * 1970-05-27 1979-05-03 Matth. Hohner Ag, 7218 Trossingen Rasterverfahren zur Klassifizierung von Schriftzeichen
US3873972A (en) * 1971-11-01 1975-03-25 Theodore H Levine Analytic character recognition system
US3918049A (en) * 1972-12-26 1975-11-04 Ibm Thresholder for analog signals
US5109432A (en) * 1989-12-27 1992-04-28 Fujitsu Limited Character recognition method
US5204914A (en) * 1991-08-30 1993-04-20 Eastman Kodak Company Character recognition method using optimally weighted correlation
DE102015007434A1 (de) 2015-06-15 2016-12-15 Mediabridge Technology GmbH Informationsvorrichtung

Also Published As

Publication number Publication date
CH466618A (fr) 1968-12-15
GB1208126A (en) 1970-10-07
FR1523180A (fr) 1968-05-03
NL6716248A (de) 1968-05-31
US3588821A (en) 1971-06-28
BE706949A (de) 1968-04-01

Similar Documents

Publication Publication Date Title
DE2909153C2 (de) Einrichtung zur digitalen Analyse von Bild- oder Zeichenmustern
DE102018128158A1 (de) Vorrichtung zur inspektion des erscheinungsbilds
EP1056046B1 (de) Verfahren zur Bearbeitung eines Röntgenbildes
DE4211904C2 (de) Automatisches Verfahren zum Erstellen einer Liste unterschiedlicher Arten für eine flüssige Probe
DE19705757A1 (de) Verfahren und Gerät für das Design eines hoch-zuverlässigen Mustererkennungs-Systems
DE2507174A1 (de) Verfahren und vorrichtung zur erzeugung digitaler repraesentationen eines objektes
DE102021201124A1 (de) Trainieren von bildklassifizierernetzen
DE1924253A1 (de) System zum automatischen elektrischen Erkennen von optisch erfassbaren Bildmerkmalen
DE1549893A1 (de) Verfahren und Anordnung zur elektronischen Klassierung von Bildvorlagen
DE3246631C2 (de) Zeichenerkennungsvorrichtung
WO2002023492A2 (de) Verfahren zur klassifizierung von dokumenten
DE202022104461U1 (de) Syntaxgeleitetes Erkennungssystem für mathematische Termini
DE112021004434T5 (de) Bildverarbeitungsvorrichtung, bildverarbeitungsverfahren und -programm
EP3482348A1 (de) Verfahren und einrichtung zur kategorisierung einer bruchfläche eines bauteils
DE102009007588A1 (de) Verfahren und Vorrichtung zum Verifizieren von Dokumenten unter Verwendung einer Wavelet-Transformation
DE2725927C2 (de)
DE2222346A1 (de) Bildpunktklassifizierung bei der Bildanalyse
DE102023107278B3 (de) Verfahren zum Authentifizieren einer auf ihrem Substrat mindestens eine bedruckte Fläche aufweisenden Banknote
DE60007333T2 (de) Trainierbares, anpassungfähiges fokussiertes replikatornetzwerk zur datenanalyse
DE4244708C2 (de) Verfahren und Vorrichtung zum Erstellen einer Artenliste für eine flüssige Probe
DE102021123761A1 (de) Bauteilklassifizierungsvorrichtung, Verfahren zum Klassifizieren von Bauteilen und Verfahren zum Trainieren einer Bauteilklassifizierungsvorrichtung
DE112010005924T5 (de) Verfahren und System zum Weitergeben von Änderungen an einer Master-Einheit zu Duplikaten
DE4136830C2 (de) Datenverarbeitungseinrichtung und Verfahren zur Mustererkennung
DE102004018174B4 (de) Verfahren zur Akquisition von Formen aus Bildern mit Fällen und zum fallbasierten Erkennen von Objekten in digitalen Bildern, Computer-Programm-Produkt und digitales Speichermedium zur Ausführung dieses Verfahrens
WO2022237930A1 (de) Bauteilklassifizierungsvorrichtung, verfahren zum klassifizieren von bauteilen und verfahren zum trainieren einer bauteilklassifizierungsvorrichtung