DE102009013390A1 - Method for automatic classification of physical object i.e. postal item, involves parameterizing classifier for classification of physical objects using parameter values that are computed by global optimization - Google Patents
Method for automatic classification of physical object i.e. postal item, involves parameterizing classifier for classification of physical objects using parameter values that are computed by global optimization Download PDFInfo
- Publication number
- DE102009013390A1 DE102009013390A1 DE102009013390A DE102009013390A DE102009013390A1 DE 102009013390 A1 DE102009013390 A1 DE 102009013390A1 DE 102009013390 A DE102009013390 A DE 102009013390A DE 102009013390 A DE102009013390 A DE 102009013390A DE 102009013390 A1 DE102009013390 A1 DE 102009013390A1
- Authority
- DE
- Germany
- Prior art keywords
- parameter
- classifier
- sensor value
- sample
- parameters
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/26—Techniques for post-processing, e.g. correcting the recognition result
- G06V30/262—Techniques for post-processing, e.g. correcting the recognition result using context analysis, e.g. lexical, syntactic or semantic context
- G06V30/274—Syntactic or semantic context, e.g. balancing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/217—Validation; Performance evaluation; Active pattern learning techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Computational Linguistics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Multimedia (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
Die Erfindung betrifft ein Verfahren und eine Vorrichtung zum Klassifizieren eines physikalischen Objekts, insbesondere zum Lesen einer Zeichenfolge auf einer Postsendung, mittels eines Klassifikators, der zuerst parametriert wird und anschließend eine Menge von Sensorwerten vom Objekt auswertet.The The invention relates to a method and apparatus for classifying a physical object, in particular for reading a string on a mailing, by means of a classifier, first is parameterized and then a lot of sensor values evaluates from the object.
Die Leistung eines solchen Klassifikators hängt oft entscheidend davon ab, welche Werte Parameter des Klassifikators haben. Diese Parameterwerte bleiben während des Klassifizierens unverändert.The Performance of such a classifier often depends critically which values have parameters of the classifier. These Parameter values remain unchanged during classifying.
In
In einer Datenbank („directory retrieval system”) sind gültige Klassifikationsergebnisse abgespeichert, z. B. tatsächlich vorhandene Adressen. Ein digitales Abbild der Postsendung wird ausgewertet. Ein Klassifikator entziffert die Zeichen in diesem Abbild oder liefert das Ergebnis, die Zeichen nicht klassifizieren zu können. Dieser Klassifikator führt nacheinander mehrere Schritte durch, z. B. „image enhancement”, „address block locator”, „segmentation”, „feature extraction”, „character selection” und „confidence evaluation”. Jeder Schritt hängt von mindestens einem Parameter des Klassifikators ab. Der Klassifikator führt mindestens einen Klassifikationslauf (eine Iteration) durch, während dem alle Parameter konstant bleibende Werte haben, also nicht variiert werden. Das Klassifikationsergebnis, welches der Klassifikationslauf liefert, wird einerseits mit den gültigen Klassifikationsergebnissen in der Datenbank verglichen. Andererseits wird ein Vertrauensmaß („confidence level”) mit einer vorgegebenen Schranke verglichen. Falls das Klassifikationsergebnis zu unsicher ist oder nicht mit einem gültigen Ergebnis überein stimmt, so wird mindestens ein Parameterwert verändert, und ein neuer Klassifikationslauf (eine neue Iteration) wird durchgeführt. Diese Iterationen werden wiederholt, bis der Klassifikator ein gültiges Ergebnis liefert oder ein Abbruchkriterium erfüllt ist, z. B. eine vorgegebene maximale Zeitspanne verstrichen ist.In a database ("directory retrieval system") are valid classification results stored, z. B. actually existing addresses. A digital image the mailpiece is evaluated. A classifier deciphers the Characters in this image or returns the result, the characters unable to classify. This classifier leads successively several steps through, z. "Image enhancement", "address block locator "," segmentation "," feature extraction "," character selection "and" confidence evaluation ". Every step depends on at least a parameter of the classifier. The classifier leads at least one classification run (one iteration) through while all parameters have constant values, that is not varied become. The classification result, which is the classification run supplies, on the one hand, with the valid classification results compared in the database. On the other hand, a confidence measure ("confidence level ") compared with a predetermined barrier. If the classification result is too uncertain or not with one valid result agrees, so will at least a parameter value changes, and a new classification run (a new iteration) is performed. These iterations are repeated until the classifier becomes a valid result delivers or a termination criterion is met, z. Legs predetermined maximum time has elapsed.
In
Der Erfindung liegt die Aufgabe zugrunde, ein Verfahren und eine Vorrichtung bereitzustellen, durch die ein Objekt automatisch klassifiziert wird, wobei vom Objekt eine Menge von Sensorwerten gemessen wird und ein Klassifikator durch Anwendung eines Algorithmus diese Sensorwerte auswertet und dieser Algorithmus von den Werten verschiedener Parameter abhängt, ohne dass die Parameter manuell eingestellt zu werden brauchen. Das Verfahren und die Vorrichtung sollen auch dann anwendbar sein, wenn Hunderte oder gar Tausende von Parametern einzustellen sind.Of the Invention is based on the object, a method and an apparatus by which an object is automatically classified is measured, whereby the object a lot of sensor values is measured and a classifier by applying an algorithm these sensor values evaluates and this algorithm of the values of various parameters depends on the parameters set manually without will need. The method and the device should also then be applicable when setting hundreds or even thousands of parameters are.
Die Aufgabe wird durch ein Verfahren mit den Merkmalen des Anspruchs 1 und eine Vorrichtung mit den Merkmalen des Anspruchs 26 gelöst. Vorteilhafte Ausgestaltungen sind in den Unteransprüchen angegeben.The The object is achieved by a method having the features of the claim 1 and a device with the features of claim 26 solved. Advantageous embodiments are in the subclaims specified.
Lösungsgemäß werden
ein Verfahren und eine Vorrichtung zum Klassifizieren eines physikalischen Objekts
bereitgestellt. Das Klassifizieren umfasst die folgenden Schritte:
Ein
Sensor nimmt Messungen an dem physikalischen Objekt vor. Hierdurch
wird eine Menge von Sensorwerten erzeugt.According to the solution, a method and a device for classifying a physical object are provided. Classifying involves the following steps:
A sensor makes measurements on the physical object. As a result, a lot of sensor values are generated.
Die durch das Messen erzeugte Sensorwerte-Menge wird in rechnerverfügbarer Form abgespeichert.The The amount of sensor values generated by the measurement becomes more computer-available Form saved.
Das physikalische Objekt soll klassifiziert werden. Vorgegeben ist eine Menge von Klassen als den möglichen Klassifikationsergebnissen. Jedes mögliche Klassifikationsergebnis ist eine Klasse oder ein Vektor von Klassen, dem bzw. denen das Objekt angehört.The physical object is to be classified. The default is one Set of classes as the possible classification results. Any classification result is a class or a vector of classes to which the object belongs.
Ein Klassifikator klassifiziert das Objekt. Der Klassifikator stellt fest, zu welcher der möglichen Klassen das Objekt gehört. Ein Klassifikationsergebnis, das der Klassifikator liefert, ist beispielsweise eine Klasse oder ein Vektor von Klassen. Möglich ist auch, dass der Klassifikator das Ergebnis liefert, dass das Objekt zu mehreren der vorgegebenen Klassen gehört. Möglich ist auch, dass der Klassifikator feststellt, dass das Objekt zu keiner der vorgegebenen Klassen gehört. Weiterhin ist möglich, dass der Klassifikator das Ergebnis liefert, das Objekt nicht klassifizieren zu können.One Classifier classifies the object. The classifier presents Determines to which of the possible classes the object belongs. A classification result provided by the classifier is for example, a class or vector of classes. Possible is also that the classifier yields the result that the Object belongs to several of the given classes. Possible is also that the classifier determines that the object does not belong to any one belongs to the given classes. It is also possible that the classifier returns the result, the object does not classify to be able to.
Der Klassifikator fungiert als ein Mustererkennungsgerät und verwendet zum Klassifizieren die abgespeicherte Sensorwerte-Menge. Hierfür wendet der Klassifikator einen Algorithmus an, um mindestens ein Muster in der Sensorwerte-Menge zu erkennen.Of the Classifier acts as a pattern recognition device and uses the stored sensor value set for classification. For this the classifier applies an algorithm, to detect at least one pattern in the sensor value set.
Der Klassifikator liefert als Klassifikation des Objekts eines der folgenden beiden Ergebnisse:
- – entweder das Ergebnis der Auswertung der Sensorwerte-Menge
- – oder das Ergebnis, die Sensorwerte-Menge (Abb) nicht klassifizieren zu können.
- Either the result of the evaluation of the sensor value quantity
- - or the result of not being able to classify the sensor value set (Fig.).
Der für das Klassifizieren angewendete Algorithmus hängt von mehreren Parametern ab. Die Werte dieser Parameter bleiben während des Klassifizierens unverändert.Of the depends on the algorithm used for classifying of several parameters. The values of these parameters remain during of classifying unchanged.
Vor dem Klassifizieren wird der Klassifikator automatisch parametriert. Das Parametrieren umfasst den Schritt, dass jedem Parameter des Algorithmus jeweils ein Wert zugewiesen wird, der zuvor automatisch ermittelt wird.In front The classifier is automatically parameterised for classifying. The parameterization includes the step that each parameter of the Algorithm is assigned a value that previously determined automatically becomes.
Um die Werte automatisch zu ermitteln, werden folgende Schritte durchgeführt:
- – Eine Objekt-Stichprobe mit N physikalischen Stichproben-Objekten wird vorgegeben.
- – Ein Sensor erzeugt eine Stichprobe mit N Sensorwerte-Mengen. Hierfür nimmt der Sensor Messungen an den N Stichproben-Objekten vor. Die N Sensorwerte-Mengen werden in rechnerverfügbarer Form abgespeichert.
- – Für jede Sensorwerte-Menge der Stichprobe wird jeweils ein Soll-Klassifikationsergebnis ermittelt und in rechnerverfügbarer Form abgespeichert.
- – Eine Bewertungsfunktion (Bew) wird vorgegeben. Diese Bewertungsfunktion (Bew) hängt von der Quote der falsch klassifizierten Sensorwerte-Mengen und der Quote der als nicht klassifizierbar eingestuften Sensorwerte-Mengen ab.
- - An object sample with N physical sample objects is specified.
- - A sensor generates a sample with N sensor value quantities. For this purpose, the sensor makes measurements on the N sample objects. The N sensor value quantities are stored in computer-available form.
- For each sensor value set of the random sample, a desired classification result is determined in each case and stored in computer-available form.
- - An evaluation function (Bew) is specified. This weighting function (Bew) depends on the proportion of misclassified sensor value quantities and the rate of sensor value sets classified as non-classifiable.
Um den Klassifikator zu parametrieren, werden weiterhin ein erster Schritt, ein zweiter Schritt und ein dritter Schritt durchgeführt.Around parameterizing the classifier will continue to be a first Step, a second step and a third step performed.
In jedem dieser drei Schritte werden folgende Schritte durchgeführt:
- – Der Klassifikator wird wiederholt probeweise mit unterschiedlichen Parameterwerten parametriert.
- – Der parametrierte Klassifikator wird auf jeweils mindestens eine Sensorwerte-Menge der Stichprobe angewendet.
- – Für jede dieser Sensorwerte-Mengen wird das Ist-Klassifikationsergebnis, das der Klassifikator liefert, mit dem abgespeicherten Soll-Klassifikationsergebnis für diese Sensorwerte-Menge verglichen.
- - The classifier is repeatedly parameterized on a trial basis with different parameter values.
- - The parameterized classifier is applied to at least one sensor value set of the random sample.
- For each of these sensor value sets, the actual classification result which the classifier delivers is compared with the stored desired classification result for this sensor value set.
Im ersten Schritt wird mindestens ein beeinflussender Parameter des Algorithmus, der mindestens eine Sensorwerte-Menge der Stichprobe beeinflusst, ermittelt. Hierbei beeinflusst ein Parameter dann eine Sensorwerte-Menge der Stichprobe, wenn das Ergebnis des Vergleichs zwischen
- – dem Ist-Klassifikationsergebnis, das der Klassifikator angewendet auf diese Sensorwerte-Menge liefert, und
- – dem abgespeicherten Soll-Klassifikationsergebnis für diese Sensorwerte-Menge
- The actual classification result that the classifier applies to this sensor value set, and
- The stored nominal classification result for this sensor value set
Im zweiten Schritt wird für jeden im ersten Schritt ermittelten beeinflussenden Parameter jeweils ein lokales Optimum berechnet. Um im zweiten Schritt das lokale Optimum eines beeinflussenden Parameters zu berechnen, werden folgende Schritte durchgeführt:
- – Die vorgegebene Bewertungsfunktion wird als die lokal zu optimierende Zielfunktion verwendet.
- – der Klassifikator wird probeweise mit verschiedenen Werten für den beeinflussenden Parameter parametriert. Hierbei bleiben die Werte aller anderen Parameter unverändert.
- - The default evaluation function is used as the target function to be locally optimized.
- - The classifier is parameterized on a trial basis with different values for the influencing parameter. The values of all other parameters remain unchanged.
Im dritten Schritt wird ein globales Optimum für die Parameter berechnet. Um das globales Optimum für die Parameter zu berechnen, werden im dritten Schritt folgende Schritte durchgeführt:
- – Die vorgegebene Bewertungsfunktion wird als die global zu optimierende Zielfunktion verwendet.
- – Jeder beeinflussende Parameter wird unter Verwendung des im zweiten Schritt berechneten lokalen Optimums variiert.
- – Der Klassifikator wird für das Klassifizieren des Objekts mit denjenigen Parameterwerten parametriert, die bei der globalen Optimierung im dritten Schritt berechnet wurden.
- The predefined evaluation function is used as the target function to be optimized globally.
- Each influencing parameter is varied using the local optimum calculated in the second step.
- - The classifier is parameterized for classifying the object with those parameter values that were calculated in the third step in the global optimization.
Das lösungsgemäße Verfahren ermittelt automatisch diejenigen Parameter, die die Klassifikationsleistung des Klassifikators am stärksten beeinflussen. Dies geschieht insbesondere da durch, dass im ersten Schritt der oder die beeinflussenden Parameter ermittelt werden. Dieses Vorgehen ist viel zielgerichteter und schneller als ein Vorgehen, bei dem systematisch alle Parameter variiert werden und die Wirkung jeder Variation überprüft wird. Dieses systematische Vorgehen ist bei einer großen Anzahl Parametern sehr zeitaufwendig.The Solution-based method determines automatically those parameters that determine the classification performance of the classifier the strongest influence. This happens in particular because by that in the first step or the influencing parameters be determined. This approach is much more targeted and faster as a procedure in which all parameters are systematically varied and the effect of each variation is checked. This systematic approach is for a large number Parameters very time consuming.
Das
lösungsgemäße Verfahren ist auch zielgerichteter
als das z. B. aus
Das lösungsgemäße Verfahren umfasst eine Parametrierungsphase und eine Klassifikationsphase. Die Parametrierungsphase umfasst drei Schritte und liefert einen parametrierten Klassifikator. Dieser Klassifikator wird in der Klassifikationsphase eingesetzt. Nur für die Parametrierungsphase wird eine Stichprobe mit Soll-Klassifikationsergebnissen benötigt. Die Schritte der Parametrierungsphase brauchen nur einmal durchgeführt zu werden, und der parametrierte Klassifikator lässt sich beliebig oft anwenden. In der Klassifikationsphase brauchen dank der Erfindung keine Iterationsläufe mit verschiedenen Parameterwerten durchgeführt zu werden, was Zeit einspart.The Method according to the invention comprises a Parameterization phase and a classification phase. The parameterization phase consists of three steps and provides a parameterized classifier. This classifier is used in the classification phase. Only for the parameterization phase is a sample with nominal classification results needed. The steps of the parameterization phase need only once to be performed, and the parameterized Classifier can be used as often as you like. In the Classification phase need thanks to the invention no iteration runs to be performed with different parameter values, which saves time.
Ein Vorteil des Verfahrens ist, dass sich mehrere Verfahrensschritte parallel ausführen lassen. Dies spart Rechenzeit ein. Lösungsgemäß werden nämlich im ersten Schritt beeinflussende Parameter ermittelt. Die Prüfung, ob ein Parameter ein beeinflussender Parameter ist, lässt sich unabhängig von und daher parallel zu der entsprechenden Prüfung für einen anderen Parameter durchführen. Keine Prüfung für einen Parameter benötigt das Ergebnis der Prüfung für einen anderen Parameter. Auch die Prüfungen, welche Sensorwerte-Mengen von einem Parameter beeinflusst werden und welche nicht, lassen sich parallel ausführen.One Advantage of the method is that there are several process steps run in parallel. This saves computing time. Become a solution namely determined in the first step influencing parameters. The Check if a parameter is an influencing parameter is independent of and therefore parallel to the corresponding test for another parameter carry out. No exam for one Parameter requires the result of the check for another parameter. Also the tests, which sensor value quantities be influenced by a parameter and which not, let to execute in parallel.
Im zweiten Schritt wird jeder beeinflussende Parameter lokal optimiert. Auch diese Berechnungen lassen sich parallel durchführen. Denn die lokale Optimierung eines Parameters erfordert nicht, dass zuvor ein anderer Parameter des Algorithmus optimiert wurde.in the second step, each influencing parameter is locally optimized. These calculations can also be performed in parallel. Because the local optimization of a parameter does not require that previously another parameter of the algorithm was optimized.
Die Anzahl der Rechenschritte, die beim ersten Schritt des lösungsgemäßen Verfahrens durchzuführen sind (beeinflusste Sensorwerte-Mengen), hängt nur linear von der Anzahl der Parameter ab, nicht etwa quadratisch oder exponentiell. Gleiches gilt für die Anzahl der Rechenschritte im zweiten Schritt (lokale Optimierungen).The Number of computation steps used in the first step of the solution To carry out the process (influenced sensor value quantities), depends only linearly on the number of parameters, not about square or exponential. The same applies to the Number of calculation steps in the second step (local optimizations).
Im dritten Schritt wird die Sensorwerte-Menge ausgewertet, um ein globales Optimum zu finden. Auch bei dieser Optimierung lassen sich mehrere Schritte parallel ausführen.in the third step, the sensor value set is evaluated to a global one To find the optimum. Also with this optimization can be several Perform steps in parallel.
Aus diesen Gründen lässt sich das lösungsgemäße Verfahren auch dann einsetzen, wenn sehr viele Parameter einzustellen sind, beispielsweise mehrere hundert oder gar tausend Parameter. In diesem Fall wäre es nicht möglich, die Parameter manuell einzustellen. Die Optimierungsverfahren nach dem Stand der Technik erfordern meistens eine viel zu hohe Rechenzeit und sind daher nicht praktisch einsetzbar. In vielen Anwendungen reicht auch die verfügbare Rechenkapazität nicht aus. Das lösungsgemäße Verfahren vermeidet diese Engpässe.Out These reasons can be the solution Use procedures even when setting many parameters are, for example, several hundred or even a thousand parameters. In this case it would not be possible to set the parameters set manually. The optimization method according to the state of Technology usually requires a much too high computation time and are therefore not practical. In many applications, too the available computing capacity is not enough. The Solution-based method avoids these bottlenecks.
Das lösungsgemäße Verfahren lässt sich auf einen Algorithmus mit beliebigen Parametern anwenden. Diese Parameter können beliebige unterschiedliche Wertebereiche, Maßeinheiten und physikalische Bedeutungen haben.The solution according to the method leaves to apply to an algorithm with arbitrary parameters. These Parameters can be any number of different value ranges, Have units of measurement and physical meanings.
Vorzugsweise wird nicht jeder Parameter im zweiten und im dritten Schritt variiert. Vielmehr wird im ersten Schritt ermittelt, welche Parameter die Klassifikationsleistung des Klassifikators überhaupt beeinflussen können. Im ersten Schritt werden aus der Gesamtheit der Parameter systematisch die beeinflussenden Parameter ausgewählt. Die übrigen Parameter bleiben konstant. Dies reduziert den Rechenaufwand für die nachfolgenden Schritte deutlich.Preferably Not every parameter is varied in the second and third steps. Rather, in the first step it is determined which parameters the Classification performance of the classifier can influence at all. In the first step, the set of parameters becomes systematic the influencing parameters selected. The remaining Parameters remain constant. This reduces the computational effort for the subsequent steps clearly.
Ein Parameter wird dann als beeinflussender Parameter ausgewählt, wenn der Klassifikator bei verschiedenen Werten dieses Parameters für mindestens eine ausgewählte Sensorwerte-Menge unterschiedliche Ergebnisse liefert. Bevorzugt ist der vorgegebene Initialwert des Parameters einer dieser verschiedenen Werte. Die nicht beeinflussten Parameter behalten ihre jeweiligen vorgegebenen Initialwerte.One Parameter is then selected as the influencing parameter if the classifier at different values of this parameter for at least one selected sensor value set gives different results. Preferably, the predetermined Initial value of the parameter of one of these different values. The unaffected parameters retain their respective predetermined ones Initial values.
Bevorzugt werden hierfür zunächst diejenigen Sensorwerte-Mengen ausgewählt, die vom Klassifikator nicht korrekt klassifiziert werden, falls der Klassifikator mit vorgegebenen Initialwerten parametriert ist. Anschließend werden die beeinflussenden Parameter ausgewählt. Hierbei wird der probeweise parametrierte Klassifikator ausschließlich auf diejenigen Sensorwerte-Mengen angewendet, die der mit den Initialwerten parametrierte Klassifikator nicht korrekt klassifizieren kann.Prefers For this purpose, first those sensor value quantities are selected that does not classify correctly by the classifier if the classifier is parameterized with given initial values is. Subsequently, the influencing parameters selected. This is the sample parameterized classifier applied exclusively to those sensor value quantities, that of the classifier parameterized with the initial values not can classify correctly.
Diese Ausgestaltung reduziert die Anzahl derjenigen Parameter, die bei der Parametrierung variiert werden, dramatisch. Zugleich erspart die Ausgestaltung die Notwendigkeit, manuell die zu variierenden Parameter vorzugeben. Vielmehr wird automatisch und systematisch ausgewählt, welche Parameter variiert werden und welche nicht.These Design reduces the number of those parameters at the parameterization can be varied dramatically. Spared at the same time the design the need to manually vary the ones Specify parameters. Rather, it will be automatic and systematic selected which parameters are varied and which Not.
Vorzugsweise wird die Stichprobe mit den Sensorwerte-Mengen in Teil-Stichproben unterteilt. Die Rechenschritte des ersten Schritts werden für jede Teil-Stichprobe durchgeführt. Die Teil-Stichproben lassen sich zeitlich parallel oder wenigstens zeitlich überlappend verarbeiten, so dass sich mehrere Rechner einsetzen lassen und die Parallelisierung Zeit einspart.Preferably will take the sample with the sensor value sets in sub-samples divided. The calculation steps of the first step are for each sub-sample performed. The partial samples can be temporally parallel or at least temporally overlapping process, so that several computers can be used and the Parallelization saves time.
Das lösungsgemäße Verfahren lässt sich z. B. dazu einsetzen, um Bildsequenzen zu digitalisieren und dabei zu rekonstruieren. Ein analoger Film, z. B. ein alter Spielfilm, wird optisch abgetastet. Die Abtastung liefert rechnerverfügbare Bildsequenzen, die noch mit mechanischen oder chemischen Beschädigungen des Films behaftet sein können. Ein Rekonstruktionsverfahren wendet eine Ausgestaltung des lösungsgemäßen Verfahrens an und liefert fehlerfreie und rekonstruierte Bildsequenzen. Ein Soll-Klassifikationsergebnis für eine durch Abtastung gewonnene Bildsequenz ist eine korrekt rekonstruierte Bildsequenz.The solution according to the method leaves z. B. to use to digitize image sequences and thereby to reconstruct. An analog film, z. An old feature film, is optically scanned. The scan provides computer-accessible Image sequences that are still with mechanical or chemical damage the film may be afflicted. A reconstruction method applies an embodiment of the method according to the solution and provides error-free and reconstructed image sequences. One Desired classification result for a sample obtained by sampling Picture sequence is a correctly reconstructed picture sequence.
In einer anderen Anwendung des lösungsgemäßen Verfahrens wird für eine Bildsequenz automatisch mindestens ein Deskriptor erzeugt, der die Bildsequenz beschreibt („Video-Annotation”). Die Bildsequenz wurde z. B. erzeugt, indem ein Ausschnitt der realen Welt gefilmt wurde, z. B. eine Parlamentsdebatte oder ein Sportereignis. Die Bildsequenz befindet sich z. B. in analoger Form im Archiv eines Fernsehsenders und wird durch Abtastung digitalisiert, was mindestens eine Sensorwert-Menge liefert. Der Deskriptor ist z. B. einer der Begriffe „Bundestagsdebatte”, „Fußballspiel” oder „Naturkatastrophe”. Als Soll-Klassifikationsergebnis für eine Bildsequenz werden die richtigen Deskriptoren ermittelt und abgespeichert.In another application of the solution Procedure will automatically for a picture sequence at least generates a descriptor describing the image sequence ("video annotation"). The image sequence was z. B. generated by a section of the real World was filmed, z. For example, a parliamentary debate or a sporting event. The image sequence is z. B. in analog form in the archive of a TV station and is digitized by sampling, which is at least provides a sensor value quantity. The descriptor is z. B. one of the terms "Bundestag debate", "football match" or "natural disaster". As the target classification result for an image sequence The correct descriptors are determined and stored.
In einer Abwandlung wird die Bildsequenz gewonnen, indem ein technisches System mittels mindestens einer Kamera überwacht wird. Das technische System ist z. B. eine produktionstechnische Anlage, ein Gebäude oder auch eine belebte Straße, ein Flughafen oder ein sonstiger öffentlicher Platz. Eine Ausgestaltung des lösungsgemäßen Verfahrens wird auf die Bildsequenz angewendet und liefert eine Aussage über einen aktuellen oder zukünftigen Zustand des technischen Systems, z. B. eine Gefährdung von Personen oder eine drohende Störung der Anlage oder ein Unfall oder ein Stau auf der Straße.In a modification, the image sequence is obtained by a technical System is monitored by means of at least one camera. The technical system is z. B. a production plant, a building or a busy street, a Airport or other public place. An embodiment of the inventive method is on applied the image sequence and provides a statement about a current or future state of the technical Systems, z. As a threat to people or an impending Disruption of the plant or an accident or a traffic jam on the Street.
In einer weiteren Anwendung wird das lösungsgemäße Verfahren eingesetzt, um Zeichenfolgen auf Gegenständen zu lesen. Jede Zeichenfolge ist z. B. eine Zustelladresse auf einer Postsendung oder auf einem Frachtgut, der Name des Besitzers eines Gepäckstücks oder auch das amtliche Kennzeichen eines Straßen-, Schienen-, Luft- oder Wasserfahrzeugs. Das Kennzeichen soll z. B. ermittelt werden, um eine Gebühr für die Benutzung einer Straße zu erheben oder um eine Ordnungswidrigkeit aufzuklären.In Another application is the solution according to Method used to draw strings on objects to read. Each string is z. B. a delivery address on a Mailing or on a freight, the name of the owner of one Baggage or the official license plate a road, rail, air or water vehicle. The indicator should z. B. can be determined for a fee for the use of a road to raise or to investigate an administrative offense.
Beispielsweise wird das Verfahren eingesetzt, um sowohl die Zieladresse als auch die Adresse des Absenders zu erkennen und außerdem noch zu überprüfen, ob die Postsendung mit einem ausreichenden Beförderungsentgelt frankiert ist (gültige und ausreichende Briefmarken). Das Klassifikationsergebnis ist ein Vektor mit drei Komponenten, nämlich der Zieladresse, der Absenderadresse und dem erkannten Beförderungsentgelt. Möglich ist z. B., dass zwar die Zieladresse und das Beförderungsentgelt richtig erkannt werden, aber nicht die Absenderadresse.For example The procedure is used to both the destination address and recognize the address of the sender and also to check if the mailing with a sufficient Transport fee is franked (valid and sufficient stamps). The classification result is a vector with three components, namely the destination address, the sender address and the recognized fare. Possible is z. For example, although the destination address and the transportation fee be recognized correctly, but not the sender address.
Von einem Gegenstand, der mit einer Zeichenfolge versehen ist, wird ein rechnerverfügbares Abbild erzeugt. Dieses Abbild zeigt die Zeichenfolge. Als Soll-Klassifikationsergebnis wird eine Codierung der richtig gelesenen Zeichenfolge abgespeichert und verwendet.From an object which is provided with a string becomes generates a computer-accessible image. This image shows the string. The target classification result is an encoding saved and used the correct read string.
Das lösungsgemäße Verfahren lässt sich auch dazu verwenden, um ein Objekt zu klassifizieren. Vom Objekt wurde mindestens ein rechnerverfügbares Abbild erzeugt. Das Objekt wird anhand seiner Form, seiner Farben und/oder seiner Abmessungen im Abbild klassifiziert. Das Abbild wird z. B. durch ein bildgebendes Verfahren der Medizin gemessen und zeigt Körperteile eines Menschen oder eines anderen Lebewesens.The solution according to the method leaves also use to classify an object. From the object At least one computer-accessible image was generated. The object is determined by its shape, colors and / or its Dimensions classified in the image. The image is z. B. by An imaging method of medicine measures and displays body parts of a human being or another living thing.
Das zu klassifizierende Objekt kann auch ein Gegenstand, z. B. ein Fahrzeug, ein Bauteil, ein Werkstück oder eine Pfandflasche, sein. Das Objekt kann auch eine Briefmarke, ein Geldschein, ein Personalausweis, eine Kreditkarte oder ein sonstiges Wertdokument sein, das auf Echtheit überprüft werden soll. Vorgegeben wird eine rechnerverfügbare Bibliothek mit Abbildern von echten Wertdokumenten. Zum Klassifizieren wird ein zu überprüfendes Wertdokument optisch abgetastet. Als Klassifikationsergebnis wird entweder ein Wertdokument aus der Bibliothek oder das Ergebnis, dass möglicherweise eine Fälschung vorliegt, geliefert.The object to be classified can also be an object, eg. A vehicle, a component, a workpiece or a returnable bottle. The object may also include a stamp, a bill, an identity card, a credit card or other valuable document that checks for authenticity shall be. A computer-accessible library is specified with images of real value documents. To classify a value document to be checked optically scanned. The classification result is either a value document from the Library or the result that may be a Counterfeiting is present, delivered.
Das Verfahren vermag auch Geoinformationen auszuwerten. Als Sensorwerte-Menge wird ein rechnerverfügbares Abbild eines Ausschnitts der Erdoberfläche verwendet, das bei Beleuchtung im sichtbaren Bereich oder per Infrarot erzeugt wurde. Dieser Ausschnitt der Erdoberfläche soll klassifiziert werden. Beispielsweise sollen unterirdische Bodenschätze gefunden werden, der Zustand von Grünflächen klassifiziert werden oder Umweltverschmutzungen, z. B. Ölfilme auf Gewässern, erkannt werden.The Method is also able to evaluate geo-information. As sensor value quantity becomes a computer-accessible image of a section of the Earth's surface used in lighting in the visible Range or generated by infrared. This section of the earth's surface should be classified. For example, underground minerals are found, the state of green areas classified or environmental pollution, eg. B. oil films on waters, be recognized.
Die Sensorwerte können auch von einem akustischen Sensor geliefert werden, der Geräusche misst. Die Geräusche können von einem technischen System kommen und werden mit dem Ziel klassifiziert, den aktuellen Zustand des technischen Systems zu erkennen. Bestimmte Geräusche können auf Verschleiß oder einen Schaden hindeuten. Das technische System ist z. B. eine Förderanlage für Frachtgut oder Bodenschätze, ein Motor, ein Getriebe oder auch ein Fahrwerk eines Fahrzeugs.The Sensor values can also be supplied by an acoustic sensor be that measures noise. The sounds can come from a technical system and are classified with the goal to recognize the current state of the technical system. Certain Noises can be on or wear indicate a damage. The technical system is z. B. a conveyor system for cargo or mineral resources, an engine, a Transmission or a chassis of a vehicle.
Das Verfahren lässt sich auch für die Spracherkennung anwenden. Eine Abfolge mit mindestens einem gesprochenen Wort wird durch einen akustischen Sensor aufgenommen. Diese Sensorwerte-Abfolge wird mit dem Ziel aufgenommen, die gesprochenen Worte automatisch zu erkennen. Beispielsweise spricht ein Werker Steuerbefehle oder Beobachtungen in ein am Kopf getragenes Mikrophon, um die Befehle bzw. Beobachtungen einzugeben und dabei beide Hände frei zu haben.The Method can also be used for speech recognition apply. A sequence with at least one spoken word becomes recorded by an acoustic sensor. This sensor value sequence becomes with the aim of automatically adding the spoken words detect. For example, a worker speaks control commands or observations in a head-worn microphone to the commands or observations to enter and to have both hands free.
In einer weiteren Anwendung soll ein technisches System geregelt werden. Beispielsweise sollen ein Fahrzeug oder ein Flugzeug auf einer vorgegebenen Trajektorie gehalten werden, auch wenn Störgrößen es aus der Bahn zu bringen versuchen. Gemessen werden Geschwindigkeit, Beschleunigung, Orientierung und sonstige physikalischen Größen. Als Soll-Klassifikationsergebnis wird ein richtiger Regeleingriff als Reaktion auf gemessene Sensorwerte und/oder Vorgaben von Führungsgrößen verwendet.In Another application is to regulate a technical system. For example, should a vehicle or an airplane on a given Trajectory are kept, even if disturbances trying to get it off the track. Speed is measured Acceleration, orientation and other physical quantities. The target classification result is a correct control intervention in response to measured sensor values and / or specifications of reference variables used.
Im Folgenden wird die Erfindung anhand eines Ausführungsbeispiels beschrieben. Dabei zeigen:in the The invention is based on an embodiment described. Showing:
Im Ausführungsbeispiel wird das lösungsgemäße Verfahren angewendet, um Zeichenfolgen auf Postsendungen zu erkennen. Die Postsendungen werden durch eine Sortieranlage sortiert, die nach dem Sortieren den Transport jeder Postsendung zum jeweiligen Ziel auslöst. Jede Postsendung ist mit jeweils mindestens einer Zeichenfolge versehen. Die Zeichenfolge ist z. B. die Zustelladresse, an die die Postsendung zu transportieren ist, eine Rücksendeadresse oder eine Vorausverfügung oder eine Transportanforderung („endorsement”).in the Embodiment is the solution according Methods used to detect strings on mail. The mail items are sorted by a sorting system, the after sorting the transport of each mail item to the respective one Target triggers. Each mail item is each with at least one String provided. The string is z. B. the delivery address, to which the item of mail is to be transported, a return address or an advance or transportation request ( "Endorsement").
- – einer Zuführeinrichtung ZE,
- – mehreren Ausgabefächern Af-A, Af-B, ..., Af-E,
- – einer Kamera
3 und - – einem Klassifikator
2 .
- A feeder ZE,
- - several output trays Af-A, Af-B, ..., Af-E,
- - a camera
3 and - - a classifier
2 ,
Ein
Stapel Postsendungen wird über die Zuführeinrichtung
ZE der Sortieranlage
Der
Klassifikator
Jeder
dieser fünf Einzel-Klassifikatoren
Im Ausführungsbeispiel wird das Verfahren für Postsendungen an Adressaten in den USA angewendet. Daher enthält das Abbild
- – den Namen des Adressaten,
- – eine Hausnummer,
- – einen Straßennamen,
- – einen Ort,
- – ein Kürzel für den US-Bundesstaat und
- – einen ZIP-Code, der z. B. aus 5 oder 9 oder 11 Ziffern besteht.
- - the name of the addressee,
- - a house number,
- - a street name,
- - a place,
- - an abbreviation for the US state and
- - a ZIP code, the z. B. consists of 5 or 9 or 11 digits.
Eine
Zeichenleseeinheit (OCR-Einheit) eines Klassifikators
Der entzifferte Adress-Bestandteil wird mit einer Adress-Datenbank verglichen. Diese Adress-Datenbank enthält gültige Zustelladressen in den USA. Die Adress-Datenbank ist baumförmig aufgebaut. Jeder Stadt sind der Kürzel des jeweiligen Bundesstaats und die gültigen ZIP-Codes für Zustelladressen in dieser Stadt zugeordnet. Jedem ZIP-Code sind die gültigen Straßennamen für Zustelladressen mit diesem ZIP-Code zugeordnet.Of the Deciphered address component is compared with an address database. This address database contains valid delivery addresses in the USA. The address database is tree-shaped. Each city is the abbreviation of the respective state and the valid ZIP codes for delivery addresses assigned in this city. Each ZIP code is valid Street names for delivery addresses associated with this ZIP code.
Die
folgende Tabelle zeigt ein Beispiel. Eine Postsendung ist mit folgender
Zustelladresse versehen:
Um die Adresse automatisch zu lesen, wird automatisch ein rechnerverfügbares Abbild der Postsendung erzeugt, welches die Adresse zeigt. In diesem Abbild wird nach dem Bereich gesucht, der die Adresse enthält („region of interest”). Der Bereich wird in Bestandteile zerlegt, um die Adress-Bestandteile zu finden.Around automatically reading the address automatically becomes a computer-available Generates an image of the mail item showing the address. In this Image is searched for the area containing the address ("Region of interest"). The area becomes integral decomposed to find the address components.
In einer Ausführungsform wird zunächst der Ortsname gesucht und entziffert. Die Entzifferung liefert im vorliegenden Beispiel kein eindeutiges Ergebnis, sondern mehrere mögliche Leseergebnisse mit jeweils einem Übereinstimmungsmaß (Konfidenzmaß). Dieses Konfidenzmaß ist ein Maß dafür, wie gut das Leseergebnis für den Adressteil mit dem jeweiligen Adressteil einer gültigen Adresse in der Adress-Datenbank übereinstimmt. Jedes Übereinstimmungsmaß ist im Ausführungsbeispiel eine Zahl zwischen 0 (niedrigstes Ergebnis) und 255 (höchstes Ergebnis).In In one embodiment, the place name first becomes searched and deciphered. The deciphering delivers in the present Example not a clear result, but several possible ones Reading results with one match measure each (confidence measure). This confidence measure is a measure of how good the reading result for the address part with the respective Address part of a valid address in the address database matches. Each agreement measure is in the embodiment a number between 0 (lowest result) and 255 (highest Result).
Durch Vergleich mit der Adress-Datenbank wird vielmehr ermittelt, dass der Ort entweder „Burnham” (Übereinstimmungsmaß 223) oder „Burningham” (Übereinstimmungsmaß 210) lautet. Alle anderen in der Adress-Datenbank hinterlegten Ortsnamen passen deutlich schlechter zum Leseergebnis.By Rather, comparison with the address database is determined that the place either "Burnham" (metric 223) or "Burningham" (Conformity measure 210) reads. All other place names stored in the address database fit significantly worse to the reading result.
Zur Kontrolle wird das Bundesstaats-Kürzel gelesen und verglichen. Zu „Burnham” gehört „PA” (Übereinstimmungsmaß 200), zu „Burningham” „GA” (Übereinstimmungsmaß 210).to Control is reading and comparing the state abbreviation. "Burnham" includes "PA" (score 200), to "Burningham" "GA" (Conformity measure 210).
Anschließend wird das Leseergebnis für den ZIP-Code mit allen ZIP-Codes abgespeichert, die in der Adress-Datenbank für Zustelladressen in „Burnham” oder „Burningham” hinterlegt sind. Der einzige hinterlegte ZIP-Code, der zu „Burnham” passt, ist „17009” (Übereinstimmungsmaß 130), der einzige zu „Burningham” passende ZIP-Code ist „77008” (Übereinstimmungsmaß 120).Subsequently becomes the reading result for the ZIP code with all ZIP codes stored in the address database for delivery addresses filed in "Burnham" or "Burningham" are. The only stored ZIP code that matches "Burnham", is "17009" (metric 130), the only ZIP code to match "Burningham" is "77008" (metric 120).
Das gleiche wird für die Straße durchgeführt. Anschließend wird die Hausnummer entziffert.The same is done for the road. Then the house number is deciphered.
Eine Abwandlung dieser Ausführungsform wird durchgeführt, wenn mehr Laufzeit zur Verfügung steht. Zunächst wird der ZIP-Code gesucht und entziffert. Alle hinterlegten gültigen Adressen, deren ZIP-Code zureichend gut zum Leseergebnis für den ZIP-Code passen, werden so wie oben beschrieben untersucht.A Modification of this embodiment is performed if more runtime is available. First the ZIP code is searched for and deciphered. All deposited valid Addresses whose ZIP code suffices to match the reading result for the ZIP code are examined as described above.
Die
folgende Tabelle veranschaulicht, welche zwei alternativen Zustelladressen
als mögliche Leseergebnisse gelesen wurden:
In der zweiten und vierten Spalte sind zwei gültige Alternativen (zwei in der Adress-Datenbank verzeichnete Zustelladressen) angegeben. In der dritten und fünften Spalte wird als Einzel-Bewertung jeweils das Übereinstimmungsmaß (Konfidenz maß) für die lokale Übereinstimmung zwischen dem Leseergebnis für den Adressteil und der gültigen Zeichenfolge in der Adress-Datenbank angegeben.In the second and fourth columns are two valid alternatives (two delivery addresses listed in the address database). In the third and fifth column is as single rating each the measure of conformity (confidence measure) for the local match between the reading result for the address part and the valid string specified in the address database.
Für jede gültige (in der Adress-Datenbank hinterlegte) Alternative wird eine Gesamtbewertung ermittelt, indem die einzelnen Übereinstimmungsmaße zu einem Gesamt-Sicherheitsmaß (Gesamt-Konfidenzmaß) gewichtet zusammengefasst werden. Der Ort erhält eine höhere Gewichtung als die Hausnummer, weil der richtige Ort für die Zustellung wichtiger ist.For every valid alternative (stored in the address database) An overall score is determined by the individual match sizes weighted to a total security measure (total confidence measure) be summarized. The place receives a higher one Weighting as the house number because the right place for the delivery is more important.
Falls die Gesamtbewertung jeder gültigen Alternative unterhalb einer vorgegebenen Sicherheits-Schwelle liegt oder überhaupt keine gültige Alternative gefunden wird, so liefert die Zeichenleseeinheit das Ergebnis, dass sie die Zeichenfolge überhaupt nicht zu entziffern vermag. In diesem Fall wird das Abbild der Postsendung an eine Videocodierstation übermittelt und auf einem Bildschirmgerät dargestellt. Ein Bearbeiter liest die abgebildete Zeichenfolge, z. B. die Zustelladresse, und gibt sie manuell ein, z. B. durch Eintippen oder Spracheingabe. Dies ist natürlich zeitaufwendiger und teurer als ein automatisches Lesen.If the overall rating of each valid alternative below a given security threshold or at all no valid alternative is found, so deliver the Character reading unit the result that they are the string at all unable to decipher. In this case, the image of the mailpiece transmitted to a video coding station and on a video display device shown. An editor reads the mapped string, z. As the delivery address, and enter them manually, z. B. by Typing or voice input. This is of course more time consuming and more expensive than an automatic reading.
Falls mehrere gültige Alternativen gefunden werden, deren Bewertungen oberhalb der vorgegebenen Schwelle liegen, so wird der Abstand zwischen diesen Bewertungen mit einer Abstands-Schwelle verglichen. Falls der Abstand größer als die Abstands-Schwelle ist, so liefert die Zeichenleseeinheit ein eindeutiges Ergebnis.If Several valid alternatives are found whose ratings above the given threshold, the distance between compared these ratings with a distance threshold. If the distance is greater than the distance threshold, Thus, the character reading unit provides a unique result.
Falls
der Klassifikator
Der
Klassifikator
Der
Klassifikator
Im
Ausführungsbeispiel liest der Klassifikator
Diese
Sicherheits-Schwelle ist im Ausführungsbeispiel kein fest
vorgegebener Wert, sondern ein veränderlicher Parameter,
für den durch das Parametrieren des Klassifikators
Möglich
ist auch, verschiedene Sicherheits-Schwellen zu verwenden. Jede
Sicherheits-Schwelle ist ein Parameter. Um ein Leseergebnis zu liefern,
wählt der Klassifikator
Ein
weiterer Parameter wird verwendet, um ein Farbbild oder Graubild
in ein Schwarzweißbild umzuwandeln. Jedes Abbild einer
Postsendung liegt als Pixelbild vor. Die Abtastung der Postsendung
liefert für jedes Pixel jeweils einen Farbwert oder einen
Grauwert, z. B. eine Zahl zwischen 0 und 255 (einschließlich).
Ein Parameter des Algorithmus Al und somit des Klassifikators
Weitere
Parameter des Klassifikators
- – das Auffinden desjenigen Bereichs im Abbild der Postsendung, in dem sich die Zustelladresse befindet („region of interest”),
- – die Unterteilung einer Zeichenfolge in die einzelnen Worte („Segmentierung”),
- – die Unterteilung eines Worts in Buchstaben,
- – die Entzifferung von Handschriften.
- Finding the region in the image of the mail item in which the delivery address is located ("region of interest"),
- - the subdivision of a string into the individual words ("segmentation"),
- - the subdivision of a word into letters,
- - the deciphering of manuscripts.
Vorgegeben wird eine zu optimierende Bewertungsfunktion. Den Parametern werden Werte dergestalt zugewiesen, dass die zugewiesenen Werte diese vorgegebene Bewertungsfunktion maximieren oder minimieren. Die Bewertungsfunktion hängt von folgenden Kennzahlen ab:
- – der Rate von richtig gelesenen Zeichenfolgen auf Postsendungen,
- – der Rate von Zeichenfolgen, die nicht automatisch gelesen werden konnten,
- – den Kosten, die durch das fehlerhafte Lesen einer Zeichenfolge entstehen, und
- – den Kosten, die dadurch entstehen, dass eine Zeichenfolge nicht automatisch gelesen werden konnte, sondern das Abbild an die Videocodierstation übermittelt werden musste.
- The rate of correctly read strings on mailpieces,
- The rate of strings that could not be read automatically
- The costs of incorrectly reading a string, and
- - The costs that result from the fact that a string could not be read automatically, but the image had to be transmitted to the video coding station.
Beispielsweise
hat die Bewertungsfunktion die Form
Falls die Zeichenfolge eine Adresse ist, so werden verschiedene Arten von Lesefehlern unterschieden, weil die verschiedenen Arten unterschiedlich gravierende Fehler bei der Zustellung der Postsendung bewirken:
- 1) Der Ort in der Adresse wurde falsch gelesen.
- 2) Der Ort wurde richtig gelesen, der ZIP-Code (oder die Postleitzahl) wurde aber falsch gelesen oder konnte nicht automatisch entziffert werden.
- 3) Der Ort und der ZIP-Code bzw. die Postleitzahl wurden richtig gelesen, aber die Straße wurde falsch gelesen oder konnte nicht automatisch entziffert werden.
- 4) Nur die Hausnummer oder die Postfachnummer wurden falsch gelesen, die übrigen Bestandteile der Adresse hingegen richtig.
- 1) The location in the address was read incorrectly.
- 2) The place was read correctly, but the zip code (or zip code) was misread or could not be deciphered automatically.
- 3) The location and ZIP code / postal code were read correctly, but the street was misread or could not be deciphered automatically.
- 4) Only the house number or PO box number were read incorrectly, the other components of the address, however, correct.
Diese
Arten von Fehlern sind deshalb unterschiedlich gravierend, weil
sie unterschiedlich hohe Kosten und zusätzliche Transportzeiten
verursachen. Wird die Postsendung in einen falschen Ort geschickt,
so muss sie nachträglich in den richtigen Ort transportiert
werden, was teuer ist und viel Zeit kostet. Hat der Klassifikator
In einer Fortbildung hat die Bewertungsfunktion folgende Form: wobei
- – s verschiedene Arten von Adress-Bestandteile unterschieden werden, z. B. Ort, ZIP-Code, Straße und Hausnummer,
- – r verschiedene Arten von Lesefehlern unterschieden werden (k = 1, ..., r),
- – NL der Prozentsatz der als nicht lesbar klassifizierten Zeichenfolgen ist,
- – β > 0 ein vorgegebener Gewichtsfaktor ist,
- – Ri(l) der Prozentsatz der richtig gelesenen Adress-Bestandteile ist (l = 1, ..., s),
- – LF(k) der Prozentsatz der Lesefehler der Art k an den insgesamt gelesenen Zeichenfolgen ist (k = 1, ..., r),
- – α(l) ein vorgegebener Gewichtsfaktor für den Adress-Bestandteil l (l = 1, ..., s) ist und
- – γ(k) ein vorgegebener Gewichtsfaktor für die Fehlerart k ist (k = 1, ..., r).
- - s different types of address components are distinguished, for. Place, ZIP code, street and house number,
- - different types of read errors are distinguished (k = 1, ..., r),
- - NL is the percentage of strings classified as unreadable,
- Β> 0 is a given weight factor,
- - Ri (l) is the percentage of correctly read address components (l = 1, ..., s),
- - LF (k) is the percentage of read errors of type k on the total read strings (k = 1, ..., r),
- - α (l) is a predetermined weighting factor for the address component l (l = 1, ..., s) and
- - γ (k) is a given weight factor for the error k (k = 1, ..., r).
Um
den Algorithmus Al und damit den Klassifikator
In
einer Ausführungsform sind N2 Postsendungen (0 < N2 < N) der Stichprobe
als solche Postsendungen gekennzeichnet, die vom Klassifikator
Der
Klassifikator
Die
Parametrierungseinheit
- – eine weitere
Kamera
9 , - – einen weiteren Rechner
7 , der die im Folgenden beschriebenen Verfahrensschritte ausführt, und - – eine Stichproben-Datenbank
8 und - – jeweils eine Parameterwerte-Zuweisungseinheit
13 pro Sortieranlage mit Klassifikator2 .
- - another camera
9 . - - another computer
7 which performs the method steps described below, and - - a sample database
8th and - Each one parameter value assignment unit
13 per sorting plant with classifier2 ,
Die
Parameterwerte-Zuweisungseinheit
In
der Klassifikationsphase reicht es aus, den Klassifikator
In
einem weiteren vorbereitenden Schritt S2 wird für jede
Postsendung mindestens ein Soll-Leseergebnis ermittelt und abgespeichert,
beispielsweise indem jede Zeichenfolge zunächst automatisch
gelesen wird und das Leseergebnis dann auf einem Bildschirm angezeigt
eine Bedienkraft die Zeichenfolge liest und eingibt. Der Klassifikator
Möglich
ist, dass mehrere Soll-Leseergebnisse abgespeichert werden. Beispielsweise
ist ein Soll-Leseergebnis für eine handgeschriebene Zustelladresse
die vollständig richtig gelesene Zustelladresse. Ein weiteres
Soll-Leseergebnis ist der richtig gelesene ZIP-Code verbunden mit
dem Ergebnis, dass der Rest der Zustelladresse nicht automatisch
gelesen werden kann. Vorzugsweise ist eines der Soll-Leseergebnisse
als das bestmögliche Soll-Leseergebnis gekennzeichnet – in
der Regel die vollständig richtig gelesene Zeichenfolge. Im
Beispiel der
Im
Beispiel der
In
einer Tabelle Tab der Stichproben-Datenbank
- – das rechnerverfügbares Abbild Abb(j) der Postsendung Ps(j), das die Zeichenfolge X[j] zeigt,
- – die eindeutige Kennung K(j) der Postsendung Ps(j), die in codierter Form auf der Postsendung Ps(j) aufgedruckt ist, und
- – jeweils eine Codierung jedes Soll-Leseergebnisses für diese Postsendung.
- The computer-accessible image Abb (j) of the mail item Ps (j) showing the string X [j]
- - The unique identifier K (j) of the mail item Ps (j), which is printed in coded form on the mail item Ps (j), and
- - One coding of each desired reading result for this mail item.
Die Kennung K(j) verbindet also die Postsendung Ps(j) mit dem Datensatz für die Postsendung Ps(j).The Identifier K (j) thus connects the mail item Ps (j) with the data record for the mail item Ps (j).
In
der Stichproben-Datenbank
Jedes Abbild Abb(1), ..., Abb(N), das zu den N abgespeicherten Abbildern gehört, fungiert als eine Sensorwerte-Menge der Stichprobe.each Image Abb (1), ..., Abb (N), the images stored to the N belongs, acts as a sensor value set of the sample.
Für
das lösungsgemäße Verfahren werden für
jeden Parameter P(i) des Klassifikators
In
einem weiteren vorbereitenden Schritt wird festgestellt, welche
Ergebnisse der Klassifikator
In
diesem weiteren vorbereitenden Schritt wird also der Klassifikator
Hierdurch
wird für jeden Parameter P(i) die Menge V(i) von Abbildern
ermittelt, zu deren Auswertung der Algorithmus Al den Wert des Parameters
P(i) verwendet, wobei der Algorithmus Al und damit der Klassifikator
In
einem nachfolgenden vorbereiten Schritt werden die fehlerhaft oder
wenigstens unvollständig gelesenen Abbilder der Stichprobe
ermittelt.
Wie
gerade beschrieben, wird der Klassifikator
Möglich ist aber auch, die N1 fehlerhaft oder unvollständig gelesenen Abbilder von einem einzelnen Rechner ermitteln zu lassen, nämlich dann, wenn die Aufteilung und Synchronisierung mehr Zeit benötigt als durch die Parallelisierung eingespart wird.Possible But also, the N1 is read incorrectly or incompletely Images from a single computer, namely then, if the splitting and synchronization takes more time as saved by the parallelization.
In
den drei Schritten der Parametrierung wird wiederholt probeweise
mindestens eine Zeichenfolge gelesen. Jede wiederholt gelesene Zeichenfolge
ist eine der N Zeichenfolgen auf einer der N Postsendungen Ps(1),
..., Ps(N) der Stichprobe. Hierbei wertet der Klassifikator
Jedes Ist-Leseergebnis wird mit dem mindestens einen Soll-Leseergebnis verglichen, die in dem Datensatz für diese Postsendung enthalten ist.each Actual reading result is with the at least one desired reading result compared that in the record for this mailing is included.
Im Ausführungsbeispiel liefert jeder Vergleich genau eines der folgenden Ergebnisse:
- – Zeichenfolge vollständig richtig gelesen,
- – Zeichenfolge nur unvollständig gelesen, der gelesene Teil ist richtig,
- – Zeichenfolge wenigstens teilweise falsch gelesen,
- – Zeichenfolge konnte nicht automatisch gelesen werden („reject”).
- - string read completely correctly,
- - string is only read incompletely, the part read is correct,
- - string at least partially misread,
- - String could not be read automatically ("reject").
Wie oben erwähnt, werden verschiedene Arten von Lesefehlern unterschieden, falls die Zeichenfolge eine Adresse ist. Diese verschiedenen Arten von Lesefehlern führen zu weiteren unterschiedlichen Ergebnissen, die der Vergleich haben kann.As mentioned above, will be different types of reading errors if the string is an address. These different Types of read errors lead to further different ones Results that the comparison can have.
Im
Ausführungsbeispiel werden im ersten Schritt zunächst
beeinflussende Parameter ausgewählt. Nur diese beeinflussenden Parameter
werden im weiteren Verlauf der Parametrierung variiert und optimiert.
Die übrigen Parameter behalten ihren jeweiligen Initialwert
Ini(i) als Wert.
Wie
oben erwähnt, wird in einer Ausgestaltung in dem weiteren
vorbereitenden Schritt eine Tracing-Funktion verwendet. Für
jeden Parameter P(i) wird die Menge V(i) ermittelt, die aus denjenigen
Abbildern der Stichprobe besteht, zu deren Auswertung der Klassifikator
Um die beeinflussenden Parameter auszuwählen, werden im ersten Schritt für jeden Parameter die N1 ausgewählten Abbilder Abb[i(1)], Abb[i(2)], ..., Abb[i(N1)] der Postsendungen jeweils (m + 1)-mal ausgewertet, um die Zeichenfolge zu lesen. Im Lesedurchgang für den Parameter P(i) (i = 1, ..., n) wird jeder andere Parameter P(j) (j = 1, ..., n; j # i) auf den vorgegebenen Initialwert Ini(j) gesetzt. Für den Parameter P(i) werden der Initialwert w[i, 0] ≔ Ini(i) und m verschiedene weitere Werte w[i, 1], ..., w[i, m] aus dem Wertebereich W[i] von P(i) vorgegeben. Die m weiteren Werte werden z. B. ausgewählt, indem m/2 Werte größer und m/2 Werte kleiner als der Initialwert ausgewählt werden.Around the influencing parameters are selected in the first Step for each parameter the N1 selected Images Abb [i (1)], Abb [i (2)], ..., Abb [i (N1)] of the mail evaluated (m + 1) times to read the string. in the Read pass for the parameter P (i) (i = 1, ..., n) every other parameter P (j) (j = 1, ..., n; j # i) to the given Initial value Ini (j) is set. For parameter P (i), the Initial value w [i, 0] ≔ Ini (i) and m various others Values w [i, 1],..., W [i, m] are given from the value range W [i] of P (i). The m further values are z. B. selected by m / 2 Values greater and m / 2 values less than the initial value to be selected.
Für
jeden dieser m Werte für den Parameter P(i) wird der Klassifikator
Wird
der Klassifikator
Für jedes ausgewählte Abbild Abb[i(l)] (l = 1, ..., N1) werden zwei Fälle unterschieden:
- – Das
Ergebnis des Vergleichs zwischen dem jeweiligen Ist-Leseergebnis
(der gelesenen Zeichenfolge), das der Klassifikator
2 liefert, und dem abgespeicherten bestmöglichen Soll-Leseergebnis X[i(l)] (der richtigen Zeichenfolge), ist für jeden der m + 1 untersuchten Werte des Parameters P(i) dasselbe. - – Das Ergebnis des Vergleichs fällt für
verschiedene Werte von P(i) unterschiedlich aus, die Ergebnisse des
Klassifikators
2 hängen also bei diesem Abbild einer Postsendung davon ab, welchen Wert der Parameter P(i) hat.
- - The result of the comparison between the respective actual read result (the read string), the classifier
2 and the stored best-possible read-only result X [i (l)] (the correct string), is the same for each of the m + 1 examined values of the parameter P (i). - The result of the comparison differs for different values of P (i), the results of the classifier
2 In the case of this image of a mail item, therefore, the value of the parameter P (i) depends on it.
In
der Veranschaulichung von
Ein Parameter P(i) wird als beeinflussender Parameter ausgewählt, wenn das Ergebnis des Vergleichs für diesen Parameter und für mindestens ein Abbild unter den N1 ausgewählten Abbildern Abb[i(1)], Abb[i(2)], ..., Abb[i(N1)] bei unterschiedlichen Parameterwerten für P(i) unterschiedlich ausfällt. Liefert der Vergleich hingegen für jedes der N1 Abbilder und für jeden untersuchten Wert des Parameters dasselbe Ergebnis, so wird der Parameter nicht als beeinflussender Parameter behandelt und behält seinen Initialwert als Wert.One Parameter P (i) is selected as an influencing parameter, if the result of the comparison for this parameter and selected for at least one image among the N1 Images Fig [i (1)], Fig [i (2)], ..., Fig [i (N1)] for different Parameter values for P (i) varies differently. Returns the comparison for each of the N1 images and for each value of the parameter examined the same Result, the parameter does not become an influencing parameter treats and keeps its initial value as a value.
Zunächst
wird das Ist-Leseergebnis Ist[i(j)] ermittelt, das der Klassifikator
Wie
gerade beschrieben und durch
Für
jeden beeinflussenden Parameter P[i(j)] (j = 1, ..., n1) werden
nunmehr alle N Abbilder der Stichprobe untersucht. Ermittelt werden
diejenigen Abbilder, für die der Vergleich bei ver schiedenen
Werten für P(i) unterschiedlich ausfällt. Diese
Ermittlung veranschaulicht
Dadurch wird im ersten Schritt für jeden beeinflussenden Parameter P(i) jeweils eine Menge T(i) von beeinflussten Abbildern ermittelt. Die Abbilder-Menge T(i) besteht aus den Abbildern derjenigen N Postsendungen der Stichprobe, für die das Ergebnis des Vergleichs zwischen
- – dem Ist-Leseergebnis, das der parametrierte
Klassifikator
2 liefert, und - – dem abgespeicherte Soll-Leseergebnis
- - the actual read result, which is the parameterized classifier
2 delivers, and - - the stored target reading result
In einer Ausgestaltung werden für jeden beeinflussenden Parameter P(i) die von P(i) beeinflussten Sensorwerte-Mengen aus allen N Abbildern der Stichprobe ausgewählt.In an embodiment are for each influencing parameter P (i) the sensor value quantities influenced by P (i) from all N images selected from the sample.
In
einer bevorzugten Ausgestaltung wird das Ergebnis der Tracing-Funktion
wiederverwendet, um den Suchraum einzuschränken. Dank dieser
Ausgestaltung werden sowohl die beeinflussenden Parameter schneller
ermittelt als auch die beeinflusste Sensorwerte-Mengen schneller
berechnet. Wie oben dargelegt, wird für jeden Parameter
P(i) je eine Menge V(i) berechnet, nämlich die Menge derjenigen
Sensorwerte-Mengen (Abbilder) der Stichprobe, zu deren Auswertung
der Klassifikator
Das Verfahren wird zunächst für den beeinflussenden Parameter P(1) erläutert. Beispielsweise beträgt der Initialwert für den Parameter P(1) 196. Folgende m = 4 weiteren Werte für P(1) werden verwendet: 176, 190, 202, 216, also 196 ± 6 und 196 ± 20. In einer bevorzugten Ausgestaltung liegen die weiteren Werte also symmetrisch um den Initialwert.The Procedure is first for the influencing Parameter P (1) explained. For example, the Initial value for parameter P (1) 196. Following m = 4 further values for P (1) are used: 176, 190, 202, 216, ie 196 ± 6 and 196 ± 20. In a preferred Embodiment, the other values are symmetrical about the Initial value.
Die
folgende Tabelle veranschaulicht das Ergebnis. Jede Zeile steht
für eine Postsendung.
In
diesem Beispiel werden nur die Leseergebnisse für die Postsendungen
Ps(1) und Ps(2) – genauer: für die Abbilder der
Postsendungen Ps(1) und Ps(2) – von der Wahl des Werts
für den Parameter P(1) beeinflusst. Für die Postsendungen
Ps(3), ..., Ps(N) liefert der Klassifikator
Dies
wird für jeden weiteren Parameter durchgeführt,
z. B. auch für den Parameter P(2). Der Initialwert für
diesen Parameter P(2) beträgt 65. Folgende m = 4 weiteren
Werte für P(2) werden verwendet: 45, 58, 72, 85, also 65 ± 7
und 65 ± 20.
In diesem Beispiel werden nur die Leseergebnisse für die Postsendungen Ps(1) und Ps(N) von der Wahl des Werts für den Parameter P(2) beeinflusst.In In this example, only the reading results for the mailings Ps (1) and Ps (N) of the choice of value for the parameter P (2) influences.
Dies
wird für jeden beeinflussenden Parameter durchgeführt.
Beispielhaft wird das Ergebnis für den letzten Parameter
P(n) erläutert, der ein beeinflussender Parameter ist.
Der Initialwert für P(n) beträgt 118. Folgende
m = 4 weiteren Werte für P(n) werden verwendet: 103, 111,
125, 133, also 118 ± 7 und 118 ± 15.
In diesem Beispiel werden nur die Leseergebnisse für die Postsendungen Ps(2) und Ps(3) von der Wahl des Werts für den Parameter P(n) beeinflusst.In In this example, only the reading results for the mailings Ps (2) and Ps (3) of the choice of value for the parameter P (n) influences.
Als
Ergebnis des ersten Schritts wird für jeden Parameter P(i)
jeweils eine Teilmenge T(i) der Stichprobe ermittelt, die aus den
N(i) beeinflussten Abbildern (i = 1, ..., n) besteht. Die Abbilder-Menge
T(i) besteht aus N(i) Datensätzen mit N(i) Abbildern von
Postsendungen – vorzugsweise in Form einer Indexmenge,
also einer Teilmenge von {1, 2, ..., N}. Jeder Datensatz steht für
eine Postsendung und umfasst die m + 1 Ist-Leseergebnisse, die der
Klassifikator
Auch
diese Berechnung der beeinflussenden Sensorwerte-Mengen (Abbilder)
lässt sich parallel auf den p Satelliten-Rechnern ausführen,
die in
Im
obigen Beispiel liefert der erste Schritt für die beeinflussenden
Parameter P(1), P(2) und P(n) folgende Ergebnisse: N(1) = N(2) =
N(n) = 2 und
Im Ausführungsbeispiel wird der zweite Schritt für jeden Parameter P(i) durchgeführt, für den die Anzahl N(i) > 0 ist, also für jeden Parameter, der die Auswertung mindestens eines Abbilds der Stichprobe beeinflusst. Falls für einen Parameter P(i) die Anzahl N(i) = 0 ist, falls also P(i) sich auf kein Abbild einer Postsendung auswirkt, so wird im zweiten Schritt der Initialwert Ini(i) für P(i) verwendet und nicht mehr verändert.in the Embodiment will be the second step for every parameter P (i) for which the Number N (i)> 0, so for each parameter, the evaluation at least an image of the sample. If for one Parameter P (i) is the number N (i) = 0, so if P (i) is on does not affect an image of a mail item, so in the second step the initial value Ini (i) is used for P (i) and not anymore changed.
Im
zweiten Schritt wird jeder Parameter P(i) lokal optimiert, für
den N(i) > 0 ist (i
= 1, ..., n). Der zweite Schritt liefert für jeden beeinflussenden
Parameter P[i(j)] ein lokales Optimum Opt_l[i(j)] (j = 1, ..., n1).
Um einen beeinflussenden Parameter P[i(j)], für den also N[i(j)] > 0 ist, lokal zu optimieren, wird jedem der übrigen n – 1 Parametern als Wert jeweils ein Wert aus dem Wertebereich des jeweiligen Parameters zugewiesen. Vorzugsweise wird jedem übrigen Parameter P(l) der jeweils vorgegebene Initialwert Ini(l) zugewiesen (l = 1, ..., n; l # i[j]).Around to locally optimize an influencing parameter P [i (j)], for which N [i (j)]> 0, is given to each of the remaining n - 1 parameters as a value one value each from the value range of the respective parameter assigned. Preferably, every other parameter P (l) the respectively given initial value Ini (l) is assigned (l = 1,. n; l # i [j]).
Eine
lokale Optimierung wird durchgeführt, bei der in einer
Ausgestaltung nur der Parameter P[i(j)] veränderlich ist.
Der Parameter P[i(j)] wird hinsichtlich der vorgegebenen Bewertungsfunktion
Bew optimiert, und zwar von einem lokalen Optimierer
Die
n1 beeinflussenden Parameter lassen sich unabhängig voneinander
optimieren. Die n1 lokalen Optimierungen lassen sich daher auf bis
zu n1 verschiedenen Rechner aufteilen, z. B. auf die p Satelliten-Rechner,
die in
Der
zweite Schritt wird zunächst am Beispiel des Parameters
P(1) erläutert. Die Menge T(1) ist:
Vorgegeben
wird eine Schrittweite S1(1), z. B. S1(1) = 1. Der Wert für
P(1) wird beginnend bei 176 wiederholt um S1(1) erhöht.
Die übrigen Parameterwerte bleiben unverändert.
Der Klassifikator
Das lokale Optimum für P(2), das mittels der Teilmenge T(2) der von P(2) beeinflussten Abbilder gefunden wird, ist z. B. 55. Das lokale Optimum für P(3), das mittels der Abbilder-Menge T(3) gefunden wird, ist z. B. 123.The local optimum for P (2) obtained by subset T (2) which is affected by P (2) affected images is z. B. 55. The local optimum for P (3), by means of the image set T (3) is found, z. 123.
Wie
oben dargelegt, muss der Klassifikator
In einer Ausgestaltung werden die lokalen Optima der n1 beeinflussenden Parameter unabhängig voneinander ermittelt. Hierbei werden n1 Optimierungen von je einer Funktion mit einer Veränderlichen durchgeführt. Die übrigen Parameter bleiben während einer solchen lokalen Optimierung konstant. Diese lokalen Optimierungen lassen sich auf verschiedene Rechner verteilen, z. B. auf die p Satelliten-Rechner.In one embodiment, the local optima of the n1 influencing parameters are determined independently. In this case, n1 optimizations are performed by one function each with one variable leads. The remaining parameters remain constant during such local optimization. These local optimizations can be distributed to different computers, eg. B. on the p satellite computers.
In
einer anderen Ausgestaltung wird die Klassifikationsleistung verbessert,
indem nach Parameter-Clustern von stark korrelierten beeinflussenden
Parametern gesucht wird. Den stark korrelierten Parameter eines
solchen Parameter-Clusters lassen sich zwar unabhängig
voneinander Werte zuweisen, und sie lassen sich unabhängig
voneinander lokal optimieren. Jedoch wird die Klassifikationsleistung
des Klassifikators
Ein derartiger Parameter-Cluster von mehreren korrelierten Parametern zeichnet sich dadurch aus, dass die Parameter dieses Clusters stark korreliert sind und daher im Wesentlichen dieselben Abbilder der Stichprobe beeinflussen.One such parameter cluster of several correlated parameters is characterized by the fact that the parameters of this cluster are strong correlated and therefore essentially the same images of the sample influence.
Wie oben dargelegt, wird im ersten Schritt für jeden beeinflussenden Parameter P(i) eine Teilmenge T(i) derjenigen Abbilder der Stichprobe, die von P(i) beeinflusst werden, ermittelt. T(i) besteht aus N(i) Abbildern. Vorzugsweise werden nur Parameter-Cluster von jeweils zwei beeinflussenden Parametern ermittelt; möglich ist aber auch ein Parameter-Cluster mit mehr als zwei Parametern.As outlined above, is the first step for each influencing Parameter P (i) a subset T (i) of those images of the sample, which are influenced by P (i) determined. T (i) consists of N (i) Images. Preferably only parameter clusters of each determines two influencing parameters; is possible but also a parameter cluster with more than two parameters.
Um Parameter-Cluster mit zwei beeinflussenden und korrelierten Parametern zu ermitteln, wird für jedes Paar P(i), P(j) von beeinflussenden Parametern ein Korrelationsmaß Korr(i, j) berechnet. Vorzugsweise liegt dieses Korrelationsmaß zwischen 0 und 1 (einschl.) und wird gemäß folgender Rechenvorschrift berechnet: In order to determine parameter clusters with two influencing and correlated parameters, a correlation measure Korr (i, j) is calculated for each pair P (i), P (j) of influencing parameters. This correlation measure is preferably between 0 and 1 (incl.) And is calculated according to the following calculation rule:
Hierbei bezeichnet card(A) die Anzahl der Elemente einer Menge A, A ∩ B ist die Schnittmenge („intersection”) und A ∪ B die Vereinigungsmenge („union”) zweier Mengen A und B. Das Korrelationsmaß Korr(i, j) ist gleich 1, wenn P(i) und P(j) die gleichen Mengen T(i) bzw. T(j) beeinflussen, wenn also T(i) = T(j) beeinflussen.in this connection card (A) denotes the number of elements of a set A, A ∩ B is the intersection and A ∪ B the union (union) of two sets A and B. The correlation measure Korr (i, j) is equal to 1 when P (i) and P (j) influence the same sets T (i) and T (j), respectively So T (i) = T (j) influence.
Für
die n1 beeinflussenden Parameter werden somit
Eine Korrelationsschwelle Korr_min wird vorgegeben, z. B. 0,8. Jeder beeinflussende Parameter gehört zu keinem oder genau einem Parameter-Cluster. Die beiden Parameter mit dem höchsten Korrelationsmaß bilden den ersten Parameter-Cluster. Unter den verbleibenden n1 – 2 beeinflussenden Parametern bilden die beiden Parametern mit dem zweithöchsten Korrelationsmaß den zweiten Parameter-Cluster und so fort, bis die verbleibenden Parameter alle mit Korrelationsmaßen unterhalb der Korrelationsschwelle Korr_min korreliert sind.A Correlation threshold Korr_min is specified, z. B. 0.8. Everyone affecting parameters belongs to none or exactly one Parameters cluster. The two parameters with the highest Correlation measure the first parameter cluster. Under the remaining n1 - 2 influencing parameters form the both parameters with the second highest correlation measure the second parameter cluster and so on until the remaining parameters all with correlation measures below the correlation threshold Correl_min are correlated.
Für
jeden Parameter-Cluster wird eine lokale Optimierung durchgeführt.
Hierbei sind die beiden beeinflussenden Parameter P(i), P(j) des
Parameter-Clusters während der lokalen Optimierung veränderlich,
und jeder andere Parameter P(k) behält seinen jeweiligen
Initialwert Ini(k). Durch die lokale Optimierung wird für P(i)
und P(j) jeweils ein optimaler Wert Opt_l(i) bzw. Opt_l(j) gefunden.
Bei der lokalen Optimierung wird der Klassifikator
Der zweite Schritt liefert also für jeden beeinflussenden Parameter P[i(j)] jeweils ein lokales Optimum Opt_l[i(j)], welches nur mittels derjenigen Postsendungs-Abbilder gefunden wurde, deren Leseergebnis von diesem Parameter überhaupt beeinflusst wird.Of the second step thus provides for each influencing parameter P [i (j)] in each case a local optimum Opt_l [i (j)], which only by means of those mailing images were found whose reading result is influenced by this parameter at all.
In
einem dritten Schritt wird ein globales Optimum für den
gesamten Satz der n Parameter ermittelt, und zwar von einem globalen
Optimierer
Der
globale Optimierer
Bei der globalen Optimierung werden nur die beeinflussenden n1 Parameter variiert, also diejenigen Parameter, für die im ersten Schritt jeweils eine nichtleere Teilmenge von beeinflussten Abbildern und im zweiten Schritt ein lokales Optimum berechnet wurde.at The global optimization will only affect the n1 parameters varies, ie those parameters for which in the first Step one non-empty subset of affected images and in the second step, a local optimum was calculated.
Zu Beginn der globalen Optimierung des dritten Schritts wird jedem Parameter ein Startwert zugewiesen. Als Startwert für einen nicht beeinflussenden Parameter wird vorzugsweise der Initialwert verwendet.To The beginning of the global optimization of the third step will be everyone Parameter assigned a start value. As starting value for a non-influencing parameter is preferably the initial value used.
Der Startwert für einen beeinflussenden Parameter hängt im allgemeinen Fall vom vorgegebenen Initialwert oder von dem lokalen Optimum ab, welches im zweiten Schritt berechnet wurde. In einer Ausgestaltung wird als Startwert für jeden Parameter P(i) dessen jeweiliger Initialwert Ini(i) verwendet. Beim globalen Optimieren wird jeder Parameter nur innerhalb seines Wertebereichs variiert.Of the Start value for an influencing parameter depends in the general case, from the given initial value or from the local one Optimum, which was calculated in the second step. In a Embodiment is used as starting value for each parameter P (i) whose initial value Ini (i) is used. For global optimization each parameter is only varied within its value range.
Weil
im dritten Schritt nur die n1 beeinflussenden Parameter variiert
werden, sind bei der globalen Optimierung viel weniger Parameter
zu variieren, als wenn die Parametrierungseinheit
In
einer Ausgestaltung wird im dritten Schritt der probeweise parametrierte
Klassifikator
In
einer alternativen Ausgestaltung wird der probeweise parametrierte
Klassifikator
Bei
der globalen Optimierung wird vorzugsweise ein schrittweises Optimierungsverfahren
verwendet, z. B. eine Methode des steilsten Anstiegs. Hierfür
werden alle beeinflussenden Parameter auf ihr jeweiliges lokales
Optimum zu verändert. Diese jeweilige Richtung auf das
lokale Optimum liefert eine „brauchbare Richtung” für
das Anstiegsverfahren, das z. B. in
In einer Ausgestaltung, die Rechenzeit einspart, werden für jeden beeinflussenden Parameter P(i) x Werte w[i, 1], ..., w[i, x] aus dem Wertebereich W[i] des beeinflussenden Parameters P(i) ausgewählt. Vorzugsweise wird w[i, 1] ≔ Ini(i) und w[i, x] ≔ Opt_l(i) gesetzt. Falls der Initialwert Ini(i) kleiner als das lokale Optimum Opt_l(i) ist, so werden die Werte so gewählt, dass w[i, 1] < w[i, 2] < ... < w[i, x] gilt. Im anderen Fall werden sie so gewählt, dass w[i, 1] > w[i, 2] > ... > w[i, x] gilt. Falls Ini(i) = Opt_l(i), so wird dieser Parameter P(i) im dritten Schritt nicht variiert, sondern behält seinen Wert Ini(i) = Opt_l(i).In an embodiment that saves computing time, are for each influencing parameter P (i) x values w [i, 1], ..., w [i, x] from the value range W [i] of the influencing parameter P (i) selected. Preferably, w [i, 1] ≔ Ini (i) and w [i, x] ≔ Opt_l (i). If the initial value Ini (i) is smaller than the local optimum Opt_l (i), then the values become chosen so that w [i, 1] <w [i, 2] <... <w [i, x]. in the otherwise, they are chosen such that w [i, 1]> w [i, 2]> ...> w [i, x]. If Ini (i) = Opt_l (i), this parameter P (i) becomes the third step does not vary but retains its value Ini (i) = Opt_l (i).
Der
Klassifikator
Anschließend
werden die dergestalt erreichten Klassifikationsleistungen verglichen.
Die beste Klassifikationsleistung erzielt der Klassifikator
Die
x Klassifikationsläufe des Klassifikators
Das Optimierungsverfahren des dritten Schritts wird beendet, wenn mindestens ein vorgegebenes Abbruchkriterium erfüllt ist, z. B. wenn eine vorgegebene Anzahl von Iterationen durchgeführt wurde oder die Zielfunktions-Werte für die letzten r untersuchten Parameterwerte-Sätze um weniger als einen vorgegebenen Schwellwert differieren. Weitere mögliche Abbruchkriterien sind, dass die Laufzeit, die die Durchführung der globalen Optimierung bislang verbraucht hat, eine vorgegebene Zeitschranke erreicht hat oder dass im dritten Schritt eine vorgegebene Anzahl von Iterationen durchgeführt wurde. Möglich ist auch, dass der dritte Schritt dann abgebrochen wird, wenn mindestens eines von mehreren vorgegebenen Abbruchkriterien erfüllt ist.The Optimization procedure of the third step is terminated if at least a predetermined abort criterion is met, z. For example a predetermined number of iterations has been performed or the goal function values for the last r examined Parameter value sets less than a predetermined threshold differ. Other possible termination criteria are that the term, the implementation of the global optimization so far has reached a predetermined time limit or that in the third step a predetermined number of iterations was carried out. It is also possible that the third step is then canceled if at least one of several predetermined termination criteria is met.
Wie
oben dargelegt, muss der Klassifikator
Nach
dem dritten Schritt ist jedem Parameter jeweils ein Wert zugewiesen.
Im Ausführungsbeispiel behält hierbei jeder nicht
beeinflussende Parameter seinen Initialwert. Jeder beeinflussende
Parameter erhielt probeweise verschiedene Werte und erhält
abschließend einen Wert, der – zusammen mit den übrigen
Parameterwerten – zu einem gut parametrierten Klassifikator
Ein schrittweises Optimierungsverfahren liefert aber in der zur Verfügung stehenden Rechenzeit nicht notwendigerweise ein Optimum. Daher wird in einer Ausgestaltung die Parametrierung in mehreren Parametrierungsläufen durchgeführt.One but gradual optimization process provides in the not necessarily an optimum. Therefore, will In one embodiment, the parameterization in several parameterization runs carried out.
Vor jedem Parametrierungslauf wird jedem Parameter jeweils ein Startwert zugewiesen. Im Verlaufe jedes Parametrierungslaufs werden die drei oben beschriebenen Schritte durchge führt, wofür die N Abbilder Abb(1), ..., Abb(N) der Stichprobe verwendet werden. Jeder Parametrierungslauf liefert jeweils einen Wert für jeden beeinflussenden Parameter. Möglich ist, dass ein Parameter in einem Parametrierungslauf ein beeinflussender Parameter ist und im nächsten nicht mehr, weil es von den Werten anderer Parameter abhängen kann, ob ein Parameter als beeinflussender Parameter ermittelt wird oder nicht.In front Each parameterization run is assigned a start value for each parameter assigned. During each parameterization run, the three steps described above performs what the N images Abb (1), ..., Abb (N) of the sample are used. Each parameterization run returns one value for each influencing parameters. It is possible that a parameter is an influencing parameter in a parameterization run and not in the next, because it is different from the values of others Parameter may depend on whether a parameter is influencing Parameter is determined or not.
Beim ersten Parametrierungslauf werden die vorgegebenen Initialwerte Ini(1), ..., Ini(n) als Startwerte der Parameter verwendet. Bei jedem weiteren Parametrierungslauf werden als Startwerte diejenigen Parameterwerte Opt(1), ..., Opt(n) verwendet, die im vorhergehenden Parametrierungslauf als das globale Optimum berechnet wurden.At the The first parameterization run will be the default initial values Ini (1), ..., Ini (n) used as starting values of the parameters. at for each additional parameterization run, the starting values are those Parameter values Opt (1), ..., Opt (n) used in the preceding Parameterization run were calculated as the global optimum.
Die Durchführung von Parametrierungsläufen wird spätestens dann abgebrochen, wenn der erste Schritt eines Parametrierungslaufs das Ergebnis liefert, dass kein Parameter ein beeinflussender Parameter ist. Weitere Abbruchkriterien können sein:
- – Die
Bewertungsfunktion Bew, die der parametrierte Klassifikator
2 nach einem Parametrierungslauf erreicht, unterscheidet sich nur noch um weniger als eine vorgegebene Verbesserungs-Schranke von der aus dem vorhergehenden Parametrierungslauf. - – Eine vorgegebene Maximalanzahl von Parametrierungsläufen ist erreicht.
- – Die Parametrierung hat eine vorgegebene Zeitspanne an Rechenzeit verbraucht.
- - The valuation function Bew, which is the parameterized classifier
2 After reaching a parameterization run, the difference is only less than a predetermined improvement threshold from that from the previous parameterization run. - - A predefined maximum number of parameterization runs has been reached.
- - The parameterization has consumed a specified amount of computing time.
In
einer Ausgestaltung wird ermittelt, welche Auswirkung die Randbedingung,
dass die N2 Zustelladressen richtig zu lesen sind, auf die Leistung
des Klassifikators
In einer Abwandlung wird wiederum mindestens eines der N2 Abbilder ausgewählt. Dieses Abbild muss richtig klassifiziert werden. Weiterhin wird ein beeinflussender Parameter P[i(j)] so ausgewählt, dass das ausgewählte Abbild zu den vom ausgewählten beeinflussenden Parameter beeinflussten Abbildern gehört. Bei der abweichenden Durchführung der globalen Optimierung wird der ausgewählte beeinflussende Parameter P[i(j)] nicht mehr variiert, sondern behält den Wert Opt_l[i(j)] aus dem zweiten Schritt oder auch auf seinen Initialwert Ini(i) bei oder auch allgemeiner auf einen Wert, bei dem das ausgewählte Abbild richtig klassifiziert wird. Dadurch kann sichergestellt werden, dass ein bestimmtes Abbild richtig klassifiziert wird und dadurch eine Randbedingung erfüllt wird. Dies lässt sich auch für mehrere Parameter durchführen.In a modification, again at least one of the N2 images is selected. This image must be classified correctly. Furthermore, an influencing parameter P [i (j)] is selected such that the selected image belongs to the images influenced by the selected influencing parameter. If the global optimization is carried out differently, the selected influencing parameter P [i (j)] is no longer varied but retains the value Opt_l [i (j)] from the second step or also at its In Ini (i), or more generally, to a value that properly classifies the selected image. This can ensure that a particular image is properly classified, thereby satisfying a constraint. This can also be done for several parameters.
In
einer weiteren Randbedingung wird vorab gemessen, wie viel Zeit
der Klassifikator
ZITATE ENTHALTEN IN DER BESCHREIBUNGQUOTES INCLUDE IN THE DESCRIPTION
Diese Liste der vom Anmelder aufgeführten Dokumente wurde automatisiert erzeugt und ist ausschließlich zur besseren Information des Lesers aufgenommen. Die Liste ist nicht Bestandteil der deutschen Patent- bzw. Gebrauchsmusteranmeldung. Das DPMA übernimmt keinerlei Haftung für etwaige Fehler oder Auslassungen.This list The documents listed by the applicant have been automated generated and is solely for better information recorded by the reader. The list is not part of the German Patent or utility model application. The DPMA takes over no liability for any errors or omissions.
Zitierte PatentliteraturCited patent literature
- - US 7031512 B2 [0003] - US 7031512 B2 [0003]
- - US 7031519 B2 [0023] US 7031519 B2 [0023]
Zitierte Nicht-PatentliteraturCited non-patent literature
- - A. Berlanga et al.: ”Optimizing Statistical Character Recognition Using Evolutionary Strategies to Recognize Aircraft Tail Numbers”, EURASIP Journal on Applied Signal Processing 2004: 8, pp. 1125–1134 [0005] - A. Berlanga et al .: "Optimizing Statistical Character Recognition Using Evolutionary Strategies to Recognize Aircraft Tail Numbers", EURASIP Journal on Applied Signal Processing 2004: 8, pp. 1125-1134 [0005]
- - „Dubbel – Taschenbuch für den Maschinenbau”, 18. Aufl., Springer-Verlag, 1994, A120–A121, skizziert wird. [0176] - "Dubbel - paperback for mechanical engineering", 18th ed., Springer-Verlag, 1994, A120-A121, outlined. [0176]
Claims (26)
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE102009013390A DE102009013390A1 (en) | 2009-03-16 | 2009-03-16 | Method for automatic classification of physical object i.e. postal item, involves parameterizing classifier for classification of physical objects using parameter values that are computed by global optimization |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE102009013390A DE102009013390A1 (en) | 2009-03-16 | 2009-03-16 | Method for automatic classification of physical object i.e. postal item, involves parameterizing classifier for classification of physical objects using parameter values that are computed by global optimization |
Publications (1)
Publication Number | Publication Date |
---|---|
DE102009013390A1 true DE102009013390A1 (en) | 2009-09-24 |
Family
ID=40984231
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE102009013390A Withdrawn DE102009013390A1 (en) | 2009-03-16 | 2009-03-16 | Method for automatic classification of physical object i.e. postal item, involves parameterizing classifier for classification of physical objects using parameter values that are computed by global optimization |
Country Status (1)
Country | Link |
---|---|
DE (1) | DE102009013390A1 (en) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116562470A (en) * | 2023-07-10 | 2023-08-08 | 苏州毕恩思实验器材有限公司 | Parameter configuration management method and system for purification type fume hood |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7031512B2 (en) | 2002-04-18 | 2006-04-18 | Stmicroelectronics, Inc. | Method and system for 3D smoothing within the bound of error regions of matching curves |
US7031519B2 (en) | 2000-07-28 | 2006-04-18 | Raf Technology, Inc. | Orthogonal technology for character recognition |
-
2009
- 2009-03-16 DE DE102009013390A patent/DE102009013390A1/en not_active Withdrawn
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7031519B2 (en) | 2000-07-28 | 2006-04-18 | Raf Technology, Inc. | Orthogonal technology for character recognition |
US7031512B2 (en) | 2002-04-18 | 2006-04-18 | Stmicroelectronics, Inc. | Method and system for 3D smoothing within the bound of error regions of matching curves |
Non-Patent Citations (2)
Title |
---|
"Dubbel - Taschenbuch für den Maschinenbau", 18. Aufl., Springer-Verlag, 1994, A120-A121, skizziert wird. |
A. Berlanga et al.: "Optimizing Statistical Character Recognition Using Evolutionary Strategies to Recognize Aircraft Tail Numbers", EURASIP Journal on Applied Signal Processing 2004: 8, pp. 1125-1134 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116562470A (en) * | 2023-07-10 | 2023-08-08 | 苏州毕恩思实验器材有限公司 | Parameter configuration management method and system for purification type fume hood |
CN116562470B (en) * | 2023-07-10 | 2023-09-08 | 苏州毕恩思实验器材有限公司 | Parameter configuration management method and system for purification type fume hood |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DE60308025T2 (en) | IDENTIFICATION MARKING OF POSTS BY IMAGE SIGNATURE AND RELATED POST MACHINING MACHINE | |
DE112017005651T5 (en) | Device for classifying data | |
DE69926280T2 (en) | Method for recognizing addresses and letter processing device | |
EP2097182B1 (en) | Method of, and apparatus for, controlling the transportation of articles, and arrangement for transporting a plurality of articles | |
DE102019119138B4 (en) | Determination of distribution and/or sorting information for the automated distribution and/or sorting of a shipment | |
WO2007022880A1 (en) | Method for identifying mailings that are to be sorted | |
DE102009013390A1 (en) | Method for automatic classification of physical object i.e. postal item, involves parameterizing classifier for classification of physical objects using parameter values that are computed by global optimization | |
EP2259210A2 (en) | Method and device for analysing a database | |
DE102021204040A1 (en) | Method, device and computer program for creating training data in the vehicle | |
DE102008044893A1 (en) | Physical object e.g. aircraft, classifying method for reading e.g. service address on mail, involves parameterizing classifier for classification of physical object with parameter values that are computed during global optimization | |
EP1485865A2 (en) | Method and device for reading the addresses of mailings | |
EP2084652A1 (en) | Method and device for identifying objects | |
DE102007034948A1 (en) | Method and device for monitoring the transport of multiple objects | |
EP1159705B1 (en) | Method for reading document entries and addresses | |
DE102005040687A1 (en) | Method for retrieving text blocks in documents | |
EP1229483B1 (en) | Method and apparatus for reading parceladdresses with postcodes | |
EP1665136B1 (en) | Method for producing and/or updating learning and/or random test samples | |
EP1229484B1 (en) | Method and apparatus for reading parcel addresses with postcodes | |
DE102012221155A1 (en) | Method for providing evaluation matrix for recognizing traffic sign to vehicle e.g. motor vehicle, involves associating evaluation matrix rows or columns of training matrix and irrelevant traffic sign with irrelevant classes | |
DE102021205897A1 (en) | Examine a training data set | |
DE102020205535A1 (en) | Characterization, training and application of image classifiers | |
DE102021214474A1 (en) | COMPUTER-IMPLEMENTED METHOD FOR OPTIMIZING AN ALGORITHM FOR DETECTING AN OBJECT OF INTEREST OUTSIDE A VEHICLE | |
DE102021003677A1 (en) | Method for improving traffic sign recognition | |
DE102021101107A1 (en) | Procedures for troubleshooting support systems | |
WO2023135244A1 (en) | Method and system for automatically annotating sensor data |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
OAV | Publication of unexamined application with consent of applicant | ||
R119 | Application deemed withdrawn, or ip right lapsed, due to non-payment of renewal fee |
Effective date: 20111001 |