EP1425709A2 - Model-based object classification and target recognition - Google Patents

Model-based object classification and target recognition

Info

Publication number
EP1425709A2
EP1425709A2 EP02769950A EP02769950A EP1425709A2 EP 1425709 A2 EP1425709 A2 EP 1425709A2 EP 02769950 A EP02769950 A EP 02769950A EP 02769950 A EP02769950 A EP 02769950A EP 1425709 A2 EP1425709 A2 EP 1425709A2
Authority
EP
European Patent Office
Prior art keywords
preprocessing
feature
image
target recognition
features
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
EP02769950A
Other languages
German (de)
French (fr)
Inventor
Henrik Baur
Helmuth Eggers
Lars KRÜGER
Rainer Ott
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Airbus Defence and Space GmbH
Original Assignee
EADS Deutschland GmbH
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by EADS Deutschland GmbH filed Critical EADS Deutschland GmbH
Publication of EP1425709A2 publication Critical patent/EP1425709A2/en
Withdrawn legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/255Detecting or recognising potential candidate objects based on visual cues, e.g. shapes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/62Text, e.g. of license plates, overlay texts or captions on TV images
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V2201/00Indexing scheme relating to image or video recognition or understanding
    • G06V2201/07Target detection

Definitions

  • the present invention relates generally to a model-based object classification and target recognition and in particular to a structure and the processing of models for object classification and position determination.
  • the rules for when a feature of a model is to be checked are either as firmly programmed as the feature itself or are determined from the geometry of the object.
  • the image is first read in, then it is preprocessed and then the matching is carried out. This leads to, that in the known systems either all preprocessing, the results of which are contained in any model, must be carried out, or that permanently implemented tests have to be carried out that circumvent this.
  • Another object of the present invention is to provide a method for object classification and target recognition that minimizes the number of preprocessing steps.
  • Fig. 2 shows the detailed flow of the matching block of Fig. 1;
  • FIG. 3 shows an image acquired in the image recording block of FIG. 1;
  • FIG. 4 shows a region (ROI) surrounding the searched objects, which region consists of a rectangular partial section of the image of FIG. 3; and FIGS. 5a to 5e using the example of the edge receptor as the feature request works.
  • the present invention is based on the knowledge that certain features are only visible from special views. So z. B. the windows of the cargo hold doors of helicopters only visible from the side, but not from other angles. The same applies to the lighting conditions, which allow the detection of cargo hold doors or other elements of helicopters (such as wheels, carrying load, etc.) only under certain lighting conditions. Therefore, according to the present invention, at least one feature to be recognized is linked to at least one condition or at least one rule. Of course, it is possible to link a large number of features with respective specific conditions and / or to associate several conditions with a single feature to be recognized. Under these circumstances, only those features would have to be extracted from the image in which the respectively linked condition is fulfilled. In other words, object classification and / or target recognition does not have to be carried out for a cargo hold door which, depending on the position of the helicopter, cannot be visible in relation to a camera.
  • the possibility was found to store various features (so-called “features”, eg edges, surface areas, hot spots) in the model in a simple and consistent manner and to carry out the extraction of these features in an effective manner.
  • features eg edges, surface areas, hot spots
  • each feature that can be recognized is provided with a condition that determines its applicability.
  • the algorithm of this condition is freely programmable and not only limited to the geometry of the object.
  • the condition can also examine, for example, the distance of the object to be recognized from the camera, the lighting conditions (e.g. contrast), speed, height, relative position, etc.
  • the redundant work caused by the "invisibility” or “non-detection” of a feature can be omitted and the method made more robust according to the invention at the same time, since missing features do not lead to a poorer evaluation of the model.
  • each feature that fulfills a condition and is therefore required in a preprocessing of a sub-step of the image processing is requested by this sub-step.
  • the order of preprocessing and the algorithm of the sub-step are stored in the model (e.g. as the number of a function in a list of available functions). This avoids the unnecessary work in a rigid arrangement of image acquisition, preprocessing and classification / localization.
  • the handling of the request is to carry out the preprocessing and to store and provide the result or, if already available, to provide the stored result without performing a recalculation.
  • existing preprocessing or series of preprocessing can be called up quickly from a cache.
  • preprocessing 1 is carried out for a feature A and preprocessing 1, 2 and 3 are required for a further feature B, the buffered preprocessing 1 of feature 1 according to the invention can be accessed, thus reducing the processing time.
  • the method for preprocessing described above can be implemented according to the invention independently of the knowledge that certain features are only visible from special views.
  • the present preprocessing can be carried out independently of the link to one of the specific conditions, although the combination of the two features has a particularly advantageous effect in terms of the computational complexity and robustness of the system.
  • the method for preprocessing according to the invention is particularly advantageous compared to the prior art. This is what DG Löwe recognizes in "Fitting Parametrized Three-Dimensional Models To Images", IEEE Transact. on Pattern Analysis and Machine Intelligence, Vol. 13, No. 5, 1991, presented method the object sought by means of edges.
  • the free parameters are expressed as parameterized curves and the free parameters (spatial position and internal degrees of freedom) are determined by an approximation method.
  • the method is relevant in that it stores geometric preprocessing in a cache.
  • the cache of the known Löwe method only relates to visibility conditions, while the cache or buffer memory according to the invention is not limited in the type of preprocessing.
  • the visibility conditions are also only determined from the geometry of the object and cannot be freely selected. Otherwise, the Löwe process is a typical representative of processes with permanently implemented preprocessing.
  • FIGS. 1 to 5e A currently particularly preferred embodiment of the invention will now be explained with reference to the accompanying FIGS. 1 to 5e.
  • This embodiment can be modified in a manner well known to those skilled in the art and it is in no way intended to limit the scope of the invention to the example below. Rather, the scope of protection is determined by the features of the claims and their equivalents.
  • step 1 shows a sequence of object recognition at the top level.
  • step 1 the acquisition of the image with a camera, loading of a stored image or generation of a VR image takes place in the image recording block.
  • An image acquired in the image recording block of FIG. 1 is shown by way of example in FIG. 3.
  • step 2 there is a simple and quick rough detection of the object in the image, i. H. the specification of a rectangular region that largely encloses the objects sought.
  • the abbreviation ROI denotes this region surrounding the sought objects, which can be seen with reference to FIG. 4.
  • Methods for determining such an ROI are known per se. These include threshold value methods, pixel classification etc.
  • the ROI currently formed must also be assigned to an ROI from the last image.
  • step 3 a decision is made as to whether the object in the region of interest has been provided with an ROI for the first time or not. This step is necessary because there are no hypotheses to be tested yet that are assigned to the ROI and therefore the hypotheses cannot yet be checked.
  • step 3 If the decision in step 3 is "yes”, the hypothesis initialization takes place in step 4.
  • the decision in step 3 is "no”
  • the hypothesis update is carried out in step 5.
  • the new position created by the movement of the object in space must be adapted to the position of the object in the image.
  • a movement prediction known in the prior art is carried out by means of a tracker (for example a Cayman filter).
  • step 5 of FIG. 1 the matching described in detail with reference to FIG. 2 takes place.
  • step 6 of FIG. 1 the 2D-3D pose estimation is implemented. From the change in position of the receptors and the assumed position of the receptors in space (from hypothesis), the change in position of the object in space can be estimated using the 2D-3D pose estimation. Methods for this are known in the prior art (see e.g. Haralick: Pose Estimation from Corresponding Point Data, IEEE Transactions on Systems, Man and Cybernetics, Vol. 19, No. 6, Nov./Dec. 1989).
  • step 7 the quality of the model is determined. This is necessary because the matching violates the rigidity property of the object.
  • the pose estimation and re-projection ensure rigidity, since errors in individual receptors are averaged and a single pose (6 degrees of freedom) is created for all receptors.
  • Another matching in the same picture is useful to get the best possible result, i. H. to achieve the smallest possible error between the hypothesis and the image. Therefore, in the event of deterioration (or very small improvement), it is assumed that the optimal point has already been reached.
  • step 8 of FIG. 1 (“Classification" block) all hypotheses, in particular their quality values, of an ROI are evaluated.
  • the classification results either the decision for a certain class and pose (by selecting or combining pose values of different hypotheses) or the information that the object cannot be assigned to a known class.
  • step 9 of FIG. 1 the class, quality and orientation are evaluated.
  • the information from the classification can be displayed to the user in various ways (e.g. location and class as an overlay in the image) or actions can be derived directly (e.g. triggering a weapon). This can be determined after each picture or at larger, regular intervals or when certain quality thresholds or classifications are exceeded or fallen below.
  • step 10 of FIG. 2 rules are checked.
  • the rule of each receptor is evaluated and, based on the result, the receptor is adopted in the 2D representation (graph) or not. Since different rules can exist for different applications that also process any information on the rule result, a geometrically motivated control function is used to describe how the method operates. It should be noted that the parameters of the control function must not only take into account the geometry of the object and its current pose. If available, other information (e.g. position of the sun, horizon line, friend-foe positions, radio beacon, time) can also contribute to the rule result.
  • the control function of the "Vector Angle" rule contains three parameters that are stored in the model: a, b and. Your result is r.
  • the vector z is the unit vector in the z direction (viewing direction of the camera).
  • Matrix ß is the rotation matrix from the hypothesis that rotates the model from its original position (parallel to the camera coordinate system) to its current view
  • x is a vector that describes the average direction of view from the object to the outside (e.g. the outside normal of a surface) ,
  • the receptor is adopted in the 2D representation.
  • the values between 0 and 1 are available for further evaluation, but are currently not in use.
  • step 11 of FIG. 2 the projection of the receptors is carried out.
  • Step 11 is performed separately (and possibly in parallel) for each receptor that is found in the graph.
  • the receptor reference point ß 3 is projected into the image matrix as ß 2 .
  • Matrix ß is the above.
  • Rotation matrix, t is the vector from the origin of the camera coordinate system to the origin of the model coordinate system in the scene (translation vector).
  • Matrix E is the projection matrix or camera model:
  • the focal length of the camera, / sx and / sy is the resolution of the camera in pixels per mm.
  • ß 2 is a homogeneous vector (u, v and scaling) in pixels relative to the main camera point. This is converted accordingly into the pixel coordinates x and y.
  • the receptor projection function is then called up, which projects the receptor-specific data.
  • An example of this is an edge receptor, the start and end points of which are defined in 3-D on the model and are projected into the image matrix using this function in the same way as the reference point.
  • the 3D points are stored in step 12.
  • a list of hypothesis points is created in 3-D, one or more points per receptor being saved in a defined order.
  • the receptor reference point of each receptor can always be found in the list, additional points are optional.
  • the edge receptor also saves the start and end points.
  • step 13 the graph generation is implemented. If this is necessary for the following matching process, a graph is generated from the point cloud of the points projected into the image matrix by tessellation.
  • the method used is known and described in the following article: Watson, D.F., 1981, Computing the n-dimensional Delaunay tessellation with application to Voronoi polytopes: The Computer J., 24 (2), p. 167-172.
  • step 14 the 2D matching is carried out, either using the Elastic Graph Matching method by Prof. vd Malsburg or another method with a similar objective.
  • the process must be the best possible Location of the searched feature near the start position can be found, a tradeoff between feature quality and deviation from the given graph configuration is desirable.
  • it is therefore necessary to scan the image in some way with the application function of the receptor.
  • the match quality of the application function is assigned to each scanned position so that the most favorable position can be determined.
  • edge receptor now shows how the feature request works.
  • the preprocessing cache is only occupied with the original image.
  • the pointer req is placed on the root of the tree.
  • (5.c) generates the distance image in the same way (see FIG. 5c).
  • (5.d) reads the image from req and (5.e) calculates the quality of the feature by determining the mean distance (in pixels) to an image edge. The values are taken directly from the edge image. For this purpose, reference is made to FIGS. 5d and 5e.
  • the 2D points are stored in step 15 of FIG. 2.
  • the points ß 2 after the matching step are stored in a list in the same order as in (12). It is important to ensure that the synchronism of the two lists is guaranteed so that there are no inconsistencies in the matching.

Abstract

The invention relates to a method for the model-based classification and/or target recognition of an object, which comprises the following steps: recording an image of an object, defining a characteristic feature represented by an object part, defining at least one condition, which is linked to said characteristic feature and which indicates the applicability thereof and carrying out the classification and/or target recognition of the objet by recording said characteristic feature, if the condition indicates the applicability of the characteristic feature.

Description

Modellbasierte Obiektklassifikation und ZielerkennungModel-based object classification and target recognition
Die vorliegende Erfindung betrifft allgemein eine modellbasierte Objektklassifikation und Zielerkennung und insbesondere eine Struktur und die Abarbeitung von Modellen zur Objektklassifikation und Lagebestimmung.The present invention relates generally to a model-based object classification and target recognition and in particular to a structure and the processing of models for object classification and position determination.
Alle bisher bekannten Verfahren aus dem Stand der Technik, die explizite Geometriemodelle zum Matching verwenden, extrahieren aus den Eingabedaten nur wenige Merkmale gleichzeitig. Dafür gibt es mehrere Gründe.All previously known methods from the prior art, which use explicit geometry models for matching, extract only a few features from the input data at the same time. There are mutliple reasons for this.
Zum einen ist es schwierig, verschiedene Merkmale so zu fusionieren, dass gleiche Ausgangswerte eine gleiche Bedeutung haben. Zum anderen gibt es rein praktische Gründe, die in den folgenden beiden Abschnitten näher erläutert werden.On the one hand, it is difficult to merge different characteristics in such a way that the same initial values have the same meaning. On the other hand, there are purely practical reasons, which are explained in more detail in the following two sections.
Des weiteren sind die Regeln, wann ein Merkmal eines Modells zu überprüfen ist, entweder ebenso fest einprogrammiert, wie das Merkmal selbst oder werden aus der Geometrie des Objektes bestimmt.Furthermore, the rules for when a feature of a model is to be checked are either as firmly programmed as the feature itself or are determined from the geometry of the object.
Die bisher bekannten Systeme, so auch die von D. G. Löwe in "Fitting Parametrized Three-Dimensional Models To Images", IEEE Transact. on Pattern Analysis and Machine Intelligence, Vol. 13, No. 5, 1991 , von L. Stephan et al. in "Portable, scalable architecture for model-based FLIR ATR and SAR/FLIR fusion", Proc. of SPIE, Vol. 3718, Automatic Target Recognition IX, Aug. 1999, und die in der EP-A-622 750 beschriebenen haben allgemein eine feste Anordnung der Bildverarbeitung und insbesondere eine feste Anordnung der Vorverarbeitung.The previously known systems, including those of D.G. Löwe in "Fitting Parametrized Three-Dimensional Models To Images", IEEE Transact. on Pattern Analysis and Machine Intelligence, Vol. 13, No. 5, 1991, by L. Stephan et al. in "Portable, scalable architecture for model-based FLIR ATR and SAR / FLIR fusion", Proc. of SPIE, Vol. 3718, Automatic Target Recognition IX, Aug. 1999, and those described in EP-A-622 750 generally have a fixed arrangement of image processing and in particular a fixed arrangement of preprocessing.
Gemäß diesen bekannten Systemen wird als erstes das Bild eingelesen, dann wird es vorverarbeitet und danach das Matching durchgeführt. Das führt dazu, dass in den bekannten Systemen entweder alle Vorverarbeitungen, deren Ergebnisse in irgendeinem Modell enthalten sind, durchgeführt werden müssen, oder dass fest implementierte Tests durchgeführt werden müssen, die das umgehen.According to these known systems, the image is first read in, then it is preprocessed and then the matching is carried out. This leads to, that in the known systems either all preprocessing, the results of which are contained in any model, must be carried out, or that permanently implemented tests have to be carried out that circumvent this.
Daher ist es eine Aufgabe der vorliegenden Erfindung, ein Verfahren für die Objektklassifikation und die Zielerkennung zur Verfügung zu stellen, das den erforderlichen Rechenaufwand minimiert und dennoch gleichzeitig robuster ist.It is therefore an object of the present invention to provide a method for object classification and target recognition which minimizes the computation effort required and is at the same time more robust.
Eine weitere Aufgabe der vorliegenden Erfindung ist es, ein Verfahren für die Objektklassifikation und die Zielerkennung zur Verfügung zu stellen, das die Anzahl der Vorverarbeitungsschritte minimiert.Another object of the present invention is to provide a method for object classification and target recognition that minimizes the number of preprocessing steps.
Diese Aufgaben sowie weitere der nachstehenden Beschreibung und Figuren zu entnehmenden Aufgaben werden durch ein Verfahren gemäß den anliegenden Ansprüchen erfüllt.These tasks as well as other tasks to be found in the description and figures below are accomplished by a method according to the appended claims.
Ausführungsbeispiele der Erfindung werden anhand einer Zeichnung näher erläutert. Darin zeigen: Fig. 1 den Ablauf der Objekterkennung auf oberster Ebene;Embodiments of the invention are explained in more detail with reference to a drawing. 1 shows the process of object detection at the highest level;
Fig. 2 den ausführlichen Ablauf des Matching-Blocks der Fig. 1 ;Fig. 2 shows the detailed flow of the matching block of Fig. 1;
Fig. 3 ein im Bildaufnahme-Block der Fig. 1 akquiriertes Bild;3 shows an image acquired in the image recording block of FIG. 1;
Fig. 4 eine die gesuchten Objekte umschließende Region (ROI), die aus einem rechteckigen Teilabschnitt des Bildes der Fig. 3 besteht; und Fig. 5a bis 5e am Beispiel des Kantenrezeptors wie die Merkmalsanforderung funktioniert.FIG. 4 shows a region (ROI) surrounding the searched objects, which region consists of a rectangular partial section of the image of FIG. 3; and FIGS. 5a to 5e using the example of the edge receptor as the feature request works.
Die vorliegende Erfindung basiert auf der Erkenntnis, dass bestimmte Merkmale nur aus speziellen Ansichten sichtbar sind. So sind z. B. die Fenster der Frachtraumtüren von Hubschraubern nur von der Seite sichtbar, von anderen Blickwinkeln jedoch nicht. Analoges gilt für die Beleuchtungsverhältnisse, die die Erkennung von Frachtraumtüren oder von weiteren Elementen von Hubschraubern (wie z. B. Räder, Tragelast usw.) nur unter bestimmten Lichtverhältnissen zulassen. Daher wird gemäß der vorliegenden Erfindung mindestens ein zu erkennendes Merkmal mit mindestens einer Bedingung oder mindestens einer Regel verknüpft. Selbstverständlich ist es möglich eine Vielzahl von Merkmalen mit jeweiligen bestimmten Bedingungen zu verknüpfen und/oder mehrere Bedingungen mit einem einzigen zu erkennenden Merkmal zu assoziieren. Dadurch müssten unter diesen Umständen nur die Merkmale aus dem Bild extrahiert werden, bei denen die jeweilig verknüpfte Bedingung erfüllt ist. Anders ausgedrückt, muss für eine Frachtraumtür, die nach Lage des Hubschraubers in Bezug auf eine Kamera gar nicht sichtbar sein kann, keine Objektklassifikation und/oder Zielerkennung durchgeführt werden.The present invention is based on the knowledge that certain features are only visible from special views. So z. B. the windows of the cargo hold doors of helicopters only visible from the side, but not from other angles. The same applies to the lighting conditions, which allow the detection of cargo hold doors or other elements of helicopters (such as wheels, carrying load, etc.) only under certain lighting conditions. Therefore, according to the present invention, at least one feature to be recognized is linked to at least one condition or at least one rule. Of course, it is possible to link a large number of features with respective specific conditions and / or to associate several conditions with a single feature to be recognized. Under these circumstances, only those features would have to be extracted from the image in which the respectively linked condition is fulfilled. In other words, object classification and / or target recognition does not have to be carried out for a cargo hold door which, depending on the position of the helicopter, cannot be visible in relation to a camera.
Erfindungsgemäß wurde die Möglichkeit gefunden, diverse Merkmale (sogenannte "Features", z. B. Kanten, Flächenumfänge, Hot-Spots) auf einfache und konsistente Art und Weise im Modell abzulegen und die Extraktion dieser Merkmale in effektiver Weise durchzuführen.According to the invention, the possibility was found to store various features (so-called “features”, eg edges, surface areas, hot spots) in the model in a simple and consistent manner and to carry out the extraction of these features in an effective manner.
Will man in den bekannten Bildverarbeitungssystemen aus dem vorstehend genannten Stand der Technik weitere Merkmale extrahieren, so muss man deren Aufrufe inklusive Parameterübergabe für jede Anwendung bzw. jedes Modell explizit programmieren. Das kann je nach System mehr oder weniger aufwendig sein. Diese starre Reihenfolge bestehend aus der Aufnahme eines Bildes, aus der Segmentierung des aufgenommenen Bildes und der Vorverarbeitung des durch die Segmentierung erfassten Bildes ist aus der EP-A-622 750 bekannt.If you want to extract further features in the known image processing systems from the aforementioned prior art, you have to explicitly program their calls including parameter transfer for each application or model. Depending on the system, this can be more or less complex. This rigid sequence consisting of the taking of an image, the segmentation of the captured image and the preprocessing of the image captured by the segmentation is known from EP-A-622 750.
In Übereinstimmung mit der vorliegenden Erfindung ist jedes Merkmal, das zu erkennen ist, mit einer Bedingung versehen, die seine Anwendbarkeit feststellt. Der Algorithmus dieser Bedingung ist beliebig frei programmierbar und nicht nur auf die Geometrie des Objektes beschränkt. Die Bedingung kann z.B. auch die Entfernung des zu erkennenden Objektes von der Kamera, die Beleuchtungsverhältnisse (z. B. Kontrast), Geschwindigkeit, Höhe, relative Stellung, usw. untersuchen.In accordance with the present invention, each feature that can be recognized is provided with a condition that determines its applicability. The algorithm of this condition is freely programmable and not only limited to the geometry of the object. The condition can also examine, for example, the distance of the object to be recognized from the camera, the lighting conditions (e.g. contrast), speed, height, relative position, etc.
Durch die Berücksichtigung einer oder mehreren der Bedingungen kann die durch "NichtSichtbarkeit" bzw. "Nichterfassbarkeit" eines Merkmals verursachte überflüssige Arbeit übergangen und das Verfahren erfindungsgemäß gleichzeitig robuster gemacht, da fehlende Merkmale nicht zu einer schlechteren Bewertung des Modells führen.By taking one or more of the conditions into account, the redundant work caused by the "invisibility" or "non-detection" of a feature can be omitted and the method made more robust according to the invention at the same time, since missing features do not lead to a poorer evaluation of the model.
Nach einem weiteren besonders bevorzugten Aspekt der vorliegenden Erfindung wird jedes eine Bedingung erfüllende Merkmal, das somit in einer Vorverarbeitung eines Teilschritts der Bildverarbeitung benötigt wird, von diesem Teilschritt angefordert. Dabei sind die Reihenfolge der Vorverarbeitung als auch der Algorithmus des Teilschritts im Modell abgelegt (z. B. als Nummer einer Funktion in einer Liste von verfügbaren Funktionen). Dadurch wird die in einer starren Anordnung von Bildaufnahme, Vorverarbeitung und Klassifikation/Lokalisation überflüssige Arbeit umgangen.According to a further particularly preferred aspect of the present invention, each feature that fulfills a condition and is therefore required in a preprocessing of a sub-step of the image processing is requested by this sub-step. The order of preprocessing and the algorithm of the sub-step are stored in the model (e.g. as the number of a function in a list of available functions). This avoids the unnecessary work in a rigid arrangement of image acquisition, preprocessing and classification / localization.
Da verschiedene Teilschritte unter Umständen gleiche Merkmale brauchen (z.B. benötigen die Merkmale linke Kante und rechte Kante eines Objektes die Vorverarbeitung "Kantenbild") oder Teilergebnisse von niedrigeren Vorverarbeitungen Eingaben für höhere Vorverarbeitungen darstellen (z. B. Kantenbild und Wavelet-Zerlegung des gefilterten Originalbilds, mit deren Hilfe mittels lokaler Wavelet-Basen die lokalen Eigenschaften einer Funktion effizient untersucht werden können), werden alle "wiederverwendungswürdigen" Vorverarbeitungsschritte in der Reihenfolge der Erstellung, beginnend mit dem Originalbild, abgespeichert. Wird eine bestimmte Vorverarbeitung benötigt, so wird durch die Bildverarbeitung eine "Anforderung" dieser Vorverarbeitung mit allen vorhergehenden Stufen dieser Vorverarbeitung, beginnend beim Original, durchgeführt.Since different sub-steps may require the same characteristics (e.g. the characteristics left edge and right edge of an object require the preprocessing "edge image") or partial results from lower preprocessing represent inputs for higher preprocessing (e.g. edge image and wavelet decomposition of the filtered original image, With the help of local wavelet bases, the local properties of a function can be efficiently examined), all "reusable" preprocessing steps are saved in the order of creation, starting with the original image. If a certain preprocessing is required, the image processing makes a "request" of this preprocessing with everyone previous stages of this preprocessing, starting with the original.
Die Behandlung der Anforderung besteht darin, die Vorverarbeitung auszuführen und das Ergebnis abzulegen und bereitzustellen oder wenn bereits vorhanden, das abgelegte Ergebnis bereitzustellen, ohne eine Neuberechnung durchzuführen. Somit können, wie bereits erwähnt, vorhandene Vorverarbeitungen oder Serien von Vorverarbeitungen aus einem Zwischenspeicher (Cache) schnell aufgerufen werden. Wird z.B. für ein Merkmal A die Vorverarbeitung 1 durchgeführt und sind für ein weiteres Merkmal B die Vorverarbeitungen 1 , 2 und 3 erforderlich, so kann auf die zwischengespeicherte Vorverarbeitung 1 des Merkmals 1 gemäß der Erfindung zugegriffen werden, womit die Verarbeitungszeit verkürzt wird.The handling of the request is to carry out the preprocessing and to store and provide the result or, if already available, to provide the stored result without performing a recalculation. Thus, as already mentioned, existing preprocessing or series of preprocessing can be called up quickly from a cache. E.g. preprocessing 1 is carried out for a feature A and preprocessing 1, 2 and 3 are required for a further feature B, the buffered preprocessing 1 of feature 1 according to the invention can be accessed, thus reducing the processing time.
Durch diese Schritte ist es möglich, alle für die Erkennung eines Objektes nötigen Merkmale (nach einer entsprechenden Normalisierung) zu extrahieren und dem Erkennungsprozess zuzuführen. Man ist also nicht mehr durch Geschwindigkeitsoder Wartungsgründe an eine kleine Zahl von Merkmalen gebunden. Natürlich verlangen die Vorverarbeitungen des Systems gemäß der Erfindung auch Zeit für die Berechnung, aber es werden nur die Berechnungen ausgeführt, die unbedingt notwendig sind, da jede Vorverarbeitung nur einmal durchzuführen ist. Dadurch können verschiedene Merkmale extrahiert werden, solange die Gesamtzeit aller Vorverarbeitungen die maximale Laufzeit nicht überschreitet.These steps make it possible to extract all the features required for the recognition of an object (after a corresponding normalization) and to feed them into the recognition process. So you are no longer tied to a small number of features due to speed or maintenance reasons. Of course, the preprocessing of the system according to the invention also requires time for the calculation, but only the calculations that are absolutely necessary are carried out, since each preprocessing has to be carried out only once. This enables various characteristics to be extracted as long as the total time of all preprocessing does not exceed the maximum runtime.
Das vorstehend beschriebene Verfahren zur Vorverarbeitung kann erfindungsgemäß unabhängig von der Erkenntnis, dass bestimmte Merkmale nur aus speziellen Ansichten sichtbar sind, implementiert werden. Anders ausgedrückt, kann die vorliegende Vorverarbeitung unabhängig von der Verknüpfung mit einer der bestimmten Bedingung ausgeführt werden, obwohl die Kombination der zwei Merkmale sich besonders vorteilhaft in Bezug auf den Rechenaufwand und Robustheit des Systems auswirkt. Das erfindungsgemäße Verfahren zur Vorverarbeitung ist im Vergleich zum Stand der Technik besonders vorteilhaft. So erkennt das von D. G. Löwe in "Fitting Parametrized Three-Dimensional Models To Images", IEEE Transact. on Pattern Analysis and Machine Intelligence, Vol. 13, No. 5, 1991 , vorgestellte Verfahren das gesuchte Objekte anhand von Kanten. Diese Kanten werden als parametrisierte Kurven ausgedrückt und die freien Parameter (Raumlage und interne Freiheitsgrade) durch ein Näherungsverfahren bestimmt. Relevant ist das Verfahren dadurch, dass es geometrische Vorverarbeitungen in einem Cache ablegt. Allerdings betrifft der Cache des bekannten Verfahrens von Löwe lediglich Sichtbarkeitsbedingungen, während der erfindungsgemäße Cache oder Zwischenspeicher nicht in der Art der Vorverarbeitung beschränkt ist. Ebenfalls sind die Sichtbarkeitsbedingungen nur aus der Geometrie des Objektes bestimmt und nicht frei wählbar. Ansonsten ist das Verfahren von Löwe ein typischer Vertreter von Verfahren mit fest implementierter Vorverarbeitung.The method for preprocessing described above can be implemented according to the invention independently of the knowledge that certain features are only visible from special views. In other words, the present preprocessing can be carried out independently of the link to one of the specific conditions, although the combination of the two features has a particularly advantageous effect in terms of the computational complexity and robustness of the system. The method for preprocessing according to the invention is particularly advantageous compared to the prior art. This is what DG Löwe recognizes in "Fitting Parametrized Three-Dimensional Models To Images", IEEE Transact. on Pattern Analysis and Machine Intelligence, Vol. 13, No. 5, 1991, presented method the object sought by means of edges. These edges are expressed as parameterized curves and the free parameters (spatial position and internal degrees of freedom) are determined by an approximation method. The method is relevant in that it stores geometric preprocessing in a cache. However, the cache of the known Löwe method only relates to visibility conditions, while the cache or buffer memory according to the invention is not limited in the type of preprocessing. The visibility conditions are also only determined from the geometry of the object and cannot be freely selected. Otherwise, the Löwe process is a typical representative of processes with permanently implemented preprocessing.
Das Verfahren gemäß L. Stephan et. al. ("Portable, scalable architecture for model-based FLIR ATR and SAR/FLIR fusion", Proc. of SPIE, Vol. 3718, Automatic Target Recognition IX, Aug. 1999) extrahiert aus den Radar-Bildern (SAR) nicht näher spezifizierte Merkmale sowie Kanten aus den Infrarot Bildern (FLIR Bildern). Mit jedem dieser Merkmale wird eine getrennte Hypothesenbildung durchgeführt und diese Hypothesen werden zuletzt fusioniert. Die ganze Vorverarbeitung ist in einer festen Reihenfolge im System implementiert, nur die zu findenden Geometriemodelle sind austauschbar. In der EP-A-622 750 ist die genaue Art und Reihenfolge der Vorverarbeitungen vorgegeben.The procedure according to L. Stephan et. al. ("Portable, scalable architecture for model-based FLIR ATR and SAR / FLIR fusion", Proc. Of SPIE, Vol. 3718, Automatic Target Recognition IX, Aug. 1999) extracts features not specified from the radar images (SAR) as well as edges from the infrared images (FLIR images). A separate hypothesis is created with each of these characteristics and these hypotheses are finally merged. The entire preprocessing is implemented in a fixed order in the system, only the geometry models to be found are interchangeable. EP-A-622 750 specifies the exact nature and sequence of the preprocessing.
Nunmehr wird unter Bezugnahme auf die begleitenden Figuren 1 bis 5e ein derzeit besonders bevorzugtes Ausführungsbeispiel der Erfindung erläutert. Dieses Ausführungsbeispiel kann in einer für den Fachmann wohl bekannten Art und Weise abgeändert werden und es ist keineswegs beabsichtigt den Schutzumfang der Erfindung auf das nachstehende Beispiel zu beschränken. Vielmehr wird der Schutzumfang durch die Merkmale der Ansprüche und deren Äquivalente bestimmt.A currently particularly preferred embodiment of the invention will now be explained with reference to the accompanying FIGS. 1 to 5e. This embodiment can be modified in a manner well known to those skilled in the art and it is in no way intended to limit the scope of the invention to the example below. Rather, the scope of protection is determined by the features of the claims and their equivalents.
Fig. 1 zeigt einen Ablauf der Objekterkennung auf oberster Ebene. Im Schritt 1 erfolgt im Bildaufnahme-Block die Akquisition des Bildes mit einer Kamera, Laden eines gespeicherten Bildes oder Erzeugung eines VR-Bildes. Ein im Bildaufnahme-Block der Fig. 1 akquiriertes Bild wird exemplarisch in der Fig. 3 gezeigt.1 shows a sequence of object recognition at the top level. In step 1, the acquisition of the image with a camera, loading of a stored image or generation of a VR image takes place in the image recording block. An image acquired in the image recording block of FIG. 1 is shown by way of example in FIG. 3.
Im Schritt 2 (ROI-Erstellung) erfolgt eine einfache und schnelle Grob-Detektion des Objektes im Bild, d. h. die Vorgabe einer rechteckigen Region, die die gesuchten Objekte weitestgehend umschließt. Die Abkürzung ROI (Region Of Interest) bezeichnet diese die gesuchten Objekte umschließende Region, die unter Bezugnahme auf die Fig. 4 zu sehen ist. Verfahren zur Bestimmung einer derartigen ROI sind an und für sich bekannt. Dazu zählen Schwellwertverfahren, Pixelklassifikation usw. Es muss auch eine Zuordnung der aktuell gebildeten ROI zu einer ROI aus dem letzten Bild erfolgen.In step 2 (ROI creation) there is a simple and quick rough detection of the object in the image, i. H. the specification of a rectangular region that largely encloses the objects sought. The abbreviation ROI (Region Of Interest) denotes this region surrounding the sought objects, which can be seen with reference to FIG. 4. Methods for determining such an ROI are known per se. These include threshold value methods, pixel classification etc. The ROI currently formed must also be assigned to an ROI from the last image.
Im Schritt 3 erfolgt eine Entscheidung, ob das Objekt in der Region Of Interest zum ersten Mal mit einer ROI versehen wurde oder nicht. Dieser Schritt ist notwendig, da noch keine zu prüfenden Hypothesen existieren, die der ROI zugeordnet sind und somit noch keine Prüfung der Hypothesen erfolgen kann.In step 3, a decision is made as to whether the object in the region of interest has been provided with an ROI for the first time or not. This step is necessary because there are no hypotheses to be tested yet that are assigned to the ROI and therefore the hypotheses cannot yet be checked.
Falls die Entscheidung im Schritt 3 "Ja" lautet, erfolgt im Schritt 4 die Hypotheseninitialisierung. Hier wird die Zuordnung eines oder mehrere 7-Tuples zu einer ROI durchgeführt. Das 7-Tupel besteht aus der Art des Objektes (z. B. Modell-Nummer (im Falle eines Hubschraubers 1 = Hind, 2 = Helix, 3 = Bell Ranger, usw.)) und den geschätzten sechs Freiheitsgraden unter der Annahme dieser Modellklasse. Die initiale Erstellung der sechs Freiheitsgraden kann z.B. durch systematisches Probieren erfolgen. Falls die Entscheidung im Schritt 3 "Nein" lautet, wird im Schritt 5 das Hypothesen-Update durchgeführt. Im Falle einer bereits existierenden Hypothese muss die durch die Bewegung des Objektes im Raum entstandene neue Lage der Lage des Objektes im Bild angepasst werden. Dazu wird eine im Stand der Technik bekannte Bewegungsprädiktion mittels eines Trackers (z. B. Kaiman- Filter) durchgeführt.If the decision in step 3 is "yes", the hypothesis initialization takes place in step 4. Here one or more 7-tuples are assigned to an ROI. The 7-tuple consists of the type of object (e.g. model number (in the case of a helicopter 1 = Hind, 2 = Helix, 3 = Bell Ranger, etc.) and the estimated six degrees of freedom, assuming this model class , The initial creation of the six degrees of freedom can be done, for example, by systematic testing. If the decision in step 3 is "no", the hypothesis update is carried out in step 5. In the case of an existing hypothesis, the new position created by the movement of the object in space must be adapted to the position of the object in the image. For this purpose, a movement prediction known in the prior art is carried out by means of a tracker (for example a Cayman filter).
Im Schritt 5 der Fig. 1 erfolgt das unter Bezugnahme auf die Fig. 2 ausführlich beschriebene Matching.In step 5 of FIG. 1, the matching described in detail with reference to FIG. 2 takes place.
Im Schritt 6 der Fig. 1 wird die 2D-3D-Pose-Schätzung implementiert. Aus der Lageänderung der Rezeptoren und der angenommenen Lage der Rezeptoren im Raum (aus Hypothese) kann mittels der 2D-3D-Pose-Schätzung die Lageänderung des Objektes im Raum geschätzt werden. Verfahren dazu sind im Stand der Technik bekannt (siehe z.B. Haralick: Pose Estimation from Corresponding Point Data, IEEE Transactions on Systems, Man and Cybernetics, Vol. 19, No. 6, Nov./Dec. 1989).In step 6 of FIG. 1, the 2D-3D pose estimation is implemented. From the change in position of the receptors and the assumed position of the receptors in space (from hypothesis), the change in position of the object in space can be estimated using the 2D-3D pose estimation. Methods for this are known in the prior art (see e.g. Haralick: Pose Estimation from Corresponding Point Data, IEEE Transactions on Systems, Man and Cybernetics, Vol. 19, No. 6, Nov./Dec. 1989).
Im Schritt 7 (Block "Besser") der Fig. 1 wird die Güte des Modells ermittelt. Das ist notwendig, da das Matching die Rigiditätseigenschaft des Objektes verletzt. Durch die Pose-Schätzung und Neu-Projektion ist die Rigidität gewährleistet, da Fehler einzelner Rezeptoren gemittelt werden und eine einzige Pose (6 Freiheitsgrade) für alle Rezeptoren entstehen. Eine weiteres Matching im gleichen Bild ist sinnvoll, um hier das bestmögliche Ergebnis, d. h. den geringstmöglichen Fehler zwischen Hypothese und Bild zu erreichen. Deshalb wird bei einer Verschlechterung (oder sehr kleinen Verbesserung) angenommen, dass der optimale Punkt bereits erreicht ist.In step 7 (block "Better") in FIG. 1, the quality of the model is determined. This is necessary because the matching violates the rigidity property of the object. The pose estimation and re-projection ensure rigidity, since errors in individual receptors are averaged and a single pose (6 degrees of freedom) is created for all receptors. Another matching in the same picture is useful to get the best possible result, i. H. to achieve the smallest possible error between the hypothesis and the image. Therefore, in the event of deterioration (or very small improvement), it is assumed that the optimal point has already been reached.
Im Schritt 8 der Fig. 1 (Block "Klassifikation") erfolgt die Auswertung aller Hypothesen, insbesondere ihrer Gütewerte, einer ROI. Die Klassifikation ergibt entweder die Entscheidung für eine bestimmte Klasse und Pose (durch Auswahl oder Kombination von Pose-Werten verschiedener Hypothesen) oder die Information, dass das Objekt keiner bekannten Klasse zugeordnet werden kann.In step 8 of FIG. 1 ("Classification" block), all hypotheses, in particular their quality values, of an ROI are evaluated. The classification results either the decision for a certain class and pose (by selecting or combining pose values of different hypotheses) or the information that the object cannot be assigned to a known class.
Im Schritt 9 der Fig. 1 erfolgt die Auswertung von Klasse, Güte und Orientierung. Dem Nutzer kann die Information aus der Klassifikation in verschiedenster Weise angezeigt werden (z. B. Lage und Klasse als Overlay ins Bild) oder es können direkt Handlungen abgeleitet werden (z. B. Auslösen einer Waffe). Dies kann nach jedem Bild oder in größeren, regelmäßigen Abständen oder beim Über- oder Unterschreiten bestimmter Güteschwellen oder der Klassifikation bestimmt werden.In step 9 of FIG. 1, the class, quality and orientation are evaluated. The information from the classification can be displayed to the user in various ways (e.g. location and class as an overlay in the image) or actions can be derived directly (e.g. triggering a weapon). This can be determined after each picture or at larger, regular intervals or when certain quality thresholds or classifications are exceeded or fallen below.
Die Einzelheiten der Anpassung (Matching) sind unter Bezug auf die Fig. 2 erläutert.The details of the matching (matching) are explained with reference to FIG. 2.
Im Schritt 10 der Fig. 2 erfolgt die Überprüfung von Regeln. Die Regel jedes Rezeptors wird ausgewertet und anhand des Ergebnisses der Rezeptor in die 2D- Repräsentation (Graph) übernommen oder nicht. Da für verschiedene Applikationen verschiedene Regeln existieren können, die auch beliebige Information zum Regelergebnis verarbeiten, wird hier am Beispiel einer geometrisch motivierten Regelfunktion beschrieben, wie das Verfahren operiert. Es ist anzumerken, dass die Parameter der Regelfunktion nicht nur die Geometrie des Objektes und dessen aktuelle Pose berücksichtigen müssen. Auch andere Informationen (z.B. Sonnenstand, Horizontlinie, Freund-Feind-Positionen, Funkfeuer, Uhrzeit) können, so verfügbar, zum Regelergebnis beitragen.In step 10 of FIG. 2, rules are checked. The rule of each receptor is evaluated and, based on the result, the receptor is adopted in the 2D representation (graph) or not. Since different rules can exist for different applications that also process any information on the rule result, a geometrically motivated control function is used to describe how the method operates. It should be noted that the parameters of the control function must not only take into account the geometry of the object and its current pose. If available, other information (e.g. position of the sun, horizon line, friend-foe positions, radio beacon, time) can also contribute to the rule result.
Die Regelfunktion der "Vector-Angle"-Regel enthält drei Parameter, die im Modell gespeichert sind: a, b und . Ihr Ergebnis ist r.The control function of the "Vector Angle" rule contains three parameters that are stored in the model: a, b and. Your result is r.
Die Regelfunktion selbst hat folgende Form: (Rχ -ή cos ? =The control function itself has the following form: (R χ -ή cos? =
- zi- zi
1 ß < a ß -a1 ß <a ß -a
1 - a ≤ ß ≤ a + b1 - a ≤ ß ≤ a + b
0 ß > a +b0 ß> a + b
Der Vektor z ist der Einheitsvektor in z-Richtung (Blickrichtung der Kamera). Matrix ß ist die Rotationsmatrix aus der Hypothese, die das Modell aus seiner Ursprungslage (parallel zum Kamerakoordinatensystem) in seine aktuelle Ansicht rotiert, x ist ein Vektor, der die mittlere Blickrichtung vom Objekt nach außen beschreibt (z. B. die Außennormale einer Fläche).The vector z is the unit vector in the z direction (viewing direction of the camera). Matrix ß is the rotation matrix from the hypothesis that rotates the model from its original position (parallel to the camera coordinate system) to its current view, x is a vector that describes the average direction of view from the object to the outside (e.g. the outside normal of a surface) ,
Liefert r einen von 0 verschiedenen Wert, so wird der Rezeptor in die 2D- Repräsentation übernommen. Die Werte zwischen 0 und 1 stehen zur weiteren Auswertung zur Verfügung, sind aber momentan nicht im Gebrauch.If r supplies a value other than 0, the receptor is adopted in the 2D representation. The values between 0 and 1 are available for further evaluation, but are currently not in use.
Im Schritt 11 der Fig. 2 wird die Projektion der Rezeptoren durchgeführt.In step 11 of FIG. 2, the projection of the receptors is carried out.
Schritt 11 wird für jeden Rezeptor, der sich durch die Prüfung im Graphen befindet, getrennt (und u. U. parallel) durchgeführt. Dabei wird zuerst der Rezeptorreferenzpunkt ß3 in die Bildmatrix als ß2 projiziert.Step 11 is performed separately (and possibly in parallel) for each receptor that is found in the graph. First, the receptor reference point ß 3 is projected into the image matrix as ß 2 .
Matrix ß ist die o. g. Rotationsmatrix, t der Vektor vom Ursprung des Kamerakoordinatensystem zum Ursprung des Modellkoordinatensystem in der Szene (Translationsvektor). Matrix E ist die Projektionsmatrix oder Kameramodell:Matrix ß is the above. Rotation matrix, t is the vector from the origin of the camera coordinate system to the origin of the model coordinate system in the scene (translation vector). Matrix E is the projection matrix or camera model:
fi, 0 0fi, 0 0
P = 0 ß>, 0P = 0 ß > , 0
0 0 1 Dabei ist / die Brennweite der Kamera, /sx und /sy die Auflösung der Kamera in Pixel pro mm. ß2 ist ein homogener Vektor (u, v und Skalierung) in Pixeln relativ zum Kamerahauptpunkt. Dieser wird entsprechend in die Pixelkoordinaten x und y umgerechnet.0 0 1 The focal length of the camera, / sx and / sy is the resolution of the camera in pixels per mm. ß 2 is a homogeneous vector (u, v and scaling) in pixels relative to the main camera point. This is converted accordingly into the pixel coordinates x and y.
Anschließend wird die Projektionsfunktion des Rezeptors aufgerufen, die die rezeptorspezifischen Daten projiziert. Ein Beispiel dafür ist ein Kantenrezeptor, dessen Anfangs- und Endpunkte im 3-D am Modell definiert sind und durch diese Funktion in gleicher Weise wie der Referenzpunkt in die Bildmatrix projiziert werden.The receptor projection function is then called up, which projects the receptor-specific data. An example of this is an edge receptor, the start and end points of which are defined in 3-D on the model and are projected into the image matrix using this function in the same way as the reference point.
Im Schritt 12 erfolgt die Speicherung der 3D-Punkte. Es wird eine Liste von Hypothesen-Punkten im 3-D angelegt, wobei ein oder mehrere Punkte pro Rezeptoren in einer definierten Reihenfolge gespeichert werden. Der Rezeptorreferenzpunkt jedes Rezeptors ist immer in der Liste zu finden, weitere Punkte sind optional. Der Kantenrezeptor speichert noch die Anfangs- und Endpunkte zusätzlich.The 3D points are stored in step 12. A list of hypothesis points is created in 3-D, one or more points per receptor being saved in a defined order. The receptor reference point of each receptor can always be found in the list, additional points are optional. The edge receptor also saves the start and end points.
In Schritt 13 wird die Graph-Erzeugung implementiert. Aus der Punktwolke der in die Bildmatrix projizierten Punkte wird, falls das für das folgende Matching- Verfahren nötig ist, ein Graph durch Tesselation erzeugt. Das verwendete Verfahren ist bekannt und in folgendem Artikel beschrieben: Watson, D.F., 1981 , Computing the n-dimensional Delaunay tessellation with application to Voronoi polytopes: The Computer J., 24(2), p. 167-172.In step 13 the graph generation is implemented. If this is necessary for the following matching process, a graph is generated from the point cloud of the points projected into the image matrix by tessellation. The method used is known and described in the following article: Watson, D.F., 1981, Computing the n-dimensional Delaunay tessellation with application to Voronoi polytopes: The Computer J., 24 (2), p. 167-172.
Im Schritt 14 wird das 2D-Matching durchgeführt, wobei entweder das Elastic- Graph-Matching Verfahren von Prof. v.d. Malsburg durchgeführt oder ein anderes Verfahren ähnlicher Zielsetzung. Ein solches Verfahren wurde von uns implementiert, das spezielle Eigenschaften aufweist, die mit dem Tracking des Objektes im Zusammenhang steht. Durch das Verfahren muss die bestmögliche Lage des gesuchten Merkmals in der Nähe der Startposition gefunden werden, wobei ein Tradeoff zwischen Merkmalsgüte und Abweichung von der gegebenen Graph-Konfiguration wünschenswert ist. In diesem Schritt ist es deshalb nötig, eine irgendwie geartete Abtastung des Bildes mit der Applikationsfunktion des Rezeptors durchzuführen. Jeder abgetasteten Position wird die Match-Güte der Applikationsfunktion zugeordnet, so dass die günstigste Lage bestimmt werden kann.In step 14, the 2D matching is carried out, either using the Elastic Graph Matching method by Prof. vd Malsburg or another method with a similar objective. We implemented such a method, which has special properties that are related to the tracking of the object. The process must be the best possible Location of the searched feature near the start position can be found, a tradeoff between feature quality and deviation from the given graph configuration is desirable. In this step it is therefore necessary to scan the image in some way with the application function of the receptor. The match quality of the application function is assigned to each scanned position so that the most favorable position can be determined.
Am Beispiel des Kantenrezeptors wird nun gezeigt, wie die Merkmalsanforderung funktioniert. Dazu wird dessen Algorithmus als Pseudocode gegeben: req=Wurzel des Vorverarbeitungsbaums (5.a) req=FordereAn(req,KantenBild,schwelle=10,sigma=1 ) (5.b) req=FordereAn(req,DistanzBild,MaximaleDistanz=100)(5.c) bild=BildAusBaum(req) (5.d) BestimmeChamferDistanzEntlangDerLinie(bild,linie) (5.e)The example of the edge receptor now shows how the feature request works. For this purpose, its algorithm is given as a pseudocode: req = root of the preprocessing tree (5.a) req = request (req, edge image, threshold = 10, sigma = 1) (5.b) req = request (req, distance image, maximum distance = 100 ) (5.c) image = image from tree (req) (5.d) determine chamfer distance along the line (image, line) (5.e)
Von der Bildaufnahme (Block 1 ) bis zum Beginn von 5b ist der Vorverarbeitungs- Cache nur mit dem Originalbild belegt.From the image acquisition (block 1) to the beginning of 5b, the preprocessing cache is only occupied with the original image.
Gemäß des Pseudocodes 5a (siehe Fig. 5.a) wird der Zeiger req auf die Wurzel des Baums gesetzt.According to the pseudo code 5a (see Fig. 5.a), the pointer req is placed on the root of the tree.
In der Anforderung (5.b) (s. Fig. 5b) wird festgestellt, dass es noch keinen Knoten des Typs Kantenbild mit den o. g. Parametern gibt. Dann wird dieser mittels der registrierten Routine zur Berechnung eines Kantenbildes erzeugt.In the request (5.b) (see FIG. 5b) it is determined that there is still no node of the type edge image with the above-mentioned. Parameters there. Then it is generated by means of the registered routine for calculating an edge image.
(5.c) erzeugt auf gleiche Weise das Distanzbild (s. Fig. 5c). (5.d) liest das Bild aus req aus und (5.e) berechnet die Güte des Merkmals, indem es den mittleren Abstand (in Pixeln) zu einer Bildkante bestimmt. Die Werte werden dazu direkt aus dem Kantenbild entnommen. Dazu wird auf die Figuren 5d und 5e verwiesen.(5.c) generates the distance image in the same way (see FIG. 5c). (5.d) reads the image from req and (5.e) calculates the quality of the feature by determining the mean distance (in pixels) to an image edge. The values are taken directly from the edge image. For this purpose, reference is made to FIGS. 5d and 5e.
Bei der Schätzung der nächsten Position wird der Baum-Iterator (req) in (5.a) wieder an die Wurzel gesetzt, und in (5.b) und (5.c) ohne Berechnung weiterbewegt.When estimating the next position, the tree iterator (req) is put back to the root in (5.a) and moved on in (5.b) and (5.c) without calculation.
Andere Rezeptoren, die im Modell hinterlegt sind, können diesen Baum noch erweitern, wie der freie Platz auf der rechten Seite der Fig. 5e andeuten soll.Other receptors that are stored in the model can expand this tree, as the free space on the right side of FIG. 5e is intended to indicate.
Im Schritt 15 der Fig. 2 erfolgt die Speicherung der 2D-Punkte. Die Punkte ß2 nach dem Matching-Schritt werden in gleichen Reihenfolgen wie in (12) in einer Liste abgelegt. Dabei ist darauf zu achten, dass die Synchronität beider Listen gewährleistet bleibt, um keine Inkonsistenzen beim Matching zu erzeugen. The 2D points are stored in step 15 of FIG. 2. The points ß 2 after the matching step are stored in a list in the same order as in (12). It is important to ensure that the synchronism of the two lists is guaranteed so that there are no inconsistencies in the matching.

Claims

Patentansprüche claims
1. Verfahren zur modellbasierten Klassifikation und/oder Zielerkennung eines Objekts das folgende Schritte umfasst: a) Aufzeichnen eines Bildes eines Objekts; b) Bestimmen eines Merkmals, das ein Teil des Objekts darstellt; c) Bestimmen von mindestens einer Bedingung, die mit dem Merkmal verknüpft ist und die die Anwendbarkeit des Merkmals anzeigt; und d) Durchführen der Klassifikation und/oder Zielerkennung des Objekts durch die Erfassung des Merkmals, falls die Bedingung die Anwendbarkeit des Merkmals anzeigt.1. A method for model-based classification and / or target recognition of an object, which comprises the following steps: a) recording an image of an object; b) determining a feature that is part of the object; c) determining at least one condition associated with the feature and indicating the applicability of the feature; and d) performing the classification and / or target recognition of the object by the detection of the feature if the condition indicates the applicability of the feature.
2. Verfahren nach Anspruch 1 , wobei Schritt b) das Bestimmen einer Vielzahl an Merkmalen umfasst, wobei2. The method of claim 1, wherein step b) comprises determining a plurality of features, wherein
Schritt c) das Bestimmen von mindestens einer Bedingung für jedes der Merkmale umfasst, und wobeiStep c) includes determining at least one condition for each of the features, and wherein
Schritt d) die Klassifikation und/oder Zielerkennung des Objekts durch die Erfassung der Vielzahl an Merkmalen umfasst.Step d) comprises the classification and / or target recognition of the object by detecting the large number of features.
3. Verfahren nach Anspruch 1 oder 2, wobei der Algorithmus der mindestens einen Bedingung beliebig frei programmierbar ist.3. The method of claim 1 or 2, wherein the algorithm of the at least one condition is freely programmable.
4. Verfahren nach einem oder mehreren der Ansprüche 1-3, wobei die Bedingung gewählt wird aus einer Gruppe bestehend aus: Geometrie des4. The method according to one or more of claims 1-3, wherein the condition is selected from a group consisting of: geometry of
Objektes, Entfernung des Objekts von einer Kamera, Beleuchtungsverhältnisse, Kontrast, Geschwindigkeit des Objekts, Höhe des Objekts, und relative Stellung des Objekts zu einer Kamera.Object, distance of the object from a camera, lighting conditions, contrast, speed of the object, height of the object, and relative position of the object to a camera.
5. Verfahren nach einem oder mehreren der Ansprüche 1-4, das weiterhin mindestens einen Schritt zur Vorverarbeitung für die Erfassung eines bestimmten Merkmals umfasst, und wobei vor der Vorverarbeitung für das bestimmte Merkmal eine Überprüfung erfolgt, ob die Vorverarbeitung für das bestimmte Merkmal im Zusammenhang mit einem anderen Merkmal erfolgt ist und falls ja, die Verwendung der Vorverarbeitung des anderen Merkmals für das bestimmte Merkmal.5. The method according to one or more of claims 1-4, further comprises at least one step for preprocessing for the detection of a specific feature, and wherein before the preprocessing for the particular feature a check is carried out to determine whether the preprocessing for the particular feature was carried out in connection with another feature and, if so, the use of the preprocessing of the other characteristic for the specific characteristic.
6. Verfahren nach Anspruch 5, wobei die durchgeführten Vorverarbeitungen in einem Cache-Speicher abgelegt werden.6. The method according to claim 5, wherein the preprocessing carried out is stored in a cache memory.
7. Verfahren nach Anspruch 5 oder 6, wobei das Merkmal "linke Kante" oder "rechte Kante" eines Objektes ist, und wobei jedes dieser Merkmale die Vorverarbeitung "Kantenbild" umfasst.7. The method of claim 5 or 6, wherein the feature is "left edge" or "right edge" of an object, and each of these features includes preprocessing "edge image".
8. Verfahren nach einem oder mehreren der Ansprüche 5-7, wobei alle wiederverwendungswürdige Vorverarbeitungsschritte in der Reihenfolge der Erstellung abgespeichert werden.8. The method according to one or more of claims 5-7, wherein all reusable preprocessing steps are stored in the order in which they were created.
9. Verfahren nach einem oder mehreren der Ansprüche 6-8, wobei der Cache nicht in der Art der Vorverarbeitung beschränkt ist. 9. The method according to one or more of claims 6-8, wherein the cache is not limited in the type of preprocessing.
EP02769950A 2001-09-15 2002-09-16 Model-based object classification and target recognition Withdrawn EP1425709A2 (en)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
DE10145608A DE10145608B4 (en) 2001-09-15 2001-09-15 Model-based object classification and target recognition
DE10145608 2001-09-15
PCT/DE2002/003423 WO2003025843A2 (en) 2001-09-15 2002-09-16 Model-based object classification and target recognition

Publications (1)

Publication Number Publication Date
EP1425709A2 true EP1425709A2 (en) 2004-06-09

Family

ID=7699206

Family Applications (1)

Application Number Title Priority Date Filing Date
EP02769950A Withdrawn EP1425709A2 (en) 2001-09-15 2002-09-16 Model-based object classification and target recognition

Country Status (5)

Country Link
US (1) US8005261B2 (en)
EP (1) EP1425709A2 (en)
CA (1) CA2460615C (en)
DE (1) DE10145608B4 (en)
WO (1) WO2003025843A2 (en)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090002224A1 (en) * 2005-09-22 2009-01-01 Nader Khatib SAR ATR tree line extended operating condition
US8341848B2 (en) * 2005-09-28 2013-01-01 Hunter Engineering Company Method and apparatus for vehicle service system optical target assembly
US7965890B2 (en) 2007-01-05 2011-06-21 Raytheon Company Target recognition system and method
US9091780B2 (en) 2009-09-17 2015-07-28 Quantum Technology Sciences, Inc. (Qtsi) Methods for identifying a signal of interest and for making a classification of identity
DE102009049849B4 (en) * 2009-10-19 2020-09-24 Apple Inc. Method for determining the pose of a camera, method for recognizing an object in a real environment and method for creating a data model
US8527445B2 (en) * 2010-12-02 2013-09-03 Pukoa Scientific, Llc Apparatus, system, and method for object detection and identification
JP5746550B2 (en) * 2011-04-25 2015-07-08 キヤノン株式会社 Image processing apparatus and image processing method
DE102012113009A1 (en) * 2012-12-21 2014-06-26 Jenoptik Robot Gmbh Method for automatically classifying moving vehicles
US10739142B2 (en) 2016-09-02 2020-08-11 Apple Inc. System for determining position both indoor and outdoor

Family Cites Families (37)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US2024602A (en) * 1933-04-22 1935-12-17 Barrett Co Protection of pipe joints
US2601840A (en) * 1950-11-29 1952-07-01 Millard F Smith Indicating protective cover for pipe flanges and valves
US4216980A (en) * 1978-10-23 1980-08-12 Martec Industries Inc. Safety shield for flanged pipe coupling
US4458521A (en) * 1978-10-23 1984-07-10 Pillette Kibbie P Leak detection system
US4441694A (en) * 1981-01-28 1984-04-10 Bunnell Plastics, Inc. Method of manufacturing a safety shield for flanged pipe couplings
US4470048A (en) * 1982-03-29 1984-09-04 Sperry Corporation Range profile target classifier
US5312137A (en) * 1990-03-27 1994-05-17 Ramco Manufacturing Company, Inc. Safety shield
US5740274A (en) * 1991-09-12 1998-04-14 Fuji Photo Film Co., Ltd. Method for recognizing object images and learning method for neural networks
EP0532052B1 (en) * 1991-09-12 2008-02-13 FUJIFILM Corporation Method for extracting object images and method for detecting movements thereof
JP2873338B2 (en) * 1991-09-17 1999-03-24 富士通株式会社 Moving object recognition device
US5579409A (en) * 1991-09-27 1996-11-26 E. I. Du Pont De Nemours And Company Methods for determining the exterior points of an object in a background
US5332176A (en) * 1992-12-03 1994-07-26 Electronics & Space Corp. Controlled interlace for TOW missiles using medium wave infrared sensor or TV sensor
US5825921A (en) * 1993-03-19 1998-10-20 Intel Corporation Memory transfer apparatus and method useful within a pattern recognition system
US5475768A (en) 1993-04-29 1995-12-12 Canon Inc. High accuracy optical character recognition using neural networks with centroid dithering
US5424823A (en) * 1993-08-17 1995-06-13 Loral Vought Systems Corporation System for identifying flat orthogonal objects using reflected energy signals
US5640468A (en) * 1994-04-28 1997-06-17 Hsu; Shin-Yi Method for identifying objects and features in an image
US5644386A (en) * 1995-01-11 1997-07-01 Loral Vought Systems Corp. Visual recognition system for LADAR sensors
CA2190409A1 (en) * 1995-11-30 1997-05-31 William E. Brown Quick disconnect safety shield
US6404920B1 (en) * 1996-09-09 2002-06-11 Hsu Shin-Yi System for generalizing objects and features in an image
DE19652925C2 (en) * 1996-12-18 1998-11-05 Hans Dr Geiger Method and device for the location and size-independent detection of features from an image
US5893085A (en) * 1997-06-10 1999-04-06 Phillips; Ronald W. Dynamic fuzzy logic process for identifying objects in three-dimensional data
US5963653A (en) * 1997-06-19 1999-10-05 Raytheon Company Hierarchical information fusion object recognition system and method
DE19831413C2 (en) * 1998-07-14 2002-03-07 Daimler Chrysler Ag Image processing methods and devices for recognizing objects in traffic
JP4226730B2 (en) * 1999-01-28 2009-02-18 株式会社東芝 Object region information generation method, object region information generation device, video information processing method, and information processing device
US6647139B1 (en) * 1999-02-18 2003-11-11 Matsushita Electric Industrial Co., Ltd. Method of object recognition, apparatus of the same and recording medium therefor
JP4332649B2 (en) * 1999-06-08 2009-09-16 独立行政法人情報通信研究機構 Hand shape and posture recognition device, hand shape and posture recognition method, and recording medium storing a program for executing the method
US6614917B1 (en) * 1999-10-22 2003-09-02 Lockheed Martin Corporation Dynamic process for identifying objects in multi-dimensional data
US6621914B1 (en) * 1999-10-22 2003-09-16 Lockheed Martin Corporation Method and software-implemented apparatus for detecting objects in multi-dimensional data
US6512849B1 (en) * 2000-05-22 2003-01-28 International Business Machines Corporation Finding objects in an image
JP4624594B2 (en) * 2000-06-28 2011-02-02 パナソニック株式会社 Object recognition method and object recognition apparatus
DE10045360A1 (en) * 2000-09-14 2002-03-28 Giesecke & Devrient Gmbh Method for classifying documents, especially banknotes, for use in automatic banknote processing machines, in which to speed and improve classification, only the most significant characteristics are used for sorting
US6801661B1 (en) * 2001-02-15 2004-10-05 Eastman Kodak Company Method and system for archival and retrieval of images based on the shape properties of identified segments
US6937746B2 (en) * 2001-05-31 2005-08-30 Northrop Grumman Corporation System and method for automatic recognition of formations in moving target indication data
US7242806B2 (en) * 2002-01-23 2007-07-10 Honeywell International Inc. Methods, functional Data, and Systems for image feature translation
US20050157931A1 (en) * 2004-01-15 2005-07-21 Delashmit Walter H.Jr. Method and apparatus for developing synthetic three-dimensional models from imagery
JP2006293949A (en) * 2005-03-17 2006-10-26 Sharp Corp Image collating apparatus, image collating method, image collating program, and computer readable recording medium recording image collating program
US7929775B2 (en) * 2005-06-16 2011-04-19 Strider Labs, Inc. System and method for recognition in 2D images using 3D class models

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
See references of WO03025843A2 *

Also Published As

Publication number Publication date
CA2460615A1 (en) 2003-03-27
US8005261B2 (en) 2011-08-23
WO2003025843B1 (en) 2003-10-16
DE10145608A1 (en) 2003-05-08
WO2003025843A2 (en) 2003-03-27
CA2460615C (en) 2012-08-07
WO2003025843A3 (en) 2003-08-07
US20040267682A1 (en) 2004-12-30
DE10145608B4 (en) 2006-01-26

Similar Documents

Publication Publication Date Title
DE69722378T2 (en) METHOD AND DEVICE FOR PROCESSING A THREE-DIMENSIONAL IMAGE USING PARALLAX GEOMETRY OF POINT PAIRS
DE112018000332T5 (en) SEAL VISUAL SLAM WITH PROBABILISTIC SURFEL MAP
DE69932489T2 (en) Method and system for feature-based real-time motion analysis for selecting keyframes from a video sequence
DE102017220307B4 (en) Device and method for recognizing traffic signs
DE69919464T2 (en) Electronic device for image alignment
EP2284795A2 (en) Quantitative analysis, visualization and motion correction in dynamic processes
DE112007000371T5 (en) Object recognition system and method
EP1191476A2 (en) Device and method for calculating a matching transformation between two images
DE112018000107T5 (en) Vehicle camera calibration apparatus and method
DE112009003144T5 (en) Method and device for detecting an obstacle in an image
DE102004046237A1 (en) Method and system for mixed rigid registration of medical 2D / 3D images
DE102019131971A1 (en) An image processing module
DE10145608B4 (en) Model-based object classification and target recognition
EP3931798A1 (en) Estimating the movement of an image position
DE102006036345B4 (en) Method and device for determining the position of objects in three-dimensional space
EP3214602B1 (en) Method for three-dimensional recording of objects
EP3142068B1 (en) Method for three-dimensional recording of objects
DE102005039703A1 (en) Characteristic database setting up method for augmented reality, involves producing texture free three dimensional geometric model of two dimensional projection image for determining characteristics of object
DE102018208604A1 (en) Determining a recording behavior of a recording unit
WO2019072451A1 (en) Method for processing images
DE102021202784B4 (en) Processing of multiple 2-D projection images using an algorithm based on a neural network
WO2012150150A1 (en) Method for estimating the position of an object in a computer-assisted manner
DE102022130692B3 (en) Computer-implemented method for creating a three-dimensional virtual model of a motor vehicle environment
EP0713592B1 (en) Process for recognizing the position and rotational position in space of suitably marked objects in digital image sequences
DE102008036812B4 (en) Method and device for segmenting an object from an image data set

Legal Events

Date Code Title Description
PUAI Public reference made under article 153(3) epc to a published international application that has entered the european phase

Free format text: ORIGINAL CODE: 0009012

17P Request for examination filed

Effective date: 20040402

AK Designated contracting states

Kind code of ref document: A2

Designated state(s): AT BE BG CH CY CZ DE DK EE ES FI FR GB GR IE IT LI LU MC NL PT SE SK TR

AX Request for extension of the european patent

Extension state: AL LT LV MK RO SI

STAA Information on the status of an ep patent application or granted ep patent

Free format text: STATUS: THE APPLICATION HAS BEEN WITHDRAWN

18W Application withdrawn

Effective date: 20060531