DE102020204758A1 - Fast symmetry detection for the classification of objects from digital images - Google Patents
Fast symmetry detection for the classification of objects from digital images Download PDFInfo
- Publication number
- DE102020204758A1 DE102020204758A1 DE102020204758.8A DE102020204758A DE102020204758A1 DE 102020204758 A1 DE102020204758 A1 DE 102020204758A1 DE 102020204758 A DE102020204758 A DE 102020204758A DE 102020204758 A1 DE102020204758 A1 DE 102020204758A1
- Authority
- DE
- Germany
- Prior art keywords
- pixel
- digital image
- signature
- symmetry
- mirror
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/50—Context or environment of the image
- G06V20/56—Context or environment of the image exterior to a vehicle by using sensors mounted on the vehicle
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/25—Determination of region of interest [ROI] or a volume of interest [VOI]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/42—Global feature extraction by analysis of the whole pattern, e.g. using frequency domain transformations or autocorrelation
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Data Mining & Analysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Image Analysis (AREA)
Abstract
Verfahren (100) zur Prüfung eines digitalen Bildes (1) auf eine vorgegebene Spiegelsymmetrie (6) bezüglich einer Achse (2a-2d) oder bezüglich eines Punkts (2), mit den Schritten:• zu jedem Pixel (1a) des digitalen Bildes (1) wird eine Signatur (3) bereitgestellt (110), die Merkmale des digitalen Bildes (1) in einer vorgegebenen Umgebung (1b) dieses Pixels (1a) charakterisiert;• für jedes Auf-Pixel (1a*) aus einer vorgegebenen Teilmenge (1c) des digitalen Bildes (1) wird dessen Signatur (3) mit einem durch die vorgegebene Spiegelsymmetrie (6) festgelegten Reflektor-Operator (4) in eine Spiegel-Signatur (3') umgewandelt (120);• es wird geprüft (130), ob die Spiegel-Signatur (3') gleich oder zumindest hinreichend ähnlich ist zu der Signatur (3), die einem zu dem Auf-Pixel (1a*) gemäß der vorgegebenen Spiegelsymmetrie (6) korrespondierenden Pixel (1a**), und/oder einem Pixel (1a) in einer vorgegebenen Umgebung (1d) dieses korrespondierenden Pixels (1a**), zugeordnet ist;• in Antwort darauf, dass Gleichheit oder hinreichende Ähnlichkeit besteht, wird ein Zähler (5) inkrementiert (140).Method (100) for checking a digital image (1) for a predetermined mirror symmetry (6) with respect to an axis (2a-2d) or with respect to a point (2), with the following steps: • for each pixel (1a) of the digital image ( 1) a signature (3) is provided (110) which characterizes the features of the digital image (1) in a given environment (1b) of this pixel (1a); • for each on-pixel (1a *) from a given subset ( 1c) of the digital image (1), its signature (3) is converted (120) into a mirror signature (3 ') with a reflector operator (4) determined by the specified mirror symmetry (6); it is checked (130 ), whether the mirror signature (3 ') is the same or at least sufficiently similar to the signature (3) which corresponds to a pixel (1a **) corresponding to the up pixel (1a *) according to the specified mirror symmetry (6), and / or a pixel (1a) in a predetermined environment (1d) of this corresponding pixel (1a **), in response to it that equality or sufficient similarity exists, a counter (5) is incremented (140).
Description
Die vorliegende Erfindung betrifft die digitale Bildverarbeitung zur Erkennung von Objekten in digitalen Bildern, beispielsweise in Fahrassistenzsystemen.The present invention relates to digital image processing for recognizing objects in digital images, for example in driver assistance systems.
Stand der TechnikState of the art
Etwa 90 % der Informationen, die ein menschlicher Fahrer zum Führen eines Fahrzeugs im Straßenverkehr benötigt, sind visuelle Informationen. Für Fahrassistenzsysteme und insbesondere für das zumindest teilweise automatisierte Führen von Fahrzeugen ist es daher unabdingbar, Bilder gleich welcher Modalität, die bei der Überwachung des Fahrzeugumfelds aufgenommen werden, inhaltlich zutreffend auszuwerten. Von besonderer Bedeutung für die Fahraufgabe ist eine Klassifikation der Bilder dahingehend, welche verkehrsrelevanten Objekte in ihnen enthalten sind, wie beispielsweise andere Verkehrsteilnehmer, Fahrbahnmarkierungen, Hindernisse und Verkehrszeichen.About 90% of the information a human driver needs to drive a vehicle in traffic is visual information. For driver assistance systems and in particular for the at least partially automated driving of vehicles, it is therefore essential to correctly evaluate images of any modality that are recorded when monitoring the vehicle environment. A classification of the images in terms of which traffic-relevant objects are contained in them, such as other road users, lane markings, obstacles and traffic signs, is of particular importance for the driving task.
Zur Bewältigung dieser Komplexität werden häufig künstliche neuronale Netzwerke eingesetzt. Die
Nicht in allen Anwendungen auf Fahrzeugen ist es praktikabel, aus der Beobachtung des Fahrzeugumfelds gewonnene Bilder mit neuronalen Netzwerken auszuwerten. Die Inferenzberechnung für trainierte neuronale Netzwerke erfordert einen hohen Rechenaufwand. Hardware, die diesen Rechenaufwand innerhalb der geforderten Reaktionszeit bewältigt, kann für manche Anwendungen zu teuer sein oder zu viel Strom benötigen.It is not practicable in all applications on vehicles to use neural networks to evaluate images obtained from observing the vehicle environment. The inference calculation for trained neural networks requires a high computational effort. Hardware that can handle this computational effort within the required response time can be too expensive for some applications or require too much power.
Offenbarung der ErfindungDisclosure of the invention
Im Rahmen der Erfindung wurde ein Verfahren zur Prüfung eines in Pixel unterteilten digitalen Bildes auf eine vorgegebene Spiegelsymmetrie bezüglich einer Achse oder bezüglich eines Punkts entwickelt.In the context of the invention, a method for checking a digital image divided into pixels for a predetermined mirror symmetry with respect to an axis or with respect to a point was developed.
Das digitale Bild kann mit einer beliebigen Modalität aufgenommen worden sein. Es kann beispielsweise ein Kamerabild, ein Wärmebild, ein Radarbild, und/oder ein LIDAR-Bild, sein. Hinsichtlich der Größe ist der Begriff „Bild“ nicht eingeschränkt. Das digitale Bild kann beispielsweise in der Größe verwendet werden, in der ein Sensor es liefert. Das digitale Bild kann aber auch beispielsweise mit einem Vorklassifikator als Region of Interest, ROI, aus einem größeren digitalen Bild vorausgewählt werden, etwa um speziell in dieser ROI nach bestimmten Objekten zu suchen.The digital image can have been captured using any modality. For example, it can be a camera image, a thermal image, a radar image and / or a LIDAR image. The term “image” is not restricted in terms of size. The digital image can, for example, be used in the size in which a sensor delivers it. The digital image can, however, also be preselected from a larger digital image with a pre-classifier as a region of interest, ROI, for example in order to search for specific objects specifically in this ROI.
Zu jedem Pixel des digitalen Bildes wird eine Signatur bereitgestellt, die Merkmale des digitalen Bildes in einer vorgegebenen Umgebung dieses Pixels diskretisiert.A signature is provided for each pixel of the digital image, which discretizes the features of the digital image in a predetermined environment of this pixel.
Hierbei ist unter dem Begriff „Signatur“ insbesondere beispielsweise ein Produkt einer zusammenfassenden und/oder vereinfachenden Verarbeitung des Bildinhalts in der Umgebung des Pixels zu verstehen, aus dem der ursprüngliche Bildinhalt nicht mehr eindeutig rekonstruierbar ist. Der Begriff ist jedoch nicht dahingehend einschränkend zu verstehen, dass es sich um eine „kryptographisch sichere Signatur“ handeln muss, die sich schon bei minimalen Änderungen des digitalen Bildes völlig ändert.Here, the term “signature” is to be understood, for example, as a product of a summarizing and / or simplifying processing of the image content in the vicinity of the pixel, from which the original image content can no longer be clearly reconstructed. However, the term is not to be understood as restrictive to the effect that it has to be a “cryptographically secure signature” that changes completely even with minimal changes to the digital image.
Der Begriff „bereitstellen“ ist nicht darauf beschränkt, dass die Signatur erst anlässlich des Verfahrens ermittelt wird. Die Signaturen können insbesondere beispielsweise bereits für eine andere Auswertung des digitalen Bildes berechnet worden sein und im Rahmen des vorliegenden Verfahrens zweitverwertet werden, was Rechenaufwand einspart. Beispiele für derartige Signaturen sind sogenannte Deskriptoren, die in vielerlei Ausprägungen als Standardinstrumente für die quantitative Auswertung digitaler Bilder genutzt werden.The term “provide” is not restricted to the fact that the signature is only determined during the procedure. In particular, the signatures can already have been calculated for another evaluation of the digital image, for example, and can be used for a second time within the scope of the present method, which saves computational effort. Examples of such signatures are so-called descriptors, which are used in many forms as standard instruments for the quantitative evaluation of digital images.
Für jedes Auf-Pixel aus einer vorgegebenen Teilmenge des digitalen Bildes wird die diesem Auf-Pixel zugeordnete Signatur mit einem durch die vorgegebene Spiegelsymmetrie vorgegebenen Reflektor-Operator in eine Spiegel-Signatur umgewandelt, die die Merkmale der gemäß der vorgegebenen Spiegelsymmetrie gespiegelten Umgebung des Auf-Pixels charakterisiert. Der Begriff „Auf-Pixel“ bedeutet in diesem Zusammenhang insbesondere beispielsweise, dass eine Abfolge weiterer Schritte ausgehend von einem konkreten Pixel des digitalen Bildes durchgeführt wird und diese Abfolge für ein solches konkretes Pixel nach dem anderen wiederholt wird, bis die vorgegebene Teilmenge vollständig abgearbeitet ist.For each on-pixel from a specified subset of the digital image, the signature assigned to this on-pixel is converted into a mirror signature using a reflector operator specified by the specified mirror symmetry, which reflects the features of the surroundings of the on- Pixels characterized. The term “on-pixel” in this context means in particular, for example, that a sequence of further steps is carried out starting from a specific pixel of the digital image and this sequence is repeated for such a specific pixel after the other until the specified subset has been completely processed .
Die Teilmenge des digitalen Bildes, aus der die Auf-Pixel bezogen werden, kann insbesondere beispielsweise durch die vorgegebene Spiegelsymmetrie, auf die das Bild zu untersuchen ist, vorgegeben sein. Wenn das Bild beispielsweise auf eine Spiegelsymmetrie bezüglich einer Achse untersucht wird, die das Bild in zwei Hälften teilt, kann beispielsweise eine dieser Hälften als Teilmenge gewählt werden. Wenn das Bild beispielsweise auf eine Punktsymmetrie bezüglich eines Mittelpunkts untersucht wird, kann beispielsweise eine beliebige zusammenhängende oder auch nicht zusammenhängende Menge von Pixeln, die insgesamt die Hälfte der Pixel des digitalen Bildes ausmacht, als Teilmenge gewählt werden. Die Teilmenge kann aber auch weniger Pixel enthalten. Beispielsweise können die besagten Hälften des digitalen Bildes zu gleichmäßig über diese Hälften verteilten zufälligen „Stichproben“ ausgedünnt werden, um Rechenzeit zu sparen.The subset of the digital image from which the on-pixels are obtained can in particular be predetermined, for example, by the predetermined mirror symmetry for which the image is to be examined. For example, if the image is examined for mirror symmetry with respect to an axis that divides the image into two halves, one of these halves can be selected as a subset, for example. If the image is examined, for example, for a point symmetry with respect to a center point, any contiguous or non-contiguous set of pixels, for example, can make up half the total which make up the pixels of the digital image can be chosen as a subset. However, the subset can also contain fewer pixels. For example, the said halves of the digital image can be thinned out to form random “samples” evenly distributed over these halves in order to save computing time.
Die Spiegel-Signatur ist diejenige Signatur, die sich ergibt, wenn die Umgebung des Auf-Pixels gespiegelt und anschließend die Signatur gebildet wird. Sie wird jedoch nicht auf diesem Wege ermittelt, sondern mit dem Reflektor-Operator direkt aus der ursprünglich bereitgestellten Signatur selbst ermittelt. Dies erfordert einen deutlich geringeren Speicherdurchsatz, also eine deutlich geringere Anzahl von Speicherzugriffen, und vermeidet so bei einer Implementierung auf Hardware Engpässe hinsichtlich der Speicherbandbreite. Je nachdem, welche Funktionsvorschrift für die Erstellung der Signatur verwendet wird und wie der zugehörige Reflektor-Operator beschaffen ist, kann das Ermitteln der Spiegel-Signatur über den Reflektor-Operator zudem deutlich schneller sein als durch Spiegeln der Umgebung des Auf-Pixels und erneutes Berechnen einer Signatur.The mirror signature is the signature that results when the surroundings of the on-pixel are mirrored and the signature is then formed. However, it is not determined in this way, but determined directly from the signature provided originally using the reflector operator. This requires a significantly lower memory throughput, i.e. a significantly lower number of memory accesses, and thus avoids bottlenecks in terms of memory bandwidth when implemented on hardware. Depending on which functional rule is used to create the signature and how the associated reflector operator is designed, determining the mirror signature via the reflector operator can also be significantly faster than by mirroring the area around the on-pixel and recalculating it a signature.
Es wird geprüft, ob die Spiegel-Signatur gleich oder gemäß einer beliebigen Metrik ähnlich ist zu der Signatur, die einem zu dem Auf-Pixel gemäß der vorgegebenen Spiegelsymmetrie korrespondierenden Pixel, und/oder einem Pixel in einer vorgegebenen Umgebung dieses korrespondierenden Pixels, zugeordnet ist. Es wird also bestimmt, an welcher Position gemäß der vorgegebenen Spiegelsymmetrie das zu dem Auf-Pixel korrespondierende Pixel sitzt, und für dieses Pixel, bzw. ein Pixel in einer vorgegebenen Umgebung dieses korrespondierenden Pixels, wird die zuvor bereitgestellte Signatur abgerufen. Anschließend wird diese abgerufene Signatur nach einer vorgegebenen Metrik, bzw. nach einem vorgegebenen Kriterium, mit der erwähnten Spiegel-Signatur verglichen. In Antwort darauf, dass Gleichheit oder hinreichende Ähnlichkeit besteht, wird ein Zähler inkrementiert.It is checked whether the mirror signature is the same or similar according to any metric to the signature which is assigned to a pixel corresponding to the up pixel according to the given mirror symmetry and / or a pixel in a given vicinity of this corresponding pixel . It is therefore determined at which position, according to the specified mirror symmetry, the pixel corresponding to the on-pixel is located, and the previously provided signature is retrieved for this pixel, or a pixel in a predetermined vicinity of this corresponding pixel. This retrieved signature is then compared with the mentioned mirror signature according to a predetermined metric or according to a predetermined criterion. In response to the fact that there is equality or sufficient similarity, a counter is incremented.
Wenn alle Auf-Pixel aus der vorgegebenen Teilmenge abgearbeitet sind, ist der Stand des Zählers ein Maß für die vorgegebene Spiegelsymmetrie. Stand des Zählers von 0 bedeutet, dass für kein Auf-Pixel Gleichheit oder hinreichende Ähnlichkeit der Signaturen festgestellt wurde. Dies deutet darauf hin, dass die vorgegebene Spiegelsymmetrie in dem untersuchten digitalen Bild nicht vorliegt. Entspricht der Stand des Zählers hingegen der Anzahl der Auf-Pixel in der Teilmenge, wurde also für alle Auf-Pixel Gleichheit oder hinreichende Ähnlichkeit der Signaturen festgestellt, deutet dies darauf hin, dass die vorgegebene Spiegelsymmetrie in dem untersuchten digitalen Bild vorliegt.When all of the on-pixels from the specified subset have been processed, the counter status is a measure of the specified mirror symmetry. The
Das Verfahren durchsucht das digitale Bild nicht mit der offenen Fragestellung, welche Symmetrien darin vorliegen, sondern prüft das digitale Bild dahingehend, ob genau eine konkrete Spiegelsymmetrie vorliegt. Es wurde erkannt, dass diese Prüfung deutlich schneller ist und deutlich weniger Rechenleistung, Speicher und Speicherbandbreite ermöglicht als die Durchsuchung mit der offenen Fragestellung. Dies ist ein Stück weit analog dazu, dass eine Hausdurchsuchung bei einem Beschuldigten deutlich effizienter wird, wenn man bereits weiß, nach welchem Beweismittel man suchen muss. Ist etwa bekannt, dass das Beweismittel eine Brechstange ist, braucht man Orte, an denen sich keine Brechstange verstecken lässt, nicht zu durchsuchen und auch keine Aktenordner durchzublättern. Anders sieht es aus, wenn man nicht weiß, ob das Beweismittel nicht auch etwa ein Schriftstück sein könnte. Auch mehrere Prüfungen auf bestimmte konkrete Symmetrien sind immer noch schneller als nur eine Durchsuchung des Bildes nach Symmetrien anhand der offenen Fragestellung.The method does not search the digital image with the open question of which symmetries it contains, but rather checks the digital image to determine whether there is exactly a specific mirror symmetry. It was recognized that this test is significantly faster and allows significantly less computing power, memory and memory bandwidth than the search with the open question. This is somewhat analogous to the fact that a house search of an accused becomes much more efficient if you already know what evidence to look for. If, for example, it is known that the evidence is a crowbar, there is no need to search places where no crowbar can be hidden, nor to leaf through files. It looks different if one does not know whether the evidence could not also be a document. Several tests for certain specific symmetries are still faster than just searching the image for symmetries on the basis of the open question.
In einer besonders vorteilhaften Ausgestaltung wird somit nach dem Abarbeiten aller Auf-Pixel der Teilmenge des digitalen Bildes der Stand des Zählers mit einem vorgegebenen Schwellwert verglichen. In Antwort darauf, dass der vorgegebene Schwellwert erreicht oder überschritten ist, wird festgestellt, dass das Bild die vorgegebene Spiegelsymmetrie aufweist.In a particularly advantageous embodiment, after processing all of the on-pixels of the subset of the digital image, the status of the counter is compared with a predetermined threshold value. In response to the fact that the predefined threshold value has been reached or exceeded, it is determined that the image has the predefined mirror symmetry.
In einer besonders vorteilhaften Ausgestaltung umfasst die einem Auf-Pixel zugeordnete Signatur einen binären Deskriptor der vorgegebenen Umgebung dieses Auf-Pixels. Wie zuvor erläutert, werden Deskriptoren vielfach in der digitalen Bildverarbeitung eingesetzt. Ein binärer Deskriptor hat im Kontext des vorliegenden Verfahrens nun den besonderen Vorteil, dass die Signatur durch schnelle Binäroperationen in die Spiegel-Signatur umgewandelt werden kann. So kann die Signatur insbesondere beispielsweise durch eine Exklusiv-Oder-Operation, XOR, mit einem binären Reflektor-Operator in die Spiegel-Signatur umgewandelt werden.In a particularly advantageous embodiment, the signature assigned to an on-pixel comprises a binary descriptor of the predetermined surroundings of this on-pixel. As previously explained, descriptors are widely used in digital image processing. In the context of the present method, a binary descriptor has the particular advantage that the signature can be converted into the mirror signature by means of rapid binary operations. For example, the signature can be converted into the mirror signature using an exclusive-or operation, XOR, with a binary reflector operator.
Der binäre Deskriptor kann insbesondere beispielsweise das Ergebnis der Anwendung mindestens eines Filterkerns auf die Umgebung des Auf-Pixels umfassen. Ein Filterkern kann insbesondere beispielsweise Werte (etwa Intensitätswerte), mit denen die Pixel in der Umgebung des Auf-Pixels belegt sind, zu einer Zahl verrechnen, deren Binärdarstellung in den binären Deskriptor eingeht. In dem binären Deskriptor können insbesondere beispielsweise mehrere derartige Binärdarstellungen zusammengefasst sein.The binary descriptor can in particular include, for example, the result of the application of at least one filter kernel to the surroundings of the on-pixel. A filter kernel can in particular, for example, calculate values (such as intensity values) with which the pixels in the vicinity of the on-pixel are assigned to form a number, the binary representation of which is included in the binary descriptor. In particular, several such binary representations can be combined in the binary descriptor, for example.
In einer besonders vorteilhaften Ausgestaltung eines Filterkerns wird die errechnete Zahl mit einem vorgegebenen Schwellwert verglichen, so dass direkt ein binäres (,0' oder ,1') Vergleichsergebnis in den Deskriptor einfließen kann.In a particularly advantageous embodiment of a filter core, the calculated number is also included compared to a predetermined threshold value, so that a binary ('0' or '1') comparison result can flow into the descriptor directly.
Die vorgegebene Umgebung des korrespondierenden Pixels, in der Signaturen für den Vergleich mit der Spiegel-Signatur herangezogen werden, kann insbesondere beispielsweise eine NxN-Nachbarschaft, mit 2 ≤ N ≤ 5, sein. Damit wird eine gewisse Toleranz beispielsweise gegen perspektivische Verzerrungen der Bildaufnahme durch eine Verkippung der für die Bildaufnahme verwendeten Kamera gegenüber der Szenerie geschaffen.The predefined environment of the corresponding pixel in which signatures are used for the comparison with the mirror signature can in particular be, for example, an NxN neighborhood, with 2
Insbesondere kann beispielsweise die Spiegel-Signatur mit den Signaturen mehrerer Pixel in der vorgegebenen Umgebung des korrespondierenden Pixels verglichen werden. Die größte hierbei festgestellte Ähnlichkeit kann dann als Ergebnis der Prüfung auf Gleichheit oder Ähnlichkeit gewertet werden, wobei Gleichheit der maximal möglichen Ähnlichkeit entspricht.In particular, for example, the mirror signature can be compared with the signatures of a plurality of pixels in the predefined vicinity of the corresponding pixel. The greatest similarity found here can then be assessed as the result of the test for equality or similarity, with equality corresponding to the maximum possible similarity.
Wie zuvor erläutert, liegt der tiefere Sinn der Prüfung auf vorgegebene Spiegelsymmetrien darin, schnell und effizient Objekte in digitalen Bildern zu erkennen. Die zuvor beschriebene Erkenntnis, dass die Prüfung auf das Vorhandensein einer konkreten vorgegebenen Spiegelsymmetrie besonders schnell und ressourceneffizient ist, lässt sich verallgemeinern: Auch die Prüfung, ob ein digitales Bild ein konkret vorgegebenes Objekt zeigt, ist wesentlich effizienter als das Durchsuchen des digitalen Bildes mit der offenen Fragestellung, welche Objekte dieses digitale Bild zeigt. Ob das digitale Bild das vorgegebene Objekt zeigt, lässt sich anhand der Symmetrien des Bildes prüfen.As explained above, the deeper purpose of checking for specified mirror symmetries is to quickly and efficiently recognize objects in digital images. The knowledge described above that the check for the existence of a specific, specified mirror symmetry is particularly fast and resource-efficient, can be generalized: The check as to whether a digital image shows a specifically specified object is also much more efficient than searching through the digital image with the open question as to which objects this digital image shows. The symmetries of the image can be used to check whether the digital image shows the specified object.
Die Erfindung stellt daher auch ein Verfahren zur Erkennung von Objekten in einem digitalen Bild bereit.The invention therefore also provides a method for recognizing objects in a digital image.
Im Rahmen dieses Verfahrens werden Symmetriegrade ermittelt, die ein Maß dafür sind, wie symmetrisch das digitale Bild in Bezug auf Spiegelungen an Mittelachsen und/oder an einem Mittelpunkt des digitalen Bildes ist. Die Mittelachsen können beispielsweise ein rechteckiges digitales Bild in horizontaler, vertikaler oder auch diagonaler Richtung teilen.In the context of this method, degrees of symmetry are determined, which are a measure of how symmetrical the digital image is with respect to reflections on central axes and / or at a center point of the digital image. The central axes can, for example, divide a rectangular digital image in a horizontal, vertical or even diagonal direction.
Die Symmetriegrade können insbesondere beispielsweise auf der Basis eines mit den zuvor beschriebenen Verfahren ermittelten Zählerstandes ermittelt werden. Es kann jedoch auch jedes beliebige andere Verfahren zum Einsatz kommen. Das Ermitteln, zu welchem Grade eine konkret vorgegebene Symmetrie in dem digitalen Bild vorliegt, ist grundsätzlich effizienter als die Suche nach Symmetrien anhand einer offenen Fragestellung.The degrees of symmetry can in particular be determined, for example, on the basis of a counter reading determined using the method described above. However, any other desired method can also be used. Determining the degree to which a specifically predetermined symmetry exists in the digital image is fundamentally more efficient than the search for symmetries on the basis of an open question.
Es werden Vergleichsinformationen zu Symmetriegraden bereitgestellt, die zu erwarten sind, wenn das digitale Bild mindestens ein vorgegebenes Objekt zeigt. Wenn beispielsweise zu prüfen ist, ob das digitale Bild einen Autoreifen zeigt, dann ist zu erwarten, dass dieser Autoreifen sowohl bezüglich einer Spiegelung an beliebigen Mittelachsen als auch bezüglich einer Spiegelung an seinem Mittelpunkt symmetrisch ist. Wenn zu prüfen ist, ob das digitale Bild eine Front- oder Heck-Ansicht eines Fahrzeugs zeigt, ist zu erwarten, dass das Fahrzeug zumindest bezüglich einer Spiegelung an einer vertikal durch das Bild verlaufenden Mittelachse symmetrisch ist.Comparative information is provided on degrees of symmetry that are to be expected when the digital image shows at least one predetermined object. If, for example, it is to be checked whether the digital image shows a car tire, then it is to be expected that this car tire is symmetrical both with respect to a reflection on any central axes and with respect to a reflection at its center point. If it is to be checked whether the digital image shows a front or rear view of a vehicle, it is to be expected that the vehicle is at least symmetrical with respect to a reflection on a central axis running vertically through the image.
Die ermittelten Symmetriegrade werden mit den Vergleichsinformationen verglichen. In Antwort darauf, dass die ermittelten Symmetriegrade nach Maßgabe eines vorgegebenen Kriteriums in Einklang mit den Vergleichsinformationen stehen, wird festgestellt, dass weitere Kriterien für das vorgegebene Objekt in dem Bild erkannt sind. Insbesondere kann beispielsweise festgestellt werden, dass das vorgegebene Objekt in dem Bild erkannt ist. Analog dem zuvor Beschriebenen ist auch die mehrmalige Prüfung auf das Vorhandensein jeweils eines konkreten Objekts schneller als eine Untersuchung des digitalen Bildes mit der offenen Fragestellung, welche Objekte in dem Bild enthalten sind.The determined degrees of symmetry are compared with the comparison information. In response to the fact that the determined degrees of symmetry are in accordance with the comparison information in accordance with a predetermined criterion, it is determined that further criteria for the predetermined object are recognized in the image. In particular, it can be established, for example, that the predefined object is recognized in the image. Analogously to what has been described above, the repeated checking for the presence of a specific object is also faster than an examination of the digital image with the open question of which objects are contained in the image.
Das Kriterium kann beispielsweise beinhalten, dass Symmetriegrade bezüglich bestimmter Spiegelungen oberhalb eines Schwellwerts liegen. Das Kriterium kann aber beispielsweise alternativ oder in Kombination auch beinhalten, dass Symmetriegrade bezüglich bestimmter Spiegelungen unterhalb eines Schwellwerts liegen. Es kann also beispielsweise danach gefragt werden, ob Symmetrie bezüglich einer ersten Spiegelung an einer ersten Achse vorliegt, nicht jedoch Symmetrie bezüglich einer zweiten Spiegelung an einer zweiten Achse.The criterion can include, for example, that degrees of symmetry with regard to certain reflections are above a threshold value. The criterion can, however, alternatively or in combination also contain, for example, that degrees of symmetry with regard to certain reflections are below a threshold value. It can therefore be asked, for example, whether there is symmetry with respect to a first reflection on a first axis, but not symmetry with respect to a second reflection on a second axis.
In einer besonders vorteilhaften Ausgestaltung werden die erkannten Objekte gegen diejenigen Objekte, die ein trainiertes künstliches neuronales Netzwerk in dem gleichen digitalen Bild erkannt hat, plausibilisiert. Es kann also beispielsweise geprüft werden, ob es auch anhand der Symmetriegrade plausibel erscheint, dass diejenigen Objekte, die das neuronale Netzwerk erkannt hat, in dem digitalen Bild vorhanden sind. Das neuronale Netzwerk kann also beispielsweise diejenigen konkreten Objekte vorgeben, auf deren Vorhandensein das digitale Bild anhand der Symmetriegrade geprüft werden soll. Auf diese Weise kann eine Fehlklassifikation von Objekten durch das neuronale Netzwerk erkannt werden. Eine solche Sicherheitsebene für die Objekterkennung mit dem neuronalen Netzwerk ist sehr wertvoll für die Erlangung behördlicher Zulassungen, beispielsweise für Fahrassistenzsysteme oder Systeme zum zumindest teilweise automatisierten Führen von Fahrzeugen. Hier ist für die Objekterkennung genauso eine Sicherheitsebene gefordert wie das Fahrzeug selbst zwei voneinander unabhängige Bremsen haben muss.In a particularly advantageous embodiment, the recognized objects are checked for plausibility against those objects that a trained artificial neural network has recognized in the same digital image. It can therefore be checked, for example, whether it also appears plausible on the basis of the degrees of symmetry that those objects that the neural network has recognized are present in the digital image. The neural network can therefore, for example, specify those specific objects for the presence of which the digital image is to be checked on the basis of the degrees of symmetry. In this way, a misclassification of objects by the neural network can be recognized. Such a security level for object recognition with the neural network is very valuable for obtaining official approvals, for example for driver assistance systems or systems for at least partially automated driving of vehicles. A safety level is required here for object recognition just as the vehicle itself must have two brakes that are independent of one another.
Fehlklassifikationen können beispielsweise auftreten, wenn ein neues Verkehrszeichen eingeführt wird und das neuronale Netzwerk hierauf noch nicht trainiert ist. Fehlklassifikationen können aber auch durch gezielte Manipulationen von digitalen Bildern oder in den Bildern enthaltenen Objekten (sogenannte „adversarial attacks“) bewusst provoziert werden. So lässt sich etwa ein Stoppschild durch Anbringen eines scheinbar unscheinbaren Aufklebers so manipulieren, dass ein neuronales Netzwerk es als „Tempo 70“-Schild klassifiziert. Auch kann beispielsweise durch Anbringen einer Folie mit einem halbdurchlässigen Punktmuster auf einer Kameralinse eine Objekterkennung so aus dem Takt gebracht werden, dass sie etwa keinen einzigen Fußgänger mehr als solchen erkennt. Derartige Fehler können durch die Plausibilisierung anhand der Symmetriegrade erkannt werden. Wenn etwa das neuronale Netzwerk an Stelle eines Fußgängers eine freie Fläche erkennt, sollte diese maximal symmetrisch sein. Ist sie es nicht, weil in Wahrheit doch ein Fußgänger vorhanden ist, liegt ein Fehler vor.Incorrect classifications can occur, for example, when a new traffic sign is introduced and the neural network is not yet trained for this. However, misclassifications can also be deliberately provoked by targeted manipulation of digital images or objects contained in the images (so-called "adversarial attacks"). For example, a stop sign can be manipulated by attaching an apparently inconspicuous sticker so that a neural network classifies it as a “Tempo 70” sign. By attaching a film with a semi-permeable point pattern to a camera lens, for example, object recognition can also be brought out of sync so that it no longer recognizes a single pedestrian as such. Such errors can be recognized by the plausibility check based on the degrees of symmetry. If, for example, the neural network detects a free area instead of a pedestrian, it should be as symmetrical as possible. If it is not, because in truth there is a pedestrian, there is an error.
In einer weiteren besonders vorteilhaften Ausgestaltung wird das digitale Bild bereitgestellt, indem es mit einem Vorklassifikator als Region of Interest, ROI, aus einem größeren digitalen Bild vorausgewählt wird. Auf diese Weise kann das digitale Bild so vorbereitet werden, dass das interessierende Objekt dort genau mittig positioniert ist und das digitale Bild möglichst nur dieses interessierende Objekt enthält. Das Vorliegen bestimmter Symmetriegrade ist dann ein besonders zuverlässiger Indikator dafür, ob das interessierende Objekt in dem digitalen Bild vorhanden ist oder nicht. Beispielsweise kann eine ROI im Rahmen der Objekterkennung mit dem neuronalen Netzwerk ermittelt werden.In a further particularly advantageous embodiment, the digital image is provided in that it is preselected from a larger digital image with a pre-classifier as a region of interest, ROI. In this way, the digital image can be prepared in such a way that the object of interest is positioned exactly in the middle there and the digital image contains only this object of interest as far as possible. The presence of certain degrees of symmetry is then a particularly reliable indicator of whether or not the object of interest is present in the digital image. For example, an ROI can be determined in the context of object recognition with the neural network.
Nach dem zuvor Beschriebenen bezieht sich die Erfindung auch auf ein Steuergerät für ein Fahrassistenzsystem oder für ein System zum zumindest teilweise automatisierten Führen eines Fahrzeugs. Dieses Steuergerät umfasst eine erste Schnittstelle zur Eingabe digitaler Bilder, eine Logikeinheit zur Auswertung dieser digitalen Bilder und Bildung eines Steuerbefehls, sowie eine zweite Schnittstelle zur Ausgabe dieses Steuerbefehls an mindestens einen Aktor des Fahrzeugs.According to what has been described above, the invention also relates to a control device for a driver assistance system or for a system for at least partially automated driving of a vehicle. This control device comprises a first interface for inputting digital images, a logic unit for evaluating these digital images and generating a control command, and a second interface for outputting this control command to at least one actuator of the vehicle.
Die erste Schnittstelle ist mit mindestens einem Sensor für die Aufnahme digitaler Bilder verbindbar. Die Logikeinheit erhält die digitalen Bilder als Eingabe und ist dazu ausgebildet, mit dem zuletzt beschriebenen Verfahren Objekte in diesen digitalen Bildern zu erkennen bzw. das durch ein anderes System vorhergesagte Vorhandensein dieser Objekte in den digitalen Bildern zu plausibilisieren. Die Logikeinheit ist weiterhin dazu ausgebildet, auf der Basis der erkannten Objekte mindestens einen Steuerbefehl für mindestens einen Aktor, der die Fahrdynamik eines mit dem Fahrassistenzsystem, bzw. mit dem System zum zumindest teilweise automatisierten Führen, ausgestatteten Fahrzeugs zu beeinflussen vermag, zu ermitteln. Die zweite Schnittstelle ist zwecks Ausgabe des Steuerbefehls mit dem mindestens einen Aktor des Fahrzeugs verbindbar.The first interface can be connected to at least one sensor for recording digital images. The logic unit receives the digital images as input and is designed to use the method described last to recognize objects in these digital images or to check the plausibility of the presence of these objects in the digital images predicted by another system. The logic unit is also designed to determine, on the basis of the detected objects, at least one control command for at least one actuator that is able to influence the driving dynamics of a vehicle equipped with the driver assistance system or the system for at least partially automated driving. The second interface can be connected to the at least one actuator of the vehicle for the purpose of outputting the control command.
Die Verfahren können insbesondere ganz oder teilweise computerimplementiert sein. Daher bezieht sich die Erfindung auch auf ein Computerprogramm mit maschinenlesbaren Anweisungen, die, wenn sie auf einem oder mehreren Computern ausgeführt werden, den oder die Computer dazu veranlassen, eines der beschriebenen Verfahren auszuführen. In diesem Sinne sind auch Steuergeräte für Fahrzeuge und Embedded-Systeme für technische Geräte, die ebenfalls in der Lage sind, maschinenlesbare Anweisungen auszuführen, als Computer anzusehen.In particular, the methods can be implemented in whole or in part by a computer. The invention therefore also relates to a computer program with machine-readable instructions which, when they are executed on one or more computers, cause the computer or computers to carry out one of the described methods. In this sense, control devices for vehicles and embedded systems for technical devices, which are also able to execute machine-readable instructions, are to be regarded as computers.
Ebenso bezieht sich die Erfindung auch auf einen maschinenlesbaren Datenträger und/oder auf ein Downloadprodukt mit dem Computerprogramm. Ein Downloadprodukt ist ein über ein Datennetzwerk übertragbares, d.h. von einem Benutzer des Datennetzwerks downloadbares, digitales Produkt, das beispielsweise in einem Online-Shop zum sofortigen Download feilgeboten werden kann.The invention also relates to a machine-readable data carrier and / or to a download product with the computer program. A download product is a digital product that can be transmitted via a data network, i.e. that can be downloaded by a user of the data network and that can be offered for immediate download in an online shop, for example.
Weiterhin kann ein Computer mit dem Computerprogramm, mit dem maschinenlesbaren Datenträger bzw. mit dem Downloadprodukt ausgerüstet sein.Furthermore, a computer can be equipped with the computer program, with the machine-readable data carrier or with the download product.
Weitere, die Erfindung verbessernde Maßnahmen werden nachstehend gemeinsam mit der Beschreibung der bevorzugten Ausführungsbeispiele der Erfindung anhand von Figuren näher dargestellt.Further measures improving the invention are illustrated in more detail below together with the description of the preferred exemplary embodiments of the invention with reference to figures.
FigurenlisteFigure list
Es zeigt:
-
1 Ausführungsbeispiel des Verfahrens 100 zur Prüfung auf eine vorgegebene Spiegelsymmetrie6 ; -
2 Illustration einer Momentaufnahme der Ausführung desVerfahrens 100 aneinem digitalen Bild 1 ; -
3 Ausführungsbeispiel des Verfahrens 200 zur Erkennung von Objekten; -
4 Ausführungsbeispiel des Steuergeräts10 .
-
1 Embodiment of themethod 100 to check for a given mirror symmetry6th ; -
2 Illustration of a snapshot of the execution of theprocedure 100 on adigital image 1 ; -
3 Embodiment of themethod 200 for the detection of objects; -
4th Embodiment of thecontrol unit 10 .
In Schritt
In Schritt
In Schritt
Der Stand dieses Zählers
Innerhalb des Kastens
Gemäß Block
Gemäß Block
In der in
Zu dem Auf-Pixel
In Schritt
In Schritt
Die Logikeinheit
Die zweite Schnittstelle
ZITATE ENTHALTEN IN DER BESCHREIBUNGQUOTES INCLUDED IN THE DESCRIPTION
Diese Liste der vom Anmelder aufgeführten Dokumente wurde automatisiert erzeugt und ist ausschließlich zur besseren Information des Lesers aufgenommen. Die Liste ist nicht Bestandteil der deutschen Patent- bzw. Gebrauchsmusteranmeldung. Das DPMA übernimmt keinerlei Haftung für etwaige Fehler oder Auslassungen.This list of the documents listed by the applicant was generated automatically and is included solely for the better information of the reader. The list is not part of the German patent or utility model application. The DPMA assumes no liability for any errors or omissions.
Zitierte PatentliteraturPatent literature cited
- GB 2454857 B [0003]GB 2454857 B [0003]
Claims (14)
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE102020204758.8A DE102020204758A1 (en) | 2020-04-15 | 2020-04-15 | Fast symmetry detection for the classification of objects from digital images |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE102020204758.8A DE102020204758A1 (en) | 2020-04-15 | 2020-04-15 | Fast symmetry detection for the classification of objects from digital images |
Publications (1)
Publication Number | Publication Date |
---|---|
DE102020204758A1 true DE102020204758A1 (en) | 2021-10-21 |
Family
ID=77919360
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE102020204758.8A Pending DE102020204758A1 (en) | 2020-04-15 | 2020-04-15 | Fast symmetry detection for the classification of objects from digital images |
Country Status (1)
Country | Link |
---|---|
DE (1) | DE102020204758A1 (en) |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB2454857B (en) | 2006-09-18 | 2010-06-09 | Bosch Gmbh Robert | Method for processing a microscope intensity image |
-
2020
- 2020-04-15 DE DE102020204758.8A patent/DE102020204758A1/en active Pending
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB2454857B (en) | 2006-09-18 | 2010-06-09 | Bosch Gmbh Robert | Method for processing a microscope intensity image |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DE102018128289A1 (en) | METHOD AND DEVICE FOR AUTONOMOUS SYSTEM PERFORMANCE AND CLASSIFICATION | |
WO2014118178A1 (en) | Creation of an environment model for a vehicle | |
EP2034461A2 (en) | Method for detecting and/or tracking moved objects in a monitoring zone with stoppers, device and computer program | |
EP3393875B1 (en) | Method for the improved detection of objects by a driver assistance system | |
DE102015208139A1 (en) | Vehicle occupant detection by means of the distance between passenger and driver characteristics | |
DE112021006280T5 (en) | GENERATE DATA BASED ON PRE-TRAINED MODELS USING GENERATING COMPETING MODELS | |
EP3746939A1 (en) | Method for evaluating sensor data having extended object recognition | |
DE102018113621A1 (en) | A method of training a convolutional neural network for processing image data for use in a driving support system | |
DE102019213061A1 (en) | Classification of AI modules | |
DE102019220069A1 (en) | More reliable classification of radar data from dynamic scenarios | |
DE102020204758A1 (en) | Fast symmetry detection for the classification of objects from digital images | |
DE102019204602A1 (en) | Method and device for masking objects contained in an image | |
DE102018114912A1 (en) | Method for classifying a color of a road marking by means of a statistical road marking determination model, electronic computing device and driver assistance system | |
DE102021204040A1 (en) | Method, device and computer program for creating training data in the vehicle | |
DE102021201833A1 (en) | Device for processing at least one input data set using a neural network and method | |
DE102020213253A1 (en) | COMPUTER-IMPLEMENTED CONSISTENT CLASSIFICATION PROCEDURES | |
DE102016200854B4 (en) | Method and arithmetic unit for dimensioning a classifier | |
EP2887264B1 (en) | Circle segment and form detection | |
DE102021214253A1 (en) | Determination of the image parts that are relevant for image processing with a transformer network | |
DE102012221155A1 (en) | Method for providing evaluation matrix for recognizing traffic sign to vehicle e.g. motor vehicle, involves associating evaluation matrix rows or columns of training matrix and irrelevant traffic sign with irrelevant classes | |
WO2023135244A1 (en) | Method and system for automatically annotating sensor data | |
DE102022204364A1 (en) | Quality determination of object recognition by a neural network | |
DE102021131868A1 (en) | Reliability check of an object classification | |
DE102020133626A1 (en) | Method for recognizing scenes, assistance devices and motor vehicles which are difficult to classify correctly for a neural network | |
DE102022204618A1 (en) | Effective quality determination of object recognition by a neural network |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
R079 | Amendment of ipc main class |
Free format text: PREVIOUS MAIN CLASS: G06K0009620000 Ipc: G06V0030190000 |