DE102017218914A1 - Method for recognizing persons - Google Patents
Method for recognizing persons Download PDFInfo
- Publication number
- DE102017218914A1 DE102017218914A1 DE102017218914.2A DE102017218914A DE102017218914A1 DE 102017218914 A1 DE102017218914 A1 DE 102017218914A1 DE 102017218914 A DE102017218914 A DE 102017218914A DE 102017218914 A1 DE102017218914 A1 DE 102017218914A1
- Authority
- DE
- Germany
- Prior art keywords
- image
- descriptor
- camera
- person
- metric
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/103—Static body considered as a whole, e.g. static pedestrian or occupant recognition
Abstract
Die vorliegende Erfindung betrifft ein Verfahren zum Erkennen von Personen, umfassend: Aufnehmen eines Abbildes (1) einer Person mittels einer Kamera (2), Extrahieren einzelner Bildmerkmale aus dem Abbild (1) und Beschreiben der Bildmerkmale mittels Deskriptoren (7), Bestimmen eines Deskriptorabstands (8) zwischen den Deskriptoren (7) des Abbilds (1) und vorbekannten Deskriptoren (7) von zumindest einem vorbekannten Referenzbild (3) einer vorbekannten Bildersammlung (4) mittels einer vorbekannten Metrik, und Ausgeben eines Wahrscheinlichkeitswerts, dass die Person auf dem Referenzbild (3) abgebildet ist, der anhand des Deskriptorabstands (8) bestimmt wurde, oder einer Reihenfolge mehrerer Referenzbilder (3), die einen zunehmenden Deskriptorabstand (8) zwischen dem Deskriptor (7) des Abbilds (1) und dem jeweiligen vorbekannten Deskriptor (7) des Referenzbildes (3) wiederspiegelt, wobei zumindest ein Bildaufnahmeparameter der Kamera (2) während der Aufnahme des Abbilds (1) mit zumindest einem korrespondierenden Bildaufnahmeparameter während der Aufnahme des Referenzbilds (3) verglichen wird, um einen Differenzwert zwischen den Bildaufnahmeparametern zu bestimmen, und dass bei dem Bestimmen des Deskriptorabstands (8) solche Referenzbilder (3) unberücksichtigt bleiben, für die der Differenzwert größer als ein vordefinierter Schwellwert ist. The present invention relates to a method for recognizing persons, comprising: capturing an image (1) of a person by means of a camera (2), extracting individual image features from the image (1) and describing the image features using descriptors (7), determining a descriptor spacing (8) between the descriptors (7) of the image (1) and known descriptors (7) of at least one known reference image (3) of a previously known image collection (4) by means of a previously known metric, and outputting a probability value that the person on the reference image (3), which has been determined on the basis of the descriptor spacing (8), or an order of a plurality of reference images (3) having an increasing descriptor spacing (8) between the descriptor (7) of the image (1) and the respective previously known descriptor (7 ) of the reference image (3), wherein at least one image acquisition parameter of the camera (2) during the acquisition of the image (1) with at least a corresponding image acquisition parameter during the recording of the reference image (3) is determined in order to determine a difference value between the image acquisition parameters, and that in determining the descriptor distance (8) those reference images (3) for which the difference value is greater than a predefined threshold value are disregarded is.
Description
Stand der TechnikState of the art
Die vorliegende Erfindung betrifft ein Verfahren zum Erkennen von Personen. Insbesondere handelt es sich um das Wiedererkennen von Personen, von denen zuvor bereits ein Abbild aufgenommen wurde. Außerdem betrifft die Erfindung ein entsprechendes Computerprogrammprodukt sowie ein System umfassend eine Kamera und ein Steuergerät zum Ausführen eines derartigen Verfahrens.The present invention relates to a method for recognizing persons. In particular, it is the recognition of persons from whom an image has already been taken. Moreover, the invention relates to a corresponding computer program product and a system comprising a camera and a control device for carrying out such a method.
Aus dem Stand der Technik sind Personen-Wiedererkennungsalgorithmen bekannt. Diese werden insbesondere auch „person re-identification, PRID“ genannt. Personen im Nahbereich von Kameras lassen sich aufgrund deren Gesichter mit hoher Genauigkeit wiedererkennen. Dieses Verfahren wird insbesondere „face recognition“ genannt. Im erweiterten Nahbereich oder Fernbereich der Kamera können diese Algorithmen nicht robust arbeiten, da die Abbildung der Gesichter auf das Bild zu klein für eine zuverlässige Wiedererkennung ist. Auch können die Verfahren nicht robust eingesetzt werden, wenn Personen sich absichtlich oder zufällig von der Kamera abwenden. Nicht nur aus diesem Grund lässt sich eine erhöhte Aktivität im Forschungsbereich der Personen-Wiedererkennungsalgorithmen beobachten, in dem versucht wird, die ganze Person anhand ihrer Farb- und Texturmerkmale (engl. Appearance) wiederzuerkennen und nicht lediglich anhand ihres Gesichts.Personal recognition algorithms are known in the art. These are also called "person re-identification, PRID". People in the vicinity of cameras can be recognized due to their faces with high accuracy. This method is called "face recognition" in particular. In the extended near or far range of the camera, these algorithms can not work robustly because the image of the faces on the image is too small for reliable recognition. Also, the methods can not be used stably if people deliberately or accidentally turn away from the camera. Not only for this reason is there an increased activity in the field of research of the person recognition algorithms, in which one tries to recognize the whole person on the basis of their color and texture characteristics (English Appearance) and not only on the basis of their face.
Aus der
Offenbarung der ErfindungDisclosure of the invention
Das erfindungsgemäße Verfahren zum Erkennen von Personen erlaubt ein zuverlässiges Erkennen, da insbesondere die Bildaufnahmeparameter verwendet werden. Ergibt eine Analyse der Bildaufnahmeparameter, dass ein Abbild einer Person mit gänzlich anderen Bildaufnahmeparametern aufgenommen wurde als ein vorbekanntes Referenzbild einer vorbekannten Bildersammlung, so ist ein Vergleich mittels Deskriptoren nicht aussagekräftig, da die Bilder zwar dieselbe Person zeigen können, dies jedoch aufgrund der unterschiedlichen Bildaufnahmeparameter nicht unmittelbar ersichtlich ist. Um die Gefahr von Fehlerkennungen zu minimieren, ist daher vorgesehen, dass solche vorbekannten Referenzbilder unberücksichtigt bleiben, bei denen eine zu große Abweichung der Bildaufnahmeparameter zu dem Abbild einer wiederzuerkennenden Person vorhanden ist oder explizit die Bildaufnahmeparameter bei der Bildauswertung zu berücksichtigen und den Deskriptor unter Einbezug der Bildaufnahmeparameter zu bestimmen.The inventive method for recognizing persons allows a reliable recognition, since in particular the image acquisition parameters are used. If an analysis of the image acquisition parameters shows that an image of a person with completely different image acquisition parameters was taken than a previously known reference image of a previously known image collection, a comparison by means of descriptors is not meaningful since the images can show the same person, but not because of the different image acquisition parameters is immediately apparent. In order to minimize the risk of false identifications, it is therefore provided that such prior art reference images are not taken into account, in which there is too great a deviation of the image acquisition parameters from the image of a person to be recognized, or explicitly take into account the image acquisition parameters in the image analysis, and include the descriptor with reference to the image Determine image acquisition parameters.
Das Verfahren zum Erkennen von Personen umfasst die folgenden Schritte: Zunächst erfolgt das Aufnahmen eines Abbilds einer Person mittels einer Kamera. Die Person auf dem Abbild soll anschließend aus einer vorbekannten Bildersammlung wiedererkannt werden. Dazu erfolgt als nächster Schritt das Extrahieren einzelner Bildmerkmale aus dem Abbild und Beschreiben der Bildmerkmale mittels Deskriptoren. Dies wurde eingangs bereits erläutert. Anschließend wird in einem Deskriptorraum ein Deskriptorabstand zwischen den Deskriptoren des Abbilds und vorbekannten Deskriptoren von zumindest einem vorbekannten Referenzbild einer vorbekannten Bildersammlung mittels einer vorbekannten Metrik bestimmt. Die Metrik wird insbesondere von einem selbstlernenden System gelernt und/oder optimiert. Anschließend erfolgt das Ausgeben eines Wahrscheinlichkeitswerts oder eines Rankings bzw. Distanzmaßes, dass die Person auf dem Referenzbild abgebildet ist, der anhand des Deskriptorabstands bestimmt wurde. Erfindungsgemäß ist vorgesehen, dass zumindest ein Bildaufnahmeparameter der Kamera während der Aufnahme des Abbilds mit zumindest einem korrespondierenden Bildaufnahmeparameter während der Aufnahme des Referenzbilds verglichen wird. So lässt sich ein Differenzwert zwischen den Bildaufnahmeparametern bestimmen. Erfindungsgemäß ist weiterhin vorgesehen, dass bei dem Bestimmen des Deskriptorabstands solche Referenzbilder unberücksichtigt bleiben, für die der zuvor bestimmte Differenzwert zwischen den Bildaufnahmeparametern größer als ein vordefinierter Schwellwert ist. Besonders vorteilhaft ist vorgesehen, dass ein Vergleich des Abbilds mit mehreren Referenzbildern der Bildersammlung erfolgt. Somit werden die Deskriptorabstände einer Vielzahl von Deskriptoren ermittelt. Unterschreitet der Deskriptorabstand zweier Deskriptoren einen vordefinierten Grenzabstand und/oder ist der Deskriptorabstand ein kleinster Deskriptorabstand, so wird ein hoher Wahrscheinlichkeitswert angenommen, dass die Person auf dem Referenzbild abgebildet ist. Da erheblich abweichende Bildaufnahmeparameter zu einer gänzlich unterschiedlichen Darstellung derselben Szenerie führen können, besteht die Gefahr, dass durch gänzlich unterschiedliche Bildaufnahmeparameter unterschiedliche Merkmale solche Deskriptoren aufweisen, die nur einen geringen Deskriptorabstand darstellen. Somit besteht die Gefahr einer fehlerhaften Erkennung der Person auf einem Referenzbild, das die Person gar nicht darstellt. Um dies zu verhindern, werden solche Referenzbilder nicht berücksichtigt, die hinsichtlich ihrer Bildaufnahmeparameter von den Bildaufnahmeparametern des Abbilds abweichen.The method for recognizing persons comprises the following steps: First of all, an image of a person is taken by means of a camera. The person on the image should then be recognized from a previously known image collection. For this purpose, the next step is the extraction of individual image features from the image and describing the image features using descriptors. This has already been explained at the beginning. Subsequently, in a descriptor space, a descriptor distance between the descriptors of the image and known descriptors of at least one known reference image of a previously known image collection is determined by means of a previously known metric. In particular, the metric is learned and / or optimized by a self-learning system. Subsequently, the outputting of a probability value or a ranking or distance measure takes place, so that the person is depicted on the reference image, which was determined on the basis of the descriptor distance. According to the invention, at least one image acquisition parameter of the camera is compared during the acquisition of the image with at least one corresponding image acquisition parameter during the recording of the reference image. Thus, a difference value between the image acquisition parameters can be determined. According to the invention, it is further provided that, in determining the descriptor distance, reference images for which the previously determined difference value between the image acquisition parameters is greater than a predefined threshold value are disregarded. It is particularly advantageously provided that a comparison of the image with a plurality of reference images of the image collection takes place. Thus, the descriptor distances of a plurality of descriptors are determined. If the descriptor distance of two descriptors falls below a predefined limit distance and / or if the descriptor distance is a smallest descriptor distance, then a high probability value is assumed that the person is depicted on the reference image. Since significantly different image acquisition parameters can lead to a completely different representation of the same scene, there is the danger that completely different characteristics of such descriptors are represented by completely different image acquisition parameters, which represent only a small descriptor distance. Thus, there is a risk of erroneous recognition of the person on a reference image that does not represent the person. In order to prevent this, those reference images are not taken into account that deviate from the image acquisition parameters of the image with respect to their image acquisition parameters.
Weiter wird vorgeschlagen, bei Deep Learning basierten Systemen die Bildaufnahmeparameter mit als zusätzliche Eingangsdaten zu integrieren, beim Training und Ausführen der künstlichen Intelligenz kann das Netzwerk dann selbstständig entscheiden und lernen, ob eine Kameraregelung stattgefunden hat und eine mögliche Wiedererkennung ausgeschlossen oder anders als sonst durchgeführt werden muss. Furthermore, it is proposed to integrate the image acquisition parameters in the case of deep learning-based systems as additional input data, during the training and execution of the artificial intelligence, the network can decide independently and learn whether a camera control has taken place and a possible recognition is excluded or performed differently than usual got to.
Die Unteransprüche haben bevorzugte Weiterbildungen der Erfindung zum Inhalt.The dependent claims have preferred developments of the invention to the content.
Bevorzugt ist vorgesehen, dass die Metrik in Abhängigkeit des Differenzwerts variiert wird. Somit ist insbesondere ermöglicht, eine andere Metrik zu verwenden, wenn anhand der Bildaufnahmeparameter erkannt wurde, dass eine Abweichung vorliegt. In diesem Fall kann beispielsweise der Weißabgleich verändert worden sein, so dass nicht direkt weiße Farben des Abbilds mit weißen Farben des Referenzbilds verglichen werden dürfen. Dem wird insbesondere durch eine spezielle Metrik Rechnung getragen. Durch das Variieren der Metrik in Abhängigkeit des Referenzwerts ist somit eine optimierte Wiedererkennung der Personen in den Referenzbildern ermöglicht. Das Unberücksichtigtlassen von Referenzbildern bei zu großen Differenzwerten bleibt insbesondere unberührt. Es ist außerdem anzumerken, dass das obige Nennen des Weißabgleichs lediglich beispielhaft für die Bildaufnahmeparameter in ihrer Allgemeinheit erfolgt. Bevorzugt wird anhand der Bildaufnahmeparameter festgestellt, dass die Kameraregelung noch keinen eingeschwungenen Zustand erreicht hat. In diesem Fall ist von einer Personenwiedererkennung abzusehen, da die von der Kamera gelieferten Farben beispielweise nicht denen der echten Welt entsprechen. Sobald der eingeschwungene Zustand erreicht ist, können Farben aber wieder besser verglichen werden. Der Zustand des Reglers wird bei aktuellen Verfahren gemäß dem Stand der Technik nicht berücksichtigt.It is preferably provided that the metric is varied as a function of the difference value. Thus, in particular, it is possible to use a different metric if it has been detected on the basis of the image acquisition parameters that a deviation exists. In this case, for example, the white balance may have been changed, so that not directly white colors of the image may be compared with white colors of the reference image. This is taken into account in particular by a special metric. By varying the metric as a function of the reference value, an optimized recognition of the persons in the reference images is thus made possible. The consideration of reference images for excessive difference values remains unaffected. It should also be noted that the above naming of the white balance is merely exemplary of the image pickup parameters in their generality. It is preferably determined on the basis of the image acquisition parameters that the camera control has not yet reached a steady state. In this case, you do not need personal recognition because the colors supplied by the camera, for example, do not match those of the real world. As soon as the steady state is reached, colors can be better compared again. The state of the regulator is not taken into account in current methods according to the prior art.
Insbesondere erfolgt außerdem ein Variieren der Beschreibung der Bildmerkmale des Abbilds basierend auf dem Differenzwert. Dies erlaubt insbesondere ein Anpassen der Deskriptoren an die verglichen mit dem Referenzbild geänderten Bildaufnahmeparameter des Abbilds. Somit kann wiederum der Tatsache Rechnung getragen werden, dass aufgrund der unterschiedlichen Bildaufnahmeparameter dieselben Personen unterschiedlich in dem Referenzbild und dem Abbild dargestellt werden. Dasselbe gilt vorteilhafterweise auch für andere bildverarbeitende Schritte, die während des Personen-Erkennungsalgorithmus ausgeführt werden, wie beispielsweise dem Post-Re-Ranking oder dem Person-Matching.In particular, there is also a variation in the description of the image features of the image based on the difference value. In particular, this makes it possible to adapt the descriptors to the image acquisition parameters of the image which have been changed compared to the reference image. Thus, again, the fact can be taken into account that the same persons are represented differently in the reference image and the image due to the different image acquisition parameters. The same is advantageously true for other image processing steps performed during the person recognition algorithm, such as post-re-ranking or person matching.
In einer weiteren bevorzugten Ausführungsform ist vorgesehen, dass das Abbild zusammen mit dem Referenzbild ausgegeben wird, wenn der Differenzwert den Schwellwert überschreitet. Dies ermöglicht es einer Person, beispielsweise einem Wachmann, ein manuelles Vergleichen von Abbild und Referenzbild vorzunehmen, um somit entscheiden zu können, ob das Abbild und das Referenzbild dieselbe Person zeigen oder nicht. Somit ist ermöglicht, eine manuelle Entscheidung durch eine Person einzufordern, wenn ein automatisches Erkennen nicht möglich ist.In a further preferred embodiment, it is provided that the image is output together with the reference image if the difference value exceeds the threshold value. This allows a person, such as a security guard, to manually compare the image and reference image so as to decide whether the image and the reference image show the same person or not. Thus, it is possible to request a manual decision by a person when automatic recognition is not possible.
Die Bildaufnahmeparameter umfassen insbesondere eine Belichtungszeit und/oder einen Weißabgleich und/oder eine Dynamikkompression (Tone Mapping) und/oder eine Signalverstärkung (Gain) und/oder eine Apertur. All diese Bildaufnahmeparameter werden bei modernen Überwachungskameras laufend geregelt, um stets ein optimales Bild erfassen zu können. Somit passt sich die Überwachungskamera an sich verändernde Umgebungsbedingungen an. Dies führt zu unterschiedlichen Bildern, die mittels der Kamera aufgenommen werden, obwohl stets dieselbe Szenerie gezeigt wird. Der Extremfall liegt vor, wenn die Kamera gerade regelt und noch nicht den eingeschwungenen Zustand erreicht hat. Daher besteht auch die Gefahr, dass Bildaufnahmeparameter von Abbildern von Personen unterschiedlich sind im Vergleich zu Bildaufnahmeparametern von Referenzbildern. Um diese Diskrepanz zu berücksichtigen, wurde zuvor bereits beschrieben, dass der Referenzwert zwischen den Bildaufnahmeparametern des Abbilds und des Referenzbilds berechnet wird, um anhand des Differenzwerts zu bestimmen, ob ein Vergleich von Referenzbild und Abbild sinnvoll ist oder nicht.The image acquisition parameters include, in particular, exposure time and / or white balance and / or tone mapping and / or signal gain and / or aperture. All these image acquisition parameters are constantly regulated in modern surveillance cameras in order to always be able to capture an optimal image. Thus, the surveillance camera adapts to changing environmental conditions. This results in different pictures being taken by the camera, although the same scene is always shown. The extreme case occurs when the camera is currently controlling and has not yet reached the steady state. Therefore, there is also a risk that image pickup parameters of images of people are different from image pickup parameters of reference images. In order to take account of this discrepancy, it has already been described above that the reference value between the image acquisition parameters of the image and the reference image is calculated in order to use the difference value to determine whether a comparison of reference image and image makes sense or not.
Die Metrik und/oder der Schwellwert werden vorteilhafterweise durch ein System mit Methoden der künstlichen Intelligenz optimiert. Hierzu werden insbesondere selbstlernende Algorithmen verwendet. Bei solchen selbstlernenden Algorithmen kann es sich insbesondere um Deep-Learning oder Machine-Learning handeln. Somit lassen sich die Systeme trainieren, um stets eine optimale Metrik und/oder einen optimalen Schwellwert zu finden. Mit jedem neuen Vergleich eines Abbilds mit den Referenzbildern aus der Bildersammlung kann die Metrik und/oder der Schwellwert weiter optimiert werden. Somit ist ein zuverlässiges Wiedererkennen von Personen ermöglicht.The metric and / or threshold are advantageously optimized by a system using artificial intelligence techniques. Self-learning algorithms are used in particular for this purpose. Such self-learning algorithms can in particular be deep learning or machine learning. Thus, the systems can be trained to always find an optimal metric and / or an optimal threshold. With each new comparison of an image with the reference images from the image collection, the metric and / or the threshold can be further optimized. Thus, a reliable recognition of persons is possible.
Werden Referenzbild und Abbild ausgegeben, um eine manuelle Entscheidung einzufordern, so wird vorteilhafterweise eine manuelle Eingabe ausgelesen, die angibt, ob das Referenzbild und das Abbild dieselbe Person zeigen. Diese Eingabe wird insbesondere durch eine Person, beispielsweise einen Wachmann, getätigt. Es ist wiederum vorgesehen, dass die Metrik und/oder der Schwellwert durch ein System mit Methoden der künstlichen Intelligenz, insbesondere durch selbstlernende Algorithmen, optimiert werden. Somit ist ermöglicht, anhand der manuellen Eingabe Metrik und/oder den Schwellwert weiter zu optimieren. Auf diese Weise wird ermöglicht, dass die Metrik und/oder der Schwellwert auch bei stark abweichenden Bildaufnahmeparametern trainiert werden, so dass die Anzahl der Fälle, in denen ein Vergleich zwischen Abbild und Referenzbild aufgrund erheblich unterschiedlicher Bildaufnahmeparameter nicht möglich ist, reduziert wird.If the reference image and the image are output in order to request a manual decision, then advantageously a manual input is read out, which indicates whether the reference image and the image show the same person. This input is made in particular by a person, for example a security guard. In turn, it is envisaged that the metric and / or the threshold value through a system using methods of artificial Intelligence, in particular by self-learning algorithms, optimized. This makes it possible to further optimize the metric and / or the threshold value by means of the manual input. In this way it is made possible that the metric and / or the threshold value are also trained in the case of strongly deviating image acquisition parameters, so that the number of cases in which a comparison between image and reference image is not possible due to considerably different image acquisition parameters is reduced.
Die Erfindung betrifft außerdem ein Computerprogramm, das eingerichtet ist, das Verfahren wie zuvor beschrieben auszuführen. Insbesondere ist das Computerprogramm ein Computerprogrammprodukt umfassend Instruktionen, die, wenn sie auf einem Prozessor ausgeführt werden, den Prozessor veranlassen, das zuvor beschriebene Verfahren auszuführen. Des Weiteren betrifft die Erfindung ein maschinenlesbares Speichermedium, auf dem das Computerprogramm wie zuvor beschrieben gespeichert ist. Bei dem maschinenlesbaren Speichermedium handelt es sich insbesondere um ein magnetisches Speichermedium und/oder um ein optisches Speichermedium und/oder um einen Flash-Speicher.The invention also relates to a computer program configured to carry out the method as described above. In particular, the computer program is a computer program product comprising instructions that, when executed on a processor, cause the processor to execute the method described above. Furthermore, the invention relates to a machine-readable storage medium on which the computer program is stored as described above. The machine-readable storage medium is, in particular, a magnetic storage medium and / or an optical storage medium and / or a flash memory.
Zuletzt betrifft die Erfindung ein System. Das System umfasst eine Kamera zum Aufnehmen von Abbildern von Personen. Außerdem ist die Kamera zur Signalübertragung mit einem Steuergerät des Systems verbunden. Das Steuergerät ist eingerichtet, das zuvor beschriebene Verfahren auszuführen.Finally, the invention relates to a system. The system includes a camera for taking pictures of people. In addition, the camera is connected for signal transmission with a control unit of the system. The controller is configured to execute the method described above.
Bei den vorbekannten Referenzbildern der vorbekannten Bildersammlung handelt es sich insbesondere um solche Referenzbilder, die zuvor als Abbild der Person mittels der Kamera aufgenommen wurde. Alternativ oder zusätzlich handelt es sich bei den Referenzbildern um Abbilder von Personen, die mit einer weiteren Kamera aufgenommen wurden. Somit ist ermöglicht, die zuvor mittels derselben Kamera oder mittels einer anderen Kamera erfassten Personen wieder zu erkennen.The previously known reference images of the previously known image collection are in particular those reference images which were previously recorded as an image of the person by means of the camera. Alternatively or additionally, the reference images are images of people who were taken with another camera. This makes it possible to recognize the persons previously detected by the same camera or by another camera.
Figurenlistelist of figures
Nachfolgend werden Ausführungsbeispiele der Erfindung unter Bezugnahme auf die begleitende Zeichnung im Detail beschrieben. In der Zeichnung ist:
-
1 eine schematische Abbildung eines Systems gemäß einem Ausführungsbeispiel der Erfindung, und -
2 eine schematische Abbildung eines Ablaufs des Verfahrens gemäß einem Ausführungsbeispiel der Erfindung.
-
1 a schematic illustration of a system according to an embodiment of the invention, and -
2 a schematic illustration of a sequence of the method according to an embodiment of the invention.
Ausführungsformen der ErfindungEmbodiments of the invention
Vorzugsweise wird das Verfahren zur Personenreidentifiation (PRID Verfahren) durch die folgenden vier Schritte durchgeführt:
- 1. Eine Person wird durch ein Detektionsverfahren detektiert. Für dieses Abbild wird eine Korrespondenz in einer vorbekannten Bildersammlung gesucht. Diese Bildersammlung kann beispielsweise alle Personenbilder aus einer anderen Kamera oder aus einem vorherigen Zeitschritt beinhalten. Alle Abbilder werden anschließend zu einer datensatz- und ansatzabhängigen Größe herunterskaliert.
- 2. Das Abbild der Person wird vorzugsweise in mehrere kleinere Streifen oder Kacheln unterteilt (Regionen, Patches). Für jeden Streifen bzw. jede Kachel werden diskriminative Merkmale über Deskriptoren extrahiert. Ein solches Extrahieren von Deskriptoren erfolgt beispielsweise mittels Gausscher Deskriptoren. Details hierzu ist in der folgender Veröffentlichung beschrieben:
Matsukawa, T.; et. al.: „Hierarchical Gaussian Descriptor for Person Re-Identification“, 2016, ISBN: 978-1-4673-8851-1 (2016 IEEE Conference on Computer Vision and Pattern Recnognition, CVPR) - 3. Anschließend wird eine Metrik gelernt, die den Abstand zwischen zwei Deskriptoren in einem Deskriptorraum für gleiche Personen minimiert und für ungleiche Personen erhöht. Dies bedeutet, dass ein Bestimmen eines spezifischen Deskriptorabstands mit der gelernten Metrik dann zu minimalen Deskriptorabständen führt, wenn die diskriminativen Merkmale des Abbilds und des Referenzbilds identisch oder zumindest sehr ähnlich sind. Weisen besagte diskriminative Merkmale einen erheblichen Unterschied auf, so wird durch die Metrik ein großer Deskriptorabstand festgestellt.
- 4. Final findet ein Bestimmen eines Wahrscheinlichkeitswerts oder eines Abstandsmaßen statt, der/das eine Aussage darüber trifft, ob die Person auf dem Abbild mit einer Person aus der Bildersammlung übereinstimmt. Alternativ oder zusätzlich findet ein Ranking statt, das eine geordnete Liste zurückgibt, deren Reihenfolge mit abnehmender Ähnlichkeit der gesuchten Person und den bekannten Personen angeordnet ist.
- 1. A person is detected by a detection method. For this image, a correspondence is searched in a previously known image collection. For example, this image collection can contain all person images from another camera or from a previous time step. All images are then scaled down to a record-dependent and record-dependent size.
- 2. The image of the person is preferably divided into several smaller stripes or tiles (regions, patches). For each stripe or tile, discriminative features are extracted via descriptors. Such extracting of descriptors takes place, for example, by means of Gaussian descriptors. Details are described in the following publication:
Matsukawa, T .; et. al .: "Hierarchical Gaussian Descriptor for Person Re-Identification", 2016, ISBN: 978-1-4673-8851-1 (2016 IEEE Conference on Computer Vision and Pattern Recognition, CVPR) - 3. Then a metric is learned that minimizes the distance between two descriptors in a descriptor room for the same person and increases it for unequal people. This means that determining a specific descriptor spacing with the learned metric then results in minimal descriptor spacing if the discriminative features of the image and the reference image are identical or at least very similar. If the discriminative features indicate a significant difference, the metric determines a large descriptor distance.
- 4. Finally, a determination of a probability value or a distance measure takes place, which makes a statement as to whether the person in the image agrees with a person from the image collection. Alternatively or additionally, a ranking takes place which returns an ordered list whose order is arranged with decreasing similarity of the searched person and the known persons.
Ausgehend von den bestimmten Deskriptoren im Schritt
Alternativ oder zusätzlich werden Deep Learning basierte Verfahren verwendet, die ein End-to-End Learning durchführen, eine Siamesische Struktur aufweisen oder eine Triplet Loss Architektur verwenden, um ausgehend von einem Trainingsdatensatz eine Künstliche Intelligenz zu lernen, die verwendet werden kann, um Personen wiederzuerkennen. Hierbei entscheidet das Deep Learning Netzwerk selbstständig, wie es am besten parametrisiert sein muss, um eine Person wiederzuerkennen, insbesondere durch Lernen von Gewichten. Das Netzwerk lernt für sich selber die Aufgabe der Wiedererkennung. Alternatively or additionally, deep learning based methods are used that perform end-to-end learning, have a Thai structure, or use a triplet loss architecture to learn artificial intelligence from a training record that can be used to recognize people , In doing so, the deep learning network autonomously decides how best to parametrize in order to recognize a person, in particular by learning weights. The network learns for itself the task of recognition.
Kameras, insbesondere Überwachungskameras, weisen Regelschleifen auf, die Bildaufnahmeparameter, wie die Belichtungszeit und/oder den Weißabgleich und/oder das Tone Mapping (Dynamik-Kompression) und/oder die Gain (Signalverstärkung) und/oder die Apertur, regeln. Wird die Szenerie, die von der Kamera erfasst wird, verändert, was beispielsweise durch eine untergehende Sonne oder durch ein mit Scheinwerfer durch ein Parkhaus fahrendes Fahrzeug geschehen kann, verändern sich auch die Bildaufnahmeparameter. Durch eine solche Kameraregelung kann ein und dieselbe Person einen komplett unterschiedlichen farblichen Verlauf aufweisen, beispielsweise wenn sich der Weißabgleich erheblich verändert.Cameras, in particular surveillance cameras, have control loops that regulate image acquisition parameters, such as the exposure time and / or the white balance and / or the tone mapping and / or the gain (signal amplification) and / or the aperture. If the scene, which is captured by the camera, changed, which can happen, for example, by a setting sun or by driving with a headlight through a parking garage vehicle, also changing the image acquisition parameters. By means of such a camera control, the same person can have a completely different color progression, for example if the white balance changes considerably.
Durch die Kamera
Aus dem Abbild
Ebenso wie für das Abbild
Es wird eine Metrik vorteilhafterweise durch ein selbstlernendes System gelernt, dass die Deskriptorabstände
Erfindungsgemäß erfolgt zusätzlich die Berücksichtigung von Bildaufnahmeparametern. So ist insbesondere ermöglicht, einen Differenzwert zu ermitteln. Dazu werden die Bildaufnahmeparameter des Abbilds
So zeigt
Erfindungsgemäß wird somit anhand des Differenzwerts der Bildaufnahmeparameter ermittelt, ob ein Vergleich einzelner Referenzbilder
Der Schwellwert kann insbesondere von einem selbstlernenden System, beispielsweise mittels Methoden der künstlichen Intelligenz, angepasst werden. The threshold value can in particular be adapted by a self-learning system, for example by means of artificial intelligence.
Dazu lernt das selbstlernende System nach jedem Vergleich und/oder anhand jedes neuen Abbilds
Bevorzugt ist außerdem vorgesehen, dass die Metrik zum Bestimmen des Deskriptorabstands
Wird ein Referenzbild
ZITATE ENTHALTEN IN DER BESCHREIBUNG QUOTES INCLUDE IN THE DESCRIPTION
Diese Liste der vom Anmelder aufgeführten Dokumente wurde automatisiert erzeugt und ist ausschließlich zur besseren Information des Lesers aufgenommen. Die Liste ist nicht Bestandteil der deutschen Patent- bzw. Gebrauchsmusteranmeldung. Das DPMA übernimmt keinerlei Haftung für etwaige Fehler oder Auslassungen.This list of the documents listed by the applicant has been generated automatically and is included solely for the better information of the reader. The list is not part of the German patent or utility model application. The DPMA assumes no liability for any errors or omissions.
Zitierte PatentliteraturCited patent literature
- WO 2015/192997 A1 [0003]WO 2015/192997 A1 [0003]
Zitierte Nicht-PatentliteraturCited non-patent literature
- Matsukawa, T.; et. al.: „Hierarchical Gaussian Descriptor for Person Re-Identification“, 2016, ISBN: 978-1-4673-8851-1 (2016 IEEE Conference on Computer Vision and Pattern Recnognition, CVPR) [0018]Matsukawa, T .; et. al .: "Hierarchical Gaussian Descriptor for Person Re-Identification", 2016, ISBN: 978-1-4673-8851-1 (2016 IEEE Conference on Computer Vision and Pattern Recognition, CVPR). [0018]
Claims (11)
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE102017218914.2A DE102017218914A1 (en) | 2017-10-24 | 2017-10-24 | Method for recognizing persons |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE102017218914.2A DE102017218914A1 (en) | 2017-10-24 | 2017-10-24 | Method for recognizing persons |
Publications (1)
Publication Number | Publication Date |
---|---|
DE102017218914A1 true DE102017218914A1 (en) | 2019-04-25 |
Family
ID=65996468
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE102017218914.2A Pending DE102017218914A1 (en) | 2017-10-24 | 2017-10-24 | Method for recognizing persons |
Country Status (1)
Country | Link |
---|---|
DE (1) | DE102017218914A1 (en) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE102020203103A1 (en) | 2020-03-11 | 2021-09-16 | Robert Bosch Gesellschaft mit beschränkter Haftung | Process for recognizing persons, computer program, storage medium, monitoring device and camera |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2015192997A1 (en) | 2014-06-20 | 2015-12-23 | Robert Bosch Gmbh | Method for identifying an individual |
-
2017
- 2017-10-24 DE DE102017218914.2A patent/DE102017218914A1/en active Pending
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2015192997A1 (en) | 2014-06-20 | 2015-12-23 | Robert Bosch Gmbh | Method for identifying an individual |
Non-Patent Citations (1)
Title |
---|
Matsukawa, T.; et. al.: „Hierarchical Gaussian Descriptor for Person Re-Identification", 2016, ISBN: 978-1-4673-8851-1 (2016 IEEE Conference on Computer Vision and Pattern Recnognition, CVPR) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE102020203103A1 (en) | 2020-03-11 | 2021-09-16 | Robert Bosch Gesellschaft mit beschränkter Haftung | Process for recognizing persons, computer program, storage medium, monitoring device and camera |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DE602004002180T2 (en) | object recognition | |
DE112017006136T5 (en) | System and method for CNN layer sharing | |
DE102006041645A1 (en) | Method and device for orientation determination in an image | |
WO2000021021A1 (en) | Methods and system for recognizing people with model-based face detection | |
DE102012016160A1 (en) | Image capture for later refocusing or focus manipulation | |
DE102009005861A1 (en) | Vehicle environment recognition system | |
DE102005034597A1 (en) | Method and device for generating a depth map | |
DE102018101034A1 (en) | Image processing apparatus and image processing method | |
DE102017122010A1 (en) | Detection method and detection device for detecting a three-dimensional position of an object | |
EP3701434A1 (en) | Method and apparatus for automatically producing an artificial neural network | |
DE102016006242A1 (en) | INFORMATION PROCESSING DEVICE, INFORMATION PROCESSOR CONTROL PROCESS, PICTURE PROCESSING SYSTEM AND STORAGE MEDIUM | |
EP3867796A1 (en) | Method and device for determining an area map | |
DE112019001138T5 (en) | Object detection device, object detection method and program | |
DE112021005703T5 (en) | INFORMATION PROCESSING EQUIPMENT AND INFORMATION PROCESSING PROCEDURES | |
DE102017218914A1 (en) | Method for recognizing persons | |
DE102021207505A1 (en) | Method for training a deep neural network | |
EP3286690B1 (en) | Identification document, identification device and corresponding methods | |
CH717006A2 (en) | Procedure for user identification. | |
DE102013213532A1 (en) | Method and system for recognizing a gesture | |
DE112020007472T5 (en) | LEARNING USE SYSTEM, USE DEVICE, LEARNING DEVICE, PROGRAM AND LEARNING METHOD | |
DE102016124906A1 (en) | Method of controlling a floor care appliance and floor care appliance | |
DE102018201909A1 (en) | Method and device for object recognition | |
DE102018207923A1 (en) | Improved training of a classifier | |
WO2021043517A1 (en) | Methods for compressing a neural network | |
DE102013004120B4 (en) | Electronic device and focus adjustment method of this |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
R079 | Amendment of ipc main class |
Free format text: PREVIOUS MAIN CLASS: G06K0009620000 Ipc: G06V0030190000 |