WO2022063654A1

WO2022063654A1 - Verfahren zur objekterkennung, computerprogramm, speichermedium, objekterkennungseinrichtung und überwachungsanordnung

Info

Publication number: WO2022063654A1
Application number: PCT/EP2021/075365
Authority: WO
Inventors: Udo Schulz; Andreas Fladee; Kai Bohne; Camille MARBACH; Christoph Jochum
Original assignee: Robert Bosch Gmbh
Priority date: 2020-09-23
Filing date: 2021-09-15
Publication date: 2022-03-31
Also published as: DE102020211892A1

Abstract

Verfahren zur Objekterkennung mit den Schritten: - Aufnehmen mindestens eines Kamerabildes (1) eines Aufnahmebereichs (6) mittels einer Kamera, wobei die Kamera Abbildungsparameter 16 aufweist, wobei das Kamerabild (1) eine auf den Abbildungsparametern (16) basierende Verzeichnung aufweist, - wobei von einem standardisierten Referenzobjekt (13) mindestens ein Referenzbild (12) bereitgestellt oder bestimmt wird, wobei das Referenzbild (12) das standardisierte Referenzobjekt (13) mit der auf den Abbildungsparametern 16 basierenden Verzeichnung umfasst und/oder beschreibt, - wobei basierend auf dem Referenzbild (12) auf das Kamerabild (1) eine Objekterkennung angewendet wird.

Description

Titel

Verfahren zur Objekterkennung, Computerprogramm, Speichermedium,

Objekterkennungseinrichtung und Überwachungsanordnung

Stand der Technik

Die Erfindung betrifft ein Verfahren zur Objekterkennung basierend auf mindestens einem Kamerabild eines Aufnahmebereiches.

Im Stand der Technik sind Verfahren zur Objekterkennung mittels Bildverarbeitung bekannt. Die Aufnahme der Bilder zur Verarbeitung erfolgt hierbei mit einer Kamera. Die aufgenommenen Bilder werden durch Vergleich und Bestimmung von Korrelationen analysiert, wobei beispielsweise Wiedererkennungswahrscheinlichkeiten ermittelt werden.

Beispielsweise beschreibt die Druckschrift EP 27 693 62 Bl, die wohl den nächstkommenden Stand der Technik bildet, eine computerimplementierte Methode zum Auffinden von Eckabschnitten von Paletten, wobei die Methode vorsieht, die Abschnitte basierend auf einer Gruppe von Pixeln, horizontaler und vertikaler Kreuzkorrelationen zu ermitteln.

Offenbarung der Erfindung

Die Erfindung betrifft ein Verfahren zur Objekterkennung mit den Merkmalen des Anspruchs 1. Ferner betrifft die Erfindung ein Computerprogramm mit den Merkmalen des Anspruchs 12, ein Speichermedium mit den Merkmalen des Anspruchs 13, eine Objekterkennungseinrichtung und eine Überwachungsanordnung. Bevorzugte und/oder vorteilhafte Ausgestaltungen der Erfindung ergeben sich aus den Unteransprüchen, der Beschreibung und den beigefügten Figuren.

Es wird ein Verfahren zur Objekterkennung vorgeschlagen. Das Verfahren ist insbesondere als ein computerimplementiertes Verfahren oder ein hardwarebasiertes Verfahren ausgebildet. Das Verfahren umfasst und/oder basiert auf maschinellem Lernen und/oder einem neuronalen Netz. Als Objekterkennung wird insbesondere die Erkennung und/oder Wiedererkennung, insbesondere die Suche, eines oder mehrerer Referenzobjekte in einem Aufnahmebereich, insbesondere in einem Kamerabild des Aufnahmebereichs verstanden. Beispielsweise sieht die Objekterkennung die Erkennung eines Referenzobjekts in Kamerabildern vor, insbesondere in verschiedenen und/oder unterschiedlichen Orientierungen, Abständen und/oder Positionen. Insbesondere ist als Objekterkennung beispielsweise eine Objektlokalisierung, Klassifizierung und/oder Objektverfolgung zu verstehen.

Mittels einer Kamera, im Speziellen mittels mehrerer Kameras, wird mindestens ein Kamerabild eines Aufnahmebereichs aufgenommen. Insbesondere können von dem Aufnahmebereich mehrere Teilbilder aufgenommen werden, wobei die Teilbilder beispielsweise zu dem Kamerabild zusammengefügt werden und/oder worden sind. Beispielsweise werden die Teilbilder zu dem Kamerabild gestitcht. Das Kamerabild kann als ein Farbbild, als ein Infrarotbild oder als ein schwarzweiß Bild ausgebildet sein. Die Kamera, insbesondere ein Objektiv der Kamera, weist Abbildungsparameter auf und/oder legt Abbildungsparameter der Kamera fest. Beispielsweise umfassen die Abbildungsparameter Linsenfehler, Brennweite, Blenden- und/oder Strahlengangparameter. Das Kamerabild umfasst eine Verzeichnung und/oder weist eine Verzeichnung auf. Insbesondere ist die Verzeichnung eine tonnenförmige Verzeichnung. Die Verzeichnung basiert und/oder resultiert insbesondere aus den Abbildungsparametern der Kamera. Insbesondere führt die Verzeichnung zu Kamerabildern welche zu üblichen Objekterkennungsalgorithmen rektifiziert werden müssten.

Von dem standardisierten Referenzobjekt, im Speziellen von mehreren standardisierten Referenzobjekten, wird mindestens ein Referenzbild bereitgestellt, ermittelt, und/oder bestimmt. Als standardisiertes Referenzobjekt ist beispielsweise ein genormtes Objekt zu verstehen, beispielsweise mit standardisierter und/oder genormte Abmessung, Form, Material, Farbe und/oder Erscheinung. Das Referenzobjekt ist insbesondere ein dreidimensionales Objekt. Das Referenzbild kann ferner bereitgestellt sein, beispielsweise in einem Speicher abgelegt und/oder bereitgestellt sein. Das Referenzbild zeigt und/oder beschreibt das standardisierte Referenzobjekt, insbesondere wie dieses mit den Abbildungsparametern, im Speziellen der Verzeichnung, und/oder der Kamera, aufgenommen, erscheinen würde. Das Referenzbild beschreibt beispielsweise eine verzeichnete, verzerrte, im Speziellen tonnenförmig verzeichnete Aufnahme des standardisierten Referenzobjekts. Im Speziellen können eine Vielzahl an Referenzbildern bereitgestellt sein, bestimmt und/oder ermittelt werden, beispielsweise unterschiedliche Ansichten, Abstände und/oder Orientierung des standardisierten Referenzbilds. Insbesondere sind die Referenzbilder keine rektifizierten und/oder verzeichnungsfreie Bilder und/oder Aufnahmen des standardisierten Referenzobjekts.

Auf das Kamerabild wird eine Objekterkennung angewendet, beispielsweise ein Objekterkennungsalgorithmus. Die Objekterkennung erfolgt im Kamerabild basierend und/oder unter Verwendung mindestens eines Referenzbildes. Beispielsweise erfolgt die Objekterkennung und/oder der Objekterkennungsalgorithmus unter Verwendung eines neuronalen Netzes, eines CNN (Convolutional Neural Network) und/oder einer SVM (Support vector machine). Als Objekterkennung wird insbesondere die Erkennung eines standardisierten Referenzobjekts und/oder eines dem standardisierten Referenzobjekt ähnlichen Objektes im Kamerabild, im Speziellen im Aufnahmebereich, verstanden. Die Objekterkennung umfasst beispielsweise eine Objekterkennung, Klassifizierung und/oder Lokalisierung. Beispielsweise wird eine Wahrscheinlichkeit bestimmt und/oder ausgegeben werden, wie Wahrscheinlich es sich bei einem Objekt und/oder einen Bildabschnitt des Kamerabildes um ein dem standardisierten Referenzobjekt entsprechendes und/oder ähnliches Objekt handelt. Ferner kann die Objekterkennung ausgebildet sein, andersartige Objekte zusätzlich und/oder ergänzend zu erkennen, beispielsweise Hindernisse und/oder Gefahren. Besonders bevorzugt ist es, dass die Objekterkennung als ein Template Matching ausgebildet ist. Beispielsweise ist die Objekterkennung ausgebildet und oder eingerichtet, ein begrenztes Portfolio und/oder Menge von Objekten und/oder Referenzobjekten zu erkennen und/oder zu klassifizieren. Beispielsweise ist die Objekterkennung für eine begrenzte und/oder eingeschränkte Zahl an Hintergründen, Szenen und/oder Beleuchtungsarten ausgebildet und/oder eingerichtet.

Die Erfindung basiert auf der Überlegung, dass eine Objekterkennung in verzeichneten Kamerabildern möglich ist, ohne diese vorher zu transformieren und/oder zu rektifizieren. Insbesondere dadurch, dass als Referenzbilder Aufnahmen und/oder Bilder eines standardisierten Referenzobjekts mit Verzeichnung verwendet werden. Durch die Verwendung von standardisierten, insbesondere genormten, Referenzobjekten kann ferner eine leistungsfähige Lokalisation, Abstandsbestimmung und/oder Orientierungsbestimmung erfolgen.

Das Verfahren zeichnet sich durch eine verbesserte und gesteigerte Erkennungsrate von Objekten, insbesondere standardisierten Objekten, in Kamerabildern aus. Ferner ist das Verfahren besonders schnell, insbesondere durch eine Reduzierung von Rechenleistung, Prozessorleistung und/oder Datenmengen, da keine Transformation der Kamerabilder durchgeführt werden muss. Stattdessen wird beispielsweise das standardisierte Referenzobjekt in die Bildebene der Kamera transformiert.

Besonders bevorzugt ist es, dass das standardisierte Referenzobjekt eine standardisierte Form, insbesondere genormte Form, eine standardisierte Abmessung, insbesondere genormte Abmessung, und/oder standardisierte Toleranzabweichungen, insbesondere genormte Toleranzabweichungen aufweist. Beispielsweise ist die standardisierte Form eine 3-dimensionale Erscheinungsform, beispielsweise quadratisch, rund und/oder komplexer. Als standardisierte Abmessungen werden beispielsweise standardisierte Längen, Breiten, Höhen, Ausnehmungen, Löcher, und/oder Konstruktionselemente verstanden. Toleranzabweichungen sind beispielsweise erlaubte Abweichungen der Form, der Abmessung und/oder anderweitige Parameter. Das mindestens eine Referenzbild und/oder die Mehrzahl an Referenzbildern sind beispielsweise als ein der Kamera und den Abbildungsparametern aufgenommenes Bild eines solchen standardisierten Referenzobjektes ausgebildet. Beispielsweise werden von dem standardisierten Referenzobjekt eine Mehrzahl an Bildern mit der Kamera und den Abbildungsparametern aufgenommen, beispielsweise für unterschiedliche Abstände, Positionen, Orientierungen, Lagen, Beleuchtungen und/oder anderweitige geometrische oder optische Parameter. Die so aufgenommenen Bilder weisen eine Verzeichnung auf, die auch die Kamerabilder des Aufnahmebereiches aufweisen. Die aufgenommenen Bilder können als Referenzbilder in einem Speichermedium, beispielsweise einem Computer, hinterlegt, gespeichert und/oder abrufbar sein. Insbesondere kann die Objekterkennung und/oder der Objekterkennungsalgorithmus auf die Referenzbilder und/oder aufgenommenen Bilder des standardisierten Referenzobjektes zugreifen. Dieser Ausgestaltung liegt die Überlegung zu Grunde, dass durch die Hinterlegung von verzeichneten Referenzbildern eine besonders schnelle und rechenarmer Objekterkennung auf die Kamerabilder angewendet werden kann.

Alternativ und/oder ergänzend kann das Referenzbild, Teile des Referenzbildes oder die Referenzbilder eine Transformation eines unverzeichneten Bildes bilden und/oder das Referenzbild kann als Transformation eines unverzeichneten Bildes ermittelt werden. Die Transformation ist beispielsweise eine Transformation des unverzeichneten Bildes und/oder standardisierten Referenzobjektes im Bild, unter Anwendung der Abbildungsparameter, beispielsweise in eine Transformation in die Bildebene der Kamera. Die Anwendung der Transformation führt beispielsweise die Verzeichnung in das unverzeichnete Bild ein. Das unverzeichnete Bild bildet beispielsweise eine Aufnahme des standardisierten Referenzobjektes, insbesondere mit keiner und/oder weniger Verzeichnung. Diese Ausgestaltung liegt die Überlegung zugrunde, dass beispielsweise unterschiedliche Kameras mit unterschiedlichen Abbildungsparametern und/oder Verzeichnung zur Objekterkennung verwendet werden können, in dem ein unverzeichnetes Bild unter Anwendung der jeweiligen Abbildungsparameter zu Referenzbildern transformiert wird.

Eine Ausgestaltung der Erfindung sieht vor, dass das Referenzbild basiert und/oder ermittelt wird aus einem Referenzobjektmodell. Das Referenzobjektmodell ist beispielsweise ein 3-D Modell, insbesondere CAD und/oder bemaßtes Modell, des standardisierten Referenzobjektes. Zur Bestimmung des Referenzbildes wird beispielsweise das Referenzobjektmodell in die Bildebene der Kamera transformiert. Insbesondere wird das Referenzobjektmodell basierend auf den Abbildungsparametern zu dem Referenzbild transformiert. Durch die Transformation des Referenzobjektmodells werden die für die Kamera typischen Verzeichnungen im Referenzbild erzeugt. Dieser Ausgestaltung liegt die Überlegung zu Grunde, dass standardisierte Referenzobjekte, insbesondere genormte Referenzobjekte, als 3-D Modell, CAD Modell bzw. im Allgemeinen als Referenzobjektmodell, hinterlegt werden können und in beliebigen Orientierungen, Abständen, Lagen und/oder Positionen unter Kenntnis der Abbildungsparameter transformiert werden können und so basierend auf einem einzigen Modell eine Vielzahl an Referenzbildern generiert werden können Optional ist es vorgesehen, dass eine Mehrzahl an Referenzbildern, insbesondere eines gleichen Referenzobjekts, zur Objekterkennung bereitgestellt sind, ermittelt werden und/oder angewendet werden. Die Mehrzahl an Referenzbildern bilden beispielsweise eine Abbildung, ein Bild, eine Aufnahme mit der Kamera und/oder eine Transformation des standardisierten Referenzobjektes für unterschiedliche Abstände, Orientierungen, Positionen, lagen, Beleuchtungen, Umgebungen und/oder weiteren optischen oder geometrischen Parameter, insbesondere relativ zur Kamera. Die Mehrzahl an Referenzbildern kann hinterlegt und/oder gespeichert sein, beispielsweise zur Reduzierung der Rechenleistung, alternativ und/oder ergänzend durch Transformation und/oder Berechnung ermittelt werden.

Besonders bevorzugt ist es, dass die Kamera ein Fischaugenobjektiv aufweist und/oder der Fischaugenkamera bildet. Die Verzeichnung der Kamera bildet beispielsweise eine Fischaugenverzeichnung, wobei die Verzeichnung einer Fischaugenkamera insbesondere eine tonnenförmige Verzeichnung bildet. Die Referenzbilder bilden und/oder beschreiben eine Aufnahme und/oder ein Bild des standardisierten Referenzobjektes mit einer Fischaugenverzeichnung. Dieser Ausgestaltung liegt die Überlegung zu Grunde, dass Fischaugenobjektive und/oder Fischaugenkameras große Bereiche abbilden und aufnehmen können, wobei statt die Aufnahmen der Fischaugenkamera zu rektifizieren, die Referenzbilder einer Fischaugenaufnahme bilden bzw. Fischaugenverzeichnung aufweisen und zur Objekterkennung, insbesondere als Referenz und/oder als Trainingsdaten eines neuronalen Netzes, herangezogen werden.

Im Speziellen ist es vorgesehen, dass die Objekterkennung, die Bereitstellung, Bestimmung und/oder Ermittlung der Referenzbilder mittels maschinellen Lernen und/oder unter Verwendung eines neuronalen Netzes ausgeführt werden und/oder erfolgen. Insbesondere wird zu Objekterkennung und/oder zur Bestimmung, Ermittlung und/oder Transformation der Referenzbilder ein CNN verwendet. Insbesondere ist das maschinelle Lernen und/oder das neuronalen Netz basierend auf den Referenzbildern trainiert und/oder trainierbar. Das neuronale Netz verwendet beispielsweise als Trainingsdaten Fischaugenaufnahmen des standardisierten Objektes und/oder Transformation von unverzeichneten Bilder. Im Speziellen ist das neuronalen Netz und/oder das maschinellen Lernen trainiert und/oder trainierbar unter Verwendung des Referenzobjektmodells und der Transformation des Referenzobjektmodells unter Verwendung der Abbildungsparameter und unterschiedlichen Positionen, Orientierungen und/oder Abständen.

Besonders bevorzugt ist es, dass das standardisierte Referenzobjekt eine Transportpalette und/oder einen Werkstückträger bildet. Im Speziellen ist das Referenzobjekt als eine Europoolpalette, kurz Europalette, insbesondere gemäß DIN EN 13698 ausgebildet. Das Verfahren ist hierbei insbesondere ausgebildet Transportpaletten in verzeichneten Kamerabildern sicher, schnell und robust zu erkennen.

Die Kamera ist beispielsweise an einem Transportfahrzeug angeordnet. Das Transportfahrzeug ist beispielsweise als ein Niederflurfahrzeuge, Gabelstapler und/oder ein Fahrzeug zum Transport der Transportpaletten ausgebildet. Besonders bevorzugt ist die Kamera an einem statischen Ort des Transportfahrzeugs angeordnet, beispielsweise am Fahrzeugrahmen, als Frontkamera oder als Rückkamera. Eine dynamische, insbesondere nicht statische Anordnung, kann beispielsweise durch Anordnung der Kamera an einem Gabelzinken vorgesehen sein. Als Aufnahmebereich wird beispielsweise ein Teil eines Frontbereichs des Transportfahrzeugs aufgenommen. Das Verfahren sieht vor, das als Objekterkennung beispielsweise die Lage, die Position, der Abstand und/oder die Orientierung der Transportpalette relativ zur Kamera, dem Transportfahrzeug und/oder dem Gabelzinken ermittelt und/oder bestimmt wird. Beispielsweise wird hierzu der Frontbereich eines Gabelstaplers mit einer Fischaugenkamera aufgenommen, wobei Bereiche vor dem Gabelstapler bzw. der Kamera mit einer Fischaugenverzeichnung in den Kamerabildern dargestellt sind. Die Referenzbilder beschreiben beispielsweise Transportpaletten mit der Fischaugenverzeichnung. Durch die Objekterkennung wird in den verzeichneten Kamerabildern basierend auf den Referenzbildern die Lage, Orientierung der Abstand und/oder die Position der Transportpaletten relativ zum Gabelstapler ermittelt. Im Speziellen ist das Transportfahrzeug ein autonom fahrendes Fahrzeug, wobei die Objekterkennung und/oder das Verfahren beispielsweise zu Unterstützung und/oder Ausführung des autonomen Fahrens eingesetzt wird. Vorzugsweise weist das Transportfahrzeug mindestens einen Gabelzinken, im Speziellen zwei Gabelzinken auf. Die Gabelzinken sind zur Aufnahme eines Objekts, insbesondere zur Aufnahme, dem Heben und/oder Transport der Transportpalette ausgebildet. Die Transportpalette weist vorzugsweise mindestens eine, insbesondere zwei oder mehrere Aufnahmeöffnungen auf, wobei die Aufnahmeöffnungen insbesondere ausgebildet sind den oder die Gabelzinken des Transportfahrzeugs auf zu nehmen. Das Verfahren und/oder die Objekterkennung ist ausgebildet, basierend auf der Objekterkennung eine Lage, Position, Abstand und/oder Orientierung zwischen Aufnahmeöffnung und Transportfahrzeug, im Speziellen dem oder den Gabelzinken, zu bestimmen. Insbesondere wird mittels dem Verfahren das Transportfahrzeug, beispielsweise der Gabelstapler, und/oder der Gabelzinken angesteuert, geregelt, geführt und/oder ein Benutzer geleitet zum Einfädeln des Gabelzinken in die Aufnahmeöffnung. Beispielsweise wird mittels der Objekterkennung eine Relativposition und/der Relativlage zwischen Gabelzinken und Aufnahmeöffnung bestimmt, wobei basierend darauf der Gabelstapler und/oder der Gabelzinken in die Aufnahmeöffnung eingefädelt wird.

Einen weiteren Gegenstand der Erfindung bildet ein Computerprogramm zur Ausführung auf einem Computer, einer Objekterkennungseinrichtung und/oder einer Kamera. Das Computerprogramm ist ausgebildet und/oder eingerichtet, bei Ausführung, insbesondere auf dem Computer, der Objekterkennungseinrichtung und/oder der Kamera, das Verfahren und/oder Schritte des Verfahrens durchzuführen.

Einen weiteren Gegenstand der Erfindung bildet ein maschinenlesbares Speichermedium, beispielsweise DVD oder Festplattenspeicher. Auf dem Speichermedium ist das Computerprogramm und/oder ein Programmcode des Computerprogramms gespeichert.

Einen weiteren Gegenstand der Erfindung bildet eine Objekterkennungseinrichtung, beispielsweise eine Computereinrichtung und/oder Kamera. Die Objekterkennungseinrichtung ist ausgebildet, mindestens ein Kamerabild aufzunehmen und/oder zu übernehmen. Das Kamerabild ist insbesondere wie im Verfahren beschrieben ausgebildet und weist eine Verzeichnung auf. Der Objekterkennungseinrichtung ist mindestens ein standardisiertes Referenzobjekt und/oder Referenzbild bereitgestellt, dort gespeichert und/oder von dieser bestimmbar. Das Referenzbild ist ausgebildet und/oder erhältlich wie für das Verfahren beschrieben. Die Objekterkennungseinrichtung umfasst ein Auswertemodul, wobei das Auswertemodul ausgebildet ist, eine Objekterkennung auf das Kamerabild anzuwenden, wobei mittels der Objekterkennung basierend auf dem mindestens einen Referenzbild, dem Kamerabild ein Objekt, insbesondere Referenzobjekt, erkannt, klassifiziert und/oder lokalisiert wird. Die Objekterkennungseinrichtung ist ausgebildet und/oder eingerichtet das Verfahren wie vorher beschrieben auszuführen.

Einen weiteren Gegenstand der Erfindung bildet eine Überwachungsanordnung mit der Objekterkennungseinrichtung. Die Überwachungsanordnung umfasst mindestens eine Kamera zur Aufnahme des Kamerabildes. Ferner umfasst die Überwachungsanordnung vorzugsweise eine Speichereinrichtung zum Speichern und/oder hinterlegen des oder der Referenzbilder, des standardisierten Referenzobjektes oder des Referenzobjektmodells.

Weitere Ausgestaltungen und/oder Vorteile ergeben sich aus den beigefügten Figuren und deren Beschreibung. Dabei zeigen:

Figur 1 schematisches Kamerabild zur Objekterkennung;

Figur 2 schematischer Ablauf eines Ausführungsbeispiels des Verfahrens.

Figur 1 zeigt beispielhaft ein Kamerabild 1 aufgenommen mit einer Kamera eines Fahrzeugs. Das Fahrzeug ist als ein Gabelstapler ausgebildet und umfasst eine Gabel mit zwei Gabelzinken 2. Die Kamera umfasst ein Fischaugenobjektiv, sodass das Kamerabild 1 eine für Fischaugenkameras übliche Verzeichnung aufweist. Gegenstände und insbesondere gerade Linien erscheinen, vor allem an den Rändern tonnenförmig gekrümmt. Beispielsweise erscheint die Kante 3 des Übergangs Boden 4 zu Wand 5 gebogen, obwohl diese in der Realität ungekrümmt ist. Auch die in Realität geraden Gabelzinken 2 erscheinen im Kamerabild 1 aufgrund der Verzeichnung gekrümmt. Das Kamerabild 1 zeigt einen Aufnahmebereich 6, der einen Abschnitt einer Lagerhalle bildet. Der Aufnahmebereich 6, bzw. die Lagerhalle, umfasst ein Regal 7 mit mehreren Regalböden 8. Auf dem untersten und dem obersten Regalboden 8 befindet sich jeweils eine Transportpalette 9 mit Öffnungen 10 zur Aufnahme der Gabelzinken 2. Bedingt durch die Verzeichnung erscheint auch die an sich genormte bzw. standardisierte Transportpalette 9 gekrümmt. Für übliche Objekterkennungen müsste das Kamerabild rektifiziert werden, sodass das Regal 7, die Gabelzinken 2 und die Transportpalette 9 gerade bzw. real aussieht. Gemäß dem Verfahren wird die Objekterkennung auf die Kamerabilder 1 angewendet, ohne diese vorher zur transformieren und/oder zu rektifizieren. Insbesondere ist das Verfahren ausgebildet und/oder eingerichtet, das Transportfahrzeug basierend auf der Objekterkennung zum Einfädeln der Gabelzinken 2 in die Aufnahmeöffnungen 10 anzusteuern.

Figur 2 zeigt schematisch einen Ablauf des Verfahrens zur Objekterkennung basierend auf und/oder in dem Kamerabild 1. Das Kamerabild 1, insbesondere wie in Figur 1, weißt eine Verzeichnung auf und wird einem Auswertemodul 11 bereitgestellt. Das Auswertemodul 11 ist ausgebildet und/oder eingerichtet, basierend auf Referenzbilder 12 in den Kamerabilder 1 ein Referenzobjekt 13 zu erkennen, zu lokalisieren und/oder zu klassifizieren.

Die Referenzbilder 12 zeigen das Referenzobjekt 13 in unterschiedlichen Orientierungen, Abständen zur Kamera bzw. Bildebene und/oder Positionen. Die Referenzbilder weisen eine Verzeichnung auf, die im der Verzeichnung der Kamerabilder 1 entspricht, hier eine Fischaugenverzeichnung. Die Referenzobjekte 13 in den Referenzbildern 12 erscheinen daher gekrümmt und/oder verzogen. Das Auswertemodul 11 kann basierend auf den Referenzbildern 12 bzw. den verzeichneten Referenzobjekten 13 in den Referenzbildern 12 in den Kamerabildern 1 das Referenzobjekt erkennen, lokalisieren und/oder klassifizieren. Das Referenzobjekt 13 bildet hier eine Transportpalette 9 wie in Figur 1 gezeigt.

Die Referenzbilder 12 können von einem Bestimmungsmodul 14, insbesondere basierend auf einem neuronalen Netz, bestimmt werden. Dem Bestimmungsmodul 14 ist ein Referenzobjektmodell 15 bereitgestellt. Das Referenzobjektmodell 15 ist ein dreidimensionales Modell, z.B. CAD-Modell, des Referenzobjekts 12. Ferner sind dem Bestimmungsmodul 14 Abbildungsparameter der Kamera bereitgestellt, insbesondere die Abbildungsparameter 16 die zur Verzeichnung und/oder eine Brennweite. Basierend auf den Abbildungsparametern 16 und dem Referenzobjektmodell 15 werden die Referenzbilder 12 vom Bestimmungsmodul 14 ermittelt, beispielsweise durch Berechnung der Abbildung des Referenzobjektmodells 15 unter Anwendung der Abbildungsparameter 16.

Das Auswertemodul 11 ist ausgebildet, basierend auf den Referenzbildern eine Wahrscheinlichkeit 17 zu ermitteln, dass in dem Kamerabild 1 ein Referenzobjekt 13, hier eine Palette 9, vorliegt. Ferner kann basierend auf dem Kamerabild 1 und den Referenzbildern 12 ein Relativabstand, eine Relativlage und/oder Relativposition zwischen Palette 9 und Fahrzeug, insbesondere Gabelzinken 2, zu bestimmen. Beispielsweise durch vergleichen, welches der Referenzbilder 12 die in dem Kamerabild 1 umfasste Palette 9 am besten wiedergibt, wobei so auf Abstand, Lage und/oder Orientierung geschlossen werden kann. Alternativ und/oder ergänzend kann basierend auf dem Referenzobjektmodell 15 vom Bestimmungsmodul ein Referenzbild 12 ermittelt werden, dass am besten die Palette 9 des Kamerabilds 1 wiedergibt, wobei basierend auf dem Referenzbild 12 und den Abbildungsparametern 16 dann Abstand, Lage und/oder Orientierung bestimmt werden.

Claims

Ansprüche

1. Verfahren zur Objekterkennung mit den Schritten:

Aufnehmen mindestens eines Kamerabildes (1) eines Aufnahmebereichs (6) mittels einer Kamera, wobei die Kamera Abbildungsparameter (16) aufweist, wobei das Kamerabild (1) eine auf den Abbildungsparametern (16) basierende Verzeichnung aufweist, wobei von einem standardisierten Referenzobjekt (13) mindestens ein Referenzbild (12) bereitgestellt oder bestimmt wird, wobei das Referenzbild (12) das standardisierte Referenzobjekt (13) mit der auf den Abbildungsparametern (16) basierenden Verzeichnung umfasst und/oder beschreibt, wobei basierend auf dem Referenzbild (12) auf das Kamerabild (1) eine Objekterkennung angewendet wird.

2. Verfahren nach Anspruch 1, dadurch gekennzeichnet, dass das standardisierte Referenzobjekt (13) eine standardisierte Form, eine standardisierte Abmessung und/oder Toleranzabweichungen aufweist, wobei das mindestens eine Referenzbild (12) ein mit den Abbildungsparametern (16) der Kamera aufgenommenes Bild des standardisierten Referenzobjekts (13) bildet.

3. Verfahren nach Anspruch 1 oder 2, dadurch gekennzeichnet, dass das standardisierte Referenzobjekt (13) eine standardisierte Form, eine standardisierte Abmessung und/oder Toleranzabweichungen aufweist, wobei das mindestens eine Referenzbild (12) eine auf den Abbildungsparametern (16) basierende Transformation eines unverzeichneten Bildes des standardisierten Referenzobjekts (13) bildet.

4. Verfahren nach einem der vorherigen Ansprüche, dadurch gekennzeichnet, dass basierend auf einem Referenzobjektmodell (15) des standardisierten Referenzobjekts (13) das mindestens eine Referenzbild (12) durch auf den Abbildungsparametern (16) basierende Transformation des Referenzobjektmodells (15) bestimmt wird. Verfahren nach einem der vorherigen Ansprüche, gekennzeichnet durch eine Mehrzahl an Referenzbildern (12), wobei die Referenzbilder (12) auf den Abbildungsparametern (16) basierende Abbildungen, Bilder und/oder Transformationen des standardisierten Referenzobjekts (13) in unterschiedliche Abstände, Positionen, Orientierungen und/oder Lagen bilden. Verfahren nach einem der vorherigen Ansprüche, dadurch gekennzeichnet, dass die Kamera ein Fischaugenobjektiv aufweist, wobei die Verzeichnung eine Fischaugenverzeichnung bildet. Verfahren nach einem der vorherigen Ansprüche, dadurch gekennzeichnet, dass das standardisierte Referenzobjekt (13) mindestens eine Aufnahmeöffnung (10) aufweist, wobei mittels der Objekterkennung eine Position, Lage und/oder Orientierung der Aufnahmeöffnung (10) eines erkannten Referenzobjekts (9, 13) bestimmt wird. Verfahren nach einem der vorherigen Ansprüche, dadurch gekennzeichnet, dass die Objekterkennung und/oder Bestimmung der Referenzbilder (12) mittels maschinellem Lernen und/oder eines neuronalen Netzes erfolgt. Verfahren nach einem der vorherigen Ansprüche, dadurch gekennzeichnet, dass das standardisierte Referenzobjekt (13) eine Transportpalette (9) beschreibt. Verfahren nach Anspruch 8, dadurch gekennzeichnet, dass die Kamera an einem Transportfahrzeug zum Transport der Transportpalette (9) angeordnet ist, wobei basierend auf der Objekterkennung eine Lage, eine Position, einen Abstand und/oder eine Orientierung der Transportpalette (9) relativ zum Transportfahrzeug bestimmt wird. Verfahren nach Anspruch 9, dadurch gekennzeichnet, dass das Transportfahrzeug mindestens einen Gabelzinken (2) aufweist, wobei die Transportpalette (9) mindestens eine Aufnahmeöffnung (10) zur Aufnahme - 14 - des mindestens einen Gabelzinken (2) aufweist, wobei basierend auf der Objekterkennung eine Lage, Position, Abstand und/oder Orientierung der Aufnahmeöffnung (10) relativ zum Transportfahrzeug und/oder Gabelzinken (2) ermittelt wird, wobei basierend auf der Objekterkennung ein Einfädeln des Gabelzinken (2) in die Aufnahmeöffnung (10) geführt, geleitet, gesteuert und/oder geregelt wird. Computerprogramm, wobei das Computerprogramm ausgebildet und/oder eingerichtet ist, bei Ausführung des Computerprogramms das Verfahren nach einem der vorherigen Ansprüche durchzuführen. Speichermedium wobei auf dem Speichermedium das Computerprogramm nach Anspruch 12 gespeichert ist. Objekterkennungseinrichtung, wobei der Objekterkennungseinrichtung mindestens ein Kamerabild (1) eines Aufnahmebereichs (6) bereitgestellt ist, mit einem Auswertemodul (11), wobei dem Auswertemodul (11) mindestens ein Referenzbild (12) und/oder ein Referenzobjektmodell (15) zu Bestimmung des Referenzbildes (12) bereitgestellt ist, wobei das Referenzbild (12) und das Kamerabild (1) eine Verzeichnung aufweisen, wobei das Auswertemodul (11) ausgebildet ist, basierend auf dem Referenzbild (12) eine Objekterkennung des Referenzobjekts auf das Kamerabild (1) anzuwenden. Überwachungsanordnung mit der Objekterkennungseinrichtung nach Anspruch 14 und mindestens einer Kamera zur Aufnahme des Kamerabildes (1).