WO2023284922A1

WO2023284922A1 - Verfahren und system zur ermittlung der räumlichen lage eines objektes

Info

Publication number: WO2023284922A1
Application number: PCT/DE2022/200150
Authority: WO
Inventors: Roberto Schlenker; Richard Albrecht
Original assignee: Continental Automotive Technologies GmbH
Priority date: 2021-07-15
Filing date: 2022-07-05
Publication date: 2023-01-19
Also published as: DE102021207551A1

Abstract

Computerimplementiertes Verfahren zur Bestimmung der räumlichen Lage eines Objektes (2), wobei wenigstens ein Objekt (2) mittels wenigstens einer optischen Erfassungseinheit erfasst wird, wobei - zu einer Anzahl von zu erkennenden Objekten (2) jeweils wenigstens eine Referenz-Repräsentation (34) hinterlegt ist, - zu dem jeweils erfassten Objekt (2) eine Objekt-Repräsentation (30) erzeugt wird, - die Objekt-Repräsentation (30) mit wenigstens einer Referenz-Repräsentation (34) abgeglichen wird, wobei - zur Erstellung der Anzahl von Objekt-Repräsentationen (30) an dem Objekt Eck- und/oder Kantenpunkte bestimmt werden, - die Referenz-Repräsentation (34) rechnerisch wenigstens einer dreidimensionalen Transformation unterworfen wird und danach die Punkte auf eine zweidimensionale Ebene projiziert werden, - ein Abgleich der projizierten Punkte (24) und Punkte (28) der Objekt-Repräsentation (30) erfolgt, wobei die Lage des Objekts (2) als erkannt gilt, sofern eine der Wert Erkennungsfunktion der Punkte (24, 28) der Objekt-Repräsentation (30) und wenigstens einer Referenz-Repräsentation (34) in einem vorgegebenen Schwellenbereich liegt.

Description

Beschreibung

Verfahren und System zur Ermittlung der räumlichen Lage eines Objektes

Die Erfindung betrifft ein Verfahren und System zur Ermittlung der Lage eines Objektes.

Die zuverlässige Erkennung der räumlichen Lage von Objekten, die sich in unterschiedlich orientierten Lagen befinden können, mit optischen Erfassungsgeräten ist eine Aufgabe, die in verschiedenen Anwendungsszenarien gelöst werden muss.

So ist beispielsweise eine große technische Herausforderung, Schüttgut aus einer Kiste mit Hilfe eines Roboters Stück für Stück heraus zu nehmen (Bin Picking), um diese Stücke dann einer Produktionsanlage zu zuführen. Die Herausforderung liegt insbesondere darin, dass der Roboter unsortierte Objekte zwar mit Hilfe von Kameras und Sensoren scannt, es jedoch aufwändiger Bildverarbeitungs-Algorithmen bedarf, um die Lage und Position der einzelnen Objekte zu identifizieren. In einzelnen Fällen wird sogar auf 3D-Kameras zurückgegriffen, um das Problem zu vereinfachen.

Maschinenlernen, insbesondere "Deep Learning" mit künstlichen neuronalen Netzen, stellt eine mögliche Lösung für das oben genannte Problem dar, ist aber aufgrund der benötigten sehr hohen Daten-Menge (alle Bildpunkte gehen während jedes Rechenschrittes ein) und der hohen Empfindlichkeit gegenüber Randbedingungen (Lichtverhältnisse, Konturen anderer angrenzender Objekte, sich überlappende Kanten anderer Objekte) nur für wenige Projekte geeignet. Auch können solche Algorithmen nur auf eine Orientierung des Objektes trainiert werden, wodurch es mehrerer solcher Trainingssätze bedarf, um alle Orientierungen zu identifizieren.

Der Erfindung liegt daher die Aufgabe zugrunde, ein verbessertes, robustes und gleichzeitig ressourcenschonendes Verfahren zur Bestimmung der Lage von Objekten anzugeben. Weiterhin soll ein entsprechendes System bereitgestellt werden.

In Bezug auf das Verfahren wird diese Aufgabe erfindungsgemäß gelöst, indem wenigstens ein Objekt mittels wenigstens einer optischen Erfassungseinheit erfasst wird, wobei zu einer Anzahl von zu erkennenden Objekten jeweils wenigstens eine Referenz-Repräsentation hinterlegt wird, zu dem jeweils erfassten Objekt eine Objekt-Repräsentation erzeugt wird, die Objekt-Repräsentation mit wenigstens einer Referenz-Repräsentation abgeglichen wird, wobei zur Erstellung der Anzahl von Objekt-Repräsentationen an dem Objekt Eck- und/oder Kantenpunkte bestimmt werden, die Referenz-Repräsentation rechnerisch wenigstens einer dreidimensionalen Transformation unterworfen wird und danach die Punkte auf eine zweidimensionale Ebene projiziert werden, ein Abgleich der projizierten Punkte und Punkte der Objekt-Repräsentation erfolgt, und wobei die Lage des Objekts als erkannt gilt, sofern eine der Wert Erkennungsfunktion der Punkte der Objekt-Repräsentation und wenigstens einer Referenz-Repräsentation in einem vorgegebenen Schwellenbereich liegt.

Vorteilhafte Ausgestaltungen der Erfindung sind Gegenstand der Unteransprüche.

Die Erfindung geht von der Überlegung aus, dass für viele Anwendungen robuste und schnelle Anwendungen zur räumlichen Lage von Objekten benötigt werden. Dabei wäre es vorteilhaft, wenn sowohl der Vorbereitungsaufwand als auch die Adaptierung an neue Objekte möglichst ressourcenschonend erfolgen könnten.

Wie nunmehr erkannt wurde, kann die Aufgabe, die Position und Orientierung eines Objektes zu ermitteln, extrem effizient auf Grundlage der Eck-Punkte bzw. Kantenpunkte eines Drahtmodells des Objektes, gelöst werden, da diese auch in einer 2D-Projektion ausreichend Informationen über die räumliche Lage des Objektes enthalten. Genauso, wie der Abstand und Konstellation aller Eckpunkte eines Draht-Models ein Muster definiert, ist es möglich, durch Orthogonal-Projektion diese Eck-Punkte auf eine Ebene zu projizieren, die vergleichbar mit dem Kamerabild ist, also sich auf der Kamera-Ebene befindet. Jede Verkippung des Draht-Models liefert eine den Winkeln entsprechende „verzerrte“ Variante von Eckpunkten, entsprechend dem Kamera-Bild, das ein Objekt in einer von der Senkrechten abweichenden Perspektive aufgenommen hat.

Damit ergibt sich als Lösung der obigen Aufgabe das Finden einer identischen Punkt-Konstellation, wie es der perspektivischen Projektion des Draht-Models auf die Ebene des Kamera-Bildes entspricht. Die Erfindung reduziert somit das Problem auf die Muster-Suche von verschiedenen Punkt-Konstellationen auf zwei übereinander liegenden parallelen Ebenen, nämlich der Kamera-Bild-Ebene und der Projektions-Ebene.

Vorteilhafterweise umfasst die jeweilige Transformation eine Drehung und/oder Skalierung. Durch das Verwenden von Skalierungen kann unterschiedlichen Objektabständen zur Kamera Rechnung getragen werden, wodurch die Genauigkeit der Objektlagenbestimmung erhöht werden kann. Bei bekannter Objekt-Größe zu Bild-Format-Größe kann durch Vergleich von Referenz-Repräsentationen mit unterschiedlicher Skalierung eine Berechnung für den Kamera-Objekt-Abstand durchgeführt werden. Die Genauigkeit der Abstands-Berechnung ist abhängig von Bild-Auflösung und Fang-Radius.

Die Erkennungsfunktion ergibt sich bevorzugt aus der Transformation des Draht-Models in Form von Winkel-Rotation und Skalierung des Draht-Models und anschließender Projektion auf die Kamera-Ebene zur Referenz-Repräsentation, durch das Finden einer identischen Punkt-Konstellation, der Objekt-Repräsentation. Die Lage der Referenz-Repräsentation stimmt dann mit der Lage der Objekt-Repräsentation überein. In diesem Falle kann davon ausgegangen werden, dass das Objekt die gleiche Winkel-Rotation wie das Draht-Modell besitzt. Für mögliche Objektlagen wird in einer bevorzugten Ausführungsform des Verfahrens eine Priorisierung der Orientierung durchgeführt, wobei zur Objekterkennung der Vergleich in der Reihenfolge der Priorisierung durchgeführt wird. Auf diese Weise kann die Erkennung der Objektlage beschleunigt werden, da zuerst die wahrscheinlichsten Orientierungen bereits zur Erkennung führen können. Die Priorität ist dabei vorteilhafterweise ein Maß dafür, wie wahrscheinlich ein Objekt in der konkreten Anwendung in dieser Lage und Orientierung zum Liegen kommt.

Die wenigstens eine Referenz-Repräsentation wird bevorzugt über das Kamerabild verschoben und in der Kamera-Ebene rotiert gemäß der möglichen Orientierung der Objekt-Repräsentationen. Dabei kommt der Suche auf dem Kamera-Bild die Unschärfe bzw. ein Fang-Radius zugute, die/der erlaubt, die Nähe zur Objekt-Repräsentation zu bewerten.

In dem Fall, dass die Repräsentationen als Punkt-Listen geführt werden, zeigen die Fang-Radien nur Lage-Toleranz an. Befinden sich gemäß einer qualitativen Größe (z. B. 90 %) der Referenz-Repräsentations-Punkte solche der Objekt-Repräsentation innerhalb der Fang-Kreise, gilt das Objekt als erkannt.

Eine weitere Rolle der Fang-Radien ist die Schrittweise Rotation. Die zulässige Toleranz zur Bestimmung der Lage eines Objektes, gilt auch der Winkel-Genauigkeit bei der Bestimmung der Orientierung. Auch hier reduziert der Fang-Radius die maximale Anzahl der möglichen Rotations-Schritte, bei der iterativen Suche nach Übereinstimmung zwischen der Referenz-Repräsentation und der Objekt-Repräsentation.

In dem Fall, dass die Referenz-Repräsentationen und Objekt-Repräsentationen als Koordinaten-Matrix geführt werden, stellen die Fang-Kreise den Bereich innerhalb des Bildes dar, der nach einem Objekt-Repräsentations-Punkt untersucht wird. Zwar erhöht sich dadurch der Datenaufwand, aber der Rechen-Aufwand nimmt um Faktoren ab, da nur noch wenige der Objekt-Repräsentations-Punkte zum Vergleich herangezogen werden. Eine weitere Rolle der Fang-Kreise bzw. Fang-Radien ist die, immer nur einen Punkt aus der Objekt-Repräsentation zum Vergleich heranzuziehen. Im Falle, dass zum Zwecke der Orientierungs-Suche, also der groben Suche, der Fangradius größer als der Objekt-Repräsentations-Punkte-Abstand ist, kann es Vorkommen, dass mehrere Objekt-Repräsentations-Punkte in einen solchen Fang-Kreis zu liegen kommen, aber nur eines dieser Punkte ausgewertet wird.

Das Verfahren wird bevorzugt in der Weise durchgeführt, dass neben der bevorzugten Lage und Rotation in der Ebene auch die wahrscheinlichste Skalierung gewählt wird. Anhand des Auswerte-Ergebnisses lässt sich bereits erkennen, ob sich die Projektion des Draht-Model in der Nähe einer entsprechenden Punkt-Konstellation des Objektes, befindet.

Exemplarisch kann man sich vorstellen, in dem Fall, es gäbe nur ein Objekt im Kamerabild, dass die Auswertung einen Vektor liefert, egal an welcher Stelle mit dem Punkt-Muster begonnen wird, der die Richtung der Position des Objektes anzeigt. Größere Schritte reduzieren die Anzahl der Wiederholungen des Vergleichs-Vorgangs und somit den Zeitbedarf bis zur Übereinstimmung.

Die Referenz-Repräsentation wird einer bevorzugten Ausführung unmittelbar vor dem Abgleich mit Hilfe der wenigstens einen Transformation generiert, d. h. berechnet.

Alternativ dazu kann eine vorher abgespeicherte Referenz-Repräsentation für den Abgleich verwendet werden. Dies erfolgt bevorzugt im Falle einer Ebene, auf der das Objekt liegt, und wenn sicherstellt ist, dass nur Rotationen des Objektes in der Ebene stattfinden können.

In einer bevorzugten Ausbildung des Verfahrens sind die einzelnen Seiten des Objektes mit verschiedenen Farben ausgestattet, wobei nur diejenigen Objekt-Repräsentationen mit der Referenz-Repräsentation verglichen werden, die gemäß der Farbe auch die priorisierte Seite des Objektes zeigt. Vorteilhafterweise wird ausgeschlossen, dass Objekt-Repräsentationen innerhalb der Kanten der Referenz-Repräsentation zu liegen kommen. Diese sind keiner Orientierung zuordbar und kosten Rechenzeit. Ausnahme bilden besondere Merkmale der Objekte, die herangezogen werden, weil das Objekt sonst sehr symmetrisch, gemäß einem Würfel ist, also mehrere ähnliche Seiten aufweist.

Mit Hilfe der erkannten Lage des wenigstens eines Objektes werden in einer bevorzugten Ausführungsform Parameter zur Ansteuerung eines Roboterarm zum Greifen des Objektes generiert. In diesem Falle werden die Rotations-Winkel und Skalierung als Abstand zur Kamera übermittelt, die eine bestmögliche Rotation des Greifers als Anpassung an das zu greifende Objekt. Auf diese Weise kann beispielsweise die Aufgabe des Bin-Picking gelöst werden.

Mit Hilfe der erkannten Lage können Parameter zur Charakterisierung der Objektlage wenigstens eines Objektes generiert werden. Beispielsweise kann die Lage von mehreren, z. B. auf eine gemeinsame Leiterplatte aufgelöteten, elektronischen Komponenten überprüft werden. So ist es auch möglich, jede beliebige Konstellation von Bauteilen in ihrer Gesamtheit als einwandfrei montierte Baugruppe zu identifizieren, also ihre korrekte Anordnung zu prüfen.

Das erfindungsgemäße Verfahren umfasst vorteilhaft folgende Schritte und Merkmale, die in verschiedenen dem Fachmann erkennbar sinnvollen Kombinationen verwendet werden können. Für jede mögliche Lageposition des Objekts werden Punkte (3D-Daten basierend auf einem Drahtmodel) hinterlegt, so dass das Verfahren jede Lage des einzelnen Objektes iterativ durch Rotation und Skalierung identifizieren kann. Das Draht-Model wird dazu intern über alle drei Achsen rotiert und skaliert und auf eine 2D-Ebene projiziert. Eine Projektion auf eine 2D-Ebene erfolgt, da das Kamerabild auch ein zweidimensionales Abbild ist. Dort begegnen sich Projektion der Draht-Model-Punkt mit Kamera-Objekt-Punkte zur Identifikation des Objektes. Mit der Projektion ist es möglich, den perspektivischen Winkel zu variieren. Das Draht-Model rotiert um seine 3D-Achsen, wobei jede Perspektive auf die 2D-Ebene projiziert und die Punkte der Projektion mit den detektierten Kanten-Punkten des Bildes verglichen werden.

Das Bild der zu erkennenden Objekte wird mit einer Kamera aufgenommen. Da die Objekterkennung robust mit Hilfe von Eck- und Katenpunkten erfolgt, reduziert eine geringe Auflösung der Kamera die Rechenzeit, nicht aber die Genauigkeit der Detektion. Rechenzeit und Auflösung stehen in einem quadratischen Zusammenhang. Wird die Auflösung auf reduziert, wird die Rechenzeit auf % reduziert.

Bevorzugt werden Farbe und Helligkeit des Kamera-Bildes angepasst, d. h. das Verfahren erhöht beispielsweise den Bildkontrast des erfassten Objektes. Dazu ermittelt der Benutzer mit Hilfe eines Musterobjektes unter bekannten Lichtverhältnissen diejenigen Parameter, mit deren Hilfe der höchste Bild-Kontrast an den Objekt-Kanten erzielt wird.

Das 3D-Draht-Modell der Referenz-Repräsentation umfasst im Vergleich zu 3D-Solid-Modellen nur einen Bruchteil der Daten-Menge. Die Eck-Punkte und Mittelpunkte der Kanten stellen effektiv die wichtigsten Informationen zur Objekterkennung dar. Weist das Objekt eine seitensymmetrische Form auf, können Bohrungen oder andere, die jeweilige Seite des Objektes heraushebende Details, herangezogen werden.

Im Kamerabild werden bevorzugt Bild-Kanten-Pixel (Punkte) ermittelt, woraus eine Reduzierung der Anzahl der zu vergleichenden Punkte erfolgt. Dazu werden um jeden Pixel der aktuellen Position drei Pixel-Ketten von vorher festgelegter Anzahl Pixel betrachtet. Die drei Pixel-Ketten sind die Pixel oberhalb und unterhalb, diagonal und links wie rechts bezogen auf den zu einem Zeitpunkt betrachteten Pixel aktueller Position. Dadurch ergeben sich Farbe- und Helligkeits-Verläufe um den aktuellen Pixel herum, die zur Ermittlung der Kante herangezogen werden. Eine Kante zeichnet sich dadurch aus, dass Farbe und Helligkeit sich sprunghaft im Verlauf der Pixel-Kette ändern. Wenn sich also beispielshaft die Farbe und Helligkeit der Pixel unterhalb des Pixels aktueller Position gegenüber den Pixeln oberhalb unterscheiden, zeigt der Pixel aktueller Position eine Kante an. Dabei enthält das Verfahren bevorzugt einen Grenzwert, der dabei überschritten sein muss. Das gleiche gilt in äquivalenter Weise diagonal und von links nach rechts.

Eine Ecke zeichnet sich dadurch aus, dass Farbe und Helligkeit sich in zwei Richtungen sprunghaft im Verlauf der Pixel-Kette ändern.

Der Scan findet von links nach rechts und von oben nach unten statt. Da Kanten und Ecken senkrecht, waagrecht oder diagonal zur Scan-Richtung vorliegen können, werden diese drei Pixel-Ketten betrachtet. Darüber hinaus gibt es verschiedene Kriterien wie Kennlinien innerhalb der Pixel-Ketten, die abhängig von Helligkeits-Verhältnisse und Oberflächenbeschaffenheit der Objekte herangezogen werden. Beispielsweise zeichnet sich eine Kante auch dadurch aus, dass die Steigung in der Pixel-Kette oben von der Steigung der Pixel-Kette unten abweicht, so auch waagrecht und diagonal.

Ein intern definierter Fang-Radius gibt den effektiven Abstand der Bild-Kantenpunkte vor, die beim Scannen des Bildes verwendet werden. Es macht keinen Sinn, wenn vorgeschrieben ist, dass jeweils nur ein Bild-Kantenpunkt innerhalb des Fang-Kreises zu liegen kommen soll, dass sich dann Bild-Kanten-Punkte in einem Abstand kleiner dem Fang-Radius zu liegen kommen. Die übrigen Bild-Kanten-Punkte tragen nicht zur Informationserhöhung bei und erhöhen gleichzeig den Rechen-Aufwand. Der Fang-Radius jedes Draht-Model-Punktes stellt eine Toleranz der Übereinstimmung dar und kann jederzeit an höhere Auflösung angepasst werden, um eine höhere Übereinstimmungspräzision zu erzielen. Vorgabe ist, nur so genau zu sein, wie der Prozess es erfordert und nicht mehr. Dieser Fang-Radius-Abstand wird auf die Generierung der Bild-Kanten-Punkte-Abstand übertragen, weil so sichergestellt ist, nur diejenigen Punkt zu bewerten, die auch zur Positionierung beitragen. Zur Erkennung der Objektlage erfolgen bevorzugt eine Rotation des Draht-Models über alle drei Achsen, optional eine Skalierung, und eine Orthogonal-Projektion auf die 2D-Ebene bis zur Über-Deckung von Projektion des Draht-Models und Bild-Kanten-Punkten. Die Winkel und damit betrachtete Perspektive sind aus interner Orthogonal-Projektion ablesbar. Auch liefert die Skalierung des internen Drahtmodels ein Maß für den Abstand zwischen Kamera und Objekt.

Die Performance des Verfahrens kann auf unterschiedliche Arten optimiert werden. Lediglich sichtbare Kanten und Punkte des Draht-Models werden auf die Ebene projiziert und ist der Abstand zwischen zwei Punkten der sichtbaren Kanten kleiner als der Fangradius, wird nur eines der Punkte berücksichtigt, was zu einer Reduktion der Daten führt. Auch ist der Abstand eines Draht-Model-Punktes zu einem Bild-Kanten-Punkt geringer als der Fang-Radius-Abstand, gilt dies als Übereinstimmung. Es soll lediglich die Genauigkeit erzielt werden, die auch mit Definition des Fang-Radius gefordert ist, was den Rechenaufwand reduziert.

In dem Fall, dass die einzelnen Seiten des Objektes mit verschiedener Farbe ausgestattet sind, ist es zusätzlich möglich allein diejenigen Punkt-Muster zu betrachten, die gemäß der Farbe auch die Seite sichtbar zeigen, die der priorisierten Projektion des Draht-Modells entspricht. Alle Übrigen können getrost ausgeblendet werden, wodurch die Rechenzeit stark reduziert wird.

Das Verfahren kann für spezielle Anwendungen parametrisiert werden. Positionserkennung, Orientierungserkennung und Objektsuche können unabhängig verwendet werden. Aufgaben von geringer Komplexität können in viel kürzeren Zyklen vollzogen werden:

• Positionserkennung zur Detektion der Position von zu justierenden Objekten.

• Orientierungserkennung zur Justierung von Objekten deren Ausrichtung im Montageprozess festgelegt wird.

• Objektsuche und Orientierung für Objekte, deren exakte Position und Orientierung zum Zeitpunkt der Verwendung zu detektieren sind. Nur ein Würfel kommt auf allen Seiten mit gleicher Wahrscheinlichkeit zu liegen. Die Position eines allgemeinen Objektes unterliegt einer statistisch verteilen Lage-Position. Zur Reduzierung des Rechenaufwandes, werden zunächst die wahrscheinlichsten Lagepositionen projiziert und erst bei Ausbleiben von Fund- Ergebnissen die übrigen herangezogen.

Die Sensitivität des Verfahrens kann während der Auswertung variieren. Welche Farbänderung als Kanten identifiziert wird, beeinflusst die Sensitivität. Die damit erkannte Zahl an Bild-Kanten-Punkte wächst/fällt mit der Sensitivität. So lässt sich der Rechenaufwand auf das notwendige Maß halten, was der Zyklus-Zeit zugutekommt. So kann auf wechselnde Lichtverhältnisse reagiert werden, indem die Sensitivität automatisch angepasst wird, um immer einen kürzest möglichen Rechenaufwand zu halten.

Mit Hilfe von in der Farbe abgestimmten Platten der Objekt-Umgebung ist es zusätzlich möglich, diffuses farbiges Licht zu erzeugen, welches aufgrund spezifischer Farben den Kontrast erhöhen kann.

Der interner Farbabgleich kann mit den äußeren Lichtverhältnissen abgestimmt werden. Auch können durch Anpassung des Designs, z. B. farblich hervorgehobene Ecken, aber auch spezifisch markante geometrische Bereiche, die Positionserkennung erhöhen. Ein Suchvorgang bis zum Finden des Objektes kann mit geringer Auflösung durchgeführt werden, und zur Steigerung der Positionserkennung kann die Auflösung, beispielsweise iterativ, erhöht werden. Dabei wird die Steigerung der Positionserkennung bevorzugt nur mit den in unmittelbarer Nähe der Objekt-Position befindlichen Ecken und Kantenpunkten durchgeführt.

In Bezug auf das System wird die oben genannte Aufgabe erfindungsgemäß gelöst mit wenigstens einer optischen Erfassungseinheit und einer Recheneinheit zur Durchführung eines Verfahrens nach einem der vorherigen Ansprüche. Die Vorteile der Erfindung liegen insbesondere darin, dass das beschriebene Verfahren zuverlässig und schnell arbeitet. Insbesondere im Gegensatz zu Verfahren, welche Deep-Learning einsetzen, ist es mit Austausch eines Draht-Modells sofort einsatzbereit, da kein aufwändiges Training notwendig ist. Es ist einfach handhabbar mit einfacher Daten-Pflege. 3D-kameras werden nicht benötigt.

Eine Umstellung auf ein anderes Produkt geschieht einfach durch Austausch des Draht-Models. Es ist flexibel auf verschiedene Objekte (durch dynamischen Tausch des Draht-Models) anwendbar. Das Verfahren bzw. das System können neben der Sortierung von Objekten aus einer Kiste, auch dazu verwendet werden, Prozessabläufe zu kontrollieren und zu überwachen.

Während also ein Deep-Learning-Algorithmus (neuronales Netz) immer alle Bildpunkte pro Durchlauf verarbeitet und immer nur auf eine Orientierung trainiert ist, ist das hier vorzustellende Verfahren in der Lage das Objekt durch Vergleich einzelner Bildpunkte (Eckpunkte des Objektes) und bei variabler Orientierung zu identifizieren.

Und werden die einzelnen Seiten des Objektes mit verschiedener Farbe ausgestattet, ist es zusätzlich möglich, allein diejenigen Bildpunkte zu betrachten, die gemäß der Farbe auch die priorisierte Seite zeigen, die übrigen Bildpunkte werden ignoriert. So ist es möglich gezielt spezifische Bauteile zu detektieren und gemäß einem Fehlerkatalog Fehlermöglichkeiten zu zeigen. Eine solche Anwendung ist geeignet, dem Operator eine Fehleranalyse zu erleichtern. Und Wartungsarbeiten zu verkürzen.

Das Verfahren kann bei Vorhandensein von mehreren Prozessoren in einer CPU oder GPU einfach parallelisiert werden. Das Verfahren arbeitet sehr robust. Falsche Punkte, also Punkte, die beispielsweise aufgrund von Schmutz und Reflektion irrtümlich erkannt wurden, spielen keine Rolle oder nur eine geringe Rolle, da als Übereinstimmung die Summe aller Punkte in ihrer Konstellation mit Fang-Radius-Abstand gelten. Wie zuvor dargelegt, gibt es bevorzugt einen Übereinstimmungs-Parameter, der z. B. 90 % der Bildpunkte innerhalb der Fang-Kreise vorschreibt. Damit ergibt sich ein Fang-Muster, das durch das Draht-Model definiert ist, aber nicht durch Falsch-Punkte verzerrt werden kann.

Ein Ausführungsbeispiel der Erfindung wird anhand einer Zeichnung näher erläutert. Darin zeigen in stark schematisierter Darstellung:

FIG. 1 eine perspektivische Darstellung eines beispielhaften Objektes;

FIG. 2 weitere perspektivische Darstellungen des Objektes gemäß FIG. 1;

FIG. 3 Darstellungen von Objektinformationen;

FIG. 4 3D-Daten eines Würfels;

FIG. 5 2D-Projektionen von Punktwolken einer Referenz-Repräsentation und von mehreren Objekt-Repräsentationen;

FIG. 6 perspektivische Darstellungen des Objektes gemäß FIG. 1 in verschiedenen Bildauflösungen:

FIG. 7 ein Ablaufdiagramm eines Verfahrens in einer ersten bevorzugten Ausführungsform; und

FIG. 8 ein Ablaufdiagramm eines Verfahrens in einer zweiten bevorzugten Ausführungsform.

Gleiche Teile sind in allen Figuren mit denselben Bezugszeichen versehen.

In FIG. 1 ist ein Objekt 2, welches eine der Komponenten einer Montage-Vorrichtung ist, perspektivisch dargestellt. Es ist eine wichtige und weit-verbreitete Aufgabe, die räumliche Lage von dreidimensionalen Objekten optisch zu erfassen. Die erkannte räumliche Lage kann beispielsweise dazu genutzt werden, einen Roboterarm zum Greifen des entsprechenden Objektes anzusteuern. Das Objekt 2 ist bereichsweise quaderförmig aufgebaut mit einer Oberseite 4, einer Unterseite (nicht sichtbar), zwei Längsseiten 6 und zwei Stirnseiten 10, 12, wobei die Stirnseite 10 zwischen zwei quaderförmige Vorsprünge 8 angeordnet ist, so dass das Objekt 2 mit Stirnseite 10 und Vorsprüngen 8 eine U-förmige Formgebung aufweist.

In FIG. 2 ist das Objekt 2 gemäß FIG. 1 in verschiedenen räumlichen Orientierungen und somit in verschiedenen räumlichen Lagen zu sehen. Viele Positionen und Perspektiven sind möglich, die das Erkennen dieses speziellen Bauteils erschweren und den notwendigen Algorithmus sehr aufwändig gestalten können. Damit ein Roboter das Objekt zuverlässig greifen und einer nächsten Verarbeitungsstation zuführen kann, muss zusätzlich zur Position auch die räumliche Orientierung des Objektes 2 genau bekannt sein, wozu das erfindungsgemäße Verfahren vorteilhaft eingesetzt werden kann.

Die räumliche Orientierung des Objektes 2 kann beispielsweise charakterisiert werden, wie in FIG. 3 dargestellt. Wie in FIG. 3a) gezeigt, sollte die der Kamera zugewandte Seite des Objektes 2 erkannt werden. Da durch Erkennen der Seite des Objektes die Punkt-Konstellation des Draht-Modells mit Punkt-Konstellation des Kamera-Bildes in Übereinstimmung gebracht wurden, können auch wie in den FIG. 3b) und 3c) dargestellt, zwei senkrecht zueinanderstehende Winkel des Objektes, nämlich die Winkel zu einer senkrechten bzw. vertikalen Achse 16 und zu einer horizontalen Ebene aus den Transformations-Daten des Draht-Modells abgeleitet werden. Mit Hilfe dieser Informationen kann die räumliche Orientierung bzw. Lage des Objektes eindeutig erkannt werden.

Anhand der FIG. 4 bis 8 wird im Folgenden eine bevorzugte Ausführungsform des Verfahrens zur Bestimmung der räumlichen Lage eines Objektes beschrieben. Das Verfahren verwendet zu einem zu erkennenden Objekt 2 ein reduziertes Drahtmodell; nicht sichtbare Kanten sind ausgeblendet, bei dem in Abhängigkeit von den Eckpunkten und Kanten eine Punktmenge 20 bzw. Menge von Punkten 24 verwendet wird, welche jeweils alle Eckpunkte und Kantenmittelpunkte repräsentieren.

In FIG.5 ist schematisch eine optische Aufnahme bzw. ein Foto von würfelförmigen Objekten 2 in einem Behälter dargestellt. Mit den großen runden Flächen sind die Punkte 28 eines ausgerichteten Drahtmodells mit Fangradius eines Würfels und mit kleinen Punkten die in einem Bild detektierten Kanten der würfelförmigen Objekte dargestellt (der Übersichtlichkeit halber sind nur wenige Punkte mit Bezugszeichen versehen). Insgesamt wurden 92 Bildpunkte (gegenüber der doch geringen Auflösung von 120x100 = 12000 Bildpunkten) als Kanten detektiert und 7 Punkte des Draht-Models verwendet, was eine extreme Effizienz-Steigerung gegenüber konventionellen Verfahren aufzeigt.

Hier sei noch ein Unterschied zu Deep Learning verfahren aufgezeigt, deren verwendete Daten-Typen Fließkomma-Zahlen (double in Programmiersprache C) sind, deren Breite 8 Byte beträgt, im Gegensatz zu den verwendeten Daten-Typen Integer (in Programmiersprache C) mit nur 4 Byte, also einer halb so großen Operation-Zahl. Damit halbiert sich die Rechendauer bei gleicher Anzahl Bildpunkte zusätzlich.

Sowohl als Objekt-Kanten identifizierte Punkte in der Ebene des Kamera-Bildes, wie auch die intern zum Vergleich herangezogenen Draht-Model-Punkte, bestehen aus Punkten in 2D-Ebenen. Die Projektion des Draht-Models auf die Bild-Ebene der detektierten Punkte erlaubt eine Positionserkennung und Orientierungserkennung. Während also ein Deep-Learning-Algorithmus (neuronales Netz) immer alle Bildpunkte pro Durchlaufverarbeitet und nur Objekte mit einer festgelegten Perspektive detektiert, ist das hier vorzustellende Verfahren in der Lage, das Objekt durch Vergleich einzelner Bildpunkte (Eckpunkte des Objektes) und bei Verwendung eines Bruchteils an Daten alle Rotationen und Skalierungen, zu identifizieren. Die Punkte 24 des Drahtmodells des Würfels sind eine Referenz-Repräsentation 34 des Würfels, während die detektierten Bild-Punkte 28 der erkannten Würfel jeweils eine Objekt-Repräsentation 30 des entsprechenden Würfels darstellen.

Bevor ein Abgleich der Referenz-Repräsentationen mit den Objekt-Repräsentationen erfolgt, reduziert das Verfahren nach Ermitteln der Bild-Kanten-Pixel (Punkte) im Kamera-Bild die Anzahl der Punkte. Ein intern definierter Fang-Radius gibt dabei den effektiven Abstand der Bild-Kantenpunkte vor.

Von Bild-Kanten-Punkten, die sich innerhalb des Fang-Radius-Abstandes befinden, ist jeweils nur einer notwendig. Die übrigen Bild-Kanten-Punkte tragen nicht zur Informationserhöhung bei und erhöhen gleichzeig den Rechen-Aufwand.

Der Fang-Radius jedes Draht-Model-Punktes stellt einen Abstand in allen Richtungen dar, der anzeigt, welche Übereinstimmungs-Genauigkeit gefordert ist.

In der FIG. 5 sind das projizierte Drahtmodell bzw. die Referenz-Repräsentation 34 des Würfels mit Punkten 24 in Übereinstimmung gebracht bzw. in Deckung gebracht mit einer Objekt-Repräsentation 30 mit Punkten 28 eines würfelförmigen Objektes.

Das Kriterium, nach dem die Lage eines Objektes als erkannt gilt, wird mit Hilfe einer Erkennungsfunktion realisiert. Sie gibt vor, wie viele der Bildpunkte innerhalb der von der Referenz-Repräsentation projizierten Kreise der Fang-Radien enthalten sind, z. B. 95 %. Dabei kommen weitere Bedingungen zum Tragen, wie z. B., dass es innerhalb der von den Kanten des Draht-Model eingeschlossenen Flächen, keine Bildpunkte zu liegen kommen dürfen, weil auch nur Kanten der Objekte detektiert wurden. Genauso, wie die detektierten Punkte der Objekte auf der Bild-Ebene keine Punkte aufweisen, die von den Kanten eingeschlossen werden, sich also innerhalb der Objekt-Flächen befinden, darf im Falle einer Übereinstimmung keine Punkte innerhalb des von dem Draht-Model projizierten Eckpunkte und Kanten-Mittelpunkte zu liegen kommen. Ausschlussverfahren von nicht gültigen Übereinstimmungen, die auftreten können, wenn eine große Zahl Objekte gemischt durcheinander in einem Behälter liegen. In FIG. 6 sind von links nach rechts vier schematischen Aufnahmen des Objektes 2 gemäß FIG. 1 dargestellt, wobei das ganz rechte Bild das Objekt in voller Kameraauflösung (100 %) zeigt. Von links nach rechts beträgt die Kameraauflösung 10 %, 20 %, 50 % und 100 % der vollen Kameraauflösung.

Vorzugsweise werden in dem Verfahren zunächst mit einem Bild grob die Positionen der Objekte erkannt, d. h. es wird ein Bild mit verringerter Kameraauflösung verwendet. Um dann die Lage des Objektes genauer zu bestimmen, wird eine höhere Auflösung verwendet. Dies kann iterativ bzw. schrittweise mit mehreren, immer höher werdenden Auflösungen durchgeführt werden. Dabei wird nur noch der Bereich des Bildes in der Auflösung erhöht, in dem sich die Objekt-Repräsentation befindet. Das reduziert die Datenmenge erheblich und somit auch die Verarbeitungs-Zeit für jede weitere iterative Optimierung. Der Suchvorgang bis zum Finden des Objektes wird somit mit geringer Auflösung durchgeführt, und zur Steigerung der Positionserkennung wird die Auflösung erhöht. Die Pixel-Zahl und die Verarbeitungs-Zeit stehen in einem quadratischen Zusammenhang zur Auflösung: 10 % der Kamera-Auflösung führen zu einer Zeitreduzierung von 99 %.

Das Verwenden von Bildern mit reduzierter Kameraauflösung wird bevorzugt in dem Verfahren auch eingesetzt, um die Verarbeitungszeit zu reduzieren. Gerade Serien-Produktionen arbeiten mit einem festen Takt-Zyklus. Da je nach Füllgrad des Behälters Vorkommen kann, dass Objekte nicht mehr in priorisierter Ausrichtung enthalten sind, die Verarbeitungszeit steigt, ist es sinnvoll, zunächst die Position von Objekten zu ermitteln, um dann nur den Bild-Bereich und damit Objekt-Repräsentation zu vergleichen, der auch ein Objekt enthält. Das reduziert die zu verarbeitenden Daten um die Zahl an Objekten, die grundsätzlich detektierbar sind. Ist die Position eines Objektes eingegrenzt, kann die Lage und Rotation des Objektes auf Basis einer höheren Auflösung aber nur einem kleinen Bild-Ausschnitt genauer ermittelt werden. Auf diese Weise wird die Taktzeit der Serien-Produktion sicher eingehalten. In FIG. 7 ist eine bevorzugte Ausführungsform des Verfahrens in einem Blockdiagram dargestellt. In einem Block 40 wird von einem Objekt ein Drahtgittermodell erstellt. In diesem Drahtgittermodell werden die Punkte an den Eckpunkten des Modells und Punkte in der Mitte von Kanten ausgewählt, woraus eine Punktwolke entsteht. In einem Block 46 wird eine Anzahl, insbesondere eine Vielzahl, von zweidimensionalen Projektionen des Draht-Models als Punktwolken erstellt, wobei jede dieser Projektionen eine Referenz-Repräsentation 34 des Objektes 2 ist. Die jeweilige Projektion umfasst dabei sowohl eine dreidimensionale Rotation als auch eine Skalierung. In anderen bevorzugten Ausführungen ist die Skalierung optional, wenn sichergestellt werden kann, dass der Abstand Objekt-kamera jeweils zumindest näherungsweise gleich groß ist.

In einem darauffolgenden Block 52 werden die Referenz-Repräsentationen 34 nach ihrer Wahrscheinlichkeit, bezüglich räumlicher Orientierung und Lage des Objektes zu entsprechen, priorisiert. Räumliche Orientierungen und Lagen, die aufgrund der Geometrie des Objektes wahrscheinlicher sind, erhalten eine höhere Priorisierung als Orientierungen und Lagen, die selten Vorkommen. Die einfachste Weise eine solchen Priorisierung zu ermitteln, ist die Auswertung von Bauteillose, die gemäß der vorher gefärbten und im Haufen sichtbaren Bauteil-Seiten über eine genügen große Zahl an Versuchen ausgezählt werden. Dabei wird auch beobachtet, abhängig von Position im Behälter, welche Bauteil-Seiten von oben sichtbar sind. So ist zu erwarten, dass flache Objekte zum Rand hin sich von flach liegend auf an der Wand stehend orientieren.

Die Verteilung der von oben beobachteten Bauteil-Seiten entsprechen dem Auftreten dieser Seiten in Wechselwirkung zueinander, also in gemeinsamem Liegen innerhalb des Behälters und Position innerhalb des Behälters. Dazu werden Teile in einen Behälter geschüttet und die erkennbaren Bauteil-Seiten gezählt. Nach mehrmaligem Wiederholen werden diejenigen Seiten, mit höchster Anzahl auch als höchste Priorität festgelegt, zusammen mit den bevorzugten Positionen. So wird die Auswertung jede Referenz-Repräsentationen in der bestgeeigneten Position innerhalb des Behälters begonnen und erst, wenn an dieser Position die Ermittlung eines Objektes fehlgeschlagen hat, wird die Position geändert. Diese Herangehensweise, die Priorität zu ermitteln, wird bevorzugt eingesetzt, wenn die Produktions-Zykluszeiten sehr kurz gegenüber der maximalen Verarbeitungszeit zum Ermitteln der Lagen, von mindestens eines der Objekte, ist. Dabei gilt die Forderung, dass für 100 % der Produktions-Zyklen jeweils ein Objekt lokalisiert und dessen Orientierung erkannt wurde.

In einem darauffolgenden Block 56 wird ein Behälter optisch mit einer stationären Kamera erfasst. In dem Bild werden Objekt-Repräsentationen 30 bestimmt, indem Punkte der Objekte bestimmt werden. Dazu werden um jedes Pixel 3 Pixel-Ketten von vorher festgelegter Länge betrachtet. Die drei Pixel-Ketten sind die Pixel oberhalb und unterhalb, diagonal und links wie rechts bezogen auf den zu einem Zeitpunkt betrachteten Pixel. Also mindestens jeweils 3 Pixel mit dem Pixel aktueller Position. Eine Bauteil-Kante zeichnet sich dadurch aus, dass Farbe und Helligkeit sich sprunghaft innerhalb der Pixel-Kette ändern. Wenn sich also beispielshaft die Farbe und Helligkeit der Pixel unterhalb des Pixels aktueller Position gegenüber den Pixeln oberhalb unterscheiden, zeigt der Pixel aktueller Position eine Kante an. Das gleiche gilt diagonal und links nach rechts. Der Scan findet von links nach rechts und von oben nach unten statt.

Eine Bauteil-Ecke zeichnet sich dadurch aus, dass Farbe und Helligkeit sich sprunghaft innerhalb zweier Pixel-Ketten ändern.

Da Kanten und Ecken senkrecht, waagrecht oder diagonal zur Scan-Richtung vorliegen können, werden diese drei Pixel-Ketten betrachtet. Darüber hinaus gibt es verschiedene Kriterien wie Verläufe innerhalb der Pixel-Ketten, die abhängig von Helligkeits-Verhältnisse und Oberflächenbeschaffenheit der Objekte herangezogen werden. Beispielsweise zeichnet sich eine Kante auch dadurch aus, dass die Steigung der Färb- und Helligkeits-Änderung der Pixel-Kette oben von der Steigung unten abweicht, so auch waagrecht und diagonal. Dementsprechend gibt es je nach Lichtverhältnissen unterschiedliche Vorschriften, die zum Zwecke haben, die für die Lichtverhältnisse jeweils günstigen Eigenschaften auszuwerten. In einem darauffolgenden Block 60 wird die am höchsten priorisierte Referenz-Repräsentation 34 mit dem Bild abgeglichen, so dass eine Erkennung der Positionierung des oder der Objekte in dem Bild erkannt werden können. Die Referenz-Repräsentation wird zunächst auf die wahrscheinlichste Position gelegt, z. B. die Mitte des Behälters. Die Referenz-Präsentation 34 wird dann kreisförmig zum Rand hin verschoben, und zwar in der Weise, das um die halbe Breite vor und zurück sowie links und rechts verschoben wird, um erneut zu vergleichen. Wenn nach Prüfen der gesamten Ebene keine Übereinstimmung, z. B. im Falle der Behälter ist bis auf wenige Bauteile leer, erfolgt die weitere Suche mit einer Referenz-Repräsentation 34 von niedrigerer Priorität und deren favorisierter Position im Behälter.

Zur Bestimmung der Lage und Erkennen des Objektes in einem bekannten Abstand zur Kamera geschieht nach festgelegter Reihenfolge. Zunächst wird aus dem Draht-Model eine Repräsentation anhand der priorisierten Winkel und Skalierung errechnet. Diese Repräsentation wird über das Bild bewegt. Ist nach einer bestimmten Zahl von Versuchen keine Übereinstimmung gefunden, wird in Block 60 der Vorgang mit einer neuen Repräsentation 34 mit niedrigerer Priorität wiederholt.

Handelt es sich um ein Objekt, dessen Abstand nicht genau bekannt ist, wird Vorgang mit einer anderen Skalierung wiederholt. Und erst, wenn für keine der Skalierungen eine Übereinstimmung gefunden wurde, wird der Vorgang mit Repräsentation 34 einer niedrigeren Priorität wiederholt. Auf diese Weise wird schließlich jede mögliche Objekt-Lage ermittelt, bis der Objekt-Behälter leer ist.

Wenn sich nur noch wenige Objekte im Behälter befinden oder die Objekte sich in einer sehr unwahrscheinlichen Lage befinden, ähnlich einer Münze, die auf dem Rand steht, steigt die Such-Zeit bis zum Finden einer Übereinstimmung, da mehrere Durchläufe mit jeweils abnehmender Priorität der Repräsentation 34 stattfinden. Somit ist es ein Vorteil für die Verarbeitungszeit, die Such-Zeit als Kriterium heran zu ziehen, um zu signalisieren, wann der Behälter gegen einen gefüllten ausgetauscht werden soll. Bevorzugt wird dies durchgeführt, noch bevor der Behälter leer ist, um Forderung nach durchgängiger 100 % Verarbeitung der Objekte in der Produktion.

In einem Block 64 wird die Lage des jeweiligen Objektes durch Abgleich der am besten passenden Referenz-Repräsentation 34 bestimmt. Die Repräsentation ist als Punkte-Konstellation mit für jeden Punkt gegebenem Fang-Radius definiert. Eine Verschiebung, Abweichung, der Bild-Punkte zu den Draht-Model-Punkten, wird als Vektor-Summe ermittelt. Die resultierende Vektor-Summe, zeigt in Richtung der Verschiebung. Um eine optimale Übereinstimmung zu finden, wird die Repräsentation entgegen dieser Richtung verschoben.

Bei bester Übereinstimmung ist auch der Betrag des Vektors am geringsten. Da aber auch eine rotatorische Abweichung vorliegen kann, wird Vektor-Summe aus den X-Komponenten der Abweichungs-Vektoren und den Y-Komponenten berechnet. Legt man diese Vektor-Summe in den Schwerpunkt der Referenz-Repräsentation und berechnet den Winkel zur Senkrechten, dieser zeigt die Rotations-Richtung der Abweichung und damit die Winkel-Abweichung. Eine entgegen gesetzte Winkel-Korrektur bringt die Referenz-Repräsentation in verbesserter Positionierung zur Objekt-Repräsentation.

In einem weiteren Verfahrensschritt können Parameter zur Ansteuerung eines Roboterarms zum Greifen des jeweiligen Objektes berechnet werden. Mit Hilfe der Parameter der Orientierung und Positionierung des Roboterarms kann dieser nach Greifen des Objektes so angesteuert werden, dass er das gegriffene Objekt in einer gewünschten räumlichen Orientierung einem nächsten Arbeitsschritt zuführt. Dabei müssen Orientierung beim Greifen und Orientierung für den nächsten Arbeitsschritt vorher nicht übereinstimmen.

In FIG. 8 ist ein Verfahren in einer zweiten bevorzugten Ausführungsform dargestellt. In einem Block 40a wird von mehreren Objekten, die Platinen-Bausteine darstellen, jeweils eigens ein Drahtgittermodell erstellt. In den Drahtgittermodellen werden die Punkte an den Eckpunkten der Modelle und Punkte in der Mitte von Kanten ausgewählt, woraus jeweils eine Punktwolke entsteht. In einem Block 46a wird für jedes der Drahtgittermodelle der verschiedenen Objekte eine Anzahl, insbesondere eine Vielzahl, von zweidimensionalen Projektionen der Punktwolke erstellt, wobei jede dieser Projektionen eine Referenz-Repräsentation 34 des Objektes 2 ist. Die jeweilige Projektion umfasst dabei sowohl eine dreidimensionale Rotation als auch eine Skalierung.

Dabei werden die einzelnen Übereinstimmungen entweder seriell, also mit einem Prozessor, oder parallel mit einer GPU, also für jedes Objekt mit einem eigenen GPU-Kern, ermittelt.

In einem darauffolgenden Block 52a werden die Referenz-Repräsentationen 34 nach ihrer Wahrscheinlichkeit, einer tatsächlichen räumlichen Lage der Objekte zu entsprechen, priorisiert. Räumliche Lagen, die aufgrund der Geometrie des Objektes wahrscheinlicher sind, erhalten eine höhere Priorisierung als Lagen, die selten Vorkommen.

In einem darauffolgenden Block 56a wird eine Platine mit aufgesetzten Bauteilen optisch mit einer stationären Kamera erfasst. In dem Bild werden Objekt-Repräsentationen 30 bestimmt, indem Punkte der Objekte bestimmt werden.

In einem darauffolgenden Block 60a wird die am höchsten priorisierte Referenz-Repräsentation 34 mit dem Bild abgeglichen, so dass eine Erkennung der Positionierung des oder der Objekte und die Art des Objektes in dem Bild erkannt werden können.

Sofern nicht alle Objekte als erkannt gelten, werden in Block 60a weitere Repräsentationen 34 mit niedriger Priorität verwendet.

In einem Block 64a wird die Lage des jeweiligen Objektes durch Abgleich der am besten passenden Referenz-Repräsentation 34 bestimmt. Auf diese Weise kann überprüft werden, ob alle Bausteine auf der Platine ordnungsgemäß in der gewünschten Orientierung angebracht sind. Und es liegen Orientierungs-Daten vor, die beschreiben in welcher Orientierung, die nicht ordnungsgemäß angebrachten Objekte liegen, um diese im nächsten Schritt zu korrigieren.

Bezugszeichenliste

2 Objekt

4 Oberseite

6 Längsseite

8 Vorsprüngen

10 Stirnseite

12 Stirnseite

16 vertikale Achse

20 Punktmenge

24 Punkt

28 Punkt

30 Objekt-Repräsentation

34 Referenz-Repräsentation

40 Block

46 Block

52 Block

56 Block

60 Block

64 Block

40a Block

46a Block

52a Block

56a Block

60a Block

64a Block

Claims

Patentansprüche

1. Computerimplementiertes Verfahren zur Bestimmung der räumlichen Lage eines Objektes (2), wobei wenigstens ein Objekt (2) mittels wenigstens einer optischen Erfassungseinheit erfasst wird, wobei

- zu einer Anzahl von zu erkennenden Objekten (2) jeweils wenigstens eine Referenz-Repräsentation (34) hinterlegt wird,

- zu dem jeweils erfassten Objekt (2) eine Objekt-Repräsentation (30) erzeugt wird,

- die Objekt-Repräsentation (30) mit wenigstens einer Referenz-Repräsentation (34) abgeglichen wird, wobei

- zur Erstellung der Anzahl von Objekt-Repräsentationen (30) an dem Objekt Eck- und/oder Kantenpunkte bestimmt werden,

- die Referenz-Repräsentation (34) rechnerisch wenigstens einer dreidimensionalen Transformation unterworfen wird und danach die Punkte auf eine zweidimensionale Ebene projiziert werden,

- ein Abgleich der projizierten Punkte (24) und Punkte (28) der Objekt-Repräsentation (30) erfolgt, und wobei die Lage des Objekts (2) als erkannt gilt, sofern eine der Wert Erkennungsfunktion der Punkte (24, 28) der Objekt-Repräsentation (30) und wenigstens einer Referenz-Repräsentation (34) in einem vorgegebenen Schwellenbereich liegt.

2. Verfahren nach Anspruch 1, wobei die jeweilige Transformation eine Drehung und/oder Skalierung umfasst.

3. Verfahren nach Anspruch 1 oder 2, wobei die Erkennungsfunktion die Summe von Funktionen der Differenzen der Punkte (24) der Referenz-Repräsentation und der Punkte (28) der Objekt-Repräsentation umfasst.

4. Verfahren nach einem der Ansprüche 1 bis 3, wobei für mögliche Objektlagen eine Priorisierung durchgeführt wird, und wobei zur Objekterkennung der Vergleich in der Reihenfolge der Priorisierung durchgeführt wird.

5. Verfahren nach einem der Ansprüche 1 bis 4, wobei die wenigstens eine Referenz-Repräsentation (34) über das Kamerabild verschoben wird.

6. Verfahren nach einem der Ansprüche 1 bis 5, wobei die Referenz-Repräsentation (34) unmittelbar vor dem Abgleich mit Hilfe der wenigstens einen Transformation generiert wird.

7. Verfahren nach einem der Ansprüche 1 bis 6, wobei die einzelnen Seiten des Objektes (2) mit verschiedenen Farben ausgestattet sind, und wobei allein diejenigen Objekt-Repräsentationen (30) mit der Referenz-Repräsentation (34) verglichen werden, die gemäß der Farbe auch die priorisierte Seite des Objektes (2) zeigt.

8. Verfahren nach einem der Ansprüche 1 bis 7, wobei ausgeschlossen wird, dass Objekt-Repräsentationen (30) innerhalb der Kanten der Referenz-Repräsentation (34) zu liegen kommen.

9. Verfahren nach einem der Ansprüche 1 bis 8, wobei eine vorher abgespeicherte Referenz-Repräsentation (34) für den Abgleich verwendet wird.

10. Verfahren nach einem der Ansprüche 1 bis 9, wobei mit Hilfe der erkannten Lage des wenigstens eines Objektes (2) Parameter zur Ansteuerung eines Roboterarm zum Greifen des Objektes (29) generiert werden.

11. Verfahren nach einem der Ansprüche 1 bis 10, wobei mit Hilfe der erkannten Lage Parameter zur Charakterisierung der Objektlage wenigstens eines Objektes (2) generiert werden.

12. System zur Bestimmung der räumlichen Lage eines Objektes (2), umfassend wenigstens eine optische Recheneinheit und eine Kontrolleinheit zur Durchführung eines Verfahrens nach einem der vorherigen Ansprüche.