Verfahren zur sicheren automatischen Nachführung eines Endoskops und Verfolgung (Tracking) eines chirurgischen Instrumentes mit einem elektrisch angetriebenen und gesteuerten Endoskopführungs- system (EFS) für die minimal invasive Chirurgie
Die Erfindung betrifft ein Verfahren zur sicheren automatischen Nachführung eines Endoskops und Verfolgung (Tracking) eines chirurgischen Instrumentes mit einem elektrisch angetriebenen und gesteuerten Endoskopführungssystem (EFS) für die minimal invasive Chirurgie.
Bei minimal invasiven Operationen orientiert sich der Chirurg an einem Monitorbild (Original-Monitor) . Ein Endoskop mit Kamera und die zur Operation notwendigen Instrumente werden durch Tro- kare in die Körperhöhle des Patienten eingeführt.
Zum gegenwärtigen Stand der Technik sind sowohl das Endoskop als auch die Kamera häufig noch manuell geführt. Der Chirurg, der die Instrumente führt, weist einen Assistenten an, das Endoskop mit Kamera so nachzuführen, daß das Instrument im Bild sichtbar bleibt. Die Vorteile dieser Vorgehensweise bestehen darin, daß der das Endoskop führende Assistent gefährliche Situationen vermeidet, Fehler erkennt, mit dem Chirurgen kommuniziert und das Endoskop nur dann nachführt, wenn es notwendig ist. Nachteilig ist ein erhöhter Personalaufwand gegenüber konventionellen Operationen und das unvermeidliche Zittern des Assistenten.
Zur Vermeidung der genannten Nachteile wurden Systeme eingeführt, die das Endoskop automatisch führen. Ein solches Endoskopführungssystem zum Führen einer endoskopischen Kameraeinheit ist elektrisch angetrieben und kann an jeden Operationstisch angebracht werden. Zur Fernbedienung dient eine Bedienkomponente, meist ein Joystick, der in der Regel am Arbeitsinstrument befestigt wird, oder auch eine Spracheingabe. Das eingeführte Endoskop wie auch separat eingeführte Instrumente haben jeweils hinsichtlich der Bewegung einen invarianten Punkt, die Trokarein-
stichstelle, der auf oder in der Körperwand des Patienten bestehen muss, damit diese Geräte geschwenkt und geneigt werden können, ohne den Patienten dabei mehr als mit dem Durchstich zu verletzen. Die Kamera des Endoskopführungssystems ist dabei so geführt und montiert, daß die untere Bildkante parallel zur Patientenauflage verläuft und das Bild nicht auf dem Kopf zu stehen kommt (siehe z. B. DE 196 09 034) . Eine Verdrehung der Kamera ist wohl möglich, erschwert aber die räumliche Orientierung.
Ein in den Körper des Patienten ragendes Endoskop eines solchen Endoskopführungssystems verfügt über mehrere Freiheitsgrade. Beispielsweise hat das EFS in DE 196 09 034 vier Freiheitsgrade der Bewegung, und zwar um eine erste Achse senkrecht zum Operationstisch durch die Einstichstelle am Körper, um eine zweite Achse senkrecht zu der ersten und senkrecht zur Einstichrichtung, entlang einer dritten Achse, der Trokarachse, und um diese letztere Achse. Die ersten drei Freiheitsgrade sind über Endschalter begrenzt. Mit der Bedienkomponente, z. B. am Instrumentengriff des vom Chirurgen bedienten Instruments, wird die Endo- skopkamera in ihrer Blickrichtung gelenkt. Jeder der vier Freiheitsgrade kann so mit sicherheitsbegrenzter Geschwindigkeit verändert werden.
Auf der Basis einer derart vorhandenen Endoskopsteuerung ist ein automatisches Trackingsystem installierbar. Ein solches Steuerungssystem ist aus der US 5,820,545 bekannt. Die darin ins Auge gefasste Instrumentenspitze wird bei jeder Bewegung ständig nachgefahren, was Unruhe für den Betrachter bedeutet. Hierzu ist eine Elektronik notwendig, die, da speziell angefertigt, einen erheblichen wirtschaftlichen Aufwand bedeutet. Soll die dritte Dimension erfasst werden, muss dazu die entsprechende 3-D-Kame- raeinrichtung vorgesehen werden, was den apparativen Aufwand erhöht. Eine Fehlerbehandlung, wie sie aufgrund von Reflexionen oder wechselnder Beleuchtung z.B. notwendig wird, ist nicht vorgesehen.
Bei dem Nachfahrsystem gemäß der US 5,836,869 wird der Bildausschnitt der aktuellen Instrumentenspitze nachgefahren. Der operierende Chirurg bekommt zwei verschiedene Bilder zu sehen. Es wird eine Färb-, Geometrie- oder Helligkeitskodierung des Instruments und eine Positionserkennung über Magnetsonden am Arbeitsinstrument beschrieben. Es können zwei Bilder betrachtet werden, nämlich der Zoom einer Situation und die Übersicht. Das Tracking wird auf Instrumente oder farb-/geometriemarkierte Organe bezogen. Mehrfarbige Markierungen zur Umschaltung der Trak- kingziele und zur Erhöhung der Sicherheit durch Redundanz werden erwähnt. Stellglied ist jeweils der Kamerazoom bzw. die Position der CCD-Chips in der Kamera oder eine elektronisch realisierte Bildauswahl auf dem Monitor. Das System benutzt durchweg Spezi- alkameras .
Bei allen verwendeten Verfahren stehen meist mehr Freiheitsgrade zur Verfügung als zur Positionierung des EFS notwendig sind, um die Instrumentenspitze auf die gewünschte Sollposition zu bringen. Diese Freiheitsgrade werden dazu verwendet, die auszuführenden Bewegungen zu minimieren. Ein mögliches Verfahren ist die Ermittlung optimaler Stellgrößen unter Verwendung einer Jacobi- Matrix, wobei auch Stellrestriktionen einbezogen werden können (US 5,887,121) .
Bei allen genannten Verfahren gehen die Vorteile verloren, die die manuelle Führung durch einen Assistenten bietet. Das Nachführverhalten ist unruhig, weil die Systeme versuchen, einen vorgegebenen Punkt auf dem Monitor genau zu erreichen und auch bei kleinen Abweichungen, die z.B. durch Bewegungen des Instruments verursacht werden, sofort das Endoskop nachführen. Die Systeme sind kaum in der Lage, auftretende Fehler automatisch zu detektieren. Es findet nur eine sehr einfache unidirek- tionale Kommunikation vom Chirurgen zum EFS statt. Der Chirurg erhält keine Hinweise über mögliche Fehlerursachen.
Der Erfindung liegt die Aufgabe zugrunde, ein schnelles, fehlertolerantes und kostengünstiges Verfahren für das automatische
Verfolgen einer Instrumentenspitze mit einem sparsam bewegten
Endoskop bereitzustellen und damit den operierenden Chirurgen von der Endoskopführung zu entlasten.
Die Erfindung wird durch ein Verfahren mit den Merkmalen des Anspruchs 1 gelöst und hat zum Ziel, die Vorteile einer manuellen Führung des Endoskops auch bei einer automatischen Nachführung beizubehalten.
Das zugrunde liegende Sicherheitskonzept besteht aus mehreren Stufen:
A. der Fehlertoleranzbearbeitung,
B. der intuitiven Bedienung und
C. der Souveränität.
Der Bildverarbeitungs- und Endoskopsteuerungsteil ist von dem Original-Monitor des operierenden Chirurgen strikt getrennt. Fehler in diesen Teilen beeinflussen nicht die von ihm verfolgten Sequenzen. Das Erkennen der Instrumentenspitze und die Steuerung des Endoskops mit seinen Achsen und der Zoomsteuerung wird als Einheit behandelt, da das hiermit realisierte Sicherheitskonzept Fehler sowohl bei der Bilderkennung als auch bei der Belegung der Stellgrößen mit hoher Zuverlässigkeit feststellen kann. Feststellbare Fehlerzustände sind:
Mehrfacherkennung des Instrumentes aufgrund von Reflexionen, keine Erkennung des Instrumentes wegen Verschmutzung, zeitlich stark verzögerte Erkennung des Instruments derart, daß die Abtastrate der Endoskopregelung wegen zu geringer Leistung des Rechners nicht mehr eingehalten werden kann, unrealistisch sprunghafte Ortsänderung des Instruments wegen begrenzter Drehzahl der Stellmotoren und eine zu starke, sicherheitskritische Annäherung der Optik an das Instrument oder an ein Organ.
Die Endoskopeinstellung wird nur verändert, wenn die Instrumentenspitze einen bestimmten Rahmen im Bildzentrum des O-Monitors verlässt (zulässiger Bereich). Dadurch bleibt das Bild für den
Chirurgen ruhig, wenn er das Instrument innerhalb dieses Rahmens in der Nähe des Bildzentrums bewegt.
Die Instrumentenspitze ist durch Form, Farbe oder auch nur durch ihre charakteristische Form markiert, um eine schnelle Erkennung zu erreichen. Dennoch ist nicht zu vermeiden, daß sich bei unterschiedlichen Instrumenten die Merkmale ändern. Deswegen wird eine Online-Adaption der charakteristischen Eigenschaften der Markierung mit neuronalen oder statistischen Lernverfahren hier zu einer sicheren und flexiblen Instrumentenerkennung führen.
Um all diese Verfahrensschritte durchführen zu können, reichen Standardkomponenten als Rechner, Betriebssystem und Kameras vollständig aus. Das System kommt zur Beobachtung mit einer einzigen Kamera, einer 2-D-Kamera aus. Es führt das Tracking anhand von zweidimensionalen Bildinformationen durch. Bei Verwendung einer 3-D-Kamera reicht die Nutzung eines Videokanals daher aus (Anspruch 9) , wodurch der Hardware-Aufwand zur Bildverarbeitung reduziert wird.
Die Instrumentenspitze soll in der Bildmitte des O-Monitors gehalten werden. Daher bleiben Bewegungen senkrecht zur Bildebene unberücksichtigt. Sollen sie dennoch erkannt werden, für eine Zoom-Steuerung etwa oder für eine Kamerabewegung senkrecht zur Bildebene, müssen weitere Maßnahmen ergriffen werden. Eine ist ein weiterer Sensor am Trokar des Instruments, der die Eintauchtiefe misst (Anspruch 7), damit reduziert sich die bei der 3-D- Aufnahme notwendige zweikanalige Bildverarbeitung auf einen Kanal wie bei der 2-D-Aufnahme . Eine weitere ist, aus der perspektivischen Verzerrung der parallelen Kanten des Instruments den Abstand zwischen Endoskop und Instrumentenspitze grob zu berechnen. Das setzt voraus, daß die Brennweite der Kamera sowie die Breiten- und Längenmaße des Instruments bekannt sind.
Oberste Priorität hat das Eingreifen des operierenden Chirurgen, der in die Endoskopsteuerung jederzeit mit höchster Priorität eingreifen und das Tracking abbrechen kann.
An Einstellungsarbeit geht vor der Operation während der Funktionsprüfung die konzentrale Einteilung des Monitorbereichs voraus. Es gibt drei Bereiche auf dem O-Monitor: den gesamten Bildschirm, den für die Instrumente zulässigen Aufenthaltsbereich und den Mittelpunktsbereich. Die Endoskopein- stellung wird automatisch nur verändert, wenn die Instrumentenspitze den zulässigen Bereich verlässt (Anspruch 2), wodurch das Bild angenehm ruhig bleibt. Um das ausführen zu können, wird der Bereich der Instrumentenspitze im Rechner abgebildet, ein zur Identifizierung ausreichendes Modell davon erstellt (Anspruch 3) . Eine Methode, das zu tun, ist in Anspruch 4 erwähnt und besteht aus der Erzeugung eines Gradientenbilds, Segmentierung der Objektkanten und Ermittlung der dritten Dimension durch Berechnung der Kantengeraden mittels linearer Regression. Dabei kann das Gradientenbild durch ein Sobel-Filter erzeugt sein (Anspruch 5) .
Um eine hohe Qualität der Sicherheit zu erreichen, ist genügende Redundanz einzurichten. Die grundsätzliche Erzeugung der MultiSensor-Umgebung durch Positionssensoren und Bildverarbeitung kann durch weitere Positionssensoren am Führungssystem des Instruments (Anspruch 6) oder durch die Erfassung der Eintauchtiefe am Trokar (Anspruch 7) ergänzt werden.
Der Vorteil der Redundanz besteht darin, daß die Bildverarbeitung und die redundanten Sensoren unterschiedliche Vor- und Nachteile aufweisen. Beispielsweise ist die Bildverarbeitung empfindlich gegenüber einer Verdeckung der Instrumentenspitze und Verschmutzungen der Optik. Positionssensoren am Instrumen- tenführungssystem können je nach verwendetem Messprinzip bei elektromagnetischen Störungen im Operationssaal fehlerhafte Informationen liefern, Ungenauigkeiten aufgrund unterschiedlicher Länge der verwendeten Instrumente oder Ungenauigkeiten bei der Ermittlung der Bezugs-Koordinatensysteme zwischen Endoskop- und Instrumentenführung aufweisen, oder sie können während der Operation ausfallen. Existieren nun sowohl Bildverarbeitung als
- - auch Positionssensoren für die Instrumentenführung, können die Ergebnisse verglichen und auf Konsistenz geprüft werden. Aufgrund der Entwicklung der Fehler kann in vielen Fällen darauf geschlossen werden, welches der Sensorsignale die gegenwärtige Situation fehlerfrei wiedergibt.
Die Verwendung der Positionssensoren am Instrumentenschaft oder am Instrumentenführungssystem kann sogar dazu führen, daß die Bildverarbeitung vollständig ersetzt wird.
Der Grad der Redundanz der Freiheitsgrade des Endoskopführungs- systems wird durch die Anzahl der überschüssigen Achsen bestimmt, die nicht direkt für die Zentrierung des Objekts im 0- Monitorbild notwendig sind. Dies können sowohl extrakorporale Achsen des EFS sein - Drehung um die Vertikalachse, um die Horizontalachse und Drehung um als auch Translation längs der Trokarachse - aber auch weitere Freiheitsgrade, die sich etwa durch den Einsatz von Endoskopen mit flexiblen, schwenkbaren Distalbe- reichen ergeben. Damit bestehen sog. intrakorporale Achsen bzw. Freiheitsgrade (Anspruch 8).
Dieses Verfahrenskonzept ergibt eine sehr hohe Sicherheit und große Fehlertoleranz. Das Verfahren arbeitet in einfachen Erkennungssituationen mit einer erhöhten Verarbeitungsgeschwindigkeit insbesondere in der Bildverarbeitung und ist in der Lage, bei komplizierten Erkennungssituationen, wie ungünstige Beleuchtung, Ähnlichkeiten zwischen Instrumentenspitzen und Umgebung, mit einer reduzierten Geschwindigkeit nachzufahren. Die Nachführung des Endoskops bleibt mindestens so schnell, daß keine Ungeduld beim operierenden Chirurgen provoziert wird.
Da das Endoskop durch das Führungssystem sparsam bewegt wird, besteht ein ruhiges und doch wahres Bild auf dem O-Monitor, das den Chirurgen nicht unnötig ablenkt. Eine weitere Entlastung ergibt sich.
Das Verfahren erlaubt optional die Integration zusätzlicher Sen-
sorinformationen wie der von Magnetsonden am Führungssystem des Arbeitsinstruments, Messung der Eintauchtiefe am Trokar, um bei der Multi-Sensor-Umgebung den temporären Ausfall einzelner Sensoren durch Verschmutzung der Instrumentenspitze bei optischer Messung zu kompensieren, die Plausibilität der ausgewerteten Sensorinformationen zu überprüfen und damit schließlich die Sicherheit zu erhöhen.
Wird das Instrument von einem _nstrumenten-Führungs_system, IFS, geführt, sei es hand- oder maschinengeführt, so kommt auch über dieses Information an das EFS.
Das System ist aus handelsüblichen Baukomponenten bzw. Teilsystemen aufgebaut und kann daher wirtschaftlich akzeptabel realisiert werden.
Das Verfahren wird im folgenden anhand der Zeichnung in seiner
Struktur näher erläutert. Es zeigen:
Figur 1 Hierarchie des Verfahrens,
Figur 2 Systemstruktur
Figur 3 Zustandsgraph des automatischen Nachführens,
Figur 4 Bildbereiche auf dem Original-Monitor,
Figur 5 Abbildung der Instrumentengeometrie und
Figur 6 Endoskopführungssystem schematisch.
In medizintechnischen Geräten ist der Sicherheitsstandard sehr hoch angesetzt. Deshalb ist der Kern der automatischen Endoskop- nachführung das fehlertolerante Verfahren, das mit mehrfacher Redundanz arbeitet und damit die geforderte Sicherheit gewährleistet. Weitere Sicherheit entsteht aus der Entlastung des operierenden Chirurgen, in dem er, wo möglich, von technischen Handgriffen befreit wird. Unterschiedliche Grade an automatischer Trackingunterstützung bieten Unterstützung nach Bedarf. Das bedeutet, daß der Arzt die für die Operation notwendigen Instrumente intuitiv und souverän bedienen kann. Dafür sorgt die ruhige Bahnführung, die Geschwindigkeitsbegrenzung bei der Nachführung und die sprachliche Ausgabe, durch die der Arzt über das
- -
Ausgabemedium: MMI-Monitor, LCD-Display oder Sprachausgabe über Fehler und kritische Zustande des Systems, wie verschmutztes Endoskop, informiert wird.
Damit wird im Vergleich zu vorhandenen Systemen die Sicherheit und Akzeptanz wesentlich erhöht, weil der Chirurg oder ein Assistent die Ursachen für die Fehlfunktion gezielt beseitigen kann, z.B. durch Reinigen der Optik oder durch Rückführung des Instruments in den Bildbereich. Außerdem werden so unerwartete Reaktionen des Nachführsystems deutlich reduziert.
Souveränität heißt weiterhin: der Chirurg benutzt den vom Nach- fuhrungssystem unabhängigen Monitor, den Original-Monitor, und hat die hierarchische Möglichkeit, das Nachfuhrungssystem jederzeit abzuschalten. In Figur 1 ist diese strukturierte Forderung dargestellt und zeigt die Hierarchie in ihrem Aufbau von der zentralen Forderung der Sicherheit ausgehend.
Die Fehlertoleranz wird durch eine oder mehrere Maßnahmen erreicht :
Objekterkennung und Steuerung als Einheit, mehrfache Behandlung möglicher Fehlerzustande, sowohl durch einzelne Komponenten der Bildverarbeitung und der Steuerung als auch durch eine übergeordnete Uberwachungseinheit, Multisensor-Konzept , adaptive Merkmalsanpassung und 3-D-Rekonstruktion.
Der Vorteil der einheitlichen Behandlung der Objekterkennung und Steuerung liegt darin, daß so Rückschlüsse auf Fehlerursachen getroffen werden können. Sind beispielsweise die letzten Stellaktionen bekannt, kann mit größerer Genauigkeit auf die wahrscheinlichen Positionen der Instrumentenmarkierung geschlossen und so eine höhere Erkennungssicherheit erzielt werden. Eine Ermittlung der Fehlerursache hat neben der verbesserten Kommunikation mit dem Chirurgen den Vorteil, adäquate Systemreaktionen ermitteln zu können.
Eine Systemkonfiguration des Endoskopführungssystems ist beispielhaft durch die Systemstruktur in Figur 2 schematisch dargestellt und besteht aus folgenden, über Kabel verbundenen Blökken: - dem Basis-EFS mit vier Freiheitsgraden, links/rechts, oben/unten, drehen und rein/raus einschließlich der elektronischen Ansteuerung und den Endschaltern auf den entsprechenden Achsen der Freiheitsgrade, _ dem 2-D-Videoendoskop mit Video-Ausgang (Rot/Gelb/Blau-Ausgang, RGB) , Original-Monitor und Lichtquelle,
~~ dem Rechner (PC) mit MMI-Monitor für die Schnittstelle:
Mensch-Maschine (MMI) und der Digital-Ausgabe-Karte zur Ansteuerung der Logik-Schnittstelle (TTL) ,
~~ der Zusatzkomponenten zur Bildvorverarbeitung, sog. Framegrab- ber,
~ der Bedienschnittstelle in Form eines Handschalters, dem Joystick für die manuelle Bedienung.
Die Nachführungssteuerung, Trackingsteuerung, besteht aus den
Komponenten:
Bildverarbeitung,
Bahnsteuerung und
Überwachung.
Sie verarbeitet die Eingangsgrößen:
BI = Binary Input „Tracking ein",
BI = Binary Input „Tracking stop" und das Videosignal mit drei Kanälen (RGB) und Synchronisation.
Die Ausgangsgrößen sind:
~~ 2 x 4 x BO (Binary Output) zur Veränderung der Achsenposition über die Ansteuerung einer zweiten digitalen Schnittstelle, ~~ Status- und Fehlermeldungen.
Die Hauptaufgabe der automatischen Tracking-Funktion besteht darin, die aktuell benötigte Instrumentenspitze in dem Mittelpunktsbereich zu halten (siehe Figur 4). Der dazu notwendige
Steuerungsablauf ist in dem Zustandsgraph gemäß Figur 3 dargestellt. Die Freigabeschaltung für das automatische Tracking wird systemintern veranlasst.
Das automatische Tracking wird hier vom operierenden Chirurgen über den Ringschalter an der Bedieneinheit freigegeben (siehe Figur 6) und bleibt solange aktiv, bis es durch Drücken der Stop- taste oder durch Bedienung des Joysticks oder automatisch gestoppt wird.
Ein automatischer Stopp des Tracking wird vorgenommen:
~~ wenn kein Instrument im Bild erkannt wird, sei es, weil nicht vorhanden oder weil verschmutzt,
_ wenn aufgrund sicherheitskritischer, zu geringer Entfernung zum Instrument das Bild unscharf wird,
~~ wenn mehrere Instrumente erkannt werden,
~" wenn die Erkennung des Instruments nicht innerhalb der geforderten Reaktionszeit erfolgt,
"~ wenn kein Videosignal anliegt,
_ wenn die Bildverarbeitung, Bahnsteuerung, Überwachung oder die Ansteuerung elektronische oder Programmfehler erkennt. Sämtliche Fehler werden auf den MMI-Monitor eingeblendet.
Nach einem Stop kann das Tracking wieder freigegeben werden. Das automatische Tracking arbeitet dabei mit eingeschränkten Stellgeschwindigkeiten bis zu 10 cm/sec bzw. 30°/sec, die weiterhin applikations- (Bauch-, Lungen-, Herzchirurgie beispielsweise) und individuumabhängig eingeschränkt bzw. angepaßt werden können, so daß der Chirurg auf unerwünschte Situationen rechtzeitig reagieren kann. Darüber hinaus besteht eine Stellbegrenzung für die Achsenpositionen, die ein Kippen und Schwenken in Grenzen hält, das translatorische Bewegen entlang der Trokarachse begrenzt und eine Volldrehung um die Schaftachse nicht zuläßt (siehe Figur 7).
Aus dem Kamerabild auf dem O-Monitor (Figur 4) wird die eventuell zusätzlich markierte Instrumentenspitze über ihr im Rechner abgelegtes Abbild automatisch erkannt und ihre mittlere Position durch die x-Position und y-Position im zweidimensionalen Kamerabild, Erkennungssicherheit, Größe der identifizierten Instrumentenspitze und weiteren Informationen zur Fehlererkennung an die Steuerung weitergegeben. Die Erkennung der Instrumentenspitze arbeitet selbständig und ist unabhängig von der Freigabe des Tracking. Die Bildverarbeitung (Figur 2) erkennt auftretende Fehler, wie kein Instrument im Bild, mehrere Instrumente im Bild, und stoppt in diesen Fällen das automatische Tracking.
Beim Verlassen des zulässigen Bereichs (Figur 4) wird das automatische Tracking die Position des Endoskops so verändern, bis sich die Instrumentenspitze wieder im Mittelpunktsbereich befindet. Diese Aufgabe wird durch die Bahnsteuerung (siehe Figur 2) gelöst, die die gemessene Position der Instrumentenspitze im Kamerabild kontinuierlich mit verarbeitet.
Nach dem Erreichen des kleineren Bereichs um den Bildmittelpunkt werden solange keine weiteren Stellhandlungen ausgelöst, bis der vorgegebene größere zulässige Bereich (Figur 4) wieder verlassen wird. Durch diese Zurückhaltung in der Bewegung durch bereichsweise Unterdrückung derselben wird ein ruhiges Bild auf dem 0- Monitor erzeugt.
Der Status des automatischen Trackings und eventuelle Fehlermeldungen werden auf dem MMI-Monitor eingeblendet bzw. angezeigt, so daß kein Eingriff in die Bildübertragung zwischen Kamera und O-Monitor für das Kamerabild erfolgen muss.
Um Tiefenerkennung zu erhalten, ist die 3-D-Positionsbestimmung gebräuchlich, aber wegen zwei notwendigen Kameras, deren Blickachsen unter einem vorgegebenen Schielwinkel zueinander stehen, ein Geräteaufwand, der durch die Tiefenerkennung an Hand von 2- D-Bilddaten mit nur einer Kamera in Grenzen kompensiert werden kann. Mit Hilfe der einfachen Strahlensatz-Strahloptik kann der
Zusammenhang zwischen Bild- und Gegenstandsweite genau ermittelt werden:
g= / X B L
mit g: Gegenstandsweite, G: Gegenstandsgröße, B: Bildgröße, f: Brennweite der Endoskoplinse
Die Abschätzung der dritten Dimension gelingt hinreichend genau bei bekannter Brennweite des Endoskops.
Die wichtigste Aufgabe bei der Tiefenabschätzung ist es, die Größe des Objektes im Bild zu bestimmen. Objekt kann auch eine auf dem Objekt gut zu erkennende Markierung mit scharfen Kanten bedeuten. Die einfachste Methode der Erkennung besteht darin, den Durchmesser der segmentierten Markierungsregion zu bestimmen. Dies erweist sich als ungenau, da es durch die unterschiedlichen Orientierungen des Endoskops und durch die Eigenschaften der Zentralprojektion zu Verformungen kommt, die keine genaue Bestimmung der Objektbreite zulassen.
Ein besseres Verfahren zur Ermittlung der Instrumentenbreite an der Spitze segmentiert in einem ersten Schritt die Kanten des Objekts und bestimmt daraufhin den Abstand zum errechneten Schwerpunkt. Dies hat den Vorteil, daß unabhängig von der Ausrichtung und durch die Projektion weitgehend unbeeinflußt die Breite des Objektes bestimmt wird.
Die Detektion der Objektkanten erfolgt in mehreren Schritten: - Zuerst wird ein Filter, zum Beispiel ein 3x3-Sobel-Filter, auf das transformierte Graustufenbild angewandt, um anschließend einen Kantenverfolgungsalgorithmus zu starten.
Die gefundenen Kanten besitzen jedoch den Nachteil, daß ihre Breite stark variieren kann. Verlangt wird eine dünne Kantenlinie, die durchweg die Breite eines Pixels besitzt, um Abstände
zu den Rändern genauer bestimmen zu können.
Realisiert wird dies, indem die segmentierten Kanten durch Geraden approximiert werden.
Dies gelingt am schnellsten durch eine lineare Regressionsanalyse, bei der die Beziehung zwischen den x- und y-Werten einer Punktemenge in Form eines linearen Modells formuliert werden. So lassen sich die Kanten mathematisch beschreiben, was die Bestimmung der Objektgröße in einem nächsten Schritt ermöglicht.
Dies geschieht entweder über den Abstand zweier paralleler Geraden oder über den Abstand einer Geraden zum Schwerpunkt des Objekts durch Umformen der Geradengleichungen in die Hesse 'sche- Normalenform und Einsetzen des Schwerpunktes. Figur 5 zeigt das Verfahren mit den vier wesentlichen Schritten im Überblick, diese sind:
1. Erzeugung des Gradientenbildes von dem markierten Instrument mit dem Sobel-Filter, dann
2. Segmentierung der Objektkanten, Kantenverfolgung, dann
3. Berechnung der Kantengerade mittels linearer Regression und schließlich
4. die Berechnung des Abstandes : Gerade - Markierungsschwerpunkt .
Es zeigt sich, daß die Genauigkeit der Entfernungsbestimmung im wesentlichen von der Qualität der Kantenextraktion abhängt.