DE19744648A1 - Verfahren und Vorrichtung zur Sekundärbilderzeugung und zur schnellen Suche in digitalen Bilddatenbanken - Google Patents

Verfahren und Vorrichtung zur Sekundärbilderzeugung und zur schnellen Suche in digitalen Bilddatenbanken

Info

Publication number
DE19744648A1
DE19744648A1 DE19744648A DE19744648A DE19744648A1 DE 19744648 A1 DE19744648 A1 DE 19744648A1 DE 19744648 A DE19744648 A DE 19744648A DE 19744648 A DE19744648 A DE 19744648A DE 19744648 A1 DE19744648 A1 DE 19744648A1
Authority
DE
Germany
Prior art keywords
image
color
coefficients
images
resolution
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Ceased
Application number
DE19744648A
Other languages
English (en)
Inventor
Stephan Dipl Ing Volmer
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Original Assignee
Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV filed Critical Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Priority to DE19744648A priority Critical patent/DE19744648A1/de
Publication of DE19744648A1 publication Critical patent/DE19744648A1/de
Ceased legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/5838Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using colour
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/52Scale-space analysis, e.g. wavelet analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Library & Information Science (AREA)
  • Multimedia (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Image Analysis (AREA)
  • Image Processing (AREA)

Description

Die Erfindung bezieht sich auf ein zur digitalen Bild­ verarbeitung bestimmtes Verfahren, bei dem in einer Recheneinheit von einer Bildvorlage mit Hilfe einer Wavelet-Zerlegung ein Sekundärbild erstellt wird, und auf ein zur Suche in einer digitalen Bilddatenbank be­ stimmtes Verfahren, bei dem in einem Sekundärabstands­ rechner ein erstes Sekundärbild einer Bildvorlage mit einer Vielzahl zweiten Bildern zugeordneter zweiter Sekundärbilder verglichen und jeweils ein Ähnlichkeits­ maß zwischen dem ersten und einem zweiten Sekundärbild errechnet wird. Die Erfindung bezieht sich ferner auf eine zur digitalen Bildverarbeitung und/oder zur Suche in digitalen Bilddatenbanken bestimmte Vorrichtung mit einer Recheneinheit zur Wavelet-Zerlegung digitaler Bilder.
Derartige Verfahren werden im Rahmen der digitalen Bildverarbeitung benötigt und werden insbesondere dazu verwandt, um in umfangreichen digitalen Bilddatenbanken aus der Vielzahl gespeicherter Bilder ein bestimmtes herauszusuchen. Meist wird eine Vorlage, beispielsweise in Form einer Skizze, mit einer Vielzahl in einer ent­ fernten Datenbank gespeicherter Bilder verglichen und als Ergebnis der Suche eine Rangfolge in Frage kommen­ der Bilder angeboten. Die für die Suche erforderliche Auswahl erfolgt entweder durch die Zuordnung alphanu­ merischer Attribute oder durch eine digitale Verarbei­ tung der Bildinformation selbst, wodurch andere erzeugt werden, die wesentlich schneller und zuverlässiger ver­ glichen und unterschieden werden können als die Bild­ vorlagen selbst und die trotz ihres kompakteren Formats die für das menschliche Empfinden wesentlichen visuel­ len Merkmale der Bildvorlagen wiedergeben. Schließlich sind Verfahren zum kombinierten Vergleich nach Bild­ attributen und Bildinhalt bekannt. Die Notwendigkeit effizienter Verfahren zur Erzeugung geeigneter Ver­ gleichsbildformen und damit zur schnelleren Bildsuche ergibt sich insbesondere aus dem durch die weltweite Vernetzung möglichen Zugriff auf immer umfangreichere digitale Bilddatenbanken, die heute bereits bei mitt­ lerere Größe Bildmengen von 100 000 und mehr umfassen.
Den auf der Zuordnung von Attributen beruhenden Ver­ fahren zum Wiederauffinden digitaler Bilder mangelt es aufgrund individuell unterschiedlicher Bildeindrücke und Vorkenntnisse des Benutzers an einer ausreichenden Objektivität der Bildauswahl; zudem führt der Umgang mit alphanumerischen Attributen, die sich nicht wie die eigentliche, durch Farben und Helligkeiten ausdrückbare Bildinformation quantitativ miteinander vergleichen lassen, regelmäßig zum fälschlichen Ausschluß des eigentlich gesuchten Bildes. Aufgrund dieser Nachteile ist für den Umgang mit derartigen Systemen eine längere Erfahrung erforderlich.
Die nach der eigentlichen Bildinformation selektieren­ den Suchverfahren arbeiten zwar nach objektiven Krite­ rien, allerdings sind nach dem Gesamteindruck sehr ähn­ liche Bilder im Hinblick auf die Farben und Helligkei­ ten der einzelnen Bildpunkte äußerst verschieden; daher wird kein direkter Bildvergleich vorgenommen, sondern die Bilder werden in Sekundärbilder umwandelt, die we­ sentlich kompakter sind als ihre Vorlagen und dennoch deren ins Auge springenden visuellen Merkmale deut­ licher wiedergeben.
Eine zur Sekundärbilderzeugung geeignete Methode ist das als Wavelet-Zerlegung bekannte Verfahren, bei dem eine Bildvorlage iterativ in Bildstrukturen fortschrei­ tender Auflösung zerlegt wird und durch diese Vielfach­ auflösung in ein Sekundärbild umgewandelt wird, das die Grobstruktur und die Detailinformationen der Bildvorla­ ge separat nebeneinander wiedergibt und daher zum Bild­ vergleich nach so unterschiedlichen Kriterien wie Bild­ aufbau und Textur wesentlich geeigneter ist als das ur­ sprüngliche Bild.
Bei der Wavelet-Zerlegung werden, wie im Schema der Fig. 1 dargestellt, die Daten des ursprünglichen Bildes von einer relativ feinen Rasterung m ausgehend in einem ersten Schritt durch zwei komplementäre Hochpaß- und Tiefpaßfilter separat gefiltert, wodurch eine Trennung von Detailinformationen Dm-1 von Infor­ mationen Cm-1 einer nächstgröberen Auflösung m-1 ent­ steht. Letztere werden in einem zweiten Schritt wieder zweifach gefiltert und liefern neben Detailinformatio­ nen Dm-2 Informationen Cm-2 der nächstgröberen Auflö­ sung m-2, auf die die Filterung in gleicher Weise bis hin zu einer gröbsten Auflösung 0 mit Detail- und Grob­ informationen D0 und C0 iterativ fortgesetzt wird. Vor jeder nächstgröberen Filterung wird, wie in Fig. 1 angedeutet, die Zahl der Rasterpunkte halbiert. Durch dieses Schema entsteht eine Kette von unterschiedlich feinen Wiedergaben des Ausgangsbildes, die sich jeweils um den Faktor 2 in der Auflösung unterscheiden. Jede Auflösungsstufe entspricht einem Raster von 2m Bild­ punkten mit dem Rastermaß 2-m.
Die den unterschiedlichen Auflösungen zugeordneten Bilddaten ergeben gemäß
eine durch Koeffizienten f[k] dargestellte Zerlegung des Bildes nach Funktionen, die bestimmten Auflösungen m und bestimmten Koordinaten n der entsprechenden Punktraster entsprechen. Die Funktionen heißen im Falle der Tiefpaßfilterung Skalierungsfunktionen (diese in Fig. 1 jeweils oben stehenden Funktionen führen dementsprechend auf die nächstgröberen Schritte der Bildauflösung) und im Falle der Hochpaßfilterung Wavelets und sind ungefähr um den jeweiligen Raster­ punkt n lokaliert. Sämtliche Skalierungs- und Wavelet- Funktionen der Zerlegung sind aus einer einzigen Ska­ lierungs- bzw. Wavelet-Funktion ableitbar.
Die Zerlegung wird horizontal wie auch vertikal durch­ geführt und ergibt einen Satz durch (mi, mj, ni, nj) bestimmter Skalierungsfunktionen und Wavelets. Die Koeffizienten der Zerlegung geben an, in welchem Maß das ursprüngliche Bild in der Nähe des jeweiligen Rasterpunkts (ni, nj) einen Informationsanteil mit der durch (mi, mj) bestimmten Frequenz enthält.
Die Koeffizienten der Entwicklungen nach den Skalie­ rungsfunktionen der gröbsten gewählten Auflösung und nach den Wavelets derselben und aller übrigen, feineren Auflösungen ergeben zusammen das Sekundärbild, wie es in Fig. 2 beispielhaft dargestellt ist. Darin sind die Informationen über die grobe Struktur der Bildvorlage in einem kleinen linken oberen Bereich und die aus zu­ nehmend feinerer Auflösung stammenden Detailinforma­ tionen weiter davon entfernt und auf zunehmend größeren quadratischen Teilflächen des gesamten Sekundärbildes angeordnet. Die Grobrasterung der Auflösung 0 liefert eine relativ kleine Anzahl von Koeffizienten, aus denen das in der linken oberen Ecke angeordnete kleinste Quadrat des Sekundärbildes besteht. Es ist von drei gleich großen Koeffizientenquadraten umgeben, die aus der ersten (im Schema der Fig. 1 letzten) Zerlegung stammen. Durch jede feinere Auflösungsstufe entstehen Quadrate doppelter Größe entsprechend der für das feinere Raster benötigten vier-fachen Zahl von Raster­ punkten bzw. Wavelets. Bei der zweidimensionalen Wave­ let-Zerlegung entstehen bei jeder Rasterverfeinerung gleich drei zusätzliche Koeffizientenquadrate entspre­ chend der vertikalen, horizontalen und kombinierten Filterung.
Diese Wavelet-Zerlegung wird für alle drei Grundfarben des Bildes separat durchgeführt. Die drei Sekundärbil­ der können gemeinsam als Merkmalsvektor in einem Eigen­ schaftsraum aufgefaßt werden, der in diesen Raum einen "Fingerabdruck" der Bildvorlage abbildet und dessen Länge durch die Gesamtzahl der Koeffizienten der Sekun­ därbilder bestimmt ist. Es ist bekannt, den Merkmals­ vektor dadurch zu verkürzen, daß durch den Einsatz von Zonenfiltern mit Bereichen von Paßbändern und Sperrbän­ dern die Zahl der Koeffizienten weiter verringert wird. Ferner ist bekannt, zwecks eines schnelleren Bildver­ gleichs die Koeffizienten zu vereinfachen, indem bei­ spielsweise die den verschiedenen Detailauflösungen (mit Ausnahme der Grobrasterung) entsprechenden Koef­ fizienten in die Werte 1, 0 und -1 überführt werden.
Obwohl die in an sich bekannter Weise durchgeführte Wavelet-Zerlegung einschließlich der oben genannten nachfolgenden Veränderungen des Sekundärbildes zu Fortschritten bei der digitalen Bildsuche geführt hat, führen herkömmliche Verfahren regelmäßig zu falschen Bildzuordnungen; so werden in den errechneten Rang­ folgen selektierter Bilder selbst in den vordersten Positionen solche Bilder angeboten, die nach menschli­ chem Ermessen von der Bildvorlage offensichtlich deut­ lich verschieden sind. Zudem erscheinen in den Rang­ folgen gewisse Bilder überproportional häufig, die offensichtlich "typische" Eigenschaften besitzen, welche nach herkömmlichen Suchverfahren bevorzugt werden. Die Zuverlässigkeit der digitalen Bildsuche ist aufgrund dieser Mängel erheblich eingeschränkt.
Der Erfindung liegt daher die Aufgabe zugrunde, ein zur digitalen Bildverarbeitung bestimmtes Verfahren und eine entsprechende Vorrichtung bereitzustellen, mit deren Hilfe sich aus einer Bildvorlage ein derartiges Sekundärbild erstellen läßt, das trotz seines gegenüber der Bildvorlage wesentlich kompakteren Formats die aus der Sicht der menschlichen Wahrnehmungssystems wesent­ lichen visuellen Merkmale der Bildvorlage wiedergibt und durch Vergleich mit anderen derartigen Sekundär­ bildern eine schnellere und zuverlässigere Suche in digitalen Bilddatenbanken ermöglicht. Es ist insbeson­ dere Aufgabe der Erfindung, solche Sekundärbilder zu erzeugen, die bei einem Vergleich untereinander nicht mehr zu den vom Stand der Technik bekannten Problemen der Bevorzugung gewisser, offensichtlich typischer Sekundärbilder und der irrtümlichen Gleichordnung von für das menschliche Auge deutlich verschiedenen Bild­ vorlagen führen. Zudem soll bei der Suche in digitalen Bilddatenbanken auch im Falle stärkerer Verzerrungen der Bildvorlage ein Suchergebnis hoher Qualität er­ zielt werden.
Die erfindungsgemäße Lösung dieser Aufgabe ist bezüg­ lich des Verfahrens in den unabhängigen Ansprüchen 1 und 8 und bezüglich der Vorrichtung im Anspruch 10 an­ gegeben; besondere Ausführungsformen sind Gegenstand der Unteransprüche.
Die Aufgabe wird gemäß Anspruch 1 dadurch gelöst, daß in einem Farbtransformierer eine Farbtransformation durchgeführt wird, um die digitale Farb- und/oder Helligkeitsskalierung dem menschlichen Farb- und/oder Helligkeitsempfinden anzugleichen, und/oder daß das Sekundärbild in einem Bildreduzierer durch eine zu­ mindest teilweise nach der Koeffizientengröße vorge­ nommene Auswahl auf einen Teil seiner bildspezifisch wesentlichen Koeffizienten reduziert wird.
Herkömmliche Verfahren benutzen zur Farbcharakteri­ sierung beispielsweise die durch die additiven Grund­ farben Rot, Grün und Blau mit dem Vorteil eines direk­ ten Bezugs zur Farberzeugung von Displays, Monitoren u. ä. sowie eines identischen Wertebereichs aller drei Grundfarben. Daneben werden andere Skalierungen nach Helligkeit, Farbton und Farbsättigung oder das von der Commision Internationale d'Élairage vorgeschlagene, durch XYZ-Werte gekennzeichnete Farbsystem benutzt. Naturgemäß solche und andere vergleichbar einfache Farbskalierungen verwandt, um den angesichts des Um­ fangs heutiger und zukünftiger Bilddatenbanken erheb­ lichen Zeitaufwand einer Bildrecherche in Grenzen zu halten.
Im Gegensatz dazu wird erfindungsgemäß eine Farbtrans­ formation durchgeführt, die der ungleichmäßigen Beur­ teilung von Farbunterschieden durch die Rezeptoren des menschlichen Auges Rechnung trägt. Zudem wird - auch zur Kompensation der Rechenzeit - im Anschluß an die Wavelet-Zerlegung eine Reduzierung des Sekundärbildes auf einen Teil seiner bildspezifisch wesentlichsten Koeffizienten vorgenommen, wozu ein Auswahlverfahren durchgeführt wird.
Das Kriterium dafür, welcher Teil der Koeffizienten ausgewählt bzw. vernachlässigt wird, ist in erster Linie die Größe der Koeffizienten selbst, durch die sich ihre bildspezifische Bedeutung ausdrückt. Da auch allgemeine Kriterien wie die Zugehörigkeit der Koeffi­ zienten zu einer bestimmten Auflösungsstufe oder die Position des zugehörigen Bildpunktes die Relevanz ein­ zelner Koeffizienten beeinflussen können, ist erfin­ dungsgemäß ebenfalls denkbar, die Selektion nach einer Kombination aus der Koeffizientengröße und einem oder beiden der nachgenannten Kriterien vorzunehmen. Die zumindest teilweise nach dem Zahlenwert der Koeffi­ zienten vorgenommene Auswahl gewährleistet im Gegen­ satz zu herkömmlichen Verfahren, die durch Zonenfilter gewisse Frequenzbereiche unabhängig von ihrer Relevanz für das individuelle Bild vernachlässigen, daß keine bildspezifisch wichtigen Teile des Sekundärbildes ver­ worfen werden. Die Selektion gewährleistet insbesondere in Verbindung mit der vorgenannten Farbtransformation, daß das Verfahren wirklich zur Extraktion der hervor­ stechenden Bildmerkmale führt und so die irrtümliche Gleichordnung von für das menschliche Empfinden deut­ lich verschiedenen Bildvorlagen verhindert.
Gemäß einer bevorzugten Ausführungsform ist die Verwen­ dung des CIE L*u*v*-Farbsystems entsprechend den Ska­ lierungen
oder einer wesensgemäß ähnlichen Farbskalierung im Farbtransformierer vorgesehen, wobei XW, YW und ZW die dem Referenzweiß entsprechenden XYZ-Werte darstellen und Farbunterschiede (zumindest bei gleicher Auflö­ sungsstufe) vorzugsweise durch den euklidischen Abstand
errechnet werden. Die Wahl dieser Farbskalierung trägt nicht nur der logarithmischen Empfindlichkeit mensch­ licher Sehrezeptoren Rechnung, sondern bewirkt durch die Trennung des die Bildhelligkeit erzeugenden Farb­ kanals der Luminanz L* von denen der Buntwirkungen beschreibenden Chrominanz u* und v*, daß die Suche Farbbildern oder Graustufen- bzw. Schwarz-Weiß-Bildern getrennt durchgeführt und so erheblich beschleunigt werden kann.
Gemäß einer weiteren Ausführungsform ist vorgesehen, daß in einem Grenzwertgeber von dem aus der Wavelet- Zerlegung erhaltenen Sekundärbild aus einer Anzahl K seiner zahlenmäßig größten Koeffizienten und aus dem Wert des kleinsten dieser K Koeffizienten ein Grenzwert bestimmt wird und die Koeffizienten vereinfacht werden entsprechend
um ein kompakt darstellbares Sekundärbild zu erhalten. In diesem Fall wird der Grenzwert nicht pauschal vorgegeben, sondern erfindungsgemäß an die individuell unterschiedlich starke Ausprägung hervorstechender Bildmerkmale angepaßt. Gegenüber dem vorbekannten Einsatz von Zonenfiltern berücksichtigt diese Ausfüh­ rungsform die bildspezifisch unterschiedliche Vertei­ lung signifikanter Koeffizienten innerhalb des Se­ kundärbildes.
Eine weitere Ausführungsform sieht vor, daß die Koeffizienten des Sekundärbildes auf vorzugsweise ganzzahlige Werte gerundet werden. Dieser Vorgang betrifft in Verbindung mit der vorgenannten Ausfüh­ rungsform nur die durch die Grenzwertbildung un­ beeinflußten Koeffizienten und ermöglicht im Gegensatz zu einer bloßen Reduktion der Koeffizienten auf Zah­ lenwerte wie -1, 0 und 1 eine differenzierte Gewichtung optischer Merkmale; auftretende Rundungsfehler sind angesichts der typischen Größe der Koeffizienten ver­ nachlässigbar.
Eine weitere Ausführungsform sieht vor, daß zur Wave­ let-Zerlegung die Haar-Basis mit der Skalierungsfunk­ tion
und der Wavelet-Funktion
verwendet wird. Diese Orthonormalbasis erlaubt eine wesentlich schnellere Bildverarbeitung als andere Funktionen mit komplizierterem Verlauf über einem viel breiteren Wertebereich und erübrigt aufgrund ihrer starken Lokalisierung eine sonst transformations­ bedingte Signalerweiterung über die Bildbegrenzung hinaus.
Eine weitere Ausführungsform sieht vor, daß die Bildvorlage vor der Wavelet-Zerlegung in einer Vor­ formatiereinheit auf ein einheitliches, vorzugsweise quadratisches Format transformiert wird. Dies hat den Vorteil, daß beispielsweise im Querformat vorliegende Landschaftsbilder und im Hochformat vorliegende Por­ traits ohne Beschneidung des Bildes miteinander ver­ glichen werden können; insbesondere das quadratische Format erlaubt aufgrund seiner symmetrischen Abmes­ sungen besonders schnelle Verfahren zur Bildverar­ beitung. Die umformatierten Bildvorlagen bestehen beispielsweise aus 128 × 128 Bildpunkten pro Grund­ farbe.
Eine weitere Ausführungsform sieht vor, daß die zweidimensionale Wavelet-Zerlegung in jedem Itera­ tionsschritt als einstufige Zerlegung in horizontaler sowie vertikaler Richtung durchgeführt wird. Normalerweise wird die zweidimensional verallgemei­ nerte Wavelet-Transformation nacheinander in beide Bildrichtungen durchgeführt; die erste Anwendung auf die beispielsweise horizontalen Bildpunktreihen ergibt dann ein Zwischenbild, mit dessen vertikalen Bildpunktreihen die Transformation wiederholt wird. Erfindungsgemäß wird dagegen eine einstufige horizontale und vertikale Wavelet-Zerlegung vorgenommen, die auf den die Grob­ struktur des Bildes enthaltenden Quadranten iterativ wiederholt wird. Bei einer Größe der Bildvorlage von 2n Bildpunkten führt diese Ausführungsform zu einer Ver­ minderung des Rechenaufwands von der Ordnung 22n+2 bei dem Standardverfahren auf eine Größenordnung 2n+2.
Für das zur Suche in einer digitalen Bilddatenbank bestimmte Verfahren wird die der Erfindung zugrunde­ liegende Aufgabe dadurch gelöst, daß zur Berechnung des Ähnlichkeitsmaßes zweier Sekundärbilder eine posi­ tions- und/oder auflösungsabhängige Gewichtung von Sekundär­ bildkoeffizienten vorgenommen wird, so daß sowohl glo­ bale als auch lokale Übereinstimmungen der Bildvorlage mit einem zweiten Bild das Ähnlichkeitsmaß bestimmen. Die allgemein übliche und daher selbstverständlich scheinende Berechnung euklidischer Abstände als Wurzel einer Summe quadratischer Koeffizientendifferenzen führt in der Bildverarbeitung bei Anwendung auf die durch die Wavelet-Zerlegung bewirkte Vielfachauflösung zu einer Überbetonung der Grobstruktureigenschaften von Bildern gegenüber deren Detailinformationen, weil die Entwicklungskoeffizienten der gröberen Auflösungsstufen aus der Transformation viel größerer Flächen hervor­ gehen als die Koeffizienten feinerer Auflösungen; da in jeder Auflösungsstufe die gesamte Bildfläche transfor­ miert werden muß, wächst mit abnehmender Koeffizienten­ zahl die durch den einzelnen Koeffizienten im Mittel zukommende Bildfläche, so daß bei jedem Schritt zur nächstgröberen Auflösung Koeffizienten mit idealer­ weise vierfach zu hohen Werten entstehen.
Diese Dominanz der Grobstrukturmerkmale entspricht dem Sachverhalt, daß sich Bilder in erster Linie durch ihren Bildaufbau, d. h. durch ihre Grobstruktur einprä­ gen und nur in Ausnahmefällen durch ihre Textur oder sonstige Detailinformationen auffallen. Die angesichts dessen bislang vorgenommene euklidische Abstandsbe­ rechnung führt jedoch zu einem überproportional häufi­ gen Erscheinen von Bildern mit "typische" Merkmalen in als Suchergebnis angebotenen Ranglisten von Vergleichs­ bildern. Dieser Mangel wird erst durch die erfindungs­ gemäße auflösungsabhängige Gewichtung von Sekundärbild­ koeffizienten behoben, wodurch sowohl globale als auch lokale Übereinstimmungen der Bildvorlage mit einem zweiten Bild das Ähnlichkeitsmaß bestimmen. Darüber hinaus ermöglicht die erfindungsgemäß alternativ oder zusätzlich denkbare positionsabhängige Gewichtung eine stärkere Berücksichtung beispielsweise in der Bild­ mitte gelegener Strukturen, denen häufig besondere Aufmerksamkeit entgegengebracht wird.
Eine weitere Ausführungsform sieht insbesondere vor, daß das Ähnlichkeitsmaß nach
mit allein von der Bildauflösung mi, mj abhängigen Gewichtungen Cmimj der Koeffizienten KX[mi,mj,ni,nj] der Sekundärbilder X bestimmt wird, und daß vorzugs­ weise die auf die Haar-Basis abgestimmte Gewichtung
vorgenommen wird, wobei p die höchste Auflösungsstufe mit der Auflösung 2p bezeichnet.
Für die zur digitalen Bildverarbeitung und/oder zur Suche in digitalen Bilddatenbanken bestimmte Vor­ richtung wird die der Erfindung zugrundeliegende Aufgabe durch einen Farbtransformierer zur Transfor­ mation der Farb- und Helligkeitsskalierung nach An­ spruch 1 und/oder 2 und/oder durch einen Bildreduzierer zur Reduzierung von Sekundärbildern nach mindestens einem der Ansprüche 1, 3 und 4 gelöst, wobei der Farbtransformierer und der Bildreduzierer mit der Recheneinheit und/oder miteinander verbunden sind. Farbtransformierer und Bildreduzierer können dabei sowohl als separate Komponenten als auch in Form von Rechenbereichen eines einkomponentigen Bauteils der gesamten Vorrichtung vorliegen, beispielsweise als Bestandteil der Recheneinheit zur Wavelet-Zerlegung. Ein weiterer, aber nicht notwendiger Bestandteil kann eine Speichereinheit zur Langzeitspeicherung von (Sekundär)Bildern sein, wenn z. B. eine Bilddatenbank mit den erfindungsgemäß erstellten Sekundärbildern ein­ gerichtet wird. Ein solcher Speicher wird jedoch bei einer Bildsuche in einer vorhandenen, mit der erfin­ dungsgemäßen Vorrichtung nur durch eine Vernetzung verbundenen Datenbank nicht erforderlich sein.
Eine erfindungsgemäße Ausführungsform sieht vor, daß der Bildreduzierer ein Grenzwertgeber zur Bildre­ duzierung nach Anspruch 3 ist. Dies betrifft insbeson­ dere die Koeffizientenauswahl ausschließlich nach ihrer Größe, was gegenüber einer Selektion nach kombinierten Kriterien eine besonders schnelle Bildverarbeitung ermöglicht.
Eine weitere Ausführungsform der Erfindung sieht einen Sekundärabstandsrechner zum Sekundärbildvergleich in unterschiedlichen Auflösungen derart, daß unterschied­ lichen Auflösungen entsprechende Sekundärbildkoeffi­ zienten nach einem Verfahren gemäß Anspruch 8 oder 9 gewichtet werden vor. Der Sekundärabstandsrechner kann mit den übrigen Komponenten vereinigt sein oder einen eigenständigen Bestandteil bilden.
Ergänzend sieht eine letzte Ausführungsform eine Ein­ gabeeinheit zur Eingabe einer Bildvorlage, eine Vorfor­ matiereinheit zur Vorformatierung nach Anspruch 6 und/oder eine Ausgabeeinheit zur Ausgabe eines Sucher­ gebnisses vor. Die Eingabeeinheit kann beispielsweise eine Zeicheneinrichtung sein, mit der manuell eine Skizze erstellt und mit Farben verehen wird; ebenso sind Dia- oder Flachbildscanner oder sonstige Ein­ richtungen denkbar; die Vorformatierung kann bereits in dieser Eingabeeinheit erfolgen. Die Bildausgabe kann separat vorliegen oder zur Darstellung einer skiz­ zierten Bildvorlage mit der Eingabeeinheit vereinigt sein. Ebenso ist - wie auch in den anderen Ausfüh­ rungsformen - denkbar, daß einzelne Bestandteile der erfindungsgemäßen Vorrichtung über eine Vernetzung miteinander verbunden sind.
Die Erfindung wird nachstehend ohne Beschränkung des allgemeinen Erfindungsgedankens anhand von Ausführungs­ beispielen unter teilweise Bezugnahme auf Zeichnungen exemplarisch beschrieben, auf die im übrigen hinsicht­ lich der Offenbarung aller im Text nicht näher erläu­ terten erfindungsgemäßen Einzelheiten ausdrücklich ver­ wiesen wird. Es zeigen:
Fig. 1 eine schematische Darstellung der bei der Wavelet-Zerlegung einer Bildvorlage ange­ wandten Filterung,
Fig. 2 ein mit Hilfe der Wavelet-Zerlegung erzeugtes Sekundärbild,
Fig. 3 ein mit Hilfe der erfindungsgemäßen Koeffi­ zientenreduktion erzeugtes Sekundärbild samt Ausschnittsvergrößerung,
Fig. 4 die der Fig. 3 zugrundeliegende Verteilung der Anzahl verbleibender Koeffizienten nach verschiedenen Auflösungsstufen,
Fig. 5 die verschiedenen Auflösungsstufen entsprechende Flächengröße des zugehörigen Punktrasters,
Fig. 6a bis 6c den Einfluß kontrollierter Bildverzerrungen auf die Qualität des Such­ ergebnisses,
Fig. 7a bis 7c zwei beispielhafte Suchergeb­ nisse anhand einer skizzierten Bildvorlage und
Fig. 8a und 8b den Zeitaufwand für die Durch­ führung des erfindungsgemäßen Suchverfahrens auf verschiedenen Rechensystemen.
Die bereits anhand der Fig. 1 erläuterte Wavelet- Zerlegung führt zu ähnlich wie in Fig. 2 aufgebauten Sekundärbildern, deren Teilflächen als Information über die Bildvorlage die Zerlegungskoeffizienten der unter­ schiedlichen Auflösungsstufen und Zerlegungsrichtungen enthalten.
Fig. 3 zeigt ein ähnliches, erfindungsgemäß noch weiter reduziertes Sekundärbild eines der Farbkanäle (der Luminanz L*), das entsprechend Anspruch 3 verein­ facht worden ist und nur noch K = 68 nichtverschwindende Koeffizienten, d. h. Bildpunkte enthält. Wie in Fig. 3 erkennbar, sind die nach der Reduzierung noch verblie­ benen Koeffizienten statistisch, d. h. bildspezifisch verteilt. Fig. 4 gibt für dieses Beispiel die Anzahl beibehaltener Koeffizienten für die Auflösungsstufen 0 (Grobauflösung) bis 6 (Feinstauflösung) wieder. Die signifikanten Koeffizienten stammen entgegen dem durch Fig. 3 zunächst vermittelten Eindruck größtenteils aus den mittleren statt aus den gröberen Auflösungsstufen, was die Bedeutung der Korrektur der Dominanz von Grob­ strukturkoeffizienten, die bei einem Bildvergleich durch die erfindungsgemäß auflösungsabhängige Gewich­ tung vorgenommen wird, unterstreicht.
Aus Fig. 5 geht anschaulich hervor, daß die Entwick­ lungskoeffizienten einer bestimmten Auflösungsstufe m aus der Transformation einer vierfach größeren Bild­ fläche hervorgehen als die Koeffizienten der nächst­ feineren Auflösungsstufe m+1 und daher zahlenmäßig entsprechend größer sind.
Die Fig. 6a bis 6c stellen die Trefferquote des erfindungsgemäßen Suchverfahrens bei einer kontrol­ lierten Verzerrung der Bildvorlage gegenüber einem in einer Datenbank von 1000 visuell breit gestreuten Bildern enthaltenen wiederaufzufindenden Bild dar, wobei die Sekundärbilder wiederum auf jeweils K = 68 Koeffizienten reduziert wurden. In Abhängigkeit von der Stärke eines auf die Grundfarbkanäle Rot, Grün und Blau der Bildvorlage addierten optischen Rauschens (Fig. 6a), der Stärke einer vorgenommenen Farbverschiebung (Fig. 6b) und dem Faktor der Bildverkleinerung sym­ metrisch um den Bildmittelpunkt (Fig. 6c) beschreiben die Diagramme jeweils in einer oberen Kurve den Pro­ zentsatz derjenigen Bilder, die in einer als Such­ ergebnis angebotenen Rangliste von 16 der Bildvorlage am nächsten kommenden Bildern wiedergefunden worden sind, und in einer unteren Kurve den Prozentsatz der so wiedergefundenen Bilder, die richtigerweise auf Platz 1 der Rangliste an erster Stelle erschienen sind. Die Abszissenskala wurde jeweils so weit ausgedehnt, daß die Trefferquote bei dem maximalen noch erfaßten Betrag der vorgenommenen Verzerrung praktisch verschwindet. Alle drei Diagramme ergeben noch bei hohen Verfäl­ schungen der Bildvorlage eine hohe Trefferquote; die bei einem Diagrammvergleich in Fig. 6a noch stärker hervortritt infolge des Umstandes, daß optisches Rauschen stets im Bereich hoher Frequenzen liegt und daher durch die Wavelet-Zerlegung weitgehend aus­ gefiltert wird.
Neben diesem analytischen Test des erfindungsgemäßen Verfahrens enthalten die Fig. 7a bis 7c das Ergebnis zweier Suchvorgänge nach dem in Fig. 7a links darge­ stellten Zielbild anhand zweier daneben abgebildeter, als Skizze vorgegebener Bildvorlagen. Die Suche anhand der in Fig. 7a in der Mitte dargestellten Vorlage er­ gibt die Rangliste nach Fig. 7b, in der das richtige Bild mit einem mit Abstand kleinsten Bildabstandsmaß gegenüber der Bildvorlage, d. h. mit dem größten Ähn­ lichkeitsmaß an erster Stelle erscheint. Auch die Suche anhand der farbverfälschten Vorlage rechts in Fig. 7a führt, wie Fig. 7c zeigt, zu einer Rangliste, die das richtige Bild noch enthält. Dem Vergleich dieses Bildes mit den übrigen in Fig. 7c dargestellten Bildern ist zu entnehmen, daß das richtige Bild bei allein farb­ licher Beurteilung sicherlich außerhalb der Rangliste stünde. Daß es dennoch aufgefunden wird, beruht auf der Wavelet-Zerlegung, die die innere Bildstruktur - hier entsprechend der Vorlage ein zentraler Bereich homo­ gener Helligkeit mit hohem Kontrast zu einem Randbe­ reich - in allen Bildern der Rangfolge aus Fig. 7c wiedererkennt.
Die Fig. 8a und 8b enthalten Angaben zum Zeitaufwand für die Durchführung des erfindungsgemäßen Suchverfah­ rens auf verschiedenen Rechensystemen. In Fig. 8a sind typische Zeiten tE für die Erzeugung eines Sekundär­ bildes sowie typische Zeiten tV für den Sekundärbild­ vergleich aufgeführt. Die für die gesamte Bildsuche erforderliche Zeit ist in Fig. 8b jeweils für zwei Da­ tenbanken der Größe von 20 000 bzw. 100 000 Bildern angegeben.
Angesichts des stetig ansteigenden Umfangs von Bild­ datenbanken ist erfindungsgemäß schließlich auch denk­ bar, das hier vorgeschlagene Verfahren mit der Zuord­ nung bildbezogener Worte oder sonstiger Attribute zu kombinieren.

Claims (13)

1. Zur digitalen Bildverarbeitung bestimmtes Verfahren, bei dem in einer Recheneinheit mit Hilfe einer Wave­ let-Zerlegung von einer Bildvorlage ein Sekundärbild erstellt wird, dadurch gekennzeichnet, daß in einem Farbtransformierer eine Farbtransformation durchgeführt wird, um die di­ gitale Farb- und Helligkeitsskalierung dem menschlichen Farb- und Helligkeitsempfinden anzugleichen, und/oder daß das Sekundärbild in einem Bildreduzierer durch eine zumindest teilweise nach der Koeffizientengröße vorge­ nommene Auswahl auf einen Teil seiner bildspezifisch wesentlichsten Koeffizienten reduziert wird.
2. Verfahren nach Anspruch 1, gekennzeichnet durch die Verwendung des CIE L*u*v*-Farbsystems entsprechend den Skalierungen
oder einer wesensgemäß ähnlichen Farbskalierung im Farbtransformierer, wobei XW, YW und ZW die dem Re­ ferenzweiß entsprechenden XYZ-Werte darstellen und Farbunterschiede vorzugsweise durch den euklidischen Abstand
dargestellt werden.
3. Verfahren nach Anspruch 1 oder 2, dadurch gekennzeichnet, daß in einem Grenzwertgeber von dem aus der Wavelet-Zerlegung erhaltenen Sekundärbild aus einer Anzahl K seiner zahlenmäßig größten Koeffi­ zienten und aus dem Wert des kleinsten dieser K Koef­ fizienten ein Grenzwert bestimmt wird und die Koeffi­ zienten vereinfacht werden entsprechend
um ein kompakt darstellbares Sekundärbild zu erhalten.
4. Verfahren nach einem der Ansprüche 1 bis 3, dadurch gekennzeichnet, daß die Koeffizienten des Se­ kundärbildes auf vorzugsweise ganzzahlige Werte gerun­ det werden.
5. Verfahren nach einem der Ansprüche 1 bis 4, dadurch gekennzeichnet, daß zur Wavelet-Zerlegung die Haar-Basis mit der Skalierungsfunktion
und der Wavelet-Funktion
verwendet wird.
6. Verfahren nach einem der Ansprüche 1 bis 5, dadurch gekennzeichnet, daß die Bildvorlage vor der Wavelet-Zerlegung in einer Vorformatiereinheit auf ein einheitliches, vorzugsweise quadratisches Format trans­ formiert wird.
7. Verfahren nach einem der Ansprüche 1 bis 6, dadurch gekennzeichnet, daß die zweidimensionale Wave­ let-Zerlegung in jedem Iterationsschritt als einstufige Zerlegung in horizontaler sowie vertikaler Richtung durchgeführt wird.
8. Zur Suche in einer digitalen Bilddatenbank bestimmtes Verfahren, bei dem in einem Sekundärab­ standsrechner ein erstes Sekundärbild einer Bildvorlage mit einer Vielzahl zweiten Bildern zugeordneter zweiter Sekundärbilder verglichen und jeweils ein Ähnlichkeits­ maß zwischen dem ersten und einem zweiten Sekundärbild errechnet wird, dadurch gekennzeichnet, daß zur Berechnung des Ähnlich­ keitsmaßes zweier Sekundärbilder eine positions- und/oder auflösungsabhängige Gewichtung von Sekundär­ bildkoeffizienten vorgenommen wird, so daß sowohl glo­ bale als auch lokale Übereinstimmungen der Bildvorlage mit einem zweiten Bild das Ähnlichkeitsmaß bestimmen.
9. Verfahren nach Anspruch 8, dadurch gekennzeichnet, daß das Ähnlichkeitsmaß nach
mit allein von der Bildauflösung mi, mj abhängigen Gewichtungen Cmimj der Koeffizienten KX[mi,mj,ni,nj] der Sekundärbilder X bestimmt wird, und daß vorzugsweise die auf die Haar-Basis abgestimmte Gewichtung
vorgenommen wird, wobei p die höchste Auflösungsstufe mit der Auflösung 2p bezeichnet.
10. Zur digitalen Bildverarbeitung und/oder zur Suche in digitalen Bilddatenbanken bestimmte Vorrichtung mit einer Recheneinheit zur Wavelet-Zerlegung digitaler Bilder, gekennzeichnet durch einen Farbtransformierer zur Transformation der Farb- und Helligkeitsskalierung nach Anspruch 1 und/oder 2 und/oder durch einen Bildredu­ zierer zur Reduzierung von Sekundärbildern nach min­ destens einem der Ansprüche 1, 3 und 4, wobei der Farb­ transformierer und der Bildreduzierer mit der Rechen­ einheit und/oder miteinander verbunden sind.
11. Vorrichtung nach Anspruch 10, dadurch gekennzeichnet, daß der Bildreduzierer ein Grenzwertgeber zur Bildreduzierung nach Anspruch 3 ist.
12. Vorrichtung nach Anspruch 10 oder 11, gekennzeichnet durch einen Sekundärabstandsrechner zum Sekundärbildvergleich in unterschiedlichen Auflösungen derart, daß unterschiedlichen Auflösungen entsprechende Sekundärbildkoeffizienten nach Anspruch 8 oder 9 ge­ wichtet werden.
13. Vorrichtung nach einem der Ansprüche 10 bis 12, gekennzeichnet durch eine Eingabeeinheit zur Eingabe einer Bildvorlage, eine Vorformatiereinheit zur Vor­ formatierung nach Anspruch 6 und/oder eine Ausgabe­ einheit zur Ausgabe eines Suchergebnisses.
DE19744648A 1997-10-09 1997-10-09 Verfahren und Vorrichtung zur Sekundärbilderzeugung und zur schnellen Suche in digitalen Bilddatenbanken Ceased DE19744648A1 (de)

Priority Applications (1)

Application Number Priority Date Filing Date Title
DE19744648A DE19744648A1 (de) 1997-10-09 1997-10-09 Verfahren und Vorrichtung zur Sekundärbilderzeugung und zur schnellen Suche in digitalen Bilddatenbanken

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
DE19744648A DE19744648A1 (de) 1997-10-09 1997-10-09 Verfahren und Vorrichtung zur Sekundärbilderzeugung und zur schnellen Suche in digitalen Bilddatenbanken

Publications (1)

Publication Number Publication Date
DE19744648A1 true DE19744648A1 (de) 1999-04-15

Family

ID=7845072

Family Applications (1)

Application Number Title Priority Date Filing Date
DE19744648A Ceased DE19744648A1 (de) 1997-10-09 1997-10-09 Verfahren und Vorrichtung zur Sekundärbilderzeugung und zur schnellen Suche in digitalen Bilddatenbanken

Country Status (1)

Country Link
DE (1) DE19744648A1 (de)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE10030712A1 (de) * 2000-06-23 2002-01-17 Deutsche Telekom Ag Verfahren zur Differenzierung von durch Suchmaschinen im Rahmen einer Suchanfrage ermittelten Referenzen auf Dokumente
WO2004068410A1 (fr) * 2002-12-31 2004-08-12 France Telecom Procédé et dispositif de détection de points d'intérêt dans une image numérique source, programme d'ordinateur et support de données correspondants.

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
MANJUNATH, B.S., MA, B.S.: Textuse Features for Browsing and Retieval of Image Data, IEEE PAMI, Vol. 18, No. 8, August 1996, S. 837-842 *
SIMMERT, O. u.a.: Prioritätscodiertes Verfahren zur Datenkomprimierung, IK 1997, H. 2, S. 39-42 *
STEINHAUSER/LANGER: Clusteranalyse, de Gruyter, 1977, S. 58-63 *
WYSZECKI, G.: Color Science, John Wiley & Sons, 1982, S. 164-169 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE10030712A1 (de) * 2000-06-23 2002-01-17 Deutsche Telekom Ag Verfahren zur Differenzierung von durch Suchmaschinen im Rahmen einer Suchanfrage ermittelten Referenzen auf Dokumente
DE10030712B4 (de) * 2000-06-23 2004-02-12 Deutsche Telekom Ag Verfahren zur Differenzierung von durch Suchmaschinen im Rahmen einer Suchanfrage ermittelten Referenzen auf Dokumente
WO2004068410A1 (fr) * 2002-12-31 2004-08-12 France Telecom Procédé et dispositif de détection de points d'intérêt dans une image numérique source, programme d'ordinateur et support de données correspondants.

Similar Documents

Publication Publication Date Title
DE69433373T2 (de) Methode und Gerät zum Bildsuchen
DE60101013T2 (de) Farbtransformationsverfahren zum Abbilden von Farben in Bildern
DE2932525C2 (de)
DE60033713T2 (de) Bildverarbeitung und Farbumwandlung
DE69018046T2 (de) Kodierung eines Bildelementes.
DE69216207T2 (de) Farbeinstellung zur Glättung der Grenzen zwischen Farbbildern
DE69118162T2 (de) Farbgekoppelte Fehlerdiffusion
DE69926469T2 (de) Filterung von Bilddaten bei der Verarbeitung zusammengesetzter Dokumente
DE60012649T2 (de) Beseitigung von chromarauschen aus digitalbildern durch verwendung veränderlich geformter pixelnachbarschaftsbereiche
DE3882323T2 (de) Interaktive Bildmodifikation.
DE3306442A1 (de) Verfahren zur farberfassung und farbmodifikation und einrichtung zur durchfuehrung des verfahrens
DE10207326A1 (de) Verfahren und Vorrichtung zum Anpassen von Farbbilddaten an eine entsprechende Farbe in einem definierten Farbraum
DE69736878T2 (de) Verfahren zur Umsetzung von Farbdaten
DE3437748A1 (de) Einrichtung zur bildsignalaufbereitung
DE102007040070B4 (de) Bilddichteumwandlungsverfahren, Bildverbesserungsverarbeitungseinrichtung und dafür geeignetes Programm
DE4102587C2 (de) Verfahren und Vorrichtung zur binären Bildverarbeitung
DE19904997A1 (de) Automatische Farbausfällung unter Verwendung von Luminanz/Chrominanz-Zwischenraumverarbeitung
DE69115117T2 (de) Gerät zur Verbesserung der Schärfe bei einem Farbbild.
DE3437063A1 (de) Verfahren und anordnung zur darstellung eines halbtonbildes unter verwendung eines detektionsangepassten rasters
DE69220190T2 (de) Rasterpufferspeicher mit aufgeteiltem Pegel
DE3750862T2 (de) Verarbeitung von Videobildsignalen.
DE10017551C2 (de) Verfahren zur zyklischen, interaktiven Bildanalyse sowie Computersystem und Computerprogramm zur Ausführung des Verfahrens
EP0042981B1 (de) Verfahren zur Codierung von elektrischen Signalen, die bei der Abtastung eines grafischen Musters mit aus Text und Bildern gemischtem Inhalt gewonnen werden
DE69023017T2 (de) Farbbildverarbeitungssystem.
EP0897247A2 (de) Verfahren zur Berechnung von Bewegungsvektoren

Legal Events

Date Code Title Description
OP8 Request for examination as to paragraph 44 patent law
8131 Rejection