DE69028699T2 - Binarisierung von graustufenbildern unter verwendung von fraktalen dimensionen - Google Patents
Binarisierung von graustufenbildern unter verwendung von fraktalen dimensionenInfo
- Publication number
- DE69028699T2 DE69028699T2 DE69028699T DE69028699T DE69028699T2 DE 69028699 T2 DE69028699 T2 DE 69028699T2 DE 69028699 T DE69028699 T DE 69028699T DE 69028699 T DE69028699 T DE 69028699T DE 69028699 T2 DE69028699 T2 DE 69028699T2
- Authority
- DE
- Germany
- Prior art keywords
- pixel
- image
- value
- gray value
- dimensional image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
- 238000004364 calculation method Methods 0.000 claims description 23
- 238000000034 method Methods 0.000 claims description 20
- 230000008859 change Effects 0.000 claims description 13
- 238000009499 grossing Methods 0.000 claims description 8
- 238000012935 Averaging Methods 0.000 claims description 4
- 239000011159 matrix material Substances 0.000 description 11
- 230000006870 function Effects 0.000 description 7
- 238000010586 diagram Methods 0.000 description 5
- 230000000694 effects Effects 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 239000013598 vector Substances 0.000 description 2
- 238000009825 accumulation Methods 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/28—Quantising the image, e.g. histogram thresholding for discrimination between background and foreground patterns
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Image Processing (AREA)
- Magnetic Resonance Imaging Apparatus (AREA)
- Measuring And Recording Apparatus For Diagnosis (AREA)
- Apparatus For Radiation Diagnosis (AREA)
- Image Analysis (AREA)
- Character Input (AREA)
Description
- Ein Teil der Offenbarung der vorliegenden Patentunterlagen enthält Material, das urheberrechtlichem Schutz unterliegt. Der Inhaber der Urheberrechts hat keine Einwände gegen ein Kopieren der Patentunterlagen oder der Offenbarung des Patentes durch irgendeine Person zwecks Verwendung in der Datei oder den Aufzeichnungen des Patent- und Markenzeichenamtes, behält sich jedoch ansonsten jegliche Art von Urheberrechten vor.
- Die vorliegende Erfindung betrifft ein Verfahren und eine Vorrichtung zur Analyse zweidimensionaler Grauwertbilder und insbesondere ein Verfahren und eine Vorrichtung, um eine derartige Analyse unter Verwendung von Fraktaldimensionen durchzuführen.
- Bei Vorlage eines Grauwertbildes ist es aus verschiedenen Gründen wünschenswert, das Grauwertbild in ein diesem entsprechendes binäres Bild umzusetzen. Zur Durchführung dieser Umsetzung wird das Bild in eine vorbestimmte Anzahl von Bildelementen ("Pixel") unterteilt, und der Grauwert jedes Pixels wird mit einem Schwellenwert verglichen. In einem typischen Fall wird, falls der Grauwert des gewählten Pixels den Schwellenwert überschreitet, dem Pixel ein vorbestimmter binärer Wert zugeordnet. Falls hingegen der Grauwert unterhalb des Schwellenwertes liegt, wird diesem Pixel der alternative Wert zugeordnet.
- Der Schwellenwert wird typischerweise als eine vorbestimmte funktionale Beziehung - typischerweise als Mittelwert - des Grauwertpegels der Pixel in einem lokalen Bereich oder an einer Lokalität des den betreffenden Pixel umgebenden Bildes bestimmt. Die zentrale Überlegung zielt darauf ab, wie man die Größe der Lokalität bestimmt, die zum Erzeugen des Schwellenwertes verwendet werden soll.
- Beispiele repräsentativer Schemata zur Schwellenwertbildung sind unter anderem beschrieben in dem US-Patent 4,468,704 (Stoffel et al.), US-Patent 4,442,544 (Moreland et al.), US- Patent 4,547,811 (Ochi et al.), US-Patent 4,710,822 (Matsunawa), US-Patent 4,501,016 (Persoon et al.), US-Patent 4,656,665 (Pennebaker), US-Patent 4,736,439 (May), US-Patent 4,685,145 (Schiller), US-Patent 4,742,557 (Ma) und US-Patent 4,731,863 (Sezan al.).
- Gemäß der Erfindung wird die Bestimmung der Lokalität des Bildes, aus dem der Schwellenwert abgeleitet wird, unter Verwendung der Fraktaldimension des Bildes durchgeführt. Aus dem zweidimensionalen Original-Bild wird der Oberflächenbereich A(r) einer entsprechenden hypothetischen dreidimensionalen Oberfläche, die der Ebene des zweidimensionalen Bildes überliegt, bei verschiedenen Auflösungswerten r berechnet, wobei jeder Auflösungswert einer Glättung des Originals mittels eines r x r - Mittelwertbildungsfensters entspricht. Die Höhe, um die ein Teil der hypothetischen dreidimensionalen Oberfläche über einem gegebenen Pixel in dem zweidimensionalen Bild liegt, steht in funktionaler Beziehung zu dem Grauwert des Pixels. Die Fraktaldimension der Oberfläche wird bestimmt, indem die Änderung in dem Logarithmus der Fläche A(r) in bezug auf die Änderung in dem Logarithmus des Wertes der Auflösung r entsprechend der Beziehung
- D(r) = 2 - d[log A(r)] / d [log (r)].
- berechnet wird.
- Die Dimension der Lokalität korreliert mit dem speziellen Auflösungswert rmax, bei dem die Fraktaldimension maximal ist. Vorzugsweise ist die Lokalität ein rechteckiges Array von Pixeln, dessen Dimension den Wert rmax um einen vorbestimmten Faktor überschreitet, typischerweise um weniger als zwanzig Prozent (20%).
- Sobald die Dimension der vorbestimmten Lokalität durch Verwendung der Fraktaldimension des Bildes bestimmt worden ist, wird ein Graupegelwert berechnet. Dieser Grauwert steht in einer vorbestimmten funktionalen Beziehung - typischerweise als Mittelwert - zu dem Grauwert der Pixel, die in die vorbestimmte Lokalität fallen. Dieser Graupegelwert definiert den Schwellenwert, mit dem der Grauwert eines gegebenen Pixels verglichen wird. Entsprechend den Ergebnissen des Vergleichs wird dem Pixel ein binärer Wert zugeordnet.
- Vorzugsweise wird die Erfindung unter Verwendung eines digitalen Computers implementiert, der gemäß einem Programm arbeitet. Es wird angenommen, daß eine rechnerische Effizienz dann erzielt wird, wenn die Berechnung der Bereiche in der Fourier- Domäne durchgeführt wird.
- Ein tiefergehendes Verständnis der Erfindung ergibt sich aus der folgenden detaillierten Beschreibung im Zusammenhang mit den Zeichnungen, die Teil der Anmeldung sind.
- Fig. 1 zeigt ein beliebig gewähltes zweidimensionales Grauwertbild;
- Fig. 2 zeigt eine schematisierte dreidimensionale bildhafte Darstellung einer hypothetischen Oberfläche, die dem Grauwertbild gemäß Fig. 1 entspricht;
- Fig. 3 zeigt eine graphische Darstellung der Fraktaldimension einer ein zweidimensionales Bild repräsentierenden dreidimensionalen Oberfläche als Funktion des Auflösungswertes;
- Fig. 4 zeigt eine schematische Darstellung einer Approximation, aus der der Oberflächenbereich der in Fig. 2 gezeigten hypothetischen dreidimensionalen Darstellung des in Fig. 1 gezeigten Grauwertbildes gemäß der Erfindung berechnet werden kann;
- Fig. 5 zeigt ein schematisiertes Blockschaltbild einer Vorrichtung zur Implementierung der Erfindung;
- Fig. 6 zeigt ein detaillierteres Blockschaltbild einer Vorrichtung zur Implementierung der bevorzugten Ausführungsform der Erfindung;
- Fign. 7A, 7B und 7C zeigen Photographien zur Veranschaulichung der Auswirkungen von Hintergrund-Variationen auf ein Bild;
- Fign. 8A, 8B, 8C und 8D zeigen Photographien einer Szene mit vorbestimmten Vergrößerungsswerten;
- Fig. 9 zeigt eine graphische Wiedergabe der Fraktaldimensionen der Bilder gemäß Fign. 8A, 8B, 8C und 8D, jeweils mit unterschiedlichen Auflösungswerten; und
- Fign. 10A, 10B, 10C und 10D zeigen Photographien der binären Bilder, die mittels des Verfahrens und der Vorrichtung gemäß der Erfindung erzeugt werden, wobei die einzelnen Photographien den Bildern gemäß Fign. 8A, 8B, 8C bzw. 8D entsprechen.
- Der die Seiten A-1 bis A-9 umfassende Anhang enthält die Auflistung eines in Fortran-77-Quellcode abgefaßten Computer- Programms zur Implementierung der in Fig. 6 gezeigten Ausführungsform der Erfindung.
- In der gesamten folgenden detaillierten Beschreibung sind Elemente, die in sämtlichen Figuren der Zeichnung gleich sind, mit gleichen Bezugszeichen versehen.
- Fig. 1 zeigt ein Beispiel eines zweidimensionalen Grauwertbildes 10. Das Bild 10 ist in vorbestimmte Pixel unterteilbar, die mit den Bezugszeichen 12-A bis 12-P bezeichnet sind. Die dunkelsten der Pixel (d.h. die Pixel 12-A bis 12-E, 12-H, 12- I, und 12L bis 12-P) sind für die Zwecke der vorliegenden Anmeldung durch gepunktete Schattierung gekennzeichnet. Diese Pixel sind dahingehend aufzufassen, daß sie einen Grauwert von null aufweisen. Die Pixel 12-F und 12-J sind heller, und das Pixel 12-K ist noch heller. Das Pixel 12-G ist das hellste der Pixel. Vom Grauwert her betrachtet sei angenommen, daß das Pixel 12-G einen Grauwert LG, das Pixel 12K einen Grauwert LK und die Pixel 12-F und 12-J Grauwert LF bzw. LJ aufweisen. Der Grauwert LG ist höher als der Grauwert LK, der seinerseits höher ist als die Grauwert LF und LJ.
- Fig. 2 zeigt eine stark schematisierte hypothetische dreidimensionale Darstellung des Grauwertbildes 10 gemäß Fig. 1. Das in Fig. 2 gezeigte Bild kann als eine aus aneinandergrenzenden Pfeilern 14 gebildete dreidimensionale Oberfläche aufgefaßt werden. Jeder Pfeiler 14 weist eine obere Fläche 16 und Seitenflächen 18 auf. Der Abstand, um den die obere Fläche 16 eines gegebenen Pfeilers 14 über einer Grundebene 20 liegt, steht in funktionaler Beziehung zu dem Grauwert dieses Pixels. In dem hier gezeigten System erstreckt sich ein Pixel, das einen niedrigeren Grauwert aufweist, um einen kürzeren Abstand über die Grundebene als ein Pixel, das einen höheren Grauwert aufweist. Somit weisen die Pfeiler 14, die den Pixeln 12-A bis 12-E, 12-H, 12-I und 12L bis 12-P zugeordnet sind, eine Höhe null auf, da die Grauwert der entsprechenden Pixel in Fig. 1 null betragen.
- Wie aus Fig. 2 ersichtlich ist, erstreckt sich, da dem Pixel 12-G ein Grauwert von LG zugeordnet ist, die obere Fläche 16-G des Pfeilers 14-G um einen Abstand LG über die Grundebene 20. In ähnlicher Weise erstreckt sich, da dem Pixel 12-K ein Grauwert von LK zugeordnet ist, die obere Fläche 16-K des Pfeilers 14-K um einen Abstand LK über die Grundebene 20. Der Abstand LK ist kleiner als der Abstand LG, was aufgrund der Differenz der Grauwert der ihnen zugeordneten Pixel der Fall ist. Entsprechend den vorstehenden Ausführungen erstrecken sich, da die Pixel 12-F und 12-J die relativ niedrigeren Grauwert LF bzw. LJ aufweisen, die oberen Flächen 16-F,16J der Pfeiler 14-F,14J um die Abstände LF,LJ über die Grundebene 20. Ferner ist für die Zwecke späterer Erläuterungen in Fig. 2 die Grundebene 20 gemäß den Koordinatenachsen 22 in der kartesischen x,y-Ebene angeordnet. Die Z-Achse gibt die Grauwert-Intensität L an.
- Es ist zu beachten, daß das zweidimensionale Bild 10 in den dreidimensionalen Raum abgebildet werden kann, wobei der Grauwert der in dem zweidimensionalen Bild 10 angeordneten Pixel 12 dazu verwendet wird, die Konturen einer hypothetischen Oberfläche 24 in dem dreidimensionalen Raum zu definieren. Mittels des in Fign. 1 und 2 vereinfacht gezeigten Prinzips kann jedes zweidimensionale Grauwertbild 10 in eine entsprechende dreidimensionale Oberfläche 24 konvertiert werden.
- Sobald ein zweidimensionales Bild 10 als eine hypothetische dreidimensionale Oberfläche 24 definiert worden ist (wobei die Höhe der Oberfläche über der Grundebene 20 an einer gegebenen Position, die durch die x,y-Koordinaten in der Ebene 20 definiert ist, in funktionaler Beziehung zu dem Grauwert des entsprechenden Bildes an dieser Position steht), kann die Oberfläche des Bildes approximiert werden.
- Die Fraktaldimension einer dreidimensionalen Oberfläche kann, intuitiv betrachtet, als ein Maß der "Zackung" einer Oberfläche in dem dreidimensionalen Raum aufgefaßt werden. In strikterer Weise kann die Fraktaldimension mathematisch dahingehend definiert werden, daß sie in Beziehung steht zu der Änderung in dem Logarithmus des Flächenbereiches A der Oberfläche, die sich bei verschiedenen Auflösungsmaßstäben r in bezug auf den Logarithmus des Auflösungsmaßstabs r ergibt.
- D(r) = 2 - d[log A(r)] / d[log (r)] (1),
- wobei D die Fraktaldimension ist,
- r der Auflösungsmaßstab ist, und
- A(r) der Flächenbereich der Oberfläche bei dem Auflösungsmaßstab r ist.
- Eine Abbildung einer tatsächlichen Szene kann mit unterschiedlichen Auflösungsmaßstäben r erstellt werden, indem die Vergrößerung der Abbildungseinrichtung verändert wird. Es ist jedoch nicht möglich, die Vergrößerung eines in einem Computer-Speicher gespeicherten Bildes zu variieren. Ein Effekt, der dem durch Vergrößerung erreichten Effekt gleicht, kann bei computergespeicherten Bildern dadurch erzielt werden, daß die Oberfläche 24 mit einem Glättungsfenster, dessen Seiten dem momentan simulierten Auflösungsmaßstab r gleich sind, konvolviert wird. Auf diese Weise kann die Fläche A einer dreidimensionale Oberfläche 24, die dem zweidimensionales Grauwertbild 10 entspricht, bei jedem Auflösungsmaßstab r einer vorbestimmten Anzahl von Auflösungsmaßstäben r berechnet werden.
- Falls die durch Gleichung (1) errechnete Fraktaldimension D(r) der hypothetischen dreidimensionalen Oberfläche als Funktion des Auflösungsmaßstabs r abgebildet wird, zeigt gemäß dem oberen Bereich von Fig. 3 die Kurve einen Peak an einem bestimmten Wert von r, der im folgenden als rmax bezeichnet wird. Es hat sich herausgestellt, daß gemäß der Erfindung der Peak der Kurve, der an dem Wert von rmax auftritt, in engem Zusammenhang mit dem mittleren Abstand zwischen Merkmalen steht, die bei dem zweidimensionalen Bild von Interesse sind.
- Im Rahmen der Erfindung hat sich erwiesen, daß der Wert rmax des Auflösungsmaßstabs r, bei dem der Peak der Kurve der Fraktaldimension auftritt, einen nützlicher Hinweis zum Definieren der Lokalität gibt, aus der der Referenz-Graupegelwert abgeleitet wird. Diese Beziehung ist im unteren Bereich von Fig. 3 gezeigt. Wie bereits erwähnt, kann dieser Referenzwert selbstverständlich beim Konvertieren des zweidimensionalen Grauwertbildes 10 in ein entsprechendes binäres Bild verwendet werden.
- Die Lokalität kann als ein Array von Pixeln definiert werden, die innerhalb eines vorbestimmten Abstandes von einem Pixel liegen, welches von Interesse ist, wobei der vorbestimmte Abstand in Beziehung zu dem Wert rmax des Auflösungsmaßstabs steht, an dem der Fraktal-Peak auftritt. Die Lokalität kann als rechteckiges Array der Pixel, aus denen es besteht, als kreisförmiges Array oder in jeder anderen vorbestimmten Form ausgebildet sein. Vorzugsweise hat die Lokalität die Form eines quadratrischen Arrays, das um die Pixel, die den Gegenstand des Interesses bilden, zentriert ist, wobei die Dimension jeder Seite des Arrays in Beziehung zu dem Wert rmax steht. Im unteren Bereich von Fig. 3 sind zwei Lokalitäten gezeigt. Die Gebiete 1 und 2 sind als quadratische Arrays von Pixeln gezeigt, von denen jedes eines von zwei gegebenen Pixeln des Bildes - die Pixel 1 und 2 - umgibt. Die Dimension jedes rechteckige Arrays steht in Beziehung zu dem Wert rmax. Das den Gegenstand des Interesses bildende Pixel sollte so nahe wie möglich an dem Mittelpunkt der Lokalität liegen.
- Falls die Dimension eines derartigen rechteckigen Arrays von Pixeln derart gewählt wird, daß sie kleiner ist als der Auflösungsmaßstab rmax, besteht die Möglichkeit, daß sich innerhalb des Bildes Lokalitäten befinden, in denen keine interessanten Merkmale vorhanden sind. Aufgrund einer derartigen Situation wird Rauschen in das konvertierte Bild eingeführt. Falls umgekehrt die Dimension weitaus größer als der Wert rmax gewählt wird, nimmt die Fähigkeit zur Handhabung von Hintergrund-Variationen ab. Es wird angestrebt, die kleinste Lokalität zu wählen, die sowohl das Merkmal als auch den Hintergrund enthält. Exakt dies kann offensichtlich erreicht werden, indem die vorbestimmte Dimension gewählt wird, die die rechteckige Lokalität derart definiert, daß sie geringfügig größer ist als der Wert rmax. Der Ausdruck "geringfügig größer" bedeutet, daß der vorbestimmte Abstand nicht mehr als zwanzig Prozent (20%) größer ist als der Wert rmax. Dies bedeutet, daß die Dimension des Quadrates den Wert rmax um weniger als zwanzig Prozent (20%) überschreitet.
- Bei Lokalitäten, die eine andere Form als die rechteckige aufweisen, steht mindestens einer ihrer dimensionalen Parameter in Beziehung zu dem Wert rmax.
- Sobald die Lokalität definiert ist, wird der Referenz-Schwellenwert für das von dieser Lokalität umgebende Pixel berechnet. Vorzugsweise wird der Schwellenwert durch Mittelwertbildung des Grauwertes jedes Pixels in dieser Lokalität berechnet. Es ist jedoch anzumerken, daß der Schwellenwert jede vorbestimmte funktionale Beziehung zu den Grauwerten der Pixel in der Lokalität erfüllen kann.
- Anschließend wird der Grauwert eines gegebenen Pixels mit dem Schwellenwert verglichen, der aus der das Pixel umgebenden Lokalität abgeleitet worden ist, und entsprechend den Ergebnissen des Vergleichs wird dem Pixel ein binärer Wert zugeordnet. Vorzugsweise wird, falls der Grauwert des gewählten Pixels den basierend auf seiner Lokalität errechneten Schwellenwert überschreitet, dem Pixel ein vorbestimmter binärer Wert zugeordnet. Falls der Grauwert unterhalb des basierend auf seiner Lokalität errechneten Schwellenwertes liegt, wird diesem Pixel der alternative binäre Wert zugeordnet.
- Der Referenz-Schwellenwert wird für jedes Pixel in dem Bild auf analoge Weise berechnet, wobei für jedes Pixel eine Lokalität verwendet wird, die die gleiche Dimension und die gleiche rechteckige Form aufweist.
- Der gesamte Vorgang hängt ab von der Berechnung von Bereichen der hypothetischen dreidimensionalen Oberfläche bei unterschiedlichen Auflösungsmaßstäben. Zunächst wird der Vorgang der Berechnung des Oberflächenbereiches erläutert. Man kann sich diesen Vorgang veranschaulichen, indem man sich erstens vorstellt, daß jeder Pfeiler gemäß Fig. 2 durch eine entsprechende Linie 28 (Fig. 4) ersetzt wird, die in der z-Richtung verläuft und an der Mitte desjenigen Pixels positioniert ist, von dem der Pfeiler absteht. Die Höhe einer Linie 28 ist gleich der Höhe des Pfeilers, den die Linie ersetzt. Somit ist das gesamte Bild auf eine Gruppe von Linien reduziert, die in der z-Richtung unterschiedliche Höhen aufweisen. Als nächstes kann man sich die Oberfläche veranschaulichen, indem man sich eine elastische Bahn vorstellt, die derart auf einer solchen Gruppe von Linien plaziert ist, daß die Bahn das obere Ende jeder Linie berührt und auf dieser aufliegt, wobei sich die Bahn als durchgehende Fläche zwischen den Linien erstreckt. Der Oberflächenbereich einer sich derart erstreckenden Bahn bildet den hypothetischen Oberflächenbereich des Bildes.
- Fig. 4 zeigt eine schematische Darstellung einer Approximation 24' an den vorstehend beschriebenen hypothetischen Oberflächenbereich. Da die Grundebene 20 als in der Ebene der Koordinatenachsen x,y liegend definiert ist, sei angenommen, daß das Pixel 12-G entsprechend den Koordinaten (u,v) positioniert ist. Das Pixel 12-K ist entsprechend den Koordinaten (u,v+1) positioniert, das Pixel 12-F ist entsprechend den Koordinaten (u+1,v) positioniert, und das Pixel 12-J ist entsprechend den Koordinaten (u+1,v+1) positioniert.
- Es sei angenommen, daß für jedes an der Position (u,v) in der x,y-Ebene angeordnete Pixel der Grauwert l(u,v) beträgt. Somit ergibt sich für die Pixel 12-G, 12-K, 12-F und 12-J
- l(u,v) = LG
- l(u,v+1) = LK
- l(u+1,v) = LF
- l(u+1,v+1) = LJ
- Die Linien 28-G, 28-K, 28-F und 28-J, die sich senkrecht zu der x,y-Ebene gemäß Fig. 4 zu den Punkten LG,LK,LF,LJ erstrecken, entsprechen den Linien 28, die in der oben erläuterten Weise die Pfeiler 14 ersetzt haben.
- In Fig. 4 ist der Punkt (u,v,LG) durch R gekennzeichnet, der Punkt (u+1,v,LF) ist durch S gekennzeichnet, der Punkt (u,v+1, LK) ist durch T gekennzeichnet, und der Punkt (u+1,v+1,LJ) ist durch U gekennzeichnet. Wenn die Punkte R, S und U miteinander verbunden werden, entsteht ein Dreieck mit einer Fläche A(u,v). In ähnlicher Weise wird bei gegenseitiger Verbindung der Punkte R, T und U ein Dreieck mit einer Fläche A'(u,v) gebildet.
- In vergleichbarer Weise können innerhalb des gesamten Bildes Dreiecke zwischen benachbarten Pixeln gezogen werden. Im Falle eines N x N - Bildes entstehen Flächen A(0,0), A'(0,0), ... A(N-1,N-1), A'(N-1,N-1). Gemäß der Erfindung ist der Oberflächenbereich A(r) des Bildes die Summe über sämtliche p's und sämtliche q's der Bereiche A(p,q) und A'(p,q) der Dreiecke. Als Gleichung ausgedrückt, bedeutet dies, daß
- wobei p und q im Bereich von null bis (N-1) liegen.
- Im folgenden wird der Vorgang des Glättens des Bildes zwecks Simulation einer Änderung des Auflösungsmaßstabs r erläutert. A(1) ist der Oberflächenbereich des ungeglätteten Original- Bildes (d.h. bei einem Maßstab 1). Zur Ermittlung des Oberflächenbereiches bei dem Maßstab r wird das Original-Bild zuerst mittels eines r x r - Fensters geglättet. Dies erfolgt, indem jede Pixel-Intensität des Original-Bildes durch die mittlere Intensität sämtlicher Pixel ersetzt wird, die in ein das Pixel umgebendes r x r - Fenster fallen. Dieser Vorgang wird für sämtliche Pixel des Original-Bildes durchgeführt, so daß ein geglättetes Bild erzeugt wird. Sobald das geglättete Bild verfügbar ist, kann seine Fläche A(r) in der bereits beschriebenen Weise berechnet werden. Auf diese Weise wird A(r) für einen Bereich von Maßstäben r berechnet. Schließlich wird D(r) entsprechend Gleichung (1) berechnet.
- Wie bereits beschrieben, ist es zum Berechnen der Fraktaldimension D(r) erforderlich, das Bild zu glätten und seinen Oberflächenbereich wiederholt über einen Bereich von Werten von r zu berechnen. In der Praxis ist die Implementierung der Erfindung in der räumlichen (oder realen) Domäne rechnerisch aufwendig. Deshalb wird die Erfindung vorzugsweise in der Fourier-Domäne unter Verwendung eines digitalen Computers mit einem zugeschalteten Array-Prozessor implementiert. Diese Methodik wird anhand der folgenden Erläuterungen verständlich.
- Wie bereits erwähnt und in Fig. 4 gezeigt, können die Dreiecke RSU und RTU durch Verbinden beliebiger dreier Punkte im dreidimensionalen Raum gebildet werden. Die Fläche eines solchen Dreiecks beträgt die Hälfte der Größe des Vektors, der aus dem direkten Produkt beliebiger zweier Vektoren resultiert, die Seiten des Dreiecks bilden. Für die Pixel (p,q) ergibt sich diese Fläche aus
- A(p, q) = 1/2{ [ l(p+1, q) - l(p, q) ]² + [ l(p+1, q+1) - l(p+1, q) ]² + 1 }1/2
- A'(p, q) = 1/2{ [ l(p, q+1) - l(p, q) ]² + [ l(p, q+1) - l(p+1, q+1) ]² + 1 }1/2
- Die Summe von A(p,q) und A'(p,q) für sämtliche Werte p,q ist der approximative Oberflächenbereich des Bildes. Statt davon Gebrauch zu machen, werden jedoch die Quadrate sämtlicher Flächen summiert. Dies führt zu einer rechnerischen Vereinfachung. Ferner kann dargelegt werden, daß in erster Linie die Weise von Interesse ist, in der der Oberflächenbereich mit einer Änderung des Maßstabs für ein einzelnes Bild variiert. Der Absolutwert der Fraktaldimension ist für die Bestimmung der Abmessungen der Lokalität nicht wichtig. Durch die Summierung der Quadrate der Flächen der Dreiecke wird in der Tat die mit der Veränderung des Maßstabs erfolgende Veränderung des Oberflächenbereiches hervorgehoben, was wünschenswert ist.
- Nun ist die Fläche [A(p,q)]² ausgedrückt als
- [A(p, q)]² = 1/4 {[ l(p+1, q) - l(p, q) ]² + [ l(p+1, q+1) - l(p+1, q) ]² + 1 }
- und die Fläche [A'(p,q)] ausgedrückt als
- [A'(p, q)]² = 1/4{ [l(p, q+1) - l(p, q) ]² + [ l(p, q+1) - l (p+1, q+1) ]² + 1 }
- Somit beträgt der Gesamtbereich über das Bild hinweg:
- Gesamtbereich =
- Eine sinnvolle Approximation von Gleichung (3) lautet:
- Gesamtbereich =
- Gleichung (4) ergibt die Summe der Quadrate der Oberflächenbereichselemente bei einem Auflösungsmaßstab r. Zur Ermittlung des Oberflächenbereiches für unterschiedliche Maßstäbe wird zunächst das Original-Bild mittels eines flachen rechteckigen Glättungsfensters geglättet, dessen Seiten eine dem Maßstabsfaktor gleichende Länge aufweisen, und anschließend wird der Oberflächenbereich des Bildes berechnet.
- Im folgenden wird ein weiteres Verfahren zum Approximieren der Glättungs- und Flächenberechnung beschrieben. Dieses Verfahren beschleunigt die Berechnung.
- Es sei angenommen, daß Y(k,h) die Fourier-Transformierten von l(p,q) bilden, einer geglätteten Version des Original-Bildes F(m,n), wobei k,h,p,q,m und n Variablen sind, die ganzzahlige Werte von null bis (N-1) annehmen können.
- wobei W (kp+hq) = exp [-i (2π/N (kp+hq) ], and i = -1
- l(p+1,q) ist eine verschobene Version von l(p,q). Somit lautet die Fourier-Transformation
- W-k Y(k,h) (6)
- Bei Anwendung des Parselvalschen Theorems (gemäß dem die Energie des Bildes sowohl in der räumlichen Domäne als auch in der Fourier-Domäne die gleiche ist) auf die Gleichung (4) erhält man
- Wie bereits erwähnt, ist l(p,q) eine geglättete Version des Original-Bildes F(m,n). Das Glättungsfenster, das zum Ermitteln des Oberflächenbereiches A(r) verwendet wird, ist ein flaches r x r - Fenster mit einer Höhe von 1/r².
- l(s, t) = 1/r² [ F(m, n) + F(m+1, n) + ... + F(m+r-1, n) + F(m, n+1) + F(m+1, n+1) + ... + F(m+ r-1, n+1) + ... + F(m, n+r-1) + ... + F(m+r-1, n+r-1)] (8)
- wobei s = m-1+(r/2), t = m-1+(r/2) für geradzahlige r-Werte, und
- s = m-1+[(r-1)/2], t = m-1+[(r-1)/2) für ungeradzahlige r-Werte.
- In Gleichung (8) ist jeder in Klammern gesetzte Term eine verschobene Version des Original-Bildes F(m,n). Falls in der Fourier-Domäne Z(k,h) die Fourier-Transformierte von F(m,n) ist, dann
- Die in Gleichung (9) umklammerten Terme können umgeschrieben werden als
- (1+W-h + ... + W-(r-1)h) (1+W-k + ... + W-(r-1)k) = [(1-W-rh)/(1-W-h)] [(1-W-rk)/(1-W-k)] (9A)
- Somit kann Gleichung (9) geschrieben werden als
- Y(k,h) = [Z(k,h)/r²] [(1-W-rh) (1-W-rk)]/[(1-W-h) (1-W-k)] (10)
- Setzt man Gleichung (10) in Gleichung (7) ein, erhält man
- Hierbei ist bekannt, daß
- W-h = exp [i(2π/N)h] = cos (2π/N)h + i sin (2π/N)h (11A)
- Bei Verwendung dieser identischen Gleichung kann Gleichung (11) umgeschrieben werden als
- Die Gleichung (13) kann in der folgenden Weise neu angeordnet werden:
- Die in der Gleichung (14) aufgeführte Berechnung kann unter Beachtung der in dieser Gleichung enthaltenen Symmetrie um den Faktor 2 gekürzt werden. Bekannterweise ist bei einem echten Bild die Fourier-Transformierte konjugiert symmetrisch um den Ausgangspunkt. Somit können die Summierungsterme in der folgenden Weise in zwei Summierungsterme aufgeteilt werden:
- Die zweite Summierung von Gleichung (15) kann umgeschrieben werden als
- Da cos (2π/N) (N-h) = cos (2π/N)h
- und Z(k,N-h) = Z*(k,h),
- kann die Gleichung 14 gekürzt werden zu
- Die Berechnung der Flächen A(r) wird in der Form durchgeführt, die in Gleichung (16) gezeigt ist. In dieser Form werden die Glättungs- und Flächenberechnungsschritte beide in einer einzigen, nichtlinearen Operation zusammengefaßt. Die in geeigneter Weise erfolgende Implementierung dieser Gleichung bietet den Vorteil der Schnelligkeit. Dies ist der Fall, weil die Koeffizienten, mit denen die Fourier-Transformierte des Bildes multipliziert wird, unabhängig von dem Bild sind und im voraus berechnet und in dem Speicher gespeichert werden können, um bei Bedarf benutzt zu werden. Ferner enthalten, da die Fourier-Transformierte über den gesamten Raum hinweg Periodizität annimmt, die Bereiche der Pixel, die nahe den Rändern und Ecken des Bildes gelegen sind, automatisch Pixel aus dem herumgelegten Bild.
- Fig. 5 zeigt ein Blockschaltbild einer generell mit 50 bezeichneten Einrichtung zum Konvertieren eines zweidimensionalen Grauwertbildes einer bei 32 schematisch gezeigten Szene aus der realen Welt in ein entsprechendes binäres Bild 34. Eine Kamera oder eine andere geeignete Bildaufnahmevorrichtung 36 erzeugt ein zweidimensionales Grauwertbild der Szene 32. Eine allgemein bei 38 gezeigte Einrichtung digitalisiert das von der Kamera 36 erzeugte Bild und unterteilt es in eine vorbestimmte Anzahl von Bildelementen (Pixeln), denen jeweils ein Grauwert zugeordnet ist. Das Bild ist in einem rechteckigen Format in einer Anordnung von N x N Pixeln ausgelegt.
- Eine generell bei 42 gezeigte Einrichtung berechnet aus der digitalisierten Grauwert-Darstellung des zweidimensionalen Bildes bei verschiedenen Auflösungsmaßstäben r den Oberflächenbereich A(r) einer entsprechenden hypothetischen dreidimensionalen Oberfläche, die der Ebene des zweidimensionalen Bildes überliegt. Wie in Verbindung mit Fign. 1 bis 3 erläutert, steht die Höhe, um die ein Bereich der Oberfläche über einem gegebenen Pixel in dem zweidimensionalen Bild liegt, in funktionaler Beziehung zu dem Grauwert des Pixels. Generell implementiert die Einrichtung 42 die Berechnung der Oberflächenbereiche gemäß der Gleichung (2).
- Eine generell bei 46 gezeigte Einrichtung berechnet die Fraktaldimension der Oberfläche entsprechend der Gleichung (1). Die Ergebnisse einer solchen Berechnung sind in Fig. 3 graphisch dargestellt.
- Die Einrichtung 50 reagiert auf die Ergebnisse der von der Einrichtung 46 durchgeführten Berechnung der Fraktaldimension, indem sie die Größe des Bereiches bestimmt, aus dem der Referenz-Graupegelwert abgeleitet wird. Wie bereits erläutert, steht die Größe des Bereiches in Beziehung zu dem Wert rmax (Fig. 3), der den vorbestimmten Abstand um einen gegebenen Pixel herum definiert, aus dem der Referenzwert für diesen Pixel bestimmt werden soll.
- Eine Einrichtung 54 reagiert auf die Bestimmung der Größe der Abmessungen des in der Einrichtung 50 erzeugten Bereiches und auf den tatsächlichen Graupegelwert der in diesem Bereich befindlichen Pixel (wie er über eine Leitung 58 ausgegeben wird), indem sie einen Referenz-Schwellenwert für jeden Pixel in dem Bild erzeugt. Somit steht der Referenz-Schwellenwert für einen gegebenen Pixel in funktionaler Beziehung zu dem Grauwert des Pixels in dem Bereich. Vorzugsweise wird der Referenzwert unter Verwendung eines direkten Mittelwertes von Grauwerten erzeugt. Es versteht sich jedoch, daß auch andere funktionale Beziehungen benutzt werden können, bei denen alle oder weniger als alle Pixel in dem Bereich verwendet werden können.
- Eine Einrichtung 60 konvertiert den Grauwert jedes in dem zweidimensionalen Bild enthaltenen Pixels in eine entsprechende binäre Darstellung des Pixeis. Dies erfolgt durch Vergleichen des Grauwertes jedes Pixels (wie er über eine Leitung 64 ausgegeben wird) mit dem (durch die Einrichtung 54 abgeleiteten) Referenz-Schwellen-Grauwert dieses Pixels. Entsprechend dem Ergebnissen des Vergleiches wird jedem Pixel ein binärer Wert zugeordnet. Das entsprechende binäre Bild 34 bildet das Ergebnis.
- Die Vorrichtung 30 wird vorzugsweise unter Verwendung eines programmbetriebenen digitalen Computers implementiert. Wie bereits erwähnt, kann jedoch die in der räumlichen Domäne durchgeführte Implementierung der in Fig. 5 bei 48 zusammen gruppierten funktionalen Blöcke, nämlich die Flächenberechnung (Einrichtung 42), rechnerisch aufwendig sein. Deshalb ist gemäß dem in Fig. 6 gezeigten Blockschaltbild eine - der Vorrichtung 30 gemäß Fig. 5 ähnliche - Vorrichtung 30' vorgesehen, um die Erfindung in der Fourier-Domäne zu implementieren. Generell gleicht die Vorrichtung 30' der in Fig. 5 gezeigten Vorrichtung, wobei der Hauptunterschied in der Anhäufung funktionaler Elemente innerhalb eines funktionalen Blocks 48' liegt, der die Flächen und die Fraktaldimension gemäß der Methodik berechnet, die sich aus den Erläuterungen im Zusammenhang mit den Gleichungen (5) bis (16) ergibt.
- Die in Fig. 6 gezeigte Ausführungsform der Erfindung kann mittels eines programmbetriebenen digitalen Computers implementiert werden. Der Anhang zu der vorliegenden Anmeldung enthält eine Auflistung eines in Fortran-77-Sprache abgefaßten Programms zur Durchführung der zu noch beschreibenden Funktionen. Die Seiten A-1 und A-2 der Auflistung enthalten den Hauptteil des Programms. Bei der bevorzugten Implementierung wird die Vorrichtung durch einen von der Digital Equipment Corporation hergestellten und vertriebenen digitalen Computer des Typs MicroVAX implementiert, der mit einem Array-Prozessor verbunden ist, welcher als "Sky Warrior Array Prozessor" von Sky Computers Inc. hergestellt und vertrieben wird. Die Einrichtung 38 kann durch eine Bildverarbeitungseinheit implementiert werden, der unter der Bezeichnung DT2658 von Data Translation Incorporated hergestellt und vertrieben wird.
- Die Einrichtung 48' bei der Ausführungsform gemäß Fig. 6 enthält eine Einrichtung 62, um die Fourier-Transformierte des aus der Digitlaisierungseinrichtung 38 abgeleiteten Bildes zu berechnen. Dies bedeutet, daß der Term Z(k,h) in Gleichung (16) für sämtliche k's und h's berechnet wird. Unterprogramme zum Durchführen einer derartigen Berechnung sind im Handel erhältlich, z.B. das von Sky Computer Inc. vertriebene Programm VSFFT zur Verwendung mit dem oben genannten Array-Prozessor. Die vorstehenden Ausführungen sind selbstverständlich dahingehend zu verstehen, daß die Daten, aus denen die Transformierte berechnet wird, dem Unterprogramm in einer Form zugeführt werden müssen, in der diese die Daten handhaben kann. Beispielsweise müssen geeignete Daten-Handhabungsvorgänge durchgeführt werden, damit das aufgerufene Ein-Dimensions- Transformierten-Unterprogramm die gewünschten Handhabungsvorgänge zweimal durchführen kann, um eine zweidimensionale Transformierte zu erzeugen. Derartige Handhabungsvorgänge gehoren zu den üblichen Fertigkeiten auf dem Gebiet. Im Zusammenhang mit der Auflistung wird die Berechnung der zweidimensionalen Fourier-Transformierten, einschließlich des Aufrufens des Unterprogramms VSFFT, durch das auf Seite A-4 der Auflistung aufgeführte Unterprogramm FRFT ausgeführt. Die eigentliche Berechnung der Transformierten wird mittels des durch den Block 62 gezeigten Abschnitts des Kodes durchgeführt.
- Die in Block 62 abgeleitete Fourier-Transformierte wird einer generell mit 64 bezeichneten Einrichtung zugeführt, die die quadratierte Größe der Transformierten berechnet. Dies bedeutet, daß die Einrichtung 64 auf die in Block 62 abgeleitete Transformierte reagiert, indem sie den in Gleichung (16) augeführten Term [Z(k,h) Z*(k,h)] erzeugt. Die Werte des Terms [Z(k,h) Z*(k,h)] werden in einer Größen-Matrix (IFFT), deren Abmessungen (N x N/2) betragen, gespeichert. Diese Berechnungen werden in dem Abschnitt des Kodes durchgeführt, der durch den Block 64 auf der Seite A-4 der Auflistung gekennzeichnet ist.
- Eine Einrichtung 66 berechnet diejenigen Koeffizienten, die in Gleichung (16) als die Terme
- [1/[1-cos(2π/N)k]] + [1/[1-cos(2π/N)h]]
- aufgeführt sind. Die Werte der Koeffizienten-Terme werden in einer Koeffizienten-Matrix COSSES gespeichert, deren Abmessungen ebenfalls (N x N/2) betragen. Der Kode zur Implementierung der Koeffizienten-Berechnung ist in dem Unterprogramm COSSES auf Seite A-3 des Anhangs aufgeführt. Die Werte der Koeffizienten für irgendeinen gegebenen ganzzahligen Wert von k und h können einfach durch Aufsuchen des geeigneten Terms in der Matrix ermittelt werden. Spezielle Fälle treten ein, wenn k=0 oder h=0. Wenn sowohl k als auch h null sind, wie in Gleichung (16) gezeigt ist, ist der Koeffizient, mit dem [Z(0,0) Z*(0,0)] multipliziert werden, null. Somit wird der Term bei (0,0) in der gespeicherten Koeffizienten-Matrix auf null gesetzt. In den speziellen Fällen, (1) wenn k=0 und h nicht gleich 0 ist oder (2) wenn k nicht gleich 0 ist und h=0, werden die Werte der Koeffizienten-Matrix auf eins gesetzt.
- Eine Einrichtung 68 dient zum Erzeugen einer Produkt-Matrix, die das Produkt der (von der Einrichtung 64 erzeugten) Größen- Matrix und der (von der Einrichtung 66 erzeugten) Größen-Matrix ist. Zusätzlich wird das resultierende Produkt um einen Faktor von (1/N²) skaliert, der dem in der Gleichung (16) aufgeführten Skalierungsterm entspricht. Der Kode für die Herstellung der Produkt-Matrix ist auf Seite A-4 des Anhangs aufgeführt. Die resultierende Produkt-Matrix, im Kode als Matrix "IFFT" aufgeführt, ist für jede ganze Zahl r verfügbar.
- Die Flächen und die Fraktaldimension werden in der Einrichtung 70 berechnet. Der Abschnitt des Kodes, der diese Funktionen implementiert, ist in dem auf den Seiten A-6 und A-7 des Anhangs aufgeführten Unterprogramm FRACTL enthalten. Die eigentliche Berechnung der Fraktaldimension für verschiedene Auflösungsmaßstäbe r ist in dem Kode auf Seite A-7 der Auflistung angegeben. Entsprechend der obigen Erläuterung kann das Ergebnis dieser Berechnung in Form eines Schaubildes dargestellt werden, das demjenigen gemäß Fig. 3 ähnlich ist.
- Das Ausgangssignal der Einrichtung 70 wird der Einrichtung 50 zugeführt, um in der bereits erläuterten Weise den Bereich zu bestimmen. Diese Funktion wird durch das Unterprogramm FRACTL gemäß Seite A-7 des Anhangs ausgeführt. In diesem Block wird die Größe des Bereiches durch Skalieren des Auflösungswertes r abgeleitet, bei dem aufgrund des vorbestimmten Faktors die Peak-Fraktaldimension aufgetreten ist.
- Nachdem die Größe des Bereiches bestimmt worden ist, wird in der Einrichtung 54 mittels der in der Einrichtung 62 abgeleitete Fourier-Transformierenden Z(h,k) der Referenz-Grauwert für die Lokalität berechnet und über die Leitung 72 zugeführt. Der diese Funktion implementierende Abschnitt des Kodes ist auf den Seiten A-8 und A-9 des Anhangs aufgeführt.
- Das Bild wird entsprechend der auf Seite A-2 des Anhangs aufgeführten Implementierung in der Einrichtung 60 konvertiert.
- Die Fraktaldimension natürlich auftretender Objekte tendiert dazu, über einen bestimmten Bereich von Maßstäben oder Vergrößerungen nahezu ganz konstant zu bleiben. Im Zusammenhang mit der Erfindung wurde beobachtet, daß die Fraktaldimensionskurve (als Funktion von r) bei einem bestimmten Wert von r einen Peak aufweist. Bei Bildern, die eine homogene (wenn auch zufällige) Textur aufweisen, hat sich erwiesen, daß der Punkt, an dem der Peak auftritt, d.h. der Wert von rmax, an dem der Peak-Wert D(r) auftritt, sehr stark mit der mittleren Bemessung und den Merkmalen der Textur korreliert.
- Die nachfolgenden Photographien und Erläuterungen verdeutlichen, daß die Erfindung bei Implementierung gemäß der in Fig. 6 gezeigten Ausführungsform in der Lage ist, die Auswirkungen von Bildhintergrund-Variationen, die bei der Bild-Konvertierung auftreten, wenn ein einziger-Referenz-Grauwert für das gesamte Bild gewählt wird, zu beseitigen. Ferner ist anhand der Photographien ersichtlich, daß die Erfindung für jeden beliebigen Vergrößerungsmaßstab des Bildes verwendbar ist.
- Zunächst werden die Auswirkung von Bildhintergrund-Variationen auf das Bild erläutert. Fig. 7A zeigt eine photographische Darstellung einer angestrichenen Platte, in der Risse vorhanden sind. In diesem Bild ist erkennbar, daß der Hintergrund keine gleichförmige Intensität aufweist. Aufgrund spiegelnder Reflektion ist im oberen linken Bereich des in Fig. 7A gezeigten Bildes ein heller Hintergrund vorhanden, und der obere rechte Bereich des Hintergrundes erscheint fast so dunkel wie die Risse.
- Aufgrund dieser Veränderungen des Hintergrundes führt die Wahl eines einzigen Schwellenwertes für das gesamte Bild nicht zu akzeptablen Ergebnissen. Wie Fig. 78 zeigt, sind, falls ein niedriger Schwellenwert gewählt wird, die Risse in dem rechten Bereich des Bildes gut sichtbar, was jedoch nicht für die Risse auf der linken Seite gilt. Wenn andererseits gemäß Fig. 7C der Schwellenwert erhöht wird, sind die Risse auf der linken Seite sichtbar, und die Risse auf der rechten Seite, die zuvor sichtbar waren, verschwinden. Wie noch erläutert wird, überwindet die Erfindung diese Schwierigkeit.
- Als nächstes werden die Auswirkungen stärkerer Vergrößerungen erläutert. Fign. 8A, 8B, 8C und 8D zeigen eine Abfolge von Bildern mit zunehmend stärkerer Vergrößerung. Fig. 9 zeigt eine Fraktaldimensionskurve für jedes der Bilder gemäß Fign. 8A bis 8D. Die bereits allgemein erläuterte Fig. 3 zeigt die Fraktaldimensionskurve des Bildes gemäß Fig. 8A. Die Kurve weist einen Peak bei einem Wert rmax auf, der 12 (zwölf) Pixeln gleicht.
- Es ist ersichtlich, daß sich der Peak der Fraktaldimension mit der Verstärkung der Bildvergrößerung nach rechts oder zu größeren Werten von r hin verschiebt. Die jeweiligen Fraktaldimensions-Peaks der Bilder gemäß Fign. 8A, 8B, 8C und 8D treten bei den Werten rmax = 12, rmax = 14, rmax = 18 bzw. rmax = 25 auf. Generell ist erkennbar, daß sich der Peak der Fraktaldimension mit zunehmender Bildvergrößerung nach rechts oder zu größeren Werten von r hin verschiebt. Falls hingegen die Vergrößerung reduziert würde, würde der Peak der Fraktaldimension auf einen niedrigeren Wert von r rücken.
- Mit der Erfindung kann das in Fign. 8A bis 8D gezeigte Bildes derart konvertiert werden, daß die Probleme von Variationen des Bildhintergrundes unabhängig von dem Vergrößerungswert des Bildes vermieden werden. Wie bereits erwähnt, gibt der Wert rmax, bei dem der Fraktaldimensions-Peak auftritt, Information über den Maßstab oder die Rauhigkeit einer Textur oder einen Hinweis auf den mittleren Abstand zwischen ähnlichen Merkmalen in einem Bild. Wie erläutert, wird diese Information verwendet, um die Lokalität (oder Fenster) zu definieren, aus dem der Referenz-Schwellenwert abgeleitet wird und die zum Berechnen des binären Bildes verwendet wird. Unter Anwendung der heuristischen Vorstellung, daß der beste Größen-Bereich ungefähr 20% größer ist als der Wert rmax, zeigen Fign. 10A, 10B, 10C und 10D die Ergebnisse einer Schwellenwertbildung, bei der dieses Verfahren für die in Fign. 8A, 8B, 8C bzw. 8D gezeigten Bilder angewandt wird.
- Somit ist aus Fign. 10A, 10B, 10C und 10D ersichtlich, daß bei Anwendung der Lehren der Erfindung unabhängig von Hintergrund- Variationen oder den Vergrößerungswerten eine gleichförmig gute Schwellenwertbildung in den entsprechenden binären Bildern erzielt wird.
- Der Fachmann auf dem Gebiet kann in Kenntnis der vorstehend erläuterten Lehren der Erfindung zahlreiche Modifikationen an der Erfindung vornehmen. Beispielsweise wurde bei der obigen Erläuterung der bevorzugten Implementierung der Berechnung des Oberflächenbereiches angenommen, daß der Abstand zwischen den Pixeln eine (1) Einheit beträgt: Somit würde ein Pixel mit einem Grauwert von eins (1) einen Pfeiler 14 gemäß Fig. 2 bewirken, der kubisch ausgebildet ist. Der Abstand zwischen den Pixeln kann jedoch verändert (größer oder kleiner gemacht) werden, was zu einer unterschiedlichen Flächenberechnung führt. In einem extremen Fall wird, wenn der Abstand zwischen den Pixeln sehr viel kleiner als eines (1) gemacht wird, der Oberflächenbereich durch die Summe der Höhen-Differenzen benachbarter Pixel eng approximiert. Es versteht sich jedoch, daß diese und weitere derartige Modifikationen innerhalb des durch die Ansprüche definierten Bereiches der Erfindung liegen.
Claims (8)
1. Verfahren zum Konvertieren eines zweidimensionalen
Grauwertbildes in ein entsprechendes binäres Bild, mit den
folgenden Schritten:
Unterteilen des zweidimensionalen Bildes in eine
vorbestimmte Anzahl von Bildelementen, denen jeweils ein
Grauwert zugeordnet ist;
Glätten des zweidimensionalen Bildes zum Simulieren einer
Änderung des Auflösungsmaßstabs r unter Verwendung eines
r x r - Mittelwertbildungsfensters;
auf der Basis des geglätteten zweidimensionalen Bildes,
Berechnen des Oberflächenbereiches A(r) einer
entsprechenden hypothetischen dreidimensionalen Oberfläche, die der
Ebene des zweidimensionalen Bildes überliegt, wobei die
Höhe, in der ein Bereich der hypothetischen Oberfläche
über einem in dem zweidimensionalen Bild enthaltenen
gegebenen Pixel liegt, in funktionaler Beziehung zu dem
Grauwert des Pixels steht;
Berechnen des Oberflächenbereiches A(r) für einen Bereich
von Auflösungsmaßstäben r;
Bestimmen der Fraktaldimension der hypothetischen
Oberfläche durch Berechnen der Änderung in dem Logarithmus des
Bereiches A(r) in bezug auf die Änderung in dem
Logarithmus des Auflösungsmaßstabs r entsprechend der Beziehung
D(r) = 2 - d[log A(r)] / d[log (r)];
Bestimmen des Auflösungsmaßstabs rmax, bei dem die
Fraktaldimension einen Maximalwert aufweist;
Bestimmen eines Referenzschwellenwert-Grauwertes für jedes
Pixel in dem zweidimensionalen Bild, wobei jeder
Referenzschwellenwert-Grauwert in funktionaler Beziehung zu den
Grauwerten jedes Pixeis steht, welches innerhalb einer
vorbestimmten Lokalität um ein gegebenes Pixel liegt, und
wobei die Abmessungen der vorbestimmten Lokalität in
funktionaler Beziehung zu dem Wert rmax stehen; und
Konvertieren des Grauwertes jedes in dem zweidimensionalen
Bild enthaltenen Pixels in eine entsprechende binäre
Darstellung, indem der Grauwert jedes Pixels mit dem
Referenzschwellenwert-Grauwert für die dieses Pixel umgebende
Lokalität verglichen wird und dem Pixel entsprechend den
Ergebnissen des Vergleichs ein binärer Wert zugeordnet
wird.
2. Verfahren nach Anspruch 1, bei dem die vorbestimmte
Lokalität eine rechteckige Gestalt aufweist und bei dem die
Abmessung der Lokalität den Wert rmax um einen vorbestimmten
Betrag überschreitet.
3. Verfahren nach Anspruch 2, bei dem die vorbestimmte
Strekken-Abmessung der Lokalität den Wert rmax um weniger als
zwanzig Prozent (20%) überschreitet.
4. Verfahren nach Anspruch 1, bei dem die Berechnung der
Oberflächenbereiche A(r) in der Fourier-Domäne
durchgeführt wird.
5. Verfahren nach Anspruch 2, bei dem die Berechnung der
Oberflächenbereiche A(r) in der Fourier-Domäne
durchgeführt wird.
6. Verfahren nach Anspruch 3, bei dem die Berechnung der
Oberflächenbereiche A(r) in der Fourier-Domäne
durchgeführt wird.
7. Vorrichtung zum Konvertieren eines zweidimensionalen
Grauwertbildes in ein entsprechendes binäres Bild, mit
einer Einrichtung zum Unterteilen des zweidimensionalen
Bildes in eine vorbestimmte Anzahl von Bildelementen,
denen jeweils ein Grauwert zugeordnet ist;
einer Einrichtung, die mittels eines r x r -
Mittelwertbildungsfensters das zweidimensionale Bild glättet, um
eine Änderung des Auflösungsmaßstabs r zu simulieren;
einer Einrichtung, um auf der Basis des geglätteten
zweidimensionalen Bildes den Oberflächenbereich A(r) einer
entsprechenden hypothetischen dreidimensionalen Oberfläche
zu berechnen, die der Ebene des zweidimensionalen Bildes
überliegt, wobei die Höhe, in der ein Bereich der
hypothetischen Oberfläche über einem in dem zweidimensionalen
Bild enthaltenen gegebenen Pixel liegt, in funktionaler
Beziehung zu dem Grauwert des Pixels steht;
einer Einrichtung zum Berechnen des Oberflächenbereiches
A(r) für einen Bereich von Auflösungsmaßstäben r;
einer Einrichtung zum Bestimmen der Fraktaldimension der
hypothetischen Oberfläche durch Berechnen der Änderung in
dem Logarithmus des Bereiches A(r) in bezug auf die
Änderung in dem Logarithmus des Auflösungsmaßstabs r
entsprechend der Beziehung
D(r) = 2 - d[log A(r)] / d[log (r)];
einer Einrichtung zum Bestimmen des Auflösungsmaßstabs rmax,
bei dem die Fraktaldimension einen Maximalwert aufweist;
einer Einrichtung zum Erzeugen eines
Referenzschwellenwert-Grauwertes für jedes Pixel in dem zweidimensionalen
Bild, wobei jeder Referenzschwellenwert-Grauwert in
funktionaler Beziehung zu dem Grauwert jedes Pixels steht,
welches innerhalb einer vorbestimmten Lokalität um ein
gegebenes Pixel liegt, und wobei die Abmessungen der
vorbestimmten Lokalität in funktionaler Beziehung zu dem Wert
rmax stehen; und
einer Einrichtung zum Konvertieren des Grauwertes jedes in
dem zweidimensionalen Bild enthaltenen Pixels in eine
entsprechende binäre Darstellung des Grauwertes, indem der
Grauwert jedes Pixels mit dem
Referenzschwellenwert-Grauwert für die dieses Pixel umgebende Lokalität verglichen
wird und dem Pixel entsprechend den Ergebnissen des
Vergleichs ein binärer Wert zugeordnet wird.
8. Vorrichtung nach Anspruch 7, bei der die Berechnung der
Oberflächenbereiche A(r) in der Fourier-Domäne
durchgeführt wird.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US07/316,716 US5054101A (en) | 1989-02-28 | 1989-02-28 | Thresholding of gray level images using fractal dimensions |
PCT/US1990/000806 WO1990010278A1 (en) | 1989-02-28 | 1990-02-20 | Thresholding of gray level images using fractal dimensions |
Publications (2)
Publication Number | Publication Date |
---|---|
DE69028699D1 DE69028699D1 (de) | 1996-10-31 |
DE69028699T2 true DE69028699T2 (de) | 1997-05-15 |
Family
ID=23230330
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE69028699T Expired - Lifetime DE69028699T2 (de) | 1989-02-28 | 1990-02-20 | Binarisierung von graustufenbildern unter verwendung von fraktalen dimensionen |
Country Status (8)
Country | Link |
---|---|
US (1) | US5054101A (de) |
EP (1) | EP0462208B1 (de) |
JP (1) | JPH04503725A (de) |
AT (1) | ATE143518T1 (de) |
CA (1) | CA2011096A1 (de) |
DE (1) | DE69028699T2 (de) |
IL (1) | IL93561A0 (de) |
WO (1) | WO1990010278A1 (de) |
Families Citing this family (23)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8352400B2 (en) | 1991-12-23 | 2013-01-08 | Hoffberg Steven M | Adaptive pattern recognition based controller apparatus and method and human-factored interface therefore |
US10361802B1 (en) | 1999-02-01 | 2019-07-23 | Blanding Hovenweep, Llc | Adaptive pattern recognition based control system and method |
US6418424B1 (en) | 1991-12-23 | 2002-07-09 | Steven M. Hoffberg | Ergonomic man-machine interface incorporating adaptive pattern recognition based control system |
US5903454A (en) | 1991-12-23 | 1999-05-11 | Hoffberg; Linda Irene | Human-factored interface corporating adaptive pattern recognition based controller apparatus |
US6850252B1 (en) | 1999-10-05 | 2005-02-01 | Steven M. Hoffberg | Intelligent electronic appliance system and method |
US6400996B1 (en) | 1999-02-01 | 2002-06-04 | Steven M. Hoffberg | Adaptive pattern recognition based control system and method |
US6118886A (en) * | 1993-03-30 | 2000-09-12 | The United States Of America As Represented By The United States Department Of Energy | Automatic target recognition apparatus and method |
US5912993A (en) * | 1993-06-08 | 1999-06-15 | Regents Of The University Of Calif. | Signal encoding and reconstruction using pixons |
AUPM661494A0 (en) * | 1994-07-01 | 1994-07-28 | Commonwealth Scientific And Industrial Research Organisation | Fractal representation of data |
FR2731819B1 (fr) * | 1995-03-17 | 1997-04-11 | Alsthom Cge Alcatel | Methode d'extraction de contours utilisant une analyse multi-fractale |
US5696700A (en) * | 1995-06-26 | 1997-12-09 | The United States Of America As Represented By The Secretary Of The Navy | System and computer-implemented method for fractal-dimension measurement for target-motion analysis noise discrimination |
US6052485A (en) * | 1997-02-03 | 2000-04-18 | The United States Of America As Represented By The Secretary Of The Navy | Fractal features used with nearest neighbor clustering for identifying clutter in sonar images |
US6466687B1 (en) * | 1997-02-12 | 2002-10-15 | The University Of Iowa Research Foundation | Method and apparatus for analyzing CT images to determine the presence of pulmonary tissue pathology |
US6240208B1 (en) | 1998-07-23 | 2001-05-29 | Cognex Corporation | Method for automatic visual identification of a reference site in an image |
US7966078B2 (en) | 1999-02-01 | 2011-06-21 | Steven Hoffberg | Network media appliance system and method |
US6567087B1 (en) * | 2000-03-27 | 2003-05-20 | The United States Of America As Represented By The Secretary Of The Army | Method to create a high resolution database |
JP2002271611A (ja) * | 2001-03-14 | 2002-09-20 | Fujitsu Ltd | 画像処理装置 |
US6993187B2 (en) * | 2003-02-14 | 2006-01-31 | Ikonisys, Inc. | Method and system for object recognition using fractal maps |
US8270699B2 (en) * | 2006-10-02 | 2012-09-18 | E I Du Pont De Nemours And Company | Method for measuring coating appearance and the use thereof |
US8939885B2 (en) * | 2010-09-17 | 2015-01-27 | Penelope S. Martin | System and method for eliciting a relaxation response |
JP7018380B2 (ja) * | 2018-11-30 | 2022-02-10 | 株式会社神戸製鋼所 | タイヤ表面の画像表示方法およびその画像表示に用いる画像処理装置 |
CN113554613B (zh) * | 2021-07-21 | 2024-03-01 | 中国电子科技集团公司信息科学研究院 | 一种基于分形理论的图像处理方法及装置 |
CN116823825B (zh) * | 2023-08-29 | 2023-12-05 | 山东海德尼克液压科技有限公司 | 一种阀门配件铸造缺陷智能识别方法 |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6234166Y2 (de) * | 1980-07-28 | 1987-09-01 | ||
GB2103449B (en) * | 1981-06-29 | 1985-05-30 | Nippon Telegraph & Telephone | Method and apparatus for gray level signal processing |
NL8105256A (nl) * | 1981-11-20 | 1983-06-16 | Philips Nv | Inrichting voor het dynamisch instellen van een discriminatiedrempel zwart/wit bij het bewerken van beelden met grijsheidswaarden. |
JPS5954376A (ja) * | 1982-09-21 | 1984-03-29 | Konishiroku Photo Ind Co Ltd | 画像処理方法 |
US4468704A (en) * | 1982-10-28 | 1984-08-28 | Xerox Corporation | Adaptive thresholder |
US4685145A (en) * | 1984-12-07 | 1987-08-04 | Fingermatrix, Inc. | Conversion of an image represented by a field of pixels in a gray scale to a field of pixels in binary scale |
US4656665A (en) * | 1985-01-15 | 1987-04-07 | International Business Machines Corporation | Thresholding technique for graphics images using histogram analysis |
US4736439A (en) * | 1985-05-24 | 1988-04-05 | The United States Of America As Represented By The Secretary Of The Navy | Image preprocessing by modified median filter |
US4694407A (en) * | 1985-06-11 | 1987-09-15 | Rca Corporation | Fractal generation, as for video graphic displays |
US4742557A (en) * | 1985-11-08 | 1988-05-03 | Ncr Corporation | Adaptive character extraction method and system |
US4731863A (en) * | 1986-04-07 | 1988-03-15 | Eastman Kodak Company | Digital image processing method employing histogram peak detection |
-
1989
- 1989-02-28 US US07/316,716 patent/US5054101A/en not_active Expired - Lifetime
-
1990
- 1990-02-20 DE DE69028699T patent/DE69028699T2/de not_active Expired - Lifetime
- 1990-02-20 WO PCT/US1990/000806 patent/WO1990010278A1/en active IP Right Grant
- 1990-02-20 AT AT90905090T patent/ATE143518T1/de not_active IP Right Cessation
- 1990-02-20 EP EP90905090A patent/EP0462208B1/de not_active Expired - Lifetime
- 1990-02-20 JP JP2505017A patent/JPH04503725A/ja active Pending
- 1990-02-27 IL IL93561A patent/IL93561A0/xx unknown
- 1990-02-28 CA CA002011096A patent/CA2011096A1/en not_active Abandoned
Also Published As
Publication number | Publication date |
---|---|
EP0462208A1 (de) | 1991-12-27 |
US5054101A (en) | 1991-10-01 |
IL93561A0 (en) | 1990-11-29 |
EP0462208B1 (de) | 1996-09-25 |
ATE143518T1 (de) | 1996-10-15 |
JPH04503725A (ja) | 1992-07-02 |
WO1990010278A1 (en) | 1990-09-07 |
EP0462208A4 (en) | 1992-11-19 |
DE69028699D1 (de) | 1996-10-31 |
CA2011096A1 (en) | 1990-08-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DE69028699T2 (de) | Binarisierung von graustufenbildern unter verwendung von fraktalen dimensionen | |
DE69217550T2 (de) | Echt-zeit-erkennung von zeigerinformation durch video | |
DE69828909T2 (de) | Neue perzeptive lokale gradientenbasierte gratbestimmung | |
DE69027616T2 (de) | Gerät und Verfahren zum Bestimmen von Konturen und Linien | |
DE68902662T2 (de) | Verarbeitungsgeraet fuer zweipegelsignale zur bilddarstellung. | |
DE69618068T2 (de) | Verfahren und Vorrichtung zum Durchführen von Text und Bildsegmentation | |
EP1316057B1 (de) | Auswerten von kantenrichtungsinformation | |
DE69715076T2 (de) | Vorrichtung zur Erzeugung eines Binärbildes | |
DE69925139T2 (de) | Adaptive querschnittsflächenberechnung mit hilfe von statistischen signaturen | |
DE10081029B4 (de) | Bildbearbeitung zur Vorbereitung einer Texturnalyse | |
DE69623642T2 (de) | Vektorkorrelationssystem zum automatischen auffinden von mustern in einem bild | |
DE68914206T2 (de) | Verfahren und System zur Verbesserung eines digitalisierten Bildes. | |
DE60114469T2 (de) | Methode und Gerät zur Bestimmung von interessanten Bildern und zur Bildübermittlung | |
DE69816824T2 (de) | Texturabbildung in 3-d-rechnergraphik | |
DE60307583T2 (de) | Auswertung der Schärfe eines Bildes der Iris eines Auges | |
DE69413384T2 (de) | Verfahren zum bestimmen der ungleichheit zwischen monoskopischen bildern, die ein stereoskopisches bild darstellen | |
DE3420576C2 (de) | Anordnung zum Reprojizieren von Bildern aus mehreren eindimensionalen Projektionen in der Computer-Tomographie | |
DE3689271T2 (de) | Verfahren zur Bildanzeige. | |
DE69916450T2 (de) | Verfahren zum suchen von bildern, basierend auf einer invarianten indizierung der bilder | |
DE69428482T2 (de) | Verfahren und Vorrichtung zur Bildverarbeitung | |
DE69328333T2 (de) | Holografisches Darstellungsverfahren und -gerät | |
DE3022454A1 (de) | Optisches abbildesystem mit computererzeugtem bild fuer einen bodenfesten flugsimulator | |
EP0780002A1 (de) | Verfahren zur rekonstruktion von in rasterform vorliegenden linienstrukturen | |
DE102004004641A1 (de) | Dreidimensionale Reprojektions- und Rückprojektionsverfahren und Algorithmen zum Durchführen derselben | |
DE102004007637A1 (de) | Verfahren zum Erzeugen eines Bildes mit erhöhter Auflösung unter Verwendung einer Mehrzahl von Bildern mit niedriger Auflösung |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
8364 | No opposition during term of opposition |