-
Die vorliegende Erfindung betrifft ein Verfahren zur Inspektion und Detektion von Defekten auf Oberflächen von scheibenförmigen Objekten. Unter dem Begriff der scheibenförmigen Objekte sind nicht nur Wafer zu verstehen, sondern auch Displays für Flat-Panel-Bildschirme.
-
In der Halbleiterfertigung werden Wafer während des Fertigungsprozesses in einer Vielzahl von Prozessschritten sequentiell bearbeitet. Mit zunehmender Integrationsdichte steigen die Anforderungen an die Qualität der auf den Wafern ausgebildeten Strukturen. Um die Qualität der ausgebildeten Strukturen während des Fertigungsprozesses überprüfen und evtl. Defekte finden zu können, ist das Erfordernis an die Qualität, die Genauigkeit und die Reproduzierbarkeit der an dem Wafer handhabenden Bauteile und Prozessschritte entsprechend hoch. Dies bedeutet, dass bei der Produktion eines Wafers mit einer Vielzahl von Prozessschritten und der Vielzahl der aufzutragenden Schichten am Fotolack eine zuverlässige und frühzeitige Erkennung von Defekten besonders wichtig ist. Bei der optischen Erkennung von Fehlern gilt es dabei, auch die systematischen Fehler durch die Dickenschwankungen bei der Belackung der Halbleiterwafer zuverlässig und reproduzierbar zu detektieren. Dabei solle es möglich sein, dass nur diejenigen Stellen auf dem Halbleiterwafer gekennzeichnet werden, die auch einen tatsächlichen Fehler beinhalten und der sich letztendlich negativ auf die Funktionalität des entsprechenden DIEs bzw. Chips auswirkt.
-
Die internationale Patentanmeldung
WO 2010/124081 A1 offenbart ein Verfahren zur Optimierung eines optischen Inspektions- und Herstellungsprozesses von Halbleiterbauteilen. Hierzu werden bevorzugt Farbbilder von zu untersuchenden Objekten aufgenommen. Auf diesen Bildern wird eine Vielzahl von Darstellungen in unterschiedlichen Farbräumen erzeugt. Jede dieser Darstellungen und die Kanäle, oder Daten, die diese Darstellungen betreffen, werden analysiert. Die Analyse kann dabei getrennt voneinander oder in Kombination mit anderen Kanälen durchgeführt werden, um festzustellen, welche Darstellung bzw. welche Kombination von Darstellungen, Kanälen oder Kombinationen von Kanälen oder Daten oder Kombinationen von Daten, die geeignetste Darstellung wiedergeben, um damit die Analyse mittels eines optischen Inspektions-Algorithmus durchführen zu können. Der Prozess kann dabei in Bezug auf die Erzeugung der Darstellungen des Bildes und/oder der einzelnen oder vielfachen Analyse automatisiert werden.
-
Die deutsche Patentschrift
DE 10 2007 039 982 B3 offenbart ein Verfahren zur optischen Inspektion und Visualisierung der von scheibenförmigen Objekten gewonnenen optischen Messwerte. Hierzu wird zunächst mindestens ein Bild des mindestens einen scheibenförmigen Objekts aufgenommen. Auf dem mindestens einen aufgenommenen Bild wird eine Vielzahl von optischen Messwerten erzeugt. Dann wird ein Ergebnisbild erzeugt, wobei einem Bereich der Fläche des scheibenförmigen Objekts, dessen optische Messwerte innerhalb eines vorbestimmten Intervalls liegen, ein Farb- oder Helligkeitswert zugeordnet wird. Der Farb- oder Helligkeitswert wird aus einer vorbestimmten Palette ausgewählt. Letztendlich wird mindestens ein Abbildungsparameter in Abhängigkeit der erfassten und ausgewerteten optischen Messwerte und/oder in Abhängigkeit einer visuellen Kontrolle des Ergebnisbildes durch eine Bedienperson variiert.
-
Die deutsche Patentschrift
DE 10 2006 042 956 B4 offenbart ein Verfahren zur optischen Inspektion und Visualisierung der von scheibenförmigen Objekten gewonnenen optischen Messwerte. Es wird mindestens ein Bild des mindestens einen scheibenförmigen Objekts aufgenommen. Aus dem mindestens einen aufgenommenen Bild wird eine Vielzahl von optischen Messwerten gewonnen. Dann erfolgt ein Zuordnen eines Farbwerts zu jedem optischen Messwert. Daraus wird ein Ergebnisbild erzeugt, wobei einem Bereich der Fläche des scheibenförmigen Objekts, dessen optische Messwerte innerhalb eines vorbestimmten Intervalls liegen, ein Farbwert zugeordnet, der aus einer vorbestimmten Palette ausgewählt wird.
-
Die deutsche Patentanmeldung
DE 103 07 454 A1 offenbart ein Verfahren, eine Vorrichtung und eine Software zur Inspektion der Oberfläche eines Halbleitersubstrats. Ferner wird ein Verfahren und eine Vorrichtung zur Herstellung eines strukturierten Halbleitersubstrats unter Verwendung eines solchen Verfahrens bzw. einer solchen Vorrichtung offenbart. Bei dem Verfahren wird zur optischen Inspektion der Oberfläche eines Halbleitersubstrats ein Bild aufgenommen. Das Bild besteht aus einer Vielzahl von Bildpunkten mit jeweils zumindest drei zugeordneten Intensitäten unterschiedlicher Wellenlängen, die als Farbwerte bezeichnet werden. Aus den Farbwerten wird durch Transformation in einen Farbraum, der von der Intensität und von Farbkoordinaten aufgespannt wird, eine Häufigkeitsverteilung von Bildpunkten mit gleichen Farbkoordinatenwerten berechnet. Die so berechnete Häufigkeitsverteilung wird für einen Vergleich mit einer zweiten entsprechend berechneten Häufigkeitsverteilung oder einer aus dieser abgeleiteten Größe verwendet. Aus diesem Verfahren kann man lediglich die Aussage gewinnen, dass auf der Oberfläche des scheibenförmigen Substrats ein Defekt vorliegt. Über die Lage des Fehlers auf der Oberfläche des scheibenförmigen Substrats kann keine Aussage getroffen werden.
-
Makroskopische Bilder von Halbleiterwafern bzw. von oberflächlichen scheibenförmigen Substraten zeigen, dass die Homogenität der Schichten oder Layer sich radial ändert. Insbesondere bei der Belackung treten in den vom Mittelpunkt des Wafers entfernten Bereichen veränderte Homogenitäten auf. Wird wie bisher eine einheitliche Empfindlichkeit über den gesamten Radius des Wafers für die Bewertung von Bildern der aufgenommenen Wafer verwendet, so kommt es vor, dass die Abweichungen am Rand immer, jedoch Defekte im Inneren (nahe am Mittelpunkt des Wafers) nicht detektiert werden. Wird eine hohe Empfindlichkeit gewählt, um Defekte in homogenen Gebieten sicher zu detektieren, so treten in den Randbereichen verstärkte Fehldetektionen auf, da die inhomogenen Randbereiche nicht immer als Fehler zu bewerten sind.
-
Um dies zu verhindern, kann man die Randbereiche komplett ausklammern. Jedoch werden dann dort keine echten Fehler gefunden. Wählt man dagegen eine geringe Empfindlichkeit, so kommt es zwar zu keinen Fehldetektionen mehr, jedoch können Fehler in den homogenen Gebieten nicht gefunden werden.
-
Die deutsche Patentanmeldung
DE 103 31 686 A1 offenbart ein Verfahren zur Bewertung von aufgenommenen Bildern von Wafern oder anderen scheibenförmigen Objekten. Dem Aufnehmen des Bildes mindestens eines Referenzwafers schließt sich das Ermitteln und Darstellen der radialen Verteilung der Messwerte des Referenzwafers als eine radiale Homogenitätsfunktion auf einen User-Interface an. Ein radial abhängiges Empfindlichkeitsprofil wird unter Berücksichtigung der gemessenen radialen Homogenitätsfunktion des Referenzwafers verändert. Mindestens ein Parameter des Empfindlichkeitsprofils wird variiert, wodurch ein erlerntes Empfindlichkeitsprofil visuell aus dem Vergleich mit der radialen Homogenitätsfunktion bestimmt wird. Dieses Verfahren zeigt ebenfalls kein Bild des gesamten Wafers, anhand dessen dann das Bild oder die Bilder bzgl. der Defekte bewertet werden.
-
Das
U.S.-Patent 7,065,460 offenbart eine Vorrichtung und ein Verfahren zur Inspektion von Halbleiterbauelementen. Mit der Vorrichtung werden die elektrischen Eigenschaften des Halbleiterprodukts untersucht. Mit den aus der Untersuchung gewonnenen Messergebnissen werden zur Darstellung auf dem Display unterschiedliche Farben zugeordnet.
-
Aus dem Stand der Technik ist eine Vielzahl von Verfahren bekannt, mit denen die Oberfläche eines scheibenförmigen Objekts in Bezug auf Defekte inspiziert werden kann. Dabei werden die unterschiedlichsten Algorithmen angewandt, um aus den an den Messdaten gewonnenen Bildern die Defekte zu visualisieren. Viele dieser Verfahren sind jedoch nicht geeignet, dass sie die Defekte zuverlässig detektieren. Letztendlich hängt es von der Erfahrung des Benutzers ab, um einen gefundenen Defekt auch als Defekt zu bewerten.
-
Der Erfindung liegt die Aufgabe zugrunde, ein Verfahren zur Inspektion und Detektion von Defekten auf der Oberfläche von scheibenförmigen Objekten anzugeben, mit dem es möglich ist, Defekte sicher und zuverlässig auf der Oberfläche von scheibenförmigen Objekten zu inspizieren bzw. zu detektieren. Mit dem erfindungsgemäßen Verfahren soll es möglich sein, die richtige Transformationsvorschrift, den richtigen Detektionskanal und ein entsprechendes Detektionsgebiet zu definieren, damit in reproduzierbarer Weise während einer Produktionscharge von scheibenförmigen Objekten die möglicherweise auf den scheibenförmigen Objekten vorhandenen Defekte sicher und zuverlässig detektiert werden können.
-
Diese Aufgabe wird erfindungsgemäß durch ein Verfahren gelöst, das die Merkmale des Anspruchs 1 umfasst.
-
Bei dem erfindungsgemäßen Verfahren erfolgt zunächst das Aufnehmen eines Bildes des jeweiligen scheibenförmigen Objekts. Dabei wird die gesamte Oberfläche des scheibenförmigen Objekts mit einer Vielzahl von Feldern erfasst. Aus mehreren, der Größe nach gleichen Feldern der Oberfläche des scheibenförmigen Objekts wird eine defektfreie Vergleichsreferenz einer vordefinierten Größe gebildet. Nachdem die defektfreie Vergleichsreferenz zur Verfügung steht, wird ein Differenzbild der Oberfläche des scheibenförmigen Objekts erzeugt. Dabei wird die gebildete Vergleichsreferenz von jedem Feld der Oberfläche des scheibenförmigen Objekts subtrahiert. Auf des so gebildete Differenzbild wird eine Farbtransformation angewendet. Durch geeignete Wahl der Transformation werden Signale in einen Kanal maximiert. Zugleich werden unerwünschte, aufgrund der Produktion bedingte Variationen der Felder in einen anderen Kanal verlagert. Abschließend werden die Signale bewertet, wobei ein Mittelwert, eine Varianz, ein maximaler Wert und ein minimaler Wert für jedes Feld bestimmt werden. Die Verteilung der Signale für jeden Bildpunkt eines Feldes wird bestimmt. Ebenso wird eine Verteilung der Signale zu jedem zu untersuchenden Defekt bestimmt. Die Verteilung wird für jede Kombination aus verwendeter Transformation und verwendetem Transformationskanal bestimmt. Schließlich wird diejenige Kombination aus Transformation und Detektionskanal ausgewählt, die für die meisten Bildpunkte eins Feldes mit dem zu findenden Defekt außerhalb der Streubreite der Bildpunkte des jeweiligen Feldes auf der Oberfläche des jeweiligen aus der Produktion kommenden scheibenförmigen Objekts liefern.
-
Die Felder der Oberfläche des scheibenförmigen Objekts können derart ausgewählt werden, dass die Felder einer strukturierten Oberfläche des scheibenförmigen Objekts mindestens einen ganzzahlig gebrochenen Teil eines DIEs enthalten.
-
Mit dem erfindungsgemäßen Verfahren ist es ebenso möglich, die Oberfläche eines scheibenförmigen Objekts zu inspizieren, wobei die Oberfläche eine unstrukturierte Oberfläche ist. Die Felder werden dabei derart gewählt, dass bei der unstrukturierten Oberfläche des scheibenförmigen Objekts alle zu untersuchenden Felder derart verteilt sind, dass sie die Oberfläche des scheibenförmigen Objekts bedecken und innerhalb eines Umfangs des scheibenförmigen Objekts liegen.
-
Über ein User-Interface können mehrere Pixel zu einem Detektionswert zusammengefasst werden. Dadurch ist es möglich, das Pixelrauschen zu minimieren und somit zwischen einer Ortsauflösung oder einer Rauschunterdrückung zu wählen. Je größer die Anzahl der Pixel sind, die zu einem Detektionswert zusammengefasst werden, desto größer ist die Rauschunterdrückung. Ist die Anzahl der Pixel, die zu einem Detektionswert zusammengefasst werden klein, so erhöht sich dadurch die Ortsauflösung. Ein Benutzer des erfindungsgemäßen Verfahrens kann somit durch geeignete Wahl der Anzahl der Pixel, die zu einem Detektionswert zusammengefasst werden, entscheiden, ob er mehr zwischen Ortsauflösung oder mehr zwischen Rauschunterdrückung wählen will. Die zu bildenden Differenzen werden für n × m Pixel des jeweiligen zu untersuchenden Feldes mit den zugehörigen Pixeln der jeweiligen Vergleichsdifferenz gebildet. Die resultierenden Differenzen werden für jeden Farbkanal getrennt aufsummiert.
-
Das so gebildete Differenzbild kann einer Normierung auf eine Beleuchtungsintensität unterzogen werden, um somit eine Unabhängigkeit von der Beleuchtungsintensität zu erreichen. Jedem Pixel des gebildeten Differenzbildes wird ein konstanter Wert addiert, um auch negative Werte des Differenzbildes darstellen zu können.
-
Das Differenzbild wird in einzelne Kanäle separiert, um daraus drei unterschiedliche Graubilder zu erhalten. Einem Differenzbild kann ein Filter mit einem Radialpolynom überlagert werden.
-
Eine Detektion eines Defekts kann dadurch erreicht werden, dass eine Schwelle auf das Differenzbild angewendet wird. Alle Positionen im Differenzbild, deren Wert größer ist als die Schwelle, werden als Defekt bewertet. Die Schwelle ist eine Funktion des Abstandes von einem Schwerpunkt des scheibenförmigen Objekts.
-
Bei einer strukturierten Oberfläche eines scheibenförmigen Objekts umfasst jedes Feld mehrere unterschiedliche Gebiete, die unterschiedliche Ausprägungen des Fehlers haben. In jedem Feld wird für jedes Gebiet bestimmt, wie stark die Signale für die aus der Produktion kommenden Felder variieren. Es werden ein Mittelwert und eine Varianz für jedes Feld gebildet. Ferner wird zusätzlich noch ein Min-Wert und ein Max-Wert bestimmt. Bei den den Defekt enthaltenen Feldern werden die Werte der Gebiete getrennt erfasst. Die Verteilung der Signale für die Felder und der Gebiete werden für jede Kombination von Transformation und Detektionskanal bestimmt. Eine Detektion eines Defekts wird dadurch erreicht, dass das Differenzbild des jeweiligen Feldes durch die Varianz des Gebietes im jeweiligen Feld geteilt wird.
-
Bei dem erfindungsgemäßen Verfahren ist es möglich, dass anhand einer Lernphase definierte Defekte auf der Oberfläche des scheibenförmigen Objekts bewertet werden. Mittels der definierten Defekte ist es möglich, anhand der Signale dieser Defekte die Bestimmung der optimalen Kombination aus Transformation und Kanal durchzuführen. Dabei wird dann diejenige Transformation gewählt, für die die meisten den Defekt enthaltenen Felder außerhalb der Streubreite des Feldes auf der Produktion liegen und die größten Defektsignale liefern.
-
Es ist ebenso möglich, dass in der Lernphase das System durch Probieren oder durch Erfahrung des Benutzers eingelernt wird. Der Benutzer bestimmt dann diejenigen Felder, in denen Defekte zu erwarten sind.
-
Gemäß einer weiteren Ausgestaltung der Erfindung wird ein morphologischer Gradient auf dem transformierten Differenzbild gebildet, so dass Änderungen des Signals bewertet werden können.
-
Das erfindungsgemäße Verfahren findet im Bereich der Makroinspektion Anwendung. Die Farbdetektion gemäß dem Stand der Technik war auf die Bildung von Histogrammen in verschiedenen Farbräumen aufgebaut. Diese Art der Farbdetektion war nicht oder nur unzureichend in der Lage, die Defekte auf den Wafern auf der Produktion zu detektieren. Mit dem erfindungsgemäßen Verfahren ist es möglich, dass die gefundenen Defekte besser visualisiert werden können. Zur Visualisierung der Defekte kommt das Differenzbild (Field-Difference-Image (FDI)) zum Einsatz. Hinzu kommt nun die Differenzbilddetektion (Field-Difference-Detektion (FDD)). Mit Hilfe des Differenzbilds war es zwar möglich, Defekte gut zu visualisieren, jedoch nur schwer möglich, die richtige Transformationsvorschrift, den richtigen Detektionskanal und ein günstiges Detektionsgebiet zu definieren.
-
Im Makromodul der Vorrichtung zur Inspektion von scheibenförmigen Objekten sind zwei grundsätzlich unterschiedliche Detektionsansätze implementiert. Der erste Ansatz ist die pixelbasierte Detektion, wobei je ein Pixel mit einem Vergleichspartner verglichen und bei Abweichung ein Defekt generiert wird. Diese Detektion ist sehr gut zum Finden sehr kleiner kontraststarker Defekte geeignet. Das Rauschen, das in der Helligkeitsinformation des Pixels vorhanden ist, geht voll in die Detektion ein. Deshalb kann die Schwelle nicht bedingt klein gemacht werden. Die Intensitäten der Farbkanäle R, G und B werden unabhängig voneinander verarbeitet. Die Farbinformation und die Beziehung der Kanäle zueinander, spielt deswegen keine Rolle.
-
Bei der Farbdetektion wird im Gegensatz dazu das Fehlersignal auf einer größeren Fläche generiert (Farbtransformation, Histogrammbildung und Schwerpunktsberechnung). Deswegen ist das Signal weniger rauschempfindlich, jedoch ist die Ortsauflösung sehr gering. Die Farbinformation ist die entscheidende Information.
-
Der Ansatz der Differenzbilddetektion (FDD) ist ein Mittelweg, der versucht, die Stärken beider Detektionen zu vereinen. Um das Pixelrauschen zu minimieren, werden mehrere Pixel (4, 9, 16, 25 oder mehr) zu einem Detektionswert zusammengefasst. Die Anzahl der zusammenzufassenden Pixel kann über ein User-Interface ausgewählt werden. Somit ist es möglich, zwischen Ortsauflösung und Rauschunterdrückung zu wählen. Bevor die eigentliche Detektion beginnen kann, wird eine lokale Referenz bzw. Vergleichsreferenz berechnet. Für sie wird aus mehreren „gleichen” Bereichen auf der Oberfläche des Wafers durch Medianbildung eine defektfreie Vergleichsreferenz gebildet. Diese Referenz hat volle Pixelauflösung. Zur Bildung des Differenzbildes werden nun für n × m Pixel die Differenzen der Pixel des Detektionsfeldes mit den zugehörigen Pixeln der Vergleichsreferenz gebildet. Die Differenzen werden für jeden Farbkanal R, G und B getrennt aufsummiert und es ergibt sich im Idealfall ein RGB-Bild, welches im Idealfall den Wert {0, 0, 0} hat. Da die Signale in der Regel nicht sehr groß sind, wird noch eine Skalierung durch Multiplikation durchgeführt. Zur besseren Darstellung wird jeweils der Zahlenwert 128 dazu addiert, um auch negative Werte als Bild darstellen zu können. Als nächstes findet die Farbtransformation statt. Durch geeignete Wahl der Farbtransformation können die Signale in einem Kanal maximiert werden, während die unerwünschten Produktionsvariationen in einen anderen Kanal verlagert werden. Durch Normierung auf die Intensität ist auch eine Unabhängigkeit von der Beleuchtungsintensität zu erreichen.
-
Anschließend erfolgt die Separierung der Kanäle im Differenzbild (Farbe) und man erhält drei Graubilder.
-
Das Differenzbild ist in der Lage die Defekte zu visualisieren. Um jedoch zu einem verwertbaren Ergebnis zu kommen, müssen die Signale noch bewertet werden. Die einfachste Möglichkeit besteht in der Anwendung einer Schwelle. Alle Positionen, deren Werte größer als die Schwelle sind, werden als Defekt bewertet. Diese Vorgehensweise eignet sich jedoch nur auf unstrukturierten Wafern bzw. wenn man nur eine „cell area” von Speichern betrachtet. Will man das gesamte DIE eines strukturierten Wafers beurteilen, so sieht man, dass verschiedene Gebiete des DIE unterschiedliche Ausprägungen des Fehlers haben. Im Weiteren kann man sehen, dass die normalen Prozessschwankungen, welche bei der Herstellung von Halbleitersubstraten bzw. Wafern auftreten, sich verschieden innerhalb eines DIEs abbilden.
-
Aus diesem Grund verwendet die Differenzbilddetektion ein Modell, in dem für jedes Feld bzw. DIE bestimmt wird, wie stark die Signale für normale Produktions-DIE (POR) variieren. Es wird der Mittelwert und die Varianz für jedes Gebiet bestimmt. Zusätzlich werden noch ein Min- und ein Max-Wert bestimmt. Für die vom Defekt betroffenen DIE (DOI) werden die Werte der Gebiete getrennt erfasst. Da sich die Signale bei unterschiedlicher Farbtransformation und der Wahl des Detektionskanals unterscheiden, wird die Verteilung der Signale für die Produktions-DIE und die Signale für den mit dem Defekt behafteten DIE für jede Kombination von Transformation- und Detektionskanal bestimmt.
-
Die Differenzbilddetektion hat den Nachteil, dass nur wenn in der Lernphase ein Wafer mit definierten Defekten in bestimmten DIEs vorliegt, die optimale Transformation und Kanalkombination gefunden werden kann. Liegt ein solcher Wafer nicht vor, so kann man nur durch Probieren oder durch Erfahrung die Detektion optimal einlernen. Aber selbst dann wird die Streuung der Produktions-DIE immer berücksichtigt.
-
Um die Streubreite des Herstellungsprozesses von Wafern einzubeziehen, ist es möglich, mehrere Wafer zur Bestimmung der Streubreite des Produktions-DIEs heranzuziehen. Auch einem schon bestehenden Rezept kann ein Wafer als Produktions-DIE hinzugefügt werden, sollte es auf ihm Fehldetektionen geben.
-
Eine weitere Erweiterung der Differenzbilddetektion ist, dass ähnlich wie bei der pixelbasierten Gradientendetektion ein morphologischer Gradient auf dem transformierten Differenzbild gebildet wird. Somit wird nicht das Signal selbst bewertet, sondern die Änderung dieses Signals. Diese Detektion ist besonders für die Detektion ganz schwacher Signale in homogenen Gebieten geeignet, bei denen die großflächigen Abweichungen, die durch den Herstellungsprozess bedingt sind, sich störend auf die Detektion auswirken.
-
Im Folgenden sollen Ausführungsbeispiele die Erfindung und ihre Vorteile anhand der beigefügten Figuren näher erläutern.
-
1 zeigt eine schematische Darstellung eines Systems zur Detektion von Fehlern bzw. Defekten auf Wafern oder scheibenförmigen Objekten.
-
2 zeigt einen Ablaufplan des erfindungsgemäßen Verfahrens.
-
3a–3c zeigen den ersten Abschnitt des erfindungsgemäßen Verfahrens, bei dem ein Differenzbild erzeugt wird.
-
4a–4c zeigen die Anwendung einer Farbtransformation auf das Differenzbild und die Möglichkeit des Entfernens von niederfrequentem Rauschen aus dem Differenzbild.
-
5a–5c zeigen die Signale der Differenzbilder, die anhand der unterschiedlichen Kanäle berechnet worden sind.
-
6 zeigt eine Draufsicht auf einen Wafer, bei dem mehrere gleich große Felder die Oberfläche des Wafers bedecken.
-
7 zeigt den in 6 gekennzeichneten Bereich, vergrößert dargestellt.
-
8 zeigt einen DIE auf der Oberfläche des scheibenförmigen Substrats in vergrößerter und schematischer Darstellung.
-
9 zeigt die Situation, bei der vier Pixel zu einem Detektionswert eines Feldes zusammengefasst werden.
-
10 zeigt ein Beispiel, anhand dessen es möglich ist, die geeignete Transformation/Kanalkombination zu finden.
-
11 zeigt einen schematischen optischen Aufbau für die Aufnahme eines Bildes von der Oberfläche eines scheibenförmigen Objekts bzw. eines Wafers.
-
12 zeigt eine Darstellung der Erfassung der Oberfläche eines Wafers mit einen Aufnahmefenster einer Kamera.
-
Für gleiche oder gleich wirkende Elemente der Erfindung werden identische Bezugszeichen verwendet. Ferner werden der Übersicht halber nur Bezugszeichen in den einzelnen Figuren dargestellt, die für die Beschreibung der jeweiligen Figur erforderlich sind.
-
Die schematische Darstellung der 1 zeigt ein System 1 zur Inspektion und Detektion von Defekten auf Wafern bzw. scheibenförmigen Objekten 100. Das System 1 besteht z. B. aus mindestens einem Kassettenelement 3 für die Halbleitersubstrate, Wafer bzw. scheibenförmigen Objekte. In einer Messeinheit 5 werden die Bilder bzw. Bilddaten von den einzelnen Wafern aufgenommen. Zwischen den mindestens einem Kassettenelement 3 für die Halbleitersubstrate bzw. Wafer und der Messeinheit 5 ist ein Transportmechanismus 9 vorgesehen. Das System 1 ist von einem Gehäuse 11 umschlossen, wobei das Gehäuse eine Grundfläche 12 definiert. Im System 1 ist ferner ein Computersystem 15 integriert, mit dem die Bilder bzw. Bilddaten von den einzelnen gemessenen Wafern aufnimmt und verarbeitet. Das System 1 ist mit einem User-Interface 13 (Display) und einer Tastatur 14 versehen. Mittels der Tastatur 14 kann der Benutzer Dateneingaben zur Steuerung des Systems 1 oder auch Parametereingaben zur Aufwertung der Bilddaten von den einzelnen Wafern machen. Auf dem User-Interface 13 werden dem Benutzer des Systems 1 mehrere Benutzer-Interfaces (BUI) dargestellt. In dem System 1 ist das erfindungsgemäße Verfahren für die Makroinspektion von Wafern implementiert.
-
2 zeigt eine schematische Darstellung des Fließschemas des erfindungsgemäßen Verfahrens, das zusätzlich in den 3a bis 3c, 4a bis 4c und 5a bis 5c anhand eines scheibenförmigen Objekts 100 graphisch dargestellt ist. Der Beginn des erfindungsgemäßen Verfahrens erfolgt in einem Schritt S20, wobei die Bestimmung einer Vergleichsreferenz aus der Vielzahl der gleichen Felder 60 auf der Oberfläche 100o eines scheibenförmigen Objekts 100 durchgeführt wird. Anschließend wird in einem Schritt S22 ein Differenzbild 31 erzeugt. Dieses Differenzbild 31 erhält man durch Subtraktion der Vergleichsreferenz von dem aufgenommenen Bild 30. Die aufgenommenen Bilder 30 stammen z. B. von Wafern oder Halbleitersubstraten, die aus dem Produktionsprozess für die Herstellung von Wafern kommen.
-
In einem nachfolgenden Schritt S24 erfolgt das Anwenden einer Farbtransformation auf das Differenzbild 31. Auf das Differenzbild 31 werden verschiedene Farbtransformationen angewendet. Jede Farbtransformation wird in einem nachfolgenden Schritt S25 bewertet. Es werden hier die Signale bewertet, um nach einem vorbestimmten Schema beurteilen zu können, ob die jeweilige ausgewählte Farbtransformation oder der jeweils ausgewählte Detektionskanal geeignet ist, um eine möglichst zuverlässige Detektion der Defekte auf der Oberfläche 100o des Wafers erzielen zu können. In einem Schritt S26 erfolgt die Bestimmung der Verteilung der Signale für jeden zu untersuchenden Defekt. Im letzten Schritt S28 erfolgt letztendlich das Auswählen derjenigen Kombination aus Transformation und Detektionskanal, bei der die meisten Defekte außerhalb einer vordefinierten Streubreite liegen.
-
In den nachstehenden 3a bis 3c, 4a bis 4c und 5a bis 5c wird bildlich dargestellt, wie Inspektion und Detektion von Defekten auf der Oberfläche von scheibenförmigen Objekten abläuft. Obwohl in der nachfolgenden Beschreibung ausschließlich strukturierte oder unstrukturierte Wafer zur Beschreibung der Erfindung verwendet werden, soll dies nicht als eine Beschränkung der Erfindung aufgefasst werden.
-
3a zeigt das aufgenommene Bild 30 der Oberfläche 100o eines scheibenförmigen Objekts 100. Das Bild 30 des scheibenförmigen Objekts 100 (Wafer) wird als RGB Bild dargestellt. Das Aufnehmen eines Bildes 30 des jeweiligen scheibenförmigen Objekts 100 wird dadurch erreicht, dass die gesamte Oberfläche 100o des jeweiligen scheibenförmigen Objekts 100 mit einer Vielzahl von N Feldern erfasst wird. Mit einer Vergleichsreferenz (nicht dargestellt) wird ein Differenzbild 31 (siehe 3b) erzeugt. Die Vergleichsreferenz wird dadurch gebildet, dass aus der Vielzahl der N der Größe nach gleichen Feldern 60 ein Mittelwert gebildet wird, der somit die defektfreie Vergleichsreferenz darstellt. Die Vergleichsreferenz ist ein Feld 60 der Oberfläche 100o des scheibenförmigen Objekts 100, das der Größe nach dem Feldern 60 entspricht, mit denen die gesamte Oberfläche 100o eines scheibenförmigen Objekts 100 erfasst wird Das Differenzbild 31 wird dadurch gebildet, dass die Vergleichsreferenz von jedem Feld der Oberfläche 100o des scheibenförmigen Objekts 100 subtrahiert wird. Die Vergleichsreferenz besitzt dabei die gleiche Größe wie ein Feld auf der Oberfläche 100o des scheibenförmigen Objekts 100, wobei sich aus einer Vielzahl der Felder 60 die gesamte Oberfläche 100o des scheibenförmigen Objekts 100 zusammensetzt.
-
Bei dem Produktionsprozess der Wafer wird von einem Wafer eine Vergleichsreferenz erstellt. Diese Vergleichsreferenz wird dann auf alle Wafer desgleichen Typs und des gleichen Produktionsschritts angewendet. Die Inspektion und Detektion von Defekten erfolgt derart, dass von dem mit einer Vielzahl von N Feldern 60 aufgenommenem Bild der Oberfläche 100o des Wafers die Vergleichsreferenz subtrahiert wird. Somit erhält man das Differenzbild 31 der Oberfläche 100o des Wafers.
-
3c zeigt die visuelle Darstellung der Oberfläche 100o des scheibenförmigen Substrats 100, auf das eine Histogrammstreckung 32 angewendet worden ist.
-
4a zeigt die schematische Darstellung eines Radialpolynoms 40, welches zur Reduzierung von niederfrequentem Rauschen auf das Differenzbild 31 angewendet werden kann. Das Radialpolynom 40 kann z. B. von fünfter Ordnung sein.
-
4b zeigt die Farbtransformation 41 des Differenzbildes 31. Dabei stellt ein erster Kanal CH0 die Addition des roten Kanals R, des blauen Kanals B und des grünen Kanals G dar. CH0 = R + B + G
-
Ein zweiter Kanal CH1 stellt die Summe des blauen Kanals B und des grünen Kanals G dar, die um den roten Kanal R vermindert ist. CH1 = B + G – R
-
Ein dritter Kanal CH2 stellt die Summe des roten Kanals R und blauen Kanals B dar, die um den grünen Kanal G vermindert ist. CH2 = R + B – G
-
In 4c ist das Differenzbild 43 dargestellt, bei dem ebenfalls das niederfrequente Rauschen entfernt worden ist. Das Filtern mit dem niederfrequenten Rauschen stellt keine Bedingung dar, die ständig angewendet wird, um die Defekte auf der Oberfläche 100o des Wafers oder der scheibenförmigen Substrats 100 besser darstellen zu können.
-
5a zeigt das Signal des ersten Kanals CH0 in der visuellen Darstellung 50 der Oberfläche 100o des scheibenförmigen Objekts 100. 5b zeigt die visuelle Darstellung 51 der Oberfläche 100o des scheibenförmigen Objekts 100, gemäß dem zweiten Kanal CH1. 5c zeigt die visuelle Darstellung 52 der Oberfläche 100o des scheibenförmigen Objekts 100, gemäß dem dritten Kanal CH2. Die Signale in den unterschiedlichen Darstellungen von 5a bis 5c können nur dadurch berechnet werden, in dem die Signale des roten Kanals R, des blauen Kanals B und des grünen Kanals G separiert sind. Anhand der in 5b gezeigten visuellen Darstellung 51 der Oberfläche 100o des scheibenförmigen Objekts 100 ist klar erkennbar, dass bei dem zweiten Kanal CH1 die Detektion der Defekte D1 bis D6 eindeutig ist. In der Regel handelt es sich bei den zu findenden Defekten D1 bis D6 um vordefinierte Defekte auf der Oberfläche 100o des scheibenförmigen Objekts 100. Für die Detektion während des Produktionsprozesses wird dann diejenige Transformation/Kanalkombination gewählt, bei der die meisten Defekte auf der Oberfläche 100o des scheibenförmigen Objekts 100 detektiert werden.
-
6 zeigt eine schematische Ansicht der Oberfläche 100o eines scheibenförmigen Objekts 100. Die Oberfläche 100o des scheibenförmigen Objekts 100 kann in eine Vielzahl von Feldern 60 zerlegt werden. Mit der Vielzahl der Felder 60 kann die gesamte Oberfläche 100o des scheibenförmigen Objekts 100 aufgenommen bzw. optisch erfasst werden. Jedes der Vielzahl der N Felder 60 hat dabei die gleiche Größe. Mit dem erfindungsgemäßen Verfahren können sowohl unstrukturierte Objekte bzw. Wafer, als auch strukturierte Objekte bzw. Wafer inspiziert werden. Bei strukturierten Objekten bzw. Wafern ist die Größe des einzelnen Feldes 60 derart bemessen, dass es einem ganzzahligen gebrochenen Vielfachen eines DIEs (siehe 7) auf der Oberfläche 100o des scheibenförmigen Objekts 100 entspricht. Jedes einzelne Feld 60 auf der Oberfläche des scheibenförmigen Objekts 100 kann z. B. dem Aufnahmefenster 22 einer Kamera 8 entsprechen, mit dem nacheinander die gesamte Oberfläche 100o des scheibenförmigen Objekts 100 innerhalb dessen Umfang 101 erfasst wird.
-
7 zeigt eine vergrößerte Darstellung des in 6 mit M bezeichneten und gestrichelten Bereichs M. Bei der hier gezeigten Darstellung entspricht jedes Feld 60 einem DIE 70 auf der Oberfläche des scheibenförmigen Objekts 100. Die Felder 60 sind dabei derart angeordnet, dass sie sich innerhalb des Umfangs 101 des scheibenförmigen Objekts 100 befinden.
-
8 zeigt eine vergrößerte Darstellung eines DIEs 70, welches mit einem einzigen Feld 60 aufgenommen wird. Das DIE enthält unterschiedliche Gebiete 81, 82, 83 und 84, welche bei der Bewertung der idealsten Farbtransformation bzw. Kanalkombination unterschiedlich bewertet bzw. gewichtet werden. Die Differenzbilddetektion verwendet dabei ein Modell, in dem für jedes Gebiet 81, 82, 83 und 84 eines DIEs der Produktion bestimmt wird, wie stark die Signale für dieses Produktions-DIE variieren. Es werden der Mittelwert und die Varianz des Gebiets bestimmt, die letztendlich in die Bewertung eingehen. Das gesamte DIE 60 des strukturierten Wafers umfasst somit verschiedene Gebiete 81, 82, 83 und 84 die unterschiedliche Ausprägungen des Fehlers haben können. Dieses wird mit der entsprechenden Gewichtung bei der Beurteilung der Differenzbilddetektion gewichtet.
-
9 zeigt die schematische Ansicht eines Feldes 60. Hier sind vier Pixel 901, 902, 903 und 904 zu einem Detektionsbereich 91 zusammengefasst. Durch das Zusammenfassen von mehreren Pixeln 901, 902, 903 und 904 zu einem Detektionsbereich 91 reduziert man somit das Pixelrauschen innerhalb eines Feldes 60. Über ein User-Interface bzw. Display 13 des Systems 1 kann der Benutzer die Anzahl der Pixel 901, 902, 903 und 904 wählen, die zu einem Detektionswert bzw. Detektionsbereich 91 zusammengefasst werden, um das Pixelrauschen zu minimieren. Bei einer geringen Zahl von Pixeln 901, 902, 903 und 904, die zu einem Detektionsbereich 91 zusammengefasst werden, entscheidet sich der Benutzer für eine Ortsauflösung. Bei einer hohen Zahl von Pixeln 901, 902, 903 und 904, die zu einem Detektionsbereich 91 zusammengefasst werden, entscheidet sich der Benutzer für eine Rauschunterdrückung. Je nach Detektionsproblem, kann der Benutzer zwischen der Ortsauflösung und der Rauschunterdrückung wählen, um somit ein optimales Detektionsergebnis zu erhalten.
-
10 zeigt ein Beispiel für das Vorgehen bei dem erfindungsgemäßen Verfahren. Hierbei wird nur ein Gebiet eines DIE betrachtet und auch nur für eine Transformation/Kanalkombination. Für alle Produktions-DIEs des Wafers, bzw. des scheibenförmigen Objekts 100 ergibt sich ein Mittelwert χ – und eine Varianz σ. Ebenso kann der Verteilung V ein Minimalwert χmin und ein Maximalwert χmax zugeordnet werden. Zur Darstellung der Berechnungsmethode wird angenommen, dass auf dem visuellen Bild des scheibenförmigen Objekts 100 vier DIEs (DOI1, DOI2, DOI3, DOI4) vorhanden sind, die ein Produktions-DIE darstellen, das jeweils einen Fehler bzw. einen Defekt umfasst. Die Signale der vier Produktions-DIEs werden mit χDOI1, χDOI2, χDOI3 und χDOI4 bezeichnet. Bei dem in 10 gezeigten Beispiel liegen das Signal χDOI1 des ersten Defekts, das Signal χDOI2 des zweiten Defekts und das Signal (χDOI3) des dritten außerhalb der Streubreite des Produktions-DIEs. Das Signal (χDOI4) des vierten Defekts dagegen ist mit dieser hier verwendeten Transformation/Kanalkombination nicht zu detektieren, da es innerhalb der Streubreite liegt. Normiert man die Distanz des Signals eines Defekts auf die Streuung der Produktions-DIEs, so erhält man das Defektsignal SDOI des scheibenförmigen Objekts (siehe Gleichung 1).
-
-
Wird der Betrag des Defektsignals SDOI mit einer Schwelle bewertet, so erhält man eine Detektion, die die Produktvarianz berücksichtigt. Gebiete die auf dem gesamten Wafer sehr homogen sind, werden sehr scharf bewertet, d. h. auch kleine Unterschiede werden hier gefunden, während in Gebieten mit starkem Strukturrauschen weniger scharf bewertet wird.
-
Gleichzeitig kann in der Lernphase durch Bewertung der Signale der Defekte die Bestimmung der optimalen Transformation/Kanalkombination durchgeführt werden. Während der Lernphase ist es z. B. möglich, dass diese mit Wafern bzw. scheibenförmigen Objekten 100 durchgeführt wird, auf denen definierte Defekte vorhanden sind. Während der Lernphase wird dann diejenige Transformation gewählt, für die die meisten scheibenförmigen Objekten 100 der Defekt außerhalb der Streubreite des Produktions-DIEs liegt und die größten Defektsignale liefert. Gleichzeitig ist es möglich, eine automatische Bestimmung des „area of interest” durchzuführen. Nur Gebiete, wo der Defekt im Produktions-DIE außerhalb der Streubreite des Produktions-DIE liegt, können ein sinnvolles Signal liefern. Liegen dagegen alle Defekte innerhalb der Streubreite des Produktions-DIEs, so liefert dieses scheibenförmige Objekt 100 auch in der „Run”-Phase auf einen unbekannten DIE kein brauchbares Signal.
-
Die Farbtransformation der Differenzbilder kann jede beliebige Transformation sein. Denkbar sind verschiedene Farbräume, wie z. B. YUV, HSI, HSL, Lad, XYZ, usw. Auch beliebige Kombinationen der Kanäle miteinander, wie z. B.:
sind möglich.
-
Derzeit sind zehn verschiedene Transformationen im System 1 hinterlegt, jedoch ist die Liste beliebig erweiterbar, da bestehende Recipes (Rezepte) die Transformation verwenden, für die die Defekte das optimale Signal zum Zeitpunkt der Lernphase geliefert haben.
-
In der Lernphase kann ein scheibenförmiges Objekt 100 verwendet werden, das definierte Defekte an definierten Stellen aufweist. Für die Lernphase wird speziell ein Wafer oder scheibenförmiges Objekt 100 hergestellt, bei dem die Defekte an definierten Stellen eingebracht sind. Während der Lernphase wird dann diejenige Transformation/Kanalkombination verwendet, mit der mit meisten Defekte gefunden werden. Diese Transformation/Kanalkombination wird dann auf alle Wafer oder scheibenförmigen Objekte des gleichen Typs während der laufenden Produktion angewendet, um die Defekte während der Produktion zu detektieren bzw. zu inspizieren.
-
11 zeigt eine schematische Darstellung einer optischen Einrichtung 20 des Systems 1 für die Aufnahme eines Bildes von der Oberfläche eines scheibenförmigen Objekts 100. Das scheibenförmige Objekt 100 kann ein Wafer sein. Der Wafer ist dabei auf einem in X-Koordinatenrichtung und in Y-Koordinatenrichtung beweglichen Tisch 2 aufgelegt. Für die Beleuchtung der Oberfläche 100o des scheibenförmigen Objekts 100 sind mindestens eine Auflichtbeleuchtungseinrichtung 4 und mindestens eine Dunkelfeldbeleuchtungseinrichtung 6 vorgesehen. Mit dem Detektor bzw. einer Kamera 8 kann das von der Oberfläche 100o des scheibenförmigen Objekts 100 ausgehende Licht in elektrische Signale umgewandelt werden. In der hier dargestellten Ausführungsform wird das Licht der Auflichtbeleuchtungseinrichtung 4 über einen Strahlteiler 12 in den Detektionsstrahlengang 10 der Kamera 8 eingekoppelt. In der hier dargestellten Ausführungsform wird die gesamte Oberfläche 100o des scheibenförmigen Objekts 100 mit einem sog. Mäanderscan (siehe 12) aufgenommen. Dabei wird immer ein Streifen 16 des Teils der Oberfläche 100o des scheibenförmigen Objekts 100 aufgenommen.
-
12 zeigt eine Draufsicht auf die Oberfläche 100o des scheibenförmigen Objekts 100. Dabei ist das Verfahren dargestellt, mit dem die gesamte Oberfläche 100o des scheibenförmigen Objekts 100 erfasst wird. Da ein Aufnahmefenster 22 der Kamera 8 kleiner ist als der Durchmesser des scheibenförmigen Objekts 100 muss zur Erfassung der gesamten Oberfläche 100o des scheibenförmigen Objekts 100 ein sog. Mäanderscan durchgeführt werden. Das Aufnahmefenster 22 erfasst einen Teil der Oberfläche 100o des. Das Aufnahmefenster 22 wird nun gemäß einer Mäander 21 derart über die Oberfläche 100o des scheibenförmigen Objekts 100 bewegt, dass dessen gesamte Oberfläche 100o erfasst wird. Ausgehend von einer Startposition 22a wird nun entweder die Kamera 8 oder der Tisch 2 auf dem sich das scheibenförmigen Objekts 100 befindet, in Y-Richtung verfahren. Das Aufnahmefenster 22 der Kamera 8 überstreicht dabei einen rechteckförmigen Bereich 241. Der Tisch 2 wird so lange in Y-Koordinatenrichtung verfahren, bis das Aufnahmefenster 22 am Endpunkt 22e angelangt ist. Am Endpunkt 22e wird die Bewegung des Tisches 2 in Y-Koordinatenrichtung gestoppt. Am Endpunkt 22e erfolgt dann eine Translation des Tisches 2 oder der Kamera 8 in X-Koordinatenrichtung. Die Translation in X-Koordinatenrichtung ist dabei nicht größer als die Breite des Aufnahmefensters 22. Es ist für einen Fachmann selbstverständlich, dass die Translation in X-Koordinatenrichtung auch etwas kleiner sein kann, als die Breite der Aufnahmefensters 22. In diesem Fall erhält man einen kleinen Überlappungsbereich 25.
-
Die gegenwärtige Erfindung ist in Bezug auf bevorzugte Ausführungsformen beschrieben worden. Dennoch können Änderungen und Abwandlungen der hier vorgestellten Ausgestaltungen durchgeführt werden, ohne dabei den Schutzbereich der nachstehenden Ansprüche zu verlassen.