-
Verfahren
zum Ermitteln einer Eigenschaft einer strukturierten Schicht
-
Die
vorliegende Erfindung bezieht sich auf ein Verfahren zum Ermitteln
einer Eigenschaft einer strukturierten Schicht an einer Oberfläche eines
Substrats, insbesondere einer lateralen Abmessung oder eines Volumens
einer Ausnehmung in der Schicht oder einer Eigenschaft eines Materials,
das in der Ausnehmung angeordnet ist.
-
In
integrierten Schaltungen werden Einzelbauelemente auf einem Chip
in immer geringerem gegenseitigen Abstand angeordnet. Gegenwärtig beträgt der Standard
bei der DRAM-Technologie
wenige 10 nm. Es treten deshalb zunehmend elektrische Wechselwirkungen, Übersprechen
und Leckagen von kritischen Strömen
auf. Um solche elektrische Wechselwirkungen zwischen den einzelnen
Bauelementen zu verhindern, werden Isolationsgräben zwischen den einzelnen
Bauelementen verwendet. Eine große Verbreitung haben dabei
insbesondere flache Isolationsgräben
bzw. Shallow Isolation Trenches gefunden. Die Shallow Trench Isolation
(STI) ist eine weit verbreitete Technologie. Sie hat in den vergangenen
Jahren an Komplexität
gewonnen und erfüllt
heute sowohl die Anforderungen, die in Zusammenhang mit Logik-Produkten
gestellt werden, als auch die Anforderungen, die in Zusammenhang
mit Speicherprodukten oder in Speicher eingebettete Produkte (memory-embedded
products) gestellt werden. Die Überwachung
und Vermessung von Isolationsgräben
ist dabei ein kritischer Prozessschritt. Besonders in Logik-Produkten
sind Isolationsgräben
in der Regel nicht regelmäßig oder
symmetrisch angeordnet, sondern quasizufällig über den Wafer verteilt.
-
Das
STI-Verfahren zum Erzeugen einer elektrischen Isolation zwischen
einzelnen Bauelementen einer integrierten Schaltung besteht im Grunde
darin, einen Graben zwischen den Bauelemen ten zu bilden, ein Oxid oder
auch einen anderen Isolator mit einer Schichtdicke abzuscheiden,
die größer ist
als die Tiefe des Grabens, und den Überstand mittels chemisch-mechanischen
Polierens (CMP) zu entfernen. Durch den CMP-Schritt wird die Oberfläche näherungsweise
eben, und es wird jedes darüber
hinausragende Oxid entfernt. Der Isolationsgraben umgibt dabei das
elektrische Bauelement vorzugsweise im Wesentlichen vollständig, um
es von anderen aktiven elektrischen Bereichen, insbesondere anderen
elektronischen Bauelementen zu isolieren.
-
Um
das Füllen
des Isolationsgrabens und den CMP-Schritt effizient steuern und
durchführen
zu können,
sind die Ätztiefe
und das Grabenprofil als für
den STI-Prozess kritische Parameter erster Ordnung zu überwachen.
Um das elektrische Verhalten eines Bauelements, das durch einen
Isolationsgraben, insbesondere einen flachen Isolationsgraben bzw.
eine STI im Wesentlichen oder vollständig umschlossen ist, zu modellieren
oder vorherzusagen, ist jedoch eine darüber hinausgehende, genauere
Analyse erforderlich. Zu den Parametern, die für diesen Zweck relevant sind,
zählen
die Dicken und die physikalischen Eigenschaften (beispielsweise
Leitfähigkeit,
Dotierstoffkonzentration und Widerstand) einzelner Schichten. Diese
Parameter müssen überwacht
und verfolgt werden, um das elektrische Verhalten in der Umgebung
von STIs vorherzusagen.
-
Es
existieren mehrere herkömmliche
Verfahren zur gelegentlichen, periodischen oder quasi-kontinuierlichen Überwachung
der genannten Parameter entlang einer Fertigungslinie. Ein wichtiges
Verfahren ist die Rasterkraft-Mikroskopie (AFM; AFM = Atomic Force
Microscopy), die die bevorzugte industrielle Lösung darstellt. Die Rasterkraft-Mikroskopie
ist ein ausgereiftes Überwachungswerkzeug
für die
Produktion von Strukturgrößen bis
herab zu ca. 70 nm. Sie liefert jedoch nur unvollständige Information über strukturierte
Bereiche wie Löcher,
Gräben,
Isolationsgräben
und insbesondere flache Isolationsgräben. Die Rasterkraft-Mikroskopie liefert
lediglich eine gesamte Ätztiefe
und ein Ätztiefenprofil.
Für eine
vollständige
Charakterisierung der untersuchten Struktur sind komplementäre destruktive
Verfahren erforderlich. Zu den Nachteilen und Beschränkungen
der Rasterkraft-Mikroskopie zählen
insbesondere folgende Punkte:
- – Der Durchsatz
eines Rasterkraft-Mikroskops ist mit gegenwärtig maximal ca. 7 Wafern pro
Stunde niedrig.
- – Tiefe
Strukturen können
mit Rasterkraft-Mikroskopie nur in beschränktem Umfang erfasst werden.
Die Form der AFM-Spitze
stellt insbesondere einen limitierenden Faktor für die Erfassung tiefer Gräben dar.
- – Die
Rasterkraft-Mikroskopie liefert nur globale geometrische Informationen
(beispielsweise ein Oberflächenprofil
und eine Gesamttiefe). Detaillierte Informationen bezüglich einzelner
Schichten (Dicke, Materialeigenschaften etc.) werden nicht geliefert.
- – Die
Rasterkraft-Mikroskopie hängt
von der zufällig
gestreuten Qualität
der speziell angefertigten AFM-Spitzen ab, die darüber hinaus
teure Verbrauchs- bzw. Ersatzteile darstellen.
- – Die
Verwendung der Rasterkraft-Mikroskopie ist gegenwärtig durch
die Strukturgrößen der
Technologie begrenzt. Wenn die untersuchten Strukturen Löcher mit
einem kleinen Durchmesser (beispielsweise < 70 nm) sind, kann die Rasterkraft-Mikroskopie
keine genauen Messungen liefern, da die AFM-Spitzen nicht oder nicht
vollständig
in diese Löcher
eindringen können.
Dies stellt einen begrenzenden Faktor für den Einsatz bei zukünftigen
Technologieschritten dar.
- – Die
Rasterkraft-Mikroskopie ist ein diskretes Messverfahren, da sie
in einem Durchgang nur jeweils einen sehr be schränkten Bereich abtastet. Zur
Erfassung statistischer Daten muss eine sehr große Anzahl von Messungen durchgeführt werden.
- Im Fall ausgedehnter strukturierter Bereiche, beispielsweise
im Fall von STI-Bereichen ist die Rasterkraft-Mikroskopie durch ihre maximale Abtastlänge und
komplizierte Geometrien begrenzt. Die Rasterkraft-Mikroskopie kann
insbesondere keine ausgedehnten Bereiche mit einer zufälligen oder
quasi-zufälligen
Struktur charakterisieren.
- – Die
Rasterkraft-Mikroskopie liefert keine Information über Füllfaktoren
und eignet sich nicht für
eine chemische Charakterisierung.
-
Verfahren
und Vorrichtungen zur Erfassung von Oberflächenprofilen, insbesondere
so genannte Surface Profiler, haben im Wesentlichen die gleichen
Beschränkungen
wie die Rasterkraft-Mikroskopie,
wobei jedoch die Abtastlänge
größer und
die Empfindlichkeit geringer als die in der Rasterkraft-Mikroskopie
sind.
-
Die
Rasterelektronen-Mikroskopie stellt in diesem Zusammenhang ein destruktives
Verfahren dar, da ein Wafer erst gebrochen werden muss, um an dem
Bruch eine vertikale Struktur mittels Rasterelektronen-Mikroskopie
erfassen zu können.
Ferner leidet die Rasterelektronen-Mikroskopie unter einem sehr
beschränkten Durchsatz
und bietet keine Lösung
für eine
hohe Abtastrate an einer Fertigungslinie.
-
Die
Vermessung durch eine Erfassung von Streulicht, die auch als Scatterometry
bekannt ist, konkurriert hinsichtlich der Erfassung von strukturierten
Bereichen (STI, Ausnehmungen, etc.) mit der Rasterelektronen-Mikroskopie
und der Rasterkraft-Mikroskopie. Sie ist auch bei Strukturgrößen von
90 nm und 70 nm einsetzbar, weist jedoch ebenfalls eine Reihe von
Nachteilen auf:
- – Die Scatterometry ist derzeit
nur auf periodische eindimensionale Teststrukturen (beispielsweise
Gitter aus beabstandeten Linien) neben dem eigentlichen zu fertigenden
Array anwendbar. Periodische oder zufällige bzw. quasi-zufällige zwei-
oder dreidimensionale Merkmale in einem Array können nicht erfasst werden.
Für eine
Anwendung im Zusammenhang mit der STI muss für jedes neue Layout der integrierten Schaltung
oder auch nur der Isolationsgräben
eine Korrelation zwischen einer periodischen Teststruktur und den
quasi-zufälligen
Strukturen in dem eigentlichen Array gefunden werden.
- – Statistische
Daten an realen integrierten Schaltungen oder Bauelementen werden
nicht geliefert.
- – Die
Grabentiefe ist auf ca. 1 μm
beschränkt.
Tiefe Gräben,
beispielsweise mit einer Tiefe von 6 μm bis 8 μm, wie sie gegenwärtig zahlreiche
Anwendungen finden, können
nicht ausgemessen werden.
-
Ein
Problem bzw. eine Aufgabenstellung, für die gegenwärtig überhaupt
keine befriedigende Lösung vorhanden
ist, stellt die Erfassung von Seitenwandschichten bzw. Seitenwandbeschichtungen
in Ausnehmungen und von deren Schichtdicken dar. Beispielsweise
werden Ausnehmungen mit TEOS-Siliciumoxidschichten ausgekleidet,
die durch chemische Gasphasenabscheidung aus Tetraethyl-ortho-Silicat
erzeugt werden. Für die
Erfassung der Dicke eines solchen TEOS-Kragens bzw. -Randes ist
derzeit kein befriedigendes Verfahren entwickelt. Für eine fortgeschrittene
Prozesskontrolle bzw. Verfahrensüberwachung
ist es jedoch erforderlich, die Dicke einer solchen TEOS-Schicht zu kennen.
-
Insbesondere
ist die Rasterkraft-Mikroskopie kritischer Dimensionen, die prinzipiell
für diese
Anwendung geeignet sein könnte,
für die
gegenwärtig
entwickelten Strukturgrößen von
90 nm und 70 nm nicht anwendbar. Auch die exakte Bestimmung der
Form bzw. Gestalt der AFM-Spitze erzeugt Probleme, die die Genauigkeit
der Messung größerer Masseleiter
reduzieren. Ein weiteres Problem ist die begrenzte Tiefe, die abgetastet
werden kann.
-
Auch
die Scatterometry ist für
die Erfassung der beschriebenen TEOS-Schichtdicken gegenwärtig noch
nicht geeignet, da sie noch nicht weit genug entwickelt ist. Bei
der Scatterometry wird die Entwicklung in Richtung auf kleine Masseleiter
vorwärts
getrieben, große
Masseleiter (ca. 0,5 μm)
liegen nicht im Zentrum des Interesses. Ferner weist die Scatterometry
Limitierungen bezüglich
tiefer Strukturen (beispielsweise 8 μm) auf.
-
Die
US 4,278,353 beschreibt
eine optische Untersuchung einer Goldoberfläche, bei der die Reflektivität der Goldoberfläche untersucht
wird.
-
Die
DE 198 52 323 A1 beschreibt
ein Verfahren zum Bestimmen der Dicke von auf einem Substrat vorgesehenen
Schichten, bei dem das gemessene Reflexionsvermögen mit einem aus einem vorgegebenen optischen
Modell berechneten Reflexionsvermögen verglichen wird. Schichtdicken
des Modells werden so lang variiert, bis eine minimale Abweichung
zwischen dem gemessenen und dem berechneten Reflexionsvermögen vorliegt.
-
Die
DE 199 50 559 A1 beschreibt
ein Verfahren zum Bestimmen von geometrischen Strukturen auf oder
in einem Substrat, sowie von Materialparametern, bei dem ein gemessenes
Reflexionsvermögen
mit einem aus einem optischen Modell berechneten Reflexionsvermögen verglichen
wird. Parameter wie die Tiefe, die Breite, der Abstand von Substrat-
und Schichtstrukturen und spektrale Materialparameter werden so
lange variiert, bis die Abweichung zwischen berechnetem und gemessenem
Reflexionsvermögen
minimal ist.
-
Die
Aufgabe der vorliegenden Erfindung besteht darin, ein Verfahren
zum Ermitteln oder Prüfen
einer lateralen Abmessung oder eines Volumens einer Ausnehmung in
einer Schicht an einer Oberfläche
eines Substrats oder einer Eigenschaft eines Materials, das in der
Ausnehmung angeordnet ist, und ein Verfahren zum Herstellen eines
Bauelements mit einer Ausnehmung in einer Schicht zu schaffen.
-
Diese
Aufgabe wird durch Verfahren gemäß Anspruch
1 bzw. 12 gelöst.
-
Bevorzugte
Weiterbildungen der vorliegenden Erfindung sind in den abhängigen Ansprüchen definiert.
-
Die
vorliegende Erfindung schafft ein Verfahren zum Ermitteln einer
lateralen Abmessung oder eines Volumens einer Ausnehmung in einer
Schicht an einer Oberfläche
eines Substrats oder einer Eigenschaft eines Materials, das in der
Ausnehmung angeordnet ist, bei dem die Schicht mit der Aus nehmung
mit einer elektromagnetischen Abtast-Strahlung mit einer Wellenlänge, die
größer als
eine laterale Abmessung der Ausnehmung ist, bestrahlt wird. Aus
einer Wechselwirkung zwischen der Abtast-Strahlung und der Schicht
mit der Ausnehmung geht eine elektromagnetische Antwort-Strahlung
hervor, die empfangen wird. Aus der empfangenen elektromagnetischen
Antwort-Strahlung werden Charakterisierungsdaten bestimmt, welche
die Wechselwirkung zwischen der Schicht mit der Ausnehmung und der
Abtast-Strahlung charakterisieren, wobei die Charakterisierungsdaten
die laterale Abmessung oder das Volumen der Ausnehmung oder die
Eigenschaft des in der Ausnehmung angeordneten Materials abbilden.
Die laterale Abmessung oder das Volumen der Ausnehmung oder die
Eigenschaft des in der Ausnehmung angeordneten Materials wird anhand
der Charakterisierungsdaten ermittelt.
-
Das
erfindungsgemäße Verfahren
ermöglicht
eine zerstörungsfreie
Bestimmung einer lateralen Abmessung oder eines Volumens einer Ausnehmung
in einer Schicht oder einer Eigenschaft eines Materials, das in
der Ausnehmung angeordnet ist. Es kann somit zur Prozesskontrolle
innerhalb der Produktionslinie eingesetzt werden. Ein Wafer oder
ein anderes Substrat, an dem das erfindungsgemäße Verfahren angewendet wird,
kann anschließend
weiter prozessiert werden, da der Wafer bzw. das Substrat bei dem
erfindungsgemäßen Verfahren
weder zerstört
noch beschädigt
wird. Dies senkt einerseits in erheblichem Umfang die Kosten des
erfindungsgemäßen Verfahrens
und ermöglicht
andererseits erforderlichenfalls auch eine Erfassung oder Prüfung jedes
einzelnen Wafers vor einer Weiterverarbeitung. Das erfindungsgemäße Verfahren
dient damit der Optimierung des Herstellungsverfahrens von Bauelementen
mit Ausnehmungen in Schichten und insbesondere von integrierten
Halbleiterschaltungen. Die vorliegende Erfindung ermöglicht damit
eine wesentliche Verbesserung der Ausbeute der Herstellungsverfahren
und damit eine Senkung der Herstellungskosten.
-
Ein
weiterer Vorteil des erfindungsgemäßen Verfahrens besteht darin,
dass es keine Probenpräparation
erfordert und innerhalb einer sehr kurzen Zeit durchführbar ist.
Es ermöglicht
deshalb einen im Vergleich zu den oben beschriebenen herkömmlichen
Verfahren hohen Durchsatz von bis zu 15 Wafern pro Stunde und darüber.
-
Ferner
liefert das erfindungsgemäße Verfahren
sowohl globale als auch detaillierte geometrische Informationen
bzw. Dimensionen, beispielsweise die totale Ätztiefe und die Dicke einer
einzelnen Schicht. Darüber
hinaus ermöglicht
es einen Zugriff auf physikalische Eigenschaften von Schichten,
beispielsweise elektrische Eigenschaften, Dotierstoffpegel und Konzentrationen.
-
Die
oben genannten Vorteile führen
zu einer Reduzierung der physikalischen Ausfallanalyse (PFA, PFA
= Physical Failure Analysis). Insbesondere ermöglicht die vorliegende Erfindung
ein besseres Verständnis des
elektrischen Verhaltens für
Modellierungszwecke, und es werden mehr Parameter gleichzeitig erfasst.
-
Ein
weiterer Vorteil besteht darin, dass bei einer Wellenlänge, die
größer als
die typische Strukturgröße und damit
insbesondere größer als
eine laterale Abmessung einer Ausnehmung ist, keine Streueffekte
auftreten. Dieser Vorteil tritt bei der bevorzugten Verwendung von
Infrarotlicht besonders deutlich zutage, da dessen Wellenlänge typischerweise
zehn bis hundert Mal so lange ist wie die kritische Dimension in
modernen Halbleiterstrukturen. Die vorliegende Erfindung ist deshalb
nicht auf einen bestimmten Technologieschritt beschränkt. Die
vorliegende Erfindung ist auch nicht hinsichtlich der Strukturtiefe
beschränkt.
Tatsächlich
kann Information von der Oberseite bis zur Unterseite eines Bauelements
gewonnen werden.
-
Bei
einer einzelnen Messung kann eine große Anzahl von Strukturen, insbesondere
Gräben
und anderen Ausnehmungen, vermessen werden. Das Messergebnis ist
ein Mittelwert über
eine große
Zahl – bis
zu einigen Tausend und darüber – von Strukturen.
-
Ein
weiterer wichtiger Vorteil der vorliegenden Erfindung besteht darin,
dass die Messungen an realen Bauelementen bzw. Substraten oder Wafern
und nicht an Teststrukturen ausgeführt werden. Die bei Messungen
an Teststrukturen kritische Äquivalenz
derselben mit den realen bzw. eigentlich interessierenden Strukturen
und somit die Übertragbarkeit
der Messergebnisse von den Teststrukturen auf die realen Strukturen
spielen somit keine Rolle.
-
Vorzugsweise
umfasst bei dem erfindungsgemäßen Verfahren
die elektromagnetische Abtast-Strahlung gleichzeitig oder nacheinander
mehrere diskrete Wellenlängen
oder ein kontinuierliches Spektrum von Wellenlängen. Die Charakterisierungsdaten
umfassen in diesem Fall insbesondere vorzugsweise ein Reflektivitätsspektrum.
-
Ferner
wird vorzugsweise linear polarisierte Abtast-Strahlung verwendet,
wobei der Schritt des Empfangens der elektromagnetischen Antwort-Strahlung
ein Bestimmen der Polarisation der Antwort-Strahlung umfasst. Die
vorliegende Erfindung verwendet somit vorzugsweise das Verfahren
der Infrarot-spektroskopischen Ellipsometrie (IRSE). Alternativ
wird das erfindungsgemäße Verfahren
Infrarot-spektroskopisch ohne Erfassung der Polarisation (IRS) ausgeführt.
-
Sowohl
die Infrarot-Spektroskopie IRS als auch die Infrarotspektroskopische
Ellipsometrie IRSE ermöglichen
eine einfache Prozesskontrolle durch einen Vergleich des jeweils
erhaltenen Spektrums mit einem Referenz-Spektrum. Solange Unterschiede
zwischen dem erfassten Spektrum und dem Referenz-Spektrum eine vorbestimmte
Schwelle nicht überschreiten,
weichen auch die Strukturen der untersuchten Schicht nicht wesentlich
von denen einer Referenzschicht, an der das Referenz-Spektrum gewonnen
wurde, ab.
-
Um
genauere und potenziell sehr detaillierte Informationen über Strukturen
in der Schicht, insbesondere über
laterale Abmessungen oder Volumina von Ausnehmungen oder Eigenschaften
von Materialien, die in den Ausnehmungen angeordnet sind, zu erhalten,
wird die IRS oder die IRSE mit einer Modellbildung kombiniert. Dazu
wird eine Modell-Schicht postuliert, für die Modell-Charakterisierungsdaten
simuliert bzw. berechnet werden, welche die Wechselwirkung der Modell-Schicht
mit der Abtast-Strahlung charakterisieren. Die Modell-Schicht bzw.
ihre mathematische Beschreibung weist mindestens einen freien Parameter
auf, von dem die Modell-Charakterisierungsdaten abhängen. Für diesem
freien Parameter wird ein Wert bestimmt, für den die Modell-Charakterisierungsdaten
und die Charakterisierungsdaten gleich sind oder eine maximale Ähnlichkeit aufweisen,
d.h. die Modell-Charakterisierungsdaten werden an die empirisch
für die
untersuchte Schicht erfassten Charakterisierungsdaten gefittet.
-
Die
laterale Abmessung oder das Volumen der Ausnehmung oder die Eigenschaft
des in der Ausnehmung angeordneten Materials werden aus dem bestimmten
Wert des freien Parameters bestimmt. Die Modell-Schicht ist lateral
homogen, wobei der freie Parameter eine Materialzusammensetzung
oder eine Dicke der Modell-Schicht beschreibt. Die laterale Abmessung
oder das Volumen der Ausnehmung oder die Eigenschaft des in der
Ausnehmung angeordneten Materials wird dann aus der Materialzusammensetzung
und/oder der Dicke der lateral homogenen Modell-Schicht ermittelt.
-
Insbesondere
wenn bei der vorliegenden Erfindung ein Modell verwendet wird, dessen
Modell-Charakterisierungsdaten an die empirisch gewonnenen Charakterisierungsdaten
gefittet wird, können
mehrere Prozessparameter gleichzeitig überwacht wer den. Die vorliegende
Erfindung geht somit weit über
den Stand der Technik hinaus, bei dem beispielsweise eine AFM-Spitze
ein Oberflächenprofil
erfasst, aber keinerlei Information über das Material direkt unterhalb
der Oberfläche
liefert. Die vorliegende Erfindung liefert hingegen die totale Ätztiefe,
einzelne Schichtdicken (Nitridflächen,
Tiefen unterhalb des Siliciums), physikalische Eigenschaften einzelner
Schichten, chemische Charakteristika, Grabenprofile, Materialkonzentrationen,
Materialeigenschaften, Füllfaktoren,
chemische Charakteristika etc.
-
Beim Übergang
zu einem zukünftigen
Technologieschritt (90 nm, 70 nm, 55 nm) müssen bei dem Modell bzw. bei
der Modell-Schicht
lediglich einige wohldefinierte Parameter verändert werden. Für die vorliegende
Erfindung ist weder eine Entwicklung neuer Hardware noch eine Veränderung
vorhandener erforderlich, viel mehr ist die für die IRSE bereits vorhandene
ausgereifte Hardware verwendbar.
-
Die
vorliegende Erfindung stellt in Kombination mit der IRSE und der
leistungsfähigen
Modellbildung eine hochflexible Lösung dar.
- – Als optisches
Verfahren stellt das erfindungsgemäße Verfahren, insbesondere
auch in der Variante mit IRS oder IRSE eine kontaktfreie Messung
dar. Das erfindungsgemäße Verfahren
hat deshalb keine Zerstörung
oder auch nur Beschädigung
der Probe zur Folge und ist nicht auf teure Verschleißteile wie
die AFM-Spitzen der Rasterkraft-Mikroskopie
angewiesen. Anders beispielsweise als die genannte Rasterkraft-Mikroskopie
ist das erfindungsgemäße Verfahren
auch nicht in zufälliger
Weise von der Qualität
teurer Ersatz- oder Verschleißteile
abhängig.
- – Das
erfindungsgemäße Verfahren
eignet sich sowohl zur exsitu-Analyse von Bauteilen als auch zur
in-situ-Überwachung
von STI- und anderen Prozessen. Es ermöglicht eine in-situ-Überwachung
von STI-Ätztiefen
und – Ätzprofilen
in Echtzeit. Es ermöglicht
damit ein schnelleres Parameter-Feedback bzw. eine schnellere Rückmeldung
von Parametern an Plasma-Ätz-Werkzeuge
und ein schnelleres Parameter-Feedforward bzw. eine schnellere Weitergabe
von Parametern zur Steuerung von CMP-Werkzeugen. Mittelfristig wird
die gegenwärtige
Erfindung sich zu einem integrierten Metrologie-Werkzeug entwickeln.
- – Die
Apparatekosten bzw. Anschaffungskosten eines Infrarot-spektroskopischen
Ellipsometers sind denen eines Rasterkraft-Mikroskops ähnlich,
wobei das Ellipsometer im Gegensatz zum Mikroskop auf dem Gebiet
der Metrologie eine höhere
Anzahl von Anwendungen aufweist. Die Betriebskosten eines IRSE sind nicht
zuletzt aufgrund des bereits erwähnten
Wegfalls von Verschleißteilen
sehr niedrig.
- – Mit
einem Infrarot-spektroskopischen Ellipsometer bietet die vorliegende
Erfindung alle Merkmale bzw. Features eines Rasterkraft-Mikroskops:
Muster- bzw. Struktur-Erkennung,
Erzeugen von Recipes bzw. Rezepten bzw. Handlungsanweisungen bzw.
Ablaufprogrammen, Operator- und Ingenieur-Modes, eine automatische
Wafer-Handhabung und eine automatische Echtzeitanalyse.
- – In
Kombination mit IRSE weist die vorliegende Erfindung die Vorteile
der IRSE auf, die vor allem in der großen Wellenlänge und in der Größe des Messflecks
bzw. Spots liegen. Die Wellenlänge
beträgt
typischerweise 1,2 μm
bis 16 μm
und ist damit größer oder
wesentlich größer als
gegenwärtige
Strukturgrößen, insbesondere
Abmessungen von flachen Isoliergräben oder anderen Isoliergräben. Eine
Streuung des Lichts findet deshalb nicht statt. Das erfindungsgemäße Verfahren
erfasst eine untersuchte Schicht mit Ausnehmungen und gegebenenfalls
in denselben angeordneten Materialien als eine homogene dünne Schicht
aus einer Mischung verschiedener Materialien. Bei einer Mess fleck-Größe von typischerweise
mindestens 300 μm × 80 μm schafft
die vorliegende Erfindung eine statistische Aussage über ein
untersuchtes Array. Aufgrund der typischerweise großen Anzahl
von STI-Gräben
innerhalb eines typischen Messflecks stellt eine Messung gemäß der vorliegenden
Erfindung immer einen Mittelwert dar. Praktisch jedes quasi-zufällige, periodische
oder semi-periodische STI-Layout
kann vermessen werden.
- – Die
vorliegende Erfindung ermöglicht
eine genaue Rückmeldung
oder Vorwärtsmeldung
von relevanten Parametern ohne einen Prozessablauf zu stören. Sie
kann insbesondere in Kombination mit IRSE auf viele Strukturen angewendet
werden, beispielsweise Mehrschicht-Stapel, tiefe Gräben bzw.
Deep Trenches, flache Gräben
bzw. Shallow Trenches, zweidimensional oder dreidimensional periodische
oder quasizufällige Strukturen.
-
Vorzugsweise
wird die vorliegende Erfindung zusammen oder aufbauend auf eine
physikalische Auswahlanalyse (PFA; PFA = Physical Failure Analysis)
angewandt, um die beste Modellierung zu bestimmen. Ferner wird die
vorliegende Erfindung vorzugsweise nach einer Vorstudie angewandt,
um die Korrelation ihrer Messergebnisse mit denen der herkömmlichen
Rasterkraft-Mikroskopie
zu untersuchen. Da Prozess- und Parameter-Variationen an tiefer liegenden Schichten
ein IRSE-Spektrum ebenso beeinflussen wie Veränderungen an oberen bzw. oberflächennahen
Schichten, können
Veränderungen
an tiefer liegenden Schichten die Aussagen und Ergebnisse eines
Verfahrens gemäß der vorliegenden
Erfindung bezüglich
einer oberen Schicht beeinflussen. Vorzugsweise wird deshalb die
Robustheit der Modellierung bzw. Modellbildung oder auch die Robustheit
eines konkreten Modells untersucht und optimiert, wofür verschiedene
DOEs (DOE = Design of Experiment) und andere Technologien (beispielsweise
genetische Algorithmen) verwendet werden.
-
Bevorzugte
Weiterbildungen der vorliegenden Erfindung sind in den Unteransprüchen definiert.
-
Nachfolgend
werden bevorzugte Ausführungsbeispiele
der vorliegenden Erfindung mit Bezug auf die beiliegenden Figuren
näher erläutert. Es
zeigen:
-
1 eine
schematische perspektivische Darstellung zur Erläuterung der STI,
-
2 ein
Bild eines flachen Isolationsgrabens, der einen aktiven Bereich
umgibt,
-
3 schematische
Darstellungen von vertikalen Schnitten durch eine reale Halbleiterstruktur
und ein Modell derselben,
-
4 eine
schematische Darstellung eines Infrarotspektroskopischen Ellipsometers
zur Verwendung bei dem erfindungsgemäßen Verfahren,
-
5 ein
schematisches Diagramm, das die Korrelation von Messergebnissen
des erfindungsgemäßen Verfahrens
und der herkömmlichen
Rasterkraft-Mikroskopie darstellt,
-
6 ein
schematisches Ablaufdiagramm der vorliegenden Erfindung,
-
7 ein
schematisches Ablaufdiagramm eines anderen, nicht beanspruchten
Verfahrens,
-
8 eine
Darstellung eines erfassten Reflektivitätsspektrums, und
-
9 eine
Darstellung von Referenz-Reflektivitätsspektren.
-
1 ist
eine schematische perspektivische Darstellung einer Halbleiterschicht 10 an
einer Oberfläche
eines nicht dargestellten Substrats. Die Halbleiterschicht 10 weist
aktive Bereiche 12, 14 auf, in denen beispielsweise
einzelne Bauelemente wie Transistoren, Kondensatoren, Widerstände etc.
angeordnet sind. Zwischen den aktiven Bereichen 12, 14 ist
ein Graben 16 angeordnet, der mit einem isolierenden Material 18,
beispielsweise einem Halbleiteroxid oder einem Halbleiternit rid,
gefüllt
ist. Der Graben 16 ist vorzugsweise so tief, dass er eine
dotierte und damit elektrisch leitfähige Teilschicht der Halbleiterschicht 10 an
deren Oberfläche vollständig unterbricht
und die aktiven Bereiche 12, 14 somit elektrisch
voneinander isoliert. Die Breite des Grabens 16 ist unter
anderem von den elektrischen Eigenschaften, insbesondere den Isolationseigenschaften, des
isolierenden Materials 18 abhängig.
-
2 ist
eine schematische perspektivische Darstellung einer realen Struktur
an einer Oberfläche
einer Halbleiterschicht. Eine Darstellung dieser Art ist beispielsweise
rasterelektronenmikroskopisch oder rasterkraftmikroskopisch erzeugbar.
Ein aktiver Bereich 12 ist von einem noch nicht mit einem
isolierenden Material gefüllten
Graben 16 umgeben und durch diesen von einem benachbarten
Bereich 14 elektrisch isoliert.
-
3 ist
eine schematische Darstellung vertikaler Schnitte durch eine reale
Halbleiterstruktur (links) und ein Modell (rechts), das im Gegensatz
zu der realen Halbleiterstruktur lediglich lateral unstrukturierte
oder lateral homogene Schichten aufweist. Bei der in 3 links
dargestellten realen Halbleiterstruktur handelt es sich beispielsweise
um einen Ausschnitt aus einer DRAM-Zellenstruktur, die in einem
0,14 μm-Prozess
hergestellt wurde. Der flache Graben bzw. Shallow Trench 16 ist
von Schichten 22, 24, 26 aus unterschiedlichen
Materialien, beispielsweise kristallinem oder polykristallinem Silicium,
Siliciumnitrid, Siliciumoxid, Borosilicatglas etc., umgeben. Unterhalb
des Grabens 16 bilden weitere Strukturen 32, 34, 36,
beispielsweise mit Polysilicium gefüllte tiefe Gräben, Ausdiffusionsbereiche
und Seitenwandbeschichtungen, die eigentliche Speicherzelle.
-
Rechts
neben der realen Struktur ist in 3 ein vorteilhaftes
Modell dieser Struktur dargestellt, das lediglich aus lateral unstrukturierten
oder lateral homogenen Modell- Schichten 42, 44, 46, 48, 50 besteht.
Die Auswahl der relevanten Schichten ist ein Schlüsselfaktor
bzw. ein wichtiger Schritt beim Modellieren. Der Prozessablauf wird
deshalb vorzugsweise eingehend analysiert, um die relevanten Schichten
zu bestimmen bzw. zu identifizieren bzw. auszuwählen. Mittels PFA-Daten, die
beispielsweise destruktiv rasterelektronenmikroskopisch oder Sekundärionen-massenspektroskopisch
gewonnen werden können,
wird der Schichtstapel analysiert. Um ein effizientes Modell zu
bilden, werden die realen Strukturen durch einen Stapel dünner Modell-Schichten
modelliert. Die optischen Indizes und/oder berechnete Dispersionen
(im Infrarotbereich) einzelner Materialien werden verwendet und
in den Modell-Schichten "gemischt", um die reale, lateral
inhomogene Struktur durch eine Folge lateral homogener Schichten
zu beschreiben. Dieses "Mischen" erfolgt durch Berechnungen
gemäß der Bruggeman-effektive-Medium-Approximation
(BEMA).
-
Anders
ausgedrückt
modelliert jede einzelne Modell-Schicht 42, 44, 46, 48, 50 eine
der Schichten 22, 24, 26 des realen Bauelements
einschließlich
der Materialien der Strukturen 32, 34, 36,
die innerhalb der jeweiligen Schicht 22, 24, 26 angeordnet
sind. Vorzugsweise weist jede einzelne Modell-Schicht die Dicke
einer entsprechenden Schicht der realen Struktur auf, wobei das
effektive Medium der Modell-Schicht eine Mischung gemäß BEMA aus
dem Material der realen Schicht und dem oder den Materialien, die
in Ausnehmungen in der realen Schicht angeordnet sind, darstellt.
-
Diese
Modellierung basiert auf zwei Annahmen:
Eine große Anzahl
von Strukturen bzw. Ausnehmungen bzw. Gräben wird gleichzeitig gemessen,
befindet sich also gleichzeitig innerhalb des Messbereichs bzw.
Mess-Spots, der erfasst wird. Die Messung bildet somit einen Mittelwert über eine
sehr große
Anzahl von Strukturen. Es wird angenommen, dass insbesondere STI-Bereiche
homogene Schichten darstellen. Es wird kein Effekt bzw. keine Wirkung
einzelner Isolationsgrä ben
oder einzelner anderer Strukturen sondern ein global über den
Messbereich gemittelter Effekt beobachtet.
-
Die
zur Erfassung der realen Struktur verwendete Wellenlänge ist
wesentlich größer als
die kritische Dimension einer einzelnen der erfassten Strukturen.
Dies ist für
Infrarotlicht und eine Strukturgröße von einigen hundert nm der
Fall, wobei die Wellenlänge
10–100 × größer ist
als die kritische Dimension. Streueffekte werden in guter Näherung nicht
berücksichtigt.
-
Basierend
auf diesen Annahmen werden beispielsweise STI-Bereiche als homogene Mischungen von Materialien
definiert, und der optische Index jeder Modell-Schicht ist eine
Mischung von optischen Indizes der beteiligten Materialien. Die
Indizes für
jedes einzelne Material werden dabei aus IRSE-Messungen an Monitor-Wafern mit jeweils
einer einzelnen Schicht oder mittels theoretischer Dispersionsgesetze
(beispielsweise des Drude-Gesetzes für dotiertes Silicium) berechnet.
Die Indizes oder die Dispersion-Gesetzmäßigkeiten werden dann in einer
Datenbank gespeichert. Basierend auf den Flächendichten der Gräben, Ausnehmungen und
anderer Strukturen und der Grabendimensionen, die aus einer PFA-Analyse
bekannt sind, wird dann das gesamte Modell Schicht für Schicht
aufgebaut.
-
Da
gemäß der vorliegenden
Erfindung vorzugsweise die jeweils oberste Schicht und die darin
angeordneten Ausnehmungen untersucht werden, und da die Messungen
vorzugsweise nach dem Ätzen
von Gräben
oder anderen Ausnehmungen und vor dem Füllen derselben mit anderen
Materialien erfolgen, sind die Ausnehmungen in der obersten Schicht
leer. Für
die Modellierung wird deshalb angenommen, dass das Füllmaterial
der Gräben
oder anderen Ausnehmungen Luft oder Vakuum ist. Damit ist die oberste
Modell-Schicht 42 eine Mischung des Materials der realen
Schicht 22 und von Luft bzw. Vakuum, die bzw. das in dem
Graben 16 angeordnet ist. Wenn man von einer über eine
größere Fläche gemittelten
Oberflächendichte
Cx für
die Gräben 16 ausgeht
(0 < Cx < 1), weist das effektive
Medium einen Anteil 1 – Cx
des Materials der realen Schicht 22 und einen Anteil Cx
Vakuum bzw. Luft auf. Der effektive optische Index Neff des
effektiven Mediums ist somit Neff = (1 – C)·Nmat + C·Nvoid, wobei Nvoid der
optische Index von Luft bzw. Vakuum ist. Gemäß dieser Prozedur wird die
gesamte reale Struktur mit den Schichten 22, 24, 26 und
den Strukturen 32, 34, 36 auf die lateral
homogenen Modell-Schichten 42, 44, 46, 48, 50 abgebildet.
-
Anstelle
einer BEMA-Berechnung wird für
kompliziertere Schichten mit mehr als zwei bis drei Materialien
alternativ und vorteilhaft die Dispersion bzw. das Dispersionsgesetz
für eine
reale Schicht unter Berücksichtigung
aller verschiedenen Materialbeiträge entwickelt.
-
Die
Anwendung und Anpassung bzw. das Fitten des Modells bzw. seiner
optischen Eigenschaften bzw. seines Reflektivitätsspektrums an die gemessenen
optischen Eigenschaften bzw. das gemessene Reflektivitätsspektrum
einer realen Struktur erfolgen an einer Produktionslinie vorzugsweise
in Echtzeit. Die interessierenden Parameter werden berechnet und
auf die STI-Prozesseigenschaften bezogen.
-
4 ist
eine schematische Darstellung eines Infrarotspektroskopischen Ellipsometers,
mit dem das erfindungsgemäße Verfahren
gemäß einem
bevorzugten Ausführungsbeispiel
ausgeführt
wird. Beispielhaft ist das Gerät
IRSE 300 der Firma SOPRA SA dargestellt, das ein vollautomatisches
System zur Wafer-Handhabung, für
Messungen und zur Echtzeit-Datenanalyse darstellt. Das IRSE umfasst
ein Fourier-Transform-Spektrometer
(FTS) 60. Das FTS 60 umfasst eine breitbandige
Lichtquelle 62, die Licht im erwünschten Spektralbereich, in
diesem Fall im Infrarot, emittiert. Die Lichtquelle 62 ist
im Fokus eines Parabolspiegels 64 angeordnet. Mittels eines
halbdurchlässigen
planen Spiegels 66 wird je ca. die Hälfte des von dem Parabolspiegel 64 reflektierten
Lichts der Licht quelle 62 auf einen starr montierten Spiegel 68 und
einen bewegbaren Spiegel 70 geleitet. Der bewegbare Spiegel 70 wird
durch einen nicht dargestellten Antrieb periodisch oszillierend
parallel zu seiner Flächennormale
bewegt. Der durch den halbdurchlässigen
Spiegel 66 transmittierte Anteil des von dem starr montierten
Spiegel 68 reflektierten Lichts und der von dem halbdurchlässigen Spiegel 66 reflektierte Anteil
des von dem bewegbaren Spiegel 70 reflektierten Lichts überlagern
sich am Ausgang 72 des FTS 60. Beide Anteile interferieren,
wobei konstruktive und destruktive Interferenz von der Wellenlänge und
der momentanen Stellung des bewegbaren Spiegels 70 abhängig auftreten.
Das FTS 60 emittiert somit Licht innerhalb eines breiten
Spektralbereichs, dessen wellenlängenabhängige Intensität mit einer
wellenlängenabhängigen Frequenz
oszilliert.
-
Dieses
Licht wird durch einen Umlenkspiegel 74 umgelenkt und durch
einen feststehenden Polarisator 76 linear polarisiert.
Ein weiterer Parabolspiegel 78 fokussiert das linear polarisierte
Licht auf einen Messfleck bzw. Mess-Bereich bzw. Mess-Spot 80 an
einem zu untersuchenden Wafer bzw. Substrat bzw. an einer zu untersuchenden
Schicht 82, die von einem Träger 84 gehalten ist.
Von der Schicht 82 reflektiertes Licht wird von einem Ellipsoidspiegel 86 auf
einen Detektor 88, beispielsweise einen Quecksilber-Cadmium-Tellurid-Detektor (MCT-Detektor; MCT = Mercury
Cadmium Telluride) fokussiert. Zwischen dem Ellipsoidspiegel 86 und
dem Detektor 88 ist ein rotierbarer Polarisator 90 als
Analysator angeordnet. Sowohl bei dem feststehenden Polarisator 76 als
auch bei dem rotierbaren Polarisator 90 handelt es sich
beispielsweise um Gitter-Polarisatoren. Im Falle eines MCT-Detektors
wird dieser automatisch alle 12 Stunden mit flüssigem Stickstoff gekühlt.
-
Der
Detektor 88 ist nicht wellenlängensensitiv. Jede von ihm
empfangene Wellenlänge
weist eine Intensität
auf, die mit einer Frequenz oszilliert, die von der Wellenlänge, der
momentanen linearen bzw. translatorischen Geschwindigkeit des be wegbaren
Spiegels 70, der Reflektivität der Schicht 82 innerhalb
des Mess-Spots 80 bei der gegebenen Wellenlänge, von
dem Einfluss der Schicht 82 innerhalb des Mess-Spots 80 auf
die Polarisation des reflektierten Lichts und von den Richtungen
der Polarisationsebenen der Polarisatoren 76, 90 abhängt. Für jede Ausrichtung
des rotierbaren Polarisators 90 wird während einer oder vorzugsweise
während
mehrerer Oszillationen des bewegbaren Spiegels 70 die von
dem Detektor 88 empfangene Gesamtintensität als Funktion
des momentanen Orts des bewegbaren Spiegels 70 erfasst.
Im Falle der Messung mehrerer Oszillationen werden die Messergebnisse
innerhalb der einzelnen Oszillationen übereinander gelegt bzw. addiert
bzw. gemittelt. Durch Fourier-(Rück)-Transformation
der Abhängigkeit
des von dem Detektor 88 empfangenen Intensitätssignals
vom Ort des bewegbaren Spiegels 70 wird die Wellenlängen- bzw.
Frequenz-Abhängigkeit
des reflektierten Lichts bestimmt. Aus dieser und der bekannten
Frequenz-Abhängigkeit des
eingestrahlten Lichts kann die frequenzabhängige Reflektivität der Schicht 82 innerhalb
des Mess-Spots 80 berechnet werden.
-
Nach
einer Durchführung
dieser Messungen für
mehrere Stellungen des rotierbaren Polarisators 90 ist
der Einfluss der Schicht 82 innerhalb des Mess-Spots 80 auf
die Polarisation reflektierten Lichts als Funktion der Wellenlänge bzw.
Frequenz des Lichts berechenbar. Dieser wird gewöhnlich als Verhältnis ρ = Rp/Rs = tan(Ψ)eiΔ dargestellt,
wobei Rp und Rs die
Reflektivitäten
der Oberfläche
für eine
Polarisation parallel bzw. senkrecht zur Einfallsebene sind. Die
so genannten ellipsometrischen Winkel Ψ und Δ stellen den Winkel, um den
die Polarisationsebene bei der Reflexion gedreht wird sowie die
Phasendifferenz zwischen parallel und senkrecht polarisierten Teilwellen
dar. tan(Ψ)
ist das Amplitudenverhältnis
der parallel und senkrecht zur Einfallsebene polarisierten Teilwellen.
-
Die
beschriebene Messung wird vorzugsweise zwischen einer Wellenzahl ṽ =1/λ von ca.
600 cm–1 bzw. einer
Wellenlänge λ von 16,6 μm und einer
Wellenzahl ṽ von 7000 cm–1 bzw.
einer Wellenlänge λ von ca.
1,43 μm
oder einer Wellenzahl ṽ von ca. 8300 cm–1 bzw.
einer Wellenlänge λ von ca.
1,2 μm ausgeführt.
-
Ergebnis
der Messung ist der Parameter ρ(λ) oder ρ(ṽ)
bzw. tan(Ψ(λ)) oder tan(Ψ(ṽ))
und cos(Δ(λ)) oder cos(Δ(ṽ))
als Funktion der Wellenlänge λ oder der
Wellenzahl ṽ. Diese in Form von Spektren darstellbaren wellenlängenabhängigen Parameter
und ihre Wellenlängenabhängigkeiten
stehen in einem (theoretisch eindeutigen) Verhältnis zu den optischen Eigenschaften,
insbesondere den optischen Indizes, der Materialien und der Organisation
dieser Materialien innerhalb der Schichten (Gräben, Gemische von Materialien,
Schichten).
-
Der
Zusammenhang zwischen dem Parameter ρ(λ) und den Eigenschaften der
untersuchten Struktur (als Funktion der Wellenlänge λ) ist durch 2 × 2 Jones-Matrizen
beschreibbar. Zu den Eigenschaften der Struktur zählen insbesondere
Dispersions-Gesetze
bzw. Wellenlängenabhängigkeiten
von optischen Eigenschaften der Materialien, die zu der Materialstruktur
bzw. der Materialorganisation (Stapel, Mischung) kombiniert sind. Für jede Schicht
sind die Dicke und die optischen Indizes oder Dispersionsgesetzmäßigkeiten
Eingangsparameter. Dicke und Material jeder Schicht des Stapels
sind durch die Prozessschritte des Herstellungsverfahrens wohl definiert.
-
Die
Spektren ρ(λ) bzw. tan(Ψ(λ)) und cos(Δ(λ)) werden
für die
in 3 rechts dargestellte Modell-Struktur aus lateral
homogenen Modell-Schichten simuliert bzw. berechnet. Durch Anpassen
bzw. Fitten eines be rechneten an ein gemessenes Spektrum über einen
oder mehrere der angesetzten Parameter können Werte für diese
Parameter ermittelt werden. Je geringer die Anzahl der freien bzw.
unbekannten Parameter ist, je genauer alle anderen Parameter bekannt
sind und je einfacher die untersuchte Struktur ist, desto genauer ist
dieser Fit und desto genauer sind der oder die Werte der Parameter
ermittelbar.
-
Das
beschriebene Verfahren ist ferner genauer, wenn an tief liegenden
Strukturen oder an einer Rückseite
eines Substrats reflektierte Strahlung nicht miterfasst wird. Dies
wird bei dem in 4 dargestellten Infrarot-spektroskopischen
Ellipsometer vorzugsweise durch die Größe des Mess-Spots 80 bestimmt.
Das an der Rückseite
des Substrats reflektierte Licht wird über den Ellipsoidspiegel 86 durch
eine Blende ausgeblendet und somit nicht auf den Detektor 88 fokussiert.
Vorzugsweise hat der Mess-Spot 80 eine Größe von ca.
80 μm × 300 μm.
-
Weitere
die Qualität
der Messung, die Aussagekraft und Genauigkeit der Messergebnisse
beeinflussende Parameter sind die Auflösung des FTS 60, die
Geschwindigkeit, mit der der bewegbare Spiegel 70 bewegt
wird, die Trägheit
bzw. Zeitauflösung
des Detektors 88, die Anzahl der Oszillationen bzw. Durchgänge bzw.
Scans, innerhalb derer bei jeder Stellung des rotierbaren Polarisators 90 gemessen
wird, die Orientierung des feststehenden Polarisators 76,
die Größe der Winkelschritte,
mit denen der rotierbare Polarisator zeitdiskret bewegt wird oder
auch der Geschwindigkeit, mit der der rotierbare Polarisator 90 kontinuierlich
bewegt wird.
-
5 ist
ein Diagramm, in dem die Korrelation zwischen Messergebnissen des
erfindungsgemäßen Verfahrens
und einer herkömmlichen
Rasterkraft-mikroskopischen Messung dargestellt ist. Es ist erkennbar, dass
die Ergebnisse des herkömmlichen
und des erfindungsgemäßen Verfahrens
innerhalb einer gewissen stochastischen Unsicherheit eindeutig aufeinander
abbildbar sind. Die dargestellte Gerade 94 stellt einen
linearen Fit dar, für
den der Zusammenhang y = 4,6 + 0,96 x zwischen dem Ergebnis x der
rasterkraftmikroskopischen Messung und dem Ergebnis y der erfindungsgemäßen Messung.
Allgemein sind jedoch auch andere Korrelationen möglich, die
durch andere mathematische Funktionen gefittet werden können.
-
6 ist
ein schematisches Ablaufdiagramm, in dem das oben dargestellte erfindungsgemäße Verfahren
schematisch wiedergegeben ist. Das Verfahren beginnt mit dem Bestrahlen 102 der
zu untersuchenden Schicht, bzw. der Schicht mit der oder den Ausnehmungen
mit einer elektromagnetischen Abtast-Strahlung, die, wie oben beschrieben,
eine Wellenlänge
aufweist, die größer ist
als die Strukturgröße der lateralen
Strukturen der Schicht. Vorzugsweise liegt die Wellenlänge der
elektromagnetischen Abtast-Strahlung im Infrarotbereich. Diese Strahlung
kann zu ein und demselben Zeitpunkt gleichzeitig mehrere Wellenlängen bzw.
Frequenzen, d.h. ein diskretes oder kontinuierliches Spektrum aufweisen,
wie es beispielsweise durch das oben anhand der 4 beschriebene
Fourier-Transform-Spektrometer 60 erzeugt
wird. Alternativ ist die elektromagnetische Abtast-Strahlung zu
jedem Zeitpunkt (quasi) monochromatisch oder sogar kohärent, wie
sie beispielsweise durch einen Gitter-, Prismen- oder anderen dispersiven
Monochromator bzw. einen Laser erzeugt wird. Die Wellenlänge der
elektromagnetischen Abtast-Strahlung wird in diesem Fall vorzugsweise
zeitabhängig
verändert,
um nacheinander die Probe mit verschiedenen Wellenlängen zu
bestrahlen.
-
Aus
der Wechselwirkung zwischen der Abtast-Strahlung und der Probe,
insbesondere deren (vorzugsweise oberflächennahen) Schicht oder Schichten,
geht eine elektromagnetische Antwort-Strahlung hervor, die sich in der Regel
in Richtung, Intensität
und Polarisation von der Abtast-Strahlung unterscheidet. Diese Antwort-Strahlung
wird empfangen 104, wobei vorzugsweise die Intensität oder die
Polarisation oder – besonders bevorzugt – beide
Parameter bestimmt werden.
-
Aus
der empfangenen elektromagnetischen Antwort-Strahlung und der Kenntnis
der elektromagnetischen Abtast-Strahlung bzw. deren Intensitäten und
Polarisationen werden Charakterisierungsdaten bestimmt 106,
welche die Wechselwirkung zwischen der Schicht mit der Ausnehmung
und der Abtast-Strahlung charakterisieren. Die Charakterisierungsdaten
bilden dabei in einer mehr oder weniger transparenten Weise die
laterale Abmessung oder das Volumen der Ausnehmung in der Schicht
oder Eigenschaften eines in der Ausnehmung angeordneten Materials
ab. Diese Charakterisierungsdaten umfassen beispielsweise die Reflektivität oder Transmittivität der Schicht
und vorzugsweise die Wellenlängen-
oder Polarisations-Abhängigkeit
dieser Größen.
-
Bei
den folgenden Schritten wird anhand der Charakterisierungsdaten
die laterale Abmessung oder das Volumen der Ausnehmung oder die
Eigenschaft des in der Ausnehmung angeordneten Materials ermittelt oder
geprüft.
Dazu wird zunächst
eine Modell-Schicht oder eine Struktur aus einem Stapel von Modell-Schichten
postuliert, 108. Die Modell-Schicht bzw. die Modell-Schichten
sind lateral homogen bzw. lateral unstrukturiert, wie dies oben
anhand der 3 erläutert wurde.
-
Für die Modell-Schicht
oder die Struktur aus dem Stapel von Modell-Schichten werden den
oben genannten Charakterisierungsdaten entsprechende Modell-Charakterisierungsdaten
berechnet. Die Modell-Schicht bzw. die Modell-Struktur aus der Mehrzahl
von Modell-Schichten weist einen oder mehrere freie Parameter auf,
sodass die Modell-Charakterisierungsdaten von diesem oder diesen
freien Parametern abhängig
sind.
-
Anschließend werden
die Modell-Charakterisierungsdaten über den oder die freien Parameter
an die im Schritt 106 bestimmten Charakterisierungsdaten
gefittet 112. Dazu wird derjenige Wert des freien Parameters
oder werden diejenigen Werte der freien Parameter bestimmt, für die die
Modell-Charakterisierungsdaten und die Charakterisierungsdaten gleich
sind oder eine maximale Ähnlichkeit
aufweisen. Im Fall der lateral homogenen Modell-Schicht ist ein
freier Parameter beispielsweise die Materialzusammensetzung oder
die Dicke der Modell-Schicht.
-
In
einem letzten Schritt wird aus dem Fit bzw. aus dem beim Fit 112 ermittelten
Wert des freien Parameters die laterale Abmessung bzw. das Volumen
der Ausnehmung bzw. die Eigenschaft des in der Ausnehmung angeordneten
Materials ermittelt, 114.
-
Das
anhand der 6 dargestellte erfindungsgemäße Verfahren
ist, wie oben bereits erwähnt
wurde, ohne weiteres auf Modelle mit mehreren Modell-Schichten und/oder
mehreren freien Parametern und die Ermittlung mehrerer Größen aus
dem Fit erweiterbar.
-
Soll
lediglich eine laufende Produktion überwacht werden, kann auf die
beschriebene Modellbildung verzichtet werden. In diesem Fall werden
vorzugsweise lediglich die empirisch bestimmten Charakterisierungsdaten
mit Referenz-Charakterisierungsdaten
verglichen. Diese Referenz-Charakterisierungsdaten
werden durch entsprechende Messung an einer Referenz-Schicht mit
einer bekannten Ausnehmung oder allgemeiner an einer Referenz-Struktur
mit einem bekannten Schichtstapel und bekannten Ausnehmungen in
demselben gewonnen. Wenn die Abweichungen zwischen den empirisch
gewonnenen Charakterisierungsdaten und den Referenz-Charakterisierungsdaten
eine von der jeweiligen Anwendung und den resultierenden Anforderungen
abhängig
genau zu bestimmende Schwelle nicht überschreiten, kann davon ausgegangen
werden, dass sich die untersuchte Schicht und die Referenz-Schicht nicht oder
nicht wesentlich unterscheiden. In diesem Fall wird die Produktion
fortgesetzt oder der un tersuchte Wafer oder das untersuchte Substrat
weiter prozessiert.
-
7 ist
ein schematisches Ablaufdiagramm eines Verfahrens, bei dem auf eine
Modellierung verzichtet wird und stattdessen lediglich durch Vergleich
der empirisch gewonnen Charakterisierungsdaten mit Referenz-Charakterisierungsdaten
die Übereinstimmung
der Schicht mit einer Referenz-Schicht geprüft wird. Wie bei dem in 6 dargestellten
Ausführungsbeispiel
wird die Schicht mit der Ausnehmung mit einer elektromagnetischen
Abtast-Strahlung bestrahlt, 102. Die von der Schicht mit
der Ausnehmung ausgehende elektromagnetische Antwort-Strahlung wird empfangen, 104,
daraus werden die Charakterisierungsdaten bestimmt, 106.
Durch entsprechende Schritte des Bestrahlens 122, Empfangens 124 und
Bestimmens 126 an einer Referenz-Schicht mit einer bekannten
Ausnehmung werden Referenz-Charakterisierungsdaten bestimmt. Die
Referenz-Charakterisierungsdaten
und die Charakterisierungsdaten werden mit einander verglichen 128,
um eine Übereinstimmung
zwischen der Schicht mit der Ausnehmung und der Referenz-Schicht
mit der bekannten Ausnehmung zu verifizieren bzw. zu prüfen.
-
Dabei
ist es unerheblich, ob die Referenz-Charakterisierungsdaten vor
oder nach den Charakterisierungsdaten gewonnen werden, in der Praxis
werden sie jedoch in der Regel bei Inbetriebnahme einer Produktionslinie
oder bei einer Änderung
von relevanten Parametern an derselben mittels der Schritte 122, 124, 126 gewonnen
und anschließend
zum Prüfen
einer großen
Anzahl von Schichten durch Vergleichen von deren Charakterisierungsdaten
mit den Referenz-Charakterisierungsdaten angewendet.
-
Die
beschriebenen Verfahren sowohl mit als auch ohne Modell-Bildung sind für eine einzige,
mehrere diskrete oder ein kontinuierliches Spektrum von Wellenlängen, für eine einzige,
mehrere diskrete oder ein kontinuierliches Spektrum von Polarisationen
durchführbar,
wobei die umfangreichsten Charakterisierungsdaten und deshalb die
zuverlässigsten
und genauesten Aussagen über
die Schicht oder die Schichten und deren Ausnehmung oder Ausnehmungen
bei der oben beschriebenen IRSE erhalten werden, bei der Messungen
sowohl bei einer Vielzahl von Wellenlängen als auch bei mehreren
Polarisationsrichtungen vorgenommen werden.
-
Im
Folgenden wird anhand der 8 und 9 ein
weiteres Verfahren beschrieben, bei dem im Gegensatz zu dem oben
beschriebenen Ausführungsbeispiel
einerseits anstelle einer Infrarot-spektroskopischen Ellipsometrie
auch einfache Infrarot-Spektrometrie ausreichend ist und andererseits
auch ohne eine Modell-Bildung eine ausreichend genaue und zuverlässige Aussage über einen
fraglichen Parameter gewonnen wird. Hintergrund dieses Verfahrens
ist das Problem der Überwachung
bzw. des Monitorings der Dicke einer Seitenwandbeschichtung bzw.
eines Randes bzw. Kragens, der beispielsweise aus TEOS-Siliciumoxid (mittels Tetraethyl-ortho-Silicat-CVD
abgeschiedenes Siliciumoxid) in einer Ausnehmung gebildet ist. Dieses
Problem tritt insbesondere beispielsweise in dem allgemein mit R1
bezeichneten Prozessschritt auf.
-
8 ist
eine Darstellung eines mittels IRSE gewonnenen Spektrums tan(Ψ(ṽ)).
Der Abszisse ist die Wellenzahl ṽ zugeordnet. Der Ordinate
ist tan(Ψ(ṽ))
zugeordnet. In diesem Spektrum sind im Wesentlichen zwei Arten von
Merkmalen erkennbar. Im Bereich 650 cm–1 ≤ ṽ ≤ 1500 cm–1 sind
Peaks bzw. relativ schmale Spitzen sichtbar, welche in diesem Fall
der Absorption durch SiO2 in einem "Kragen" und einer oben liegenden SiN-Schicht
zugeordnet werden können.
Während
die meisten Halbleitermaterialien, insbesondere Silicium, in diesem
Wellenlängenbereich
transparent ist, zeigen dielektrische Materialien wie Siliciumoxid
SiO2 und Siliciumnitrid SiN2 in
diesem Wellenlängenbereich
wohl definierte Absorptionspeaks.
-
Im
Wellenlängenbereich
1500 cm–1 ≤ ṽ ≤ 7000 cm–1 sind
mehrere breite Oszillationen bzw. Maxima 134, 136, 138 beobachtbar.
Die sichtbaren breiten Maxima 134, 136, 138 sind
Teil eines so genannten Fringe, die nur teilweise im dargestellten
Wellenlängenbereich
liegt und in Zusammenhang mit der Strukturtiefe steht. Für sehr flache
Strukturen kann ein Fringe zu einer mehr oder weniger flachen Flanke
degenerieren.
-
Aus
dem in 8 dargestellten Spektrum kann eine Seitenwandschichtdicke
bestimmt werden, indem die Höhe
und die Form, insbesondere die Breite und die Gesamtfläche des
Peaks 132 ausgemessen werden. Je größer die Seitenwandschichtdicke
ist, desto größer ist
die Höhe
des Peaks 132.
-
Alternativ
kann aus dem in 8 dargestellten Spektrum auch
durch eine Analyse der Fringes (insbesondere deren Position, Amplitude
und Frequenz) oder der degenerierten Fringes (insbesondere aus deren Steigung)
die Seitenwandschichtdicke bestimmt werden. Abhängig von der Seitenwandschichtdicke
verschieben sich die Position und die Frequenz der Fringes in dem
dargestellten Spektrum.
-
Im
Falle jeder der beiden Alternativen wird die Seitenwandschichtdicke
durch eine genaue Analyse des Spektrums berechnet. Ferner können gleichzeitig
sowohl der Peak 132 als auch die Fringes bzw. deren breite
Maxima 134, 136, 138 analysiert werden.
Es stehen somit drei Grundformen von Analysealgorithmen zur Spektralanalyse
zur Verfügung:
Es können
entweder nur der Peak 132 oder nur die Fringes bzw. deren breite
Maxima 134, 136, 138 oder aber das gesamte
Spektrum (Peak und Fringes) ausgewertet werden, wobei die letzte
Option aufgrund der größeren Menge
an verarbeiteter Information genauer ist als die alleinige Auswertung
von entweder dem Peak 132 oder den Fringes. Alle drei Grundoptionen
können
wiederum an einer Probe lediglich nach der Erzeugung bzw. Prozessierung
der Seitenwandschicht („Post") oder vor („Pre") und nach der Prozessierung
der Seitenwandschicht („Pre/Post") ausgeführt werden.
Ferner können
die Algorithmen auf Spektren angewandt werden, die entweder mittels
Infrarot-Spektroskopie (IRS) oder mittels Infrarot-spektroskopischer
Ellipsometrie (IRSE) erfasst werden. Insgesamt ergeben sich somit
zwölf Optionen,
von denen sich bisher allerdings nicht alle als praktisch tauglich
erwiesen haben. In der folgenden Tabelle sind diese Optionen matrixartig
zusammengestellt. Für
jede Option ist durch ein J die Verwendbarkeit dieser Option angezeigt
und durch ein N die bis jetzt nicht ausreichende praktische Tauglichkeit
oder prinzipielle Unmöglichkeit
der Option angezeigt.
-
-
Zu
der ausschließlichen
Auswertung der Peaks im unteren Wellenzahlbereich nach der Erzeugung
der Seitenwandschicht (*1) ist anzumerken,
dass diese nicht anwendbar ist, wenn das Material der Seitenwandschicht
auch anderweitig in der Halbleiterstruktur vorhanden ist. In diesem
Fall ist nur die Erfassung der Peaks sowohl vor als auch nach der
Prozessierung der Seitenwandschicht und der Vergleich derselben
möglich.
-
Zur
ausschließlichen
Auswertung der Fringes nach der Prozessierung der Seitenwandschicht
mittels IRS (*2) ist anzumerken, dass die
IRS im Gegensatz zur IRSE keine Informationen über Materialzusammensetzungen
liefert. Die Materialzusammensetzung muss bei der ausschließlichen
Auswertung von Fringes nach der Prozessierung der Seitenwandschicht
jedoch bekannt sein.
-
9 ist
eine schematische Darstellung einer Mehrzahl von Spektren tan(Ψ(ṽ)),
die für
verschiedene R1-Kragen-Seitenwanddicken
zwischen 0 und 20 nm simuliert wurden. Es ist erkennbar, dass für eine ansteigende
Seitenwandschichtdicke eine deutliche und systematische Veränderung
im Spektrum tan(Ψ(λ)) auftritt. Dadurch
ist es möglich,
entweder das berechnete Spektrum an ein empirisch erfasstes Spektrum
zu fitten, um die Seitenwandschichtdicke als resultierenden Fit-Parameter zu gewinnen
oder ein empirisch erfasstes Spektrum mit einem Referenz-Spektrum
zu vergleichen, um im Rahmen einer Prozesskontrolle die Seitenwandschichtdicke
zu prüfen.
In beiden Varianten liefert das angegebene Verfahren ein genaues
und zuverlässiges und
damit aussagekräftiges
Ergebnis.
-
Das
beanspruchte Verfahren ist für
eine große
Bandbreite von Strukturen in Halbleitermaterialien und insbesondere
Halbleiter-Volumen-Materialien anwendbar, beispielsweise Gräben, Leitungen,
Abstände,
Löcher
unterschiedlicher Gestalt und alle Arten von geätzten Strukturen. Ferner ist
das beanspruchte Verfahren mit einer großen Bandbreite von Seitenwandschichtmaterialien
kompatibel. Es ist nicht hinsichtlich irgendwelcher Konstruktions-Grundregeln
oder der Strukturtiefe limitiert.
-
Die
vorliegende Erfindung ist vorzugsweise in ein Herstellungsverfahren
integriert. Bei der Herstellung eines Bauelements wird zunächst ein
teilfertiges Bauelement erzeugt, das die zu untersuchende Schicht
mit der Ausnehmung an der Oberfläche
eines Substrats aufweist. Eine laterale Abmessung oder ein Volumen
der Ausnehmung in der Schicht oder eine Eigenschaft eines in der
Ausnehmung angeordneten Materials nach einem der oben beschriebenen
beanspruchten Verfahren bestimmt. Schließlich wird abhängig von
einem Ergebnis des Bestimmens oder Prüfens das teilfertige Bauelement
verworfen oder fertig gestellt, wobei gegebenenfalls Fertigungsparameter
abhängig
von dem Ergebnis eingestellt oder verändert werden. Alternativ werden abhängig von
dem Ergebnis eines oder mehrere weitere teilfertige Bauelemente
erzeugt, wobei das Ergebnis vorzugsweise Prozessierungsparameter
beeinflusst.
-
- 10
- Halbleiterschicht
- 12
- aktiver
Bereich
- 14
- aktiver
Bereich
- 16
- Graben
- 18
- isolierendes
Material
- 22
- Schicht
- 24
- Schicht
- 26
- Schicht
- 32
- Struktur
- 34
- Struktur
- 36
- Struktur
- 42
- Modell-Schicht
- 44
- Modell-Schicht
- 46
- Modell-Schicht
- 48
- Modell-Schicht
- 50
- Modell-Schicht
- 60
- Fourier-Transform-Spektrometer
- 62
- Lichtquelle
- 64
- Parabolspiegel
- 66
- halbdurchlässiger Spiegel
- 68
- starr
montierter Spiegel
- 70
- bewegbarer
Spiegel
- 72
- Ausgang
des FTS 60
- 74
- Umlenkspiegel
- 76
- feststehender
Polarisator
- 78
- weiterer
Parabolspiegel
- 80
- Mess-Spot
- 82
- Wafer
mit Schichten
- 84
- Träger
- 86
- Ellipsoidspiegel
- 88
- Detektor
- 90
- rotierbarer
Polarisator
- 94
- Gerade
- 102
- Bestrahlen
der Schicht
- 104
- Empfangen
einer Antwort-Strahlung
- 106
- Bestimmen
von Charakterisierungsdaten
- 108
- Postulieren
einer Modell-Schicht
- 110
- Berechnen
von Modell-
-
- Charakterisierungsdaten
- 112
- Fit
- 114
- Ermitteln
der gesuchten Größe
- 122
- Bestrahlen
der Referenz-Schicht
- 124
- Empfangen
einer Antwort-Strahlung
- 126
- Bestimmen
von Referenz-
-
- Charakterisierungsdaten
- 128
- Vergleichen
- 132
- Peak
- 134
- breites
Maximum
- 136
- breites
Maximum
- 138
- Breites
Maximum