WO2005045364A1 - 位置検出方法、露光方法、位置検出装置、露光装置及びデバイス製造方法 - Google Patents

位置検出方法、露光方法、位置検出装置、露光装置及びデバイス製造方法 Download PDF

Info

Publication number
WO2005045364A1
WO2005045364A1 PCT/JP2004/016423 JP2004016423W WO2005045364A1 WO 2005045364 A1 WO2005045364 A1 WO 2005045364A1 JP 2004016423 W JP2004016423 W JP 2004016423W WO 2005045364 A1 WO2005045364 A1 WO 2005045364A1
Authority
WO
WIPO (PCT)
Prior art keywords
model
regression model
position information
value
wafer
Prior art date
Application number
PCT/JP2004/016423
Other languages
English (en)
French (fr)
Inventor
Shinichi Nakajima
Original Assignee
Nikon Corporation
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nikon Corporation filed Critical Nikon Corporation
Priority to JP2005515316A priority Critical patent/JP4596166B2/ja
Publication of WO2005045364A1 publication Critical patent/WO2005045364A1/ja

Links

Classifications

    • GPHYSICS
    • G03PHOTOGRAPHY; CINEMATOGRAPHY; ANALOGOUS TECHNIQUES USING WAVES OTHER THAN OPTICAL WAVES; ELECTROGRAPHY; HOLOGRAPHY
    • G03FPHOTOMECHANICAL PRODUCTION OF TEXTURED OR PATTERNED SURFACES, e.g. FOR PRINTING, FOR PROCESSING OF SEMICONDUCTOR DEVICES; MATERIALS THEREFOR; ORIGINALS THEREFOR; APPARATUS SPECIALLY ADAPTED THEREFOR
    • G03F9/00Registration or positioning of originals, masks, frames, photographic sheets or textured or patterned surfaces, e.g. automatically
    • G03F9/70Registration or positioning of originals, masks, frames, photographic sheets or textured or patterned surfaces, e.g. automatically for microlithography
    • G03F9/7003Alignment type or strategy, e.g. leveling, global alignment
    • GPHYSICS
    • G03PHOTOGRAPHY; CINEMATOGRAPHY; ANALOGOUS TECHNIQUES USING WAVES OTHER THAN OPTICAL WAVES; ELECTROGRAPHY; HOLOGRAPHY
    • G03FPHOTOMECHANICAL PRODUCTION OF TEXTURED OR PATTERNED SURFACES, e.g. FOR PRINTING, FOR PROCESSING OF SEMICONDUCTOR DEVICES; MATERIALS THEREFOR; ORIGINALS THEREFOR; APPARATUS SPECIALLY ADAPTED THEREFOR
    • G03F9/00Registration or positioning of originals, masks, frames, photographic sheets or textured or patterned surfaces, e.g. automatically
    • G03F9/70Registration or positioning of originals, masks, frames, photographic sheets or textured or patterned surfaces, e.g. automatically for microlithography
    • G03F9/7003Alignment type or strategy, e.g. leveling, global alignment
    • G03F9/7046Strategy, e.g. mark, sensor or wavelength selection

Definitions

  • Position detection method exposure method, position detection device, exposure device, and device manufacturing method
  • the present invention relates to a position detection method, an exposure method, a position detection device, an exposure device, and a device manufacturing method, and more particularly, to a position detection method for detecting position information of a plurality of partitioned areas arranged on an object. Exposure method using the position detection method, position detection device for detecting position information of a plurality of divided areas arranged on an object, exposure device using the position detection device, device manufacturing using the exposure method and exposure device About the method.
  • each of a plurality of shot areas arranged on a substrate is defined by a predetermined reference point in a stationary coordinate system (that is, a rectangular coordinate system defined by a laser interferometer) that defines the movement position of the substrate. It must be very precisely aligned (eg, with the processing points of various devices).
  • a circuit pattern (reticle pattern) of ten or more layers is transferred onto a wafer in a superimposed manner.
  • the characteristics on the circuit are disadvantageous. May occur.
  • the chip does not satisfy the expected characteristics, and in the worst case, the chip becomes defective and the yield decreases. Therefore, in the exposure step, an alignment mark is previously attached to each of a plurality of shot areas on the wafer, and the position (coordinate value) of the mark in the stage coordinate system is detected. Shi Thereafter, based on the mark position information and the position information of the known reticle pattern (this is measured in advance), a wafer alignment is performed to align one shot area on the wafer with the reticle pattern. .
  • D / D die-by-die
  • the other is a global 'alignment method' that aligns shot areas by detecting alignment marks in several shot areas on the wafer and determining the regularity of the shot area arrangement.
  • the global alignment method is mainly used in the device manufacturing line in consideration of throughput.
  • the Enhanced Global Alignment (EGA) method in which the regularity of the arrangement of shot regions on a wafer is precisely specified by a statistical method, has become mainstream (for example, See Japanese Unexamined Patent Publication No. Sho 61-44429 and U.S. Pat. No. 4,780,617 corresponding thereto, and Japanese Patent Application Laid-Open No. 62-84516 and U.S. Pat. No. 4,780,617 corresponding thereto).
  • sample shots position coordinates on a stage coordinate system of a plurality of shot areas (hereinafter, also referred to as "sample shots") on a wafer are actually measured. Then, the actual measured value and the design of a plurality (three or more required, usually about 7 to 15) of sample shots on the array coordinate system defined by the array of shot areas on the wafer are considered.
  • the regression-analytical statistical calculation process for example, the least squares method
  • finds the values of error parameters such as scaling, rotation, and offset used in the conversion.
  • position coordinates of each shot area in the stage coordinate system are calculated based on a regression model defined by the obtained error parameter values.
  • the residuals (learning errors) of the regression model power of measured data can be reduced as much as possible by increasing the degree of freedom of parameters.
  • measurement data usually contains noise components due to measurement errors, etc.
  • a model different from the true model may be selected as the most likely model.
  • the EGA method is a method for predicting the positions of all shot areas with limited sample power. If a regression model with unnecessarily large parameter flexibility is selected, the expected positions of shot areas other than the sample shots are estimated. In such a case, the deviation from the actual position may be rather large.
  • model error generalization error
  • the model It is necessary to set the degree of freedom of the parameters and the number of samples appropriately.
  • the present invention has been made under the above circumstances, and a first object of the present invention is to detect position information of a plurality of partitioned areas on an object with high accuracy or in a short time and with high accuracy.
  • An object of the present invention is to provide a position detection method that can be used.
  • a second object of the present invention is to provide an exposure method capable of forming a pattern in a plurality of partitioned areas on an object with high accuracy or in a short time and with high accuracy. .
  • a third object of the present invention is to provide a position detecting device capable of detecting position information of a plurality of divided areas on an object with high accuracy or in a short time with high accuracy.
  • a fourth object of the present invention is to provide an exposure apparatus that can form a pattern in a plurality of partitioned areas on an object with high accuracy or in a short time and with high accuracy.
  • a fifth object of the present invention is to provide a device manufacturing method capable of improving device productivity.
  • a position detecting method for detecting position information of a plurality of partitioned areas arranged on an object, wherein the plurality of partitioned areas in a predetermined coordinate system are A first step of determining a model relating to the arrangement of the plurality of partitioned areas based on an actually measured value of the positional information of at least a part of the partitioned areas; and V based on the determined model; And a second step of calculating position information of the defined area.
  • a model relating to the arrangement of the plurality of partitioned areas is determined based on the actually measured values of the positional information of at least some of the partitioned areas, and in the second step, the determined model is determined. Is used to calculate the position information of the plurality of partitioned areas. That is, since a model close to the true model can be determined based on the actual positional information of the partitioned areas, the positional information of the plurality of partitioned areas can be accurately calculated based on the model.
  • the first step may include a step of determining a section area for measuring the position information based on an actually measured value of the position information of the at least one section area.
  • the degrees of freedom of the parameters of the model are determined based on the actually measured values of the position information of the at least some of the divided areas, and the degrees of freedom of the parameters of the determined model are determined.
  • the division area to be additionally measured based on Can do.
  • a position detecting method for detecting position information of a plurality of partitioned areas arranged on an object, wherein the position detecting method includes: Using the measured values of the positional information of some of the divided areas, the regression models for the plurality of divided areas, each having a different degree of freedom of the parameters, are respectively predetermined evaluation criteria of the model. A first step of calculating a value determined as the regression model for the plurality of partitioned areas based on the calculation result and selecting a model determined to be optimal in the evaluation criterion; based on the selected regression model. A second step of calculating position information of the plurality of partitioned areas.
  • a regression with a small generalization error for a plurality of partitioned regions on the object is performed.
  • the model is most likely selected as the model.
  • the model closest to the true model is selected, so that in the second step, the position information of the plurality of partitioned areas can be calculated with high accuracy.
  • the method further includes a third step of reflecting parameter values of a regression model selected as an optimal model in the evaluation criterion to prior knowledge about coefficients defining the regression model,
  • the first step, the second step, and the third step may be repeated while sequentially changing the object whose position information is to be detected for the plurality of objects in which the regions are formed. it can.
  • prior knowledge about coefficients defining a regression model refers to information obtained in advance about coefficients including the values of coefficients of regression models obtained in the past. is there. Note that the values of the coefficients of the regression model obtained in the past include those obtained by regression analysis based on the measured position information of each partitioned area on the object, regression analysis based on simulation, and any other means.
  • the position information of each of the divided areas is measured so that the number of the regression models selected as the optimal model in the evaluation criterion is sufficient.
  • the number of sample values can be updated.
  • the first position in which the degree of freedom of the parameter is a predetermined magnitude.
  • An optimal model in the evaluation criterion may be selected.
  • the degree of freedom of the parameter is larger than the value of the evaluation criterion of the first regression model having a predetermined magnitude.
  • the second regression model is regarded as an optimal model in the evaluation criterion.
  • the first regression model has a better value of the evaluation criterion than the second regression model and the likelihood in the first regression model is better than a predetermined value
  • the first regression model has a better value of the evaluation criterion than the second regression model, and the likelihood in the first regression model is a predetermined value. If not better, the degree of freedom of the parameters is greater than in the first regression model, and the third regression model may be selected as the optimal model in the evaluation criterion.
  • the third regression model when the third regression model is selected as an optimal model in the evaluation criterion, the number of samples of the actually measured value of the position information of the partitioned area is: In order to sufficiently evaluate the likelihood of the third regression model, a section area to be measured is further added, and the measured value of the position information of the added section area is measured. Then, the values of the parameters of the third regression model can be calculated.
  • the third regression model when the third regression model is selected and there are a plurality of the third regression models, the third regression model having the best evaluation criterion value is assigned to the evaluation criterion. Can be selected as the optimal model in.
  • the coefficients of the regression model which are expected to have large fluctuations in values between objects, are used as parameters in the first, second, and third regression models.
  • the coefficient of the regression model which is expected to have a relatively small change in the value of, is used as a parameter, while in the second regression model, the coefficient is determined based on the prior knowledge.
  • a regression model that is expected to have almost the same value for all objects as a fixed constant May be a constant determined based on the prior knowledge in the first and second regression models, while being a parameter in the third regression model.
  • a coefficient expected to have a large variation in the value between the processing units is: While parameters are used in the first and third regression models, constants are set based on the prior knowledge in the second regression model, and when the number of processes exceeds a predetermined number, In the first and second regression models, the coefficient is a constant determined on the basis of the prior knowledge, while the coefficient is used as a parameter in the third regression model.
  • a position detection method for sequentially detecting, for each object, position information of a plurality of partitioned areas arranged on a plurality of objects.
  • Estimating the coefficient of the model for each object includes a step of estimating the coefficient of the model of the object to be estimated based on the estimation result of the object for which the estimation of the coefficient of the model has already been completed. This is the third position detection method.
  • the coefficient of the model relating to a plurality of partitioned areas arranged on the object is estimated, so that the accuracy can be reduced in a short time. It is possible to detect the position information of the partitioned area well.
  • a position detection method for sequentially detecting, for each object, position information of a plurality of divided areas arranged on a plurality of objects, wherein the position information of the object is Prior knowledge about the coefficients of the regression model for the plurality of partitioned areas obtained each time sequential detection is performed, and some of the plurality of partitioned areas of the object whose position information is to be detected this time in a predetermined coordinate system
  • the next position A third step of determining the sample number of the measured value of the position information of each of the divided areas in the object to be detected, and the plurality of divided areas formed therein.
  • a fourth position detection method of repeating the first step, the second step, and the third step while sequentially changing the object whose position information is to be detected with respect to the object.
  • the first step, the second step, and the third step are repeatedly executed while sequentially changing the detection target object for a plurality of objects. Then, in the first step, prior knowledge about the coefficients of the regression model for a plurality of partitioned areas obtained each time the position information of the object is sequentially detected, and the object to be detected for the current position information in the predetermined coordinate system
  • the degree of freedom of the parameters of the regression model is optimized by a predetermined evaluation criterion of the regression model based on the actual measurement values of the position information of some of the plurality of subareas.
  • the number of effective samples of the actually measured value of the position information of each partitioned area in the object to be detected next time is determined. This makes it possible to dynamically change the effective sample number of the actual measurement value of the position information of each partitioned area according to the degree of freedom of the parameter to be optimized. Throughput can be improved.
  • the likelihood of each of the regression models is obtained by calculating the position information of each of the partitioned areas in the predetermined coordinate system obtained by the regression model, and the position It can be estimated by the residual of the information and the actual measurement.
  • a coefficient of a primary component indicating a deviation between the predetermined coordinate system and an array coordinate system defined by the arrangement of the plurality of divided areas At least a part of the coefficient indicating the deviation of the component from the design value and the coefficient indicating the higher-order component related to the arrangement of the plurality of partitioned areas can be included.
  • the evaluation criterion may be a criterion that is a likelihood to which a penalty according to the degree of freedom of a model parameter is given.
  • the criterion may be either! / Or the deviation of the Akaike information criterion or the Bayesian information criterion, and a model having a small value may be a good model.
  • the penalty in the above criterion is defined as the product of the expected value of the likelihood change with respect to the increase in the degree of freedom of the parameter of the regression model and the degree of freedom of the parameter of the regression model, and the value of the criterion is large. It is also good to make the model a good model.
  • an exposure method for sequentially exposing a plurality of divided regions arranged on an object to form a predetermined pattern in each divided region. Detecting the position information of the plurality of divided regions by the position detection method of 4; and exposing each of the divided regions by moving the object based on the detected position information. Exposure method. In the case of power, since the position information of a plurality of partitioned areas is detected with high accuracy by the first to fourth position detection methods of the present invention, high-precision overlay exposure or short-time and high-precision overlay An alignment exposure can be realized.
  • a device manufacturing method including a lithographic step, wherein the lithographic step uses the exposure method of the present invention.
  • the exposure is performed by using the exposure method of the present invention, so that high-accuracy overlay exposure or short-time and high-accuracy overlay exposure can be realized.
  • Device productivity can be improved.
  • a position detecting device for detecting position information of a plurality of partitioned areas arranged on an object, wherein the plurality of partitioned areas in a predetermined coordinate system are
  • a measurement device for measuring position information of some of the divided areas; and using a measured value of the measured position information of each of the divided areas, regarding a plurality of the divided areas having different degrees of freedom of parameters.
  • a selection device that calculates a value of a predetermined evaluation criterion of the regression model, and selects an optimal model in the evaluation criterion as a regression model of the plurality of partitioned areas based on the calculation result;
  • a calculation device that calculates position information of the plurality of partitioned areas based on the selected regression model.
  • the selection device selects the most likely regression model based on the log likelihood with a penalty of the regression model related to the plurality of partitioned regions, each of which has a different degree of freedom of the norameter. .
  • the model closest to the true model is selected, so that the calculation device can accurately calculate the position information of the plurality of partitioned areas.
  • a storage device for storing prior knowledge about coefficients defining the regression model of the plurality of partitioned areas; a regression model selected by the selection device as an optimal model according to the evaluation criterion
  • An updating device that reflects the parameters of the above in the prior knowledge stored in the storage device; and wherein the selecting device performs the regression model based on the prior knowledge stored in the storage device.
  • the storage device stores the number of samples of actual measurement values of the positional information of each of the divided areas measured by the measuring device, and the updating device sets the optimal model in the evaluation standard as the optimal model. Updating the number of samples of the actual measurement value of the position information of each of the divided areas stored in the storage device so that the number is sufficient to evaluate the likelihood of the selected regression model. can do.
  • a position detecting device for sequentially detecting position information of a plurality of partitioned areas arranged on a plurality of objects for each object, wherein the position information of the object is Prior knowledge about the coefficients of the regression model for the plurality of partitioned areas obtained each time sequential detection is performed and some of the plurality of partitioned areas of the object to be detected for the current position information in a predetermined coordinate system
  • An optimization device for optimizing the degree of freedom of the parameters of the regression model based on the actual measurement value of the position information of the partitioned area according to the predetermined evaluation criterion of the regression model;
  • a calculating device that calculates the position information of a plurality of partitioned areas of the object to be detected this time based on the regression model having a degree of freedom; and a calculating device that calculates the next degree of freedom based on the degrees of freedom of the optimized parameters.
  • position A second position detecting device comprising a; determining device and to determine a sample number Le of the measured
  • the optimization apparatus obtains a plurality of positions obtained each time the position information of the object is sequentially detected.
  • Prior knowledge about the coefficients of the regression model for the defined area, and measured values of the position information of some of the defined areas of the object to be detected this time in the predetermined coordinate system Based on the above, the degree of freedom of the parameters of the regression model is optimized by the likelihood given a penalty according to the degree of freedom of the parameters of the regression model. Then, based on the degrees of freedom of the optimized parameters, the determination device determines the number of effective samples of the actually measured values of the position information of each partitioned area in the object to be detected next time for the position information.
  • the number of effective samples of the actual measurement value of the position information of each partitioned area can be increased or decreased according to the degree of freedom of the parameters optimized for each object. Therefore, throughput can be improved while maintaining high-precision exposure.
  • an exposure apparatus for sequentially exposing a plurality of divided areas arranged on at least one object to form a predetermined pattern in each divided area.
  • An exposure device comprising: first and second position detection devices; and a transfer device that moves the object based on the detected position information and exposes each of the divided areas.
  • a device manufacturing method including a lithographic step, wherein the exposure apparatus according to the present invention is used in the lithographic step.
  • the exposure apparatus according to the present invention is used in the lithographic step.
  • FIG. 1 is a view schematically showing a configuration of an exposure apparatus according to a first embodiment of the present invention.
  • FIG. 2 is a diagram showing an example of the arrangement of a shot area on a wafer and a wafer mark attached thereto.
  • FIG. 3 is a flowchart showing a processing algorithm of a CPU of a main control device at the time of exposure processing in the exposure apparatus according to one embodiment of the present invention.
  • FIG. 4 is a flowchart (part 1) showing a wafer alignment process.
  • FIG. 5 is a flowchart (part 2) showing a wafer alignment process.
  • FIG. 6 is a flowchart for explaining an embodiment of a device manufacturing method according to the present invention.
  • FIG. 7 is a flowchart showing details of step 604 in FIG. 6.
  • FIG. 1 shows a schematic configuration of an exposure apparatus 100 according to an embodiment of the present invention.
  • the exposure apparatus 100 is a step-and-scan type projection exposure apparatus.
  • the exposure apparatus 100 includes an illumination system 10, a reticle stage RST holding a reticle R as a mask, a projection optical system PL, a wafer stage WST on which a wafer W as an object is mounted, an alignment detection system AS, and an apparatus.
  • a main control device 20 for overall control of the whole is provided.
  • the illumination system 10 includes, as disclosed in, for example, Japanese Patent Application Laid-Open No. 2001-313250 and corresponding US Patent Application Publication No. 2003Z0025890, etc., with a light source and an illuminance uniforming optical system including an optical 'integrator. It includes a system, a relay lens, a variable ND filter, a variable field stop (also called a reticle blind or a masking 'blade), and a dichroic mirror (all not shown). As an optical 'integrator, a fly-eye lens, a rod integrator (internal reflection type integrator), or a diffractive optical element is used. To the extent permitted by the national laws of the designated State or selected elected States specified in this International Application, the disclosures in the above-mentioned publications and corresponding US patents are incorporated herein by reference.
  • a slit-shaped illumination area (a rectangular illumination area elongated in the X-axis direction) defined by a reticle blind on a reticle R on which a circuit pattern or the like is drawn is irradiated with illumination light IL. Illuminate with almost uniform illuminance.
  • far ultraviolet light such as KrF excimer laser light (wavelength 248 nm), vacuum ultraviolet light such as ArF excimer laser light (wavelength 193 nm), or F laser light (wavelength 157 nm) is used.
  • a reticle R force is fixed on the reticle stage RST by, for example, vacuum suction.
  • the reticle stage RST is driven by a reticle stage driving unit (not shown) driven by a linear motor, a voice coil motor, or the like, so that an XY axis perpendicular to the optical axis of the illumination system 10 (which coincides with the optical axis AX of the projection optical system PL described later)
  • a scanning speed specified in a predetermined scanning direction here, the Y-axis direction, which is the horizontal direction in FIG. 1).
  • the position of the reticle stage RST in the stage movement plane is determined by a reticle laser interferometer (hereinafter simply referred to as “reticle interferometer”) 16 via a movable mirror 15 to a resolution of, for example, about 0.5—1 nm. Is always detected.
  • reticle interferometer reticle laser interferometer
  • a moving mirror having a reflecting surface orthogonal to the Y-axis direction and a moving mirror having a reflecting surface orthogonal to the X-axis direction are provided on the reticle stage RST. In FIG. 1, these are typically shown as a moving mirror 15 and a reticle interferometer 16.
  • the end surface of reticle stage RST may be mirror-finished to form a reflection surface (corresponding to the reflection surface of movable mirror 15).
  • at least one corner cube type mirror (for example, a retro-reflector) is used instead of the reflecting surface extending in the X-axis direction used for detecting the position of the reticle stage RST in the scanning direction (Y-axis direction in this embodiment). Is also good.
  • the reticle Y interferometer is a two-axis interferometer having two measurement axes, and the reticle stage is determined based on the measurement values of the reticle Y interferometer.
  • the amount of rotation (jowing amount) in the z direction (the direction of rotation around the Z axis) at the Y position of the RST!
  • Reticle interferometer 16-power Position information of reticle stage RST (including rotation information such as jowing amount) is supplied to stage controller 19 and main controller 20 via this.
  • the stage control device 19 drives and controls the reticle stage RST via a reticle stage driving unit (not shown) based on the position information of the reticle stage RST in response to an instruction from the main control device 20.
  • a pair of reticle alignment detection systems 22 (however, the reticle alignment detection system 22 on the back side of the paper is not shown in FIG. 1) is arranged at a predetermined distance in the X-axis direction. ing. Each reticle alignment detection system 22 is not shown here.
  • the illumination system comprises an epi-illumination system for illuminating a mark to be detected with illumination light having the same wavelength as the illumination light IL, and a detection system for capturing an image of the mark to be detected.
  • the detection system includes an imaging optical system and an image sensor, and the imaging result of the detection system (that is, the detection result of the mark by the reticle alignment detection system 22) is supplied to the main control device 20.
  • a deflecting mirror (not shown) for guiding the detection light from the reticle R to the reticle alignment detection system 22 is movably arranged, and when the exposure sequence is started, the main controller 20 sends the detection light.
  • the deflection mirrors are retracted out of the optical path of the illumination light IL integrally with the reticle alignment detection system 22 by a driving device (not shown) based on the command.
  • the projection optical system PL is arranged below the reticle stage RST in FIG. 1, and the direction of the optical axis AX is the Z-axis direction.
  • a refracting optical system having a predetermined reduction magnification for example, 1Z5 or 1Z4 with double telecentricity is used. Therefore, when the illumination area IL of the reticle R is illuminated by the illumination light IL from the illumination system 10, a reduced image (partially inverted image) of the illumination area portion of the circuit pattern of the reticle R is formed on the wafer W via the projection optical system PL. The light is projected onto a projection area in the field of view of the projection optical system conjugate to the above illumination area, and is transferred to a resist layer on the surface of the wafer W.
  • the wafer stage WST is arranged on a base (not shown) below the projection optical system PL in FIG.
  • Wafer holder 25 is mounted on wafer stage WST.
  • the wafer W is fixed on the wafer holder 25 by, for example, vacuum suction or the like.
  • the wafer stage WST is arranged below the projection optical system PL in FIG. 1 and on a base (not shown).
  • Wafer holder 25 is mounted on wafer stage WST.
  • the wafer W is fixed on the wafer holder 25 by, for example, vacuum suction or the like.
  • the wafer stage WST is driven by X, Y, ⁇ , ⁇ ⁇ (rotation direction around ⁇ axis), ⁇ ⁇ (rotation direction around ⁇ axis), and 0 y ( ⁇ axis It is a single stage that can be driven in six degrees of freedom (in the direction of rotation).
  • the wafer stage WST (specifically, the wafer holder 25) may be configured to be rotatable, and the bowing error of the wafer stage WST may be reduced by the reticle stage RST side.
  • the correction may be made by rotation.
  • a moving mirror 17 that reflects a laser beam from a wafer laser interferometer (hereinafter abbreviated as “wafer interferometer”) 18 is fixed to a side surface of the wafer stage WST, and a wafer placed outside is fixed.
  • the interferometer 18 constantly detects the positions of the wafer stage WST in the X direction, the Y direction, and the 0z direction (the rotation direction around the Z axis) with a resolution of, for example, about 0.5 to 1 nm.
  • an X moving mirror having a reflecting surface orthogonal to the X-axis direction and a Y moving mirror having a reflecting surface orthogonal to the Y-axis direction are actually provided on wafer stage WST.
  • the wafer interferometer also irradiates the X-moving mirror and the Y-moving mirror with laser light to measure the positions of the ueno and stage WST in the X-axis and Y-axis directions, respectively.
  • Y-axis interferometer are provided.
  • the X-axis and Y-axis interferometers are composed of multi-axis interferometers having a plurality of measurement axes, and in addition to the X and Y positions of wafer stage WST, rotation (jowing (rotation about Z axis)). ⁇ z rotation), pitching ( ⁇ X rotation around the X axis), and rolling ( ⁇ y rotation around the Y axis)) can also be measured.
  • a plurality of wafer interferometers and a plurality of moving mirrors are provided, respectively, and these are representatively shown as a moving mirror 17 and a wafer interferometer 18 in FIG.
  • the reflection surface (corresponding to the reflection surface of the movable mirror) may be formed by mirror-finish the end surface of the stage WST.
  • a reference mark plate FM is fixed near wafer W on wafer stage WST.
  • the surface of this reference mark plate FM is set at the same height as the surface of the wafer W, and this surface has at least a pair of reference marks for reticle alignment and reference marks for baseline measurement of the alignment detection system AS. Is formed.
  • the alignment detection system AS is an off-axis alignment sensor arranged on the side surface of the projection optical system PL.
  • the alignment detection system AS for example, irradiates the target mark with a broadband detection light beam that does not expose the resist on the wafer, and reflects the target mark image formed on the light receiving surface by the reflected light from the target mark.
  • FIA (Field Image Alignment) type sensors are used.
  • a target mark is irradiated with coherent detection light to detect scattered or diffracted light generated from the target mark, or two diffracted lights (for example, the same order) generated by the target mark force
  • the alignment sensor for detecting interference by interference can be used alone or in combination as appropriate.
  • the imaging result of the alignment detection system AS is output to the main controller 20 via an alignment signal processing system (not shown).
  • the control system mainly includes a main controller 20 and a stage controller 19 under the main controller.
  • the main controller 20 includes a CPU (central processing unit), ROM (read only memory), RAM (random access memory), etc., and includes a so-called microcombiner (or workstation). It is configured and controls the whole device.
  • the main control device 20 includes, for example, an input device including a pointing device such as a keyboard and a mouse, a display device 0 such as a CRT display (or a liquid crystal display), a shift is not shown, and a CD. (Compact Disc), DVD (Digital Versatile Disc), MO (Magneto-Optical disc) or FD (Flexible Disc) and other information recording media drive device 46 and hard disk storage device 47 are externally connected. .
  • An information recording medium (hereinafter, referred to as a CD) set in the drive device 46 includes a program (hereinafter, for convenience, which corresponds to a processing algorithm at the time of wafer alignment and exposure operation shown in a flowchart described later). This is recorded as “specific programs”), other programs, and databases attached to these programs.
  • the main controller 20 executes, for example, processing according to the above-described specific program so that the exposure operation is performed properly, and performs, for example, synchronous scanning of the reticle R and the wafer W, stepping of the wafer W, and the like. Control.
  • the reticle interferometer 16 and the wafer interferometer 18 move the reticle stage drive unit and the wafer stage drive unit 24 (not shown) so that they are scanned at
  • the position and speed of the reticle stage RST and wafer stage WST are respectively controlled via them.
  • main controller 20 controls the position of wafer stage WST via wafer stage drive unit 24 based on the measurement value of wafer interferometer 18.
  • the exposure apparatus 100 of the present embodiment transmits the image forming light beam for forming a plurality of slit images toward the best image forming plane of the projection optical system PL from an oblique direction with respect to the optical axis AX direction.
  • An oblique incidence multi-point focus detection system which includes an irradiation system (not shown) to supply and a light receiving system (not shown) that receives each reflected light beam of the imaging light beam from the surface of the wafer W through a slit, respectively.
  • this multipoint focus detection system one having the same configuration as that disclosed in, for example, Japanese Patent Application Laid-Open No. Hei 6-283403 and US Patent No. 5,448,332 corresponding thereto is used.
  • the output of the multipoint focus detection system is supplied to main controller 20.
  • the main controller 20 drives the wafer stage WST in the Z direction and the tilt direction via the stage controller 19 and the wafer stage driving unit 24 based on the information on the position and the position of the multipoint focus detection system.
  • the specific program in the CD-ROM set in the drive device 46 and other programs are installed in the storage device 47. Further, the program power of the reticle alignment and the baseline measurement process is loaded from the storage device 47 to the memory of the main control device 20 by the CPU inside the main control device 20.
  • the average value of the X position is designed to match the X coordinate of the shot area SA (center C),
  • the average of the Y positions of the marks M 1, M 2, M 3, and M 3 is the Y coordinate of the shot area SA (center C)
  • the position coordinates of the shot area SA (center C) can be obtained from the X position and ⁇ position of ⁇ , ⁇ .
  • a cross mark formed by lines extending in the 'direction is used. These marks may be box marks that are joined by a cross mark, a line 'and' space 'pattern (LZS pattern) with the ⁇ -axis direction as its arrangement direction, and an
  • step 301 reticle R is loaded on reticle stage RST via a reticle loader (not shown).
  • the main controller 20 executes the reticle alignment and baseline measurement processing as described above. Is executed according to the following program.
  • reference mark plate FM on wafer stage WST via wafer drive and stage drive unit 24 is placed at a predetermined position immediately below projection optical system PL (hereinafter referred to as “reference position” for convenience). ), And the relative positions of the pair of first fiducial marks on the fiducial mark plate FM and the corresponding pair of reticle alignment marks on the reticle R are described above. Detection is performed using the chicular alignment detection system 22. Then, main controller 20 stores the detection result of reticle alignment detection system 22 and the measured values of interferometers 16 and 18 at the time of the detection in memory.
  • main controller 20 moves wafer stage WST and reticle stage RST in the opposite directions along the Y-axis direction by a predetermined distance, respectively, and moves another pair of first fiducial marks on fiducial plate FM.
  • the relative position with respect to another pair of reticle alignment marks on the corresponding reticle R is detected using the pair of reticle alignment detection systems 22 described above.
  • main controller 20 stores the detection result of reticle alignment detection system 22 and the measured values of interferometers 16 and 18 at the time of detection in memory.
  • the relative positional relationship between another pair of first fiducial marks on the fiducial mark plate FM and the corresponding reticle alignment marks may be further measured.
  • main controller 20 provides information on the relative positional relationship between at least two pairs of the first reference marks and the corresponding reticle alignment marks obtained in this manner, and the interferometer at the time of each measurement.
  • the reticle stage coordinate system defined by the measurement axis of the interferometer 16 and the wafer stage coordinate system defined by the measurement axis of the interferometer 18 (hereinafter referred to as the “stage coordinate system”) ) Is obtained. This ends the reticle alignment.
  • step 305 baseline measurement is performed. Specifically, the wafer stage WST is returned to the above-described reference position, and is moved by a predetermined amount, for example, the design value of the baseline in the XY plane from the reference position, and the reference mark is detected using the alignment detection system AS. Detect the second fiducial mark on the board FM. Main controller 20 obtains the information on the relative positional relationship between the detection center of alignment detection system AS and the second fiducial mark obtained at this time, and a pair of first and second wafers measured when wafer stage WST was previously positioned at the reference position.
  • a predetermined amount for example, the design value of the baseline in the XY plane from the reference position
  • Main controller 20 obtains the information on the relative positional relationship between the detection center of alignment detection system AS and the second fiducial mark obtained at this time, and a pair of first and second wafers measured when wafer stage WST was previously positioned at the reference position.
  • the baseline of the alignment detection system AS that is, the reticle
  • the distance (positional relationship) between the projection center of the pattern and the detection center (index center) of the alignment detection system AS is calculated.
  • main controller 20 unloads the above-described reticle alignment and baseline measurement processing programs from the memory,
  • the specific program described above is loaded from the storage device 47 to the memory. Thereafter, according to this specific program, wafer loading, wafer alignment (here, EGA type wafer alignment), and exposure for each shot area SA on the Ueno and W are performed.
  • the wafer W is loaded onto the wafer holder 25 on the wafer stage WST via a wafer loader (not shown).
  • a stage alignment system (XY coordinate system) for defining the movement position of the wafer stage WST and a shot area on the wafer W by a bri-alignment device (not shown).
  • the rotational displacement and center of the wafer W with respect to the ueno and the stage WST are adjusted so that the coordinate system defined by the array (the a8 coordinate system in Fig. 2; hereinafter, abbreviated as the "wafer coordinate system") coincides to some extent.
  • the a8 coordinate system in Fig. 2 hereinafter, abbreviated as the "wafer coordinate system”
  • a wafer alignment process is performed.
  • the arrangement of shot areas on the wafer W in the stage coordinate system is estimated, and the arrangement, that is, the center position of all shot areas is calculated.
  • the wafer alignment process will be described later in detail.
  • step 311 the counter j indicating the array number of the shot area is set to 1, and the first shot area is set as an exposure target area.
  • step 313 the position of the wafer W is displayed on the wafer W based on the array coordinates (center position of each shot area) of the exposure target area calculated in step 526 of FIG.
  • the wafer stage WST is moved via the stage controller 19 and the wafer stage drive unit 24 so as to be the acceleration start position for exposing the exposure target area, and the position of the reticle R becomes the acceleration start position.
  • the reticle stage RST is moved via the stage controller 19 and the reticle stage drive unit (not shown).
  • step 315 relative scanning between reticle stage RST and wafer stage WST is started.
  • the pattern area of the reticle R starts to be illuminated by the illumination light IL from the illumination system 10, and scanning exposure is started.
  • the different areas of the reticle R pattern area correspond to the illumination light IL.
  • the scanning exposure is completed when the illumination of the entire pattern area is completed.
  • the pattern of the reticle R is reduced and transferred to the exposure target area on the wafer W via the projection optical system PL.
  • step 317 it is determined whether or not all shot areas have been exposed, with reference to the counter value j.
  • step 319 the value of the counter j is incremented (+1), the next shot area is set as an exposure target area, and the flow returns to step 313.
  • step 313 ⁇ step 315 ⁇ step 317 ⁇ step 319 are repeated until the determination in step 317 is affirmed.
  • step 317 When the transfer of the pattern to all the shot areas on the wafer W is completed, the determination in step 317 is affirmed, and the process proceeds to step 321.
  • step 321 an instruction to unload the wafer W is given to a wafer loader (not shown).
  • the wafer W is unloaded from above the wafer holder 25, is connected inline to the exposure apparatus 100 by a wafer transfer system (not shown), and is transferred to a coater / developer (not shown).
  • next step 323 it is determined whether or not exposure of all wafers in the lot has been completed. If this judgment is affirmed, the exposure processing is terminated, and if denied, the procedure returns to step 307. Here, since the exposure of the first (first) wafer W in the lot has only been completed, the determination is denied, and the process returns to step 307.
  • step 307 wafer opening
  • subroutine 309 wafer alignment
  • step 311 one step 319 (exposure)
  • step 321 wafer unloading
  • step 323 slot end determination
  • wafer alignment processing and exposure processing are performed on the wafers in the lot, with the wafers sequentially loaded on the wafer stage WST being processed.
  • stage coordinate system (X, ⁇ ) that defines the movement position of the wafer stage WST and the wafer coordinate system ( ⁇ , ⁇ ) is the main cause of strong misalignment. It is rejected as.
  • wafer scaling in the X-axis direction S is two points in the a direction on wafer W
  • Ratio of the measured distance between the measured value and the design value, wafer scaling in the Y-axis direction S is 2 in the ⁇ -direction
  • the axial translation component (offset) is represented by o and o.
  • the pattern to be transferred to the design position (DX, DY) in the wafer coordinate system (a, j8) is actually the following. It is expected to be located at the position (EX, EY) on the stage coordinate system (X, Y) obtained by the formula.
  • the orthogonality error W and the residual rotation error ⁇ are considered to be minute amounts, and the transfer position (DX, DY) in the design is estimated by the following equation that expresses the trigonometric function of the above equation (1) by a linear approximation.
  • the transfer position (EX, ⁇ ) is related.
  • the above equation (4) is the model equation of the most general linear model in the force EGA method.
  • the components in the shot are the positions of the wafer marks M formed at the four corners of the shot area SA.
  • the design position of the wafer mark ⁇ in that coordinate system is (mx, my)
  • sx and sy indicate the scaling component (shot scaling component) of the intra-shot coordinate system with respect to the stage coordinate system
  • rx and ry indicate the rotation component (shot rotation component) of the intra-shot coordinate system with respect to the stage coordinate system, respectively. Is shown.
  • the expected position (MX ', MY') can be expressed by the following equation.
  • (DX, DY) is the design coordinate of the center C of the shot area SA.
  • the design position (DX, DY) of the shot area is determined by the model of the above equation (4).
  • the values of the coefficients Sx, Sy, Rx, Ry, Ox, and Oy in the model equation of the above equation (4) may be obtained.
  • the values of the coefficients Sx, Sy, Rx, Ry, Ox, and Oy are calculated based on the actual positions of some wafer marks M, the
  • Design shot (DX, DY) of the SH Using the design position (mx, my) in the internal coordinate system,
  • the evaluation function E is obtained by calculating the residual of the estimated position (MX ′, MY ′) of the measured position of each wafer mark M and the actually measured value (MX, MY) of the position, which are obtained from the above equation (6).
  • K gggg The sum of squares of the difference divided by the number of samples h of the wafer mark M (that is, the square of the residual
  • i ⁇ P ⁇ g, i is the number of the sample shot given in order (for example, in the order of the measurement path), and g is the number of the wafer mark actually measured. is there.
  • the number h of samples of the wafer mark M is large if it is large.
  • the number h of samples of the wafer mark M is equal to the number of unknowns (parameters) in the EGA model formula.
  • the parameters of the model equation shown in the above equation (6) which does not reduce the alignment accuracy, are reduced as much as possible (the degree of freedom is reduced), and the number h of samples of the wafer mark M is reduced as much as possible.
  • the number h of samples of hamark M is, for example,
  • the model equation shown in the above equation (6) is used.
  • the coefficients are classified in advance as follows based on the properties (attributes) of the values of the coefficients obtained empirically.
  • the coefficients of the model equation of the above equation (6) are classified as follows.
  • the value is fixed as a constant, estimated as a parameter if necessary, and the coefficient for changing the value [0113]
  • the prior knowledge is knowledge about the value of each coefficient of the model formula of the above equation (6).
  • the value obtained from the prior knowledge is the value of the coefficient expected from the value of the coefficient of the model equation obtained in the past.
  • the default value of each coefficient in the prior knowledge may be stored in the storage device 47, for example. As this default value, for example, a value of prior knowledge in the previous lot may be used, or a design value may be used (0 may be used).
  • the coefficients of the model equation of the above equation (6) there are some different trends, and the coefficients can be classified based on the trends.
  • An example of the classification is shown below.
  • the wafer offset components Ox, Oy and the rotation components Rx, Ry vary due to the variation in the result of the pre-alignment performed before the wafer is loaded on the wafer stage WST. It is reasonable to make an estimate and it is desirable to classify it as a factor of a.
  • wafer scaling Sx and Sy depend more on the characteristics and processes of the exposure apparatus than on the wafer, the amount of variation between wafers in the same lot that has been exposed by the same exposure apparatus through the same process is very small.
  • the value may vary slightly between wafers in the same lot, so it is appropriate to classify as a coefficient b.
  • the values of the coefficients (sx, sy, rx, ry) of the components in the shot are desirably classified into the coefficients of e. When it is basically assumed that they do not change.
  • each coefficient in the EGA model equation (Equation (6)) is not limited to this example, and various classification patterns can be adopted.
  • the coefficients (sx, sy, rx, ry) of the in-shot components can be classified as d.
  • this subroutine 309 Each time a wafer is switched, it is executed once for that wafer. Therefore, in the following description, the processing flow when the first wafer of the lot is processed is first described, and then the second, third,... Wafers are sequentially processed. The flow of the processing when this is done will be described in order.
  • step 402 of FIG. 4 it is determined whether or not the force of the wafer W which is the subject of the current processing and is loaded on the wafer stage WST is within the first m (for example, 5) th wafer W of the lot. . If the determination is affirmative, the process proceeds to step 404, and if the determination is negative, the process proceeds to step 418.
  • the wafer W loaded on the wafer stage WST is the first wafer W in the lot (the first wafer)
  • the determination is affirmed, and the process proceeds to step 404.
  • step 404 sample information of the wafer W is referred to.
  • the pull information is information on the number and arrangement of the measured wafer marks.
  • the ability to optimize the number of samples along with the optimization of the parameters of the model formula At this stage, the wafer W at the head of the lot is to be processed, and the parameters of the model formula are still being optimized. Since the number and arrangement of the wafer marks M i, k to be measured at this point in time are not parameters, if all the coefficients of the model equation of the above equation (6) are used as parameters, The number and arrangement must satisfy the number of valid samples required for the calculation. Specifically, since the maximum parameter degree of freedom of the model equation of equation (6) is 5 for each axis, the number of samples here must be 6 or more.
  • the number and arrangement of the wafer marks M satisfying the number of effective samples are determined by the storage device 47 i, k
  • the default set sample information is obtained from the storage device 47, is stored in the memory, and is referred to.
  • the sample information is designated as a sample shot! Of the wafer marks M attached to the shot area SA, h wafer marks are
  • the wafer stage WST is moved in the XY plane so as to sequentially move within the detection field of view of the alignment detection system AS, and the wafer mark M is imaged by the alignment detection system AS.
  • the wafer stage WST is moved in the XY plane so as to sequentially move within the detection field of view of the alignment detection system AS, and the wafer mark M is imaged by the alignment detection system AS.
  • the position of the WST is determined from the measured value of the wafer interferometer 18. Since the alignment detection system AS sends the position information of the wafer mark M within the imaging field of view,
  • Stage M the position information of wafer M, the measured values of wafer interferometer 18 and the baseline
  • the measured value of the position of the wafer mark M in the coordinate system can be obtained. Asked
  • the measured value of the wafer mark M is stored in the memory. In this way, sample information
  • the coefficients classified into e. are set as constants determined by prior knowledge, and then classified into a.- d. Based on the measured values of the positions of the obtained wafer marks. Calculate the value of the coefficient.
  • the prior knowledge of the coefficients classified in e. Is obtained.
  • the value of the prior knowledge of the coefficient classified into e. Is assumed to be 0.
  • step 410 the obtained EGA parameters are set as the coefficients of the above equation (6), and the measured wafer mark M is designed in the in-shot coordinate system.
  • step 412 the statistical model M (first coefficient) in which the coefficients classified into the above models (a.- d. Are used as parameters and the coefficients classified in e.
  • AIC Kaike's Information Criterion
  • the AIC is the estimated value (twice the value) of the KLI data number (here,! /, The number of sample shots h) corrected for the bias due to the increase in the number of parameters representing the model.
  • the AIC of the statistical model M is expressed by the following equation.
  • AIC ⁇ M -2- ⁇ ogL + 2-d ⁇ '(9)
  • logL is the maximum log likelihood for statistical model M
  • d is the number of parameters (unknowns) of statistical model M
  • L is the likelihood.
  • L (1ZE) is used by the evaluation function E shown in the above equation (7).
  • the term 2d is a penalty term for an increase in parameters, and the value of the term increases as the number of parameters increases.
  • AIC is an abbreviation for the Akaike information criterion, which is also used as a function name of the information criterion in the above equation (9).
  • step 412 the value of logL corresponding to the evaluation function (residual error) E calculated this time and the value of the number d of unknown parameters are substituted into the above equation (7), and AIC (M ) Is calculated.
  • Sx, Sy, Rx, Ry, Ox, Oy are parameters and sx, sy, rx, ry are values based on prior knowledge, so the number of parameters d in the model M is 6 become.
  • a statistical model of EGA based on the model equation of the above equation (6) is used as a parameter with the coefficients classified as ac as parameters, and the coefficients classified as b., D., And e. Calculate the value of the evaluation function (residual error) E as the model M as the value (constant) based on the knowledge and the (second regression model).
  • the prior knowledge of Sx, Sy, sx, sy, rx is acquired from the storage device 47, and the value determined by the acquired prior knowledge is represented by the equation (6) ).
  • the values of the coefficients classified into a. And c. are calculated. That is, the measured value of the position of each wafer mark M is substituted into the above equation (6), and the evaluation value shown in the above equation (7) is obtained.
  • the position (MX, MY) of the mark M is obtained, and the obtained position (MX, MY,;) is converted to (MX, i, Ki, Ki, Ki, Ki, K g
  • the value of AIC (M,) of the statistical model M is calculated.
  • Rx, Ry, Ox, and Oy are parameters and Sx, Sy, sx, sy, rx, and ry are values (constants) based on prior knowledge, the number of parameters d of the model M is , And 4.
  • the value of AIC (M) of model M obtained in step 412 is compared with the value of AIC (M,) of model M obtained in step 416. , AIC ( ⁇ ') to determine whether the force is AIC (M) or not.
  • step 504 the process proceeds to step 504, and if the determination is denied, the process proceeds to step 510.
  • the wafer W at the head of the lot (the first wafer) is to be processed, and the coefficient power determined by prior knowledge is fit as the coefficient of the model equation shown in equation (6) for the actual wafer W.
  • the possibilities are not always great. Therefore, here, the judgment is made that the value of AIC (M,) is larger than the value of AIC (M), and the process proceeds to step 510.
  • step 510 the value of the evaluation function (residual error) E in the statistical model M is compared with a predetermined value to determine whether E is smaller than the predetermined value. If this judgment is affirmed, the routine proceeds to step 512, and if this judgment is denied, the routine proceeds to step 516.
  • the value of the prior knowledge of the coefficient classified into e. (Default value) is not fit to the first wafer W of the lot to be processed, so the evaluation function of the model M (residual) E If the value is equal to or greater than the predetermined value, the determination is denied, and the process proceeds to step 516.
  • step 516 it is determined whether or not it is necessary to additionally measure a sample shot with reference to the sample information stored in the memory. If this determination is affirmative, the process proceeds to step 518, and if negative, the process proceeds to step 522.
  • step 522 all the coefficients classified as a.-e. are used as parameters, and based on the actually measured values of the positions of the h wafer marks measured in step 406, a. — Calculate the coefficient value classified into e. That is, the measured value of the position of each wafer mark M is
  • the evaluation function E shown in the above expression (7) is minimized, that is, the parameters Sx, Sy, Rx, Ry, Ox, Ov, sx, sy, rx, ry Value by least squares Request.
  • step 526 the values of the coefficients obtained in step 522 and held in the memory are set as the values of the coefficients of the above equation (4), and the design position (DX ,
  • the position (reference position) (EX, EX) is calculated, and the calculation result is stored in the storage device 47.
  • step 526 the subroutine 309 is ended.
  • the judgment is affirmative, and the routine proceeds to step 404.
  • step 406 the number and arrangement of sample shots included in the sample information are grasped by referring to the sample information stored in the memory.
  • the sample information stored in the memory (the number of samples, the arrangement of the wafer mark of the sample shot, and the number of valid samples) is updated from the default sample information stored in the storage device 47. Therefore, the default sample information is also referred to here as it is.
  • step 408 based on the actually measured value of the position of the obtained wafer mark M,
  • the coefficients classified as a.-d. are used as parameters and the coefficients classified as e.
  • the values of the classified coefficients are calculated by the least-squares method using the above equation (8) as a conditional expression.At step 410, the residual E at that time is calculated, and at step 412, the AIC (M ) Is calculated.
  • the coefficient value stored in step 524 of the previous subroutine 309 that is, the coefficient value obtained in the EGA processing on the first wafer W of the lot is stored in the storage device 47.
  • the value of the coefficient of e As the prior knowledge can be used as it is as the coefficient of e.
  • the statistical model of the EGA is set using the coefficients classified into a. And c. As parameters, and the coefficients classified into b., D. And e.
  • the value (constant) is used as the model M 'of the model equation of equation (6)
  • the least squares method is performed under the condition of equation (10), and the coefficients classified into a. And c. Are calculated.
  • the value of the evaluation function (residual) E is calculated, and in step 416, the value of AIC (M,) in the model M is calculated.
  • the coefficient values that is, the coefficient values of b., D., And e. Determined in the EGA processing on the first wafer W of the lot are stored in the storage device 47.
  • step 502 of Fig. 5 the value of AIC (M) of model M obtained in step 412 this time and the value of AIC (M,) of model M obtained in step 416 this time are calculated. Then, it is determined whether AIC (M ') ⁇ AIC (M). Here, it is assumed that AIC (M ') ⁇ AIC (M), the judgment is denied, and the process proceeds to step 510.
  • step 510 it is determined whether or not the evaluation function (residual) E force in the model M is smaller than a predetermined value.
  • the evaluation function (residual) E force in the model M is smaller than a predetermined value.
  • model M is selected, and the value of the coefficient of the model M is stored in the memory for the current exposure processing of wafer W.
  • the current wafer W is the second wafer in the lot.
  • the disconnection is affirmed, and the process proceeds to Step 524 ⁇ Step 526.
  • step 524 the value of the coefficient b.e.e. of the model M is stored in the storage device 47.
  • step 526 calculation of the center position of all shot areas SA and storage in the storage device 47 are performed. Step 526 ends
  • the judgment is affirmed, and the process proceeds to step 404.
  • step 404 the sample information on the memory is referred to. Since this sample information (the number of samples and the arrangement of sample shots) has not been updated in the previous subroutine 309, the default sample information is referred to here as it is.
  • step 408 using a model in which the coefficient classified into e. Is a constant determined by prior knowledge, based on the obtained measured value of the position of the wafer mark, a.
  • the value of the coefficient (parameter) classified as. Is calculated, the residual E at that time is calculated in step 410, and the AIC (M) is calculated in step 412.
  • the average value of the previous and previous values is used as is for the coefficient classified as e. Can be used as a value.
  • step 414 the statistical model of the EGA is set using the coefficients classified into a. And c. As parameters, and the coefficients classified into b., D. And e. The value of the coefficient classified into a. And c. By the least squares method is calculated as the model M 'expressed by the model equation of Equation (6) when the value is used, and the value of the evaluation function (residual error) E
  • step 416 the value of AIC (M ') is calculated.
  • the coefficients of b., D., And e., which were updated in step 524 see FIG.
  • step 502 of FIG. 5 the model M obtained in step 412 this time is The value of AIC (M) is compared with the value of AIC (M,) of model M, obtained in step 416, to determine whether AIC (M ') ⁇ AIC (M) .
  • AIC (M ') AIC (M)
  • the values of the coefficients of the model M are stored in the memory for the current wafer exposure processing.
  • the judgment is affirmed, and the process proceeds to step 524.
  • step 524 the values of the coefficients b.-e. of the model M are stored in the storage device 47 as prior knowledge.
  • step 526 the center of all shot areas SA
  • the position is calculated and stored in the storage device 47, and then the processing of the subroutine 309 is terminated.
  • the wafer to be processed is m + 1 (
  • step 404-step 416 6) Until the second wafer, that is, until the determination in step 402 is denied, the processing of step 404-step 416 is performed, and step 502 of FIG. 5 is determined. Then, if the arrangement strength of the shot area of the wafer W to be processed shows the same tendency as the arrangement of the shot areas of the wafer W to be processed in the past, AIC (M,) becomes AIC (M), and the judgment is made. Affirmative, in step 504, held on the coefficient memory of the model M ', and step 506 (condition judgment is of course affirmative) is executed, and then in step 524, the values of the coefficients (parameters) of a., C. , B., D., E.
  • step 526 The values of the coefficients based on the prior knowledge are stored in the storage device 47 as prior knowledge, and the step 526 is further executed to complete the subroutine 309. If the arrangement is different from the arrangement of the shot areas of the wafer to be processed in the past, AIC (M,) ⁇ AIC (M), the judgment is denied, and the routine proceeds to step 510. If the residual E of the model M is smaller than the predetermined value in step 510, the model M is selected as the optimal model. In step 512, the value of the coefficient of the model M is held. However, if the residual E of the model M is larger than the predetermined value, step 516 (judgment is negative) ⁇ step 522 is processed, and the coefficients classified into a.—e. Value is para The coefficient is recalculated as a meter and held in the memory. At step 524, the coefficient value is stored in the storage device 47 as prior knowledge.
  • the values hardly fluctuate.
  • the value of the coefficient of the component within the shot classified as e. Is obtained at the time of processing the first wafer, and the first, second,.
  • a priori knowledge of the coefficient values classified as b.—d. comes to converge to the true model coefficient values, and a model M with a small degree of parameter freedom is selected.
  • model M is always selected in the subroutine 309 when processing that wafer.
  • model M is selected, and b. And d of model M
  • the coefficients of e and e are accumulated and stored in the storage device 47 as new prior knowledge. If the arrangement of the fourth and subsequent wafers is significantly different from the arrangement of the first to third wafers, the coefficients b.-e. are recalculated and stored as new prior knowledge. The data is cumulatively stored in the device 47.
  • step 402 the determination in step 402 is denied, and the flow advances to step 418.
  • step 418 the sample information of the wafer W is referred to. Since the sample information still stored in the memory remains at the default, the default sample information is obtained.
  • step 420 as in step 406, of the wafer mark M attached to the shot area SA specified as the sample shot in the sample information, the measurement target
  • the positions of h elephant wafer marks are sequentially measured.
  • the model M is defined as a model in which coefficients classified into a, b. Are used as parameters and coefficients classified into c, d., E. Based on the measured values of the acquired positions of the wafer marks, the values of the coefficients classified into a. And b. Are calculated by using the least squares method, and in step 424, the obtained coefficient values are calculated. Again the above formula Substituting in (6) to obtain the expected position of the wafer mark, and substituting the obtained expected position and the measured value of the position of the wafer mark into the evaluation function E of the above equation (7), the value (residual) Ask for. Further, in step 426, the above model (a statistical model M in which coefficients classified into a. And b. Are used as parameters and coefficients classified into c., D. And e. Are values based on prior knowledge) Calculate the AI C (M) of
  • step 430 the value of AIC (M,) of the statistical model M, is calculated.
  • step 502 of Fig. 5 the value of AIC (M) of model M obtained in step 426 is compared with the value of AIC (M,) of model M obtained in step 430. , AIC (M,) judge whether it is AIC (M) or not.
  • AIC ( ⁇ ') ⁇ AIC (M) is affirmed, and the process proceeds to step 504.
  • M ' is selected and kept on its coefficient memory.
  • step 506 since the wafer is the sixth wafer, the judgment is denied, and the process proceeds to step 508.
  • step 508 the sample information on the memory is updated.
  • the reliability of the prior knowledge of the coefficients classified as b.—e. Is increased, and it can be determined that the model M ′ has reached the state of being selected. ) Can be reduced from the default large number of samples to a number that can sufficiently secure a high-precision alignment when only the coefficients classified as a. For example, in this case, if the coefficients classified as a.
  • the degree of freedom of the parameter for each axis is 2, so the number of effective samples is 3 per axis (2 You can set 3 for a dimensional mark and 6 for a one-dimensional mark.
  • the arrangement of the seventh and subsequent wafers may be different from the arrangement of the past wafers.
  • the AIC (M ,) The AIC (M) of model M is also calculated. Therefore, in this case, the number of effective samples is set to 4 or more (for example, 16) for each axis by adding 1 to the number of parameters 3 for each axis of the model M in consideration of some margin.
  • the number and arrangement of the wafer marks to be measured at each effective sample number of 1 to 30 are estimated in advance by maximum likelihood and stored in the storage device 47, and the effective sample number is updated.
  • information (the number and arrangement of the wafer marks) at that degree of freedom is read out from the storage device 47 onto the memory, and the sample information on the memory is updated to the information.
  • step 502 in FIG. 5 is determined. If the arrangement strength of the shot area of the wafer to be processed shows the same tendency as the arrangement of the shot areas of the wafer W to be processed in the past, AIC (M ') becomes AIC (M), and the judgment is affirmative. Step 504 (selection of model M) ⁇ step 506 (conditional judgment is negative) ⁇ step 508 is executed, and the sample information is further limited as long as it does not become smaller than the degree of freedom of model M parameter + 1. Keep the number of valid samples small. Then, in step 524, the values of the coefficients b.-d. based on the prior knowledge are stored in the storage device 47 as the prior knowledge.
  • step 510 if the residual of model ⁇ is smaller than the predetermined value, model ⁇ is selected as the optimal model.
  • the sample information is updated so as to slightly increase the number of valid samples.
  • the power of the coefficients (parameters) classified as ab in the model ⁇ is stored in the storage device 47 together with the values of other coefficients (constants) as new prior knowledge (for the coefficients classified as e.) The value is based on prior knowledge).
  • Step 524 is processed and classified into a.—e.
  • the value of the coefficient to be calculated is newly obtained as a parameter, stored in the memory as the coefficient of the current wafer model, and the value of the coefficient classified as b.-e. is stored in the storage device 47 as new prior knowledge. It will be remembered.
  • Step 516-Step 522 When Step 516-Step 522 are processed, the degree of freedom of the model parameters when only the coefficients of the effective sample number a. And b. Since the number of samples is small enough to have some margin, the number of effective samples is set to a large number according to the degree of freedom of the model parameters when the coefficient of a. Need to be updated. Therefore, the determination in step 516 is affirmative, and in step 518, the number of effective samples (for example, the default number) according to the degree of freedom of the model parameters (6 or more for each axis) when the coefficient of a. 30) Update the sample information in the memory so that it becomes the same as the default 30).
  • the number of effective samples for example, the default number
  • step 520 additional sample shots are measured based on the updated sample information. Then, in step 522, the values of the coefficients (parameters) classified into a.—e. are obtained based on the actually measured values of the positions of the wafer marks measured this time, and in step 524, the values of a. e. Coefficients classified in are reflected in prior knowledge. Further, in step 526, the reference positions of all shot areas are calculated and stored in the storage device 47, and then the processing of the subroutine 309 is terminated.
  • step 323 of FIG. 3 the loop processing of step 307—step 323 including the subroutine 309 as described above is performed for each wafer in the lot. Are sequentially executed. During this time, in the subroutine 309, the degree of freedom of the parameters of the model and the number of effective samples are dynamically optimized each time according to the arrangement state of the wafer to be processed.
  • the processing flow of the subroutine 309 for processing the first, second, and third wafers described in the present embodiment is merely an example. That is, when the arrangement of the wafers well follows the prior knowledge, the judgments in Steps 502 and 510 are affirmative even when the first wafer is to be processed, and the models M and M ′ are selected. In some cases, even when the second wafer is to be processed, the determination in step 502 may be affirmed, or the determination in step 510 may be denied. Even when processing is performed, the determination in step 502 may be denied, or the determination in step 510 may be denied. In any case, in the present embodiment, prior knowledge is accumulated as wafers are sequentially processed, and optimization of the degrees of freedom of model parameters is realized.
  • the force with m 5.
  • This may be any value.
  • the optimization of the number of effective samples is not performed until the m-th sheet in the lot.
  • the determination in step 506 is omitted, and even within the m-th sheet in the lot, It may be possible to update the number of valid samples.
  • the subroutine 309 determines whether the residual of the model M as the first regression model is smaller than a predetermined value, and thereby determines whether the first regression model (model M) And the force that determines whether to select! / ⁇ deviation of the third regression model with all the coefficients of the above equation (6) as parameters.
  • the AIC of the third regression model Alternatively, the calculated value may be compared with the AIC of the model M, and the smaller value may be selected.
  • the average value of past values of the coefficient obtained as prior knowledge is set as the representative value of the coefficient, but the immediately preceding (or the latest several) wafers were processed.
  • the value of the coefficient at that time may be used as it is as the representative value.
  • the coefficient values may be weighted.
  • the weight for the value of the prior knowledge of the latest may be the heaviest, or the weight of the value of the prior knowledge for the wafer whose residual is small may be the heaviest.
  • the storage device 4 of the main control device 20 A storage device is constituted by 7 and the memory.
  • the main control device 20 corresponds to the position detecting device selecting device, the calculating device, the updating device, the optimizing device, and the determining device of the present invention. That is, the function of the selection device is performed by the processing of Step 402—Step 430 (FIG. 4) and Step 502, Step 504, Step 510, Step 512, and Step 522 (FIG. 5) performed by the CPU of the main control device 20.
  • the functions of the calculating device are realized by the processing of step 526 (FIG.
  • steps 506, 508, and step 516—step 520 and step 524 (FIG. 5).
  • the functions of the optimization device are realized by the processing of step 402—step 430 (FIG. 4), step 502—step 504, step 510, step 512, step 522, and step 524 (FIG. 5).
  • the processing in steps 508, 516, 518, and 520 (FIG. 5) implements the determining device.
  • the present invention is not limited to this.
  • the bias of model estimation is corrected so that the tendency of selecting a model having a large degree of parameter freedom is not increased, and a learning error is corrected.
  • Several regression models (models M, M, etc.) with different degrees of freedom of parameters using AIC which is a criterion for selecting a model that can reduce the generalization error as the most likely model regardless of Based on the AIC, the most likely regression model for the arrangement of the plurality of shot areas SA on the wafer W is selected.
  • the model closest to the true model is selected, so that the position information of the center position of the plurality of shot areas SA can be accurately calculated.
  • the base of a plurality of shot areas SA in the original process is provided.
  • AIC is used for comparing models having different degrees of freedom of parameters.
  • other criteria for example, Bayesian Information Criterion (BIC) may be used.
  • BIC Bayesian Information Criterion
  • BIC ⁇ -2-log L + d-log n---(12)
  • BIC is different from penalty term second-order force AIC.
  • AIC has 2d in the second term
  • BIC has d'logn.
  • n is the number of valid samples. Therefore, BIC is set to have a larger penalty than AIC, and is set so as to reduce the tendency to select a statistical model with a large number of nomora.
  • both AIC and BIC are derived assuming asymptotic to the generalization error of the model with respect to the population or the log likelihood when the number of samples in the regular model is sufficiently large. Since the linear regression model is a regular model, it is considered appropriate to use these evaluation criteria.
  • the application of the asymptotic theory is not necessarily appropriate because the number of samples for performing the regression analysis is small because of the throughput. Therefore, it is more preferable to define a log likelihood with a penalty obtained by generalizing the above AIC and BIC as in the following equation, and to select a model that optimizes this.
  • PL logZ- ⁇ del, n)-d ... h 3) where PL is the log likelihood with penalty.
  • the reason why the sign of the first term is opposite to that of AIC and BIC is that the equation that evaluates the one with larger PL force as better.
  • the value of ⁇ can be a function that depends on the type of parameter (ie, model) and the number of samples (ie, n) that can be added as necessary.
  • an expected value of an amount of change of a residual with respect to an increase in a parameter can be adopted.
  • the residual in the model when the coefficient classified into e. Is a value based on prior knowledge, and e.
  • the expected value of the difference from the residual when the coefficients to be classified are also used as parameters may be set, and the value may be set to j8. In this way, the residuals of the best fitting model are extremely smaller than those of the preceding and following models.
  • the linear regression model is regular, but this is the case where the order (priority) of the parameters to be added is determined in advance when evaluating a model having a greater degree of freedom. The number of samples is small! / ⁇ problem is a certain force
  • the order of additional parameters is determined in advance in the above embodiment.
  • the regression model becomes irregular, and the validity of AIC and BIC is lost.However, when logarithmic likelihood with penalty is used, the irregularity is matched.
  • the residual is expressed by the evaluation function E shown by the above equation (7), that is, the square error divided by the number of samples, but the present invention is not limited to this.
  • E the evaluation function
  • the residuals follow a normal distribution, an unbiased estimate of the variance of the residuals obtained by subtracting the degrees of freedom of the parameters from the number of samples, or ⁇ (square error It is not appropriate because it increases or decreases according to the number of samples), Whichever is appropriate.
  • model M based on a certain model (model M), the likelihood of the three models is compared with that of the model having a smaller degree of parameter freedom than that of the model, so that the optimal model is obtained.
  • model M based on a certain model (model M)
  • the likelihood of the three models is compared with that of the model having a smaller degree of parameter freedom than that of the model, so that the optimal model is obtained.
  • the present invention is not limited to this, and four or more models may be compared. For example, calculate the AIC value for each of four or more models and select the model with the smallest value!
  • the model with the smallest degree of parameter freedom is model M
  • the model with the second smallest model is model M.
  • the model may be optimized using other models as a third regression model. In this case, there will be multiple third regression models, so if the determination in step 510 is denied, the AIC value is calculated for each of the multiple third regression models. Just select the model with the smallest value! ,.
  • the force which is the optimization of the model formula in which the EGA parameters of six points are combined and the shot component is also taken into consideration is not limited to this model formula.
  • (DX, DY) in the above equation (4) is replaced with (DX ', DY,) in the following equation.
  • a model including the above-described higher-order component, a model that considers the in-shot component used in the above embodiment, or a higher-order component, and a And a model containing both of them can be used as the third regression model.
  • the regression model of the EGA may be a model based on the above equation (6).
  • the regression model may be based on the above equation (4).
  • a model based on the above equation (2) using the orthogonality error W and the residual rotation error ⁇ as coefficients may be used.
  • the residual rotation error ⁇ is desirably classified into a.
  • the orthogonality error W depends on which exposure apparatus used to expose the layer of the original process, and it is considered that there is little variation within the lot. It is considered appropriate to be classified as c or d.
  • the model using the orthogonality error W as a coefficient is selected, if the value based on prior knowledge and the parameter value obtained by the current wafer mark measurement are significantly different, the current processing Exposure tool power that exposed the original process layer of the target wafer is likely to be different from that of past wafers. In this case, it is conceivable that the higher-order components and the in-shot components are also greatly changed, and thus the coefficients relating to those components may be used as parameters unconditionally. As described above, depending on the coefficient, the change of the coefficient is closely related to the change of the other coefficients. Therefore, if the relation is used, the optimization of the model parameters can be performed more efficiently. It can be something.
  • the average value of the coefficients stored in the storage device 47 as the prior knowledge is set as the coefficient value.
  • the present invention is not limited to this, and the average value obtained in the past is obtained. From the amount of change in the value of the force parameter with the coefficient (preferably smoothed by a Lonos process, etc.), the value of the coefficient for the wafer to be processed this time is calculated. You may do what you expect.
  • the coefficients of the EGA model equation were obtained by using all the h wafer marks, but the position of the h wafer marks was significantly different from the shot array model. If the mark is considered to have been distorted, the measured value of the mark may be rejected from the sample result. However, even after rejection, the effective It goes without saying that the number of samples must be larger than the degree of freedom of the model parameters.
  • various methods can be applied. The method using the above AIC can also be applied.
  • a mixed distribution model consisting of a linear combination of the probability density distribution function indicating the distribution of normal values of each measured value and the probability density distribution function indicating the distribution of abnormal values is considered.
  • the above-described optimization may be executed in consideration of the degree of normality and the degree of abnormality of each measurement value.
  • the power of selecting the optimal model based on the log likelihood with a penalty of each model from the models having different degrees of freedom of the parameters is not limited to this.
  • a value obtained by weighting and averaging the value of each coefficient of the model by the ratio of logarithmic likelihood with penalty may be estimated as the value of the coefficient of the model formula.
  • the value of the parameter of a certain coefficient in the model M and the value based on the prior knowledge of the coefficient in the model M are weighted and averaged by the ratio of the reciprocal of AIC (M) and AIC ('). The value obtained in this way can be used as the value of the coefficient.
  • the value of this coefficient can be regarded as a value based on prior knowledge corrected based on the measured value of the wafer mark of the current sample shot.
  • the residual ⁇ in the model formula when the value of the coefficient obtained by the weighted average is used is further obtained, the AIC of the model is calculated, and the AIC (M,) of the model ⁇ , or the model
  • the best model among the three models may be selected by comparing with the AIC (M) in ⁇ .
  • AIC is better than BIC.
  • the coefficients of the model formula of the EGA system are classified into a.-e., but are not limited thereto.
  • it can be classified into various categories such as a coefficient to be estimated and changed for each process, a coefficient to be estimated and changed for each product type, or a coefficient to be estimated and changed periodically.
  • priorities may be set for parameters classified into the same category, and the degree of freedom of the parameters may be gradually increased or decreased in that order.
  • the coefficients of the model formula of the EGA method are not particularly classified, and all the coefficients may be given a priority and the degree of freedom of the parameter may be increased or decreased according to the order. In determining this priority, if the coefficient also includes higher-order components, the lower the priority, the lower the priority. ).
  • the present invention provides a force for measuring a wafer mark of a sample shot with an appropriate number of effective samples according to the degree of freedom of the parameter of the model to be evaluated. It is assumed that the number and arrangement of the wafer marks of the sample shots based on the number of effective samples according to the degree of freedom of each parameter are previously obtained for a plurality of models having different parameters, and are stored in the storage device 47. When a plausible model is selected, information on the number and arrangement of wafer marks of sample shots that satisfies the appropriate number of effective samples according to the degree of freedom of the parameters of the model is read from the storage device 47, and is read. By writing the contents to the memory, the sample information on the memory was updated.
  • Various methods can be adopted as a method for creating information on the number and arrangement of wafer marks based on a predetermined number of valid samples. For example, as in the above embodiment, in a wafer as shown in FIG. 2, there are 4N wafer marks. There are C combinations when selecting h wafer marks from these 4N wafer marks. There are C combinations when selecting h wafer marks from these 4N wafer marks. There are C combinations when selecting h wafer marks from these 4N wafer marks.
  • the expected value and the sample variance of the overlay error of all shot areas are estimated for each of the combinations, and the combination whose estimated value is good (minimum) is determined by the number and arrangement of the sample shots with the effective number of samples. You may make it.
  • the weight of all shot areas The expected value of the joining error and the sample variance are determined by the maximum likelihood estimate of each coefficient in the selected model.
  • the maximum likelihood estimate of each coefficient in the force model is determined by the design position of the wafer mark and Using the empirically obtained standard deviation of the error distribution of the difference between the design position at the wafer mark and the actual measurement position, based on the condition formula that minimizes the evaluation function by the least squares method, V can be obtained from any normal equation.
  • the number and arrangement of the sample shots are determined by the above method before performing the exposure operation.
  • the above maximum likelihood estimation method is performed.
  • the number and arrangement of the sample shots may be optimized in real time.
  • the FIA-type alignment sensor is used as the alignment detection system AS.
  • the laser beam is applied to the dot-shaped alignment marks on the wafer W.
  • the LSA (Laser Step Alignment) type alignment sensor that detects the mark position using the light diffracted or scattered by the mark, and the alignment sensor that appropriately combines the alignment sensor with the FIA method described above. It is possible to apply the present invention.
  • an alignment sensor that irradiates a coherent detection light onto a mark on a surface to be detected and interferes with two diffracted lights (for example, the same order) generated from the mark can be used alone or in the FIA method described above.
  • the present invention can be applied to an alignment sensor appropriately combined with the LSA method or the like.
  • the alignment detection system may be an on-axis system (for example, a TTL (Through The Lens) system).
  • the alignment detection system is not limited to one that detects the alignment mark in a state where the alignment mark is almost stationary within the detection field of view of the alignment detection system. May be moved relative to each other (for example, the above-mentioned LSA system, homodyne LIA system, etc.). In the case of such a method in which the detection light and the alignment mark are relatively moved, it is desirable that the relative movement direction is the same as the movement direction of the wafer stage WST when detecting each of the above-mentioned alignment marks.
  • the present invention can be suitably applied to a step-and-repeat method, a step-and-statistic method, a mirror projection aligner, a photo repeater, and the like.
  • the projection optical system PL may be any one of a refraction system, a catadioptric system, and a reflection system, and may be any of a reduction system, an equal magnification system, and an enlargement system.
  • the present invention may be applied to an immersion type exposure apparatus or the like disclosed in International Publication WO99Z49504 or the like, in which a liquid is filled between a projection optical system PL and a wafer.
  • the light source of the exposure apparatus to which the present invention is applied may be a KrF excimer laser, an ArF excimer laser, a pulse laser light source using an F laser, or another vacuum ultraviolet pulse laser light source.
  • illumination light for exposure for example, a single-wavelength laser beam in the infrared or visible range oscillated from a DFB semiconductor laser or a fiber laser is doped with, for example, erbium (or both erbium and ytterbium).
  • erbium or both erbium and ytterbium
  • a harmonic that is amplified by a fiber amplifier and wavelength-converted to ultraviolet light using a nonlinear optical crystal may be used.
  • the illumination optical system, projection optical system, and alignment detection system AS composed of a plurality of lenses are incorporated into the exposure apparatus main body to perform optical adjustment, and to perform a reticle stage or wafer consisting of many mechanical parts.
  • the exposure apparatus of the above embodiment can be manufactured by attaching the stage to the exposure apparatus main body, connecting wiring and piping, and performing overall adjustment (electrical adjustment, operation confirmation, and the like). It is desirable to manufacture the exposure apparatus in a clean room in which the temperature, cleanliness, etc. are controlled.
  • the present invention is not limited to an exposure apparatus for manufacturing a semiconductor, but also includes an exposure apparatus for transferring a device pattern onto a glass plate and a method for manufacturing a thin film magnetic head, which are used for manufacturing a display including a liquid crystal display element and the like. It can also be applied to an exposure device used to manufacture device patterns used for manufacturing, such as an exposure device that transfers a device pattern onto a ceramic wafer, an imaging device (such as a CCD), an organic EL, a micromachine, and a DNA chip. In addition, glass substrates or silicon wafers are used to manufacture reticles or masks used in optical exposure equipment, EUV exposure equipment, X-ray exposure equipment, electron beam exposure equipment, etc.
  • a transmissive reticle is generally used in an exposure apparatus that uses DUV (far ultraviolet) light, VUV (vacuum ultraviolet) light, or the like, and a quartz glass or a reticle is used as a reticle substrate. Quartz glass, fluorite, magnesium fluoride, quartz, or the like doped with nitrogen is used.
  • a transparent mask stencil mask, membrane mask
  • a silicon wafer or the like is used as a mask substrate.
  • the position detection method according to the present invention is not limited to an exposure apparatus, but may be an apparatus that needs to select and detect some marks from a plurality of marks formed on an object. If there is, it can be applied.
  • FIG. 6 shows a flowchart of an example of manufacturing devices (semiconductor chips such as ICs and LSIs, liquid crystal panels, CCDs, thin-film magnetic heads, micromachines, etc.).
  • device function / performance design for example, circuit design of a semiconductor device
  • pattern design for realizing the function is performed.
  • step 602 mask manufacturing step
  • step 603 wafer manufacturing step
  • a wafer is manufactured using a material such as silicon.
  • step 604 wafer processing step
  • step 605 device assembly step
  • step 605 includes steps such as a dicing step, a bonding step, and a packaging step (chip sealing) as necessary.
  • step 606 inspection step
  • inspections such as an operation confirmation test and a durability test of the device created in step 605 are performed. After these steps, the device is completed and shipped.
  • FIG. 7 shows a detailed flow example of step 604 in the semiconductor device.
  • step 611 oxidation step
  • step 612 CVD step
  • step 613 electrode forming step
  • step 614 ion implantation step
  • ions are implanted into the wafer.
  • step 615 resist forming step
  • step 616 exposure step
  • step 617 development step
  • step 618 etching step
  • step 619 resist removing step
  • the exposure step uses the exposure apparatus 100 to which the position detection method of the above embodiment can be applied. Can be realized. As a result, it becomes possible to produce higher-density devices.
  • the position detection method and apparatus of the present invention are suitable for detecting position information for aligning an object. Further, the exposure apparatus and method of the present invention are suitable for a lithographic process for manufacturing a semiconductor device, a liquid crystal display device and the like. Further, the device manufacturing method of the present invention is suitable for microdevice production.

Landscapes

  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Exposure And Positioning Against Photoresist Photosensitive Materials (AREA)
  • Exposure Of Semiconductors, Excluding Electron Or Ion Beam Exposure (AREA)
  • Length Measuring Devices By Optical Means (AREA)

Description

明 細 書
位置検出方法、露光方法、位置検出装置、露光装置及びデバイス製造 方法
技術分野
[0001] 本発明は、位置検出方法、露光方法、位置検出装置、露光装置及びデバイス製造 方法に係り、更に詳しくは、物体上に配置された複数の区画領域の位置情報を検出 する位置検出方法、該位置検出方法を用いる露光方法、物体上に配置された複数 の区画領域の位置情報を検出する位置検出装置、該位置検出装置を用いる露光装 置、これら露光方法及び露光装置を用いるデバイス製造方法に関する。
背景技術
[0002] 近年、半導体素子等のデバイスの製造工程では、ステップ'アンド'リピート方式、又 はステップ'アンド'スキャン方式等の露光装置、ウェハプローバ、或いはレーザリぺ ァ装置等が用いられている。これらの装置では、基板上に配置された複数のショット 領域の各々を、基板の移動位置を規定する静止座標系(すなわちレーザ干渉計によ つて規定される直交座標系)内の所定の基準点 (例えば、各種装置の加工処理点) に対して極めて精密に位置合わせ (ァライメント)する必要がある。
[0003] 特に、露光装置では、マスク又はレチクル (以下「レチクル」と総称する)に形成され たパターンの投影位置に対して基板 (半導体ウェハやガラスプレート)を位置合わせ (ァライメント)するに際して、製造段階のチップでの不良品の発生による歩留りの低 下を防止するため、その位置合わせ精度を常に高精度かつ安定に維持しておくこと が望まれている。
[0004] 通常、露光工程では、ウェハ上に 10層以上の回路パターン(レチクルパターン)を 重ね合わせて転写するが、各層間での重ね合わせ精度が良好でない場合には、回 路上の特性に不都合が生じることがある。このような場合、チップが所期の特性を満 足せず、最悪の場合にはそのチップが不良品となり、歩留まりを低下させてしまう。そ こで、露光工程では、ウェハ上の複数のショット領域の各々に予めァライメントマーク を付設しておき、ステージ座標系におけるそのマークの位置 (座標値)を検出する。し かる後、このマーク位置情報と既知のレチクルパターンの位置情報 (これは事前測定 されている)とに基づいてウェハ上の 1つのショット領域をレチクルパターンに対して 位置合わせするウェハァライメントが行われる。
[0005] ウェハァライメントには大別して 2つの方式があり、 1つはウェハ上のショット領域毎 にそのァライメントマークを検出して位置合わせを行うダイ ·バイ ·ダイ (D/D)ァラィメ ント方式である。もう 1つは、ウェハ上のいくつかのショット領域のァライメントマークを 検出してショット領域の配列の規則性を求めることにより、各ショット領域を位置合わ せするグローバル'ァライメント方式である。現在のところ、デバイス製造ラインではス ループットとの兼ね合いから、主にグローバル 'ァライメント方式が採用されている。特 に現在では、グローバル 'ァライメント方式の中でも、ウェハ上のショット領域の配列の 規則性を統計的手法によって精密に特定するェンハンスト ·グローバル ·ァライメント( EGA)方式が主流となっている(例えば、特開昭 61— 44429号公報及びこれに対応 する米国特許第 4, 780, 617号、特開昭 62 - 84516号公報及びこれに対応する米 国特許第 4, 780, 617号など参照)。
[0006] EGA方式においては、まず、ウェハ上の複数のショット領域(以下、「サンプルショ ット」ともいう)のステージ座標系上の位置座標を実測する。そして、その実測値と、ゥ ェハ上のショット領域の配列によって規定される配列座標系上の複数個(3個以上必 要であり、通常 7— 15個程度)のサンプルショットの設計上の位置座標をステージ座 標系上の位置座標に変換したときに得られる位置座標とのフィッティング誤差ができ るだけ小さくなるように、回帰分析的な統計演算処理 (例えば最小二乗法)を用いて、 その変換の際に用いられるスケーリング、回転、オフセット等の誤差パラメータの値を 求める。さらに、求められた誤差パラメータの値によって規定される回帰モデルに基 づ 、て、ステージ座標系における各ショット領域の位置座標を算出する。
[0007] 最近のデバイスパターンの微細化に伴うショット領域の重ね合わせ精度の高度化の 要求に応えるベぐ力かる EGA方式についても様々な改良方法が提案されている。 例えば、上記誤差パラメータにより規定される統計モデルとして、配列座標系に対す るショット領域内のスケーリングや回転などのショット内成分もパラメータとして考慮し た回帰モデルを用いた方法 (特開平 6— 349705号公報これに対応する米国特許第 6, 278, 957号参照)や、ウェハ上のショット領域の配列の高次成分もパラメータとし て考慮した回帰モデルを用いた方法 (特許第 3230271号公報これに対応する米国 特許第 5, 561, 606号参照)も用いられるようになつている。すなわち、ショット領域 の重ね合わせ精度を高めるため、 EGA方式における回帰モデルは、そのパラメータ の自由度が増大し、より複雑なものとなっている。
[0008] し力しながら、 EGA方式のような回帰分析においては、パラメータの自由度を増や すことにより、計測データの回帰モデル力 の残差 (学習誤差)はいくらでも小さくす ることができる。しかし、通常、計測データには、計測誤差等によるノイズ成分が含ま れており、上記回帰分析では、パラメータの自由度を増やしすぎると、そのノイズ成分 に対してもフィッティングしようとしてオーバーフィッティング (過学習)となってしまい、 真のモデルとは異なるモデルを最も尤もらしいモデルとして選択してしまう場合もある 。 EGA方式は、本来限られたサンプル力 すべてのショット領域の位置を予測する 方法であり、不必要にパラメータの自由度が大きい回帰モデルを選択した場合には、 サンプルショット以外のショット領域の予想位置と、実際の位置とのずれがかえって大 きくなつてしまう虞がある。
[0009] したがって、 EGA方式において、最小化すべきは、上記学習誤差ではなぐすべて のショット領域を考慮したときのモデル誤差 (汎化誤差)であり、この汎化誤差を小さく するためには、モデルのパラメータの自由度とサンプル数とを、適切に設定する必要 がある。
[0010] さらに、 EGA方式においては、その回帰モデルのパラメータの自由度が増大すれ ばするほど、その回帰モデルを精度良くフィッティングさせるためのサンプルショットの 数を増やさなければならず、結果的にサンプルショットの計測時間が長くなり、その分 スループットが低下してしまうという不都合があった。
発明の開示
発明が解決しょうとする課題
[0011] 本発明は、上記事情の下になされたもので、その第 1の目的は、物体上の複数の 区画領域の位置情報を精度良ぐ又は、短時間にかつ精度良く検出することができ る位置検出方法を提供することにある。 [0012] また、本発明の第 2の目的は、物体上の複数の区画領域に、精度良ぐ又は、短時 間にかつ精度良くパターンを形成することができる露光方法を提供することにある。
[0013] また、本発明の第 3の目的は、物体上の複数の区画領域の位置情報を精度良ぐ 又は短時間にかつ精度良く検出することができる位置検出装置を提供することにある
[0014] また、本発明の第 4の目的は、物体上の複数の区画領域に、精度良ぐ又は短時 間にかつ精度良くパターンを形成することができる露光装置を提供することにある。
[0015] また、本発明の第 5の目的は、デバイスの生産性を向上させることができるデバイス 製造方法を提供することにある。
課題を解決するための手段
[0016] 本発明は、第 1の観点力 すると、物体上に配置された複数の区画領域の位置情 報を検出する位置検出方法であって、所定の座標系における前記複数の区画領域 のうちの少なくとも一部の区画領域の位置情報の実測値に基づいて、前記複数の区 画領域の配置に関するモデルを決定する第 1工程と;前記決定されたモデルに基づ V、て、前記複数の区画領域の位置情報を算出する第 2工程と;を含む第 1の位置検 出方法である。
[0017] これによれば、第 1工程において、少なくとも一部の区画領域の位置情報の実測値 に基づいて、複数の区画領域の配置に関するモデルが決定され、第 2工程において 、決定されたモデルに基づいて、複数の区画領域の位置情報を算出する。すなわち 、実際の区画領域の位置情報に基づいて、真のモデルに近いモデルを決定すること ができるので、そのモデルに基づいて、複数の区画領域の位置情報を精度良く算出 することができる。
[0018] この場合、前記第 1工程は、前記少なくとも一部の区画領域の位置情報の実測値 に基づいて、前記位置情報を計測する区画領域を決定する工程を含むこととするこ とがでさる。
[0019] この場合、前記第 1工程では、前記少なくとも一部の区画領域の位置情報の実測 値に基づいて、前記モデルのパラメータの自由度を決定し、前記決定されたモデル のパラメータの自由度に基づいて、追加計測する区画領域を決定することとすること ができる。
[0020] 本発明は、第 2の観点力 すると、物体上に配置された複数の区画領域の位置情 報を検出する位置検出方法であって、所定の座標系における前記複数の区画領域 のうちの幾つかの区画領域の位置情報の実測値を用いて、パラメータの自由度がそ れぞれ異なる幾つかの、前記複数の区画領域に関する回帰モデルについてそれぞ れ、そのモデルの所定の評価規範の値を算出し、その算出結果に基づいて、前記複 数の区画領域に関する回帰モデルとして前記評価規範において最適と判断された モデルを選択する第 1工程と;前記選択された回帰モデルに基づいて、前記複数の 区画領域の位置情報を算出する第 2工程と;を含む第 2の位置検出方法である。
[0021] これによれば、第 1工程において、パラメータの自由度がそれぞれ異なる幾つかの 回帰モデルに関する所定の評価規範に基づいて、物体上の複数の区画領域に関す る汎化誤差が小さい回帰モデルが最も尤もらし 、モデルとして選択される。これにより 、真のモデルに最も近いモデルが選択されるようになるため、第 2工程において、複 数の区画領域の位置情報を精度良く算出することができる。
[0022] この場合、前記評価規範において最適なモデルとして選択された回帰モデルのパ ラメータの値を、前記回帰モデルを規定する係数に関する事前知識に反映する第 3 工程をさらに含み、前記複数の区画領域が形成された複数の前記物体について、位 置情報の検出対象となる物体を順次変更しながら、前記第 1工程と、前記第 2工程と 、前記第 3工程とを繰り返すこととすることができる。
[0023] なお、本明細書において、「回帰モデルを規定する係数に関する事前知識」とは、 過去に得られた回帰モデルの係数の値等を含み、その係数に関して事前に得られる 情報のことである。なお、過去に得られた回帰モデルの係数の値は、物体上の各区 画領域の実測位置情報による回帰分析や、シミュレーションに基づく回帰分析その 他あらゆる手段によって得られたものを含む。
[0024] この場合、前記第 3工程では、前記評価規範における最適なモデルとして選択され た回帰モデルの確からしさを評価するのに十分な数となるように、前記各区画領域の 位置情報の実測値のサンプル数を更新することとすることができる。
[0025] 本発明の第 2の位置検出方法では、パラメータの自由度が所定の大きさである第 1 の回帰モデルと、該第 1の回帰モデルよりもパラメータの自由度が小さい第 2の回帰 モデルと、前記第 1の回帰モデルよりもパラメータの自由度が大きい第 3の回帰モデ ルとの中から、前記評価規範における最適なモデルを選択することとしても良いし、 前記第 1工程では、パラメータの自由度が所定の大きさである第 1の回帰モデルの前 記評価規範の値よりも、該第 1の回帰モデルよりもパラメータの自由度が小さい第 2の 回帰モデルの前記評価規範の値の方が良好である場合には、前記第 2の回帰モデ ルを前記評価規範における最適なモデルとして選択し、前記第 1の回帰モデルが前 記第 2の回帰モデルよりも前記評価規範の値が良好で、かつ、前記第 1の回帰モデ ルにおける尤度が所定の値より良好な場合には、前記第 1の回帰モデルを前記評価 規範における最適なモデルとして選択し、前記第 1の回帰モデルが前記第 2の回帰 モデルよりも前記評価規範の値が良好で、かつ、前記第 1の回帰モデルにおける尤 度が所定の値より良好でない場合には、前記第 1の回帰モデルよりもパラメータの自 由度が大き 、第 3の回帰モデルを、前記評価規範における最適なモデルとして選択 することとしても良い。
[0026] この場合、前記第 1工程では、前記第 3の回帰モデルが前記評価規範における最 適なモデルとして選択された場合には、前記区画領域の位置情報の実測値のサン プル数が、前記第 3の回帰モデルの確からしさを評価するのに十分となるように、さら に計測対象とする区画領域を追加し、前記追加された区画領域の位置情報の実測 値の計測を行った後で、前記第 3の回帰モデルのパラメータの値を算出することとす ることがでさる。
[0027] この場合、前記第 3の回帰モデルが選択され、かつ、前記第 3の回帰モデルが複数 有る場合には、前記評価規範の値が最も良好な第 3の回帰モデルを、前記評価規範 における最適なモデルとして選択することとすることができる。
[0028] 本発明の第 2の位置検出方法では、物体間の値の変動が大きいと予想される回帰 モデルの係数を、前記第 1、第 2、第 3の回帰モデルではパラメータとし、物体間の値 の変動が比較的小さいと予想される回帰モデルの係数を、前記第 1、第 3の回帰モ デルではパラメータとする一方、前記第 2の回帰モデルでは前記事前知識に基づ ヽ て定められる定数とし、全ての物体で、値がほぼ同一であると予想される回帰モデル の係数を、前記第 1、第 2の回帰モデルでは、前記事前知識に基づいて定められる 定数とする一方、前記第 3の回帰モデルではパラメータとすることとすることができる。
[0029] この場合、位置情報の検出対象となる複数の物体のその処理単位における処理数 が所定数に満たない場合には、前記処理単位間の値の変動が大きいと予想される 係数を、前記第 1、第 3の回帰モデルではパラメータとする一方、前記第 2の回帰モ デルでは前記事前知識に基づ ヽて定められる定数とし、前記処理数が所定数を超 えた場合には、その係数を、前記第 1、第 2の回帰モデルでは前記事前知識に基づ いて定められる定数とする一方、前記第 3の回帰モデルではパラメータとすることとす ることがでさる。
[0030] 本発明は、第 3の観点力 すると、複数の物体上に配置された複数の区画領域の 位置情報を、物体毎に順次検出する位置検出方法であって、前記複数の区画領域 に関するモデルの係数を物体毎に推定する際には、すでに前記モデルの係数の推 定が完了した物体でのその推定結果に基づ 、て、推定対象の物体のモデルの係数 を推定する工程を含む第 3の位置検出方法である。
[0031] これによれば、過去に推定が完了した物体のモデルの係数の推定結果に基づいて 、物体上に配置された複数の区画領域に関するモデルの係数を推定するので、短 時間にかつ精度良く区画領域の位置情報を検出することができる。
[0032] 本発明は、第 4の観点力 すると、複数の物体上に配置された複数の区画領域の 位置情報を、物体毎に順次検出する位置検出方法であって、前記物体の位置情報 を順次検出する度に得られる前記複数の区画領域に関する回帰モデルの係数に関 する事前知識と、所定の座標系における、今回の位置情報の検出対象となる物体の 複数の区画領域のうちの幾つかの区画領域の位置情報の実測値とに基づいて、前 記回帰モデルの所定の評価規範に基づいて、前記回帰モデルのパラメータの自由 度を最適化する第 1工程と;前記最適化されたパラメータの自由度を有する回帰モデ ルに基づいて、今回の位置情報の検出対象となる物体の複数の区画領域の位置情 報を算出する第 2工程と;前記最適化されたパラメータの自由度に基づいて、次回の 位置情報の検出対象となる物体における各区画領域の位置情報の実測値のサンプ ル数を決定する第 3工程と;を含み、前記複数の区画領域が形成された複数の前記 物体について、位置情報の検出対象となる前記物体を順次変更しながら、前記第 1 工程と、前記第 2工程と、前記第 3工程とを繰り返す第 4の位置検出方法である。
[0033] これによれば、複数の物体について、検出対象となる物体を順次変更しながら、第 1工程と第 2工程と第 3工程が繰り返し実行される。そして、第 1工程において、物体 の位置情報を順次検出する度に得られる複数の区画領域に関する回帰モデルの係 数に関する事前知識と、所定の座標系における、今回の位置情報の検出対象となる 物体の複数の区画領域のうちの幾つかの区画領域の位置情報の実測値とに基づい て、回帰モデルの所定の評価規範により、回帰モデルのパラメータの自由度を最適 化する。そして、第 3工程において、最適化されたパラメータの自由度に基づいて、 次回の位置情報の検出対象となる物体における各区画領域の位置情報の実測値の 有効サンプル数を決定する。このようにすれば、最適化されるパラメータの自由度に 応じて各区画領域の位置情報の実測値の有効サンプル数を動的に変更することが できるため、高精度な露光を維持しつつ、スループットを向上させることができる。
[0034] 本発明の第 2、第 4の位置検出方法では、前記各回帰モデルの尤度は、その回帰 モデルにより得られる前記所定の座標系における前記各区画領域の位置情報と、前 記位置情報の実測置との残差によって推定されることとすることができる。
[0035] この場合、前記各回帰モデルのパラメータとして、前記所定の座標系と、前記複数 の区画領域の配置によって規定される配列座標系とのずれを示す 1次成分の係数と 、各区画領域の成分の設計値からのずれを示す係数と、前記複数の区画領域の配 置に関する高次成分を示す係数との少なくとも一部が含まれることとすることができる
[0036] 本発明の第 2、第 4の位置検出方法では、前記評価規範を、モデルのパラメータの 自由度に応じたペナルティが付与された尤度である規準とすることとすることができる
[0037] なお、本明細書においては、「ペナルティ」とは、その回帰モデルの尤度を減少させ る方向に作用する成分という意味で用いられる。したがって、その「ペナルティ」をパラ メータの自由度に応じて増減させるようにすれば、パラメータの自由度が大きいモデ ルを選択する傾向が強くなるような、モデル推定の偏りを補正することができ、結果的 に、学習誤差に左右されず、汎化誤差を小さくできるモデルを最も尤もらしいモデル として選択することができるよう〖こなる。
[0038] この場合、前記規準を、赤池情報量規準及びベイジアン情報量規準の!/、ずれか一 方とし、その値が小さいモデルを良好なモデルとすることしてもよいし、前記各回帰モ デルの前記規準でのペナルティを、その回帰モデルのパラメータの自由度の増加に 対する尤度の変化の期待値と、その回帰モデルのパラメータの自由度との積とし、前 記規準の値が大き 、モデルを良好なモデルとすることとしても良 、。
[0039] 本発明は、第 5の観点力 すると、物体に配置された複数の区画領域を順次露光し て各区画領域に所定パターンを形成する露光方法であって、本発明の第 1一第 4の 位置検出方法により前記複数の区画領域の位置情報を検出する工程と;前記検出さ れた位置情報に基づ 、て、前記物体を移動して前記各区画領域を露光する工程と; を含む露光方法である。力かる場合には、本発明の第 1一第 4の位置検出方法により 複数の区画領域の位置情報が高精度に検出されるため、高精度な重ね合わせ露光 、又は短時間かつ高精度な重ね合わせ露光を実現することができる。
[0040] 本発明は、第 6の観点力 すると、リソグラフイエ程を含むデバイス製造方法におい て、前記リソグラフイエ程では、本発明の露光方法を用いることを特徴とするデバイス 製造方法である。力かる場合には、本発明の露光方法を用いて露光を行うため、高 精度な重ね合わせ露光、又は、短時間かつ高精度な重ね合わせ露光を実現するこ とができるので、高集積度のデバイスの生産性を向上させることができる。
[0041] 本発明は、第 7の観点力 すると、物体上に配置された複数の区画領域の位置情 報を検出する位置検出装置であって、所定の座標系における前記複数の区画領域 のうちの幾つかの区画領域の位置情報を計測する計測装置と;前記計測された各区 画領域の位置情報の実測値を用いて、パラメータの自由度がそれぞれ異なる幾つか の、前記複数の区画領域に関する回帰モデルについてそれぞれ、そのモデルの所 定の評価規範の値を算出し、その算出結果に基づいて、前記複数の区画領域の回 帰モデルとして前記評価規範における最適なモデルを選択する選択装置と;前記選 択された回帰モデルに基づいて、前記複数の区画領域の位置情報を算出する算出 装置と;を備える第 1の位置検出装置である。 [0042] これによれば、選択装置により、ノラメータの自由度がそれぞれ異なる幾つかの、 前記複数の区画領域に関する回帰モデルのペナルティ付き対数尤度に基づいて、 最も尤もらしい回帰モデルが選択される。これにより、最も真のモデルに近いモデル が選択されるようになるため、算出装置により、複数の区画領域の位置情報を精度良 く算出することができる。
[0043] この場合、前記複数の区画領域の回帰モデルを規定する係数に関する事前知識 を記憶する記憶装置と;前記選択装置によって、前記評価規範にぉ 、て最適なモデ ルとして選択された回帰モデルのパラメータを、前記記憶装置によって記憶されて!ヽ る事前知識に反映する更新装置と;をさらに備え、前記選択装置は、前記記憶装置 に記憶された事前知識に基づ 、て、前記回帰モデルを設定することとすることができ る。
[0044] この場合、前記記憶装置は、前記計測装置が計測する前記各区画領域の位置情 報の実測値のサンプル数を記憶しており、前記更新装置は、前記評価規範において 最適なモデルとして選択された回帰モデルの確力 しさを評価するのに十分な数と なるように、前記記憶装置に記憶されて!、る前記各区画領域の位置情報の実測値の サンプル数を更新することとすることができる。
[0045] 本発明は、第 8の観点力 すると、複数の物体上に配置された複数の区画領域の 位置情報を、物体毎に順次検出する位置検出装置であって、前記物体の位置情報 を順次検出する度に得られる前記複数の区画領域に関する回帰モデルの係数に関 する事前知識と、所定の座標系における、今回の位置情報の検出対象である物体の 複数の区画領域のうちの幾つかの区画領域の位置情報の実測値とに基づいて、前 記回帰モデルの所定の評価規範により、前記回帰モデルのパラメータの自由度を最 適化する最適化装置と;前記最適化されたパラメータの自由度を有する回帰モデル に基づいて、今回の位置情報の検出対象である物体の複数の区画領域の位置情報 を算出する算出装置と;前記最適化されたパラメータの自由度に基づいて、次回の 位置情報の検出対象となる物体における各区画領域の位置情報の実測値のサンプ ル数を決定する決定装置と;を備える第 2の位置検出装置である。
[0046] これによれば、最適化装置は、物体の位置情報を順次検出する度に得られる複数 の区画領域に関する回帰モデルの係数に関する事前知識と、所定の座標系におけ る、今回の位置情報の検出対象となる物体の複数の区画領域のうちの幾つかの区画 領域の位置情報の実測値とに基づいて、回帰モデルのパラメータの自由度に応じた ペナルティが付与された尤度により、回帰モデルのパラメータの自由度を最適化する 。そして、決定装置は、最適化されたパラメータの自由度に基づいて、次回の位置情 報の検出対象となる物体における各区画領域の位置情報の実測値の有効サンプル 数を決定する。この装置を用いて、複数の物体を順次処理対象としていけば、物体 毎に最適化されるパラメータの自由度に応じて各区画領域の位置情報の実測値の 有効サンプル数を増減させることができるため、高精度な露光を維持しつつ、スルー プットを向上させることができる。
[0047] 本発明は、第 9の観点力 すると、少なくとも 1つの物体に配置された複数の区画領 域を順次露光して各区画領域に所定パターンを形成する露光装置であって、本発 明の第 1、第 2の位置検出装置と;前記検出された位置情報に基づいて、前記物体 を移動して前記各区画領域を露光する転写装置と;を備える露光装置である。かかる 場合には、本発明の第 1、第 2の位置検出装置により複数の区画領域の位置情報が 高精度に検出されるため、高精度な露光、又は、短時間かつ高精度な重ね合わせ 露光を実現することができる。
[0048] 本発明は、第 10の観点力もすると、リソグラフイエ程を含むデバイス製造方法にお いて、前記リソグラフイエ程では、本発明の露光装置を用いることを特徴とするデバイ ス製造方法である。力かる場合には、本発明の露光装置を用いて露光を行うため、 高精度な露光、又は、短時間かつ高精度な重ね合わせ露光を実現することができる ため、高集積度のデバイスの生産性を向上させることができる。
図面の簡単な説明
[0049] [図 1]本発明の第 1の実施形態に係る露光装置の構成を概略的に示す図である。
[図 2]ウェハ上のショット領域及びこれに付設されたウェハマークの配置の一例を示 す図である。
[図 3]本発明の一実施形態に係る露光装置における、露光処理の際の主制御装置 の CPUの処理アルゴリズムを示すフローチャートである。 [図 4]ウェハァライメント処理を示すフローチャート(その 1)である。
[図 5]ウェハァライメント処理を示すフローチャート(その 2)である。
[図 6]本発明に係るデバイス製造方法の実施形態を説明するためのフローチャートで める。
[図 7]図 6のステップ 604の詳細を示すフローチャートである。
発明を実施するための最良の形態
[0050] 以下、本発明の一実施形態を図 1一図 5に基づいて説明する。
[0051] 図 1には、本発明の一実施形態に係る露光装置 100の概略構成が示されている。
この露光装置 100は、ステップ'アンド'スキャン方式の投影露光装置である。この露 光装置 100は、照明系 10、マスクとしてのレチクル Rを保持するレチクルステージ RS T、投影光学系 PL、物体としてのウェハ Wが搭載されるウェハステージ WST、ァライ メント検出系 AS、及び装置全体を統括制御する主制御装置 20等を備えて 、る。
[0052] 前記照明系 10は、例えば特開 2001-313250号公報及びこれに対応する米国特 許出願公開第 2003Z0025890号等に開示されるように、光源、オプティカル 'イン テグレータを含む照度均一化光学系、リレーレンズ、可変 NDフィルタ、可変視野絞り (レチクルブラインド又はマスキング 'ブレードとも呼ばれる)、及びダイクロイツクミラー 等 (いずれも不図示)を含んで構成されている。オプティカル 'インテグレータとしては 、フライアイレンズ、ロッドインテグレータ(内面反射型インテグレータ)、あるいは回折 光学素子などが用いられる。本国際出願で指定した指定国又は選択した選択国の 国内法令が許す限りにおいて、上記公報及びこれに対応する米国特許における開 示を援用して本明細書の記載の一部とする。
[0053] この照明系 10では、回路パターン等が描かれたレチクル R上における、レチタルブ ラインドで規定されたスリット状の照明領域 (X軸方向に細長い長方形状の照明領域 )部分を照明光 ILによりほぼ均一な照度で照明する。ここで、照明光 ILとしては、 Kr Fエキシマレーザ光(波長 248nm)などの遠紫外光、 ArFエキシマレーザ光(波長 19 3nm)、あるいは Fレーザ光 (波長 157nm)などの真空紫外光などが用いられる。照
2
明光 ILとして、超高圧水銀ランプからの紫外域の輝線 (g線、 i線等)を用いることも可 能である。 [0054] 前記レチクルステージ RST上にはレチクル R力 例えば真空吸着により固定されて いる。レチクルステージ RSTは、リニアモータ、ボイスコイルモータ等を駆動源とする 不図示のレチクルステージ駆動部によって、照明系 10の光軸 (後述する投影光学系 PLの光軸 AXに一致)に垂直な XY平面内で微少駆動可能であるとともに、所定の走 查方向(ここでは図 1における紙面内左右方向である Y軸方向とする)に指定された 走査速度で駆動可能となって 、る。
[0055] レチクルステージ RSTのステージ移動面内の位置はレチクルレーザ干渉計(以下、 「レチクル干渉計」と略述する) 16によって、移動鏡 15を介して、例えば 0. 5— lnm 程度の分解能で常時検出される。ここで、実際には、レチクルステージ RST上には Y 軸方向に直交する反射面を有する移動鏡と X軸方向に直交する反射面を有する移 動鏡とが設けられ、これらの移動鏡に対応してレチクル Y干渉計とレチクル X干渉計 とが設けられている力 図 1ではこれらが代表的に移動鏡 15、レチクル干渉計 16とし て示されている。なお、例えば、レチクルステージ RSTの端面を鏡面カ卩ェして反射面 (移動鏡 15の反射面に相当)を形成しても良い。また、レチクルステージ RSTの走査 方向(本実施形態では Y軸方向)の位置検出に用いられる X軸方向に伸びた反射面 の代わりに、少なくとも 1つのコーナーキューブ型ミラー(例えばレトロリフレクタ)を用 いても良い。ここで、レチクル Y干渉計とレチクル X干渉計の少なくとも一方、例えばレ チクル Y干渉計は、測長軸を 2軸有する 2軸干渉計であり、このレチクル Y干渉計の 計測値に基づきレチクルステージ RSTの Y位置にカ卩え、 Θ z方向(Z軸回りの回転方 向)の回転量 (ョーイング量)も計測できるようになって!/、る。レチクル干渉計 16力もの レチクルステージ RSTの位置情報 (ョーイング量などの回転情報を含む)はステージ 制御装置 19及びこれを介して主制御装置 20に供給される。ステージ制御装置 19で は、主制御装置 20からの指示に応じて、レチクルステージ RSTの位置情報に基づい てレチクルステージ駆動部(不図示)を介してレチクルステージ RSTを駆動制御する
[0056] レチクル Rの上方には、 X軸方向に所定距離隔てて一対のレチクルァライメント検出 系 22 (但し、図 1においては紙面奥側のレチクルァライメント検出系 22は不図示)が 配置されている。各レチクルァライメント検出系 22は、ここでは図示が省略されている 力 それぞれ照明光 ILと同じ波長の照明光にて検出対象のマークを照明するための 落射照明系と、その検出対象のマークの像を撮像するための検出系とを含んで構成 されている。検出系は結像光学系と撮像素子とを含んでおり、この検出系による撮像 結果 (すなわちレチクルァライメント検出系 22によるマークの検出結果)は主制御装 置 20に供給されている。この場合、レチクル Rからの検出光をレチクルァライメント検 出系 22に導くための不図示の偏向ミラーが移動自在に配置されており、露光シーケ ンスが開始されると、主制御装置 20からの指令に基づいて不図示の駆動装置により 偏向ミラーはそれぞれレチクルァライメント検出系 22と一体的に照明光 ILの光路外 に退避される。
[0057] 前記投影光学系 PLは、レチクルステージ RSTの図 1における下方に配置され、そ の光軸 AXの方向が Z軸方向とされている。投影光学系 PLとしては、両側テレセントリ ックで所定の縮小倍率 (例えば 1Z5、又は 1Z4)を有する屈折光学系が使用されて いる。このため、照明系 10からの照明光 ILによってレチクル Rの照明領域が照明され ると、レチクル Rの回路パターンの照明領域部分の縮小像 (部分倒立像)が投影光学 系 PLを介してウェハ W上の前記照明領域に共役な投影光学系の視野内の投影領 域に投影され、ウェハ W表面のレジスト層に転写される。
[0058] 前記ウェハステージ WSTは、投影光学系 PLの図 1における下方で、不図示のベ ース上に配置されて 、る。このウェハステージ WST上にウェハホルダ 25が載置され ている。このウェハホルダ 25上にウェハ Wが例えば真空吸着等によって固定されて いる。
[0059] 前記ウェハステージ WSTは、投影光学系 PLの図 1における下方で、不図示のベ ース上に配置されて 、る。このウェハステージ WST上にウェハホルダ 25が載置され ている。このウェハホルダ 25上にウェハ Wが例えば真空吸着等によって固定されて いる。このウェハステージ WSTは、図 1のウェハステージ駆動部 24により、 X、 Y、 Ζ、 θ ζ (Ζ軸回りの回転方向)、 θ χ (Χ軸回りの回転方向)、及び 0 y (Υ軸回りの回転方 向)の 6自由度方向に駆動可能な単一のステージである。なお、残りの Θ z方向につ いては、ウェハステージ WST (具体的には、ウェハホルダ 25)を回転可能に構成し ても良いし、このウェハステージ WSTのョーイング誤差をレチクルステージ RST側の 回転により補正することとしても良い。
[0060] 前記ウェハステージ WSTの側面には、ウェハレーザ干渉計(以下、「ウェハ干渉計 」と略述する) 18からのレーザビームを反射する移動鏡 17が固定され、外部に配置さ れたウェハ干渉計 18により、ウェハステージ WSTの X方向、 Y方向及び 0 z方向(Z 軸回りの回転方向)の位置が例えば、 0. 5— lnm程度の分解能で常時検出されて いる。
[0061] ここで、ウェハステージ WST上には、実際には、 X軸方向に直交する反射面を有 する X移動鏡と Y軸方向に直交する反射面を有する Y移動鏡とが設けられて ヽる。ま た、これに対応して、ウェハ干渉計も X移動鏡、 Y移動鏡にそれぞれレーザ光を照射 してウエノ、ステージ WSTの X軸方向、 Y軸方向の位置をそれぞれ計測する X軸干渉 計、 Y軸干渉計がそれぞれ設けられている。
[0062] 本実施形態では、 X軸及び Y軸干渉計は測長軸を複数有する多軸干渉計で構成 され、ウェハステージ WSTの X、 Y位置の他、回転(ョーイング(Z軸回りの回転である Θ z回転)、ピッチング (X軸回りの回転である θ X回転)、ローリング (Y軸回りの回転 である Θ y回転))も計測可能となっている。
[0063] このようにウェハ干渉計、及び移動鏡はそれぞれ複数設けられているが、図 1では これらが代表的に移動鏡 17、ウェハ干渉計 18として示されている。また、例えば、ゥ エノ、ステージ WSTの端面を鏡面加工して反射面 (移動鏡の反射面に相当)を形成し ても良い。
[0064] また、ウェハステージ WST上のウェハ Wの近傍には、基準マーク板 FMが固定さ れている。この基準マーク板 FMの表面は、ウェハ Wの表面と同じ高さに設定され、こ の表面には少なくとも一対のレチクルァライメント用基準マーク、及びァライメント検出 系 ASのベースライン計測用の基準マーク等が形成されて 、る。
[0065] 前記ァライメント検出系 ASは、投影光学系 PLの側面に配置された、オファクシス 方式のァライメントセンサである。このァライメント検出系 ASとしては、例えばウェハ上 のレジストを感光させないブロードバンドな検出光束を対象マークに照射し、その対 象マークからの反射光により受光面に結像された対象マークの像と不図示の指標の 像とを撮像素子 (CCD)等を用いて撮像し、それらの撮像信号を出力する画像処理 方式の FIA (Field Image Alignment)系のセンサが用いられている。なお、 FIA系に 限らず、コヒーレントな検出光を対象マークに照射し、その対象マークから発生する 散乱光又は回折光を検出する、あるいはその対象マーク力 発生する 2つの回折光 (例えば同次数)を干渉させて検出するァライメントセンサを単独である 、は適宜組み 合わせて用いることは勿論可能である。このァライメント検出系 ASの撮像結果が不図 示のァライメント信号処理系を介して主制御装置 20へ出力されている。
[0066] 制御系は、図 1中、主制御装置 20及びこの配下にあるステージ制御装置 19などに よって主に構成される。主制御装置 20は、 CPU (中央演算処理装置)、 ROM (リード •オンリ'メモリ)、 RAM (ランダム ·アクセス 'メモリ)等力 成る!/、わゆるマイクロコンビ ユータ (又はワークステーション)を含んで構成され、装置全体を統括して制御する。
[0067] 主制御装置 20には、例えばキーボード,マウス等のポインティングデバイス等を含 んで構成される入力装置、及び CRTディスプレイ (又は液晶ディスプレイ)等の表示 装置 0、ずれも図示省略)、並びに CD (Compact Disc) , DVD (Digital Versatile Disc) , MO (Magneto-Optical disc)あるいは FD (Flexible Disc)等の情報記録媒体 のドライブ装置 46、ハードディスクから成る記憶装置 47が、外付けで接続されている 。ドライブ装置 46にセットされた情報記録媒体 (以下では、 CDであるものとする)には 、後述するフローチャートで示されるウェハァライメント及び露光動作時の処理アルゴ リズムに対応するプログラム(以下、便宜上、「特定プログラム」と呼ぶ)、その他のプロ グラム、並びにこれらのプログラムに付属するデータベースなどが記録されている。
[0068] 主制御装置 20は、例えば露光動作が的確に行われるように、前述の特定プロダラ ムに従った処理を実行し、例えばレチクル Rとウェハ Wの同期走査、ウェハ Wのステ ッビング等を制御する。
[0069] 具体的には、前記主制御装置 20は、例えば走査露光時には、レチクル Rがレチク ルステージ RSTを介して +Y方向(又は Y方向)に速度 V =Vで走査されるのに同
R
期して、ウェハステージ WSTを介してウェハ Wが前述の照明領域に共役な投影領 域に対して Y方向(又は +Y方向)に速度 V = β ·ν ( βはレチクル Rからウエノ、 W
W
に対する投影倍率)で走査されるように、レチクル干渉計 16、ウェハ干渉計 18の計 測値に基づ!/、て不図示のレチクルステージ駆動部、ウェハステージ駆動部 24をそれ ぞれ介してレチクルステージ RST、ウェハステージ WSTの位置及び速度をそれぞれ 制御する。また、ステッピングの際には、主制御装置 20ではウェハ干渉計 18の計測 値に基づいてウェハステージ駆動部 24を介してウェハステージ WSTの位置を制御 する。
[0070] さらに、本実施形態の露光装置 100は、投影光学系 PLの最良結像面に向けて複 数のスリット像を形成するための結像光束を光軸 AX方向に対して斜め方向より供給 する不図示の照射系と、その結像光束のウェハ Wの表面での各反射光束を、それぞ れスリットを介して受光する不図示の受光系とから成る斜入射方式の多点フォーカス 検出系を備えている。この多点フォーカス検出系としては、例えば特開平 6— 28340 3号公報及びこれに対応する米国特許第 5, 448, 332号などに開示されるものと同 様の構成のものが用いられ、この多点フォーカス検出系の出力が主制御装置 20に 供給されている。主制御装置 20では、この多点フォーカス検出系力ものウエノ、位置 情報に基づいてステージ制御装置 19及びウェハステージ駆動部 24を介してウェハ ステージ WSTを Z方向及び傾斜方向に駆動する。本国際出願で指定した指定国又 は選択した選択国の国内法令が許す限りにおいて、上記公報及びこれに対応する 米国特許における開示を援用して本明細書の記載の一部とする。
[0071] 次に、上述のようにして構成された本実施形態の露光装置 100により、ウェハ Wに 対して第 2層目(セカンドレイヤ)以降の層の露光処理を行う際の動作について、図 2 のウェハの上面図及び上記特定プログラムに従って実行される、主制御装置 20内の CPUの処理アルゴリズムを示す図 3—図 5のフローチャートに沿って説明する。
[0072] 前提として、ドライブ装置 46にセットされた CD— ROM内の特定プログラム及びその 他のプログラムは、記憶装置 47にインストールされているものとする。さらに、そのうち のレチクルァライメント及びベースライン計測処理のプログラム力 主制御装置 20内 部の CPUによって記憶装置 47から主制御装置 20のメモリにロードされて 、るものと する。
[0073] 第 2層目以降の層の露光対象であるウエノ、 W上には、図 2に示されるように、前層 までの処理工程で複数 (例えば N個)のショット領域 SA (P= l、 2、 ' ··、Ν)が、隣接
Ρ
するショット領域間の 100 m幅程度の間隔 (ストリートライン)を置いて、マトリックス 状の配置で形成されるとともに、各ショット領域 SAの四隅 (ストリートライン上)に、 2
P
次元位置検出用のウェハァライメントマーク(ウェハマーク) M (K= l, 2, 3, 4)が
Ρ,Κ
形成されている。ショット領域 SAの配列によって規定される配列座標系の各軸を α
ρ
軸 (X軸に略平行な軸)、 j8軸 (Υ軸に略平行な軸)とし、 α軸と X軸とが完全に一致し 、 j8軸と Υ軸とが完全に一致したと仮定すると、ウェハマーク M 、M 、M 、M の
Ρ,Ι Ρ,2 Ρ,3 Ρ,4
X位置の平均値は、ショット領域 SA (の中心 C )の X座標に設計上一致し、ウェハマ
P P
ーク M 、M 、M 、M の Y位置の平均値は、ショット領域 SA (の中心 C )の Y座
Ρ,Ι Ρ,2 Ρ,3 Ρ,4 Ρ Ρ 標に設計上一致するようになっている。すなわち、設計上は、各ウェハ Xマーク Μ
Ρ,Κ の X位置と Υ位置とにより、ショット領域 SA (の中心 C )の位置座標を求めることがで
Ρ Ρ
きるようになつている。
[0074] この場合、ウェハマーク Μ としては、例えば互いに交差する X軸( α軸)方向及び
Ρ,Κ
'方向に延びるラインによって形成される十字マークが用いられて 、る。こ れらのマークとしては、十字マークでなぐボックスマークであっても良いし、 α軸方向 をその配列方向とするライン'アンド 'スペース'パターン (LZSパターン)と |8軸方向 をその配列方向とする LZSパターンとの組合せのマークであっても良!、。
[0075] なお、上述したようなウェハ W上のショット領域などに関する情報(ショット数、ショッ トサイズ、配置、ァライメントマークの配置、種類などに関するいわゆるショットマップデ ータ)は、リソグラフィシステムのホストコンピュータ力も記憶装置 47にダウンロードされ ているものとする。
[0076] 図 3に示されるように、まず、ステップ 301において、不図示のレチクルローダを介し て、レチクルステージ RST上にレチクル Rをロードする。このレチクルロードが終了す ると、ステップ 303→ステップ 305において、主制御装置 20 (より正確には、 CPU)で は、レチクルァライメント及びベースライン計測を前述のレチクルァライメント及びべ一 スライン計測処理のプログラムに従って以下のようにして実行する。
[0077] すなわち、主制御装置 20では、ウエノ、ステージ駆動部 24を介してウェハステージ WST上の基準マーク板 FMを投影光学系 PLの直下の所定位置(以下、便宜上「基 準位置」と呼ぶ)に位置決めし、基準マーク板 FM上の一対の第 1基準マークと対応 するレチクル R上の一対のレチクルァライメントマークとの相対位置を前述の一対のレ チクルァライメント検出系 22を用いて検出する。そして、主制御装置 20では、レチク ルァライメント検出系 22の検出結果と、その検出時の干渉計 16、 18の計測値とをメ モリに記憶する。次いで、主制御装置 20では、ウェハステージ WST及びレチクルス テージ RSTを、それぞれ所定距離だけ Y軸方向に沿って相互に逆向きに移動して、 基準板 FM上の別の一対の第 1基準マークと対応するレチクル R上の別の一対のレ チクルァライメントマークとの相対位置を前述の一対のレチクルァライメント検出系 22 を用いて検出する。そして、主制御装置 20では、レチクルァライメント検出系 22の検 出結果と、その検出時の干渉計 16、 18の計測値とをメモリに記憶する。次いで、上 記と同様にして、基準マーク板 FM上の更に別の一対の第 1基準マークと対応するレ チクルァライメントマークとの相対位置関係を更に計測しても良い。
[0078] そして、主制御装置 20では、このようにして得られた少なくとも 2対の第 1基準マー クと対応するレチクルァライメントマークとの相対位置関係の情報と、それぞれの計測 時の干渉計 16、 18の計測値とを用いて、干渉計 16の測長軸で規定されるレチクル ステージ座標系と干渉計 18の測長軸で規定されるウェハステージ座標系(以下、「ス テージ座標系」と略述する)との相対位置関係を求める。これにより、レチクルァラィメ ントが終了する。
[0079] 次いで、ステップ 305において、ベースライン計測を行う。具体的には、ウェハステ ージ WSTを前述の基準位置に戻し、その基準位置カゝら所定量、例えばベースライン の設計値だけ XY面内で移動して、ァライメント検出系 ASを用いて基準マーク板 FM 上の第 2基準マークを検出する。主制御装置 20では、このとき得られるァライメント検 出系 ASの検出中心と第 2基準マークの相対位置関係の情報及び先にウェハステー ジ WSTが基準位置に位置決めされた際に計測した一対の第 1基準マークと対応す る一対のレチクルァライメントマークと相対位置関係の情報と、それぞれの計測時の ウェハ干渉計 18の計測値とに基づいて、ァライメント検出系 ASのベースライン、すな わちレチクルパターンの投影中心とァライメント検出系 ASの検出中心 (指標中心)と の距離 (位置関係)を算出する。
[0080] このような一連の準備作業が終了すると、主制御装置 20では、前述のレチクルァラ ィメント及びベースライン計測処理のプログラムをメモリからアンロードするとともに、前 述の特定プログラムを記憶装置 47からメモリにロードする。以後、この特定プログラム に従って、ウェハロード、ウェハァライメント(ここでは EGA方式のウェハァライメント) 及びウエノ、 W上の各ショット領域 SAに対する露光が行われる。
P
[0081] まず、ステップ 307にお!/、て、不図示のウェハローダを介して、ウェハ Wをウェハス テージ WST上のウェハホルダ 25上にロードする。ここで、本実施形態では、ウェハ Wのロードに先立って、不図示のブリアライメント装置により、ウェハステージ WSTの 移動位置を規定するステージ座標系(XY座標系)と、ウェハ W上のショット領域の配 列により規定される座標系(図 2の a j8座標系、以下、「ウェハ座標系」と略述する)と がある程度まで一致するように、ウエノ、ステージ WSTに対するウェハ Wの回転ずれ と中心位置ずれが高精度に調整されるいわゆるブリアライメントが実施されており、口 ード後にウェハ Wの回転ずれ及び中心位置ずれを調整するいわゆるサーチァラィメ ントが不要となって 、るものとする。
[0082] 次に、サブルーチン 309において、ウェハァライメント処理を行う。このウェハァライ メント処理では、ステージ座標系における、ウェハ W上のショット領域の配列を推定し 、その配列、すなわち全ショット領域の中心位置を算出する。なお、このウェハァライ メント処理については、後で詳述する。
[0083] 次!、で、ステップ 311では、ショット領域の配列番号を示すカウンタ jに 1をセットし、 最初のショット領域を露光対象領域とする。
[0084] 次に、ステップ 313では、後述する図 5のステップ 526において算出された露光対 象領域の配列座標(各ショット領域の中心位置)に基づいて、ウェハ Wの位置がゥェ ハ W上の露光対象領域を露光するための加速開始位置となるように、ステージ制御 装置 19、ウェハステージ駆動部 24を介してウェハステージ WSTを移動させるととも に、レチクル Rの位置が加速開始位置となるようにステージ制御装置 19、レチクルス テージ駆動部(不図示)を介して、レチクルステージ RSTを移動する。
[0085] ステップ 315では、レチクルステージ RSTとウェハステージ WSTの相対走査を開 始する。そして両ステージがそれぞれの目標走査速度に達し、等速同期状態に達す ると、照明系 10からの照明光 ILによってレチクル Rのパターン領域が照明され始め、 走査露光が開始される。そして、レチクル Rのパターン領域の異なる領域が照明光 IL で逐次照明され、パターン領域全面に対する照明が完了することにより走査露光が 終了する。これにより、レチクル Rのパターンが投影光学系 PLを介してウェハ W上の 露光対象領域に縮小転写される。
[0086] ステップ 317では、カウンタ値 jを参照し、全てのショット領域に露光が行われたか否 かを判断する。ここでは、 j = l、すなわち、最初のショット領域に対して露光が行なわ れたのみであるので、ステップ 317での判断は否定され、ステップ 319に移行する。
[0087] ステップ 319では、カウンタ jの値をインクリメント( + 1)して、次のショット領域を露光 対象領域とし、ステップ 313に戻る。
[0088] 以下、ステップ 317での判断が肯定されるまで、ステップ 313→ステップ 315→ステ ップ 317→ステップ 319の処理、判断が繰り返される。
[0089] ウェハ W上の全てのショット領域へのパターンの転写が終了すると、ステップ 317で の判断が肯定され、ステップ 321に移行する。
[0090] ステップ 321では、不図示のウェハローダに対しウェハ Wのアンロードを指示する。
これにより、ウェハ Wは、ウェハホルダ 25上からアンロードされた後、不図示のウェハ 搬送系により、露光装置 100にインラインにて接続されて 、る不図示のコータ ·デベロ ツバに搬送される。
[0091] 次のステップ 323では、ロット内のすべてのウェハの露光が終了したか否か判断す る。この判断が肯定されれば、露光処理を終了し、否定されればステップ 307に戻る 。ここでは、まだロット内の先頭(1枚目)のウェハ Wの露光が終了しただけなので、判 断は否定され、ステップ 307に戻る。
[0092] 以降、図 3のステップ 323における判断が肯定されるまで、ステップ 307 (ウェハ口 ード)→サブルーチン 309 (ウェハァライメント)→ステップ 311一ステップ 319 (露光) →ステップ 321 (ウェハアンロード)→ステップ 323 (ロット終了判断)のループ処理が 、ロット内のウェハそれぞれを処理対象として順次実行される。ステップ 323における 判断が肯定されると、一連の露光処理を終了する。
[0093] すなわち、上記露光処理においては、ロット内のウェハに対し、ウェハステージ WS T上に順次ロードされたウェハを処理対象として、ウェハァライメント処理、露光処理 が施される。 [0094] 《ウェハァライメント処理》
次に、サブルーチン 309のウェハァライメント処理について説明する。このウェハァ ライメント処理では、 EGA方式を採用する力 ここでは、まず最初に、 EGA方式につ いて説明する。
[0095] 図 2に示されるウェハ Wに形成されたウェハマーク M の実際の形成位置が、設計
Ρ,Κ
位置からずれる(すなわちショット領域 SAの形成位置が設計位置からずれる)のは、
Ρ
ウェハステージ WSTの移動位置を規定するステージ座標系(X, Υ)と、ウェハ座標 系( α , β )との不整合が原因であり、力かる不整合が生じる主要因は、次の 4つであ ると考免られる。
[0096] Α.ウェハ Wの回転:これはステージ座標系(X, Υ)に対するウェハ座標系 , j8 ) の残留回転誤差 Θで表される。
B.ステージ座標系(X, Y)の直交度:これは X軸方向及び Y軸方向のウェハステー ジ WSTの送りが正確に直交していないことにより生じ、直交度誤差 Wで表される。
C.ウェハ座標系( a , j8 )における a軸方向及び j8軸方向の線形伸縮 (ウェハスケ 一リング):これはウェハ Wが加工プロセス等によって全体的に伸縮することである。こ の伸縮量は oc軸方向及び β軸方向につ!、てそれぞれウェハスケーリング S及び S
X Υ
で表される。ただし、 X軸方向のウェハスケーリング Sはウェハ W上の a方向の 2点
X
間の距離の実測値と設計値との比、 Y軸方向のウェハスケーリング Sは β方向の 2
Υ
点間の実測値と設計値との比で表すものとする。
D.ウェハ座標系 , j8 )のステージ座標系(X, Y)に対するオフセット:これはゥェ ハ wがウエノ、ステージ WSTに対して全体的に微小量だけずれることにより生じ、 X軸 方向及び Y軸方向の並進成分 (オフセット) o , oで表される。
X Y
[0097] 上記の A.— D.の誤差要因が加わった場合、ウェハ座標系( a , j8 )における設計 上の位置(DX, DY)に転写されるはずのパターンは、実際には、次式によって求め られるステージ座標系(X, Y)上の位置 (EX, EY)に位置していると予想される。
[0098] [数 1]
(ΕΧλ fsx ο γ cos© - sin@Y 1 - tanW DX Ox
+ (1)
、 ο 人 sin© cos©ノ 0" 11 ノ DYノ 一般に、直交度誤差 W及び残留回転誤差 Θは、微小量であるとみなし、上記式(1 )の三角関数を 1次近似で表した次式によって設計上の転写位置 (DX, DY)と予想 転写位置 (EX, ΕΥ)とが関係付けられるようになる。
[0099] [数 2]
Sx - Sx - (W + Θ) ϋΧλ ίθχヽ
•(2)
Figure imgf000025_0002
Sy - Θ Sy ノ DY Oy なお、 X軸に対するウェハ座標系の α軸の回転成分を Rxとし、 Y軸に対するウェハ 座標系の β軸の回転成分を Ryとする。そして、残留回転誤差 Θを、そのまま X軸に 対する回転成分 Rxに対応させ、直交度誤差 Wを、 Ry— Rxに対応させると、上記式( 2)を、次式に変換することができる。
[0100] [数 3]
Sx - Sx - Ry
■(3)
Figure imgf000025_0003
Sy Rx Sy
Figure imgf000025_0004
さらに、スケーリング Sx、 Syを 1 + Sx、 1 + Syと置き換え、 Sx 'Ry= SyRx 0のよ うに近似すると、上記式 (3)を、次式に変換することができる。
[0101] [数 4]
ΕΥ
Figure imgf000025_0001
Figure imgf000025_0005
上記式 (4)力 EGA方式における最も一般的な線形モデルのモデル式であり、こ のモデル式では、ウェハスケーリング Sx, Sy、ウェハ回転 Rx, Ry、オフセット Ox, O y力 モデル式の係数(いわゆる 6つの EGAパラメータ)となる。
[0102] なお、実際の転写位置と設計位置とのずれの要因としては、上記のステージ座標 系とウェハ座標系とのずれによる誤差要因以外にも様々な誤差要因があると考えら れる。例えば、ショット領域 SA自体の誤差成分 (例えば、投影光学系 PLの投影倍率
P
の誤差 (これでショット領域の大きさが変わる)や、スキャン方向に対するレチクルステ ージ RST上のパターン自体の回転誤差などを含む。以下「ショット内成分」と略述す る)も含んでおり、その誤差成分の影響が無視できな 、場合もある。 [0103] 上記ショット内成分は、ショット領域 SAの四隅に形成されたウェハマーク M の位
P Ρ,Κ 置により観測することができる。ショット領域 SA内の中心 Cを原点とするショット内座
Ρ Ρ
標系を想定し、その座標系でのウェハマーク Μ の設計上の位置を (mx , my )
Ρ,Κ Ρ,Κ Ρ,Κ とし、上記ショット内成分の影響によるウェハマーク Μ の予想転写位置を (mx ' ,
Ρ,Κ Ρ,Κ my ' )とすると、それらの関係は次式で示される。
Ρ,Κ
[0104] [数 5]
1
Figure imgf000026_0003
Figure imgf000026_0001
ここで、 sx、 syは、ステージ座標系に対するショット内座標系のスケーリング成分 (シ ヨットスケーリング成分)を示し、 rx、 ryは、それぞれステージ座標系に対するショット 内座標系の回転成分 (ショット回転成分)を示す。
[0105] 以上のことから、ステージ座標系におけるサンプルショット SAの各ウェハマーク M
P
の予想位置(MX ' , MY ' )を、次式で表すことができる。
Ρ,Κ Ρ,Κ Ρ,Κ
[0106] [数 6]
Figure imgf000026_0002
ここで、(DX , DY )は、ショット領域 SAの中心 Cの設計座標である。
P P P P
[0107] EGA方式では、ショット領域の設計上の位置(DX , DY )を、上記式 (4)のモデル
P P
式の(DX, DY)に代入して、ショット領域の設計上の位置(EX, EY)を求め、その位 置を、ステージ座標系におけるショット領域 SAの中心位置とみなすのである力 そ p
のためには、上記式(4)のモデル式における係数 Sx、 Sy、 Rx、 Ry、 Ox、 Oyの値を 求めればよい。しかしながら、この係数 Sx、 Sy、 Rx、 Ry、 Ox、 Oyの値は、何点かの ウェハマーク M の実際の位置に基づいて算出されるようになるため、上記ショット内
Ρ,Κ
成分を考慮する必要がある。そこで、本実施形態では、これらの係数の値を求めるた めに、幾つかのショット領域 SA (1= 1, 2、 · ··、 η)に付設された何個(例えば h個)か のウェハマーク M のステージ座標系における位置(MX , MY )を実測し、サンプ i,K i,K i,K
ルショット SAの設計上の位置(DX, DY)と、 h個の実測されたウェハマークのショッ ト内座標系における設計上の位置 (mx , my )とを用いて、上記式 (6)に示される
i,K i,K
ショット成分をも考慮したモデル式に基づ 、て、統計的処理 (例えば最小二乗法)を 実行し、次式に示される評価関数 Eの値が最小となるような、上記式 (6)のモデル式 における係数 Sx、 Sy、 Rx、 Ry、 Ox、 Oy、 sx, sy、 rx、 ryの値を求める。なお、次式 においては、計測される各ウェハマーク M の実測位置をそれぞれ (MX , MY ) (g
ι, g g
= 1、 2、 "-h)とし、求められた係数 Sx、 Sy、 Rx、 Ry、 Ox、 Oy、 sx, sy、 rx、 ryの値 を上記式 (6)に代入して求められた計測される各ウェハマーク M の予想位置をそ
i,K
れぞれ(MX ' , MY ' )としている。
g g
[0108] [数 7]
∑(Mxg -Mxg'} +∑( g - g')2
JT1 …(フ)
すなわち、この評価関数 Eは、上記式 (6)より求められる、計測される各ウェハマー ク M の位置の予想位置(MX ' , MY ' )とその位置の実測値(MX , MY )との残 i,K g g g g 差の二乗和を、ウェハマーク M のサンプル数 hで割ったもの(すなわち残差の二乗
i,K
和の平均)である。
[0109] なお、ここで、 i≠P≠gであり、 iは、順番 (例えば計測経路順)に付与されたサンプ ルショットの番号であり、 gは、実際に計測されるウェハマークの番号である。
[0110] ところで、 EGA方式においては、ウェハマーク M のサンプル数 hは、多ければ多
i,K
いほど、ァライメント精度の観点からは望ましいが、逆に、ウェハマーク M のサンプ
i,K
ル数 hが少なければ少ないほど、スループットの観点から望ましい。また、このウェハ マーク M のサンプル数 hは、 EGAのモデル式における、未知数(パラメータ)の数に
i,K
制約を受ける。例えば、上記式(6)のモデル式の 10個の係数(Sx、 Sy、 Rx、 Ry、 O x、 Oy、 sx, sy、 rx、 ry)すべてを未知数 (パラメータ)とする場合には、軸毎のパラメ ータ数がそれぞれ 5個ずっとなるので、 2次元位置検出用のウェハマーク M のサン
i,K プル数 hは、少なくとも 6 ( = 5 + 1)以上である必要がある(1次元位置検出用のゥェ ハマークであれば、軸毎に 6サンプル以上必要)力 上記式(6)のモデル式の係数の うち、例えば sx、 sy、 rx、 ryを定数とすれば、そのモデル式の軸ごとのパラメータ数は 3となり、 2次元位置検出用のウェハマーク M のサンプル数 hは、 4 ( = 3 + 1)でもよ
i,K
い。すなわち、 EGA方式においては、モデル式のパラメータ数が増えれば増えるほ ど、ウェハマーク M のサンプル数 hを増やさなければならないため、スループットの
i,K
点で不利となる。そこで、本実施形態では、ァライメント精度を低減させることなぐ上 記式 (6)に示されるモデル式のパラメータをできるだけ少なくし(自由度を小さくし)、 ウェハマーク M のサンプル数 hを可能な限り少なくするように、モデルのパラメータ
i,K
の自由度及びウェハマーク M のサンプル数 hの最適化を行う。なお、上述したゥェ
i,K
ハマーク M のサンプル数 hは、あくまで、計測されるマークのうち、例えば 1直線上
i,K
に配置された 3つのマークが選ばれることがないように抽出された、パラメータの導出 に有効な計測マークのサンプル数である。
[0111] なお、上記式(6)に示されるモデル式のパラメータの自由度及びサンプル数の最 適化を実施するために、本実施形態においては、上記式 (6)に示されるモデル式の 係数に関し、経験的に得られている各係数の値の性質 (属性)等から、各係数を次の ように予め分類しておく。
[0112] 本実施形態では、上記式 (6)のモデル式の係数を以下のように分類する。
a.ウェハ毎に推定し、今回のサンプルショット(のウェハマーク)の計測値に基づいて 必ず変更する、すなわちパラメータとする係数
b.ウェハ毎に推定し、今回のサンプルショット(のウェハマーク)の計測値に基づいて 推定されるパラメータとするか、事前知識より得られる値 (定数)とするかを判断する係 数
cロット毎に推定し、今回のサンプルショット(のウェハマーク)の計測値に基づいて 必ずパラメータとして変更するが、ロット内では、事前知識より得られる値 (定数)を用 いる係数
d.ロット毎に推定し、今回のサンプルショット(のウェハマーク)の計測値に基づいて 推定されるパラメータとするか、事前知識より得られる値 (定数)とするかを判断するが 、ロット内では、事前知識より得られる値 (定数)を用いる係数
e.原則として値を定数として固定し、必要に応じてパラメータとして推定し、値を変更 する係数 [0113] ここで、事前知識とは、上記式(6)のモデル式の各係数の値に関する知識のことで あり、例えば、シミュレーション、あるいは、過去に実際に求められたモデル式の係数 の値のことである。ここでは、事前知識より得られる値は、過去に求められたモデル式 の係数の値から予想される係数の値ということにする。なお、この事前知識における 各係数のデフォルト値は、例えば、記憶装置 47に記憶されているとしても良い。この デフォルト値としては、例えば、前回のロットにおける事前知識の値が用いられても良 いし、設計値が用いられても良い (0でも良い)。
[0114] 上記式(6)のモデル式の各係数の値の変動については、それぞれある程度異なつ た傾向が見られるので、その傾向に基づいて各係数を分類することができる。以下に その分類の一例を示す。例えば、ウェハのオフセット成分 Ox, Oyや、回転成分 Rx, Ryは、ウェハステージ WSTにウェハがロードされる前に実施されるプリアライメントの 結果のばらつきによりばらついたものとなるので、ウェハ毎に逐一推定するのが妥当 であり、 a.の係数として分類されるのが望ましい。また、ウェハスケーリング Sx、 Syは 、ウェハよりも、露光装置の特性やプロセスに対する依存度が大きいため、同じプロ セスを経て同じ露光装置で露光されてきた同一ロット内のウェハ間の変動量があまり 大きくはないが、同一ロット内のウェハ間で値が多少変動することも考えられるので、 b.の係数として分類するのが妥当である。また、ショット内成分の係数(sx、 sy、 rx、 r y)の値については、基本的には変動しないものとみなした場合には、 e.の係数に分 類するのが望ましい。
[0115] なお、上記 EGAのモデル式 (式 (6) )の各係数の分類は、この分類例に限定される ものではなぐ様々な分類パターンを採用することができる。例えば、ショット内成分の 係数(sx、 sy、 rx、 ry)を d.の係数として分類することもできる。しかし、ここでは、上記 例の分類がなされたものとして話を進める。
[0116] なお、このようなモデルの係数の分類の指定は、すでに、オペレータによって、不図 示の入力装置を介して行われており、その指定内容は、記憶装置 47に格納されてい るちのとする。
[0117] 以下、ウェハァライメント処理を、図 4、図 5に示されるサブルーチン 309のフローチ ヤートに沿って説明する。なお、上述したように、このサブルーチン 309は、処理対象 のウェハが切り替わる毎に、そのウェハに対して 1回実行されるようになる。したがつ て、以下の説明では、ロットの 1枚目のウェハを処理対象としたときの処理の流れに ついてまず説明し、続いて 2枚目、 3枚目、…のウェハを順次処理対象としたときの処 理の流れについて順番に説明していくこととする。
[0118] まず、ロットの 1枚目のウェハを処理対象としたときの処理の流れの一例について説 明する。図 4のステップ 402において、今回の処理対象であり、ウェハステージ WST 上にロードされたウェハ W力 そのロットの先頭 m (例えば 5とする)枚目以内のウェハ Wである力否かを判断する。その判断が肯定されれば、ステップ 404に進み、否定さ れればステップ 418に進む。ここでは、ウェハステージ WST上にロードされたウェハ W力 ロット先頭(1枚目)のウェハ Wであるので、判断が肯定されステップ 404に進 む。
[0119] ステップ 404では、そのウェハ Wのサンプル情報を参照する。 EGA処理では、前述 のように、ウェハ W上のショット領域 SAの中から、幾つかのショット領域をサンプルシ ヨット SAとして選択し、そのサンプルショット SAに付設されたウェハマーク M の中 i i i,K から、計 h個のウェハマークの位置(MX、 MY ) (g= l、 2、 · ··、 h)を計測する。サン g g
プル情報とは、この計測されるウェハマークの数及び配置に関する情報のことである 。本実施形態では、モデル式のパラメータの最適化に伴い、サンプル数の最適化も 行う力 この段階では、ロットの先頭のウェハ Wが処理対象であり、まだモデル式のパ ラメータの最適化が行われていないため、この時点での計測対象のウェハマーク M i,k の数及び配置としては、上記式(6)のモデル式の各係数をすベてパラメータとした場 合に、そのパラメータを求めるために必要とされる有効サンプル数を満たすような数 および配置とする必要がある。具体的には、式 (6)のモデル式の最大パラメータ自由 度が軸ごとに 5であるため、ここでのサンプル数は 6以上である必要である。ここでは、 このような有効サンプル数を満たすウェハマーク M の数及び配置が、記憶装置 47 i,k
に記憶されているものとし、ここでは、そのデフォルト設定されたサンプル情報を記憶 装置 47から取得し、メモリに保持してその情報を参照するものとする。なお、ここでは 、デフォルトのサンプル情報として、サンプル数 h= 30が指定されているものとする。
[0120] 次のステップ 406では、そのサンプル情報にサンプルショットとして指定されて!、る ショット領域 SAに付設されたウェハマーク M のうちの h個のウェハマークが、そのサ
i i,K
ンプル情報に指定されている計測順に基づいて、ァライメント検出系 ASの検出視野 内に順次移動するようにウェハステージ WSTを XY平面内で移動させつつ、そのゥ ェハマーク M をァライメント検出系 ASに撮像させると同時に、そのときのウェハステ
i,K
ージ WSTの位置をウェハ干渉計 18の計測値から求める。ァライメント検出系 ASから は、その撮像視野内のウェハマーク M の位置情報が送られるので、そのウェハマ
i,K
ーク M の位置情報と、ウェハ干渉計 18の計測値と、ベースラインとから、ステージ i,K
座標系におけるそのウェハマーク M の位置の実測値を求めることができる。求めら
i,K
れたウェハマーク M の実測値は、メモリに保持される。このようにして、サンプル情
i,K
報に指定されたサンプルショット SAに付設された h個のウェハマーク M の位置の実
i i,K
測値(MX , MY )が取得される。
g g
[0121] 次のステップ 408では、 e.に分類された係数を事前知識により定められる定数とし た上で、取得されたウェハマークの位置の実測値に基づいて、 a.— d.に分類された 係数の値を算出する。まず、記憶装置 47に記憶されている事前知識を参照し、 e.に 分類された係数の事前知識を得る。ここでは、まだロット内 1枚目のウェハを処理対 象としているため、 e.に分類された係数の事前知識の値は 0になっているものとする 。すなわち、ここでは、上記式(6)のモデル式の係数に関し、 sx = sy=rx=ry=0と 設定したうえで、メモリに記憶された各ウェハマーク M の位置の実測値 (MX、 MY
ι,Κ g g
)に基づいて、上記式 (7)に示される評価関数を最小にする、すなわち次式を満たす パラメータ Sx、 Sy、 Rx、 Ry、 Ox、 Oyの値を最小二乗法により求める。
[0122] [数 8] δΕ_ BE dE — dE dE dE _ Q
dSx— dSy _ dRx— dRy _ dOx dOy ~ " 次に、ステップ 410では、求められた EGAパラメータを上記式(6)の係数として設 定し、計測されたウェハマーク M のショット内座標系における設計位置 (mx , my
i,K i,K
)を(mx , my )に代入し、サンプルショット SAの中心 Cの設計位置(DX, DY) i,K Ρ,Κ Ρ,Κ i i i i を、(DX, DY )に代入して、予想されるウェハマーク M の位置(MX ,, MY ,)
P P i,k i,K i,K を求める。そして、求められた位置(MX ,, MY ,;)を(MX,, MY,)とし、ウェハ
i,K i,K g g マークの位置の実測値(MX , MY )を(MX , MY )として上記式(7)に代入して
i,K i,K g g
、その値 (残差)を求める。
[0123] さらに、ステップ 412では、上記モデル (a.— d.に分類される係数をパラメータとし 、 e.に分類される係数を事前知識に基づく値 (定数)とした統計モデル M (第 1の回 帰モデル)とする)の AIC (Akaike's Information Criterion)を算出する。
[0124] ここで、 AICについて簡単に説明する。計測によってモデル Mが得られたとき、これ が真のモデルと一致するか否かの尺度となる、そのモデルに対する誤差を正規分布 としたときの対数尤度を表す量として、カルバック'ライブラー情報量 (KLI)がある。 K LIのデータ数(ここで!/、うサンプルショットの数 h)の、モデルを表現するパラメータ数 の増加に伴う偏りを修正した推定値(の 2倍)が AICである。統計モデル Mの AICは、 次式で表される。
[0125] [数 9]
AIC{M) = -2 - \ogL + 2 - d · ' ·(9) ここで、 logLは、統計モデル Mに関する最大対数尤度であり、 dは、統計モデル M のパラメータ (未知数)の数であり、 Lは尤度であり、例えば、上記式(7)に示される評 価関数 Eにより、 L= (1ZE)が用いられる。すなわち、そのモデルでの評価関数 (残 差)の値が、小さくなればなるほど、その尤度 Lは大きくなるので、そのモデルの妥当 性が高くなり、結果的に AICの値は小さくなる。この AICの値が小さいければ小さい ほど、そのモデルが尤もらしいということになる。また、 2dの項は、パラメータの増加に 対するペナルティの項であり、パラメータの数が増えれば増えるほどその項の値が大 きくなる。すなわち、パラメータの自由度の増加に対し、一定以上の尤度の向上がな いと、ノ ラメータの自由度が大きいモデルが選択されなくなる。なお、 AICは、赤池情 報量規準の略称であるが、上記式 (9)では、これを、該情報量規準の関数名としても 用いている。
[0126] すなわち、 AICをモデルの確からしさの指標とすれば、ノ ラメータの自由度が大き V、モデルが選択される傾向が抑制され、学習誤差である残差 Eを小さくするモデルを 選択するのではなぐ汎化誤差を小さくするモデルを選択することができるようになる のである。
[0127] したがって、ステップ 412では、上記式(7)に、今回算出された評価関数 (残差) E に応じた logLの値と、未知パラメータ数 dの値とを代入して、 AIC (M)の値を算出す る。なお、上記係数の分類例では、 Sx、 Sy、 Rx、 Ry、 Ox、 Oyをパラメータとし、 sx、 sy、 rx、 ryを事前知識に基づく値としているので、モデル Mにおけるパラメータ数 dは 6となる。
[0128] 次のステップ 414では、上記式(6)のモデル式に基づく EGAの統計モデルを、 a. c.に分類される係数をパラメータとし、 b.、 d.、 e.に分類される係数を事前知識に 基づく値 (定数)とするモデル M,(第 2の回帰モデル)としたときの評価関数 (残差) E の値を算出する。具体的には、上記式(6)の係数のうち、 Sx、 Sy、 sx、 sy、 rx、 の 事前知識を記憶装置 47から取得し、取得された事前知識によって定められる値を、 式(6)に設定する。そして、上記ステップ 406で計測された h個のウェハマークの位 置の実測値に基づいて、 a.、 c.に分類された係数の値を算出する。すなわち、各ゥ ェハマーク M の位置の実測値を上記式 (6)に代入し、上記式(7)に示される評価
i,K
関数 Eを最小にするすなわち次式を満たす a.、c.に分類された係数 (パラメータ)で ある Rx、 Ry、 Ox、 Oyの値を最小二乗法により求める。
[0129] [数 10] dE dE dE dE = 0 -(10)
dRx dRy dOx dOy
[0130] そして、上記ステップ 406において計測されたウェハマーク M のショット内座標系
i,K
における設計位置(mx , my )を(mx , my )に代入し、サンプルショット SAの
i,K i,K Ρ,Κ Ρ,Κ i 中心 Cの設計位置(DX, DY)を、(DX , DY )に代入して、予想されるウェハマー i i i P P
ク M の位置(MX ,, MY ,)を求め、求められた位置(MX ,, MY ,;)を(MX, i,K i,K i,K i,K i,K g
, MY,;)とし、ウェハマークの位置の実測値(MX , MY )を(MX , MY )として上 g i,K i,K g g
記式(7)に代入して、その値 (残差)を求める。
[0131] 次のステップ 416では、上記統計モデル M,の AIC (M,)の値を算出する。なお、 上記分類例では、 Rx、 Ry、 Ox、 Oyをパラメータとし、 Sx、 Sy、 sx、 sy、 rx、 ryを事前 知識に基づく値 (定数)とするため、モデル M,のパラメータ数 dは、 4となる。 [0132] 次いで、図 5のステップ 502において、ステップ 412で求められたモデル Mの AIC ( M)の値と、ステップ 416で求められたモデル M,の AIC (M,)との値を比較し、 AIC ( Μ' )く AIC (M)である力否かを判断する。この判断が肯定されればステップ 504に 進み、判断が否定されればステップ 510に進む。なお、ここでは、ロットの先頭(1枚 目)のウェハ Wを処理対象としており、事前知識により値が定められた係数力 実際 のウェハ Wに関する式(6)に示すモデル式の係数としてフィットする可能性が必ずし も大きいとはいえない。そこで、ここでは、 AIC (M,)の値力 AIC (M)の値よりも大き ぐ判断が否定され、ステップ 510に進むものとして話を進める。
[0133] ステップ 510では、統計モデル Mでの評価関数 (残差) Eの値と所定値とを比較して 、 Eが所定値より小さいか否かを判断する。この判断が肯定されればステップ 512に 進み、この判断が否定されればステップ 516に進む。ここでは、 e.に分類される係数 の事前知識の値(デフォルト値)力 処理対象となっているロットの先頭のウェハ Wに フィットしていないため、モデル Mの評価関数 (残差) Eの値力 所定値以上となって 、判断が否定され、ステップ 516に進むものとして話を進める。
[0134] ステップ 516以降では、これまで、式(6)に示されるモデル式の係数すベてをパラメ ータとしたときの処理を行う。まず、ステップ 516では、メモリに記憶されているサンプ ル情報を参照して、サンプルショットを追加計測する必要があるか否かを判断する。 この判断が肯定されればステップ 518に進み、否定されればステップ 522に進む。こ こでは、前述のように、ステップ 404において取得され、メモリに記憶されたサンプル 情報におけるデフォルトの有効サンプル数 (h= 30)が、 a.— e. に分類される係数を すべてのパラメータとしたときのそのパラメータの自由度 (軸毎に 5)よりも十分大きく なって 、るので、サンプルショットの追加計測を行う必要が特にな 、ので判断は否定 され、ステップ 522に進む。
[0135] ステップ 522では、 a.一 e.に分類される係数をすベてパラメータとした上で、ステツ プ 406で計測された h個のウェハマークの位置の実測値に基づいて、 a.— e.に分 類される係数の値を算出する。すなわち、各ウェハマーク M の位置の実測値を上
i,K
記式 (6)に代入し、上記式(7)に示される評価関数 Eを最小にするすなわち次式を 満たすパラメータ Sx、 Sy、 Rx、 Ry、 Ox、 Ov、 sx、 sy、 rx、 ryの値を最小二乗法によ り求める。
[0136] [数 11] dE ΘΕ ΘΕ ΘΕ ΘΕ 6Ε dE dE dE dE Q
dSx dSy dRx dRy dOx dOy dsx dsy drx dry 求められた a. -e.に分類される係数 (パラメータ)の値は、後述する露光処理に用 いるために、メモリに保持される。そして、ステップ 524において、 b.— e.に分類され るパラメータの値を、事前知識として、記憶装置 47に格納する。
[0137] 次に、ステップ 526では、上記ステップ 522で求められメモリ上に保持された係数の 値を、上記式 (4)の各係数の値として設定し、全ショット領域 SAの設計位置 (DX ,
P P
DY )を上記式(4)の(DX、 DY)にそれぞれ代入して全ショット領域 SAの中心 Cの
P P P
位置 (基準位置) (EX , EX )を算出し、その算出結果を記憶装置 47に記憶する。ス
P P
テツプ 526終了後、サブルーチン 309を終了する。
[0138] 次に、ロット内の 2枚目のウェハ Wを処理対象としたときのサブルーチン 309の処理 の流れの一例について説明する。まず、図 4のステップ 402では、処理対象のウェハ Wがロットの m( = 5)枚目以内であるか否かが判断される。ここではまだ 2枚目なので 、判断は肯定され、ステップ 404に進む。
[0139] ステップ 406では、メモリに記憶されているサンプル情報を参照し、そのサンプル情 報に含まれるサンプルショットの数及び配置を把握する。メモリに記憶されて 、るサン プル情報(サンプル数及びサンプルショットのウェハマークの配置、有効サンプル数) は、前回のサブルーチン 309では、記憶装置 47に記憶されたデフォルトのサンプル 情報から更新されて 、な 、ので、ここでもデフォルトのサンプル情報がそのまま参照 される。
[0140] 次に、ステップ 408において、取得されたウェハマーク M の位置の実測値に基づ
i,K
いて、前回のサブルーチン 309と同様に、 a.— d.に分類される係数をパラメータとし 、 e.に分類された係数を事前知識により定められる定数とするモデル Mにおける、 a .一 d. に分類された係数 (パラメータ)の値を、上記式 (8)を条件式とする最小二乗 法により算出し、ステップ 410において、そのときの残差 Eを算出し、ステップ 412に おいて AIC (M)を算出する。この時点では、 e.に分類された係数の事前知識として 、前回のサブルーチン 309のステップ 524 (図 5参照)において記憶された係数の値 、すなわちロットの先頭のウェハ Wでの EGA処理において求められた係数の値が、 記憶装置 47に記憶されており、ここでは、その事前知識としての e.の係数の値をそ のまま今回の e.の係数として用いることができる。
[0141] 次のステップ 414では、 EGAの統計モデルを、 a.、 c. に分類される係数をパラメ ータとし、 b.、d.、e. に分類される係数を事前知識により定められる値 (定数)とした ときの式(6)のモデル式のモデル M'として、上記式(10)を条件として、最小二乗法 を行い、 a.、c.に分類される係数を算出して、評価関数 (残差) Eの値を算出し、ステ ップ 416では、そのモデル M,での AIC (M,)の値を算出する。この時点では、 b.、 d .、e.の係数の値の事前知識として、前回のサブルーチン 309のステップ 524 (図 5 参照)において記憶装置 47に記憶された b.、 d.、 e.の係数の値、すなわちロットの 先頭のウェハ Wでの EGA処理において求められた b.、d.、e.の係数の値が記憶 装置 47に記憶されており、ここでは、その事前知識としての b.、 d.、 e.の係数の値 をそのまま今回の b.、d.、e.の係数として用いることができる。
[0142] 次に、図 5のステップ 502において、今回のステップ 412で求められたモデル Mの AIC (M)の値と、今回のステップ 416で求められたモデル M,の AIC (M,)との値を 比較し、 AIC (M' ) <AIC (M)であるか否かを判断する。ここでは、依然、 AIC (M' ) ≥AIC (M)となって、判断が否定され、ステップ 510に進むものとして話を進める。
[0143] ステップ 510では、モデル Mでの評価関数 (残差) E力 所定値より小さいか否かが 判断される。ここでは、前回のサブルーチン 309におけるロットの先頭のウェハ Wの 処理において、そのロット内においては、値の変動がほとんどないと予想されている e . に分類される各係数が求められており、その係数がモデル Mに用いられているので 、残差 Eの値が所定値より小さくなつていて、判断が肯定され、ステップ 512に進むも のとして話を進める。
[0144] 次のステップ 512では、モデル Mを選択し、そのモデル Mの係数の値を、今回のゥ ェハ Wの露光処理のためにメモリに保持しておく。
[0145] 次のステップ 506では、今回の処理対象のウェハ W力 ロット先頭 m ( = 5)枚目以 内であるか否かが判断される。ここでは、今回のウェハ Wがロット内 2枚目なので、判 断は肯定され、ステップ 524→ステップ 526に進む。ステップ 524では、モデル Mの b .一 e.の係数の値を記憶装置 47に記憶する。そして、ステップ 526では、全ショット 領域 SAの中心位置の算出、記憶装置 47への記憶が行われる。ステップ 526終了
P
後、サブルーチン 309を終了する。
[0146] 次に、ロット内の 3枚目のウェハを処理対象としたときのサブルーチン 309の処理の 流れの一例について説明する。まず、図 4のステップ 402では、処理対象のウェハが ロットの m ( = 5)枚目以内である力否かが判断される。ここではまだ 3枚目なので、判 断は肯定され、ステップ 404に進む。
[0147] ステップ 404では、メモリ上のサンプル情報を参照する。このサンプル情報(サンプ ル数及びサンプルショットの配置)は、前回のサブルーチン 309でも更新されていな V、ので、ここでもデフォルトのサンプル情報がそのまま参照される。
[0148] 次に、ステップ 408において、 e.に分類される係数を事前知識により定められる定 数とするモデルを用いて、取得されたウェハマークの位置の実測値に基づいて、 a. 一 d.に分類される係数 (パラメータ)の値を算出し、ステップ 410において、そのとき の残差 Eを算出し、ステップ 412において AIC (M)を算出する。ここでも、事前知識と して記憶装置 47に記憶される、 e.に分類される係数の値に基づいて、例えば前回と 前々回の値の平均値をそのまま今回に e.に分類される係数の値として用いることが できる。
[0149] 次に、ステップ 414では、 EGAの統計モデルを、 a.、 c.に分類される係数をパラメ ータとし、 b.、d.、e. に分類される係数を事前知識に基づく値としたときの式 (6)の モデル式によって表現されるモデル M'として、最小二乗法により a.、c. に分類され る係数の値を算出して評価関数 (残差) Eの値を算出し、ステップ 416では、 AIC (M ' )の値を算出する。この時点では、 b.、 d.、 e.に分類される係数の事前知識として 、前回、前々回のサブルーチン 309のステップ 524 (図 5参照)において更新された b .、 d.、 e.の係数の値が記憶装置 47に記憶されており、ここでは、この事前知識の b .、 d.、 e.の係数の平均値を、今回の b.、 d.、 e.の係数の値として用いることがで きる。
[0150] 次に、図 5のステップ 502において、今回のステップ 412で求められたモデル Mの AIC (M)の値と、今回のステップ 416で求められたモデル M,の AIC (M,)との値を 比較し、 AIC (M' ) <AIC (M)であるか否かを判断する。ここでは、 b.、 d.に分類さ れる係数の事前知識に基づく値が、真のモデルの係数に収束してきて、判断が肯定 され、ステップ 504に進むものとして話を進める。
[0151] 次のステップ 504では、モデル M,の係数の値を、今回のウェハの露光処理のため にメモリに保持しておく。
[0152] 次に、ステップ 506では、今回の処理対象のウェハ W力 ロットの m( = 5)枚目以内 であるか否かが判断される。ここでは、まだロットの 3枚目なので、判断は肯定され、ス テツプ 524に進む。ステップ 524では、モデル M,の b.— e.の係数の値を事前知識 として記憶装置 47に記憶する。そして、ステップ 526では、全ショット領域 SAの中心
P
位置の算出、記憶装置 47への記憶が行われ、その後サブルーチン 309の処理を終 了する。
[0153] 以降、サブルーチン 309が実行される際には、処理対象のウェハがロットの m+ 1 (
=6)枚目のウェハとなるまで、すなわち、ステップ 402において判断が否定されるま で、ステップ 404—ステップ 416の処理が実行され、図 5のステップ 502が判断される 。そして、処理対象のウェハ Wのショット領域の配列力 過去の処理対象のウェハ W のショット領域の配列と同じ傾向を示している場合には、 AIC (M,)く AIC (M)となり 、判断が肯定され、ステップ 504においてモデル M'の係数カ モリ上に保持され、ス テツプ 506 (条件判断は当然肯定)が実行され、その後ステップ 524において、 a.、 c .の係数 (パラメータ)の値と、 b.、 d.、 e.の事前知識の基づく係数の値が、事前知 識として記憶装置 47に記憶され、さらにステップ 526が実行されて、サブルーチン 30 9を終了する力 処理対象のウェハのショット領域の配列力 過去の処理対象のゥェ ハのショット領域の配列と異なる場合には、 AIC (M,)≥ AIC (M)となって判断が否 定され、ステップ 510に進む。そして、ステップ 510においてモデル Mの残差 Eが所 定値より小さい場合には、モデル Mが最適モデルとして選択され、ステップ 512にお いて、モデル Mの係数の値が保持され、ステップ 524において事前知識として記憶 装置 47に格納されるが、モデル Mの残差 Eが所定値より大きい場合には、ステップ 5 16 (判断は否定)→ステップ 522が処理され、 a.— e.に分類される係数の値がパラ メータとして求め直されてメモリに保持され、ステップ 524において、その係数の値が 事前知識として記憶装置 47に記憶されるようになる。
[0154] このように、本実施形態では、ロットの先頭の m( = 5)枚目までは、モデルの最適化 に重点を置いた処理とし、モデルの係数の事前知識の値力 そのロットでの真のモデ ルの係数の値近傍に収束するまで、有効サンプル数をデフォルトの数 (例えば h= 3 0)に維持したままで EGAを行う。その処理中に、ほとんど値が変動しない e.に分類 されたショット内成分の係数の値力 1枚目のウェハの処理の時に求められ、 1枚目、 2枚目、…とウェハが処理されていくうちに、 b.— d. に分類される係数の値の事前知 識力 真のモデルの係数の値に収束するようになり、パラメータの自由度の小さいモ デル M,が選択されるようになる。そして、 4枚目以降のウェハの配列状態力 1一 3 枚目のウェハの配列状態とほぼ同じであれば、そのウェハを処理する際のサブルー チン 309では、常に、モデル M,が選択されるようになる力 4枚目以降のウェハの配 列が、 1一 3枚目のウェハの配列と若干異なっている場合には、モデル Mが選択され 、ノラメータとなったモデル Mの b.、 d.、 e.の係数が新たな事前知識として記憶装 置 47に累積記憶されていく。また、 4枚目以降のウェハの配列が、 1一 3枚目のゥェ ハの配列と著しく異なっている場合には、 b.— e.の係数が求め直され、新たな事前 知識として記憶装置 47に累積記憶されていく。
[0155] そして、処理対象のウェハがロット内 6枚目となると、サブルーチン 309においては 、ステップ 402における判断が否定され、ステップ 418に進む。ステップ 418では、そ のウェハ Wのサンプル情報を参照する。まだメモリに記憶されて 、るサンプル情報は 、デフォルトのままとなっているので、デフォルトのサンプル情報が取得される。
[0156] 次のステップ 420では、ステップ 406と同様に、そのサンプル情報にサンプルショッ トとして指定されているショット領域 SAに付設されたウェハマーク M のうち、計測対
i i,K
象となっている h個のウェハマークの位置が順次計測される。
[0157] 次のステップ 422では、モデル Mを、 a.、 b.に分類される係数をパラメータとし、 c 、 d.、 e.に分類される係数を事前知識により定められる定数としたモデルとし、取得 されたウェハマークの位置の実測値に基づいて、最小二乗法を用いて、 a.、b.に分 類される係数の値を算出し、ステップ 424では、求められた係数の値を改めて上記式 (6)に代入し、ウェハマークの予想位置を求め、求められた予想位置と、ウェハマー クの位置の実測値を上記式(7)の評価関数 Eに代入して、その値 (残差)を求める。 さらに、ステップ 426では、上記モデル (a.、b.に分類される係数をパラメータとし、 c .、d.、e.に分類される係数を事前知識に基づく値とした統計モデル Mとする)の AI C (M)を算出する。
[0158] 次のステップ 428では、 EGAの統計モデルを、上記式(6)のモデル式の a.の係数 をパラメータとし、 b.一 e.の係数の値を事前知識に基づく値としたときのモデル M, でのパラメータの値を最小二乗法により求め、モデル M,での評価関数 (残差) Eの値 を算出する。
[0159] 次に、ステップ 430では、上記統計モデル M,の AIC (M,)の値を算出する。
[0160] 以上述べたように、上記分類のように、ロット毎に推定、変更するパラメータ、すなわ ち d.に分類される係数がある場合には、モデル M、 M,のパラメータの自由度は、 ロット先頭 m枚目までとそれ以降とでは、異なったものとなり、 m+ 1枚目以降の方が 、各モデルの自由度が小さくなるように設定されている。
[0161] 次いで、図 5のステップ 502では、ステップ 426で求められたモデル Mの AIC (M) の値と、ステップ 430で求められたモデル M,の AIC (M,)との値を比較し、 AIC (M, )く AIC (M)であるか否かを判断する。ここで、処理対象のウェハの配列が、過去に 処理されたウェハの配列とほぼ同一であれば、 AIC (Μ' ) < AIC (M)となって判断 が肯定され、ステップ 504に進み、モデル M'が選択され、その係数カ モリ上に保 持される。
[0162] 次のステップ 506では、 6枚目のウェハなので、判断が否定され、ステップ 508に進 む。ステップ 508では、メモリ上のサンプル情報が更新される。ここまでくると、 b.— e . に分類される係数の事前知識の信頼性が増し、モデル M'が選択される状態に達 したと判断することができるため、有効サンプル数 (h= 30)を、デフォルトの大きいサ ンプル数から、例えば a.に分類される係数だけをパラメータしたときに高精度なァラ ィメント精度を十分確保できるような数まで小さくすることができる。例えば、この場合 、 a.に分類される係数が、ウェハのオフセット成分 Ox、 Oy、回転成分 Rx、 Ryである とすると、軸毎のパラメータの自由度は、 2となるので、有効サンプル数を軸毎に 3 (2 次元マークであれば 3つ、 1次元マークであれば 6つ)と設定することができる。ただし 、ここでは、 7枚目以降のウェハの配列が、過去のウェハの配列と異なっている場合 も考えられ、本実施形態では、そのような場合に対処するため、モデル M'の AIC (M ,)とともに、モデル Mの AIC (M)も算出している。したがって、ここでは、多少の余裕 を考慮して、有効サンプル数を、モデル Mの軸毎のパラメータ数 3に 1を足し、軸毎に 4以上(例えば 16)とする。なお、ここでは、 1一 30までの各有効サンプル数での計測 すべきウェハマークの数及び配置が予め最尤推定され、記憶装置 47に記憶されて いるものとし、有効サンプル数が更新された場合には、その自由度での情報(ウェハ マークの数及び配置)が記憶装置 47からメモリ上に読み出され、メモリ上のサンプル 情報がその情報に更新されるものとする。
[0163] このように、(m+ 1)枚目以降のウェハ Wでは、処理対象のウェハ Wに関し、ステツ プ 418—ステップ 430の処理が実行され、図 5のステップ 502が判断される。そして、 処理対象のウェハのショット領域の配列力 過去の処理対象のウェハ Wのショット領 域の配列と同じ傾向を示している場合には、 AIC (M' )く AIC (M)となり判断が肯定 され、ステップ 504 (モデル M,の選択)→ステップ 506 (条件判断は否定)→ステップ 508が実行され、さらにサンプル情報を、モデル Mのパラメータの自由度 + 1よりも小 さくならないことを限度として有効サンプル数が小さくなるようにする。そして、ステップ 524において、事前知識に基づく b.— d.の係数の値が、事前知識として記憶装置 4 7に記憶される。
[0164] 一方、処理対象のウェハ Wのショット領域の配列力 過去の処理対象のウェハ Wの ショット領域の配列と異なる場合には、 AIC (Μ' )≥ AIC (Μ)となり判断が否定され、 ステップ 510に進む。そして、ステップ 510では、モデル Μの残差が所定値より小さい 場合には、モデル Μが最適モデルとして選択され、ステップ 508では、有効サンプル 数を若干大きくするようにサンプル情報が更新され、ステップ 524において、そのモ デル Μにおける a. b.に分類される係数 (パラメータ)の値力 新たな事前知識として 他の係数 (定数)の値とともに、記憶装置 47に格納される(e.に分類される係数の値 はもともと事前知識に基づく値)。一方、ステップ 510において、モデル Mの残差が所 定値より大きい場合には、ステップ 516—ステップ 524が処理され、 a.— e.に分類さ れる係数の値がパラメータとして新たに求め直され、今回のウェハのモデルの係数と してメモリに保持され、 b. -e. に分類される係数の値が新たな事前知識として記憶 装置 47に記憶されるようになる。
[0165] なお、ステップ 516—ステップ 522を処理する場合には、メモリ上のサンプル情報に おける有効サンプル数力 a.、 b.の係数だけをパラメータとしたときのモデルのパラ メータの自由度に若干の余裕を持たせた程度の小さいサンプル数となっているので 、その有効サンプル数を、 a. — e.の係数をパラメータとしたときのモデルのパラメ一 タの自由度に応じた大きい数に更新する必要がある。そこで、ステップ 516における 判断が肯定され、ステップ 518において、 a. — e.の係数をパラメータとしたときのモ デルのパラメータの自由度 (軸毎に 6以上)に応じた有効サンプル数 (例えばデフォ ルトと同じ 30)となるようにメモリ上のサンプル情報を更新する。
[0166] 次のステップ 520にお!/、て、更新されたサンプル情報に基づ 、て、追加サンプルシ ヨットを計測する。そして、ステップ 522において、今回計測されたウェハマークの位 置の実測値に基づいて a. — e.に分類された係数 (パラメータ)の値を求め、ステップ 524において、今回求められた a. — e. に分類された係数が事前知識に反映される 。さらに、ステップ 526において、全ショット領域の基準位置の算出、記憶装置 47へ の記憶が行われ、その後サブルーチン 309の処理を終了する。
[0167] このように、図 3のステップ 323における判断が肯定されるまで、上述したようなサブ ルーチン 309を含む、ステップ 307—ステップ 323のループ処理が、ロット内のゥェ ハそれぞれを処理対象として順次実行される。この間、サブルーチン 309において、 処理対象となるウェハの配列状態に応じて、適宜、モデルのパラメータ自由度及び 有効サンプル数が、その都度、動的に最適化される。
[0168] なお、本実施形態において説明した 1枚目、 2枚目、 3枚目のウェハを処理対象と するサブルーチン 309の処理の流れは、あくまでも一例である。すなわち、そのゥェ ハの配列が事前知識に良く従っているときには、 1枚目のウェハを処理対象としたと きでも、ステップ 502、ステップ 510における判断が肯定され、モデル M、 M'が選択 される場合もあるし、 2枚目のウェハを処理対象としたときでも、ステップ 502の判断が 肯定されたり、ステップ 510の判断が否定されたりする場合もあり、 3枚目のウェハを 処理対象としたときでも、ステップ 502の判断が否定されたり、ステップ 510の判断が 否定されたりする場合もある。いずれの場合でも、本実施形態においては、ウェハを 順次処理していくうちに事前知識が累積され、モデルのパラメータの自由度の最適 化が実現されるようになる。
[0169] また、本実施形態では、 m= 5とした力 これは任意の値で良い。この mは、そのロッ トのモデル M'の係数の事前知識が十分得られるように設定されて!、るのが望ま ヽ 。例えば、 1回でそれらの事前知識が十分取得できるようになっているとすれば、 m= 1であっても良い。
[0170] また、本実施形態では、ロット内 m枚目までは、有効サンプル数の最適化を行わな いようにしたが、ステップ 506の判断を省略して、ロット内 m枚目以内でも、有効サン プル数を更新できるようにしても良 、。
[0171] また、本実施形態では、サブルーチン 309において、第 1の回帰モデルとしてのモ デル Mの残差が所定値より小さいか否かを判断することにより、第 1の回帰モデル( モデル M)と、上記式(6)のすベての係数をパラメータとする第 3の回帰モデルの!/ヽ ずれを選択するかを決定した力 この判断を行わずに、第 3の回帰モデルの AICも 併せて算出し、モデル Mの AICと比較し、その値が小さい方を選ぶようにしても良い 。しかしながら、この場合には、ウェハマークの有効サンプル数を、パラメータの自由 度が大きい第 3の回帰モデルに応じた自由度とする必要があるため、サンプル数が 大きくなる傾向があるので、やはり上記サブルーチン 309のようにするのがより望まし い。
[0172] また、本実施形態では、事前知識として得られたその係数の過去の値の平均値を、 その係数の代表値として設定したが、直前 (又は直近の数枚)のウェハを処理したと きの係数の値を代表値としてそのまま用いるようにしても良 、。複数枚でのウェハを 処理したときの係数の値を、今回の係数の値に反映する場合には、その係数の値を それぞれ重み付けするようにしても良い。例えば、最近の事前知識の値に対する重 みを最も重くしたり、残差が小さ力つたウェハでの事前知識の値に対する重みを最も 重くしたりするようにしても良い。
[0173] これまでの説明から明らかなように、本実施形態では、主制御装置 20の記憶装置 4 7及びメモリにより、記憶装置が構成されている。また、本実施形態では、主制御装置 20が、本発明の位置検出装置の選択装置、算出装置、更新装置、最適化装置、決 定装置に対応している。すなわち、主制御装置 20の CPUが行う、ステップ 402—ス テツプ 430 (図 4)及びステップ 502、ステップ 504、ステップ 510、ステップ 512、ステ ップ 522 (図 5)の処理によって選択装置の機能が実現され、ステップ 526 (図 5)の処 理によって算出装置の機能が実現され、ステップ 506、ステップ 508、ステップ 516— ステップ 520、ステップ 524 (図 5)の処理によって、更新装置の機能が実現されてい る。また、ステップ 402—ステップ 430 (図 4)、ステップ 502—ステップ 504、ステップ 5 10、ステップ 512、ステップ 522、ステップ 524 (図 5)の処理によって、最適化装置の 機能が実現され、ステップ 506、ステップ 508、ステップ 516、ステップ 518、ステップ 520 (図 5)の処理によって決定装置が実現されている。し力しながら、本発明がこれ に限定されるものではないことは勿論である。
[0174] 以上詳細に述べたように、本実施形態の位置検出方法によれば、パラメータの自 由度が大きいモデルを選択する傾向が強くならないようにモデル推定の偏りが補正さ れ、学習誤差に左右されず、汎化誤差を小さくできるモデルを最も尤もらしいモデル として選択することができる規準である AICを用い、パラメータの自由度がそれぞれ 異なる幾つかの回帰モデル(モデル M、 M,等)の AICに基づいて、ウェハ W上の複 数のショット領域 SAの配列に関する最も尤もらしい回帰モデルが選択される。これ
P
により、真のモデルに最も近いモデルが選択されるようになるため、複数のショット領 域 SAの中心位置の位置情報を精度良く算出することができる。
P
[0175] また、本実施形態によれば、複数のウェハ Wを順次検出対象とする際に、ウェハ毎 にサブルーチン 309のモデルのパラメータ及び有効サンプル数の最適化が繰り返し 実行される。そして、サブルーチン 309において、ウェハ Wのショット領域 SAの位置
P
情報を順次検出する度に得られる複数のショット領域 SAに関する回帰モデル (上記
P
式 (6) )の係数に関する事前知識と、ステージ座標系における、今回の位置情報の 検出対象となるウェハ Wの複数のショット領域 SAのうちの幾つかのショット領域 SA
P i に付設されたウェハマーク M の位置情報の実測値 (h個)とに基づ 、て、回帰モデ
i,K
ルのパラメータの自由度に応じた AICに基づいて、回帰モデルのパラメータの自由 度を最適化する。そして、最適化されたパラメータの自由度に基づいて、次回の位置 情報の検出対象となるウェハ Wにおける各ショット領域 SAに付設されたウェハマー
P
クの実測値の有効サンプル数を決定する。このようにすれば、最適化されるパラメ一 タの自由度に応じてウェハマーク M の位置の実測値の有効サンプル数を増減する
i,K
ことができるため、各ショット領域 SAの基準位置を短時間に、かつ精度良く検出する
P
ことができる。
[0176] また、本実施形態の露光装置 100によれば、元工程の複数のショット領域 SAの基
P
準位置が高精度に検出されるため、短時間かつ高精度な重ね合わせ露光を実現す ることがでさる。
[0177] また、上記実施形態では、パラメータの自由度が異なるモデルの比較に AICを用 いたが、他の規準、例えばベイジアン情報量規準(Bayesian Information Criterion : B IC)を用いるようにしても良い。上述した統計モデル Mの BICは、次式で表される。
[0178] [数 12]
BIC ^ -2 - log L + d - log n - - -(12) このように、 BICは、ペナルティ項である第 2項力 AICと異なる。すなわち AICは、 第 2項が 2dであるのに対し、 BICは d'lognとなっている。 nは有効サンプル数である 。したがって、 BICは、 AICよりもペナルティが大きくなるように設定されており、ノラメ ータ数の多い統計モデルを選択する傾向が低減されるように設定されている。
[0179] なお、 AIC、 BICはともに、正則モデルにおいてサンプル数が十分大きいときに、 母集団に対するモデルの汎化誤差、あるいは対数尤度に漸近するものとして導出さ れたものである。線形回帰モデルは、正則モデルであるため、これらの評価規範を用 V、ることが妥当であると 、える。
[0180] ただし、上記実施形態にお!、ては、スループットとのかねぁ 、から、回帰分析を行う ためのサンプル数が小さいため、上記漸近論の適用が妥当であるとは必ずしもいえ ない。そこで、上記 AIC及び BICを一般ィ匕したペナルティ付き対数尤度を次式のよう に定義し、これを最良とするモデルを選択するのがより好まし 、。
[0181] [数 13] PL = logZ - { del,n) - d …ひ 3) ここで、 PLはペナルティ付き対数尤度である。第 1項の符号が、 AIC及び BICと逆 になっているのは、 PL力 大きい方を良好であると評価する式であるためである。 PL における第 2項は、 AICや BICと同じようにペナルティ項であり、 β (model, n) = 2と おけば、 PLは AICとなり、 β (model, n) =lognとおけば、 BICとなる。 βの値は、シ ミュレーシヨン等によって決定することができる力 必要に応じて追加するパラメータ の種類 (すなわち、 model)とサンプル数 (すなわち n)に依存した関数とすることがで きる。例えばこのような関数の一例としては、パラメータの増大に対する残差の変化量 の期待値を採用することができる。例えば、第 1の回帰モデルと、第 3の回帰モデルと を比較する場合には、 e.に分類される係数を事前知識に基づく値としたときのモデ ルでの残差と、 e.に分類される係数までもパラメータとしたときの残差との差分の期 待値をとり、その値を j8とするようにすればよい。このようにすれば、最もフィッティング するモデルでは、その残差がその前後のモデルのそれよりも極端に小さくなつており
、上記差分の期待値が負側に極大になっていると考えられるため、 PLの値が大きく なり、そのモデルが選択されやすくなるからである。なお、線形回帰モデルは正則で あるが、これは、より大きい自由度のモデルを評価する際に、追加するパラメータの順 番 (優先順位)があらかじめ決定されて ヽる場合である。サンプル数が小さ!/ヽ問題は ある力 AIC, BICを使用することの妥当性を保証するために、上記実施形態では追 加するパラメータの順番を予め決定している。追加するパラメータを自由に取り替え るような場合には、回帰モデルは非正則となり、 AIC, BICの妥当'性はなくなるが、ぺ ナルティ付き対数尤度を用いる場合には、非正則性に見合った j8を使用すれば、パ ラメータの優先順位を特に指定する必要はな 、。 また、上記実施形態では、残差を上記式(7)で示される評価関数 E、すなわち二乗 誤差をサンプル数で除算したもので表現したが、本発明はこれに限定されない。例 えば、残差が正規分布に従うとしたときの、サンプル数カゝらパラメータの自由度を減 算して得られる残差の分散の不偏推定値、あるいは二乗誤差そのものではな ヽ(二 乗誤差自体は、サンプル数に応じて増減するので適当でない)、残差を表現するの に妥当なもののいずれでも良い。
[0183] また、上記実施形態では、 1ロット内でのモデルパラメータの最適化について説明し た力 同一プロセスを経た複数のロットにおいて、モデル式の係数の事前知識を共有 することも可能である。例えば同一プロセスを経た複数のロットを処理する場合には、 前回処理したロットに関するパラメータの事前知識を記憶装置 47に記憶しておき、今 回のロットのパラメータのデフォルトの事前知識として用いるようにすれば良 、。
[0184] また、上記実施形態では、あるモデル (モデル M)を基準として、そのモデルよりパ ラメータの自由度が小さいモデルと、大きいモデルと 3つのモデルの確からしさを比 較することにより、最適なモデルを選択した力 本発明はこれに限定されるものではな ぐ 4つ以上のモデルを比較するようにしても構わない。例えば、 4つ以上のモデルに つ!、てそれぞれ AICの値を算出し、値が最小のモデルを選択するようにすれば良!ヽ
[0185] また、 4つ以上のモデルが適用可能である場合には、上記実施形態と同様に、パラ メータの自由度が最小のモデルをモデル M,とし、 2番目に小さいモデルをモデル M として、その他の複数のモデルを第 3の回帰モデルとして、モデルの最適化を行って も良い。この場合には、第 3の回帰モデルが複数存在するようになるため、ステップ 5 10での判断が否定された場合には、その複数の第 3の回帰モデルについてそれぞ れ AICの値を求め、その値が最小のモデルを選択すれば良!、。
[0186] また、上記実施形態では、 6点の EGAパラメータにカ卩え、ショット成分をも考慮した モデル式についての最適化であった力 本発明はこのモデル式には限定されない。 例えば、ショット領域の配列の 1次成分だけでなぐ 2次以上の高次成分をも考慮した モデルを適用することもできる。このモデルでは、上記式 (4)の(DX、 DY)を次式の( DX'、 DY,)に、置き換えたモデルとなる。
[0187] [数 14]
DX + ax - (DX)2 + a2 . (DX , DY)2 + α3 , (DY)2 + -
•(14)
Figure imgf000047_0001
DY + β, - (DXf + β2 · {DX . DY)2 + β3 - (DY)2 + , 上記モデルでは、上記 6つの EGAパラメータに加え、係数 α 、 α 、 α 、 · · ·、 β 、
1 2 3 1 β 、 β …、が未知パラメータとなる。なお、このパラメータも、一般的にはロット内での
2 3 変動が小さいと考えられるので、 d.又は e.に分類されるのが望ましい。
[0188] したがって、高次成分も考慮する場合には、上記高次成分を含むモデルと、上記 実施形態で使用されたショット内成分を考慮したモデルと、または高次成分と、ショッ ト内成分との両方を含むモデルとをそれぞれ第 3の回帰モデルとすることができる。
[0189] また、上記実施形態では、 EGAの回帰モデルを上記式 (6)に基づくモデルとした 力 上記式 (4)に基づくものであっても構わない。この他、直交度誤差 Wや残留回転 誤差 Θ等を係数とする上記式 (2)に基づくモデルとしても構わない。この場合、残留 回転誤差 Θは、 a.に分類されるのが望ましいが、直交度誤差 Wは、元工程のレイヤ をどの露光装置で露光したかに依存し、ロット内では変動が少ないと考えられるので 、 c又は d.に分類されるのが妥当であると考えられる。
[0190] なお、この直交度誤差 Wを係数とするモデルを選択した場合、事前知識に基づく 値と、今回のウェハマークの計測により得られたパラメータの値が著しく異なる場合に は、今回の処理対象のウェハの元工程のレイヤを露光した露光装置力 過去のゥェ ハのそれとは異なっている可能性が高い。この場合には、上記高次成分や、ショット 内成分についても大きく変化していることが考えられるため、それらの成分に関する 係数を、無条件にパラメータとするようにしても良い。このように、係数によっては、そ の係数の変化が、他の係数の変化との関連性が深いものもあるため、その関連性を 利用すれば、モデルのパラメータの最適化をさらに効率の良いものにすることができ る。
[0191] また、上記実施形態では、事前知識として記憶装置 47に記憶された係数の値の平 均値を、その係数の値として設定したが、これには限定されず、過去に得られたその 係数での幾つ力パラメータの値の変化量(ローノ ス処理等で平滑ィ匕されて 、るのが 望ま 、)などから、今回処理対象となって!/、るウェハでの係数の値を予想するように しても良い。
[0192] また、上記実施形態では、 h個のウェハマークを全て用いて、 EGAモデル式の係 数を求めたが、 h個のウェハマークのうち、その位置が、ショット配列モデルに対し著 しくずれているみなせるものに対しては、そのマークの実測値を、サンプル結果からリ ジェタトするようにしても良い。しかしながら、リジェクト後でも、ウェハマークの有効サ ンプル数は、モデルのパラメータの自由度よりも大きくなければならないことはいうま でもない。実測値をリジェクトする方法としては、種々の方法を適用することができる 力 上記 AICを用いた方法も適用することができる。また、計測値を完全にリジェクト せずに、各計測値の正常値の分布を示す確率密度分布関数や異常値の分布を示 す確率密度分布関数の線形結合から成る混合分布モデルを考慮して、各計測値の 正常度、異常度を考慮しつつ、上記最適化を実行するようにしても良い。
[0193] まだ、上記実施形態では、モデル Mとモデル M'との 、ずれを選択するかは、上記 規準 (ペナルティ付き対数尤度)により判断した。この規準による判定は、統計的な妥 当性に基づく判定であるといえる力 ウェハァライメントにおいて最も重要な点は、ァ ライメント精度をできるだけ良好に、すなわち残差をできるだけ小さくするというのが最 終目的である。そこで、例えば、モデル M,が選択された場合でも、そのモデル M,で の評価関数 Eの値に閾値を設定し、 Eがその値よりも大きい場合には、さらに、サンプ ルショットのウェハマークの追加計測を行って、モデル Mとモデル M,とを比較し直す ようにしても良ぐモデル Mやモデル M'とは異なる新たなモデルを設定し、新たなモ デルでのペナルティ付き対数尤度による評価、残差の判定を行うようにしても良 ヽ。
[0194] また、上記実施形態では、パラメータの自由度が異なるモデルの中から、各モデル のペナルティ付き対数尤度に基づいて、最適なモデルを選択した力 これには限定 されず。モデルの各係数の値を、ペナルティ付き対数尤度の比によって重み付け平 均して得られる値を、そのモデル式の係数の値として推定するようにしても良い。例え ば、上記モデル Mのある係数のパラメータの値とモデル M,でのその係数の事前知 識に基づく値とを、 AIC (M)と AIC (Μ' )との逆数の比で重み付け平均することにより 得られる値を、その係数の値とすることができる。すなわち、この場合、この係数の値 は、事前知識に基づく値を、今回のサンプルショットのウェハマークの計測値に基づ いて修正したものとみなすことができる。また、この重み付け平均により求められた係 数の値を用いたときのモデル式での残差 Εをさらに求めて、そのモデルでの AICを算 出し、モデル Μ,の AIC (M,)又はモデル Μの AIC (M)と比較し、 3つのモデルの中 で最良なモデルを選択するようにしても良い。なお、上記重み付けを行う場合、ゥェ ハ毎のパラメータの急峻な変化に対応するためには、ノ ラメータの増加に対するぺ ナルティの変化が小さい規準を用いるのが望ましい。その点では、 BICよりも AICを 用いる方が良い。
[0195] また、上記実施形態では、 EGA方式のモデル式の係数を a. — e.に分類したが、 これには限られない。例えば、プロセス毎に推定、変更する係数、製品の種類毎に推 定、変更する係数、または定期的に推定、変更する係数など、種々のカテゴリに分類 することができる。また、同じカテゴリに分類されたパラメータ同士にも優先順位を設 け、その順番で、徐々にパラメータの自由度を増減させるようにしても良い。また、 EG A方式のモデル式の係数を特に分類せず、すべての係数に対し優先順位を付与し 、その順番に従って、パラメータの自由度を増減させるようにしても良いことは勿論で ある。なお、この優先順位を定めるにあたっては、やはりその係数が高次成分のもの まで含まれる場合には、高次になればなるほど優先順位を下げる(事前知識のものを 用いやす 1、ように設定する)のが望ま 、。
[0196] また、本発明は、評価されるモデルのパラメータの自由度に応じた適切な有効サン プル数でサンプルショットのウェハマークを計測するものである力 上記実施形態で は、パラメータの自由度が異なる複数のモデルについて、それぞれのパラメータの自 由度に応じた有効サンプル数に基づくサンプルショットのウェハマークの数及び配置 が予め求められており、記憶装置 47に記憶されているものとし、最も尤もらしいモデ ルが選択されると、そのモデルのパラメータの自由度に応じた適切な有効サンプル 数を満たすサンプルショットのウェハマークの数及び配置に関する情報を記憶装置 4 7から読み取って、その読み取った内容をメモリ上に書き込むことにより、メモリ上のサ ンプル情報を更新するものとした。
[0197] 所定の有効サンプル数に基づくウェハマークの数及び配置に関する情報の作成 方法としては、種々の方法を採用することが可能である。例えば、上記実施形態のよ うに、図 2に示されるようなウェハでは、ウェハマークは 4N個存在する。この 4N個の ウェハマークの中から、 h個のウェハマークを選ぶときの組合せは C通りある。そこ
4N h
で、その組合せ各々について全ショット領域の重ね合わせ誤差の期待値及び標本分 散を推定し、その推定値が良好 (最小)であった組合せを、その有効サンプル数での サンプルショットの数及び配置とするようにしても良い。なお、この全ショット領域の重 ね合わせ誤差の期待値及び標本分散は、選択されたモデルでの各係数の最尤推定 値を求める必要がある力 モデルの各係数の最尤推定値は、そのウェハマークの設 計位置と、経験的に求められている、そのウェハマークでの設計位置と実測位置との 差分の誤差分布の標準偏差とを用いて、最小二乗法での評価関数を最小とする条 件式に基づ 、て作成される、 V、わゆる正規方程式から求めることができる。
[0198] 上記実施形態では、露光動作を行う前に、サンプルショットの数及び配置を上記方 法などで求めておくとした力 上記露光動作中のサブルーチン 309において、上記 最尤推定方法を実施して、サンプルショットの数及び配置の最適化をリアルタイムに 行うようにしても良い。
[0199] また、上記実施形態では、ァライメント検出系 ASとして、 FIA方式のァライメントセン サを用いたが、前述したように、レーザ光をウェハ W上の点列状のァライメントマーク に照射し、そのマークにより回折又は散乱された光を用いてマーク位置を検出する L S A (Laser Step Alignment)方式のァライメントセンサや、そのァライメントセンサと上 記 FIA方式とを適宜組み合わせたァライメントセンサにも本発明を適用することは可 能である。また、例えばコヒーレントな検出光を被検面のマークに照射し、そのマーク から発生する 2つの回折光 (例えば同次数)を干渉させて検出するァライメントセンサ を、単独で、あるいは上記 FIA方式、 LSA方式などと適宜組み合わせたァライメント センサに本発明を適用することは勿論可能である。
[0200] なお、ァライメント検出系はオン.ァクシス方式(例えば TTL (Through The Lens)方 式など)でも良い。また、ァライメント検出系は、ァライメント検出系の検出視野内にァ ライメントマークをほぼ静止させた状態でその検出を行うものに限られるものではなく 、ァライメント検出系力 照射される検出光とァライメントマークとを相対移動させる方 式であっても良い(例えば前述の LSA系や、ホモダイン LIA系など)。かかる検出光 とァライメントマークとを相対移動させる方式の場合には、その相対移動方向を、前述 の各ァライメントマークを検出する際のウェハステージ WSTの移動方向と同一方向と することが望ましい。
[0201] また、上記実施形態では、本発明がステップ'アンド'スキャン方式の走査型露光装 置に適用された場合について説明したが、本発明の適用範囲がこれに限定されない のは勿論である。すなわち、ステップ'アンド'リピート方式、ステップ'アンド'ステイツ チ方式、ミラープロジェクシヨン'ァライナー、及びフォトリピータなどにも好適に適用 することができる。さらに、投影光学系 PLは、屈折系、反射屈折系、及び反射系のい ずれでもよいし、縮小系、等倍系、及び拡大系のいずれでも良い。この他、例えば国 際公開 WO99Z49504号などに開示される、投影光学系 PLとウェハとの間に液体 が満たされる液浸型露光装置などにも本発明を適用しても良い。
[0202] さらに、本発明が適用される露光装置の光源は、 KrFエキシマレーザや ArFエキシ マレーザ、 Fレーザとした力 他の真空紫外域のパルスレーザ光源であっても良い。
2
この他、露光用照明光として、例えば、 DFB半導体レーザ又はファイバーレーザから 発振される赤外域、又は可視域の単一波長レーザ光を、例えばエルビウム(又はェ ルビゥムとイッテルビウムの両方)がドープされたファイバーアンプで増幅し、非線形 光学結晶を用いて紫外光に波長変換した高調波を用いても良い。
[0203] なお、複数のレンズから構成される照明光学系、投影光学系、並びにァライメント検 出系 ASを露光装置本体に組み込み、光学調整をするとともに、多数の機械部品か らなるレチクルステージやウェハステージを露光装置本体に取り付けて配線や配管 を接続し、更に総合調整 (電気調整、動作確認等)をすることにより、上記実施形態 の露光装置を製造することができる。なお、露光装置の製造は温度およびクリーン度 等が管理されたクリーンルームで行うことが望ましい。
[0204] なお、本発明は、半導体製造用の露光装置に限らず、液晶表示素子などを含むデ イスプレイの製造に用いられる、デバイスパターンをガラスプレート上に転写する露光 装置、薄膜磁気ヘッドの製造に用いられるデバイスパターンをセラミックウェハ上に 転写する露光装置、撮像素子 (CCDなど)、有機 EL、マイクロマシン及び DNAチッ プなどの製造に用いられる露光装置などにも適用することができる。また、半導体素 子などのマイクロデバイスだけでなぐ光露光装置、 EUV露光装置、 X線露光装置、 及び電子線露光装置などで使用されるレチクル又はマスクを製造するために、ガラス 基板又はシリコンウェハなどに回路パターンを転写する露光装置にも本発明を適用 することができる。ここで、 DUV (遠紫外)光や VUV (真空紫外)光などを用いる露光 装置では一般的に透過型レチクルが用いられ、レチクル基板としては石英ガラス、フ ッ素がドープされた石英ガラス、ホタル石、フッ化マグネシウム、又は水晶などが用い られる。また、プロキシミティ方式の X線露光装置、又は電子線露光装置などでは透 過型マスク (ステンシルマスク、メンブレンマスク)が用いられ、マスク基板としてはシリ コンウェハなどが用いられる。
[0205] また、本発明に係る位置検出方法は、露光装置に限らず、物体に形成されている 何らかの複数のマークの中から、幾つかのマークを選択して検出する必要がある装 置であれば、適用が可能である。
[0206] 《デバイス製造方法》
次に、上述した露光装置 100をリソグラフィ工程で使用したデバイスの製造方法の 実施形態について説明する。
[0207] 図 6には、デバイス (ICや LSI等の半導体チップ、液晶パネル、 CCD,薄膜磁気へ ッド、マイクロマシン等)の製造例のフローチャートが示されている。図 6に示されるよう に、まず、ステップ 601 (設計ステップ)において、デバイスの機能 ·性能設計 (例えば 、半導体デバイスの回路設計等)を行い、その機能を実現するためのパターン設計 を行う。引き続き、ステップ 602 (マスク製作ステップ)において、設計した回路パター ンを形成したマスクを製作する。一方、ステップ 603 (ウェハ製造ステップ)において、 シリコン等の材料を用いてウェハを製造する。
[0208] 次に、ステップ 604 (ウェハ処理ステップ)において、ステップ 601—ステップ 603で 用意したマスクとウェハを使用して、後述するように、リソグラフィ技術等によってゥェ ハ上に実際の回路等を形成する。次いで、ステップ 605 (デバイス組立てステップ)に おいて、ステップ 604で処理されたウェハを用いてデバイス組立てを行う。このステツ プ 605には、ダイシング工程、ボンディング工程、及びパッケージング工程 (チップ封 入)等の工程が必要に応じて含まれる。
[0209] 最後に、ステップ 606 (検査ステップ)にお 、て、ステップ 605で作成されたデバイス の動作確認テスト、耐久テスト等の検査を行う。こうした工程を経た後にデバイスが完 成し、これが出荷される。
[0210] 図 7には、半導体デバイスにおける、上記ステップ 604の詳細なフロー例が示され ている。図 7において、ステップ 611 (酸化ステップ)においてはウェハの表面を酸化 させる。ステップ 612 (CVDステップ)においてはウェハ表面に絶縁膜を形成する。ス テツプ 613 (電極形成ステップ)においてはウェハ上に電極を蒸着によって形成する 。ステップ 614 (イオン打ち込みステップ)においてはウェハにイオンを打ち込む。以 上のステップ 611—ステップ 614それぞれは、ウェハ処理の各段階の前処理工程を 構成しており、各段階において必要な処理に応じて選択されて実行される。
[0211] ウェハプロセスの各段階において、上述の前処理工程が終了すると、以下のように して後処理工程が実行される。この後処理工程では、まず、ステップ 615 (レジスト形 成ステップ)において、ウエノ、に感光剤を塗布する。引き続き、ステップ 616 (露光ス テツプ)において、上記実施形態の露光装置 100を用いてマスクの回路パターンをゥ ェハに転写する。次に、ステップ 617 (現像ステップ)においては露光されたウェハを 現像し、ステップ 618 (エッチングステップ)において、レジストが残存している部分以 外の部分の露出部材をエッチングにより取り去る。そして、ステップ 619 (レジスト除去 ステップ)において、エッチングが済んで不要となったレジストを取り除く。
[0212] これらの前処理工程と後処理工程とを繰り返し行うことによって、ウェハ上に多重に 回路パターンが形成される。
[0213] 以上説明した本実施形態のデバイス製造方法を用いれば、露光工程 (ステップ 61 6)において上記実施形態の位置検出方法が適用可能な露光装置 100が用いられ るので、高精度な露光を実現することができる。この結果、より高集積度のデバイスの 生産することが可能になる。
産業上の利用可能性
[0214] 本発明の位置検出方法及び装置は、物体の位置合わせをするための位置情報の 検出に適している。また、本発明の露光装置及び方法は、半導体素子、液晶表示素 子等を製造するためのリソグラフイエ程に適している。また、本発明のデバイス製造方 法は、マイクロデバイスの生産に適している。

Claims

請求の範囲
[1] 物体上に配置された複数の区画領域の位置情報を検出する位置検出方法であつ て、
所定の座標系における前記複数の区画領域のうちの少なくとも一部の区画領域の 位置情報の実測値に基づ 、て、前記複数の区画領域の配置に関するモデルを決定 する第 1工程と;
前記決定されたモデルに基づいて、前記複数の区画領域の位置情報を算出する 第 2工程と;を含む位置検出方法。
[2] 請求項 1に記載の位置検出方法において、
前記第 1工程は、
前記少なくとも一部の区画領域の位置情報の実測値に基づいて、前記位置情報を 計測する区画領域を決定する工程を含むことを特徴とする位置検出方法。
[3] 請求項 2に記載の位置検出方法において、
前記第 1工程では、
前記少なくとも一部の区画領域の位置情報の実測値に基づ!、て、前記モデルのパ ラメータの自由度を決定し、前記決定されたモデルのパラメータの自由度に基づいて 、追加計測する区画領域を決定することを特徴とする位置検出方法。
[4] 物体上に配置された複数の区画領域の位置情報を検出する位置検出方法であつ て、
所定の座標系における前記複数の区画領域のうちの幾つかの区画領域の位置情 報の実測値を用いて、パラメータの自由度がそれぞれ異なる幾つかの、前記複数の 区画領域に関する回帰モデルにっ ヽてそれぞれ、そのモデルの所定の評価規範の 値を算出し、その算出結果に基づいて、前記複数の区画領域に関する回帰モデルと して前記評価規範において最適と判断されたモデルを選択する第 1工程と; 前記選択された回帰モデルに基づいて、前記複数の区画領域の位置情報を算出 する第 2工程と;を含む位置検出方法。
[5] 請求項 4に記載の位置検出方法において、
前記評価規範において最適なモデルとして選択された回帰モデルのパラメータの 値を、前記回帰モデルを規定する係数に関する事前知識に反映する第 3工程をさら に含み、
前記複数の区画領域が形成された複数の前記物体について、位置情報の検出対 象となる物体を順次変更しながら、前記第 1工程と、前記第 2工程と、前記第 3工程と を繰り返すことを特徴とする位置検出方法。
[6] 請求項 5に記載の位置検出方法において、
前記第 3工程では、
前記評価規範における最適なモデルとして選択された回帰モデルの確力 しさを 評価するのに十分な数となるように、前記各区画領域の位置情報の実測値のサンプ ル数を更新することを特徴とする位置検出方法。
[7] 請求項 5に記載の位置検出方法において、
前記第 1工程では、
ノ ラメータの自由度が所定の大きさである第 1の回帰モデルと、該第 1の回帰モデ ルよりもパラメータの自由度が小さい第 2の回帰モデルと、前記第 1の回帰モデルより もパラメータの自由度が大きい第 3の回帰モデルとの中から、前記評価規範における 最適なモデルを選択することを特徴とする位置検出方法。
[8] 請求項 5に記載の位置検出方法において、
前記第 1工程では、
ノ ラメータの自由度が所定の大きさである第 1の回帰モデルの前記評価規範の値 よりも、該第 1の回帰モデルよりもパラメータの自由度が小さい第 2の回帰モデルの前 記評価規範の値の方が良好である場合には、前記第 2の回帰モデルを前記評価規 範における最適なモデルとして選択し、
前記第 1の回帰モデルが前記第 2の回帰モデルよりも前記評価規範の値が良好で 、かつ、前記第 1の回帰モデルにおける尤度が所定の値より良好な場合には、前記 第 1の回帰モデルを前記評価規範における最適なモデルとして選択し、
前記第 1の回帰モデルが前記第 2の回帰モデルよりも前記評価規範の値が良好で 、かつ、前記第 1の回帰モデルにおける尤度が所定の値より良好でない場合には、 前記第 1の回帰モデルよりもパラメータの自由度が大きい第 3の回帰モデルを、前記 評価規範における最適なモデルとして選択することを特徴とする位置検出方法。
[9] 請求項 8に記載の位置検出方法において、
前記第 1工程では、
前記第 3の回帰モデルが前記評価規範における最適なモデルとして選択された場 合には、前記区画領域の位置情報の実測値のサンプル数が、前記第 3の回帰モデ ルの確力 しさを評価するのに十分となるように、さらに計測対象とする区画領域を追 加し、
前記追加された区画領域の位置情報の実測値の計測を行った後で、前記第 3の回 帰モデルのパラメータの値を算出することを特徴とする位置検出方法。
[10] 請求項 9に記載の位置検出方法において、
前記第 3の回帰モデルが選択され、かつ、前記第 3の回帰モデルが複数有る場合 には、前記評価規範の値が最も良好な第 3の回帰モデルを、前記評価規範における 最適なモデルとして選択することを特徴とする位置検出方法。
[11] 請求項 7に記載の位置検出方法において、
物体間の値の変動が大きいと予想される回帰モデルの係数を、前記第 1、第 2、第 3の回帰モデルではパラメータとし、
物体間の値の変動が比較的小さいと予想される回帰モデルの係数を、前記第 1、 第 3の回帰モデルではパラメータとする一方、前記第 2の回帰モデルでは前記事前 知識に基づ 、て定められる定数とし、
全ての物体で、値がほぼ同一であると予想される回帰モデルの係数を、前記第 1、 第 2の回帰モデルでは、前記事前知識に基づいて定められる定数とする一方、前記 第 3の回帰モデルではパラメータとすることを特徴とする位置検出方法。
[12] 請求項 11に記載の位置検出方法にぉ 、て、
位置情報の検出対象となる複数の物体のその処理単位における処理数が所定数 に満たない場合には、前記処理単位間の値の変動が大きいと予想される係数を、前 記第 1、第 3の回帰モデルではパラメータとする一方、前記第 2の回帰モデルでは前 記事前知識に基づ 、て定められる定数とし、
前記処理数が所定数を超えた場合には、その係数を、前記第 1、第 2の回帰モデ ルでは前記事前知識に基づいて定められる定数とする一方、前記第 3の回帰モデル ではパラメータとすることを特徴とする位置検出方法。
[13] 請求項 4に記載の位置検出方法において、
前記各回帰モデルの尤度は、その回帰モデルにより得られる前記所定の座標系に おける前記各区画領域の位置情報と、前記位置情報の実測置との残差によって推 定されることを特徴とする位置検出方法。
[14] 請求項 13に記載の位置検出方法において、
前記各回帰モデルのパラメータとして、前記所定の座標系と、前記複数の区画領 域の配置によって規定される配列座標系とのずれを示す 1次成分の係数と、各区画 領域の成分の設計値からのずれを示す係数と、前記複数の区画領域の配置に関す る高次成分を示す係数との少なくとも一部が含まれることを特徴とする位置検出方法
[15] 請求項 4に記載の位置検出方法において、
前記評価規範を、モデルのパラメータの自由度に応じたペナルティが付与された尤 度である規準とすることを特徴とする位置検出方法。
[16] 請求項 15に記載の位置検出方法において、
前記規準を、赤池情報量規準及びベイジアン情報量規準の!/、ずれか一方とし、 その値が小さいモデルを良好なモデルとすることを特徴とする位置検出方法。
[17] 請求項 15に記載の位置検出方法において、
前記ペナルティを、その回帰モデルのパラメータの自由度の増加に対する尤度の 変化の期待値と、その回帰モデルのパラメータの自由度との積とし、
前記規準の値が大きいモデルを良好なモデルとすることを特徴とする位置検出方 法。
[18] 複数の物体上に配置された複数の区画領域の位置情報を、物体毎に順次検出す る位置検出方法であって、
前記複数の区画領域に関するモデルの係数を物体毎に推定する際には、すでに 前記モデルの係数の推定が完了した物体でのその推定結果に基づ 、て、推定対象 の物体のモデルの係数を推定する工程を含む位置検出方法。
[19] 複数の物体上に配置された複数の区画領域の位置情報を、物体毎に順次検出す る位置検出方法であって、
前記物体の位置情報を順次検出する度に得られる前記複数の区画領域に関する 回帰モデルの係数に関する事前知識と、所定の座標系における、今回の位置情報 の検出対象となる物体の複数の区画領域のうちの幾つかの区画領域の位置情報の 実測値とに基づいて、前記回帰モデルの所定の評価規範に基づいて、前記回帰モ デルのパラメータの自由度を最適化する第 1工程と;
前記最適化されたパラメータの自由度を有する回帰モデルに基づいて、今回の位 置情報の検出対象となる物体の複数の区画領域の位置情報を算出する第 2工程と; 前記最適化されたパラメータの自由度に基づいて、次回の位置情報の検出対象と なる物体における各区画領域の位置情報の実測値のサンプル数を決定する第 3ェ 程と;を含み、
前記複数の区画領域が形成された複数の前記物体について、位置情報の検出対 象となる前記物体を順次変更しながら、前記第 1工程と、前記第 2工程と、前記第 3ェ 程とを繰り返す位置検出方法。
[20] 請求項 19に記載の位置検出方法において、
前記各回帰モデルの尤度は、その回帰モデルにより得られる前記所定の座標系に おける前記各区画領域の位置情報と、前記位置情報の実測置との残差によって推 定されることを特徴とする位置検出方法。
[21] 請求項 20に記載の位置検出方法にお!、て、
前記各回帰モデルのパラメータとして、前記所定の座標系と、前記複数の区画領 域の配置によって規定される配列座標系とのずれを示す 1次成分の係数と、各区画 領域の成分の設計値からのずれを示す係数と、前記複数の区画領域の配置に関す る高次成分を示す係数との少なくとも一部が含まれることを特徴とする位置検出方法
[22] 請求項 19に記載の位置検出方法において、
前記評価規範を、モデルのパラメータの自由度に応じたペナルティが付与された尤 度である規準とすることを特徴とする位置検出方法。
[23] 請求項 22に記載の位置検出方法において、
前記規準を、赤池情報量規準及びベイジアン情報量規準の!/、ずれか一方とし、 その値が小さいモデルを良好なモデルとすることを特徴とする位置検出方法。
[24] 請求項 22に記載の位置検出方法において、
前記ペナルティを、その回帰モデルのパラメータの自由度の増加に対する尤度の 変化の期待値と、その回帰モデルのパラメータの自由度との積とし、
前記規準の値が大きいモデルを良好なモデルとすることを特徴とする位置検出方 法。
[25] 物体に配置された複数の区画領域を順次露光して各区画領域に所定パターンを 形成する露光方法であって、
請求項 1、4、 18、 19のいずれか一項に記載の位置検出方法により前記複数の区 画領域の位置情報を検出する工程と;
前記検出された位置情報に基づ!、て、前記物体を移動して前記各区画領域を露 光する工程と;を含む露光方法。
[26] リソグラフイエ程を含むデバイス製造方法にぉ 、て、
前記リソグラフイエ程では、請求項 25に記載の露光方法を用いることを特徴とする デバイス製造方法。
[27] 物体上に配置された複数の区画領域の位置情報を検出する位置検出装置であつ て、
所定の座標系における前記複数の区画領域のうちの幾つかの区画領域の位置情 報を計測する計測装置と;
前記計測された各区画領域の位置情報の実測値を用いて、ノ メータの自由度が それぞれ異なる幾つかの、前記複数の区画領域に関する回帰モデルについてそれ ぞれ、そのモデルの所定の評価規範の値を算出し、その算出結果に基づいて、前記 複数の区画領域の回帰モデルとして前記評価規範における最適なモデルを選択す る選択装置と;
前記選択された回帰モデルに基づいて、前記複数の区画領域の位置情報を算出 する算出装置と;を備える位置検出装置。
[28] 請求項 27に記載の位置検出装置において、
前記複数の区画領域の回帰モデルを規定する係数に関する事前知識を記憶する 記憶装置と;
前記選択装置によって、前記評価規範にぉ 、て最適なモデルとして選択された回 帰モデルのパラメータを、前記記憶装置によって記憶されている事前知識に反映す る更新装置と;をさらに備え、
前記選択装置は、
前記記憶装置に記憶された事前知識に基づ 、て、前記回帰モデルを設定すること を特徴とする位置検出装置。
[29] 請求項 28に記載の位置検出装置において、
前記記憶装置は、
前記計測装置が計測する前記各区画領域の位置情報の実測値のサンプル数を記 憶しており、
前記更新装置は、
前記評価規範において最適なモデルとして選択された回帰モデルの前記記憶装 置に記憶されている前記各区画領域の位置情報の実測値のサンプル数を更新する ことを特徴とする位置検出装置。
[30] 複数の物体上に配置された複数の区画領域の位置情報を、物体毎に順次検出す る位置検出装置であって、
前記物体の位置情報を順次検出する度に得られる前記複数の区画領域に関する 回帰モデルの係数に関する事前知識と、所定の座標系における、今回の位置情報 の検出対象である物体の複数の区画領域のうちの幾つかの区画領域の位置情報の 実測値とに基づいて、前記回帰モデルの所定の評価規範により、前記回帰モデルの パラメータの自由度を最適化する最適化装置と;
前記最適化されたパラメータの自由度を有する回帰モデルに基づいて、今回の位 置情報の検出対象である物体の複数の区画領域の位置情報を算出する算出装置と 前記最適化されたパラメータの自由度に基づいて、次回の位置情報の検出対象と なる物体における各区画領域の位置情報の実測値のサンプル数を決定する決定装 置と;を備える位置検出装置。
[31] 物体に配置された複数の区画領域を順次露光して各区画領域に所定パターンを 形成する露光装置であって、
請求項 27又は 30に記載の位置検出装置と;
前記検出された位置情報に基づ!、て、前記物体を移動して前記各区画領域を露 光する転写装置と;を備える露光装置。
[32] リソグラフイエ程を含むデバイス製造方法にぉ 、て、
前記リソグラフイエ程では、請求項 31に記載の露光装置を用いることを特徴とする デバイス製造方法。
[33] 物体上に配置された複数の区画領域の位置情報を検出する位置検出方法であつ て、
前記物体上の前記複数の区画領域のうち、指定された複数の区画領域の位置情 報を計測する第 1工程と、
前記第 1工程後に所定の処理動作を行う第 2工程と、
前記第 2工程の後で、前記物体上の前記複数の区画領域のうち、前記第 1工程で 計測されていない複数の区画領域の位置情報を計測する第 3工程と、を含む位置検 出方法。
[34] 請求項 33に記載の位置検出方法において、
前記第 2工程では、前記第 1工程での計測結果に基づいて、前記物体上の複数の 区画領域に関する回帰モデルとして最適なモデルを探索する処理動作を行うと共に 、該最適なモデルの探索のために更なる区画領域の位置情報の必要性を判別する 処理動作を行い、
前記第 3工程では、前記第 2工程での処理に基づいて、更なる位置情報が必要で あると判断された区画領域の位置情報を計測することを特徴とする位置検出方法。
[35] 物体上に配置された複数の区画領域の位置情報を検出する位置検出装置であつ て、
前記物体上の前記複数の区画領域のうち、指定された複数の区画領域の位置情 報を計測する計測装置と、
前記計測装置による計測後に所定の処理動作を行う処理装置と、
前記計測装置は、前記処理装置による前記処理動作後に、前記物体上の前記複 数の区画領域のうち、前記計測動作時に計測されていない複数の区画領域の位置 情報を計測することを特徴とする位置検出装置。
[36] 請求項 35に記載の位置検出装置において、
前記処理装置は、前記計測装置による最初の計測結果に基づいて、前記物体上 の複数の区画領域に関する回帰モデルとして最適なモデルを探索する処理を行うと 共に、該最適なモデルの探索のために更なる区画領域の位置情報の必要性を判別 する処理を行い、
前記計測装置は、前記処理装置での判別処理に基づいて、更なる位置情報が必 要であると判断された区画領域の位置情報を計測することを特徴とする位置検出装
PCT/JP2004/016423 2003-11-07 2004-11-05 位置検出方法、露光方法、位置検出装置、露光装置及びデバイス製造方法 WO2005045364A1 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005515316A JP4596166B2 (ja) 2003-11-07 2004-11-05 位置検出方法、露光方法、位置検出装置、露光装置及びデバイス製造方法

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2003378229 2003-11-07
JP2003-378229 2003-11-07

Publications (1)

Publication Number Publication Date
WO2005045364A1 true WO2005045364A1 (ja) 2005-05-19

Family

ID=34567168

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2004/016423 WO2005045364A1 (ja) 2003-11-07 2004-11-05 位置検出方法、露光方法、位置検出装置、露光装置及びデバイス製造方法

Country Status (3)

Country Link
JP (1) JP4596166B2 (ja)
TW (1) TW200520054A (ja)
WO (1) WO2005045364A1 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1744217A1 (en) * 2005-07-12 2007-01-17 ASML Netherlands B.V. Method of selecting a grid model for correcting grid deformations in a lithographic apparatus and lithographic assembly using the same
JP2007311580A (ja) * 2006-05-19 2007-11-29 Nikon Corp 露光方法、露光装置、計測方法及び計測装置
WO2013178404A3 (en) * 2012-05-29 2014-03-20 Asml Netherlands B.V. A method to determine the usefulness of alignment marks to correct overlay, and a combination of a lithographic apparatus and an overlay measurement system

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6271922B2 (ja) * 2013-09-10 2018-01-31 キヤノン株式会社 位置を求める方法、露光方法、露光装置、および物品の製造方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6284516A (ja) * 1985-10-08 1987-04-18 Nippon Kogaku Kk <Nikon> 位置合わせ方法
JPH05114545A (ja) * 1991-08-30 1993-05-07 Nikon Corp 位置合わせ方法
JPH11295056A (ja) * 1998-04-15 1999-10-29 Nikon Corp 位置検出方法、位置合わせ方法、および露光方法
WO2000019497A1 (fr) * 1998-09-30 2000-04-06 Nikon Corporation Procede d'alignement et procede pour l'obtention d'un dispositif au moyen du procede d'alignement
JP2002324756A (ja) * 2001-02-26 2002-11-08 Nikon Corp 位置計測装置、露光装置、及び露光システム、並びにデバイス製造方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6284516A (ja) * 1985-10-08 1987-04-18 Nippon Kogaku Kk <Nikon> 位置合わせ方法
JPH05114545A (ja) * 1991-08-30 1993-05-07 Nikon Corp 位置合わせ方法
JPH11295056A (ja) * 1998-04-15 1999-10-29 Nikon Corp 位置検出方法、位置合わせ方法、および露光方法
WO2000019497A1 (fr) * 1998-09-30 2000-04-06 Nikon Corporation Procede d'alignement et procede pour l'obtention d'un dispositif au moyen du procede d'alignement
JP2002324756A (ja) * 2001-02-26 2002-11-08 Nikon Corp 位置計測装置、露光装置、及び露光システム、並びにデバイス製造方法

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1744217A1 (en) * 2005-07-12 2007-01-17 ASML Netherlands B.V. Method of selecting a grid model for correcting grid deformations in a lithographic apparatus and lithographic assembly using the same
JP2007027721A (ja) * 2005-07-12 2007-02-01 Asml Netherlands Bv リソグラフィ装置における格子変形の処理レシピを修正するための格子モデルの選択方法及び該方法を使用したリソグラフィ・アセンブリ
US7468795B2 (en) 2005-07-12 2008-12-23 Asml Netherlands B.V. Method of selecting a grid model for correcting a process recipe for grid deformations in a lithographic apparatus and lithographic assembly using the same
JP2010123997A (ja) * 2005-07-12 2010-06-03 Asml Netherlands Bv リソグラフィ装置における格子変形の処理レシピを修正するための格子モデルの選択方法及び該方法を使用したリソグラフィ・アセンブリ
JP2007311580A (ja) * 2006-05-19 2007-11-29 Nikon Corp 露光方法、露光装置、計測方法及び計測装置
WO2013178404A3 (en) * 2012-05-29 2014-03-20 Asml Netherlands B.V. A method to determine the usefulness of alignment marks to correct overlay, and a combination of a lithographic apparatus and an overlay measurement system
US9454084B2 (en) 2012-05-29 2016-09-27 Asml Netherlands B.V. Method to determine the usefulness of alignment marks to correct overlay, and a combination of a lithographic apparatus and an overlay measurement system

Also Published As

Publication number Publication date
TWI377598B (ja) 2012-11-21
JPWO2005045364A1 (ja) 2007-05-17
TW200520054A (en) 2005-06-16
JP4596166B2 (ja) 2010-12-08

Similar Documents

Publication Publication Date Title
EP1603153B1 (en) Exposure method, device production method, and information display method
US7718327B2 (en) Overlay management method and apparatus, processing apparatus, measurement apparatus and exposure apparatus, device manufacturing system and device manufacturing method, and program and information recording medium
JP4400745B2 (ja) 露光方法及びデバイス製造方法、露光装置、並びにプログラム
JP5057248B2 (ja) 測定検査方法、測定検査装置、露光方法、デバイス製造方法及びデバイス製造装置
WO2006019166A1 (ja) アライメント情報表示方法とそのプログラム、アライメント方法、露光方法、デバイス製造方法、表示システム、表示装置、プログラム及び測定/検査装置
JP4905617B2 (ja) 露光方法及びデバイス製造方法
WO2005096353A1 (ja) アライメント条件決定方法及び装置、並びに露光方法及び装置
JP2010186918A (ja) アライメント方法、露光方法及び露光装置、デバイス製造方法、並びに露光システム
JP5428671B2 (ja) 露光方法、デバイス製造方法、及び露光システム
US20060033916A1 (en) Selection method, exposure method, selection unit, exposure apparatus, and device manufacturing method
JP2011119457A (ja) 位置合わせ条件最適化方法及びシステム、パターン形成方法及びシステム、露光装置、デバイス製造方法、並びに重ね合わせ精度評価方法及びシステム
JP2003059807A (ja) 露光方法及び露光装置、並びにデバイス製造方法
JP5838594B2 (ja) ダブルパターニング最適化方法及びシステム、パターン形成方法、露光装置、並びにデバイス製造方法
JP2004200632A (ja) 位置検出方法、露光方法及び露光装置、デバイス製造方法、並びにプログラム及び情報記録媒体
WO2005045364A1 (ja) 位置検出方法、露光方法、位置検出装置、露光装置及びデバイス製造方法
JP2006148013A (ja) 位置合わせ方法及び露光方法
JP5105135B2 (ja) 推定方法、露光方法、デバイス製造方法、検査方法、デバイス製造装置、及びプログラム
JP2005116580A (ja) 位置検出装置及び方法、露光装置及び方法、並びにデバイス製造方法
JP2005064369A (ja) 最適化方法、露光方法、最適化装置、露光装置、デバイス製造方法、及びプログラム、並びに情報記録媒体
JP2004087562A (ja) 位置検出方法及びその装置、露光方法及びその装置、並びにデバイス製造方法
WO2005008752A1 (ja) 露光装置、露光方法及びデバイス製造方法
JP2006108533A (ja) 位置検出方法及び露光方法
JP2003197504A (ja) 露光方法及びデバイス製造方法
JP2006135281A (ja) 推定方法、露光方法及びプログラム
JP2012079735A (ja) マスク伸縮補正最適化方法、露光方法及びデバイス製造方法、並びにデバイス製造システム

Legal Events

Date Code Title Description
AK Designated states

Kind code of ref document: A1

Designated state(s): AE AG AL AM AT AU AZ BA BB BG BR BW BY BZ CA CH CN CO CR CU CZ DE DK DM DZ EC EE EG ES FI GB GD GE GH GM HR HU ID IL IN IS JP KE KG KP KR KZ LC LK LR LS LT LU LV MA MD MG MK MN MW MX MZ NA NI NO NZ OM PG PH PL PT RO RU SC SD SE SG SK SL SY TJ TM TN TR TT TZ UA UG US UZ VC VN YU ZA ZM ZW

AL Designated countries for regional patents

Kind code of ref document: A1

Designated state(s): GM KE LS MW MZ NA SD SL SZ TZ UG ZM ZW AM AZ BY KG KZ MD RU TJ TM AT BE BG CH CY CZ DE DK EE ES FI FR GB GR HU IE IS IT LU MC NL PL PT RO SE SI SK TR BF BJ CF CG CI CM GA GN GQ GW ML MR NE SN TD TG

121 Ep: the epo has been informed by wipo that ep was designated in this application
WWE Wipo information: entry into national phase

Ref document number: 2005515316

Country of ref document: JP

122 Ep: pct application non-entry in european phase