WO2021065516A1 - 研磨装置、情報処理システム、情報処理方法及びプログラム - Google Patents

研磨装置、情報処理システム、情報処理方法及びプログラム Download PDF

Info

Publication number
WO2021065516A1
WO2021065516A1 PCT/JP2020/035106 JP2020035106W WO2021065516A1 WO 2021065516 A1 WO2021065516 A1 WO 2021065516A1 JP 2020035106 W JP2020035106 W JP 2020035106W WO 2021065516 A1 WO2021065516 A1 WO 2021065516A1
Authority
WO
WIPO (PCT)
Prior art keywords
polishing
data
eddy current
current sensor
target substrate
Prior art date
Application number
PCT/JP2020/035106
Other languages
English (en)
French (fr)
Inventor
顕 中村
Original Assignee
株式会社荏原製作所
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 株式会社荏原製作所 filed Critical 株式会社荏原製作所
Priority to US17/765,388 priority Critical patent/US20220371151A1/en
Publication of WO2021065516A1 publication Critical patent/WO2021065516A1/ja

Links

Images

Classifications

    • BPERFORMING OPERATIONS; TRANSPORTING
    • B24GRINDING; POLISHING
    • B24BMACHINES, DEVICES, OR PROCESSES FOR GRINDING OR POLISHING; DRESSING OR CONDITIONING OF ABRADING SURFACES; FEEDING OF GRINDING, POLISHING, OR LAPPING AGENTS
    • B24B37/00Lapping machines or devices; Accessories
    • B24B37/005Control means for lapping machines or devices
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B23MACHINE TOOLS; METAL-WORKING NOT OTHERWISE PROVIDED FOR
    • B23QDETAILS, COMPONENTS, OR ACCESSORIES FOR MACHINE TOOLS, e.g. ARRANGEMENTS FOR COPYING OR CONTROLLING; MACHINE TOOLS IN GENERAL CHARACTERISED BY THE CONSTRUCTION OF PARTICULAR DETAILS OR COMPONENTS; COMBINATIONS OR ASSOCIATIONS OF METAL-WORKING MACHINES, NOT DIRECTED TO A PARTICULAR RESULT
    • B23Q15/00Automatic control or regulation of feed movement, cutting velocity or position of tool or work
    • B23Q15/007Automatic control or regulation of feed movement, cutting velocity or position of tool or work while the tool acts upon the workpiece
    • B23Q15/12Adaptive control, i.e. adjusting itself to have a performance which is optimum according to a preassigned criterion
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B24GRINDING; POLISHING
    • B24BMACHINES, DEVICES, OR PROCESSES FOR GRINDING OR POLISHING; DRESSING OR CONDITIONING OF ABRADING SURFACES; FEEDING OF GRINDING, POLISHING, OR LAPPING AGENTS
    • B24B37/00Lapping machines or devices; Accessories
    • B24B37/005Control means for lapping machines or devices
    • B24B37/013Devices or means for detecting lapping completion
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B24GRINDING; POLISHING
    • B24BMACHINES, DEVICES, OR PROCESSES FOR GRINDING OR POLISHING; DRESSING OR CONDITIONING OF ABRADING SURFACES; FEEDING OF GRINDING, POLISHING, OR LAPPING AGENTS
    • B24B37/00Lapping machines or devices; Accessories
    • B24B37/11Lapping tools
    • B24B37/20Lapping pads for working plane surfaces
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B24GRINDING; POLISHING
    • B24BMACHINES, DEVICES, OR PROCESSES FOR GRINDING OR POLISHING; DRESSING OR CONDITIONING OF ABRADING SURFACES; FEEDING OF GRINDING, POLISHING, OR LAPPING AGENTS
    • B24B37/00Lapping machines or devices; Accessories
    • B24B37/27Work carriers
    • B24B37/30Work carriers for single side lapping of plane surfaces
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B24GRINDING; POLISHING
    • B24BMACHINES, DEVICES, OR PROCESSES FOR GRINDING OR POLISHING; DRESSING OR CONDITIONING OF ABRADING SURFACES; FEEDING OF GRINDING, POLISHING, OR LAPPING AGENTS
    • B24B49/00Measuring or gauging equipment for controlling the feed movement of the grinding tool or work; Arrangements of indicating or measuring equipment, e.g. for indicating the start of the grinding operation
    • B24B49/02Measuring or gauging equipment for controlling the feed movement of the grinding tool or work; Arrangements of indicating or measuring equipment, e.g. for indicating the start of the grinding operation according to the instantaneous size and required size of the workpiece acted upon, the measuring or gauging being continuous or intermittent
    • B24B49/04Measuring or gauging equipment for controlling the feed movement of the grinding tool or work; Arrangements of indicating or measuring equipment, e.g. for indicating the start of the grinding operation according to the instantaneous size and required size of the workpiece acted upon, the measuring or gauging being continuous or intermittent involving measurement of the workpiece at the place of grinding during grinding operation
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B24GRINDING; POLISHING
    • B24BMACHINES, DEVICES, OR PROCESSES FOR GRINDING OR POLISHING; DRESSING OR CONDITIONING OF ABRADING SURFACES; FEEDING OF GRINDING, POLISHING, OR LAPPING AGENTS
    • B24B49/00Measuring or gauging equipment for controlling the feed movement of the grinding tool or work; Arrangements of indicating or measuring equipment, e.g. for indicating the start of the grinding operation
    • B24B49/10Measuring or gauging equipment for controlling the feed movement of the grinding tool or work; Arrangements of indicating or measuring equipment, e.g. for indicating the start of the grinding operation involving electrical means
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B19/00Programme-control systems
    • G05B19/02Programme-control systems electric
    • G05B19/18Numerical control [NC], i.e. automatically operating machines, in particular machine tools, e.g. in a manufacturing environment, so as to execute positioning, movement or co-ordinated operations by means of programme data in numerical form
    • G05B19/404Numerical control [NC], i.e. automatically operating machines, in particular machine tools, e.g. in a manufacturing environment, so as to execute positioning, movement or co-ordinated operations by means of programme data in numerical form characterised by control arrangements for compensation, e.g. for backlash, overshoot, tool offset, tool wear, temperature, machine construction errors, load, inertia
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B19/00Programme-control systems
    • G05B19/02Programme-control systems electric
    • G05B19/18Numerical control [NC], i.e. automatically operating machines, in particular machine tools, e.g. in a manufacturing environment, so as to execute positioning, movement or co-ordinated operations by means of programme data in numerical form
    • G05B19/4155Numerical control [NC], i.e. automatically operating machines, in particular machine tools, e.g. in a manufacturing environment, so as to execute positioning, movement or co-ordinated operations by means of programme data in numerical form characterised by programme execution, i.e. part programme or machine function execution, e.g. selection of a programme
    • HELECTRICITY
    • H01ELECTRIC ELEMENTS
    • H01LSEMICONDUCTOR DEVICES NOT COVERED BY CLASS H10
    • H01L21/00Processes or apparatus adapted for the manufacture or treatment of semiconductor or solid state devices or of parts thereof
    • H01L21/02Manufacture or treatment of semiconductor devices or of parts thereof
    • H01L21/04Manufacture or treatment of semiconductor devices or of parts thereof the devices having potential barriers, e.g. a PN junction, depletion layer or carrier concentration layer
    • H01L21/18Manufacture or treatment of semiconductor devices or of parts thereof the devices having potential barriers, e.g. a PN junction, depletion layer or carrier concentration layer the devices having semiconductor bodies comprising elements of Group IV of the Periodic Table or AIIIBV compounds with or without impurities, e.g. doping materials
    • H01L21/30Treatment of semiconductor bodies using processes or apparatus not provided for in groups H01L21/20 - H01L21/26
    • H01L21/302Treatment of semiconductor bodies using processes or apparatus not provided for in groups H01L21/20 - H01L21/26 to change their surface-physical characteristics or shape, e.g. etching, polishing, cutting
    • H01L21/304Mechanical treatment, e.g. grinding, polishing, cutting

Definitions

  • the present invention relates to a polishing device, an information processing system, an information processing method and a program.
  • CMP Chemical Mechanical Polishing
  • the polishing device is equipped with a controller for detecting the polishing end point, and for example, an eddy current sensor is used to detect the optimum polishing end point (see Patent Document 1).
  • the eddy current sensor is installed under, for example, a polishing table, and generates magnetic field lines in a direction penetrating the polishing table. As the polishing table rotates, the eddy current sensor rotates with the polishing table and passes under the wafer held by the top ring. At this time, if a conductive film is present on the wafer surface, an eddy current is generated on the wafer surface. When an eddy current flows, a magnetic field line is generated in the direction opposite to the initial magnetic field line. The thickness of the conductive film is measured by measuring the strength of the magnetic field lines generated in the opposite direction.
  • the present invention has been made in view of the above problems, and an object of the present invention is to provide a polishing apparatus, an information processing system, an information processing method and a program capable of estimating the wiring height of a substrate during polishing. To do.
  • the polishing apparatus includes a polishing table provided with a vortex current sensor and rotatably configured, and a surface facing the polishing table and rotatably facing the polishing table.
  • a predetermined pretreatment is executed for the output signal when the vortex current sensor is located at each position facing the target substrate.
  • the pre-processed data of the board is generated, and the data after the predetermined pre-processing is executed for the output signal when the vortex current sensor is located at each position facing the board is used as the input of the board.
  • a processor that determines the wiring height in the above.
  • the polishing apparatus is the polishing apparatus according to the first aspect, and when the determined wiring height reaches a predetermined wiring height, the processor said. Control to finish polishing the target substrate.
  • polishing can be automatically completed when the wiring height reaches a predetermined value.
  • the polishing apparatus is the polishing apparatus according to the first or second aspect, and the polishing head is provided with an airbag for pressing the substrate, and the processor , The pressure distribution in the airbag is controlled according to the determined distribution of the wiring height.
  • the uniformity of the height of the polished surface of the substrate (for example, the wiring height) can be improved.
  • the polishing apparatus is the polishing apparatus according to any one of the first to third aspects, and the input of the machine learning model is further the thickness of the polishing pad and the number of rotations of the polishing table. , And / or the number of rotations of the polishing head.
  • the amount of one polishing can be changed depending on the thickness of the polishing pad, the rotation speed of the polishing table, and / or the rotation speed of the polishing head. Therefore, by considering one or more of these parameters, The estimation accuracy of the wiring height can be improved.
  • the polishing apparatus is the polishing apparatus according to any one of the first to fourth aspects, includes a plurality of the eddy current sensors, and inputs the machine learning model to the plurality of the above. This is data after the preprocessing is executed for the output signals at each position facing the target substrate in the same polishing table rotation orbit of the eddy current sensor.
  • the data after the preprocessing is executed is used as the input of the machine learning model, so that the output signals of the same orbit are used.
  • the polishing apparatus is the polishing apparatus according to any one of the first to fourth aspects, includes a plurality of the eddy current sensors, and inputs the machine learning model to the plurality of the above. This is data after the preprocessing is executed for the output signals at each position facing the target substrate in the same plurality of polishing table rotation orbits of the eddy current sensor.
  • the influence can be offset. Therefore, the estimation accuracy of the wiring height can be improved.
  • the wiring height can be estimated if there is no noise on the other output signals, so the wiring height can be estimated. The robustness of the estimation of noise can be improved.
  • the polishing apparatus is the polishing apparatus according to any one of the first to fourth aspects, and the input of the machine learning model is the rotation of a plurality of polishing tables of one eddy current sensor. This is data after the preprocessing is executed for the output signal at each position facing the target substrate in the orbit.
  • the polishing apparatus is the polishing apparatus according to any one of the first to seventh aspects, and the processor uses the output signal of the eddy current sensor during the polishing process to learn the above. Retrain a machine learning model that has already been completed.
  • the output signal of the eddy current sensor during the polishing process is used for re-learning, so that the prediction accuracy of the wiring height can be improved.
  • the information processing system executes predetermined preprocessing for the output signal when the eddy current sensor is located at each position facing the target substrate during the polishing process of the target substrate.
  • the preprocessing unit that generates the preprocessing and post-processing data of the target substrate.
  • a predetermined preprocessing is executed for an output signal when the eddy current sensor is located at each position facing the target substrate during the polishing process of the target substrate.
  • the computer performs a predetermined pretreatment on the output signal when the vortex current sensor is located at each position facing the target substrate during the polishing process of the target substrate.
  • the preprocessing unit that executes and generates the preprocessing and post-processing data of the target substrate.
  • data after performing predetermined preprocessing on the output signal when the vortex current sensor is located at each position facing the substrate is used as input, and at least one of the substrates.
  • an output signal obtained by measuring a wafer having a wiring pattern with a vortex current sensor during CMP polishing and a wiring height when the output signal is measured (either a measured value or an estimated value).
  • Good is trained by a machine learning model (here, a neural network as an example).
  • the estimated wiring height is determined (that is, the film thickness value is estimated).
  • the estimation accuracy is improved by re-learning the trained machine learning model using the eddy current waveform data during CMP processing obtained during operation and the estimated wiring height.
  • FIG. 1 is a schematic front view of the polishing apparatus according to the embodiment.
  • the polishing apparatus 100 according to one embodiment is a CMP apparatus that polishes a substrate by chemical mechanical polishing (CMP).
  • the polishing device 100 may be any device that polishes the substrate by rotating a polishing table provided with an eddy current sensor.
  • the polishing apparatus 100 includes a polishing table 110, a polishing head 120, and a liquid supply mechanism 130.
  • the polishing apparatus 100 may further include a controller 140 for controlling each component.
  • the controller 140 may include, for example, a storage 141, a processor 142 and an input / output interface 143.
  • a polishing pad 111 is detachably attached to the surface of the polishing table 110 facing the polishing head 120.
  • the polishing head 120 is provided so as to face the polishing table 110.
  • a substrate 121 is detachably attached to a surface of the polishing head 120 facing the polishing table 110.
  • the liquid supply mechanism 130 is configured to supply a polishing liquid such as a slurry to the polishing pad 111.
  • the liquid supply mechanism 130 may be configured to supply a cleaning liquid, a chemical liquid, or the like in addition to the polishing liquid.
  • the polishing device 100 can lower the polishing head 120 by a vertical movement mechanism (not shown) to bring the substrate 121 into contact with the polishing pad 111.
  • the vertical movement mechanism may be able to move the polishing table 110 up and down.
  • the polishing table 110 and the polishing head 120 are rotated by a motor (not shown) or the like.
  • the polishing apparatus 100 polishes the substrate 121 by rotating both the polishing table 110 and the polishing head 120 in a state where the substrate 121 and the polishing pad 111 are in contact with each other.
  • An eddy current sensor 150 is provided inside the polishing table 110. Specifically, for example, the eddy current sensor 150 is installed at a position where it passes through the center of the substrate 121 being polished. The eddy current sensor 150 induces an eddy current in the conductive layer on the surface of the substrate 121. The eddy current sensor 150 further detects the thickness of the conductive layer on the surface of the substrate 121 (hereinafter, also referred to as wiring height) from the change in impedance caused by the magnetic field generated by the eddy current. The eddy current sensor 150 (or the operator who reads the output of the controller 140 connected to the eddy current sensor 150 or the eddy current sensor 150) can detect the end point of substrate polishing from the detected thickness of the conductive layer. .. The input / output interface 143 is connected to the eddy current sensor 150, and receives an output signal detected by the eddy current sensor 150 from the eddy current sensor 150.
  • the polishing head is provided with an airbag for pressing the substrate 121, and the airbag 122 is divided into, for example, a plurality of sections 1221 to 1224.
  • the airbag 122 is provided on the polishing head 120 as an example. In addition to or in place of it, the airbag 122 may be provided on the polishing table 110.
  • the airbag 122 is a member for adjusting the polishing pressure of the substrate 121 for each region of the substrate 121.
  • the airbag 122 is configured so that its volume changes depending on the pressure of the air introduced therein.
  • air is "air" bag, a fluid other than air, for example, nitrogen gas or pure water, may be introduced into the airbag 122.
  • the compartments 1221, 1222, 1223, 1224 are connected to the corresponding pressure control valves R1, R2, R3, R4, respectively.
  • the pressure control valves R1, R2, R3, and R4 are connected to the controller 140, and the pressure of the pressure fluid (for example, gas) supplied to the compartments 1221, 1222, 1223, 1224 in response to the control signal from the controller 140. To adjust individually. Thereby, the pressure can be adjusted for each section 1221 to 1224.
  • FIG. 2 is a diagram for explaining the wiring height according to the present embodiment.
  • the substrate before polishing has a base layer L12 on which a groove DP for wiring is formed and a metal layer L11 provided on the base layer L12.
  • the base layer L2 is, for example, an oxide film (for example, SiO 2 ) or a nitride film.
  • the metal layer L11 is scraped to remove the metal resting on the base layer L12 in addition to the groove DP, as shown in the cross-sectional view of the substrate on the right side of FIG. become.
  • the length H from the bottom of the groove DP to the upper surface of the metal layer L11 is the wiring height.
  • the substrate 121 will be described as an example of a wafer.
  • FIG. 3A is a schematic view showing a horizontal movement locus of the eddy current sensor 150 with respect to the substrate 121.
  • the eddy current sensor 150 passes under the substrate 121 in the trajectory shown by the arrow A1, as shown in FIG. 3A. Since the rotation speed of the polishing table 110 is predetermined, the speed of the eddy current sensor 150 fixed to the polishing table 110 is known.
  • the positions of the eddy current sensor 150 and the substrate 121 of the polishing head 120 are preset so that the eddy current sensor 150 passes through the center of the substrate 121 (here, as an example, a wafer).
  • the processor 142 can calculate the position where the eddy current sensor 150 moves in an arc shape at a constant speed, for example, at predetermined time intervals, and the radius of the wafer can be calculated from this position.
  • the position in the direction (hereinafter referred to as the radius position of the wafer) can be calculated.
  • FIG. 3B is a graph showing the output signal of the eddy current sensor 150 while the eddy current sensor 150 passing under the substrate 121 is passing.
  • the horizontal axis is the wafer radius position where the eddy current sensor 150 is located, and the vertical axis is the sensor output.
  • the radius of the wafer is 150 mm, and represents the sensor output when the radius position of the wafer changes from ⁇ 150 mm to 150 mm. As described above, the waveform of the output signal is uneven.
  • FIG. 4 is a functional block diagram of the processor 142 according to the first embodiment. As shown in FIG. 4, the processor 142 functions as a preprocessing unit 160, a prediction unit 164, and a determination unit 165.
  • the preprocessing unit 160 executes predetermined preprocessing for the output signal when the eddy current sensor 150 is at each position facing the target substrate to preprocess the target substrate. Generate post-data.
  • the preprocessing unit 160 includes a noise removal filter 161, a data interpolation unit 162, and an offset processing unit 163. These processes will be described later in FIG.
  • the prediction unit 164 determines the wiring height of the target substrate using a machine learning model (here, a neural network as an example). More specifically, the prediction unit 164 inputs data after executing predetermined preprocessing on the output signal when the vortex current sensor 150 is located at each position facing the substrate, and inputs the data of the substrate. By inputting the pre-processed data of the target substrate into a machine learning model (here, a neural network as an example) trained using a training data set that outputs the wiring height at at least one position, the said The wiring height at at least one position (here, M positions as an example) of the target substrate is determined.
  • a machine learning model here, a neural network as an example
  • FIG. 5 is a schematic diagram showing an example of the neural network used in the first embodiment.
  • the neural network MD1 is a neural network of the K layer (K is a natural number)
  • the input layer has N + 3 neurons (N is a natural number)
  • the intermediate layer has N neurons.
  • the output layer has M neurons (M is a natural number).
  • Each neuron contained in the input layer and the intermediate layer is, for example, fully connected to the neurons in the next layer.
  • neurons in the middle layer for example, weight their output to the input and feed it back.
  • the neural network according to the present embodiment is, for example, a recurrent neural network (RNN).
  • RNN recurrent neural network
  • the output waveform or waveform pattern that appears in the output signal of the eddy current sensor 150 that is passing under the substrate in one orbit is the output signal of the eddy current sensor 150 that is passing under the orbiting substrate before that (pre-scan). It is related to the output waveform (also called the output signal). It is preferable to use a recurrent neural network (RNN) or an LSTM (Long short-term memory) which is a kind of recurrent neural network as a machine learning model so that the data of the output signal of the prescan can be used.
  • RNN recurrent neural network
  • LSTM Long short-term memory
  • Data 1 to data N which are signals after preprocessing corresponding to each wafer radius position, are input to neurons L 1, 1 to L 1, N in the input layer of the neural network. Further, the thickness data of the polishing pad 111 (hereinafter, also referred to as Pad thickness data) and the rotation speed data of the polishing table 110 are stored in the neurons L 1, N + 1 to L 1, N + 3 of the input layer of the neural network, respectively. (Hereinafter, also referred to as table rotation speed data) and rotation speed data of the polishing head 120 (hereinafter, also referred to as carrier rotation speed data) are input.
  • the wiring heights in radii r 1 to radius r M are output from the output layers of the neural network, respectively.
  • data 1 to data N which are signals after preprocessing corresponding to each wafer radius position, pad thickness data, table rotation number data, and carrier rotation number data are used. It is used as input data, and the measured value or estimated value of the wiring height in the radius r 1 to radius r M at that time is input as output data, and the weight coefficient of each neural is updated.
  • the measured value is the wiring height measured after actually polishing the wafer.
  • An existing update method (for example, backpropagation) may be used to update the weighting coefficient.
  • FIG. 6 is a flowchart showing an example of the processing flow according to the first embodiment.
  • the weighting coefficient of each neuron in the trained neural network is stored in the storage 141.
  • Step S101 First, the processor 142 controls to start wafer polishing.
  • Step S102 the processor 142 sequentially stores the output signal of the eddy current sensor when passing under the wafer once in the storage 141.
  • the processing of the following steps S103 to S105 is the processing of the preprocessing unit 160.
  • the noise reduction filter 161 applies a noise removal filter (here, a low-pass filter (LPF) as an example) to the output signal of the eddy current sensor.
  • a noise removal filter here, a low-pass filter (LPF) as an example
  • Step S104 the data interpolation unit 162 interpolates the data at the wafer radius position without the sensor value.
  • Step S105 the offset processing unit 163 offsets the data at the predetermined radius position with respect to the signal after data interpolation so as to have a specific value. As a result, it is possible to cancel by setting the DC component that varies from wafer to wafer to the same specific value, and it is possible to learn the difference between the AC components excluding the DC component.
  • the offset processing unit 163 may be, for example, a filter that removes a DC component.
  • Step S106 Next, the prediction unit 164 inputs the offset data to the trained neural network with reference to the storage 141, and determines the wiring height.
  • Step S107 the determination unit 165 determines whether or not the wiring height determined in step S106 has reached a predetermined wiring height. If it is determined that the wiring height is not the predetermined wiring height, the process returns to step S102, and the processes after step S102 are executed.
  • Step S108 When it is determined in step S107 that the wiring height has reached a predetermined wiring height, the processor 142 controls to finish the wafer polishing.
  • the processor 142 controls to finish polishing the target substrate when the determined wiring height reaches a predetermined wiring height. As a result, polishing can be automatically completed when the wiring height reaches a predetermined value.
  • the neural network outputs the wiring heights at a plurality of positions on the substrate, but the present invention is not limited to this, and the wiring heights at one position on the substrate may be output. ..
  • the polishing apparatus has a polishing table 110 provided with an eddy current sensor 150 and rotatably configured, and facing the polishing table 110 and rotatably and facing the polishing table 110.
  • a polishing head 120 to which a substrate can be attached and a processor 142 are provided on the surface to be surfaced.
  • the processor 142 executes predetermined preprocessing for the output signal when the eddy current sensor is located at each position facing the target substrate, and performs preprocessing and post-processing data of the target substrate. To generate.
  • the processor 142 takes data after executing predetermined preprocessing on the output signal when the vortex current sensor 150 is at each position facing the board as input, and at least one position of the board.
  • the processor 142 takes data after executing predetermined preprocessing on the output signal when the vortex current sensor 150 is at each position facing the board as input, and at least one position of the board.
  • the input of the neural network includes, but is not limited to, the thickness of the polishing pad, the rotation speed of the polishing table, and the rotation speed of the polishing head, and one or two of these are not limited to these. It may be included. That is, the input of the machine learning model may further include the thickness of the polishing pad, the number of revolutions of the polishing table, and / or the number of revolutions of the polishing head. With this configuration, the amount of polishing at one time can change depending on the thickness of the polishing pad, the rotation speed of the polishing table, and / or the rotation speed of the polishing head. Therefore, by considering one or more of these parameters, the wiring height The estimation accuracy of the table can be improved.
  • it may be a neural network in which the thickness of the polishing pad, the rotation speed of the polishing table, and the rotation speed of the polishing head are not input.
  • a modification of the first embodiment is different from the first embodiment in that the processor 142 further controls the pressure distribution in the airbag 122 according to the determined wiring height distribution. There is.
  • FIG. 7 is a functional block diagram of the processor 142 according to the modified example of the first embodiment.
  • the functional block diagram of the processor 142 according to the modified example of the first embodiment shown in FIG. 7 has a pressure control unit 166 added as compared with the functional block diagram of the processor 142 according to the first embodiment of FIG. It has become a thing.
  • the same elements as those in FIG. 4 are designated by the same reference numerals, and the description thereof will be omitted.
  • the pressure control unit 166 controls the pressure distribution in the airbag 122 according to the distribution of the wiring height determined by the prediction unit 164.
  • FIG. 8 is a flowchart showing an example of the processing flow according to the modified example of the first embodiment. Since steps S201 to S205 are the same as steps S101 to S105 in FIG. 6, the description thereof will be omitted.
  • Step S206 The prediction unit 164 inputs the offset data to the trained neural network with reference to the storage 141, and determines the distribution of the wiring height.
  • the pressure control unit 166 controls the pressure distribution in the airbag 122 according to the distribution of the wiring height determined by the prediction unit 164. Specifically, for example, when the wiring height of the target position is higher than that of the other position, the pressure control unit 166 is not cut more than the other position, so that the pressure in the airbag 122 at that position is reduced to another position. The pressure may be higher than the position. Further, in addition to or in place of that, when the wiring height at the target position is lower than the other position, the pressure control unit 166 is cut off from the other position, so that the pressure control unit 166 is inside the airbag 122 at that position. The pressure may be lower than the other positions. Thereby, the uniformity of the height (for example, the wiring height) of the polished surface of the substrate can be improved.
  • steps S208 to S209 are the same as steps S107 to S108 of FIG. 6, so the description thereof will be omitted.
  • FIG. 9A is a schematic view showing horizontal movement loci of a plurality of eddy current sensors with respect to the substrate 121.
  • U eddy current sensors up to 150-1, ..., 150-U (U is an integer of 2 or more) are provided.
  • FIG. 9B is a schematic diagram of a graph showing the output signals of the eddy current sensors while they are passing under the substrate 121. As shown in FIG. 9B, each time the polishing table 110 makes one rotation, the output signals of the eddy current sensors 150-1, ..., 150-U are obtained, so that U output signals can be obtained.
  • FIG. 10 is a functional block diagram of the processor 142 according to the second embodiment. As shown in FIG. 10, as compared with the modified example of the first embodiment of FIG. 7, the pre-processing unit 160 is changed to the pre-processing unit 160b, and the prediction unit 164 is changed to the prediction unit 164b. There is.
  • the preprocessing unit 160b includes noise removal filters 161-1, ..., 161-U, data interpolation units 162-1, ..., 162-U, and offset processing units 163-1, ..., 163-U.
  • the noise reduction filters 161-1, ..., 161-U apply a noise reduction filter to the output signals from the corresponding eddy current sensors 150-1, ..., 150-U, respectively.
  • the data interpolation units 162-1, ..., 162-U interpolate the data at the wafer radius position without the sensor value with respect to the corresponding noise-removing filtered signals.
  • the offset processing units 163-1, ..., 163-U offset the data at the predetermined radial position with respect to the corresponding data interpolated signals so as to have a specific value.
  • the prediction unit 164b determines the wiring height of the target substrate using a machine learning model (here, a neural network as an example). More specifically, the prediction unit 164b executes a predetermined preprocessing for the output signal at each position facing the target substrate of the same polishing table rotation orbit of the plurality of eddy current sensors 150-1 to 150-U. For a machine learning model (here, a neural network as an example) trained using a training data set that inputs the data after the data is input and outputs the wiring height at at least one position of the board, the target board is used. By inputting the pre-processed data of the above, the wiring height at at least one position (here, M positions as an example) of the target board is determined.
  • a machine learning model here, a neural network as an example
  • FIG. 11 is a schematic diagram showing an example of the neural network used in the second embodiment.
  • the neural network MD2 is, for example, a neural network of the K layer (K is a natural number), the input layer has U ⁇ N + 3 neurons (N is a natural number), and the intermediate layer is U ⁇ . It has N neurons and the output layer has M neurons (M is a natural number).
  • K is a natural number
  • N is a natural number
  • M M neurons
  • Each neuron contained in the input layer and the intermediate layer is, for example, fully connected to the neurons in the next layer.
  • neurons in the middle layer weight their output to the input and feed it back.
  • the thickness data (pad thickness data) of the polishing pad 111 and the rotation number data of the polishing table 110 are stored in the neurons L 1, U ⁇ N + 1 to L 1, U ⁇ N + 3 in the input layer of the neural network, respectively.
  • Table rotation number data and rotation number data of the polishing head 120 are input.
  • the wiring heights in radii r 1 to radius r M are output from the output layers of the neural network, respectively.
  • a plurality of eddy current sensors are provided, and the input of the machine learning model is at each position facing the target substrate in the same polishing table rotation orbit of the plurality of eddy current sensors 150-1 to 150-U. This is the data after the preprocessing is executed for the output signal.
  • the data after the preprocessing is executed is used as the input of the machine learning model, so that the output signals of the same orbit are used more than once. Therefore, even if noise appears on one output signal, the wiring height can be estimated if noise does not appear on the other output signals. This makes it possible to improve the robustness of estimating the wiring height.
  • the third embodiment will be described.
  • it is common to use the output signals of the plurality of eddy current sensors, but it is different in that the output signals of a plurality of laps are further used.
  • FIG. 12 is a schematic view showing an example of the output signal of the same eddy current sensor from the V rotation to the V + 3 rotation of the polishing table.
  • V is a natural number.
  • the vertical axis is the sensor output, and the horizontal axis is the wafer radius position. As the number of times of polishing increases, it is polished and the wiring height gradually decreases.
  • FIG. 13 is a schematic view showing a horizontal movement locus with reference to the substrate of the same eddy current sensor from the V rotation to the V + 3 rotation in FIG. As shown in FIG. 13, the horizontal movement loci of the eddy current sensor from the V rotation to the V + 3 rotation are T1 to T4.
  • the average wiring height of the plurality of laps is estimated by using the output signals of the plurality of laps of the plurality of eddy current sensors.
  • FIG. 14 is a functional block diagram of the processor 142 according to the third embodiment. As shown in FIG. 14, as compared with the second embodiment of FIG. 10, the pretreatment unit 160b is changed to the pretreatment unit 160c, and the prediction unit 164b is changed to the prediction unit 164c.
  • the number of each of the noise removal filter, the data interpolation unit, and the offset processing unit is 8 in the preprocessing unit 160b.
  • the noise removal filters 161-1 to 161-8, the data interpolation units 162-1 to 162-8, and the offset processing units 163-1 to 163-8 execute the same processing as in the second embodiment.
  • the offset processing units 163-1 to 163-8 store the offset data in the storage 141.
  • the prediction unit 164c determines the wiring height of the target substrate using a machine learning model (here, a neural network as an example). More specifically, after the prediction unit 164c has performed a predetermined pretreatment on the output signals at each position facing the target substrate of the same "plurality" polishing table rotation orbit of the plurality of eddy current sensors. Preprocessing of the target board for a machine learning model (here, a neural network as an example) learned using a learning data set that takes the data of the above as an input and outputs the wiring height at at least one position of the board. By inputting the post-data, the wiring height at at least one position (here, M positions as an example) of the target board is determined.
  • a machine learning model here, a neural network as an example
  • FIG. 15 is a schematic diagram showing an example of a data flow during learning of the neural network used in the third embodiment.
  • data D1 after the preprocessing unit 160c executes preprocessing on the output signals output from the eddy current sensors 150-1 to 150-8 each time the polishing table rotates once. Is output and stored in the storage 141. Since data for each wafer radius position can be obtained for each of the eddy current sensors 150-1 to 150-8, the data D1 for one rotation of the polishing table is, as shown in FIG. 15, 8 rows ⁇ N columns (N). Is represented by a matrix of natural numbers).
  • the wafer radius position is in the range of -150 mm to 150 mm
  • the data of the wafer radius position of -150 mm is represented when the column index is 1
  • the wafer of 150 mm is represented when the column index is N. Represents radial position data.
  • the preprocessed data for which the number of rotations of the polishing table (hereinafter, also referred to as the number of rotations of the polishing table) is 5 turns is used as the input data of the training data set of the neural network MD3 used in the third embodiment.
  • the preprocessed data D2 for five times of polishing table rotations S-4 to S (S is an integer of 5 or more) is input as input data of the training data set of the neural network MD3.
  • the thickness distribution of the substrate before polishing (also referred to as the thickness profile before polishing) is measured. Then, the polishing time and the number of rotations of the polishing table are set. Then, polishing is performed at a set polishing time and a set polishing table rotation speed. After the polishing is completed, the thickness distribution of the substrate after polishing (also referred to as the thickness profile after polishing) is measured. Assuming that the polishing rate, which is the thickness removed by polishing per rotation of the polishing table 110, is constant, the wiring height for each wafer radius position at each polishing table rotation number S-4 to S is calculated. The wiring height array for each wafer radius position obtained by this calculation is used as the output data of the learning data set.
  • FIG. 16 is a schematic diagram showing an example of the neural network used in the third embodiment.
  • the neural network MD3 is, for example, a neural network of the K layer (K is a natural number)
  • the input layer has 5N + 3 neurons (N is a natural number)
  • the intermediate layer has 5N neurons.
  • the output layer has M neurons (M is a natural number).
  • Each neuron contained in the input layer and the intermediate layer is, for example, fully connected to the neurons in the next layer.
  • neurons in the middle layer weight their output to the input and feed it back.
  • the neurons L 1, 1 to L 1, N in the input layer of the neural network are in front of the output signals from 150-1, ..., 150-8 of the eddy current sensor with the same table rotation frequency of S-4 times.
  • Data 1 to data N of the vortex current sensor 150-1 which are signals corresponding to each wafer radius position after processing, data 1 to data N of the vortex current sensor 150-8 are input.
  • S-3, S-2, S-1, and S times After the number of table rotations has been preprocessed for the output signals from the eddy current sensors 150-1, ..., 150-8, respectively, S-3, S-2, S-1, and S times.
  • Data 1 to data N of the eddy current sensor 150-1 which are signals corresponding to each wafer radius position, ..., Data 1 to data N of the eddy current sensor 150-8 are input.
  • the thickness data (pad thickness data) of the polishing pad 111 and the rotation number data of the polishing table 110 (table) are stored in the neurons L 1,5N + 1 to L 1, U ⁇ 5 + 3 in the input layer of the neural network, respectively.
  • the rotation number data) and the rotation number data (carrier rotation number data) of the polishing head 120 are input.
  • the wiring heights in radii r 1 to radius r M are output from the output layers of the neural network, respectively.
  • FIG. 17 is a schematic diagram showing an example of data flow at the time of inference of the neural network used in the third embodiment.
  • the eddy current sensor 150-1 The pre-processing unit 160c executes pre-processing on the output signals of ⁇ 150-8.
  • the preprocessed data D3 is output from the preprocessing unit 160c, and the preprocessed data D3 is stored in the storage 141.
  • the prediction unit 164c obtains 5 preprocessed data from the storage 141 to i-4 to i (i is an integer of 5 or more) having the latest number of rotations of the polishing table. It is read, and the five read data D4 after preprocessing are input to the trained neural network MD3. As a result, the array height array is output from the trained neural network MD3.
  • the input of the machine learning model (here, the neural network MD3) is for the output signal at each position facing the target substrate in the plurality of polishing table rotation orbits of the plurality of eddy current sensors. This is the data after the preprocessing is executed.
  • the influence can be offset.
  • the estimation accuracy of the wiring height can be improved.
  • the wiring height can be estimated if there is no noise on the other output signals, so the wiring height can be estimated. The robustness of the estimation of noise can be improved.
  • the number of eddy current sensors may be 2 to 7 or 9 or more, may be one, or may be one or more.
  • the input of the machine learning model is performed after the preprocessing is executed for the output signals at each position facing the target substrate in the plurality of polishing table rotation orbits of the plurality of eddy current sensors.
  • the data is not limited to this, but after the preprocessing is executed for the output signal at each position facing the target substrate in the multiple polishing table rotation orbits of the "one" eddy current sensor. It may be data.
  • the order of processing of the noise removal filter 161, the data interpolation unit 162, and the offset processing unit 163 is not limited to this order, and is in no particular order.
  • the processor 142 relearns the trained machine learning model (for example, a neural network) by using the output signal of the eddy current sensor during the polishing process. You may let me. As a result, even after the polishing apparatus is operated, the output signal of the eddy current sensor during the polishing process is used for re-learning, so that the accuracy of predicting the wiring height can be improved.
  • the trained machine learning model for example, a neural network
  • processor 142 may be executed by another information processing system, or may be executed by an information processing system implemented on the cloud.
  • controller 140 described in the above-described embodiment may be configured by hardware or software.
  • a program that realizes at least a part of the functions of the controller 140 may be stored in a recording medium such as a flexible disk or a CD-ROM, read by a computer, and executed.
  • the recording medium is not limited to a removable one such as a magnetic disk or an optical disk, and may be a fixed recording medium such as a hard disk device or a memory.
  • a program that realizes at least a part of the functions of the controller 140 may be distributed via a communication line (including wireless communication) such as the Internet. Further, the program may be encrypted, modulated, compressed, and distributed via a wired line or wireless line such as the Internet, or stored in a recording medium.
  • a communication line including wireless communication
  • the program may be encrypted, modulated, compressed, and distributed via a wired line or wireless line such as the Internet, or stored in a recording medium.
  • the controller 140 may be operated by an information processing system including one or more information processing devices.
  • one of the information processing devices may be a computer, and the function may be realized as at least one means of the controller 140 by executing a predetermined program by the computer.
  • all the steps (steps) may be realized by automatic control by a computer. Further, the progress control between the processes may be manually performed while the computer is used to perform each process. Further, at least a part of the whole process may be manually performed.
  • the present invention is not limited to the above-described embodiment as it is, and at the implementation stage, the components can be modified and embodied within a range that does not deviate from the gist thereof.
  • various inventions can be formed by an appropriate combination of the plurality of components disclosed in the above-described embodiment. For example, some components may be removed from all the components shown in the embodiments. Furthermore, components over different embodiments may be combined as appropriate.
  • Polishing device 110 Polishing table 111 Polishing pad 120 Polishing head 121 Substrate 122 Air bag 1221-1224 Section 130 Liquid supply mechanism 140 Controller 141 Storage 142 Processor 143 Input / output interface 150 Eddy current sensor 160, 160b, 160c Preprocessing unit 161 Noise removal Filter 162 Data interpolation unit 163 Offset processing unit 164, 164b, 164c Prediction unit 165 Judgment unit 166 Pressure control unit

Landscapes

  • Engineering & Computer Science (AREA)
  • Mechanical Engineering (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Manufacturing & Machinery (AREA)
  • Automation & Control Theory (AREA)
  • Human Computer Interaction (AREA)
  • Power Engineering (AREA)
  • Microelectronics & Electronic Packaging (AREA)
  • Computer Hardware Design (AREA)
  • Condensed Matter Physics & Semiconductors (AREA)
  • Mechanical Treatment Of Semiconductor (AREA)
  • Finish Polishing, Edge Sharpening, And Grinding By Specific Grinding Devices (AREA)
  • Constituent Portions Of Griding Lathes, Driving, Sensing And Control (AREA)
  • Numerical Control (AREA)
  • Automatic Control Of Machine Tools (AREA)

Abstract

渦電流センサが設けられ且つ回転可能に構成された研磨テーブルと、当該研磨テーブルに対向し且つ回転可能に構成され且つ当該研磨テーブルと対向する面に基板が取り付け可能な研磨ヘッドと、対象基板の研磨処理中に、前記渦電流センサが対象基板に対向する各位置にある場合の出力信号に対して予め決められた前処理を実行して対象基板の前処理後データを生成し、当該渦電流センサが基板に対向する各位置にある場合の出力信号に対して予め決められた前処理を実行された後のデータを入力とし、当該基板の少なくとも一つの位置における配線高さを出力とする学習データセットを用いて学習済みの機械学習モデルに対して、前記対象基板の前処理後データを入力することによって、当該対象基板の少なくとも一つの位置における配線高さを決定するプロセッサと、を有する。

Description

研磨装置、情報処理システム、情報処理方法及びプログラム
 本発明は、研磨装置、情報処理システム、情報処理方法及びプログラムに関する。
 化学機械研磨(Chemical Mechanical Polishing:以下、CMPという)は、研磨剤(砥粒)自体が有する表面化学作用または研磨液に含まれる化学成分の作用によって、研磨剤と研磨対象物の相対運動による機械的研磨(表面除去)効果を増大させ、高速かつ平滑な研磨面を得る技術である。
 研磨装置は、研磨終点検出するコントローラを搭載して例えば渦電流センサを用いて、最適な研磨終了点の検出を行うことが行われている(特許文献1参照)。渦電流センサは、例えば研磨テーブルの下に設置され、研磨テーブルを貫く方向に磁力線を発生している。研磨テーブルが回転すると渦電流センサは研磨テーブルと共に回転し、トップリングに保持されたウエハの下を通過する。このとき、ウエハ面上に導電性の膜が存在すると、ウエハ面上に渦電流が発生する。渦電流が流れると当初の磁力線とは逆方向に磁力線が発生する。この逆方向に発生する磁力線の強度を測定することによって導電性の膜の厚さを計測する。
特開2005-121616号公報
 半導体の微細化によりCMP加工中の配線の高さをコントロールしたい需要がある。CMPを用いた研磨装置がウエハのCMP加工中に渦電流センサで配線パターンを持ったウエハを測定すると、凹凸を持った信号が観測できる。この凹凸と配線パターンのサイズ(パターン形状、幅、高さ)には相関がある。
 しかし、CMP加工中にはウエハと、研磨テーブルの下に固定された渦電流センサはそれぞれに円運動しており、また、配線パターンは製品により種々に変化するため、出現する凹凸パターンも様々であり、単純に配線高さ(導電性の膜の厚さ)を算出することができない。
 本発明は、上記問題に鑑みてなされたものであり、研磨中に基板の配線高さを推定することを可能とする研磨装置、情報処理システム、情報処理方法及びプログラムを提供することを目的とする。
 本発明の第1の態様に係る研磨装置は、渦電流センサが設けられ且つ回転可能に構成された研磨テーブルと、前記研磨テーブルに対向し且つ回転可能に構成され且つ前記研磨テーブルと対向する面に基板が取り付け可能な研磨ヘッドと、対象基板の研磨処理中に、前記渦電流センサが対象基板に対向する各位置にある場合の出力信号に対して予め決められた前処理を実行して対象基板の前処理後データを生成し、前記渦電流センサが基板に対向する各位置にある場合の出力信号に対して予め決められた前処理を実行された後のデータを入力とし、当該基板の少なくとも一つの位置における配線高さを出力とする学習データセットを用いて学習済みの機械学習モデルに対して、前記対象基板の前処理後データを入力することによって、当該対象基板の少なくとも一つの位置における配線高さを決定するプロセッサと、を備える。
 この構成によれば、渦電流センサが基板に対向する各位置にある場合の出力信号に対して予め決められた前処理を実行された後のデータを入力とし、当該基板の少なくとも一つの位置における配線高さを出力とする学習データセットを用いて学習済みの機械学習モデルに対して、対象基板の前処理後データを入力することによって、対象基板の少なくとも一つの位置における配線高さを推定することができる。
 本発明の第2の態様に係る研磨装置は、第1の態様に係る研磨装置であって、前記プロセッサは、当該決定された配線高さが予め決められた配線高さになった場合、前記対象基板の研磨を終了するよう制御する。
 この構成によれば、予め決められた配線高さになった場合に研磨を自動的に終了することができる。
 本発明の第3の態様に係る研磨装置は、第1または2の態様に係る研磨装置であって、前記研磨ヘッドには、基板を押圧するためのエアバッグが設けられており、前記プロセッサは、前記決定された配線高さの分布に応じて、前記エアバッグ内の圧力分布を制御する。
 この構成によれば、基板の研磨された面の高さ(例えば配線高さ)の均一性を向上させることができる。
 本発明の第4の態様に係る研磨装置は、第1から3のいずれかの態様に係る研磨装置であって、前記機械学習モデルの入力は、更に研磨パッドの厚さ、研磨テーブルの回転数、及び/または研磨ヘッドの回転数を含む。
 この構成によれば、研磨パッドの厚さ、研磨テーブルの回転数、及び/または研磨ヘッドの回転数によって、1回の削れる量が変わり得るので、これらのパラメータを一つ以上考慮することによって、配線高さの推定精度を向上させることができる。
 本発明の第5の態様に係る研磨装置は、第1から4のいずれかの態様に係る研磨装置であって、前記渦電流センサを複数備え、前記機械学習モデルの入力は、前記複数の前記渦電流センサの同じ研磨テーブル回転周回における前記対象基板に対向する各位置における出力信号に対して、前記前処理が実行された後のデータである。
 この構成によれば、複数の渦電流センサの同じ研磨テーブル回転周回の出力信号に対して、当該前処理が実行された後のデータを機械学習モデルの入力として用いることによって、同じ周回の出力信号を複数用いることで、一つの出力信号にノイズが載ったとしても他の出力信号にノイズが載っていなければ配線高さを推定することができる。これにより、配線高さの推定のロバスト性を向上させることができる。
 本発明の第6の態様に係る研磨装置は、第1から4のいずれかの態様に係る研磨装置であって、前記渦電流センサを複数備え、前記機械学習モデルの入力は、前記複数の前記渦電流センサの同じ複数の研磨テーブル回転周回の前記対象基板に対向する各位置における出力信号に対して、前記前処理が実行された後のデータである。
 この構成によれば、複数の周回の出力信号を用いることで、特定の渦電流センサが周回毎に基板を基準とする渦電流センサの移動軌跡が異なっていたとしても、その影響を相殺することができるので、配線高さの推定精度を向上させることができる。同じ周回の渦電流センサの出力信号を複数用いることで、一つの出力信号にノイズが載ったとしても他の出力信号にノイズが載っていなければ配線高さを推定することができるので、配線高さの推定のロバスト性を向上させることができる。
 本発明の第7の態様に係る研磨装置は、第1から4のいずれかの態様に係る研磨装置であって、前記機械学習モデルの入力は、一つの前記渦電流センサの複数の研磨テーブル回転周回における前記対象基板に対向する各位置における出力信号に対して、前記前処理が実行された後のデータである。
 この構成によれば、複数の周回の出力信号を用いることで、特定の渦電流センサが周回毎に基板を基準とする渦電流センサの移動軌跡が異なっていたとしても、その影響を相殺することができるので、配線高さの推定精度を向上させることができる。
 本発明の第8の態様に係る研磨装置は、第1から7のいずれかの態様に係る研磨装置であって、前記プロセッサは、研磨処理中の渦電流センサの出力信号を用いて、前記学習済みの機械学習モデルを再学習させる。
 この構成によれば、研磨装置を稼働した後も、研磨処理中の渦電流センサの出力信号を用いて、再学習するので、配線高さの予測精度を向上させることができる。
 本発明の第9の態様に係る情報処理システムは、対象基板の研磨処理中に、渦電流センサが対象基板に対向する各位置にある場合の出力信号に対して予め決められた前処理を実行して対象基板の前処理後データを生成する前処理部と、前記渦電流センサが基板に対向する各位置にある場合の出力信号に対して予め決められた前処理を実行された後のデータを入力とし、当該基板の少なくとも一つの位置における配線高さを出力とする学習データセットを用いて学習済みの機械学習モデルに対して、前記対象基板の前処理後データを入力することによって、当該対象基板の少なくとも一つの位置における配線高さを決定する予測部と、を備える。
 この構成によれば、渦電流センサが基板に対向する各位置にある場合の出力信号に対して予め決められた前処理を実行された後のデータを入力とし、当該基板の少なくとも一つの位置における配線高さを出力とする学習データセットを用いて学習済みの機械学習モデルに対して、対象基板の前処理後データを入力することによって、対象基板の少なくとも一つの位置における配線高さを推定することができる。
 本発明の第10の態様に係る情報処理方法は、対象基板の研磨処理中に、渦電流センサが対象基板に対向する各位置にある場合の出力信号に対して予め決められた前処理を実行して対象基板の前処理後データを生成する前処理ステップと、前記渦電流センサが基板に対向する各位置にある場合の出力信号に対して予め決められた前処理を実行された後のデータを入力とし、当該基板の少なくとも一つの位置における配線高さを出力とする学習データセットを用いて学習済みの機械学習モデルに対して、前記対象基板の前処理後データを入力することによって、当該対象基板の少なくとも一つの位置における配線高さを決定する予測ステップと、を有する。
 この構成によれば、渦電流センサが基板に対向する各位置にある場合の出力信号に対して予め決められた前処理を実行された後のデータを入力とし、当該基板の少なくとも一つの位置における配線高さを出力とする学習データセットを用いて学習済みの機械学習モデルに対して、対象基板の前処理後データを入力することによって、対象基板の少なくとも一つの位置における配線高さを推定することができる。
 本発明の第11の態様に係るプログラムは、コンピュータを、対象基板の研磨処理中に、渦電流センサが対象基板に対向する各位置にある場合の出力信号に対して予め決められた前処理を実行して対象基板の前処理後データを生成する前処理部と、前記渦電流センサが基板に対向する各位置にある場合の出力信号に対して予め決められた前処理を実行された後のデータを入力とし、当該基板の少なくとも一つの位置における配線高さを出力とする学習データセットを用いて学習済みの機械学習モデルに対して、前記対象基板の前処理後データを入力することによって、当該対象基板の少なくとも一つの位置における配線高さを決定する予測部と、として機能させるためのプログラムである。
 この構成によれば、渦電流センサが基板に対向する各位置にある場合の出力信号に対して予め決められた前処理を実行された後のデータを入力とし、当該基板の少なくとも一つの位置における配線高さを出力とする学習データセットを用いて学習済みの機械学習モデルに対して、対象基板の前処理後データを入力することによって、対象基板の少なくとも一つの位置における配線高さを推定することができる。
 本発明の一態様によれば、渦電流センサが基板に対向する各位置にある場合の出力信号に対して予め決められた前処理を実行された後のデータを入力とし、当該基板の少なくとも一つの位置における配線高さを出力とする学習データセットを用いて学習済みの機械学習モデルに対して、対象基板の前処理後データを入力することによって、対象基板の少なくとも一つの位置における配線高さを推定することができる。
一実施形態に係る研磨装置の概略正面図である。 本実施形態に係る配線高さを説明するための図である。 基板121に対する渦電流センサ150の水平方向の移動軌跡を示す模式図である。 基板121の下を通る渦電流センサ150が通っている間の渦電流センサ150の出力信号を表すグラフである。 第1の実施形態に係るプロセッサ142の機能ブロック図である。 第1の実施形態において用いられるニューラルネットワークの一例を示す模式図である。 第1の実施形態に係る処理の流れの一例を示すフローチャートである。 第1の実施形態の変形例に係るプロセッサ142の機能ブロック図である。 第1実施形態の変形例に係る処理の流れの一例を示すフローチャートである。 基板121に対する複数の渦電流センサの水平方向の移動軌跡を示す模式図である。 基板121の下を通る渦電流センサそれぞれが通っている間の渦電流センサそれぞれの出力信号を表すグラフの模式図である。 第2の実施形態に係るプロセッサ142の機能ブロック図である。 第2の実施形態において用いられるニューラルネットワークの一例を示す模式図である。 同じ渦電流センサのV回転目からV+3回転目までの出力信号の例を示す模式図である。 図12におけるV回転目からV+3回転目までの同じ渦電流センサの水平位置における水平方向の移動軌跡を示す模式図である。 第3の実施形態に係るプロセッサ142の機能ブロック図である。 第3の実施形態において用いられるニューラルネットワークの学習時のデータの流れの一例を示す模式図である。 第3の実施形態において用いられるニューラルネットワークの一例を示す模式図である。 第3の実施形態において用いられるニューラルネットワークの推論時のデータの流れの一例を示す模式図である。
 以下、各実施形態について、図面を参照しながら説明する。但し、必要以上に詳細な説明は省略する場合がある。例えば、既によく知られた事項の詳細説明や実質的に同一の構成に対する重複説明を省略する場合がある。これは、以下の説明が不必要に冗長になるのを避け、当業者の理解を容易にするためである。
 本実施形態では、配線パターンを持ったウエハをCMP研磨中の渦電流センサで測定して得られた出力信号と、その出力信号が測定された時の配線高さ(測定値でも、推定値でも良い)を機械学習モデル(ここでは一例としてニューラルネットワーク)に学習させる。この学習済みの機械学習モデル(ここでは一例としてニューラルネットワーク)を、CMP加工中に得られた出力信号に適用することにより、推定配線高さを決定する(すなわち膜厚値を推定する)。また、運用中に得られた、CMP加工中の渦電流波形データと、推定配線高さを用いて、学習済みの機械学習モデルを再学習することで、推定精度を改善する。
 図1は、一実施形態に係る研磨装置の概略正面図である。一実施形態に係る研磨装置100は、化学機械研磨(CMP)で基板を研磨するCMP装置である。なお、研磨装置100は、渦電流センサが設けられた研磨テーブルを回転させて基板を研磨する装置であればよい。
 図1に示すように、一実施形態に係る研磨装置100は、研磨テーブル110と、研磨ヘッド120と、液体供給機構130と、を備える。研磨装置100は、各構成要素を制御するためのコントローラ140を更に備えてもよい。コントローラ140は例えば、ストレージ141、プロセッサ142および入出力インタフェース143を備えてもよい。
 研磨テーブル110の研磨ヘッド120と対向する面には、研磨パッド111が着脱可能に取り付けられている。研磨ヘッド120は研磨テーブル110と対向するように設けられている。研磨ヘッド120のうち研磨テーブル110と対向する面には基板121が着脱可能に取り付けられている。液体供給機構130はスラリなどの研磨液を研磨パッド111に供給するよう構成されている。なお、液体供給機構130は、研磨液以外にも洗浄液または薬液などを供給するように構成されていてもよい。
 研磨装置100は、図示しない上下動機構により研磨ヘッド120を下降させて基板121を研磨パッド111に接触させることができる。ただし、上下動機構は研磨テーブル110を上下動させることができてもよい。研磨テーブル110および研磨ヘッド120は図示しないモータなどによって回転させられる。研磨装置100は、基板121と研磨パッド111とが接触した状態で研磨テーブル110および研磨ヘッド120の双方を回転させることで基板121を研磨する。
 研磨テーブル110の内部には渦電流センサ150が設けられている。具体的には例えば、渦電流センサ150は、研磨中の基板121の中心を通過する位置に設置されている。渦電流センサ150は基板121の表面の導電層に渦電流を誘起する。渦電流センサ150は更に、当該渦電流により生じる磁界に起因するインピーダンスの変化から基板121の表面の導電層の厚さ(以下、配線高さともいう)を検出する。渦電流センサ150(または渦電流センサ150に接続されたコントローラ140もしくは渦電流センサ150の出力を読み取ったオペレータ)は、検出された導電層の厚さから、基板研磨の終点を検知することができる。入出力インタフェース143は、渦電流センサ150に接続されており、渦電流センサ150によって検出された出力信号を渦電流センサ150から受け取る。
 研磨ヘッドには、基板121を押圧するためのエアバッグが設けられており、エアバッグ122は例えば、複数の区画1221~1224に分割されている。エアバッグ122は一例として研磨ヘッド120に設けられている。なお、それに加えてまたはそれに替えて、エアバッグ122は研磨テーブル110に設けられていてもよい。エアバッグ122は基板121の研磨圧力を基板121の領域ごとに調整するための部材である。エアバッグ122は、内部に導入された空気の圧力によって体積が変化するように構成されている。なお、「エア」バッグという名称ではあるが、空気以外の流体、たとえば窒素ガスや純水、がエアバッグ122に導入されてもよい。
 区画1221、1222、1223、1224はそれぞれ対応する圧力制御弁R1、R2、R3、R4に接続されている。圧力制御弁R1、R2、R3、R4は、コントローラ140に接続されており、コントローラ140からの制御信号に応じて、区画1221、1222、1223、1224に供給する圧力流体(例えば、ガス)の圧力を個別に調整する。これにより、区画1221~1224毎に圧力を調整することができる。
 図2は、本実施形態に係る配線高さを説明するための図である。図2の向かって左側の基板の断面図に示すように、研磨前の基板は、配線用の溝DPが形成されているベース層L12とベース層L12の上に設けられた金属層L11とを有する。ここでベース層L2は例えば、酸化膜(例えば、SiO2)または窒化膜である。 続いて、研磨装置100によって研磨することによって、金属層L11が削られて溝DP以外にベース層L12の上に載っている金属を除去すると、図2の向かって右側の基板の断面図のようになる。ここで、図2に示すように、溝DPの底から金属層L11の上面までの長さHが配線高さである。以下、基板121は一例としてウエハであるものとして説明する。
 図3Aは、基板121に対する渦電流センサ150の水平方向の移動軌跡を示す模式図である。研磨テーブル110が回転することにより、図3Aに示すように、渦電流センサ150は、矢印A1に示す軌跡で、基板121の下を通る。研磨テーブル110の回転数が予め決められているので、研磨テーブル110に固定された渦電流センサ150の速度は既知である。渦電流センサ150は、基板121(ここでは一例としてウエハ)の中心を通るように、渦電流センサ150及び研磨ヘッド120の基板121の位置が予め設定されている。これにより、プロセッサ142は、渦電流センサ150は一定の速度で円弧状に移動するので、渦電流センサ150が例えば所定の時間毎に移動する位置を計算することができ、この位置からウエハの半径方向の位置(以下、ウエハ半径位置という)を計算することができる。
 図3Bは、基板121の下を通る渦電流センサ150が通っている間の渦電流センサ150の出力信号を表すグラフである。横軸が渦電流センサ150が位置するウエハ半径位置であり、縦軸がセンサ出力である。ここでは、ウエハの半径が150mmであり、ウエハ半径位置が-150mmから150mmまで変化する際のセンサ出力を表している。このように、出力信号の波形には凹凸がある。
 図4は、第1の実施形態に係るプロセッサ142の機能ブロック図である。図4に示すように、プロセッサ142は、前処理部160、予測部164、判定部165として機能する。
 前処理部160は、対象基板の研磨処理中に、渦電流センサ150が対象基板に対向する各位置にある場合の出力信号に対して予め決められた前処理を実行して対象基板の前処理後データを生成する。ここで、前処理部160は、ノイズ除去フィルタ161、データ補間部162、及びオフセット処理部163を備える。これらの処理については、図6において後述する。
 予測部164は、機械学習モデル(ここでは一例としてニューラルネットワーク)を用いて、対象基板の配線高さを決定する。より詳細には、予測部164は、渦電流センサ150が基板に対向する各位置にある場合の出力信号に対して予め決められた前処理を実行された後のデータを入力とし、当該基板の少なくとも一つの位置における配線高さを出力とする学習データセットを用いて学習した機械学習モデル(ここでは一例としてニューラルネットワーク)に対して、当該対象基板の前処理後データを入力することによって、当該対象基板の少なくとも一つの位置(ここでは、一例としてM個の位置)における配線高さを決定する。
 図5は、第1の実施形態において用いられるニューラルネットワークの一例を示す模式図である。図5に示すように、ニューラルネットワークMD1は一例として、K層(Kは自然数)のニューラルネットワークで、入力層は、N+3個(Nは自然数)のニューロンを有し、中間層はN個のニューロンを有し、出力層はM個(Mは自然数)のニューロンを有する。入力層及び中間層に含まれる各ニューロンは、一例として、次の層のニューロンと全結合する。それに加えて中間層のニューロンは一例として、自身の出力を入力に重みづけしてフィードバックする。このように本実施形態に係るニューラルネットワークは、一例としてリカレントニューラルネットワーク(RNN)である。
 ある周回で基板の下を通過中の渦電流センサ150の出力信号で出現する出力波形または波形パターンは、それより前の周回基板の下を通過中の渦電流センサ150の出力信号(前スキャンの出力信号ともいう)の出力波形に関係がある。前スキャンの出力信号のデータを利用できるように、機械学習モデルは、リカレントニューラルネットワーク(RNN)またはリカレントニューラルネットワークの一種であるLSTM(Long short-term memory)を使うのが好ましい。
 ニューラルネットワークの入力層のニューロンL1,1~L1,Nには、各ウエハ半径位置に対応する前処理後の信号であるデータ1~データNが入力される。 また、ニューラルネットワークの入力層のニューロンL1,N+1~L1,N+3にはそれぞれ研磨パッド111の厚さデータ(以下、Pad厚さデータともいう)、研磨テーブル110の回転数データ(以下、テーブル回転数データともいう)、研磨ヘッド120の回転数データ(以下、キャリア回転数データともいう)が入力される。ニューラルネットワークの出力層からはそれぞれ、半径r1~半径rMにおける配線高さが出力される。
 すなわち、このニューラルネットワークの学習時には、学習データセットとして、各ウエハ半径位置に対応する前処理後の信号であるデータ1~データN、及びPad厚さデータ、テーブル回転数データ及びキャリア回転数データが入力データとされ、そのときの半径r1~半径rMにおける配線高さの測定値または推測値が出力データとして入力されて、各ニューロンの重み係数が更新される。ここで、測定値は、実際にウエハを研磨した後に計測された配線高さである。この重み係数の更新は、既存の更新方法(例えば、バックプロパゲーションなど)が用いられてもよい。
 続いて、図6を用いて本実施形態に係る処理の流れについて説明する。図6は、第1の実施形態に係る処理の流れの一例を示すフローチャートである。ここでは、ストレージ141には、学習済のニューラルネットワークにおける各ニューロンの重み係数が記憶されているものとして説明する。
 (ステップS101)まず、プロセッサ142はウエハ研磨を開始するよう制御する。
 (ステップS102)次にプロセッサ142は、ウエハの下を1回通過する際の渦電流センサの出力信号を順次、ストレージ141に蓄積する。
 以下のステップS103~S105の処理は、前処理部160の処理である。
 (ステップS103)次にノイズ除去フィルタ161は、渦電流センサの出力信号に対して、ノイズ除去フィルタ(ここでは一例としてローパスフィルタ(LPF))をかける。
 (ステップS104)次にデータ補間部162は、センサ値がないウエハ半径位置のデータを補間する。
 (ステップS105)次にオフセット処理部163は、データ補間後の信号に対して、予め決められた半径位置のデータを特定の値になるようオフセットする。これにより、ウエハ毎にばらつく直流成分を同じ特定の値にすることによってキャンセルすることができ、直流成分を除く交流成分の違いを学習することができる。オフセット処理部163は例えば、直流成分を除去するフィルタであってもよい。
 (ステップS106)次に、予測部164は、ストレージ141を参照して、学習済のニューラルネットワークへ、オフセット後のデータを入力して、配線高さを決定する。
 (ステップS107)次に、判定部165は、ステップS106で決定された配線高さが、予め決められた配線高さになったか否か判定する。配線高さが、予め決められた配線高さになっていないと判定された場合、処理がステップS102に戻って、ステップS102以降の処理が実行される。
 (ステップS108)ステップS107で配線高さが、予め決められた配線高さになったと判定された場合、プロセッサ142はウエハ研磨を終了するよう制御する。
 このように、プロセッサ142は、当該決定された配線高さが予め決められた配線高さになった場合、対象基板の研磨を終了するよう制御する。これにより、予め決められた配線高さになった場合に研磨を自動的に終了することができる。
 なお、第1の実施形態では、ニューラルネットワークが、基板の複数の位置における配線高さを出力するようにしたが、これに限らず、基板の一つの位置における配線高さを出力してもよい。
 以上、第1の実施形態に係る研磨装置は、渦電流センサ150が設けられ且つ回転可能に構成された研磨テーブル110と、研磨テーブル110に対向し且つ回転可能に構成され且つ研磨テーブル110と対向する面に基板が取り付け可能な研磨ヘッド120と、プロセッサ142とを備える。プロセッサ142は、対象基板の研磨処理中に、前記渦電流センサが対象基板に対向する各位置にある場合の出力信号に対して予め決められた前処理を実行して対象基板の前処理後データを生成する。そして、プロセッサ142は、渦電流センサ150が基板に対向する各位置にある場合の出力信号に対して予め決められた前処理を実行された後のデータを入力とし、当該基板の少なくとも一つの位置における配線高さを出力とする学習データセットを用いて学習済みの機械学習モデルに対して、当該対象基板の前処理後データを入力することによって、当該対象基板の少なくとも一つの位置における配線高さを決定する。
 この構成により、渦電流センサ150が基板に対向する各位置にある場合の出力信号に対して予め決められた前処理を実行された後のデータを入力とし、当該基板の少なくとも一つの位置における配線高さを出力とする学習データセットを用いて学習済みの機械学習モデルに対して、対象基板の前処理後データを入力することによって、対象基板の少なくとも一つの位置における配線高さを推定することができる。
 なお、本実施形態に係るニューラルネットワークの入力には、研磨パッドの厚さ、研磨テーブルの回転数、及び研磨ヘッドの回転数を含んだが、これに限らず、これらのうちの一つまたは二つが含まれていてもよい。すなわち、機械学習モデルの入力は、更に研磨パッドの厚さ、研磨テーブルの回転数、及び/または研磨ヘッドの回転数を含んでもよい。この構成により、研磨パッドの厚さ、研磨テーブルの回転数、及び/または研磨ヘッドの回転数によって、1回の削れる量が変わり得るので、これらのパラメータを一つ以上考慮することによって、配線高さの推定精度を向上させることができる。
 また、研磨パッドの厚さ、研磨テーブルの回転数、及び研磨ヘッドの回転数の入力がないニューラルネットワークであってもよい。
 <第1の実施形態の変形例>
 続いて第1の実施形態の変形例について説明する。第1の実施形態の変形例では、第1の実施形態に比べて、更にプロセッサ142が、決定された配線高さの分布に応じて、エアバッグ122内の圧力分布を制御する点が異なっている。
 図7は、第1の実施形態の変形例に係るプロセッサ142の機能ブロック図である。図7に示す第1の実施形態の変形例に係るプロセッサ142の機能ブロック図は、図4の第1の実施形態に係るプロセッサ142の機能ブロック図に比べて、圧力制御部166が追加されたものになっている。図7において、図4と同じ要素には同じ符号を付し、その説明を省略する。圧力制御部166は、予測部164によって決定された配線高さの分布に応じて、エアバッグ122内の圧力分布を制御する。
 図8は、第1実施形態の変形例に係る処理の流れの一例を示すフローチャートである。ステップS201~S205は、図6のステップS101~S105と同様であるので、その説明を省略する。
 (ステップS206)予測部164は、ストレージ141を参照して、学習済のニューラルネットワークへ、オフセット後のデータを入力して、配線高さの分布を決定する。
 (ステップS207)次に、圧力制御部166は、予測部164によって決定された配線高さの分布に応じて、エアバッグ122内の圧力分布を制御する。具体的には例えば、圧力制御部166は、対象の位置の配線高さが他の位置よりも高い場合、他の位置よりも削れていないので、その位置におけるエアバッグ122内の圧力を他の位置よりも圧力を高くしてもよい。また、それに加えてまたはそれに替えて、圧力制御部166は、対象の位置の配線高さが他の位置よりも低い場合、他の位置よりも削れているので、その位置におけるエアバッグ122内の圧力を他の位置よりも圧力を低くしてもよい。これにより、基板の研磨された面の高さ(例えば配線高さ)の均一性を向上させることができる。
 以降のステップS208~S209は、図6のステップS107~S108と同様であるので、その説明を省略する。
 <第2の実施形態>
 続いて第2の実施形態について説明する。第2の実施形態では、第1の実施形態と比べて、渦電流センサが複数設けられている点が異なっている。図9Aは、基板121に対する複数の渦電流センサの水平方向の移動軌跡を示す模式図である。図9Aに示すように、渦電流センサ150-1、…、150-U(Uは2以上の整数)までのU個の渦電流センサが設けられている。
 図9Bは、基板121の下を通る渦電流センサそれぞれが通っている間の渦電流センサそれぞれの出力信号を表すグラフの模式図である。図9Bに示すように、研磨テーブル110が1回転する毎に、渦電流センサ150-1、…、150-Uそれぞれの出力信号が得られるので、U個の出力信号が得られる。
 図10は、第2の実施形態に係るプロセッサ142の機能ブロック図である。図10に示すように、図7の第1の実施形態の変形例に比べて、前処理部160が前処理部160bに変更され、予測部164が予測部164bに変更されたものになっている。
 前処理部160bは、ノイズ除去フィルタ161-1、…、161-Uと、データ補間部162-1、…、162-Uと、オフセット処理部163-1、…、163-Uとを備える。ノイズ除去フィルタ161-1、…、161-Uはそれぞれ対応する渦電流センサ150-1、…、150-Uからの出力信号に対してノイズ除去フィルタをかける。データ補間部162-1、…、162-Uはそれぞれ対応するノイズ除去フィルタ後の信号に対して、センサ値がないウエハ半径位置のデータを補間する。オフセット処理部163-1、…、163-Uはそれぞれ対応するデータ補間後の信号に対して、予め決められた半径位置のデータを特定の値になるようオフセットする。
 予測部164bは、機械学習モデル(ここでは一例としてニューラルネットワーク)を用いて、対象基板の配線高さを決定する。より詳細には、予測部164bは、複数の渦電流センサ150-1~150-Uの同じ研磨テーブル回転周回の対象基板に対向する各位置における出力信号に対して予め決められた前処理を実行された後のデータを入力とし、当該基板の少なくとも一つの位置における配線高さを出力とする学習データセットを用いて学習した機械学習モデル(ここでは一例としてニューラルネットワーク)に対して、当該対象基板の前処理後データを入力することによって、当該対象基板の少なくとも一つの位置(ここでは、一例としてM個の位置)における配線高さを決定する。
 図11は、第2の実施形態において用いられるニューラルネットワークの一例を示す模式図である。図11に示すように、ニューラルネットワークMD2は一例として、K層(Kは自然数)のニューラルネットワークで、入力層は、U×N+3個(Nは自然数)のニューロンを有し、中間層はU×N個のニューロンを有し、出力層はM個(Mは自然数)のニューロンを有する。入力層及び中間層に含まれる各ニューロンは、一例として、次の層のニューロンと全結合する。それに加えて中間層のニューロンは、自身の出力を入力に重みづけしてフィードバックする。
 ニューラルネットワークの入力層のニューロンL1,1~L1,U×Nには、同じテーブル回転周回の渦電流センサ150-1、…、150-Uからの出力信号に対して前処理された後の各ウエハ半径位置に対応する信号である渦電流センサ150-1のデータ1~データN、…、渦電流センサ150-Uのデータ1~データNが入力される。
 また、ニューラルネットワークの入力層のニューロンL1,U×N+1~L1,U×N+3にはそれぞれ研磨パッド111の厚さデータ(Pad厚さデータ)、研磨テーブル110の回転数データ(テーブル回転数データ)、研磨ヘッド120の回転数データ(キャリア回転数データ)が入力される。ニューラルネットワークの出力層からはそれぞれ、半径r1~半径rMにおける配線高さが出力される。
 以上、第2の実施形態では、渦電流センサを複数備え、機械学習モデルの入力は、複数の渦電流センサ150-1~150-Uの同じ研磨テーブル回転周回における対象基板に対向する各位置における出力信号に対して、当該前処理が実行された後のデータである。
 これにより、複数の渦電流センサの同じ研磨テーブル回転周回の出力信号に対して、当該前処理が実行された後のデータを機械学習モデルの入力として用いることによって、同じ周回の出力信号を複数用いることで、一つの出力信号にノイズが載ったとしても他の出力信号にノイズが載っていなければ配線高さを推定することができる。これにより、配線高さの推定のロバスト性を向上させることができる。
 <第3の実施形態>
 続いて、第3の実施形態について説明する。第3の実施形態では、第2の実施形態と比べて、複数の渦電流センサの出力信号を用いることは共通しているが、更に複数の周回の出力信号を用いる点が異なっている。
 図12は、研磨テーブルのV回転目からV+3回転目までの同じ渦電流センサの出力信号の例を示す模式図である。Vは自然数である。縦軸がセンサ出力で、横軸がウエハ半径位置である。研磨回数が増えると、研磨されて僅かずつ配線高さが低くなっていく。
 図13は、図12におけるV回転目からV+3回転目までの同じ渦電流センサの基板を基準とする水平方向の移動軌跡を示す模式図である。図13に示すように、渦電流センサのV回転目からV+3回転目それぞれの水平方向の移動軌跡は、T1~T4である。このように、同じ渦電流センサであっても、研磨テーブルが回転する回数毎に、基板121を基準とする水平方向の移動軌跡が異なっている。本実施形態では、複数の渦電流センサの複数の周回の出力信号を用いることによって、その複数の周回の平均的な配線高さを推定する。
 図14は、第3の実施形態に係るプロセッサ142の機能ブロック図である。図14に示すように、図10の第2の実施形態に比べて、前処理部160bが前処理部160cに変更され、予測部164bが予測部164cに変更されたものになっている。
 本実施形態では、一例として、渦電流センサ150-1、…、150-8までの8個の渦電流センサを備える。これに応じて、前処理部160cは、前処理部160bにおいて、ノイズ除去フィルタ、データ補間部、オフセット処理部それぞれの数が8になったものである。ノイズ除去フィルタ161-1~161-8、データ補間部162-1~162-8、オフセット処理部163-1~163-8は第2の実施形態と同様の処理を実行する。そしてオフセット処理部163-1~163-8は、オフセット後のデータをストレージ141に保存する。
 予測部164cは、機械学習モデル(ここでは一例としてニューラルネットワーク)を用いて、対象基板の配線高さを決定する。より詳細には、予測部164cは、複数の渦電流センサの同じ“複数の”研磨テーブル回転周回の対象基板に対向する各位置における出力信号に対して予め決められた前処理を実行された後のデータを入力とし、当該基板の少なくとも一つの位置における配線高さを出力とする学習データセットを用いて学習した機械学習モデル(ここでは一例としてニューラルネットワーク)に対して、当該対象基板の前処理後データを入力することによって、当該対象基板の少なくとも一つの位置(ここでは、一例としてM個の位置)における配線高さを決定する。
 図15は、第3の実施形態において用いられるニューラルネットワークの学習時のデータの流れの一例を示す模式図である。図15に示すように、研磨テーブルが1回転する毎に、渦電流センサ150-1~150-8それぞれから出力された出力信号に対して前処理部160cが前処理を実行した後のデータD1が出力され、ストレージ141に保存される。渦電流センサ150-1~150-8それぞれについて、ウエハ半径位置それぞれのデータが得られるので、研磨テーブル1回転分のデータD1は、図15に示すように一例として、8行×N列(Nは自然数)の行列で表される。ここでは一例として、ウエハ半径位置は、-150mm~150mmの範囲であるので、列のインデックスが1の場合、-150mmのウエハ半径位置のデータを表わし、列のインデックスがNの場合、150mmのウエハ半径位置のデータを表す。
 研磨テーブルの回転回数(以下、研磨テーブル回転回数ともいう)が5回転分の前処理後のデータを、第3の実施形態において用いられるニューラルネットワークMD3の学習データセットの入力データとする。図15では、研磨テーブル回転回数がS-4~S(Sは5以上の整数)までの5回分の前処理後のデータD2がニューラルネットワークMD3の学習データセットの入力データとして入力される。
 まず、研磨前の基板の厚さ分布(研磨前の厚さプロファイルともいう)を測定する。そして、研磨時間、研磨テーブル回転数を設定する。そして、設定された研磨時間、設定された研磨テーブル回転数で研磨を実行する。研磨終了後に、研磨後の基板の厚さ分布(研磨後の厚さプロファイルともいう)を測定する。
 研磨テーブル110の1回転あたりの研磨で除去される厚みである研磨レートが一定と仮定して、各研磨テーブル回転回数S-4~Sでのウエハ半径位置毎の配線高さを計算する。この計算で得られたウエハ半径位置毎の配線高さ配列を学習データセットの出力データとする。
 図16は、第3の実施形態において用いられるニューラルネットワークの一例を示す模式図である。図15に示すように、ニューラルネットワークMD3は一例として、K層(Kは自然数)のニューラルネットワークで、入力層は、5N+3個(Nは自然数)のニューロンを有し、中間層は5N個のニューロンを有し、出力層はM個(Mは自然数)のニューロンを有する。入力層及び中間層に含まれる各ニューロンは、一例として、次の層のニューロンと全結合する。それに加えて中間層のニューロンは、自身の出力を入力に重みづけしてフィードバックする。
 ニューラルネットワークの入力層のニューロンL1,1~L1,Nには、テーブル回転回数が同じS-4回の渦電流センサの150-1、…、150-8からの出力信号に対して前処理された後の各ウエハ半径位置に対応する信号である渦電流センサ150-1のデータ1~データN、…、渦電流センサ150-8のデータ1~データNが入力される。
 同様にして、テーブル回転回数がS-3、S-2、S-1、S回それぞれの渦電流センサの150-1、…、150-8からの出力信号に対して前処理された後の各ウエハ半径位置に対応する信号である渦電流センサ150-1のデータ1~データN、…、渦電流センサ150-8のデータ1~データNが入力される。
 また、ニューラルネットワークの入力層のニューロンL1,5N+1~L1,U×5+3にはそれぞれ研磨パッド111の厚さデータ(Pad厚さデータ)、研磨テーブル110の回転数データ(テーブル回転数データ)、研磨ヘッド120の回転数データ(キャリア回転数データ)が入力される。ニューラルネットワークの出力層からはそれぞれ、半径r1~半径rMにおける配線高さが出力される。
 図17は、第3の実施形態において用いられるニューラルネットワークの推論時のデータの流れの一例を示す模式図である。図17に示すように、研磨処理中において、研磨テーブルが1回転する毎(あるいは渦電流センサ150-1~150-8がそれぞれ基板121の下を通る毎に)に、渦電流センサ150-1~150-8の出力信号に対して前処理部160cが前処理を実行する。これによって、前処理部160cから前処理後のデータD3が出力され、この前処理後のデータD3がストレージ141に保存される。
 そして、予測部164cは、研磨テーブルが5回転する毎に、ストレージ141から研磨テーブル回転回数が直近のi-4~i(iは5以上の整数)までの5個の前処理後のデータを読み出し、この読み出された5個の前処理後のデータD4が学習済みのニューラルネットワークMD3に入力される。これにより、学習済みのニューラルネットワークMD3から、配列高さ配列が出力される。
 このように、第3の実施形態では、機械学習モデル(ここではニューラルネットワークMD3)の入力は、複数の渦電流センサの複数の研磨テーブル回転周回における対象基板に対向する各位置における出力信号に対して、前処理が実行された後のデータである。
 これにより、複数の周回の出力信号を用いることで、特定の渦電流センサが周回毎に基板を基準とする渦電流センサの移動軌跡が異なっていたとしても、その影響を相殺することができるので、配線高さの推定精度を向上させることができる。同じ周回の渦電流センサの出力信号を複数用いることで、一つの出力信号にノイズが載ったとしても他の出力信号にノイズが載っていなければ配線高さを推定することができるので、配線高さの推定のロバスト性を向上させることができる。
 なお、第3の実施形態において、渦電流センサは2~7個または9個以上であってもよいし、一つであってもよく、一つ以上であればよい。
 なお、第3の実施形態では、機械学習モデルの入力は、複数の渦電流センサの複数の研磨テーブル回転周回における対象基板に対向する各位置における出力信号に対して、前処理が実行された後のデータであるとしたが、これに限らず、“一つの”渦電流センサの複数の研磨テーブル回転周回における対象基板に対向する各位置における出力信号に対して、前処理が実行された後のデータであってもよい。これにより、複数の周回の出力信号を用いることで、特定の渦電流センサが周回毎に基板を基準とする渦電流センサの移動軌跡が異なっていたとしても、その影響を相殺することができるので、配線高さの推定精度を向上させることができる。
 なお、ノイズ除去フィルタ161、データ補間部162、及びオフセット処理部163の処理の順番は、この順番に限ったものではなく、順不同である。
 なお、各実施形態において、学習済みの機械学習モデルが完成後に、プロセッサ142は、研磨処理中の渦電流センサの出力信号を用いて、学習済みの機械学習モデル(例えば、ニューラルネットワーク)を再学習させてもよい。これにより、研磨装置を稼働した後も、研磨処理中の渦電流センサの出力信号を用いて、再学習するので、配線高さの予測精度を向上させることができる。
 なお、プロセッサ142の処理の一部または全部を、別の情報処理システムが実行してもよいし、クラウド上に実装された情報処理システムが実行してもよい。
 なお、上述した実施形態で説明したコントローラ140の少なくとも一部は、ハードウェアで構成してもよいし、ソフトウェアで構成してもよい。ハードウェアで構成する場合には、コントローラ140の少なくとも一部の機能を実現するプログラムをフレキシブルディスクやCD-ROM等の記録媒体に収納し、コンピュータに読み込ませて実行させてもよい。記録媒体は、磁気ディスクや光ディスク等の着脱可能なものに限定されず、ハードディスク装置やメモリなどの固定型の記録媒体でもよい。
 また、コントローラ140の少なくとも一部の機能を実現するプログラムを、インターネット等の通信回線(無線通信も含む)を介して頒布してもよい。さらに、同プログラムを暗号化したり、変調をかけたり、圧縮した状態で、インターネット等の有線回線や無線回線を介して、あるいは記録媒体に収納して頒布してもよい。
 さらに、一つまたは複数の情報処理装置を含む情報処理システムによってコントローラ140を機能させてもよい。複数の情報処理装置を用いる場合、情報処理装置のうちの1つをコンピュータとし、当該コンピュータが所定のプログラムを実行することによりコントローラ140の少なくとも1つの手段として機能が実現されてもよい。
 また、方法の発明においては、全ての工程(ステップ)をコンピュータによって自動制御で実現するようにしてもよい。また、各工程をコンピュータに実施させながら、工程間の進行制御を人の手によって実施するようにしてもよい。また、さらには、全工程のうちの少なくとも一部を人の手によって実施するようにしてもよい。
 以上、本発明は上記実施形態そのままに限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を変形して具体化できる。また、上記実施形態に開示されている複数の構成要素の適宜な組み合わせにより、種々の発明を形成できる。例えば、実施形態に示される全構成要素から幾つかの構成要素を削除してもよい。更に、異なる実施形態にわたる構成要素を適宜組み合わせてもよい。
100 研磨装置
110 研磨テーブル
111 研磨パッド
120 研磨ヘッド
121 基板
122 エアバッグ
1221~1224 区画
130 液体供給機構
140 コントローラ
141 ストレージ
142 プロセッサ
143 入出力インタフェース
150 渦電流センサ
160、160b、160c 前処理部
161 ノイズ除去フィルタ
162 データ補間部
163 オフセット処理部
164、164b、164c 予測部
165 判定部
166 圧力制御部

 

Claims (11)

  1.  渦電流センサが設けられ且つ回転可能に構成された研磨テーブルと、
     前記研磨テーブルに対向し且つ回転可能に構成され且つ前記研磨テーブルと対向する面に基板が取り付け可能な研磨ヘッドと、
     対象基板の研磨処理中に、前記渦電流センサが対象基板に対向する各位置にある場合の出力信号に対して予め決められた前処理を実行して対象基板の前処理後データを生成し、前記渦電流センサが基板に対向する各位置にある場合の出力信号に対して予め決められた前処理を実行された後のデータを入力とし、当該基板の少なくとも一つの位置における配線高さを出力とする学習データセットを用いて学習済みの機械学習モデルに対して、前記対象基板の前処理後データを入力することによって、当該対象基板の少なくとも一つの位置における配線高さを決定するプロセッサと、
     を備える研磨装置。
  2.  前記プロセッサは、当該決定された配線高さが予め決められた配線高さになった場合、前記対象基板の研磨を終了するよう制御する
     請求項1に記載の研磨装置。
  3.  前記研磨ヘッドには、基板を押圧するためのエアバッグが設けられており、
     前記プロセッサは、前記決定された配線高さの分布に応じて、前記エアバッグ内の圧力分布を制御する
     請求項1または2に記載の研磨装置。
  4.  前記機械学習モデルの入力は、更に研磨パッドの厚さ、研磨テーブルの回転数、及び/または研磨ヘッドの回転数を含む
     請求項1から3のいずれか一項に記載の研磨装置。
  5.  前記渦電流センサを複数備え、
     前記機械学習モデルの入力は、前記複数の前記渦電流センサの同じ研磨テーブル回転周回における前記対象基板に対向する各位置における出力信号に対して、前記前処理が実行された後のデータである
     請求項1から4のいずれか一項に記載の研磨装置。
  6.  前記渦電流センサを複数備え、
     前記機械学習モデルの入力は、前記複数の前記渦電流センサの複数の研磨テーブル回転周回における前記対象基板に対向する各位置における出力信号に対して、前記前処理が実行された後のデータである
     請求項1から4のいずれか一項に記載の研磨装置。
  7.  前記機械学習モデルの入力は、一つの前記渦電流センサの複数の研磨テーブル回転周回における前記対象基板に対向する各位置における出力信号に対して、前記前処理が実行された後のデータである
     請求項1から4のいずれか一項に記載の研磨装置。
  8.  前記プロセッサは、研磨処理中の渦電流センサの出力信号を用いて、前記学習済みの機械学習モデルを再学習させる
     請求項1から7のいずれか一項に記載の研磨装置。
  9.  対象基板の研磨処理中に、渦電流センサが対象基板に対向する各位置にある場合の出力信号に対して予め決められた前処理を実行して対象基板の前処理後データを生成する前処理部と、
     前記渦電流センサが基板に対向する各位置にある場合の出力信号に対して予め決められた前処理を実行された後のデータを入力とし、当該基板の少なくとも一つの位置における配線高さを出力とする学習データセットを用いて学習済みの機械学習モデルに対して、前記対象基板の前処理後データを入力することによって、当該対象基板の少なくとも一つの位置における配線高さを決定する予測部と、
     を備える情報処理システム。
  10.  対象基板の研磨処理中に、渦電流センサが対象基板に対向する各位置にある場合の出力信号に対して予め決められた前処理を実行して対象基板の前処理後データを生成する前処理ステップと、
     前記渦電流センサが基板に対向する各位置にある場合の出力信号に対して予め決められた前処理を実行された後のデータを入力とし、当該基板の少なくとも一つの位置における配線高さを出力とする学習データセットを用いて学習済みの機械学習モデルに対して、前記対象基板の前処理後データを入力することによって、当該対象基板の少なくとも一つの位置における配線高さを決定する予測ステップと、
     を有する情報処理方法。
  11.  コンピュータを、
     対象基板の研磨処理中に、渦電流センサが対象基板に対向する各位置にある場合の出力信号に対して予め決められた前処理を実行して対象基板の前処理後データを生成する前処理部と、
     前記渦電流センサが基板に対向する各位置にある場合の出力信号に対して予め決められた前処理を実行された後のデータを入力とし、当該基板の少なくとも一つの位置における配線高さを出力とする学習データセットを用いて学習済みの機械学習モデルに対して、前記対象基板の前処理後データを入力することによって、当該対象基板の少なくとも一つの位置における配線高さを決定する予測部と、
     として機能させるためのプログラム。
PCT/JP2020/035106 2019-10-04 2020-09-16 研磨装置、情報処理システム、情報処理方法及びプログラム WO2021065516A1 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
US17/765,388 US20220371151A1 (en) 2019-10-04 2020-09-16 Polishing apparatus, information processing system, information processing method, and program

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2019183750A JP2021058955A (ja) 2019-10-04 2019-10-04 研磨装置、情報処理システム、情報処理方法及びプログラム
JP2019-183750 2019-10-04

Publications (1)

Publication Number Publication Date
WO2021065516A1 true WO2021065516A1 (ja) 2021-04-08

Family

ID=75337975

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2020/035106 WO2021065516A1 (ja) 2019-10-04 2020-09-16 研磨装置、情報処理システム、情報処理方法及びプログラム

Country Status (4)

Country Link
US (1) US20220371151A1 (ja)
JP (1) JP2021058955A (ja)
TW (1) TW202114814A (ja)
WO (1) WO2021065516A1 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2024508936A (ja) * 2021-03-05 2024-02-28 アプライド マテリアルズ インコーポレイテッド タイムベースの一連の画像を使用したcmp構成要素の動作不良の検出
TWI792559B (zh) * 2021-09-13 2023-02-11 中國砂輪企業股份有限公司 可感測研磨狀態的研磨工具及包含其的研磨系統

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003021501A (ja) * 2000-11-24 2003-01-24 Ebara Corp 渦電流センサ
US20180150052A1 (en) * 2016-11-30 2018-05-31 Applied Materials, Inc. Spectrographic monitoring using a neural network
US20180304435A1 (en) * 2017-04-21 2018-10-25 Applied Materials, Inc. Polishing apparatus using neural network for monitoring

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003021501A (ja) * 2000-11-24 2003-01-24 Ebara Corp 渦電流センサ
US20180150052A1 (en) * 2016-11-30 2018-05-31 Applied Materials, Inc. Spectrographic monitoring using a neural network
US20180304435A1 (en) * 2017-04-21 2018-10-25 Applied Materials, Inc. Polishing apparatus using neural network for monitoring

Also Published As

Publication number Publication date
JP2021058955A (ja) 2021-04-15
US20220371151A1 (en) 2022-11-24
TW202114814A (zh) 2021-04-16

Similar Documents

Publication Publication Date Title
WO2021065516A1 (ja) 研磨装置、情報処理システム、情報処理方法及びプログラム
JP7441889B2 (ja) 機械学習とパッドの厚さの補正を使用した研磨装置
JP7227158B2 (ja) モニタリング用のニューラルネットワークを用いた研磨装置
US11731238B2 (en) Monitoring of polishing pad texture in chemical mechanical polishing
CN111133560A (zh) 使用机器学习方式以产生工艺控制参数的半导体制造
JP7475462B2 (ja) 隣接する導電層のスタックの研磨中のプロファイル制御
WO2021193063A1 (ja) ワークピースの化学機械研磨システム、演算システム、および化学機械研磨のシミュレーションモデルを作成する方法
JP2018065212A (ja) 基板処理制御システム、基板処理制御方法、およびプログラム
US20220266414A1 (en) Control method for processing of a substrate
TW202235214A (zh) 用於對保持環進行分類的機器學習
JP2024508932A (ja) 基板歳差運動を伴う基板研磨のための処理パラメータの制御
WO2021262450A1 (en) Determination of substrate layer thickness with polishing pad wear compensation
WO2023162579A1 (ja) 研磨終点検出方法、研磨終点検出システム、研磨装置、およびコンピュータ読み取り可能な記録媒体
TW202411017A (zh) 針對墊子厚度使用機器學習及補償的拋光裝置、拋光系統、方法及電腦儲存媒體
TW202239523A (zh) 基板處理裝置

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 20873285

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 20873285

Country of ref document: EP

Kind code of ref document: A1