WO2024029236A1 - 情報処理装置、推論装置、機械学習装置、情報処理方法、推論方法、及び、機械学習方法 - Google Patents

情報処理装置、推論装置、機械学習装置、情報処理方法、推論方法、及び、機械学習方法 Download PDF

Info

Publication number
WO2024029236A1
WO2024029236A1 PCT/JP2023/023932 JP2023023932W WO2024029236A1 WO 2024029236 A1 WO2024029236 A1 WO 2024029236A1 JP 2023023932 W JP2023023932 W JP 2023023932W WO 2024029236 A1 WO2024029236 A1 WO 2024029236A1
Authority
WO
WIPO (PCT)
Prior art keywords
polishing
information
reliability
end point
state information
Prior art date
Application number
PCT/JP2023/023932
Other languages
English (en)
French (fr)
Inventor
隆一郎 三谷
Original Assignee
株式会社荏原製作所
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 株式会社荏原製作所 filed Critical 株式会社荏原製作所
Publication of WO2024029236A1 publication Critical patent/WO2024029236A1/ja

Links

Images

Classifications

    • BPERFORMING OPERATIONS; TRANSPORTING
    • B24GRINDING; POLISHING
    • B24BMACHINES, DEVICES, OR PROCESSES FOR GRINDING OR POLISHING; DRESSING OR CONDITIONING OF ABRADING SURFACES; FEEDING OF GRINDING, POLISHING, OR LAPPING AGENTS
    • B24B37/00Lapping machines or devices; Accessories
    • B24B37/005Control means for lapping machines or devices
    • B24B37/013Devices or means for detecting lapping completion
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B24GRINDING; POLISHING
    • B24BMACHINES, DEVICES, OR PROCESSES FOR GRINDING OR POLISHING; DRESSING OR CONDITIONING OF ABRADING SURFACES; FEEDING OF GRINDING, POLISHING, OR LAPPING AGENTS
    • B24B49/00Measuring or gauging equipment for controlling the feed movement of the grinding tool or work; Arrangements of indicating or measuring equipment, e.g. for indicating the start of the grinding operation
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B24GRINDING; POLISHING
    • B24BMACHINES, DEVICES, OR PROCESSES FOR GRINDING OR POLISHING; DRESSING OR CONDITIONING OF ABRADING SURFACES; FEEDING OF GRINDING, POLISHING, OR LAPPING AGENTS
    • B24B49/00Measuring or gauging equipment for controlling the feed movement of the grinding tool or work; Arrangements of indicating or measuring equipment, e.g. for indicating the start of the grinding operation
    • B24B49/12Measuring or gauging equipment for controlling the feed movement of the grinding tool or work; Arrangements of indicating or measuring equipment, e.g. for indicating the start of the grinding operation involving optical means
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B19/00Programme-control systems
    • G05B19/02Programme-control systems electric
    • G05B19/418Total factory control, i.e. centrally controlling a plurality of machines, e.g. direct or distributed numerical control [DNC], flexible manufacturing systems [FMS], integrated manufacturing systems [IMS] or computer integrated manufacturing [CIM]
    • HELECTRICITY
    • H01ELECTRIC ELEMENTS
    • H01LSEMICONDUCTOR DEVICES NOT COVERED BY CLASS H10
    • H01L21/00Processes or apparatus adapted for the manufacture or treatment of semiconductor or solid state devices or of parts thereof
    • H01L21/02Manufacture or treatment of semiconductor devices or of parts thereof
    • HELECTRICITY
    • H01ELECTRIC ELEMENTS
    • H01LSEMICONDUCTOR DEVICES NOT COVERED BY CLASS H10
    • H01L21/00Processes or apparatus adapted for the manufacture or treatment of semiconductor or solid state devices or of parts thereof
    • H01L21/02Manufacture or treatment of semiconductor devices or of parts thereof
    • H01L21/04Manufacture or treatment of semiconductor devices or of parts thereof the devices having potential barriers, e.g. a PN junction, depletion layer or carrier concentration layer
    • H01L21/18Manufacture or treatment of semiconductor devices or of parts thereof the devices having potential barriers, e.g. a PN junction, depletion layer or carrier concentration layer the devices having semiconductor bodies comprising elements of Group IV of the Periodic Table or AIIIBV compounds with or without impurities, e.g. doping materials
    • H01L21/30Treatment of semiconductor bodies using processes or apparatus not provided for in groups H01L21/20 - H01L21/26
    • H01L21/302Treatment of semiconductor bodies using processes or apparatus not provided for in groups H01L21/20 - H01L21/26 to change their surface-physical characteristics or shape, e.g. etching, polishing, cutting
    • H01L21/304Mechanical treatment, e.g. grinding, polishing, cutting

Definitions

  • the present invention relates to an information processing device, an inference device, a machine learning device, an information processing method, an inference method, and a machine learning method.
  • a substrate processing apparatus that performs various processes on substrates such as semiconductor wafers
  • CMP chemical mechanical polishing
  • a substrate processing apparatus for example, a polishing table having a polishing pad is rotated and a polishing liquid (slurry) is supplied to the polishing pad from a liquid supply nozzle, and a polishing head called a top ring presses a substrate against the polishing pad. Then, the substrate is chemically and mechanically polished. Then, in order to remove foreign matter such as polishing debris adhering to the polished substrate, a cleaning tool is brought into contact with the polished substrate while supplying substrate cleaning fluid, and the substrate is then dried. processing is completed, and the process moves on to the next substrate.
  • slurry polishing liquid
  • polishing apparatuses detect the end point of polishing by detecting changes in frictional force, changes in motor current, or changes in physical quantities of the wafer.
  • Patent Document 1 includes a learned model that machine-learns the waveform of measurement data from the start of polishing to the end of polishing that was output during past polishing from each of multiple types of end point detection sensors provided in one polishing unit. Then, the end point is detected by inputting the measurement data from the start of polishing up to the current point that is output from each of the multiple types of end point detection sensors during new polishing, and estimating whether or not the current point is the timing of the end point indicating the end of polishing.
  • a technique for improving the accuracy of is disclosed.
  • the present invention provides information that makes it possible to appropriately predict reliability information of a polishing end point detection function that indicates the reliability of an end point detection function that detects that chemical mechanical polishing processing has reached the end point.
  • the purpose of the present invention is to provide a processing device, an inference device, a machine learning device, an information processing method, an inference method, and a machine learning method.
  • an information processing device includes: Contains at least one of wear-out state information indicating the wear-out state of the constituent elements of the substrate processing apparatus in chemical mechanical polishing processing of the substrate performed by the substrate processing apparatus, and processing state information indicating the processing state during the polishing process.
  • an information acquisition unit that acquires reliability deterioration factor state information
  • Machine learning was used to learn the correlation between the reliability reduction factor state information and the reliability information of a polishing end point detection function that indicates the reliability of the end point detection function that detects that the chemical mechanical polishing process has reached the end point.
  • a state prediction unit that predicts reliability information of the polishing end point detection function with respect to the reliability reduction factor state information by inputting the reliability reduction factor state information acquired by the information acquisition unit into a learning model; equipped with
  • wear state information indicating the wear state of the constituent elements of the substrate processing apparatus in chemical mechanical polishing processing, and processing state information indicating the processing state during polishing processing;
  • the reliability deterioration factor status information including at least one of Reliability information of the polishing end point detection function, which indicates the reliability of the end point detection function that detects that the end point has been reached, can be appropriately predicted.
  • FIG. 1 is an overall configuration diagram showing an example of a substrate processing system 1.
  • FIG. FIG. 2 is a plan view showing an example of a substrate processing apparatus 2.
  • FIG. FIG. 3 is a perspective view showing an example of first to fourth polishing sections 22A to 22D. 3 is a cross-sectional view schematically showing an example of a top ring 221.
  • FIG. 1 is a block diagram showing an example of a substrate processing apparatus 2.
  • FIG. 9 is a hardware configuration diagram showing an example of a computer 900.
  • FIG. 3 is a data configuration diagram showing an example of production history information 30 managed by a database device 3.
  • FIG. 3 is a data configuration diagram showing an example of polishing test information 31 managed by the database device 3.
  • FIG. 2 is a block diagram showing an example of a machine learning device 4 according to the first embodiment. It is a diagram showing an example of a first learning model 10A and first learning data 11A.
  • 3 is a flowchart illustrating an example of a machine learning method by the machine learning device 4.
  • FIG. FIG. 2 is a block diagram showing an example of an information processing device 5 according to the first embodiment.
  • FIG. 2 is a functional explanatory diagram showing an example of the information processing device 5 according to the first embodiment.
  • 5 is a flowchart illustrating an example of an information processing method by the information processing device 5.
  • FIG. FIG. 7 is a schematic diagram for explaining an optical sensor 226 provided on a polishing table 220 according to a second embodiment.
  • FIG. 1 is an overall configuration diagram showing an example of a substrate processing system 1.
  • the substrate processing system 1 includes a chemical mechanical polishing process (hereinafter referred to as "polishing process”) for flattening the surface of a substrate W such as a semiconductor wafer (hereinafter referred to as "wafer”), It functions as a system that manages a series of substrate processing including cleaning processing for cleaning the wafer W and the like.
  • polishing process chemical mechanical polishing process for flattening the surface of a substrate W such as a semiconductor wafer (hereinafter referred to as "wafer")
  • the substrate processing system 1 includes a substrate processing device 2, a database device 3, a machine learning device 4, an information processing device 5, and a user terminal device 6 as its main components.
  • Each of the devices 2 to 6 is configured with, for example, a general-purpose or dedicated computer (see FIG. 6 described later), and is connected to a wired or wireless network 7 to collect various data (some data is shown in FIG. 1). (indicated by dotted line arrows) can be mutually transmitted and received. Note that the number of the devices 2 to 6 and the connection configuration of the network 7 are not limited to the example shown in FIG. 1, and may be changed as appropriate.
  • the substrate processing apparatus 2 is composed of a plurality of units, and performs a series of substrate processing on one or more wafers W, such as loading, polishing, cleaning, drying, film thickness measurement, and unloading. This is a device that performs each.
  • the substrate processing apparatus 2 includes apparatus setting information 265 consisting of a plurality of apparatus parameters set for each unit, and substrate recipe information 266 that defines polishing process status information for polishing processes, cleaning process conditions for cleaning processes, etc. Control the operation of each unit while referring to
  • the substrate processing device 2 transmits various reports R to the database device 3, user terminal device 6, etc. according to the operation of each unit.
  • Various reports R include, for example, process information that identifies the target wafer W when substrate processing is performed, equipment status information that indicates the status of each unit when each process is performed, and substrate processing apparatus 2.
  • the information includes event information detected by the system, operation information of users (operators, production managers, maintenance managers, etc.) on the substrate processing apparatus 2, and the like.
  • the database device 3 includes production history information 30 regarding the history of substrate processing performed on wafers W for main production, and a test of polishing processing on dummy wafers for testing (hereinafter referred to as "polishing test"). This is a device that manages polishing test information 31 regarding the history of polishing tests performed.
  • the database device 3 may also store device setting information 265 and substrate recipe information 266, and in that case, the substrate processing device 2 may refer to these information. good.
  • the database device 3 receives various reports R from the substrate processing device 2 at any time when the substrate processing device 2 performs substrate processing on wafers W for main production, and registers them in the production history information 30. , the production history information 30 stores reports R regarding substrate processing.
  • the database device 3 receives various reports R (including at least device status information) from the substrate processing device 2 at any time when the substrate processing device 2 performs a polishing test on a dummy wafer for testing, and stores polishing test information. 31 and register the test results of the polishing test in association with each other, the polishing test information 31 accumulates the report R and the test results regarding the polishing test.
  • reports R including at least device status information
  • the dummy wafer is a jig that simulates the wafer W.
  • a dummy wafer sensor such as a pressure sensor or a temperature sensor is provided on or inside the dummy wafer to measure the state of the wafer W when the polishing process is performed, and the measured values of the dummy wafer sensor are used as the test results. It is registered in the polishing test information 31.
  • the dummy wafer sensor may be provided at one or more locations on the substrate surface of the dummy wafer, or may be provided on the substrate surface of the dummy wafer.
  • the polishing test may be performed in the substrate processing apparatus 2 for main production, or may be performed in a polishing test apparatus (not shown) for testing that can reproduce the same polishing process as the substrate processing apparatus 2. good.
  • the machine learning device 4 operates as a subject of the learning phase of machine learning, and, for example, acquires a part of the polishing test information 31 from the database device 3 as the first learning data 11A, and uses it in the information processing device 5.
  • a first learning model 10A is generated by machine learning.
  • the trained first learning model 10A is provided to the information processing device 5 via the network 7, a recording medium, or the like.
  • the information processing device 5 operates as a subject in the inference phase of machine learning, and uses the first learning model 10A generated by the machine learning device 4 to perform polishing processing by the substrate processing device 2 on wafers W for main production.
  • the state of the wafer W is predicted when the polishing end point detection function is performed, and the reliability information of the polishing end point detection function, which is the predicted result, is transmitted to the database device 3, user terminal device 6, etc.
  • the timing at which the information processing device 5 predicts the reliability information of the polishing end point detection function may be after the polishing process is performed (post-event prediction process) or while the polishing process is being performed (real-time prediction process). Alternatively, it may be performed before the polishing process is performed (pre-prediction process).
  • the user terminal device 6 is a terminal device used by a user, and may be a stationary device or a portable device.
  • the user terminal device 6 receives various input operations via the display screen of an application program, a web browser, etc., and also receives various information (for example, notification of an event, reliability of the polishing end point detection function, etc.) via the display screen. information, production history information 30, polishing test information 31, etc.).
  • FIG. 2 is a plan view showing an example of the substrate processing apparatus 2.
  • the substrate processing apparatus 2 includes a load/unload unit 21, a polishing unit 22, a substrate transport unit 23, a cleaning unit 24, a film thickness measuring unit 25, inside a housing 20 that is approximately rectangular in plan view. and a control unit 26.
  • the load/unload unit 21, the polishing unit 22, the substrate transport unit 23, and the cleaning unit 24 are partitioned by a first partition wall 200A, and the substrate transport unit 23 and the cleaning unit 24 are partitioned by a second partition wall 200A. It is divided by a partition wall 200B.
  • the load/unload unit 21 includes first to fourth front load sections 210A to 210D on which wafer cassettes (FOUPs, etc.) capable of storing a large number of wafers W in the vertical direction are placed, and wafers stored in the wafer cassettes.
  • a transfer robot 211 that can move up and down along the storage direction (up and down direction) of the wafer W, and a transfer robot 211 that can move up and down along the direction in which the first to fourth front load sections 210A to 210D are lined up (the lateral direction of the housing 20).
  • a horizontal movement mechanism section 212 that moves the horizontal movement mechanism section 212 is provided.
  • the transfer robot 211 carries a wafer cassette mounted on each of the first to fourth front load sections 210A to 210D, a substrate transfer unit 23 (specifically, a lifter 232, which will be described later), and a cleaning unit 24 (specifically, It is configured to be accessible to a drying chamber 241) and a film thickness measurement unit 25 (to be described later), and includes upper and lower hands (not shown) for transferring the wafer W therebetween.
  • the lower hand is used when transferring the wafer W before processing, and the upper hand is used when transferring the wafer W after processing.
  • a shutter (not shown) provided on the first partition wall 200A is opened and closed.
  • the polishing unit 22 includes first to fourth polishing sections 22A to 22D that perform a polishing process (planarization) on the wafer W, respectively.
  • the first to fourth polishing parts 22A to 22D are arranged in parallel along the longitudinal direction of the housing 20.
  • FIG. 3 is a perspective view showing an example of the first to fourth polishing sections 22A to 22D.
  • the basic configuration and functions of the first to fourth polishing sections 22A to 22D are common.
  • Each of the first to fourth polishing units 22A to 22D includes a polishing table 220 to which a polishing pad 2200 having a polishing surface is attached, and a polishing table 220 that holds a wafer W and transfers the wafer W to the polishing pad 2200 on the polishing table 220.
  • an atomizer 224 that sprays cleaning fluid onto the polishing pad 2200
  • an environment sensor 225 that measures the state of the internal space of the housing 20 where polishing processing is performed.
  • the polishing table 220 is supported by a polishing table shaft 220a, and includes a rotary movement mechanism section 220b that rotates the polishing table 220 around its axis via a polishing table rotary connector 2201, and adjusts the surface temperature of the polishing pad 2200.
  • a polishing pad surface temperature control mechanism section 220c is provided.
  • the polishing pad surface temperature control mechanism section 220c has a radiation thermometer 220c1 above the polishing table 220 that measures the surface temperature of the polishing pad 2200 or the surface temperature of the grindstone.
  • the polishing table 220 of this embodiment includes a polishing table internal temperature control mechanism section 220d that controls the temperature of the polishing table 220 by supplying and discharging temperature-controlled water to the inside of the polishing table 220.
  • the polishing table internal temperature control mechanism section 220d has a temperature controlled water supply pipe 220d1 that supplies temperature controlled water to the inside of the polishing table 220, and a temperature controlled water discharge pipe 220d2 that discharges the temperature controlled water.
  • the polishing table internal temperature control mechanism section 220d has a temperature control water thermometer 220d3 for measuring the temperature of the supplied temperature control water in the temperature control water supply pipe 220d1, and a temperature control water thermometer 220d3 for measuring the temperature of the temperature control water being supplied to the temperature control water discharge pipe 220d2. It has a discharge temperature control water thermometer 220d4 that measures the temperature of the temperature control water.
  • the top ring 221 is supported by a top ring shaft 221a that is movable in the vertical direction, and includes a top ring rotation movement mechanism section 221c that rotates the top ring 221 around its axis and a top ring rotation movement mechanism section 221c that moves the top ring 221 in the vertical direction. It includes a top ring vertical movement mechanism section 221d and a top ring swing movement mechanism section 221e that swings (swings) the top ring 221 around the top ring swing support shaft 221b.
  • the top ring swing movement mechanism section 221e includes a top ring swing support shaft 221b, a top ring swing arm 221f that swingably connects the top ring shaft 221a to the top ring swing support shaft 221b, and a top ring swing support shaft 221b. It has a top ring swing shaft motor 221g that rotationally drives the swing support shaft 221b.
  • the top ring rocking movement mechanism section 221e detects the top ring rocking torque applied to the top ring rocking arm 221f at the connection part between the top ring rocking arm 221f and the top ring rocking shaft motor 221g. It has a sensor 221h. Specifically, the top ring swing torque sensor 221h may detect the torque applied to the top ring swing arm 221f from the current value of the top ring swing shaft motor 221g. The current value of the top ring swing shaft motor 221g is an amount that depends on the torque of the top ring swing arm 221f at the connection to the top ring swing shaft motor 221g.
  • the current value of the top ring swing shaft motor 221g is a current value supplied to the top ring swing shaft motor 221g, or a current command value generated within a driver (not shown). good. Note that the top ring swing torque may be detected using other methods.
  • an acceleration sensor 221j and/or an amplitude sensor may be attached to the top ring 221 to measure the vibration of the top ring 221 during polishing.
  • a noise measuring device 221k may be provided near the top ring 221 to measure noise during polishing.
  • the polishing fluid supply nozzle 222 is supported by a support shaft 222a, and includes a swing movement mechanism section 222b that pivots and moves the polishing fluid supply nozzle 222 around the support shaft 222a, and a polishing fluid flow rate that adjusts the flow rate of the polishing fluid. It includes an adjustment section 222c and a polishing fluid temperature adjustment mechanism section 222d that adjusts the temperature of the polishing fluid.
  • the polishing fluid is a polishing liquid (slurry) or pure water, and may also contain a chemical solution, or may be a polishing liquid with a dispersant added thereto.
  • the dresser 223 is supported by a dresser shaft 223a that is movable in the vertical direction, and includes a dresser rotation movement mechanism section 223c that rotates the dresser 223 around its axis, and a dresser vertical movement mechanism section that moves the dresser 223 in the vertical direction. 223d, and a dresser swing movement mechanism section 223e that swings and moves the dresser 223 around the dresser swing support shaft 223b.
  • the dresser swing movement mechanism section 223e includes a dresser swing support shaft 223b, a dresser swing arm 223f that swingably connects the dresser shaft 223a to the dresser swing support shaft 223b, and a dresser swing support shaft 223b.
  • the dresser swing shaft motor 223g is rotatably driven.
  • the dresser swing movement mechanism section 223e includes a dresser swing torque sensor 223h that detects the dresser swing torque applied to the dresser swing arm 223f at the connection part between the dresser swing arm 223f and the dresser swing shaft motor 223g.
  • the dresser swing torque sensor 223h may detect the torque applied to the dresser swing arm 223f from the current value of the dresser swing shaft motor 223g.
  • the current value of the dresser swing shaft motor 223g is an amount that depends on the torque of the dresser swing arm 223f at the connection to the dresser swing shaft motor 223g.
  • the current value of the dresser swing shaft motor 223g may be a current value supplied to the dresser swing shaft motor 223g, or a current command value generated within a driver (not shown). Note that the dresser swing torque may be detected by other methods.
  • the atomizer 224 is supported by a support shaft 224a, and includes an atomizer swing movement mechanism section 224b that rotates the atomizer 224 around the support shaft 224a, and a cleaning fluid flow rate adjustment section 224c that adjusts the flow rate of cleaning fluid.
  • the cleaning fluid is a mixed fluid of a liquid (eg, pure water) and a gas (eg, nitrogen gas) or a liquid (eg, pure water).
  • the environmental sensor 225 includes sensors arranged in the internal space of the housing 20, and includes, for example, a temperature sensor 225a that measures the temperature of the internal space, a humidity sensor 225b that measures the humidity of the internal space, and a sensor that measures the atmospheric pressure of the internal space. and an atmospheric pressure sensor 225c.
  • the environment sensor 225 may include a camera (image sensor) capable of photographing the surface of the polishing pad 2200 during the polishing process or before and after the polishing process.
  • each rotational movement mechanism section 220b, 221c, 223c, each vertical movement mechanism section 221d, 223d, and each swing movement mechanism section 221e, 222b, 223e, 224b are omitted.
  • modules for generating driving force such as motors and actuators, driving force transmission mechanisms such as linear guides, ball screws, gears, belts, couplings, and bearings, linear sensors, encoder sensors, limit sensors, and torque. It is configured by appropriately combining sensors such as sensors.
  • each flow rate adjustment unit 222c, 224c is omitted, but for example, a module for fluid adjustment such as a pump, a valve, a regulator, a flow rate sensor, a pressure sensor, a liquid level sensor, etc. It is configured by appropriately combining sensors such as the following.
  • specific configurations of the polishing table surface temperature control mechanism section 220c, polishing table internal temperature control mechanism section 220d, and polishing fluid temperature control mechanism section 222d are omitted, but for example, heaters, heat exchangers, etc. It is constructed by appropriately combining modules for temperature regulation (conduction type, radiation type, convection type), and sensors such as temperature sensors and current sensors.
  • FIG. 4 is a cross-sectional view schematically showing an example of the top ring 221.
  • the top ring 221 includes a top ring main body 2210 attached to a top ring shaft 221a, a substantially disc-shaped carrier 2211 housed in the top ring main body 2210, and a carrier 2211 disposed below the carrier 2211, and the top ring 221 is configured to move the wafer W onto a polishing pad.
  • a substantially annular retainer ring 2213 that is placed around the outer periphery of the carrier 2211 and the elastic membrane 2212 and directly presses the polishing pad 2200 , and the top ring body 2210 and the retainer ring 2213 .
  • a retaining ring airbag 2214 is provided as a retaining ring pressing mechanism that is disposed at and presses the retaining ring 2213 against the polishing pad 2200.
  • the retaining ring airbag 2214 is used as the retaining ring pressing mechanism, but the retaining ring pressing mechanism may be a fluid actuator using air, water, oil, etc., an electric actuator using a ball screw, etc., a spring or a bag. An elastic member including a shaped bag may be used.
  • the elastic membrane 2212 is formed of an elastic membrane, and has a plurality of concentric partition walls 2212e therein, so that first to second partition walls 2212e are arranged concentrically from the center of the top ring main body 2210 toward the outer circumference. It has fourth elastic membrane pressure chambers 2212a to 2212d. Further, the elastic film 2212 has a plurality of holes 2212f for adsorbing the wafer W on its lower surface, and functions as a substrate holding surface for holding the wafer W.
  • the retaining ring airbag 2214 is formed of an elastic membrane and has a retaining ring pressure chamber 2214a therein.
  • the configuration of the top ring 221 may be changed as appropriate, and it may be provided with a pressure chamber that presses the entire carrier 2211, and the number and shape of the elastic membrane pressure chambers that the elastic membrane 2212 has may be changed as appropriate.
  • the number and arrangement of the suction holes 2212f may be changed as appropriate.
  • the elastic membrane 2212 may not have the suction holes 2212f.
  • First to fourth flow paths 2216A to 2216D are connected to the first to fourth elastic membrane pressure chambers 2212a to 2212d, respectively, and a fifth flow path 2216E is connected to the retaining ring pressure chamber 2214a.
  • the first to fifth channels 2216A to 2216E communicate with the outside via a top ring rotary connector 2215 provided on the top ring shaft 221a, and are connected to first branch channels 2217A to 2217E and second branch channels 2217A to 2217E. It branches into paths 2218A to 2218E, respectively.
  • Pressure sensors PA to PE are installed in the first to fifth channels 2216A to 2216E, respectively.
  • the first branch channels 2217A to 2217E are connected to a gas supply source GS of pressure fluid (air, nitrogen, etc.) via valves V1A to V1E, flow rate sensors FA to FE, and pressure regulators RA to RE.
  • the second branch channels 2218A to 2218E are connected to the vacuum source VS via valves V2A to V2E, respectively, and are configured to be able to communicate with the atmosphere via valves V3A to V3E.
  • the wafer W is held by suction on the lower surface of the top ring 221 and moved to a predetermined polishing position on the polishing table 220, the wafer W is held against the polishing surface of the polishing pad 2200 to which polishing fluid is supplied from the polishing fluid supply nozzle 222. It is polished by being pressed by the top ring 221. At this time, the top ring 221 presses the wafer W against the polishing pad 2200 with the pressure fluid supplied to the first to fourth elastic membrane pressure chambers 2212a to 2212d by independently controlling the pressure regulators RA to RE.
  • the pressure is adjusted for each region of the wafer W, and the pressing force for pressing the retainer ring 2213 against the polishing pad 2200 is adjusted using the pressure fluid supplied to the retainer ring pressure chamber 2214a.
  • the pressure of the pressure fluid supplied to the first to fourth elastic membrane pressure chambers 2212a to 2212d and the retaining ring pressure chamber 2214a, respectively, is measured by the pressure sensors PA to PE, and the flow rate of the pressure gas is measured by the flow rate sensors FA to 2214a. Each is measured by FE.
  • the substrate transport unit 23 includes first and second linear transporters that are horizontally movable along the direction in which the first to fourth polishing sections 22A to 22D are lined up (the longitudinal direction of the housing 20).
  • a temporary holding table 233 for the wafer W is provided.
  • the first linear transporter 230A is arranged adjacent to the first and second polishing sections 22A and 22B, and has four transport positions (first to fourth transport positions in order from the load/unload unit 21 side). This is a mechanism for transporting the wafer W between TP1 and TP4).
  • the second transport position TP2 is a position where the wafer W is delivered to the first polishing section 22A
  • the third transport position TP3 is a position where the wafer W is delivered to the second polishing part 22B. be.
  • the second linear transporter 230B is arranged adjacent to the third and fourth polishing sections 22C and 22D, and has three transport positions (fifth to seventh transport positions in order from the load/unload unit 21 side). This is a mechanism for transporting the wafer W between TP5 and TP7).
  • the sixth transport position TP6 is a position where the wafer W is delivered to the third polishing section 22C
  • the seventh transport position TP7 is a position where the wafer W is delivered to the fourth polishing part 22D. be.
  • the swing transporter 231 is disposed adjacent to the fourth and fifth transport positions TP4 and TP5, and has a hand that is movable between the fourth and fifth transport positions TP4 and TP5.
  • the swing transporter 231 is a mechanism that transfers the wafer W between the first and second linear transporters 230A and 230B and temporarily places the wafer W on the temporary holding table 233.
  • the lifter 232 is a mechanism that is disposed adjacent to the first transfer position TP1 and transfers the wafer W to and from the transfer robot 211 of the load/unload unit 21.
  • a shutter (not shown) provided on the first partition wall 200A is opened and closed.
  • the cleaning unit 24 includes first and second cleaning chambers 240A and 240B for cleaning the wafer W using a cleaning tool, a drying chamber 241 for drying the wafer W, and a drying chamber 241 for transporting the wafer W. It includes first and second transfer chambers 242A and 242B. Each chamber of the cleaning unit 24 is divided into sections along the first and second linear transporters 230A and 230B, for example, a first cleaning chamber 240A, a first transfer chamber 242A, and a second conveyance chamber 242A.
  • the cleaning chamber 240B, the second transfer chamber 242B, and the drying chamber 241 are arranged in this order (in order of distance from the load/unload unit 21). Note that the number and arrangement of the cleaning chambers 240A, 240B, the drying chamber 241, and the transfer chambers 242A, 242B are not limited to the example shown in FIG. 2, and may be changed as appropriate.
  • the film thickness measuring unit 25 is a measuring device that measures the film thickness of the wafer W before or after the polishing process, and includes, for example, an optical film thickness measuring device, an eddy current type film thickness measuring device, or the like.
  • the transfer robot 211 transfers the wafer W to each film thickness measurement module.
  • FIG. 5 is a block diagram showing an example of the substrate processing apparatus 2. As shown in FIG. The control unit 26 is electrically connected to each unit 21-25 and controls each unit 21-25 in an integrated manner.
  • the control system (module, sensor, sequencer) of the polishing unit 22 will be explained as an example, but since the other units 21, 23 to 25 have the same basic configuration and functions, the explanation will be omitted.
  • the polishing unit 22 is arranged in each subunit (for example, polishing table 220, top ring 221, polishing fluid supply nozzle 222, dresser 223, atomizer 224, etc.) included in the polishing unit 22, and controls a plurality of modules to be controlled. 227 1 to 227 r , and a plurality of sensors 228 1 to 228 s that are respectively arranged in the plurality of modules 227 1 to 227 r and detect data (detected values) necessary for controlling each module 227 1 to 227 r . , and a sequencer 229 that controls the operation of each of the modules 227 1 to 227 r based on the detected values of each of the sensors 228 1 to 228 s .
  • each subunit for example, polishing table 220, top ring 221, polishing fluid supply nozzle 222, dresser 223, atomizer 224, etc.
  • the sensors 228 1 to 228 s of the polishing unit 22 include, for example, a sensor that detects the flow rate of polishing fluid, a sensor that detects the pressing force of the retainer ring pressing mechanism, a sensor that detects the rotational torque of the top ring 221, and a sensor that detects the rotational torque of the polishing table 220.
  • a sensor that detects the rotational torque of , a timer that measures the time until the end point is detected, an optical sensor that detects the end point, an environmental sensor 225, and the like are included.
  • the rotational torque measures the sliding resistance between the polishing table 220 and the top ring 221 or dresser 223 that are in contact with the polishing surface.
  • the control unit 26 includes a substrate processing control section 260, a communication section 261, an input section 262, an output section 263, and a storage section 264.
  • the control unit 26 is configured with, for example, a general-purpose or dedicated computer (see FIG. 6, which will be described later).
  • the communication unit 261 is connected to the network 7 and functions as a communication interface for transmitting and receiving various data.
  • the input unit 262 accepts various input operations, and the output unit 263 functions as a user interface by outputting various information via a display screen, signal tower lighting, and buzzer sound.
  • the storage unit 264 stores various programs (operating system (OS), application programs, web browser, etc.) and data (device setting information 265, substrate recipe information 266, etc.) used in the operation of the substrate processing apparatus 2.
  • the device setting information 265 and the board recipe information 266 are data that can be edited by the user via the display screen.
  • the substrate processing control unit 260 controls a plurality of sensors 218 1 to 218 q , 228 1 to 228 s , and 238 1 to 238 via a plurality of sequencers 219 , 229 , 239 , 249 , and 259 (hereinafter referred to as "sequencer group").
  • sequencers 219 , 229 , 239 , 249 , and 259 hereinafter referred to as "sequencer group”
  • sensor group hereinafter referred to as " sensor group”
  • FIG. 6 is a hardware configuration diagram showing an example of the computer 900.
  • Each of the control unit 26, database device 3, machine learning device 4, information processing device 5, and user terminal device 6 of the substrate processing apparatus 2 is configured by a general-purpose or dedicated computer 900.
  • the computer 900 includes a bus 910, a processor 912, a memory 914, an input device 916, an output device 917, a display device 918, a storage device 920, and a communication I/F (interface) as its main components. 922 , an external device I/F section 924 , an I/O (input/output) device I/F section 926 , and a media input/output section 928 . Note that the above-mentioned components may be omitted as appropriate depending on the purpose for which the computer 900 is used.
  • the processor 912 includes one or more arithmetic processing units (CPU (Central Processing Unit), MPU (Micro-processing unit), DSP (digital signal processor), GPU (Graphics Processing Unit), NPU (Neural Processing Unit), etc.)
  • the computer 900 is configured as follows and controls the entire computer 900.
  • the memory 914 stores various data and programs 930, and includes, for example, a volatile memory (DRAM, SRAM, etc.) that functions as a main memory, a nonvolatile memory (ROM), a flash memory, etc.
  • the input device 916 includes, for example, a keyboard, a mouse, a numeric keypad, an electronic pen, etc., and functions as an input unit.
  • the output device 917 is configured with, for example, a sound (voice) output device, a vibration device, etc., and functions as an output section.
  • the display device 918 is configured with, for example, a liquid crystal display, an organic EL display, electronic paper, a projector, etc., and functions as an output unit.
  • Input device 916 and display device 918 may be configured integrally, such as a touch panel display.
  • the storage device 920 is configured with, for example, an HDD, an SSD (Solid State Drive), etc., and functions as a storage unit. The storage device 920 stores various data necessary for executing the operating system and programs 930.
  • the communication I/F section 922 is connected to a network 940 such as the Internet or an intranet (which may be the same as the network 7 in FIG. 1) by wire or wirelessly, and exchanges data with other computers according to a predetermined communication standard. It functions as a communication unit that sends and receives information.
  • the external device I/F section 924 is connected to an external device 950 such as a camera, printer, scanner, reader/writer, etc. by wire or wirelessly, and serves as a communication section that sends and receives data to and from the external device 950 according to a predetermined communication standard. Function.
  • the I/O device I/F unit 926 is connected to an I/O device 960 such as various sensors and actuators, and transmits, for example, a detection signal from a sensor, a control signal to an actuator, etc. with the I/O device 960. It functions as a communication unit that sends and receives various signals and data.
  • the media input/output unit 928 is configured with a drive device such as a DVD drive or a CD drive, and reads and writes data on a medium (non-temporary storage medium) 970 such as a DVD or a CD.
  • the processor 912 calls the program 930 stored in the storage device 920 to the memory 914 and executes it, and controls each part of the computer 900 via the bus 910.
  • the program 930 may be stored in the memory 914 instead of the storage device 920.
  • the program 930 may be recorded on the medium 970 in an installable file format or an executable file format, and provided to the computer 900 via the media input/output unit 928.
  • the program 930 may be provided to the computer 900 by being downloaded via the network 940 via the communication I/F unit 922.
  • the computer 900 may implement various functions achieved by the processor 912 executing the program 930 using hardware such as an FPGA or an ASIC.
  • the computer 900 is, for example, a stationary computer or a portable computer, and is any type of electronic device.
  • the computer 900 may be a client computer, a server computer, or a cloud computer.
  • the computer 900 may also be applied to devices other than the devices 2 to 6.
  • FIG. 7 is a data configuration diagram showing an example of production history information 30 managed by the database device 3.
  • the production history information 30 includes, for example, a wafer history table 300 for each wafer W, as a table in which reports R acquired when substrate processing is performed on wafers W for main production are classified and registered; A polishing history table 301 regarding device status information in polishing processing is provided.
  • the production history information 30 includes a cleaning history table regarding device status information in cleaning processing, an event history table regarding event information, an operation history table regarding operation information, etc., but detailed description thereof will be omitted.
  • each record of the wafer history table 300 for example, a wafer ID, cassette number, slot number, start time and end time of each process, used unit ID, etc. are registered. Note that although FIG. 7 shows a polishing process and a cleaning process, other processes are also registered in the same way.
  • wafer ID For example, wafer ID, wear state information, processing state information, etc. are registered in each record of the polishing history table 301.
  • the wear state information is information indicating the wear state of each component of the substrate processing apparatus 2 that can be obtained before polishing.
  • the wear status information includes, for example, information indicating the condition of the polishing pad 2200, information indicating the condition of the top ring rotary connector 2215, information indicating the condition of the polishing table rotary connector 2201, information indicating the condition of the dresser 223, and information indicating the condition of the substrate processing control unit. This information indicates the condition of H.260.
  • the information indicating each condition includes at least the usage time of each component and the number of wafers processed.
  • the processing state information is information indicating the processing state of the substrate processing apparatus 2 that can be obtained during the polishing process.
  • the processing state information is provided by, for example, a sensor group such as a polishing fluid flow rate sensor of the substrate processing apparatus 2, a pressing force sensor of the retainer ring pressing mechanism, a rotational torque sensor of the top ring 221, or a rotational torque sensor of the polishing table 220. These are detection values of each sensor sampled at predetermined time intervals.
  • the processing state information is, for example, a statistical value of the time until end point detection for each wafer W, and a statistical value of sensor time series data for each wafer W.
  • time-series data of each sensor can be extracted as the device state of the substrate processing apparatus 2 when the polishing process was performed on the wafer W specified by the wafer ID.
  • FIG. 8 is a data configuration diagram showing an example of the polishing test information 31 managed by the database device 3. As shown in FIG.
  • the polishing test information 31 includes a polishing test table 310 in which reports R and test results obtained when a polishing test is performed are classified and registered.
  • a test ID, wear state information, processing state information, test result information, etc. are registered in each record of the polishing test table 310.
  • the wear state information and processing state information of the polishing test table 310 are information indicating the state of each part in the polishing test, and the data structure is the same as that of the polishing history table 301, so detailed explanation will be omitted. .
  • the test result information is information indicating the state of the test polishing device when the polishing process was performed in the polishing test.
  • the test result information may be a measurement value measured by a polishing device measuring device provided in a polishing device for testing.
  • the test result information shown in FIG. 8 includes the number of wafers processed 1, 2, . . . , m, . . . , n and usage times t1, t2, .
  • the reliability of end point detection at each time tm1, tm2, ..., ...tmm, ..., tmn included in the m-th polishing processing period, signs of reliability deterioration, and types of components that cause reliability deterioration are also shown.
  • types of processes TR1 to TR4 that cause a decrease in reliability respectively.
  • time series data of each sensor indicating the state of the polishing unit 22 when the polishing process is performed and the end point detection function at that time can be obtained.
  • reliability can be extracted.
  • the signs of a decline in the reliability of the end point detection function can be determined by using data from the first target period of the polishing process, which is before the time tmm when the reliability of the end point detection function has decreased.
  • data of the second target period including the time point tmm at which the reliability of the end point detection function decreases may be used.
  • FIG. 9 is a block diagram showing an example of the machine learning device 4 according to the first embodiment.
  • the machine learning device 4 includes a machine learning control section 40, a communication section 41, a learning data storage section 42, and a learned model storage section 43.
  • the machine learning control unit 40 functions as a learning data acquisition unit 400 and a machine learning unit 401.
  • the communication unit 41 is connected to external devices (for example, the substrate processing device 2, the database device 3, the information processing device 5, the user terminal device 6, the polishing test device (not shown), etc.) via the network 7, and is connected to various external devices. Functions as a communication interface for sending and receiving data.
  • the learning data acquisition unit 400 is connected to an external device via the communication unit 41 and the network 7, and receives reliability deterioration factor state information as input data and reliability information of the polishing end point detection function as output data.
  • First learning data 11A configured as a set is acquired.
  • the first learning data 11A is data used as teacher data (training data), verification data, and test data in supervised learning.
  • the reliability information of the polishing end point detection function is data used as a correct answer label in supervised learning.
  • the learning data storage unit 42 is a database that stores a plurality of sets of first learning data 11A acquired by the learning data acquisition unit 400. Note that the specific configuration of the database that constitutes the learning data storage section 42 may be designed as appropriate.
  • the machine learning unit 401 performs machine learning using the plurality of sets of first learning data 11A stored in the learning data storage unit 42. That is, the machine learning unit 401 inputs a plurality of sets of first learning data 11A to the first learning model 10A, and compares the reliability deterioration factor state information included in the first learning data 11A with the polishing end point detection function. By causing the first learning model 10A to learn the correlation with the reliability information, a trained first learning model 10A is generated.
  • the trained model storage unit 43 is a database that stores the trained first learning model 10A (specifically, the adjusted weight parameter group) generated by the machine learning unit 401.
  • the trained first learning model 10A stored in the trained model storage unit 43 is provided to the actual system (for example, the information processing device 5) via the network 7, a recording medium, or the like. Note that although the learning data storage section 42 and the learned model storage section 43 are shown as separate storage sections in FIG. 9, they may be configured as a single storage section.
  • the number of first learning models 10A stored in the learned model storage unit 43 is not limited to one, and may be changed depending on, for example, the machine learning method, the mechanism or material of the top ring 221, or the type of the elastic membrane 2212. , the type of retainer ring 2213, the type of polishing pad 2200, the type of polishing fluid, the type of data included in the reliability deterioration factor state information, the type of data included in the reliability information of the polishing end point detection function, etc.
  • a plurality of learning models with different conditions may be stored.
  • the learning data storage unit 42 may store a plurality of types of learning data each having a data structure corresponding to a plurality of learning models with different conditions.
  • FIG. 10 is a diagram showing an example of the first learning model 10A and the first learning data 11A.
  • the first learning data 11A used for machine learning of the first learning model 10A is composed of reliability deterioration factor state information and reliability information of the polishing end point detection function.
  • the reliability deterioration factor state information constituting the first learning data 11A includes wear state information indicating the wear state of the components of the substrate processing apparatus 2, and processing state information of the substrate processing apparatus 2 that can be acquired during polishing. Contains the polishing status information shown.
  • the wear state information included in the reliability deterioration factor state information is information indicating the wear state of the constituent elements of the substrate processing apparatus 2.
  • the wear state information includes, for example, at least one of the condition of the polishing pad 2200, the condition of the top ring rotary connector 2215, the condition of the polishing table rotary connector 2201, the condition of the dresser 223, and the condition of the substrate processing control unit 260.
  • the condition of the polishing pad 2200 includes at least the usage time of the polishing pad 2200 and the number of wafers processed by the polishing pad 2200.
  • the conditions of the polishing pad 2200 include, for example, the cumulative number of rotations of the polishing table 220, the rotation speed of the polishing table 220, the rotational torque of the polishing table 220, the presence or absence of dressing, the presence or absence of replacement, an image of the surface, surface shape, and flatness. , cleanliness, humidity, etc.
  • the condition of polishing pad 2200 may change over time during the polishing process.
  • the condition of the top ring rotary connector 2215 includes at least the usage time of the top ring 221 and the number of wafers processed by the top ring 221. Further, the condition of the top ring rotary connector 2215 may be set based on, for example, the cumulative number of rotations of the top ring 221, the rotation speed of the top ring 221, the rotation torque of the top ring 221, and the like. The condition of the top ring 221 may change over time during the polishing process, for example.
  • the condition of the polishing table rotary connector 2201 includes at least the usage time of the polishing table 220 and the number of wafers processed by the polishing table 220. Further, the condition of the polishing table rotary connector 2201 may be set based on, for example, the cumulative number of rotations of the polishing table 220, the rotation speed of the polishing table 220, the rotation torque of the polishing table 220, and the like. For example, the condition of the polishing table 220 may change over time during the polishing process.
  • the condition of the dresser 223 includes at least the usage time of the dresser 223 and the number of wafers processed by the polishing table 220.
  • the condition of the dresser 223 includes, for example, the cumulative number of rotations of the dresser 223, the rotation speed of the dresser 223, the rotation torque of the dresser 223, the presence or absence of dressing, the presence or absence of replacement, an image of the surface, surface shape, flatness, and cleanliness. It may also be set based on the temperature, humidity, etc. For example, the condition of the dresser 223 may change over time during the polishing process.
  • the condition of the substrate processing control section 260 includes at least the usage time of the substrate processing control section 260 and the number of wafers processed by the substrate processing control section 260.
  • the conditions of the substrate processing control unit 260 may change over time during the polishing process, for example.
  • the processing state information included in the reliability deterioration factor state information is information indicating the processing state of the substrate processing apparatus 2 that can be obtained during the polishing process.
  • the processing state information includes, for example, the flow rate of the polishing fluid, the pressing force of the retainer ring pressing mechanism, the rotational torque of the top ring 221, the rotational torque of the polishing table 220, the swinging torque of the top ring 221, the vibration of the top ring 221, and the dresser 223. oscillating torque during polishing, noise during polishing, temperature of the polishing surface, temperature control water temperature of polishing table 220, statistical values of time until end point detection for each wafer, and statistical values of sensor time series data for each wafer. Contains at least one.
  • the flow rate of the polishing fluid may be the flow rate of the polishing fluid supplied from the polishing fluid supply nozzle 222.
  • the pressing force of the retaining ring pressing mechanism may be the pressure within the retaining ring pressure chamber 2214a of the retaining ring airbag 2214, the flow rate of the pressure fluid supplied to the retaining ring pressure chamber 2214a, or the like.
  • the rotational torque of the top ring 221 may be determined from the motor current that drives the top ring 221 or the like.
  • the rotational torque of the polishing table 220 may be determined from the motor current that drives the polishing table 220 or the like.
  • the swing torque of the top ring 221 may be the top ring swing torque applied to the top ring swing arm 221f, which is detected by the top ring swing torque sensor 221h.
  • the vibration of the top ring 221 may be the vibration of the top ring 221 during polishing, which is measured by the acceleration sensor 221j attached to the top ring 221.
  • the swinging torque of the dresser 223 may be, for example, the dresser swinging torque applied to the dresser swinging arm 223f detected by the dresser swinging torque sensor 223h.
  • the noise during polishing may be the noise during polishing measured by the noise measuring device 221k provided near the top ring 221.
  • the temperature of the polishing surface may be the surface temperature of the polishing pad 2200 or the surface temperature of the grindstone measured by the radiation thermometer 220c1 installed above the polishing table 220.
  • the temperature of the temperature controlled water of the polishing table 220 may be the temperature of the supplied temperature controlled water measured by the supplied temperature controlled water thermometer 220d3.
  • the statistical value of the time until end point detection for each wafer may be obtained from the measured time until end point detection for each wafer.
  • the time required to detect the end point of each measured wafer may be divided into predetermined ranges and calculated from the number of data for each range.
  • Statistical values of sensor time series data for each wafer may be obtained from time series data measured by sensors such as the flow rate, pressing force, rotational torque, etc. of the constituent elements.
  • the time required to detect the end point of the measured time series data may be divided into predetermined ranges, and the number of data for each range may be determined.
  • the statistical values obtained in this way may be used as they are, after processing such as noise reduction so that they can be easily captured by a measuring instrument, or by using the results of statistical processing. In any case, it is sufficient if the dispersion of the results can be determined.
  • the top ring status information included in the polishing process status information includes the pressure in the retaining ring pressure chamber 2214a (retaining ring airbag pressure), It includes the flow rate of pressure fluid (retaining ring airbag flow rate) supplied to the retaining ring pressure chamber 2214a.
  • the pressing force of the retaining ring pressing mechanism in the machining state information included in the reliability reduction factor status information is determined by the amount of elements that adjust the pressing force of the retaining ring pressing mechanism. good.
  • the pressing force of the electric actuator may be the amount of current that adjusts the pressing force of the electric actuator.
  • the pressing force of the retaining ring pressing mechanism may be a vertical position that adjusts the pressing force of the elastic member and the pressing force of the elastic member.
  • the reliability information of the polishing end point detection function that constitutes the first learning data 11A indicates the reliability of the polishing end point detection function of the wafer W that has been subjected to the polishing process in the state shown in the reliability deterioration factor state information. It is information.
  • the reliability information of the polishing end point detection function includes information on the current reliability of end point detection, information on a sign of reliability deterioration, information on the type of component that causes reliability deterioration, and reliability deterioration. This is information on the type of process that is a factor.
  • the learning data acquisition unit 400 acquires the first learning data 11A by referring to the polishing test information 31 and accepting user input operations via the user terminal device 6 as necessary. For example, by referring to the polishing test table 310 of the polishing test information 31, the learning data acquisition unit 400 determines the wear state of the components of the substrate processing apparatus 2 when the polishing test specified by the test ID is performed.
  • the consumption state information shown in FIG. 1 and the processing state information showing the processing state of the substrate processing apparatus 2 that can be obtained during the polishing process are acquired as reliability deterioration factor state information.
  • reliability deterioration factor state information is acquired as time series data of a sensor group, but it may be changed as appropriate depending on the configuration of the polishing unit 22 (in particular, the top ring 221 and the polishing table 220). May be changed.
  • a command value to the module may be used, a parameter converted from a sensor detection value or a command value to the module may be used, or detection values of multiple sensors may be used. Parameters calculated based on may also be used.
  • the reliability deterioration factor state information may be acquired as time series data for the entire polishing process period, or as time series data for a target period that is a part of the polishing process period, or for example, It may also be acquired as point-in-time data at a specific target point, such as the point in time when the reliability of the end point detection function decreases.
  • the data structure of the input data in the first learning model 10A and the first learning data 11A may be changed as appropriate.
  • the learning data acquisition unit 400 acquires the test result information when the polishing test specified by the same test ID is performed. Obtained as reliability information of the polishing end point detection function corresponding to the deterioration factor status information.
  • the reliability information of the polishing end point detection function includes reliability information of the current end point detection, information on the sign of reliability deterioration, and the type of component that causes the reliability deterioration, as shown in FIG. A case will be explained in which the information is process type information that causes a decrease in reliability.
  • the current end point detection reliability information is information about what percentage the current end point detection reliability is.
  • the reliability may be classified on a scale of 0 to 100%. For example, if the reliability of the current endpoint detection is 100%, the current endpoint detection is reliable, and if the reliability of the current endpoint detection is 0%, the current endpoint detection is unreliable. It can be determined that there is.
  • the predictor information of reliability decline is information about the time until the end point detection reliability is reduced or the end point is not detected, or the number of sheets to be processed. For example, if there is a high possibility that the reliability of end point detection will decrease in the polishing process several hours or several sheets from now, some kind of treatment can be performed on the substrate processing apparatus 2 before that.
  • the type information of the component that causes a decrease in reliability is information about the type of component that causes a decrease in the reliability of end point detection, among the components prepared in advance. For example, if the top ring is a factor that reduces the reliability of end point detection, some kind of treatment can be taken for the top ring.
  • the information on the type of process that causes a decrease in reliability is information on the type of process that causes a decrease in the reliability of end point detection among the previously prepared processes. For example, if the factor that reduces the reliability of end point detection is the film formation process, some measures can be taken to improve the film strength, film thickness, variation, etc. in the film formation process.
  • the first learning model 10A employs, for example, a neural network structure, and includes an input layer 100, an intermediate layer 101, and an output layer 102. Synapses (not shown) connecting each neuron are placed between each layer, and each synapse is associated with a weight. A weight parameter group consisting of the weight of each synapse is adjusted by machine learning.
  • the input layer 100 has a number of neurons corresponding to the reliability reduction factor state information as input data, and each value of the reliability reduction factor state information is input to each neuron.
  • the output layer 102 has a number of neurons corresponding to the reliability information of the polishing end point detection function as output data, and the prediction result (inference result) of the reliability information of the polishing end point detection function with respect to the reliability deterioration factor state information is , is output as output data.
  • the reliability information of the polishing end point detection function is output as a numerical value normalized to a predetermined range (for example, 0 to 1).
  • the reliability information of the polishing end point detection function is set within a predetermined range (for example, 0 to 1) as a score (accuracy) for each class. Each is output as a normalized value.
  • Inference results corresponding to numerical values are set in advance in the "predetermined range (0 to 1)".
  • the "predetermined range (0 to 1)” that is the inference result is divided into multiple ranges, and the current end point detection reliability ( 0 to 100%) may be set.
  • the "predetermined range (0 to 1)" which is the inference result is divided into multiple ranges, and the predictive time until reliability deterioration is set for each divided range. That's fine.
  • a predetermined threshold is set between the "predetermined range (0 to 1)" that is the inference result of each component, and the output value is the threshold value. If it is less than or equal to the threshold, the component may be set as "not a factor in reducing reliability", and if it exceeds a threshold value, it may be set as "being a factor in reducing reliability”. Note that each component may be prepared in advance and a respective threshold value may be set for each component.
  • a predetermined threshold value is set between the "predetermined range (0 to 1)" that is the inference result of each process, and the output value is the threshold value. If the process is less than or equal to the threshold value, the process may be set as "not a factor in reducing reliability," and if it exceeds a threshold value, it may be set as "a factor in reducing reliability.” Note that each process may be prepared in advance and a respective threshold value may be set for each process.
  • FIG. 11 is a flowchart illustrating an example of a machine learning method by the machine learning device 4.
  • step S100 the learning data acquisition unit 400 acquires a desired number of first learning data 11A from the polishing test information 31 etc. as advance preparation for starting machine learning, and the acquired first learning data 11A. 1 learning data 11A is stored in the learning data storage section 42.
  • the number of first learning data 11A prepared here may be set in consideration of the inference accuracy required for the first learning model 10A finally obtained.
  • step S110 the machine learning unit 401 prepares the first learning model 10A before learning in order to start machine learning.
  • the first learning model 10A before learning prepared here is configured by the neural network model illustrated in FIG. 10, and the weight of each synapse is set to an initial value.
  • step S120 the machine learning unit 401 randomly selects one set of first learning data 11A from the plurality of sets of first learning data 11A stored in the learning data storage unit 42. get.
  • the machine learning unit 401 converts the polishing process state information (input data) included in the set of first learning data 11A into the prepared first learning data before learning (or during learning). It is input to the input layer 100 of the learning model 10A.
  • the reliability information (output data) of the polishing end point detection function is output as an inference result from the output layer 102 of the first learning model 10A, but the output data is different from the first learning model before learning (or during learning). It is generated by the learning model 10A of . Therefore, in the state before learning (or during learning), the output data output as the inference result contains information different from the reliability information (correct label) of the polishing end point detection function included in the first learning data 11A. show.
  • step S140 the machine learning unit 401 outputs the reliability information (correct label) of the polishing end point detection function included in the set of first learning data 11A acquired in step S120 and the output in step S130.
  • Machine learning is performed by comparing the reliability information (output data) of the polishing end point detection function output as the inference result from the layer and adjusting the weight of each synapse (backpropagation).
  • the machine learning unit 401 causes the first learning model 10A to learn the correlation between the reliability reduction factor state information and the reliability information of the polishing end point detection function.
  • step S150 the machine learning unit 401 determines whether or not a predetermined learning end condition is satisfied using, for example, the reliability information (correct label) of the polishing end point detection function included in the first learning data 11A. and the reliability information (output data) of the polishing end point detection function output as the inference result, and the evaluation value of the error function based on the reliability information (output data) of the polishing end point detection function output as the inference result, and the unlearned first learning data stored in the learning data storage unit 42. The determination is made based on the remaining number of 11A.
  • step S150 if the machine learning unit 401 determines that the learning end condition is not satisfied and machine learning is to be continued (No in step S150), the process returns to step S120 and the first learning model 10A that is currently learning is On the other hand, the steps S120 to S140 are performed multiple times using the unlearned first learning data 11A. On the other hand, in step S150, if the machine learning unit 401 determines that the learning termination condition is satisfied and the machine learning is to be terminated (Yes in step S150), the process proceeds to step S160.
  • step S160 the machine learning unit 401 stores the learned first learning model 10A (adjusted weight parameter group) generated by adjusting the weight associated with each synapse in the learned model memory. 43, and the series of machine learning methods shown in FIG. 11 is completed.
  • step S100 corresponds to a learning data storage step
  • steps S110 to S150 correspond to a machine learning step
  • step S160 corresponds to a learned model storage step.
  • the polishing end point detection function indicates the state of the wafer W from the reliability deterioration factor state information including the wear state information and the processing state information. It is possible to provide a first learning model 10A that can predict (infer) reliability information of.
  • FIG. 12 is a block diagram showing an example of the information processing device 5 according to the first embodiment.
  • FIG. 13 is a functional explanatory diagram showing an example of the information processing device 5 according to the first embodiment.
  • the information processing device 5 includes an information processing control section 50, a communication section 51, and a learned model storage section 52.
  • the information processing control unit 50 functions as an information acquisition unit 500, a state prediction unit 501, and an output processing unit 502.
  • the communication unit 51 is connected to external devices (for example, the substrate processing device 2, the database device 3, the machine learning device 4, the user terminal device 6, etc.) via the network 7, and serves as a communication interface for transmitting and receiving various data. Function.
  • the information acquisition section 500 is connected to an external device via the communication section 51 and the network 7, and acquires reliability deterioration factor state information including wear state information and processing state information.
  • the information acquisition unit 500 When performing "real-time prediction processing" of the reliability information of the polishing end point detection function for a wafer W in the middle of polishing, the information acquisition unit 500 By receiving the report R regarding reliability deterioration factor state information from the device 2 at any time, the wear state information and processing state information during the polishing process on the wafer W are converted into reliability deterioration factor state information. obtained from time to time.
  • the state prediction unit 501 inputs the reliability reduction factor state information acquired by the information acquisition unit 500 as input data to the first learning model 10A, thereby determining the reliability reduction factor state information indicated in the reliability reduction factor state information. Reliability information of a polishing end point detection function for a wafer W undergoing polishing processing is predicted.
  • the trained model storage unit 52 is a database that stores the trained first learning model 10A used by the state prediction unit 501.
  • the number of first learning models 10A stored in the learned model storage unit 52 is not limited to one, and may vary depending on, for example, the machine learning method, the mechanism or material of the top ring 221, or the type of elastic membrane 2212. , the type of retainer ring 2213, the type of polishing pad 2200, the type of polishing fluid, the type of data included in the reliability deterioration factor state information, the type of data included in the reliability information of the polishing end point detection function, etc.
  • a plurality of trained models with different states may be stored and selectively available.
  • the learned model storage unit 52 may be replaced by a storage unit of an external computer (for example, a server type computer or a cloud type computer), and in that case, the state prediction unit 501 will be able to access the external computer.
  • an external computer for example, a server type computer or a cloud type computer
  • the output processing unit 502 performs output processing to output the reliability information of the polishing end point detection function generated by the state prediction unit 501. For example, the output processing unit 502 transmits the reliability information of the polishing end point detection function to the user terminal device 6, so that a display screen based on the reliability information of the polishing end point detection function is displayed on the user terminal device 6. Alternatively, by transmitting the reliability information of the polishing end point detection function to the database device 3, the reliability information of the polishing end point detection function may be registered in the production history information 30.
  • FIG. 14 is a flowchart illustrating an example of an information processing method by the information processing device 5. Below, an example of operation will be described in which the user operates the user terminal device 6 to perform "prediction processing" on reliability information of the polishing end point detection function for a specific wafer W.
  • step S200 when the user performs an input operation on the user terminal device 6 to input a wafer ID that specifies a wafer W to be predicted, the user terminal device 6 inputs the wafer ID to the information processing device 5. Send to.
  • step S210 the information acquisition unit 500 of the information processing device 5 receives the wafer ID transmitted in step S200.
  • step S211 the information acquisition unit 500 uses the wafer ID received in step S210 to refer to the polishing history table 301 of the production history information 30, so that the wafer W specified by the wafer ID is polished. Obtain reliability deterioration factor status information when the process is performed.
  • step S220 the state prediction unit 501 inputs the reliability reduction factor state information acquired in step S211 as input data to the first learning model 10A, thereby Reliability information of the polishing end point detection function is generated as output data, and the state of the wafer W is predicted.
  • step S230 the output processing unit 502 outputs the reliability information of the polishing end point detection function to the user terminal device as output processing for outputting the reliability information of the polishing end point detection function generated in step S220. Send to 6.
  • the destination of the reliability information of the polishing end point detection function may be the database device 3 in addition to or instead of the user terminal device 6.
  • step S240 when the user terminal device 6 receives the reliability information of the polishing end point detection function transmitted in step S230 as a response to the transmission process of step S200, the user terminal device 6 receives the reliability information of the polishing end point detection function.
  • steps S210 and S211 correspond to an information acquisition step
  • step S220 corresponds to a state prediction step
  • step S230 corresponds to an output processing step.
  • reliability reduction factor information in the polishing process is inputted to the first learning model 10A. Since the reliability information of the polishing end point detection function is predicted based on the state information, the reliability information of the polishing end point detection function, which indicates the reliability of the end point detection function that detects that the chemical mechanical polishing process has reached the end point, can be appropriately predicted. can do.
  • the second embodiment differs from the first embodiment in that an optical sensor is used as a polishing end point detection function.
  • an optical sensor is used as a polishing end point detection function.
  • a machine learning device 4a and an information processing device 5a according to the second embodiment will be described, focusing on the differences from the first embodiment.
  • FIG. 15 is a schematic diagram for explaining the optical sensor 226 provided on the polishing table 220 according to the second embodiment.
  • an optical sensor 226 that detects the state of the film on the wafer W is embedded inside the polishing table 220.
  • the optical sensor 226 irradiates the wafer W with light and detects the state (film thickness, etc.) of the film on the wafer W based on the intensity (reflection intensity or reflectance) of the reflected light from the wafer W.
  • a light transmitting portion 2200a is attached to the polishing pad 2200 to transmit light from the optical sensor 226.
  • the light transmitting portion 2200a is made of a material with high transmittance, such as quartz glass, a glass material, or pure water (with a transparent fluid supply portion and flow path not shown).
  • the light transmitting portion 2200a may be configured by providing a through hole in the polishing pad 2200, and flowing a transparent fluid such as pure water from below from the transparent fluid supply portion while the through hole is blocked by the wafer W. .
  • the transparent portion 2200a is arranged at a position passing through the center of the wafer W held by the top ring 221.
  • the optical sensor 226B includes a light source 226a, a light emitting optical fiber 226b serving as a light emitting section that irradiates the surface to be polished of the wafer W with light from the light source 226a, and a light emitting optical fiber 226b that emits light reflected from the surface to be polished.
  • a light-receiving optical fiber 226c serving as a light-receiving section for receiving light, a spectroscope for dispersing the light received by the light-receiving optical fiber 226c, and a plurality of light-receiving elements for accumulating the light separated by the spectrometer as electrical information are installed inside.
  • a spectrometer unit 226d an operation control section 226e that controls the timing of turning on and off the light source 226a and the start of reading of the light receiving element in the spectrometer unit 226d, and a power source 226f that supplies power to the operation control section 226e. It is equipped with Note that power is supplied to the light source 226a and the spectrometer unit 226d via the operation control section 226e.
  • the light emitting end of the light emitting optical fiber 226b and the light receiving end of the light receiving optical fiber 226c are configured to be substantially perpendicular to the polished surface of the wafer W.
  • a 128-element photodiode array can be used as the light-receiving element in the spectrometer unit 226d.
  • the spectrometer unit 226d is connected to the operation control section 226e. Information from the light receiving element in the spectrometer unit 226d is sent to the operation control section 226e, and spectrum data of reflected light is generated based on this information. That is, the operation control unit 226e reads electrical information accumulated in the light receiving element and generates spectrum data of reflected light. This spectral data indicates the intensity of reflected light resolved according to wavelength, and varies depending on the film thickness.
  • the operation control section 226e is connected to the optical sensor control section 226g. In this way, the spectrum data generated by the operation control section 226e is transmitted to the optical sensor control section 226g.
  • the optical sensor control unit 226g calculates a characteristic value associated with the film thickness of the wafer W based on the spectrum data received from the operation control unit 226e, and uses this as a monitoring signal to detect the end point. Note that the optical sensor control section 226g may be included in the substrate processing control section 260.
  • FIG. 16 is a block diagram showing an example of a machine learning device 4a according to the second embodiment.
  • FIG. 17 is a diagram showing an example of the second learning model 10B and the second learning data 11B.
  • the second learning data 11B is used for machine learning of the second learning model 10B.
  • the reliability deterioration factor state information constituting the second learning data 11B includes the condition of the optical sensor 226 and the condition of the transparent liquid supply section as consumption state information, and the condition of the optical sensor 226 as processing state information. Light reflection intensity information and transparent liquid flow rate information are added. Note that other reliability deterioration factor state information constituting the second learning data 11B is the same as that in the first embodiment, and therefore a description thereof will be omitted.
  • the condition of the optical sensor 226 includes at least the usage time of the optical sensor 226 and the number of wafers processed by the optical sensor 226.
  • the condition of the optical sensor 226 may be set based on, for example, the usage time of the light source 226a such as a lamp of the optical sensor 226, the temperature of the optical sensor 226, and the like.
  • the condition of the optical sensor 226 may change over time during the polishing process.
  • the conditions of the pure water transparent liquid supply section include at least the usage time of the pure water supply section and the number of wafers processed by the polishing unit 22.
  • the condition of the transparent liquid supply section may be set based on, for example, the cumulative supply flow rate of the transparent liquid supply section.
  • the condition of the transparent liquid supply section may change over time during the polishing process.
  • the light reflection intensity information of the optical sensor 226 may be the intensity of the reflected light emitted by the optical sensor 226 and reflected by the wafer W.
  • the transparent liquid information may be the flow rate of transparent liquid such as pure water supplied from the transparent liquid supply section.
  • the learning data acquisition unit 400 acquires the second learning data 11B by referring to the polishing test information 31 and accepting user input operations via the user terminal device 6 as necessary. For example, by referring to the polishing test table 310 of the polishing test information 31, the learning data acquisition unit 400 obtains wear state information and processing state information (each time series data of each sensor that each component has) is acquired as reliability deterioration factor status information.
  • FIG. 18 is a block diagram showing an example of an information processing device 5a that functions as the information processing device 5a according to the second embodiment.
  • FIG. 19 is a functional explanatory diagram showing an example of the information processing device 5a according to the second embodiment.
  • the information acquisition unit 500 acquires reliability deterioration factor state information including wear state information and processing state information.
  • the information acquisition unit 500 When performing "post-prediction processing" of the reliability information of the polishing end point detection function for the wafer W after the polishing process has already been performed, the information acquisition unit 500 refers to the polishing history table 301 of the production history information 30. Therefore, wear state information and processing state information when the polishing process is performed on the wafer W may be acquired as reliability deterioration factor state information.
  • the state prediction unit 501 inputs the reliability reduction factor state information acquired by the information acquisition unit 500 as input data to the second learning model 10B, thereby determining the reliability reduction factor state information indicated in the reliability reduction factor state information. Reliability information of a polishing end point detection function for a wafer W undergoing polishing processing is predicted.
  • the reliability deterioration factor state information including the wear state information and the machining state information in the polishing process is used in the second learning model 10B. Since the reliability of the polishing end point detection function with respect to the reliability deterioration factor status information is predicted by inputting the above information, it is possible to appropriately predict the reliability of the polishing end point detection function of the wafer W in the polishing process.
  • the optical sensor 226 is used to detect the polishing end point of the wafer W, but other polishing end point detection functions may be used.
  • an eddy current sensor may be used as another example of the polishing end point detection function.
  • the eddy current sensor has an excitation coil, and when magnetic lines of force generated from the excitation coil connected to a high-frequency AC power source pass through a conductive film, an eddy current is generated on the surface of the wafer W.
  • the magnitude of this eddy current changes depending on the resistance of the metal film, that is, the thickness of the metal film.
  • lines of magnetic force are generated from the eddy current in a direction opposite to the lines of magnetic force generated from the exciting coil.
  • the change in the thickness of the metal film can be measured by the detection coil measuring the intensity of the magnetic lines of force generated in the opposite direction.
  • the eddy current sensor is installed below the polishing table 220 shown in FIG. 3, and generates lines of magnetic force in the direction penetrating the polishing table 220.
  • the eddy current sensor rotates together with the polishing table 220 and passes below the wafer W held by the top ring 221. At this time, if a conductive film exists on the surface of the wafer W, the magnetic lines of force pass through the conductive film, so that the thickness of the conductive film can be measured.
  • the metal film on the surface of the wafer W decreases, and the resistance value of the metal film increases accordingly. Then, the eddy current generated by the magnetic lines of force generated from the coil of the eddy current sensor decreases, and the strength of the magnetic lines of force generated from the eddy current also decreases. Eddy current sensors convert changes in magnetic lines of force generated by this eddy current into voltages corresponding to changes in film thickness using circuits and software within the sensor.
  • the eddy current sensor measures and stores the detected voltage for the wafer W after polishing in advance, and compares the stored voltage value with the voltage value while the wafer W is being polished. It is preferable to detect the polishing end point by doing this.
  • the analog processing portion may be replaced with digital processing. By using digital processing, eddy current sensors have improved performance and stability.
  • the condition of the eddy current sensor may be used as wear state information, and the magnetic force line strength information of the eddy current sensor may be used as processing state information.
  • the condition of the eddy current sensor includes at least the usage time of the eddy current sensor and the number of wafers processed by the eddy current sensor.
  • the condition of the eddy current sensor may be set based on, for example, the usage time of the excitation coil.
  • the condition of the eddy current sensor may change over time, for example, during a polishing process.
  • the magnetic force line strength information of the eddy current type sensor may be the magnetic force line strength generated in the opposite direction detected by the eddy current type sensor.
  • a rotational torque method may be used as another example of the polishing end point detection function.
  • the rotational torque method is, for example, the rotational torque of a polishing table rotation motor included in the rotational movement mechanism section 220b that rotationally drives the polishing table 220, or the top ring rotation that is included in the topring rotational movement mechanism section 221c that rotationally drives the top ring 221. What is necessary is to detect at least one of the rotational torque of the motor.
  • the polishing resistance rapidly decreases, making it possible to detect when the polishing of the wafer W has ended.
  • polishing end point of the wafer W may be detected by using an optical sensor, an eddy current sensor, a torque method, or a combination of all of them.
  • the database device 3, machine learning device 4, and information processing device 5 are described as being configured as separate devices, but these three devices may be configured as a single device. However, any two of these three devices may be configured as a single device. Further, at least one of the machine learning device 4 and the information processing device 5 may be incorporated in the control unit 26 of the substrate processing device 2 or the user terminal device 6.
  • the substrate processing apparatus 2 has been described as including each of the units 21 to 25, but the substrate processing apparatus 2 only needs to include at least the polishing unit 22, and the other units may be omitted. good.
  • machine learning models include tree types such as decision trees and regression trees, ensemble learning such as bagging and boosting, and neural network types (including deep learning) such as recurrent neural networks, convolutional neural networks, and LSTM. ), hierarchical clustering, non-hierarchical clustering, clustering types such as k-nearest neighbor method and k-means method, multivariate analysis such as principal component analysis, factor analysis, and logistic regression, support vector machine, etc.
  • the test result information is information indicating the state when the polishing process is performed in the polishing test using the dummy wafer in the test equipment, but the test result information is information indicating the state when the polishing process is performed in the polishing test using the dummy wafer in the test equipment.
  • the information may be continuously acquired as information indicating the state when the actual wafer polishing process is performed using the polishing unit 22.
  • the continuously acquired test result information is continuously learned by the machine learning device 4.
  • test result information may be continuously acquired by a person in the polishing unit 22 where no sensor is installed, by determining whether the reliability of the polishing end point detection function has decreased and by labeling the data.
  • the information continuously acquired using the actual polishing unit 22 may be uploaded to the cloud, and after machine learning is performed in the cloud, the learned model may be deployed to the substrate processing apparatus 2. Further, the processing method may be learned within the substrate processing apparatus 2 without being uploaded to the cloud.
  • the present invention is provided in the form of a program (machine learning program) that causes the computer 900 to function as each part of the machine learning device 4, and a program (machine learning program) that causes the computer 900 to execute each step included in the machine learning method. You can also. Further, the present invention provides a program (information processing program) for causing the computer 900 to function as each unit included in the information processing device 5, and a program for causing the computer 900 to execute each step included in the information processing method according to the above embodiment. It can also be provided in the form of (information processing program).
  • the present invention is applicable not only to aspects of the information processing device 5 (information processing method or information processing program) according to the above embodiments, but also to an inference device (inference method) used for inferring reliability information of a polishing end point detection function. or an inference program).
  • the inference device may include a memory and a processor, of which the processor may execute a series of processes.
  • the series of processes includes an information acquisition process (information acquisition step) that acquires reliability deterioration factor state information, and, when reliability deterioration factor state information is acquired in the information acquisition process, polishing using the reliability deterioration factor state information.
  • the method includes an inference process (inference step) for inferring reliability information of a polishing end point detection function indicating the reliability of the polishing end point detection function of the processed substrate.
  • an inference device inference method or inference program
  • it can be applied to various devices more easily than in the case of implementing an information processing device.
  • the inference device inference method or inference program
  • it uses the trained learning model generated by the machine learning device and machine learning method according to the above embodiment to perform state prediction. It will be understood by those skilled in the art that the inference techniques implemented by the Department may also be applied.
  • 1...Substrate processing system 2...Substrate processing device, 3...Database device, 4, 4a... Machine learning device, 5, 5a... Information processing device, 6... User terminal device, 7... Network, 10... learning model, 10A... first learning model, 10B... second learning model, 11A...first learning data, 11B...second learning data, 20...housing, 21...load/unload unit, 22... Polishing unit, 22A to 22D... Polishing section, 23... Substrate transport unit, 24...Cleaning unit, 25...Film thickness measurement unit, 26...Control unit, 30... Production history information, 31... Polishing test information, 40...Machine learning control unit, 41...Communication unit, 42...Learning data storage unit, 43...Learned model storage unit, 50...
  • Information processing control unit 51... Communication unit, 52... Learned model storage unit, 220... Polishing table, 221... Top ring, 222... Polishing fluid supply nozzle, 223...Dresser, 224...Atomizer, 225...Environmental sensor 260...Substrate processing control section, 21...Communication section, 262...Input section, 263...Output section, 264...Storage section, 300... Wafer history table, 301... Polishing history table, 310... Polishing test table, 400...Learning data acquisition unit, 401...Machine learning unit, 500...information acquisition unit, 501...state prediction unit, 502...output processing unit, 900... Computer 2200... Polishing pad, 2210... Top ring body, 2211...
  • Carrier 2212...Elastic membrane, 2212a to 2212d...Elastic membrane pressure chamber, 2213...retainer ring, 2214... Retainer ring airbag (retainer ring pressing mechanism), 2214a...retaining ring pressure chamber, 226...Optical sensor

Landscapes

  • Engineering & Computer Science (AREA)
  • Mechanical Engineering (AREA)
  • Manufacturing & Machinery (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Hardware Design (AREA)
  • Power Engineering (AREA)
  • Microelectronics & Electronic Packaging (AREA)
  • Condensed Matter Physics & Semiconductors (AREA)
  • Quality & Reliability (AREA)
  • Automation & Control Theory (AREA)
  • General Engineering & Computer Science (AREA)
  • Finish Polishing, Edge Sharpening, And Grinding By Specific Grinding Devices (AREA)
  • Mechanical Treatment Of Semiconductor (AREA)
  • Constituent Portions Of Griding Lathes, Driving, Sensing And Control (AREA)
  • General Factory Administration (AREA)
  • Cleaning Or Drying Semiconductors (AREA)

Abstract

【課題】化学機械研磨処理が終点に到達したことを検知する終点検知機能の信頼性を示す研磨終点検知機能の信頼性情報を適切に予測することを可能とする情報処理装置を提供する。 【解決手段】情報処理装置5は、基板処理装置2により行われる基板の化学機械研磨処理における、基板処理装置2の構成要素の消耗状態を示す消耗状態情報、及び、研磨加工中の加工状態を示す加工状態情報、の少なくとも1つを含む、信頼性低下要因状態情報を取得する情報取得部500と、信頼性低下要因状態情報と、化学機械研磨処理が終点に到達したことを検知する終点検知機能の信頼性を示す研磨終点検知機能の信頼性情報との相関関係を機械学習により学習させた学習モデルに、情報取得部500により取得された信頼性低下要因状態情報を入力することで、信頼性低下要因状態情報に対する研磨終点検知機能の信頼性情報を予測する状態予測部501と、を備える。

Description

情報処理装置、推論装置、機械学習装置、情報処理方法、推論方法、及び、機械学習方法
 本発明は、情報処理装置、推論装置、機械学習装置、情報処理方法、推論方法、及び、機械学習方法に関する。
 半導体ウェハ等の基板に対して各種の処理を行う基板処理装置の1つとして、化学機械研磨(CMP:Chemical Mechanical Polishing)処理を行う基板処理装置が知られている。基板処理装置では、例えば、研磨パッドを有する研磨テーブルを回転させつつ、液体供給ノズルから研磨パッドに研磨液(スラリー)を供給した状態で、トップリングと呼ばれる研磨ヘッドにより基板を研磨パッドに押し付けることで、基板は化学的かつ機械的に研磨される。そして、研磨後の基板に付着した研磨屑等の異物を除去するため、研磨後の基板に基板洗浄流体を供給しながら洗浄具を接触させてスクラブ洗浄し、さらに基板を乾燥することで、一連の処理が終了し、次の基板の処理に移行する。
 上記のような一連の処理において、研磨が不十分な場合、完成したウェハに形成される電子回路の絶縁が不十分でショートしてしまうおそれがある。また、過剰な研磨をしてしまった場合、配線の断面積が減ることにより抵抗値が上昇したり、回路自体が形成されないという問題があった。そこで、近年の研磨装置は、摩擦力の変化、モータ電流の変化、又は、ウェハの物理量の変化等を検出し、研磨の終点を検出するものがある。
特開2021-028099号公報
 特許文献1には、1つの研磨ユニットに設けられた複数種類の終点検知センサの各々から過去の研磨時に出力された研磨開始から研磨終了までの計測データの波形を機械学習した学習済みモデルを有し、複数種類の終点検知センサの各々から新たな研磨時に出力された研磨開始から現時点までの計測データを入力として、現時点が研磨終了を示す終点のタイミングであるか否かを推定して終点検知の精度を向上する技術が開示されている。
 しかしながら、終点検知技術を有する従来の研磨装置は、終点検知結果が信頼できるものかを判断できるものは存在せず、終点と検知された結果をそのまま用いるしかなかった。
 本発明は、上記の課題に鑑み、化学機械研磨処理が終点に到達したことを検知する終点検知機能の信頼性を示す研磨終点検知機能の信頼性情報を適切に予測することを可能とする情報処理装置、推論装置、機械学習装置、情報処理方法、推論方法、及び、機械学習方法を提供することを目的とする。
 上記目的を達成するために、本発明の一態様に係る情報処理装置は、
 基板処理装置により行われる基板の化学機械研磨処理における、前記基板処理装置の構成要素の消耗状態を示す消耗状態情報、及び、研磨加工中の加工状態を示す加工状態情報、の少なくとも1つを含む、信頼性低下要因状態情報を取得する情報取得部と、
 前記信頼性低下要因状態情報と、前記化学機械研磨処理が終点に到達したことを検知する終点検知機能の信頼性を示す研磨終点検知機能の信頼性情報との相関関係を機械学習により学習させた学習モデルに、前記情報取得部により取得された前記信頼性低下要因状態情報を入力することで、当該信頼性低下要因状態情報に対する前記研磨終点検知機能の信頼性情報を予測する状態予測部と、を備える
 本発明の一態様に係る情報処理装置によれば、化学機械研磨処理における、前記基板処理装置の構成要素の消耗状態を示す消耗状態情報、及び、研磨加工中の加工状態を示す加工状態情報、の少なくとも1つを含む、信頼性低下要因状態情報が学習モデルに入力されることで、当該信頼性低下要因状態情報に対する研磨終点検知機能の信頼性情報が予測されるので、化学機械研磨処理が終点に到達したことを検知する終点検知機能の信頼性を示す研磨終点検知機能の信頼性情報を適切に予測することができる。
 上記以外の課題、構成及び効果は、後述する発明を実施するための形態にて明らかにされる。
基板処理システム1の一例を示す全体構成図である。 基板処理装置2の一例を示す平面図である。 第1乃至第4の研磨部22A~22Dの一例を示す斜視図である。 トップリング221の一例を模式的に示す断面図である。 基板処理装置2の一例を示すブロック図である。 コンピュータ900の一例を示すハードウエア構成図である。 データベース装置3により管理される生産履歴情報30の一例を示すデータ構成図である。 データベース装置3により管理される研磨試験情報31の一例を示すデータ構成図である。 第1の実施形態に係る機械学習装置4の一例を示すブロック図である。 第1の学習モデル10A及び第1の学習用データ11Aの一例を示す図である。 機械学習装置4による機械学習方法の一例を示すフローチャートである。 第1の実施形態に係る情報処理装置5の一例を示すブロック図である。 第1の実施形態に係る情報処理装置5の一例を示す機能説明図である。 情報処理装置5による情報処理方法の一例を示すフローチャートである。 第2の実施形態に係る研磨テーブル220に設けられた光学式センサ226を説明するための模式図である。 第2の実施形態に係る機械学習装置4aの一例を示すブロック図である。 第2の学習モデル10B及び第1の学習用データ11Bの一例を示す図である。 第2の実施形態に係る情報処理装置5aの一例を示すブロック図である。 第2の実施形態に係る情報処理装置5aの一例を示す機能説明図である。
 以下、図面を参照して本発明を実施するための実施形態について説明する。以下では、本発明の目的を達成するための説明に必要な範囲を模式的に示し、本発明の該当部分の説明に必要な範囲を主に説明することとし、説明を省略する箇所については公知技術によるものとする。
(第1の実施形態)
 図1は、基板処理システム1の一例を示す全体構成図である。本実施形態に係る基板処理システム1は、半導体ウェハ等の基板(以下、「ウェハ」という)Wの表面を平坦に研磨する化学機械研磨処理(以下、「研磨処理」という)、研磨処理後のウェハWを洗浄する洗浄処理等を含む一連の基板処理を管理するシステムとして機能する。
 基板処理システム1は、その主要な構成として、基板処理装置2と、データベース装置3と、機械学習装置4と、情報処理装置5と、ユーザ端末装置6とを備える。各装置2~6は、例えば、汎用又は専用のコンピュータ(後述の図6参照)で構成されるとともに、有線又は無線のネットワーク7に接続されて、各種のデータ(図1には一部のデータの送受信を破線の矢印にて図示)を相互に送受信可能に構成される。なお、各装置2~6の数やネットワーク7の接続構成は、図1の例に限られず、適宜変更してもよい。
 基板処理装置2は、複数のユニットで構成されて、1又は複数のウェハWに対する一連の基板処理として、例えば、ロ―ド、研磨、洗浄、乾燥、膜厚測定、アンロード等の各処理をそれぞれ行う装置である。その際、基板処理装置2は、各ユニットにそれぞれ設定された複数の装置パラメータからなる装置設定情報265と、研磨処理の研磨処理状態情報や洗浄処理の洗浄処理条件等を定める基板レシピ情報266とを参照しつつ、各ユニットの動作を制御する。
 基板処理装置2は、各ユニットの動作に応じて、各種のレポートRをデータベース装置3、ユーザ端末装置6等に送信する。各種のレポートRには、例えば、基板処理が行われたときの対象となるウェハWを特定する工程情報、各処理が行われたときの各ユニットの状態を示す装置状態情報、基板処理装置2にて検出されたイベント情報、基板処理装置2に対するユーザ(オペレータ、生産管理者、保守管理者等)の操作情報等が含まれる。
 データベース装置3は、本生産用のウェハWに対して基板処理が行われたときの履歴に関する生産履歴情報30と、試験用のダミーウェハに対して研磨処理の試験(以下、「研磨試験」という)が行われたときの履歴に関する研磨試験情報31とを管理する装置である。なお、データベース装置3には、上記の他に、装置設定情報265や基板レシピ情報266が記憶されていてもよく、その場合には、基板処理装置2がこれらの情報を参照するようにしてもよい。
 データベース装置3は、基板処理装置2が本生産用のウェハWに対して基板処理を行ったときに、基板処理装置2から各種のレポートRを随時受信し、生産履歴情報30に登録することで、生産履歴情報30には、基板処理に関するレポートRが蓄積される。
 データベース装置3は、基板処理装置2が試験用のダミーウェハに対して研磨試験を行ったときに、基板処理装置2から各種のレポートR(装置状態情報を少なくとも含む)を随時受信し、研磨試験情報31に登録するとともに、その研磨試験の試験結果を対応付けて登録することで、研磨試験情報31には、研磨試験に関するレポートR及び試験結果が蓄積される。
 ダミーウェハは、ウェハWを模擬した治具である。ダミーウェハの表面又は内部には、研磨処理が行われたときのウェハWの状態を測定するための圧力センサや温度センサ等のダミーウェハセンサが設けられ、ダミーウェハセンサの測定値が、試験結果として研磨試験情報31に登録される。なお、ダミーウェハセンサは、ダミーウェハの基板面に対して1又は複数の箇所に設けられてもよいし、面的に設けられていてもよい。また、研磨試験は、本生産用の基板処理装置2で行われてもよいし、基板処理装置2と同様の研磨処理を再現可能な試験用の研磨試験装置(不図示)で行われてもよい。
 機械学習装置4は、機械学習の学習フェーズの主体として動作し、例えば、データベース装置3から研磨試験情報31の一部を第1の学習用データ11Aとして取得し、情報処理装置5にて用いられる第1の学習モデル10Aを機械学習により生成する。学習済みの第1の学習モデル10Aは、ネットワーク7や記録媒体等を介して情報処理装置5に提供される。
 情報処理装置5は、機械学習の推論フェーズの主体として動作し、機械学習装置4により生成された第1の学習モデル10Aを用いて、基板処理装置2による研磨処理が本生産用のウェハWに対して行われたときに、そのウェハWの状態を予測し、その予測した結果である研磨終点検知機能の信頼性情報をデータベース装置3、ユーザ端末装置6等に送信する。情報処理装置5が研磨終点検知機能の信頼性情報を予測するタイミングとしては、研磨処理が行われた後(事後予測処理)でもよいし、研磨処理が行われている最中(リアルタイム予測処理)でもよいし、研磨処理が行われる前(事前予測処理)でもよい。
 ユーザ端末装置6は、ユーザが使用する端末装置であり、据置型の装置でもよいし、携帯型の装置でもよい。ユーザ端末装置6は、例えば、アプリケーションプログラム、ウェブブラウザ等の表示画面を介して各種の入力操作を受け付けるとともに、表示画面を介して各種の情報(例えば、イベントの通知、研磨終点検知機能の信頼性情報、生産履歴情報30、研磨試験情報31等)を表示する。
        (基板処理装置2)
 図2は、基板処理装置2の一例を示す平面図である。基板処理装置2は、平面視で略矩形状のハウジング20の内部に、ロード/アンロードユニット21と、研磨ユニット22と、基板搬送ユニット23と、洗浄ユニット24と、膜厚測定ユニット25と、制御ユニット26とを備えて構成される。ロード/アンロードユニット21と、研磨ユニット22、基板搬送ユニット23及び洗浄ユニット24との間は、第1の隔壁200Aにより区画され、基板搬送ユニット23と洗浄ユニット24との間は、第2の隔壁200Bにより区画されている。
(ロード/アンロードユニット)
 ロード/アンロードユニット21は、多数のウェハWを上下方向に収納可能なウェハカセット(FOUP等)が載置される第1乃至第4のフロントロード部210A~210Dと、ウェハカセットに収納されたウェハWの収納方向(上下方向)に沿って上下移動可能な搬送ロボット211と、第1乃至第4のフロントロード部210A~210Dの並び方向(ハウジング20の短手方向)に沿って搬送ロボット211を移動させる水平移動機構部212とを備える。
 搬送ロボット211は、第1乃至第4のフロントロード部210A~210Dの各々に載置されたウェハカセット、基板搬送ユニット23(具体的に、後述のリフタ232)、洗浄ユニット24(具体的に、後述の乾燥室241)、及び、膜厚測定ユニット25に対してアクセス可能に構成され、それらの間でウェハWを受け渡すための上下二段のハンド(不図示)を備える。下側ハンドは、処理前のウェハWを受け渡すときに使用され、上側ハンドは、処理後のウェハWを受け渡すときに使用される。基板搬送ユニット23や洗浄ユニット24に対するウェハWの受け渡しの際には、第1の隔壁200Aに設けられたシャッタ(不図示)が開閉される。
(研磨ユニット)
 研磨ユニット22は、ウェハWの研磨処理(平坦化)をそれぞれ行う第1乃至第4の研磨部22A~22Dを備える。第1乃至第4の研磨部22A~22Dは、ハウジング20の長手方向に沿って並べられて配置される。
 図3は、第1乃至第4の研磨部22A~22Dの一例を示す斜視図である。第1乃至第4の研磨部22A~22Dの基本的な構成や機能は共通する。
 第1乃至第4の研磨部22A~22Dの各々は、研磨面を有する研磨パッド2200が取り付けられた研磨テーブル220と、ウェハWを保持し、かつウェハWを研磨テーブル220上の研磨パッド2200に押圧しながら研磨するためのトップリング(研磨ヘッド)221と、研磨パッド2200に研磨流体を供給する研磨流体供給部としての研磨流体供給ノズル222と、研磨パッド2200の研磨面のドレッシングを行うドレッサ223と、研磨パッド2200に洗浄流体を噴射するアトマイザ224と、研磨処理が行われるハウジング20の内部空間の状態を測定する環境センサ225と、を備える。
 研磨テーブル220は、研磨テーブルシャフト220aにより支持されて、研磨テーブルロータリーコネクタ2201を介して、その軸心周りに研磨テーブル220を回転駆動させる回転移動機構部220bと、研磨パッド2200の表面温度を調節する研磨パッド表面温調機構部220cとを備える。研磨パッド表面温調機構部220cは、研磨テーブル220の上方に、研磨パッド2200の表面温度もしくは砥石の表面温度を測定する放射温度計220c1を有する。
 また、本実施形態の研磨テーブル220は、研磨テーブル220の内部に温調水を供給及び排出して研磨テーブル220の温度を調節する研磨テーブル内部温調機構部220dを有する。研磨テーブル内部温調機構部220dは、研磨テーブル220の内部に温調水を供給する温調水供給配管220d1及び温調水を排出する温調水排出配管220d2を有する。研磨テーブル内部温調機構部220dは、温調水供給配管220d1に、供給される温調水の温度を測定する供給温調水温度計220d3を有し、温調水排出配管220d2に、排出される温調水の温度を測定する排出温調水温度計220d4を有する。
 トップリング221は、上下方向に移動可能なトップリングシャフト221aに支持されて、その軸心周りにトップリング221を回転駆動させるトップリング回転移動機構部221cと、トップリング221を上下方向に移動させるトップリング上下移動機構部221dと、トップリング揺動支持シャフト221bを旋回中心にしてトップリング221を旋回(揺動)移動させるトップリング揺動移動機構部221eとを備える。
 トップリング揺動移動機構部221eは、トップリング揺動支持シャフト221bと、トップリングシャフト221aをトップリング揺動支持シャフト221bに対して揺動可能に連結するトップリング揺動アーム221fと、トップリング揺動支持シャフト221bを回転駆動するトップリング揺動軸モータ221gと、を有する。
  トップリング揺動移動機構部221eは、トップリング揺動アーム221fとトップリング揺動軸モータ221gの接続部において、トップリング揺動アーム221fに加わるトップリング揺動トルクを検知するトップリング揺動トルクセンサ221hを有する。具体的には、トップリング揺動トルクセンサ221hは、トップリング揺動軸モータ221gの電流値から、トップリング揺動アーム221fに加わるトルクを検知すればよい。トップリング揺動軸モータ221gの電流値は、トップリング揺動軸モータ221gへの接続部におけるトップリング揺動アーム221fのトルクに依存する量である。本実施形態では、トップリング揺動軸モータ221gの電流値は、本実施形態では、トップリング揺動軸モータ221gに供給される電流値、または、図示しないドライバ内で生成される電流指令値でよい。なお、他の方法でトップリング揺動トルクを検知してもよい。
 また、トップリング221には、研磨中のトップリング221の振動を測定する加速度センサ221j及び/又は図示しない振幅センサを取付けてもよい。さらに、トップリング221の近傍に、研磨中の騒音を測定する騒音測定器221kを設けてもよい。
 研磨流体供給ノズル222は、支持シャフト222aに支持されて、支持シャフト222aを旋回中心にして研磨流体供給ノズル222を旋回移動させる揺動移動機構部222bと、研磨流体の流量を調節する研磨流体流量調節部222cと、研磨流体の温度を調節する研磨流体温調機構部222dとを備える。研磨流体は、研磨液(スラリー)又は純水であり、さらに、薬液を含むものでもよいし、研磨液に分散剤を添加したものでもよい。
 ドレッサ223は、上下方向に移動可能なドレッサシャフト223aに支持されて、その軸心周りにドレッサ223を回転駆動させるドレッサ回転移動機構部223cと、ドレッサ223を上下方向に移動させるドレッサ上下移動機構部223dと、ドレッサ揺動支持シャフト223bを旋回中心にしてドレッサ223を旋回移動させるドレッサ揺動移動機構部223eとを備える。
 ドレッサ揺動移動機構部223eは、ドレッサ揺動支持シャフト223bと、ドレッサシャフト223aをドレッサ揺動支持シャフト223bに対して揺動可能に連結するドレッサ揺動アーム223fと、ドレッサ揺動支持シャフト223bを回転駆動するドレッサ揺動軸モータ223gと、を有する。
  ドレッサ揺動移動機構部223eは、ドレッサ揺動アーム223fとドレッサ揺動軸モータ223gの接続部において、ドレッサ揺動アーム223fに加わるドレッサ揺動トルクを検知するドレッサ揺動トルクセンサ223hを有する。具体的には、ドレッサ揺動トルクセンサ223hは、ドレッサ揺動軸モータ223gの電流値から、ドレッサ揺動アーム223fに加わるトルクを検知すればよい。ドレッサ揺動軸モータ223gの電流値は、ドレッサ揺動軸モータ223gへの接続部におけるドレッサ揺動アーム223fのトルクに依存する量である。本実施形態では、ドレッサ揺動軸モータ223gの電流値は、ドレッサ揺動軸モータ223gに供給される電流値、または、図示しないドライバ内で生成される電流指令値でよい。なお、他の方法でドレッサ揺動トルクを検知してもよい。
 アトマイザ224は、支持シャフト224aに支持されて、支持シャフト224aを旋回中心にしてアトマイザ224を旋回移動させるアトマイザ揺動移動機構部224bと、洗浄流体の流量を調節する洗浄流体流量調節部224cとを備える。洗浄流体は、液体(例えば、純水)と気体(例えば、窒素ガス)の混合流体又は液体(例えば、純水)である。
 環境センサ225は、ハウジング20の内部空間に配置されたセンサからなり、例えば、内部空間の温度を計測する温度センサ225aと、内部空間の湿度を計測する湿度センサ225bと、内部空間の気圧を計測する気圧センサ225cとを備える。なお、環境センサ225として、研磨処理中や研磨処理の前後に、研磨パッド2200の表面等を撮影可能なカメラ(イメージセンサ)を備えていてもよい。
 なお、図3では、各回転移動機構部220b、221c、223c、各上下移動機構部221d、223d、及び、各揺動移動機構部221e、222b、223e、224bの具体的な構成を省略しているが、例えば、モータ、アクチュエータ等の駆動力発生用のモジュールと、リニアガイド、ボールねじ、ギヤ、ベルト、カップリング、軸受等の駆動力伝達機構と、リニアセンサ、エンコーダセンサ、リミットセンサ、トルクセンサ等のセンサとを適宜組み合わせて構成される。
 また、図3では、各流量調節部222c、224cの具体的な構成を省略しているが、例えば、ポンプ、バルブ、レギュレータ等の流体調節用のモジュールと、流量センサ、圧力センサ、液面センサ等のセンサとを適宜組み合わせて構成される。さらに、図3では、研磨テーブル表面温調機構部220c、研磨テーブル内部温調機構部220d及び研磨流体温調機構部222dの具体的な構成を省略しているが、例えば、ヒータ、熱交換器等の温度調節用(伝導方式、輻射(放射)方式、対流方式)のモジュールと、温度センサ、電流センサ等のセンサとを適宜組み合わせて構成される。
 図4は、トップリング221の一例を模式的に示す断面図である。トップリング221は、トップリングシャフト221aに取り付けられたトップリング本体2210と、トップリング本体2210に収容された略円盤状のキャリア2211と、キャリア2211の下側に配置されて、ウェハWを研磨パッド2200に対して押圧する弾性膜2212と、キャリア2211及び弾性膜2212の外周に配置されて、研磨パッド2200を直接押圧する略円環状のリテーナリング2213と、トップリング本体2210及びリテーナリング2213の間に配置されて、リテーナリング2213を研磨パッド2200に対して押圧するリテーナリング押圧機構としてのリテーナリングエアバッグ2214と、を備える。
 なお、本実施形態ではリテーナリング押圧機構としてリテーナリングエアバッグ2214を用いたが、リテーナリング押圧機構は、エア、水、又は、油等を用いる流体アクチュエータ、ボールネジ等を用いる電動アクチュエータ、バネや袋状バッグを含む弾性部材等でよい。
 弾性膜2212は、弾性膜で形成されており、その内部に、同心状の複数の隔壁2212eを有することにより、トップリング本体2210の中心から外周方向に向かって同心状に配置された第1乃至第4の弾性膜圧力室2212a~2212dを有する。また、弾性膜2212は、その下面に、ウェハWの吸着用の複数の孔2212fを有し、ウェハWを保持する基板保持面として機能する。リテーナリングエアバッグ2214は、弾性膜で形成されており、その内部に、リテーナリング圧力室2214aを有する。なお、トップリング221の構成は適宜変更してもよく、キャリア2211全体を押圧する圧力室を備えるものでもよいし、弾性膜2212が有する弾性膜圧力室の数や形状は適宜変更してもよいし、吸着用の孔2212fの数や配置は適宜変更してもよい。また、弾性膜2212は、吸着用の孔2212fを有しないものでもよい。
 第1乃至第4の弾性膜圧力室2212a~2212dには、第1乃至第4の流路2216A~2216Dがそれぞれ接続され、リテーナリング圧力室2214aには、第5の流路2216Eが接続される。第1乃至第5の流路2216A~2216Eは、トップリングシャフト221aに設けられたトップリングロータリーコネクタ2215を介して外部に連通し、第1の分岐流路2217A~2217Eと、第2の分岐流路2218A~2218Eとにそれぞれ分岐される。第1乃至第5の流路2216A~2216Eには、圧力センサPA~PEがそれぞれ設置される。第1の分岐流路2217A~2217Eは、バルブV1A~V1E、流量センサFA~FE及び圧力レギュレータRA~REを介して圧力流体(空気、窒素等)のガス供給源GSに接続される。第2の分岐流路2218A~2218Eは、それぞれバルブV2A~V2Eを介して真空源VSに接続されるとともに、バルブV3A~V3Eを介して大気に連通可能に構成される。
 ウェハWは、トップリング221の下面に吸着保持されて、研磨テーブル220上の所定の研磨位置に移動された後、研磨流体供給ノズル222から研磨流体が供給された研磨パッド2200の研磨面に対してトップリング221により押圧されることで研磨される。その際、トップリング221は、圧力レギュレータRA~REを独立に制御することで、第1乃至第4の弾性膜圧力室2212a~2212dに供給する圧力流体によりウェハWを研磨パッド2200に押圧する押圧力をウェハWの領域毎に調整するとともに、リテーナリング圧力室2214aに供給する圧力流体によりリテーナリング2213を研磨パッド2200に押圧する押圧力を調整する。第1乃至第4の弾性膜圧力室2212a~2212d及びリテーナリング圧力室2214aにそれぞれ供給される圧力流体の圧力は、圧力センサPA~PEによりそれぞれ測定され、圧力気体の流量は、流量センサFA~FEによりそれぞれ測定される。
(基板搬送ユニット)
 基板搬送ユニット23は、図2に示すように、第1乃至第4の研磨部22A~22Dの並び方向(ハウジング20の長手方向)に沿って水平移動可能な第1及び第2のリニアトランスポータ230A、230Bと、第1及び第2のリニアトランスポータ230A、230Bの間に配置されたスイングトランスポータ231と、ロード/アンロードユニット21側に配置されたリフタ232と、洗浄ユニット24側に配置されたウェハWの仮置き台233とを備える。
 第1のリニアトランスポータ230Aは、第1及び第2の研磨部22A、22Bに隣接して配置されて、4つの搬送位置(ロード/アンロードユニット21側から順に第1乃至第4の搬送位置TP1~TP4とする)の間でウェハWを搬送する機構である。第2の搬送位置TP2は、第1の研磨部22Aに対してウェハWを受け渡す位置であり、第3の搬送位置TP3は、第2の研磨部22Bに対してウェハWを受け渡す位置である。
 第2のリニアトランスポータ230Bは、第3及び第4の研磨部22C、22Dに隣接して配置されて、3つの搬送位置(ロード/アンロードユニット21側から順に第5乃至第7の搬送位置TP5~TP7とする)の間でウェハWを搬送する機構である。第6の搬送位置TP6は、第3の研磨部22Cに対してウェハWを受け渡す位置であり、第7の搬送位置TP7は、第4の研磨部22Dに対してウェハWを受け渡す位置である。
 スイングトランスポータ231は、第4及び第5の搬送位置TP4、TP5に隣接して配置されるとともに、第4及び第5の搬送位置TP4、TP5の間を移動可能なハンドを有する。スイングトランスポータ231は、第1及び第2のリニアトランスポータ230A、230Bの間でウェハWを受け渡すとともに、仮置き台233にウェハWを仮置きする機構である。リフタ232は、第1の搬送位置TP1に隣接して配置されて、ロード/アンロードユニット21の搬送ロボット211との間でウェハWを受け渡す機構である。ウェハWの受け渡しの際、第1の隔壁200Aに設けられたシャッタ(不図示)が開閉される。
(洗浄ユニット)
 洗浄ユニット24は、図2に示すように、洗浄具を用いてウェハWを洗浄する第1及び第2の洗浄室240A、240Bと、ウェハWを乾燥させる乾燥室241と、ウェハWを搬送する第1及び第2の搬送室242A、242Bとを備える。洗浄ユニット24の各室は、それぞれが区画された状態で第1及び第2のリニアトランスポータ230A、230Bに沿って、例えば、第1の洗浄室240A、第1の搬送室242A、第2の洗浄室240B、第2の搬送室242B、及び、乾燥室241の順(ロード/アンロードユニット21から遠い順)に配置される。なお、洗浄室240A、240B、乾燥室241、及び、搬送室242A、242Bの数や配置は、図2の例に限られず、適宜変更してもよい。
(膜厚測定ユニット)
 膜厚測定ユニット25は、研磨処理前又は研磨処理後のウェハWの膜厚を測定する測定器であり、例えば、光学式膜厚測定器、渦電流式膜厚測定器等で構成される。各膜厚測定モジュールに対するウェハWの受け渡しは、搬送ロボット211により行われる。
(制御ユニット)
 図5は、基板処理装置2の一例を示すブロック図である。制御ユニット26は、各ユニット21~25と電気的に接続されて、各ユニット21~25を統括的に制御する。以下では、研磨ユニット22の制御系(モジュール、センサ、シーケンサ)を例にして説明するが、他のユニット21、23~25も基本的な構成や機能は共通するため、説明を省略する。
 研磨ユニット22は、研磨ユニット22が備える各サブユニット(例えば、研磨テーブル220、トップリング221、研磨流体供給ノズル222、ドレッサ223、アトマイザ224等)にそれぞれ配置されて、制御対象となる複数のモジュール227~227と、複数のモジュール227~227にそれぞれ配置されて、各モジュール227~227の制御に必要なデータ(検出値)を検出する複数のセンサ228~228と、各センサ228~228の検出値に基づいて各モジュール227~227の動作を制御するシーケンサ229と、を備える。
 研磨ユニット22のセンサ228~228には、例えば、研磨流体の流量を検出するセンサ、リテーナリング押圧機構の押圧力を検出するセンサ、トップリング221の回転トルクを検出するセンサ、研磨テーブル220の回転トルクを検出するセンサ、終点検知までの時間を測定するタイマー、終点検知する光学式等のセンサ、環境センサ225等が含まれる。なお、本実施形態では、回転トルクとは、研磨面と接するトップリング221やドレッサ223と、研磨テーブル220との摺接抵抗を測るものである。
 制御ユニット26は、基板処理制御部260、通信部261、入力部262、出力部263、及び、記憶部264を備える。制御ユニット26は、例えば、汎用又は専用のコンピュータ(後述の図6参照)で構成される。
 通信部261は、ネットワーク7に接続され、各種のデータを送受信する通信インターフェースとして機能する。入力部262は、各種の入力操作を受け付けるとともに、出力部263は、表示画面、シグナルタワー点灯、ブザー音を介して各種の情報を出力することで、ユーザインターフェースとして機能する。
 記憶部264は、基板処理装置2の動作で使用される各種のプログラム(オペレーティングシステム(OS)、アプリケーションプログラム、ウェブブラウザ等)やデータ(装置設定情報265、基板レシピ情報266等)を記憶する。装置設定情報265及び基板レシピ情報266は、表示画面を介してユーザにより編集可能なデータである。
 基板処理制御部260は、複数のシーケンサ219、229、239、249、259(以下、「シーケンサ群」という)を介して複数のセンサ218~218、228~228、238~238、248~248、258~258(以下、「センサ群」という)の検出値を取得するとともに、複数のモジュール217~217、227~227、237~237、247~247、257~257(以下、「モジュール群」という)を連携して動作させることで、ロ―ド、研磨、洗浄、乾燥、膜厚測定、アンロード等の一連の基板処理を行う。
(各装置のハードウエア構成)
 図6は、コンピュータ900の一例を示すハードウエア構成図である。基板処理装置2の制御ユニット26、データベース装置3、機械学習装置4、情報処理装置5、及び、ユーザ端末装置6の各々は、汎用又は専用のコンピュータ900により構成される。
 コンピュータ900は、図6に示すように、その主要な構成要素として、バス910、プロセッサ912、メモリ914、入力デバイス916、出力デバイス917、表示デバイス918、ストレージ装置920、通信I/F(インターフェース)部922、外部機器I/F部924、I/O(入出力)デバイスI/F部926、及び、メディア入出力部928を備える。なお、上記の構成要素は、コンピュータ900が使用される用途に応じて適宜省略されてもよい。
 プロセッサ912は、1つ又は複数の演算処理装置(CPU(Central Processing Unit)、MPU(Micro-processing unit)、DSP(digital signal processor)、GPU(Graphics Processing Unit)、NPU(Neural Processing Unit)等)で構成され、コンピュータ900全体を統括する。メモリ914は、各種のデータ及びプログラム930を記憶し、例えば、メインメモリとして機能する揮発性メモリ(DRAM、SRAM等)と、不揮発性メモリ(ROM)、フラッシュメモリ等とで構成される。
 入力デバイス916は、例えば、キーボード、マウス、テンキー、電子ペン等で構成され、入力部として機能する。出力デバイス917は、例えば、音(音声)出力装置、バイブレーション装置等で構成され、出力部として機能する。表示デバイス918は、例えば、液晶ディスプレイ、有機ELディスプレイ、電子ペーパー、プロジェクタ等で構成され、出力部として機能する。入力デバイス916及び表示デバイス918は、タッチパネルディスプレイのように、一体的に構成されていてもよい。ストレージ装置920は、例えば、HDD、SSD(Solid State Drive)等で構成され、記憶部として機能する。ストレージ装置920は、オペレーティングシステムやプログラム930の実行に必要な各種のデータを記憶する。
 通信I/F部922は、インターネットやイントラネット等のネットワーク940(図1のネットワーク7と同じであってもよい)に有線又は無線により接続され、所定の通信規格に従って他のコンピュータとの間でデータの送受信を行う通信部として機能する。外部機器I/F部924は、カメラ、プリンタ、スキャナ、リーダライタ等の外部機器950に有線又は無線により接続され、所定の通信規格に従って外部機器950との間でデータの送受信を行う通信部として機能する。I/OデバイスI/F部926は、各種のセンサ、アクチュエータ等のI/Oデバイス960に接続され、I/Oデバイス960との間で、例えば、センサによる検出信号やアクチュエータへの制御信号等の各種の信号やデータの送受信を行う通信部として機能する。メディア入出力部928は、例えば、DVDドライブ、CDドライブ等のドライブ装置で構成され、DVD、CD等のメディア(非一時的な記憶媒体)970に対してデータの読み書きを行う。
 上記構成を有するコンピュータ900において、プロセッサ912は、ストレージ装置920に記憶されたプログラム930をメモリ914に呼び出して実行し、バス910を介してコンピュータ900の各部を制御する。なお、プログラム930は、ストレージ装置920に代えて、メモリ914に記憶されていてもよい。プログラム930は、インストール可能なファイル形式又は実行可能なファイル形式でメディア970に記録され、メディア入出力部928を介してコンピュータ900に提供されてもよい。プログラム930は、通信I/F部922を介してネットワーク940経由でダウンロードすることによりコンピュータ900に提供されてもよい。また、コンピュータ900は、プロセッサ912がプログラム930を実行することで実現する各種の機能を、例えば、FPGA、ASIC等のハードウエアで実現するものでもよい。
 コンピュータ900は、例えば、据置型コンピュータや携帯型コンピュータで構成され、任意の形態の電子機器である。コンピュータ900は、クライアント型コンピュータでもよいし、サーバ型コンピュータやクラウド型コンピュータでもよい。コンピュータ900は、各装置2~6以外の装置にも適用されてもよい。
(生産履歴情報30)
 図7は、データベース装置3により管理される生産履歴情報30の一例を示すデータ構成図である。生産履歴情報30は、本生産用のウェハWに対して基板処理が行われたときに取得されたレポートRが分類されて登録されるテーブルとして、例えば、各ウェハWに関するウェハ履歴テーブル300と、研磨処理における装置状態情報に関する研磨履歴テーブル301とを備える。なお、生産履歴情報30は、上記の他に、洗浄処理における装置状態情報に関する洗浄履歴テーブル、イベント情報に関するイベント履歴テーブル及び操作情報に関する操作履歴テーブル等を備えるが、詳細な説明は省略する。
 ウェハ履歴テーブル300の各レコードには、例えば、ウェハID、カセット番号、スロット番号、各工程の開始時刻、終了時刻、使用ユニットID等が登録される。なお、図7では、研磨工程、洗浄工程が例示されているが、他の工程についても同様に登録される。
 研磨履歴テーブル301の各レコードには、例えば、ウェハID、消耗状態情報、加工状態情報等が登録される。
 消耗状態情報は、研磨加工前に取得できる基板処理装置2の各構成要素の消耗状態を示す情報である。消耗状態情報は、例えば、研磨パッド2200のコンディションを示す情報、トップリングロータリーコネクタ2215のコンディションを示す情報、研磨テーブルロータリーコネクタ2201のコンディションを示す情報、ドレッサ223のコンディションを示す情報、基板処理制御部260のコンディションを示す情報である。各コンディションを示す情報は、少なくとも各構成要素の使用時間及びウェハ処理枚数を含む。
 加工状態情報は、研磨加工中に取得できる基板処理装置2の加工状態を示す情報である。加工状態情報は、例えば、基板処理装置2が有する研磨流体の流量センサ、リテーナリング押圧機構の押圧力センサ、トップリング221の回転トルクセンサ、又は、研磨テーブル220の回転トルクセンサ等のセンサ郡により所定の時間間隔でサンプリングされた各センサの検出値である。さらに、加工状態情報は、例えば、ウェハW毎の終点検知までの時間の統計値、ウェハW毎のセンサ時系列データの統計値である。
 研磨履歴テーブル301を参照することで、ウェハIDで特定されるウェハWに対して研磨処理が行われたときの基板処理装置2の装置状態として、各センサの時系列データが抽出可能である。
(研磨試験情報31)
 図8は、データベース装置3により管理される研磨試験情報31の一例を示すデータ構成図である。研磨試験情報31は、研磨試験が行われたときに取得されたレポートR及び試験結果が分類されて登録される研磨試験テーブル310を備える。
 研磨試験テーブル310の各レコードには、例えば、試験ID、消耗状態情報、加工状態情報、試験結果情報等が登録される。研磨試験テーブル310の消耗状態情報、及び、加工状態情報、は、研磨試験における各部の状態を示す情報であり、そのデータ構成は、研磨履歴テーブル301と同様であるため、詳細な説明を省略する。
 試験結果情報は、研磨試験において研磨処理が行われたときの試験用の研磨装置の状態を示す情報である。試験結果情報は、試験用の研磨装置に設けられた研磨装置用測定機器により測定された測定値でよい。図8に示す試験結果情報は、研磨処理を開始してからのウェハ処理枚数1,2,…,…m,…,n及び使用時間t1,t2,…,…tm,…,tnを含む。また、m枚目の研磨処理期間に含まれる各時刻tm1,tm2,…,…tmm,…,tmnにおける終点検知の信頼度、信頼性低下の予兆、信頼性低下の要因となる構成要素の種類、及び、信頼性低下の要因となる工程の種類TR1~TR4をそれぞれ含む。
 研磨試験テーブル310を参照することで、試験IDで特定される研磨試験において、研磨処理が行われたときの研磨ユニット22の状態を示す各センサの時系列データと、そのときの終点検知機能の信頼性とが抽出可能である。例えば、終点検知機能の信頼性の低下の予兆は、終点検知機能の信頼性の低下時点tmmより前の研磨処理の第1対象期間のデータを用い、終点検知機能の信頼性の低下の有無は、終点検知機能の信頼性の低下時点tmmを含む第2対象期間のデータを用いればよい。
(機械学習装置4)
 図9は、第1の実施形態に係る機械学習装置4の一例を示すブロック図である。機械学習装置4は、機械学習制御部40、通信部41、学習用データ記憶部42、及び、学習済みモデル記憶部43を備える。
 機械学習制御部40は、学習用データ取得部400及び機械学習部401として機能する。通信部41は、ネットワーク7を介して外部装置(例えば、基板処理装置2、データベース装置3、情報処理装置5、及び、ユーザ端末装置6、研磨試験装置(不図示)等)と接続され、各種のデータを送受信する通信インターフェースとして機能する。
 学習用データ取得部400は、通信部41及びネットワーク7を介して外部装置と接続され、入力データとしての信頼性低下要因状態情報と、出力データとしての研磨終点検知機能の信頼性情報とで1組として構成される第1の学習用データ11Aを取得する。第1の学習用データ11Aは、教師あり学習における教師データ(トレーニングデータ)、検証データ及びテストデータとして用いられるデータである。また、研磨終点検知機能の信頼性情報は、教師あり学習における正解ラベルとして用いられるデータである。
 学習用データ記憶部42は、学習用データ取得部400で取得した第1の学習用データ11Aを複数組記憶するデータベースである。なお、学習用データ記憶部42を構成するデータベースの具体的な構成は適宜設計すればよい。
 機械学習部401は、学習用データ記憶部42に記憶された複数組の第1の学習用データ11Aを用いて機械学習を実施する。すなわち、機械学習部401は、第1の学習モデル10Aに第1の学習用データ11Aを複数組入力し、第1の学習用データ11Aに含まれる信頼性低下要因状態情報と研磨終点検知機能の信頼性情報との相関関係を第1の学習モデル10Aに学習させることで、学習済みの第1の学習モデル10Aを生成する。
 学習済みモデル記憶部43は、機械学習部401により生成された学習済みの第1の学習モデル10A(具体的には、調整済みの重みパラメータ群)を記憶するデータベースである。学習済みモデル記憶部43に記憶された学習済みの第1の学習モデル10Aは、ネットワーク7や記録媒体等を介して実システム(例えば、情報処理装置5)に提供される。なお、図9では、学習用データ記憶部42と、学習済みモデル記憶部43とが別々の記憶部として示されているが、これらは単一の記憶部で構成されてもよい。
 なお、学習済みモデル記憶部43に記憶される第1の学習モデル10Aの数は1つに限定されず、例えば、機械学習の手法、トップリング221の機構や材質の違い、弾性膜2212の種類、リテーナリング2213の種類、研磨パッド2200の種類、研磨流体の種類、信頼性低下要因状態情報に含まれるデータの種類、研磨終点検知機能の信頼性情報に含まれるデータの種類等のように、条件が異なる複数の学習モデルが記憶されてもよい。その場合には、学習用データ記憶部42には、条件が異なる複数の学習モデルにそれぞれ対応するデータ構成を有する複数種類の学習用データが記憶されればよい。
 図10は、第1の学習モデル10A及び第1の学習用データ11Aの一例を示す図である。第1の学習モデル10Aの機械学習に用いられる第1の学習用データ11Aは、信頼性低下要因状態情報と研磨終点検知機能の信頼性情報とで構成される。
第1の学習用データ11Aを構成する信頼性低下要因状態情報は、基板処理装置2の構成要素の消耗状態を示す消耗状態情報、及び、研磨加工中に取得できる基板処理装置2の加工状態を示す研磨加工状態情報を含む。
 信頼性低下要因状態情報に含まれる消耗状態情報は、基板処理装置2の構成要素の消耗状態を示す情報である。消耗状態情報は、例えば、研磨パッド2200のコンディション、トップリングロータリーコネクタ2215のコンディション、研磨テーブルロータリーコネクタ2201のコンディション、ドレッサ223のコンディション、及び、基板処理制御部260のコンディションの少なくとも1つを含む。
 研磨パッド2200のコンディションは、少なくとも、研磨パッド2200の使用時間、及び、研磨パッド2200のウェハ処理枚数、を含む。研磨パッド2200のコンディションは、例えば、研磨テーブル220の累積回転回数、研磨テーブル220の回転速度、研磨テーブル220の回転トルク、ドレッシングの有無、交換の有無、表面を撮影した画像、表面形状、平面度、清浄度、湿潤度等に基づいて設定されてもよい。研磨パッド2200のコンディションは、例えば、研磨処理中に経時変化するものでもよい。
 トップリングロータリーコネクタ2215のコンディションは、少なくとも、トップリング221の使用時間、及び、トップリング221のウェハ処理枚数、を含む。また、トップリングロータリーコネクタ2215のコンディションは、例えば、トップリング221の累積回転回数、トップリング221の回転速度、トップリング221の回転トルク等に基づいて設定されてもよい。トップリング221のコンディションは、例えば、研磨処理中に経時変化するものでもよい。
 研磨テーブルロータリーコネクタ2201のコンディションは、少なくとも、研磨テーブル220の使用時間、及び、研磨テーブル220のウェハ処理枚数、を含む。また、研磨テーブルロータリーコネクタ2201のコンディションは、例えば、研磨テーブル220の累積回転回数、研磨テーブル220の回転速度、研磨テーブル220の回転トルク等に基づいて設定されてもよい。研磨テーブル220のコンディションは、例えば、研磨処理中に経時変化するものでもよい。
 ドレッサ223のコンディションは、少なくとも、ドレッサ223の使用時間、及び、研磨テーブル220のウェハ処理枚数、を含む。また、ドレッサ223のコンディションは、例えば、ドレッサ223の累積回転回数、ドレッサ223の回転速度、ドレッサ223の回転トルク、ドレッシングの有無、交換の有無、表面を撮影した画像、表面形状、平面度、清浄度、湿潤度等に基づいて設定されてもよい。ドレッサ223のコンディションは、例えば、研磨処理中に経時変化するものでもよい。
 基板処理制御部260のコンディションは、少なくとも、基板処理制御部260の使用時間、及び、基板処理制御部260のウェハ処理枚数、を含む。基板処理制御部260のコンディションは、例えば、研磨処理中に経時変化するものでもよい。
 信頼性低下要因状態情報に含まれる加工状態情報は、研磨加工中に取得できる基板処理装置2の加工状態を示す情報である。加工状態情報は、例えば、研磨流体の流量、リテーナリング押圧機構の押圧力、トップリング221の回転トルク、研磨テーブル220の回転トルク、トップリング221の揺動トルク、トップリング221の振動、ドレッサ223の揺動トルク、研磨中の騒音、研磨面の温度、研磨テーブル220の温調水温度、ウェハ毎の終点検知までの時間の統計値、及び、ウェハ毎のセンサ時系列データの統計値、の少なくとも1つを含む。
 研磨流体の流量は、研磨流体供給ノズル222から供給される研磨流体の流量でよい。リテーナリング押圧機構の押圧力は、本実施形態では、リテーナリングエアバッグ2214のリテーナリング圧力室2214a内の圧力、リテーナリング圧力室2214aに供給される圧力流体の流量等でよい。トップリング221の回転トルクは、トップリング221を駆動するモータ電流等から求めればよい。研磨テーブル220の回転トルクは、研磨テーブル220を駆動するモータ電流等から求めればよい。
 トップリング221の揺動トルクは、トップリング揺動トルクセンサ221hが検知するトップリング揺動アーム221fに加わるトップリング揺動トルク等でよい。トップリング221の振動は、トップリング221に取り付けた加速度センサ221jが測定する研磨中のトップリング221の振動等でよい。ドレッサ223の揺動トルクは、ドレッサ揺動トルクセンサ223hが検知するドレッサ揺動アーム223fに加わるドレッサ揺動トルク等でよい。研磨中の騒音は、トップリング221の近傍に設けられた騒音測定器221kが測定する研磨中の騒音等でよい。研磨面の温度は、研磨テーブル220の上方に設置された放射温度計220c1が測定する研磨パッド2200の表面温度もしくは砥石の表面温度等でよい。研磨テーブル220の温調水温度は、供給温調水温度計220d3が測定する供給される温調水の温度等でよい。
 ウェハ毎の終点検知までの時間の統計値は、測定したウェハ毎の終点検知までの時間から求めればよい。また、測定したウェハ毎の終点検知までの時間を所定の範囲毎に区切り、当該範囲毎のデータ数から求めてもよい。ウェハ毎のセンサ時系列データの統計値は、構成要素の流量、押圧力、回転トルク等のセンサが測定した時系列データから求めればよい。また、測定した時系列データの終点検知までの時間をそれぞれ所定の範囲毎に区切り、当該範囲毎のデータ数を求めればよい。
 このように求めた統計値は、それをそのまま利用、計測器が取り込みやすいノイズ落とし等の処理をしたものを利用、あるいは、統計処理した結果を利用等のいずれかで利用してもよい。いずれであっても結果のバラツキを求められればよい。
 なお、本実施形態では、リテーナリング押圧機構としてリテーナリングエアバッグ2214を用いたため、研磨処理状態情報に含まれるトップリング状態情報は、リテーナリング圧力室2214a内の圧力(リテーナリングエアバッグ圧力)、リテーナリング圧力室2214aに供給される圧力流体の流量(リテーナリングエアバッグ流量)を含んでいる。
 リテーナリング押圧機構として他の押圧機構を用いる場合、信頼性低下要因状態情報に含まれる加工状態情報のリテーナリング押圧機構の押圧力は、リテーナリング押圧機構の押圧力を調節する要素の量等でよい。例えば、リテーナリング押圧機構として電動アクチュエータを用いる場合には、電動アクチュエータの押圧力は、電動アクチュエータの押圧力を調節する電流の量等でよい。また、リテーナリング押圧機構としてバネ又はバッグ等の弾性部材を用いる場合、リテーナリング押圧機構の押圧力は、弾性部材の押圧力と弾性部材の押圧力を調節する上下方向の位置等でよい。
 第1の学習用データ11Aを構成する研磨終点検知機能の信頼性情報は、信頼性低下要因状態情報に示すような状態で研磨処理が行われたウェハWの研磨終点検知機能の信頼性を示す情報である。本実施形態では、研磨終点検知機能の信頼性情報は、現在の終点検知の信頼度の情報、信頼性低下の予兆の情報、信頼性低下の要因となる構成要素の種類の情報、信頼性低下の要因となる工程の種類の情報である。
 学習用データ取得部400は、研磨試験情報31を参照するとともに、必要に応じてユーザ端末装置6によるユーザの入力操作を受け付けることで、第1の学習用データ11Aを取得する。例えば、学習用データ取得部400は、研磨試験情報31の研磨試験テーブル310を参照することで、試験IDで特定される研磨試験が行われたときの基板処理装置2の構成要素の消耗状態を示す消耗状態情報、及び、研磨加工中に取得できる基板処理装置2の加工状態を示す加工状態情報を、信頼性低下要因状態情報として取得する。
 なお、本実施形態では、信頼性低下要因状態情報を、センサ群の時系列データとして取得する場合について説明するが、研磨ユニット22(特に、トップリング221及び研磨テーブル220)の構成に応じて適宜変更してもよい。また、信頼性低下要因状態情報として、モジュールへの指令値を用いてもよいし、センサの検出値又はモジュールへの指令値から換算されるパラメータを用いてもよいし、複数のセンサの検出値に基づいて算出されるパラメータを用いてもよい。さらに、信頼性低下要因状態情報は、研磨処理期間全体の時系列データとして取得されてもよいし、研磨処理期間の一部である対象期間の時系列データとして取得されてもよいし、例えば研磨終点検知機能の信頼性低下時点のように特定の対象時点における時点データとして取得されてもよい。上記のように、信頼性低下要因状態情報の定義を変更する場合には、第1の学習モデル10A及び第1の学習用データ11Aにおける入力データのデータ構成を適宜変更すればよい。
 また、学習用データ取得部400は、研磨試験情報31の研磨試験テーブル310を参照することで、同一の試験IDで特定される研磨試験が行われたときの試験結果情報を、上記の信頼性低下要因状態情報に対応する研磨終点検知機能の信頼性情報として取得する。
 なお、本実施形態では、研磨終点検知機能の信頼性情報が、図10に示すような現在の終点検知の信頼度情報、信頼性低下の予兆情報、信頼性低下の要因となる構成要素の種類情報、信頼性低下の要因となる工程の種類情報である場合について説明する。
 現在の終点検知の信頼度情報は、現在の終点検知の信頼度が何%であるかの情報である。信頼度は、0~100%で分類すればよい。例えば、現在の終点検知の信頼度が100%であれば、現在の終点検知は信頼できるものであり、現在の終点検知の信頼度が0%であれば、現在の終点検知は信頼できないものであると判断できる。
 信頼性低下の予兆情報は、終点検知の信頼性が低下又は終点未検知までの時間又は処理枚数の情報である。例えば、終点検知の信頼性の低下が今から数時間後又は数枚後の研磨処理で起こる可能性が高い場合、その前に基板処理装置2に何らかの処置をすることができる。
 信頼性低下の要因となる構成要素の種類情報は、予め用意した構成要素のうち、終点検知の信頼性が低下する要因となる構成要素の種類の情報である。例えば、終点検知の信頼性が低下する要因がトップリングである場合、トップリングに何らかの処置をすることができる。
 信頼性低下の要因となる工程の種類情報は、予め用意した工程のうち、終点検知の信頼性が低下する要因となる工程の種類の情報である。例えば、終点検知の信頼性が低下する要因が成膜工程である場合、成膜工程の膜の強弱、膜厚、バラツキ等に何らかの処置をすることができる。
 第1の学習モデル10Aは、例えば、ニューラルネットワークの構造を採用したものであり、入力層100、中間層101、及び、出力層102を備える。各層の間には、各ニューロンをそれぞれ接続するシナプス(不図示)が張られており、各シナプスには、重みがそれぞれ対応付けられている。各シナプスの重みからなる重みパラメータ群が、機械学習により調整される。
 入力層100は、入力データとしての信頼性低下要因状態情報に対応する数のニューロンを有し、信頼性低下要因状態情報の各値が各ニューロンにそれぞれ入力される。出力層102は、出力データとしての研磨終点検知機能の信頼性情報に対応する数のニューロンを有し、信頼性低下要因状態情報に対する研磨終点検知機能の信頼性情報の予測結果(推論結果)が、出力データとして出力される。
 第1の学習モデル10Aが、回帰モデルで構成される場合には、研磨終点検知機能の信頼性情報は、所定の範囲(例えば、0~1)に正規化された数値でそれぞれ出力される。また、第1の学習モデル10Aが、分類モデルで構成される場合には、研磨終点検知機能の信頼性情報は、各クラスに対するスコア(確度)として、所定の範囲(例えば、0~1)に正規化された数値でそれぞれ出力される。
 「所定の範囲(0~1)」には予め数値に対応した推論結果が設定されている。例えば、現在の終点検知の信頼度情報の場合、推論結果である「所定の範囲(0~1)」を複数の範囲に分割して、分割された範囲毎に現在の終点検知の信頼度(0~100%)が設定されればよい。また、信頼性低下の予兆情報の場合、推論結果である「所定の範囲(0~1)」を複数の範囲に分割して、分割された範囲毎に信頼性低下までの予兆時間が設定されればよい。
 信頼性低下の要因となる構成要素の種類情報の場合、各構成要素の推論結果である「所定の範囲(0~1)」の間に所定の閾値を設定し、出力された数値が、閾値以下であればその構成要素は「信頼性低下の要因でない」、閾値を超えたら「信頼性低下の要因である」と設定されればよい。なお、各構成要素は、予め用意しておき、それぞれに対してそれぞれの閾値を設定すればよい。
 また、信頼性低下の要因となる工程の種類情報の場合、各工程の推論結果である「所定の範囲(0~1)」の間に所定の閾値を設定し、出力された数値が、閾値以下であればその工程は「信頼性低下の要因でない」、閾値を超えたら「信頼性低下の要因である」と設定されればよい。なお、各工程は、予め用意しておき、それぞれに対してそれぞれの閾値を設定すればよい。
(機械学習方法)
 図11は、機械学習装置4による機械学習方法の一例を示すフローチャートである。
 まず、ステップS100において、学習用データ取得部400は、機械学習を開始するための事前準備として、研磨試験情報31等から所望の数の第1の学習用データ11Aを取得し、その取得した第1の学習用データ11Aを学習用データ記憶部42に記憶する。ここで準備する第1の学習用データ11Aの数については、最終的に得られる第1の学習モデル10Aに求められる推論精度を考慮して設定すればよい。
 次に、ステップS110において、機械学習部401は、機械学習を開始すべく、学習前の第1の学習モデル10Aを準備する。ここで準備する学習前の第1の学習モデル10Aは、図10に例示したニューラルネットワークモデルで構成されており、各シナプスの重みが初期値に設定されている。
 次に、ステップS120において、機械学習部401は、学習用データ記憶部42に記憶された複数組の第1の学習用データ11Aから、例えば、ランダムに1組の第1の学習用データ11Aを取得する。
 次に、ステップS130において、機械学習部401は、1組の第1の学習用データ11Aに含まれる研磨処理状態情報(入力データ)を、準備された学習前(又は学習中)の第1の学習モデル10Aの入力層100に入力する。その結果、第1の学習モデル10Aの出力層102から推論結果として研磨終点検知機能の信頼性情報(出力データ)が出力されるが、当該出力データは、学習前(又は学習中)の第1の学習モデル10Aによって生成されたものである。そのため、学習前(又は学習中)の状態では、推論結果として出力された出力データは、第1の学習用データ11Aに含まれる研磨終点検知機能の信頼性情報(正解ラベル)とは異なる情報を示す。
 次に、ステップS140において、機械学習部401は、ステップS120において取得された1組の第1の学習用データ11Aに含まれる研磨終点検知機能の信頼性情報(正解ラベル)と、ステップS130において出力層から推論結果として出力された研磨終点検知機能の信頼性情報(出力データ)とを比較し、各シナプスの重みを調整する処理(バックプロパゲーション)を実施することで、機械学習を実施する。これにより、機械学習部401は、信頼性低下要因状態情報と研磨終点検知機能の信頼性情報との相関関係を第1の学習モデル10Aに学習させる。
 次に、ステップS150において、機械学習部401は、所定の学習終了条件が満たされたか否かを、例えば、第1の学習用データ11Aに含まれる研磨終点検知機能の信頼性情報(正解ラベル)と、推論結果として出力された研磨終点検知機能の信頼性情報(出力データ)とに基づく誤差関数の評価値や、学習用データ記憶部42内に記憶された未学習の第1の学習用データ11Aの残数に基づいて判定する。
 ステップS150において、機械学習部401が、学習終了条件が満たされておらず、機械学習を継続すると判定した場合(ステップS150でNo)、ステップS120に戻り、学習中の第1の学習モデル10Aに対してステップS120~S140の工程を未学習の第1の学習用データ11Aを用いて複数回実施する。一方、ステップS150において、機械学習部401が、学習終了条件が満たされて、機械学習を終了すると判定した場合(ステップS150でYes)、ステップS160に進む。
 そして、ステップS160において、機械学習部401は、各シナプスに対応付けられた重みを調整することで生成された学習済みの第1の学習モデル10A(調整済みの重みパラメータ群)を学習済みモデル記憶部43に記憶し、図11に示す一連の機械学習方法を終了する。機械学習方法において、ステップS100が学習用データ記憶工程、ステップS110~S150が機械学習工程、ステップS160が学習済みモデル記憶工程に相当する。
 以上のように、本実施形態に係る機械学習装置4及び機械学習方法によれば、消耗状態情報及び加工状態情報を含む信頼性低下要因状態情報から、当該ウェハWの状態を示す研磨終点検知機能の信頼性情報を予測(推論)することが可能な第1の学習モデル10Aを提供することができる。
(情報処理装置5)
 図12は、第1の実施形態に係る情報処理装置5の一例を示すブロック図である。図13は、第1の実施形態に係る情報処理装置5の一例を示す機能説明図である。情報処理装置5は、情報処理制御部50、通信部51、及び、学習済みモデル記憶部52を備える。
 情報処理制御部50は、情報取得部500、状態予測部501及び出力処理部502として機能する。通信部51は、ネットワーク7を介して外部装置(例えば、基板処理装置2、データベース装置3、機械学習装置4、及び、ユーザ端末装置6等)と接続され、各種のデータを送受信する通信インターフェースとして機能する。
 情報取得部500は、通信部51及びネットワーク7を介して外部装置と接続され、消耗状態情報及び加工状態情報を含む信頼性低下要因状態情報を取得する。
 例えば、研磨処理が行われている最中のウェハWに対する研磨終点検知機能の信頼性情報の「リアルタイム予測処理」を行う場合には、情報取得部500は、その研磨処理を行っている基板処理装置2から信頼性低下要因状態情報に関するレポートRを随時受信することで、そのウェハWに対して研磨処理が行われている最中の消耗状態情報及び加工状態情報を、信頼性低下要因状態情報として随時取得する。
 状態予測部501は、上記のように、情報取得部500により取得された信頼性低下要因状態情報を入力データとして第1の学習モデル10Aに入力することで、当該信頼性低下要因状態情報に示す研磨処理が行われているウェハWに対する研磨終点検知機能の信頼性情報を予測する。
 学習済みモデル記憶部52は、状態予測部501にて用いられる学習済みの第1の学習モデル10Aを記憶するデータベースである。なお、学習済みモデル記憶部52に記憶される第1の学習モデル10Aの数は1つに限定されず、例えば、機械学習の手法、トップリング221の機構や材質の違い、弾性膜2212の種類、リテーナリング2213の種類、研磨パッド2200の種類、研磨流体の種類、信頼性低下要因状態情報に含まれるデータの種類、研磨終点検知機能の信頼性情報に含まれるデータの種類等のように、状態が異なる複数の学習済みモデルが記憶され、選択的に利用可能としてもよい。また、学習済みモデル記憶部52は、外部コンピュータ(例えば、サーバ型コンピュータやクラウド型コンピュータ)の記憶部で代用されてもよく、その場合には、状態予測部501は、当該外部コンピュータにアクセスすればよい。
 出力処理部502は、状態予測部501により生成された研磨終点検知機能の信頼性情報を出力するための出力処理を行う。例えば、出力処理部502は、その研磨終点検知機能の信頼性情報をユーザ端末装置6に送信することで、その研磨終点検知機能の信頼性情報に基づく表示画面がユーザ端末装置6に表示されてもよいし、その研磨終点検知機能の信頼性情報をデータベース装置3に送信することで、その研磨終点検知機能の信頼性情報が生産履歴情報30に登録されてもよい。
(情報処理方法)
 図14は、情報処理装置5による情報処理方法の一例を示すフローチャートである。以下では、ユーザがユーザ端末装置6を操作して、特定のウェハWに対する研磨終点検知機能の信頼性情報の「予測処理」を行う場合の動作例について説明する。
 まず、ステップS200において、ユーザが、ユーザ端末装置6に対して、予測対象のウェハWを特定するウェハIDを入力する入力操作を行うと、ユーザ端末装置6は、そのウェハIDを情報処理装置5に送信する。
 次に、ステップS210において、情報処理装置5の情報取得部500は、ステップS200にて送信されたウェハIDを受信する。ステップS211において、情報取得部500は、ステップS210で受信したウェハIDを用いて生産履歴情報30の研磨履歴テーブル301を参照することで、そのウェハIDで特定されたウェハWに対して研磨処理が行われたときの信頼性低下要因状態情報を取得する。
 次に、ステップS220において、状態予測部501は、ステップS211にて取得された信頼性低下要因状態情報を入力データとして第1の学習モデル10Aに入力することで、当該信頼性低下要因状態情報に対する研磨終点検知機能の信頼性情報を出力データとして生成し、そのウェハWの状態を予測する。
 次に、ステップS230において、出力処理部502は、ステップS220にて生成された研磨終点検知機能の信頼性情報を出力するための出力処理として、その研磨終点検知機能の信頼性情報をユーザ端末装置6に送信する。なお、研磨終点検知機能の信頼性情報の送信先は、ユーザ端末装置6に加えて又は代えて、データベース装置3でもよい。
 次に、ステップS240において、ユーザ端末装置6は、ステップS200の送信処理に対する応答として、ステップS230にて送信された研磨終点検知機能の信頼性情報を受信すると、その研磨終点検知機能の信頼性情報に基づいて表示画面を表示することで、そのウェハWの状態がユーザにより視認される。上記の情報処理方法において、ステップS210、S211が情報取得工程、ステップS220が状態予測工程、ステップS230が出力処理工程に相当する。
 以上のように、本実施形態に係る情報処理装置5及び情報処理方法によれば、研磨処理における、信頼性低下要因情報が第1の学習モデル10Aに入力されることで、当該信頼性低下要因状態情報に対する研磨終点検知機能の信頼性情報が予測されるので、化学機械研磨処理が終点に到達したことを検知する終点検知機能の信頼性を示す研磨終点検知機能の信頼性情報を適切に予測することができる。
(第2の実施形態)
 第2の実施形態は、研磨終点検知機能として、光学式センサを用いる点で第1の実施形態と相違する。以下では、第2の実施形態に係る機械学習装置4a及び情報処理装置5aについて、第1の実施形態と異なる部分を中心に説明する。
 図15は、第2の実施形態に係る研磨テーブル220に設けられた光学式センサ226を説明するための模式図である。
 図15に示すように、研磨テーブル220の内部に、ウェハWの膜の状態を検知する光学式センサ226が埋設されている。この光学式センサ226は、ウェハWに光を照射し、ウェハWからの反射光の強度(反射強度または反射率)からウェハWの膜の状態(膜厚など)を検知する。
 また、研磨パッド2200には、光学式センサ226からの光を透過させるための透光部2200aが取付けられている。この透光部2200aは、透過率の高い材質で形成されており、例えば、石英ガラス、ガラス材料、純水(図示しない透明流体供給部及び流路あり)などにより形成される。あるいは、研磨パッド2200に貫通孔を設け、この貫通孔がウェハWに塞がれる間下方から純水等の透明流体を透明流体供給部から流すことにより、透光部2200aを構成してもよい。透光部2200aは、トップリング221に保持されたウェハWの中心を通過する位置に配置される。
 光学式センサ226Bは、図15に示すように、光源226aと、光源226aからの光をウェハWの被研磨面に照射する発光部としての発光光ファイバ226bと、被研磨面からの反射光を受光する受光部としての受光光ファイバ226cと、受光光ファイバ226cにより受光された光を分光する分光器およびこの分光器により分光された光を電気的情報として蓄積する複数の受光素子とを内部に有する分光器ユニット226dと、光源226aの点灯および消灯や分光器ユニット226d内の受光素子の読取開始のタイミングなどの制御を行う動作制御部226eと、動作制御部226eに電力を供給する電源226fとを備えている。なお、光源226aおよび分光器ユニット226dには、動作制御部226eを介して電力が供給される。
 発光光ファイバ226bの発光端と受光光ファイバ226cの受光端は、ウェハWの被研磨面に対して略垂直になるように構成されている。分光器ユニット226d内の受光素子としては、例えば128素子のフォトダイオードアレイを用いることができる。分光器ユニット226dは、動作制御部226eに接続されている。分光器ユニット226d内の受光素子からの情報は、動作制御部226eに送られ、この情報に基づいて反射光のスペクトルデータが生成される。すなわち、動作制御部226eは、受光素子に蓄積された電気的情報を読み取って反射光のスペクトルデータを生成する。このスペクトルデータは、波長に従って分解された反射光の強度を示し、膜厚によって変化する。
 動作制御部226eは、光学式センサ制御部226gに接続されている。このようにして、動作制御部226eで生成されたスペクトルデータは、光学式センサ制御部226gに送信される。光学式センサ制御部226gでは、動作制御部226eから受信したスペクトルデータに基づいて、ウェハWの膜厚に関連付けられた特性値を算出して、これをモニタリング信号として使用し、終点検知を行う。なお、光学式センサ制御部226gは、基板処理制御部260に含まれてもよい。
 図16は、第2の実施形態に係る機械学習装置4aの一例を示すブロック図である。図17は、第2の学習モデル10B及び第2の学習用データ11Bの一例を示す図である。第2の学習用データ11Bは、第2の学習モデル10Bの機械学習に用いられる。
 第2の学習用データ11Bを構成する信頼性低下要因状態情報は、消耗状態情報として光学式センサ226のコンディション、及び、透明液供給部のコンディションを付加され、加工状態情報として、光学式センサ226の光反射強度情報、及び、透明液流量情報を付加される。なお、第2の学習用データ11Bを構成するその他の信頼性低下要因状態情報は、第1の実施形態と同様であるため、説明を省略する。
 光学式センサ226のコンディションは、少なくとも、光学式センサ226の使用時間、及び、光学式センサ226のウェハ処理枚数、を含む。光学式センサ226のコンディションは、例えば、光学式センサ226のランプ等の光源226aの使用時間、光学式センサ226の温度等に基づいて設定されてもよい。光学式センサ226のコンディションは、例えば、研磨処理中に経時変化するものでもよい。
 純水透明液供給部のコンディションは、少なくとも、純水供給部の使用時間、及び、研磨ユニット22のウェハ処理枚数、を含む。透明液供給部のコンディションは、例えば、透明液供給部の累積供給流量等に基づいて設定されてもよい。透明液供給部のコンディションは、例えば、研磨処理中に経時変化するものでもよい。
 光学式センサ226の光反射強度情報は、光学式センサ226が射出した光がウェハWによって反射された反射光の強度でよい。透明液情報は、透明液供給部から供給される純水等の透明液の流量でよい。
 学習用データ取得部400は、研磨試験情報31を参照するとともに、必要に応じてユーザ端末装置6によるユーザの入力操作を受け付けることで、第2の学習用データ11Bを取得する。例えば、学習用データ取得部400は、研磨試験情報31の研磨試験テーブル310を参照することで、試験IDで特定される研磨試験が行われたときの消耗状態情報、及び、加工状態情報(各構成要素がそれぞれ有する各センサの時系列データ)を、信頼性低下要因状態情報として取得する。
 図18は、第2の実施形態に係る情報処理装置5aとして機能する情報処理装置5aの一例を示すブロック図である。図19は、第2の実施形態に係る情報処理装置5aの一例を示す機能説明図である。
 情報取得部500は、第1の実施形態と同様に、消耗状態情報、及び、加工状態情報を含む信頼性低下要因状態情報を取得する。
 研磨処理がすでに行われた後のウェハWに対する研磨終点検知機能の信頼性情報の「事後予測処理」を行う場合には、情報取得部500は、生産履歴情報30の研磨履歴テーブル301を参照することで、そのウェハWに対して研磨処理が行われたときの消耗状態情報、及び、加工状態情報を、信頼性低下要因状態情報として取得してもよい。
 状態予測部501は、上記のように、情報取得部500により取得された信頼性低下要因状態情報を入力データとして第2の学習モデル10Bに入力することで、当該信頼性低下要因状態情報に示す研磨処理が行われているウェハWに対する研磨終点検知機能の信頼性情報を予測する。
 以上のように、本実施形態に係る情報処理装置5a及び情報処理方法によれば、研磨処理における、消耗状態情報、及び、加工状態情報を含む信頼性低下要因状態情報が第2の学習モデル10Bに入力されることで、当該信頼性低下要因状態情報に対する研磨終点検知機能の信頼性が予測されるので、研磨処理によるウェハWの研磨終点検知機能の信頼性を適切に予測することができる。
 なお、第2実施形態では、ウェハWの研磨終点を検知するものとして光学式センサ226を用いたが、他の研磨終点検知機能を用いてもよい。例えば、他の例の研磨終点検知機能として、渦電流式センサを用いてもよい。
 渦電流式センサは、励磁コイルを有し、高周波交流電源に接続された励磁コイルから発生する磁力線が導電性の膜を通過すると、ウェハW面上に渦電流を発生させる。この渦電流は、金属膜の抵抗、すなわち金属膜の厚さに応じて大きさが変化する。一方、渦電流が流れると、励磁コイルから発生する磁力線とは逆方向に渦電流から磁力線が発生する。この逆方向に発生する磁力線の強度を検出コイルが測定することによって、金属膜の厚さの変化を計測することができる。
 渦電流式センサは、図3に示した研磨テーブル220の下方に設置され、研磨テーブル220を貫く方向に磁力線を発生する。研磨テーブル220が回転すると、渦電流式センサは研磨テーブル220と共に回転し、トップリング221に保持されたウェハWの下方を通過する。この時、ウェハW面上に導電性の膜が存在すると、磁力線が導電性の膜を通過するため、導電性の膜の厚さが計測できる。
 ウェハWの研磨が進行すると、ウェハW面の金属膜が減少し、これに伴って金属膜の抵抗値が上昇する。すると、渦電流式センサのコイルから発生する磁力線によって生じる渦電流が減少するため、渦電流から発生する磁力線の強さも減少する。渦電流式センサは、この渦電流から発生する磁力線の変化をセンサ内の回路とソフトウェアによって膜厚の変化量に対応した電圧に変換する。
 このように、渦電流式センサは、研磨が終了した状態のウェハWに対して検出電圧を予め計測して記憶しておき、記憶した電圧の値とウェハWを研磨中の電圧の値を比較することで、研磨終点の検出を行うとよい。なお、渦電流式センサは、アナログ処理部分をデジタル処理に置き換えてもよい。デジタル処理を用いることによって、渦電流式センサは、性能と安定性が向上する。
 渦電流式センサを用いた場合、消耗状態情報として、渦電流式センサのコンディションを用い、加工状態情報として、渦電流式センサの磁力線強度情報を用いればよい。
 渦電流式センサのコンディションは、少なくとも渦電流式センサの使用時間、渦電流式センサのウェハ処理枚数、を含む。渦電流式センサのコンディションは、例えば、励磁コイルの使用時間等に基づいて設定されてもよい。渦電流式センサのコンディションは、例えば、研磨処理中に経時変化するものでもよい。
 渦電流式センサの磁力線強度情報は、渦電流式センサが検知する逆方向に発生する磁力線強度でよい。
 また、その他の例の研磨終点検知機能として、回転トルク方式を用いてもよい。回転トルク方式は、例えば、研磨テーブル220を回転駆動させる回転移動機構部220bが有する研磨テーブル回転モータの回転トルク、又は、トップリング221を回転駆動させるトップリング回転移動機構部221cが有するトップリング回転モータの回転トルク、の少なくとも1つを検知すればよい。
 ウェハWが平坦化すると、研磨抵抗が急激に減少することから、ウェハWの研磨が終了した時を検知することが可能となる。
 なお、ウェハWの研磨終点検知は、光学式センサ、渦電流式センサ、又はトルク方式のいずれか、又は、全てを組み合わせてもよい。
(他の実施形態)
 本発明は上述した実施形態に制約されるものではなく、本発明の主旨を逸脱しない範囲内で種々変更して実施することが可能である。そして、それらはすべて、本発明の技術思想に含まれるものである。
 上記実施形態では、データベース装置3、機械学習装置4及び情報処理装置5は、別々の装置で構成されたものとして説明したが、それら3つの装置が、単一の装置で構成されていてもよいし、それら3つの装置のうち任意の2つの装置が、単一の装置で構成されていてもよい。また、機械学習装置4及び情報処理装置5の少なくとも一方は、基板処理装置2の制御ユニット26又はユーザ端末装置6に組み込まれていてもよい。
 上記実施形態では、基板処理装置2が、各ユニット21~25を備えるものとして説明したが、基板処理装置2は、研磨ユニット22を少なくとも備えていればよく、他のユニットは省略されていてもよい。
 上記実施形態では、機械学習部401による機械学習を実現する学習モデルとして、ニューラルネットワークを採用した場合について説明したが、他の機械学習のモデルを採用してもよい。他の機械学習のモデルとしては、例えば、決定木、回帰木等のツリー型、バギング、ブースティング等のアンサンブル学習、再帰型ニューラルネットワーク、畳み込みニューラルネットワーク、LSTM等のニューラルネット型(ディープラーニングを含む)、階層型クラスタリング、非階層型クラスタリング、k近傍法、k平均法等のクラスタリング型、主成分分析、因子分析、ロジスティク回帰等の多変量解析、サポートベクターマシン等が挙げられる。
 上記実施形態では、試験結果情報は、試験装置においてダミーウェハを用いた研磨試験において研磨処理が行われたときの状態を示す情報であるが、各構成要素の状態を検出するセンサを設置した実際の研磨ユニット22を用いて実際のウェハの研磨処理が行われたときの状態を示す情報として継続的に取得されるようにしてもよい。継続的に取得した試験結果情報は、機械学習装置4によって継続的に学習される。
 また、試験結果情報は、センサを設置しない研磨ユニット22において、人が研磨終点検知機能の信頼性の低下を判断し、データにラベル付けをして継続的に取得されるようにしてもよい。
 さらに、実際の研磨ユニット22を用いて継続的に取得された情報をクラウドへアップロードし、クラウドで機械学習した後、学習されたモデルを基板処理装置2へ展開してもよい。また、クラウドへアップロードすることなく、基板処理装置2内で処理方法を学習してもよい。
(機械学習プログラム及び情報処理プログラム)
 本発明は、機械学習装置4が備える各部としてコンピュータ900を機能させるプログラム(機械学習プログラム)や、機械学習方法が備える各工程をコンピュータ900に実行させるためのプログラム(機械学習プログラム)の態様で提供することもできる。また、本発明は、情報処理装置5が備える各部としてコンピュータ900を機能させるためのプログラム(情報処理プログラム)や、上記実施形態に係る情報処理方法が備える各工程をコンピュータ900に実行させるためのプログラム(情報処理プログラム)の態様で提供することもできる。
(推論装置、推論方法及び推論プログラム)
 本発明は、上記実施形態に係る情報処理装置5(情報処理方法又は情報処理プログラム)の態様によるもののみならず、研磨終点検知機能の信頼性情報を推論するために用いられる推論装置(推論方法又は推論プログラム)の態様で提供することもできる。その場合、推論装置(推論方法又は推論プログラム)としては、メモリと、プロセッサとを含み、このうちのプロセッサが、一連の処理を実行するものとすることができる。当該一連の処理とは、信頼性低下要因状態情報を取得する情報取得処理(情報取得工程)と、情報取得処理にて信頼性低下要因状態情報を取得すると、当該信頼性低下要因状態情報による研磨処理が行われた基板の研磨終点検知機能の信頼性を示す研磨終点検知機能の信頼性情報を推論する推論処理(推論工程)とを含む。
 推論装置(推論方法又は推論プログラム)の態様で提供することで、情報処理装置を実装する場合に比して簡単に種々の装置への適用が可能となる。推論装置(推論方法又は推論プログラム)が研磨終点検知機能の信頼性情報を推論する際、上記実施形態に係る機械学習装置及び機械学習方法により生成された学習済みの学習モデルを用いて、状態予測部が実施する推論手法を適用してもよいことは、当業者にとって当然に理解され得るものである。
1…基板処理システム、2…基板処理装置、3…データベース装置、
4、4a…機械学習装置、5、5a…情報処理装置、
6…ユーザ端末装置、7…ネットワーク、
10…学習モデル、10A…第1の学習モデル、10B…第2の学習モデル、
11A…第1の学習用データ、11B…第2の学習用データ、
20…ハウジング、21…ロード/アンロードユニット、
22…研磨ユニット、22A~22D…研磨部、23…基板搬送ユニット、
24…洗浄ユニット、25…膜厚測定ユニット、26…制御ユニット、
30…生産履歴情報、31…研磨試験情報、
40…機械学習制御部、41…通信部、42…学習用データ記憶部、
43…学習済みモデル記憶部、
50…情報処理制御部、51…通信部、52…学習済みモデル記憶部、
220…研磨テーブル、221…トップリング、222…研磨流体供給ノズル、
223…ドレッサ、224…アトマイザ、225…環境センサ
260…基板処理制御部、21…通信部、262…入力部、263…出力部、264…記憶部、
300…ウェハ履歴テーブル、301…研磨履歴テーブル、310…研磨試験テーブル、
400…学習用データ取得部、401…機械学習部、
500…情報取得部、501…状態予測部、502…出力処理部、
900…コンピュータ
2200…研磨パッド、2210…トップリング本体、2211…キャリア、
2212…弾性膜、2212a~2212d…弾性膜圧力室、
2213…リテーナリング、
2214…リテーナリングエアバッグ(リテーナリング押圧機構)、
2214a…リテーナリング圧力室、
226…光学式センサ

Claims (11)

  1.  基板処理装置により行われる基板の化学機械研磨処理における、前記基板処理装置の構成要素の消耗状態を示す消耗状態情報、及び、研磨加工中の加工状態を示す加工状態情報、の少なくとも1つを含む、信頼性低下要因状態情報を取得する情報取得部と、
     前記信頼性低下要因状態情報と、前記化学機械研磨処理が終点に到達したことを検知する終点検知機能の信頼性を示す研磨終点検知機能の信頼性情報との相関関係を機械学習により学習させた学習モデルに、前記情報取得部により取得された前記信頼性低下要因状態情報を入力することで、当該信頼性低下要因状態情報に対する前記研磨終点検知機能の信頼性情報を予測する状態予測部と、を備える
     情報処理装置。
  2.  前記基板処理装置は、研磨パッドを回転可能に支持する研磨テーブル、前記研磨パッドに基板を押し付けるトップリング、ドレッサディスクを回転可能に支持するとともに前記ドレッサディスクを前記研磨パッドに接触させて前記研磨パッドをドレッシングするドレッサ、及び、前記基板処理装置全体を統括的に制御する基板処理制御部、をさらに備え、
     前記消耗状態情報は、
      前記研磨パッドのコンディション、
      前記トップリング及び前記研磨テーブルを回転可能に設置するロータリコネクタのコンディション、
      前記ドレッサのコンディション、及び、
      前記基板処理制御部のコンディション、の少なくとも1つを含む、
     請求項1に記載の情報処理装置。
  3.  前記基板処理装置は、前記研磨パッドに透明液を供給する透明液供給部、及び、発光するランプの光の反射強度を計測して前記化学機械研磨処理が終点に到達したことを検知する光学式センサ、をさらに備え、
     前記消耗状態情報は、
      前記光学式センサのコンディション、
      前記透明液供給部のコンディション、の少なくとも1つを含む、
     請求項2に記載の情報処理装置。
  4.  前記基板処理装置は、研磨パッドを回転可能に支持する研磨テーブル、前記研磨パッドに基板を押し付けるトップリング、研磨パッドに研磨流体を供給する研磨流体供給部、を備え、
     前記トップリングは、
      回転移動機構部、上下移動機構部及び揺動移動機構部により移動されるトップリング本体と、
      前記トップリング本体に収容されて、弾性膜圧力室に供給される圧力流体に応じて前記基板を前記研磨パッドに押圧する弾性膜と、
      前記弾性膜の外周に配置されて、前記研磨パッドを押圧するリテーナリングと、
      前記リテーナリングの押圧力を調節するリテーナリング押圧機構と、
    を備え、
     前記加工状態情報は、
      前記研磨流体の流量
      前記リテーナリング押圧機構の押圧力、
      前記トップリング及び研磨テーブルの回転トルク、
      前記トップリングの揺動トルク、
      前記トップリングの振動、
      前記ドレッサの揺動トルク、
      前記トップリングの研磨中の騒音、
      前記トップリングの研磨中の研磨面の温度、
      前記研磨テーブルの温調水温度、
      前記基板毎の終点検知までの時間の統計値、及び、
      前記基板毎のセンサ時系列データの統計値、の少なくとも1つを含む、
     請求項2又は3に記載の情報処理装置。
  5.  前記基板処理装置は、前記研磨パッドに透明液を供給する透明液供給部、及び、前記化学機械研磨処理が終点に到達したことを検知する光学式センサ、をさらに備え、
     前記加工状態情報は、
      前記光学式センサの光反射強度、及び
      前記透明液の流量、の少なくとも1つを含む
     請求項4に記載の情報処理装置。
  6.  前記研磨終点検知機能の信頼性情報は、
      現在の終点検知の信頼性情報、
      信頼性低下の予兆情報、
      信頼性低下の要因となる前記基板処理装置の構成要素の種類情報、及び、
      信頼性低下の要因となる前記基板処理工程の種類情報、の少なくとも1つを含む、
     請求項1に記載の情報処理装置。
  7.  メモリと、プロセッサとを備える推論装置であって、
     前記プロセッサは、
     基板処理装置により行われる基板の化学機械研磨処理における、前記基板処理装置の構成要素の消耗状態を示す消耗状態情報、及び、研磨加工中の加工状態を示す加工状態情報、の少なくとも1つを含む、信頼性低下要因状態情報を取得する情報取得処理と、
     前記情報取得処理にて前記信頼性低下要因状態情報を取得すると、当該研磨処理状態情報に対する前記化学機械研磨処理が終点に到達したことを検知する終点検知機能の信頼性を示す研磨終点検知機能の信頼性情報を推論する推論処理を実行する、
     推論装置。
  8.  基板処理装置により行われる基板の化学機械研磨処理における、前記基板処理装置の構成要素の消耗状態を示す消耗状態情報、及び、研磨加工中の加工状態を示す加工状態情報、の少なくとも1つを含む、信頼性低下要因状態情報と、前記化学機械研磨処理が終点に到達したことを検知する終点検知機能の信頼性を示す研磨終点検知機能の信頼性情報とで構成される学習用データを複数組記憶する学習用データ記憶部と、
     複数組の前記学習用データを学習モデルに入力することで、前記信頼性低下要因状態情報と前記研磨終点検知機能の信頼性情報との相関関係を前記学習モデルに学習させる機械学習部と、
     前記機械学習部により前記相関関係を学習させた前記学習モデルを記憶する学習済みモデル記憶部と、を備える、
     機械学習装置。
  9.  基板処理装置により行われる基板の化学機械研磨処理における、前記基板処理装置の構成要素の消耗状態を示す消耗状態情報、及び、研磨加工中の加工状態を示す加工状態情報、の少なくとも1つを含む、信頼性低下要因状態情報を取得する情報取得工程と、
     前記信頼性低下要因状態情報と、前記化学機械研磨処理が終点に到達したことを検知する終点検知機能の信頼性を示す研磨終点検知機能の信頼性情報との相関関係を機械学習により学習させた学習モデルに、前記情報取得工程により取得された前記研磨処理状態情報を入力することで、当該研磨処理状態情報に対する前記研磨終点検知機能の信頼性情報を予測する状態予測工程と、を備える、
     情報処理方法。
  10.  メモリと、プロセッサとを備える推論装置により実行される推論方法であって、
     前記プロセッサは、
      基板処理装置により行われる基板の化学機械研磨処理における、前記基板処理装置の構成要素の消耗状態を示す消耗状態情報、及び、研磨加工中の加工状態を示す加工状態情報、の少なくとも1つを含む、信頼性低下要因状態情報を取得する情報取得工程と、
      前記情報取得工程にて前記信頼性低下要因状態情報を取得すると、当該研磨処理状態情報に対する前記化学機械研磨処理が終点に到達したことを検知する終点検知機能の信頼性を示す研磨終点検知機能の信頼性情報を推論する推論工程と、を実行する、
     推論方法。
  11.  基板処理装置により行われる基板の化学機械研磨処理における、前記基板処理装置の構成要素の消耗状態を示す消耗状態情報、及び、研磨加工中の加工状態を示す加工状態情報、の少なくとも1つを含む、信頼性低下要因状態情報と、前記化学機械研磨処理が終点に到達したことを検知する終点検知機能の信頼性を示す研磨終点検知機能の信頼性情報とで構成される学習用データを複数組記憶する学習用データ記憶工程と、
     複数組の前記学習用データを学習モデルに入力することで、前記信頼性低下要因状態情報と前記研磨終点検知機能の信頼性情報との相関関係を前記学習モデルに学習させる機械学習工程と、
     前記機械学習工程により前記相関関係を学習させた前記学習モデルを学習用データ記憶部に複数組記憶する学習用データ記憶工程と、を備える、
     機械学習方法。
     
PCT/JP2023/023932 2022-08-01 2023-06-28 情報処理装置、推論装置、機械学習装置、情報処理方法、推論方法、及び、機械学習方法 WO2024029236A1 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2022122766A JP2024019962A (ja) 2022-08-01 2022-08-01 情報処理装置、推論装置、機械学習装置、情報処理方法、推論方法、及び、機械学習方法
JP2022-122766 2022-08-01

Publications (1)

Publication Number Publication Date
WO2024029236A1 true WO2024029236A1 (ja) 2024-02-08

Family

ID=89848872

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2023/023932 WO2024029236A1 (ja) 2022-08-01 2023-06-28 情報処理装置、推論装置、機械学習装置、情報処理方法、推論方法、及び、機械学習方法

Country Status (3)

Country Link
JP (1) JP2024019962A (ja)
TW (1) TW202406675A (ja)
WO (1) WO2024029236A1 (ja)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013176828A (ja) * 2012-02-29 2013-09-09 Ebara Corp 研磨終点検出装置の遠隔監視システム
WO2020235581A1 (ja) * 2019-05-22 2020-11-26 株式会社荏原製作所 基板処理システム

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013176828A (ja) * 2012-02-29 2013-09-09 Ebara Corp 研磨終点検出装置の遠隔監視システム
WO2020235581A1 (ja) * 2019-05-22 2020-11-26 株式会社荏原製作所 基板処理システム

Also Published As

Publication number Publication date
TW202406675A (zh) 2024-02-16
JP2024019962A (ja) 2024-02-14

Similar Documents

Publication Publication Date Title
US11027395B2 (en) Polishing apparatus, polishing method, and machine learning apparatus
US11731232B2 (en) Irregular mechanical motion detection systems and method
CN111133560A (zh) 使用机器学习方式以产生工艺控制参数的半导体制造
KR20220011144A (ko) 기판 처리 시스템
WO2021029264A1 (ja) 終点検知装置、終点検知方法
WO2024029236A1 (ja) 情報処理装置、推論装置、機械学習装置、情報処理方法、推論方法、及び、機械学習方法
WO2023112830A1 (ja) 情報処理装置、推論装置、機械学習装置、情報処理方法、推論方法、及び、機械学習方法
US20240062066A1 (en) Information processing apparatus and machine learning apparatus
WO2023189170A1 (ja) 情報処理装置、推論装置、機械学習装置、情報処理方法、推論方法、及び、機械学習方法
WO2023153208A1 (ja) 情報処理装置、推論装置、機械学習装置、情報処理方法、推論方法、及び、機械学習方法
CN111571423B (zh) 基板研磨系统
CN115008339B (zh) 使用基于时间的图像序列检测cmp部件的偏移
WO2023189165A1 (ja) 情報処理装置、推論装置、機械学習装置、情報処理方法、推論方法、及び、機械学習方法
JP2023116396A (ja) 情報処理装置、推論装置、機械学習装置、情報処理方法、推論方法、及び、機械学習方法
WO2023149161A1 (ja) 情報処理装置、推論装置、機械学習装置、情報処理方法、推論方法、及び、機械学習方法
WO2023149162A1 (ja) 情報処理装置、推論装置、機械学習装置、情報処理方法、推論方法、及び、機械学習方法
WO2023166991A1 (ja) 情報処理装置、推論装置、機械学習装置、情報処理方法、推論方法、及び、機械学習方法
JP2023090667A (ja) 情報処理装置、推論装置、機械学習装置、情報処理方法、推論方法、及び、機械学習方法
WO2023058289A1 (ja) 情報処理装置、推論装置、機械学習装置、情報処理方法、推論方法、及び、機械学習方法
WO2024024391A1 (ja) 情報処理装置、機械学習装置、情報処理方法、及び、機械学習方法
JP2023127537A (ja) 情報処理装置、推論装置、機械学習装置、情報処理方法、推論方法、及び、機械学習方法
WO2024053221A1 (ja) 情報処理装置、機械学習装置、情報処理方法、及び、機械学習方法
WO2023058285A1 (ja) 情報処理装置、推論装置、機械学習装置、情報処理方法、推論方法、及び、機械学習方法
WO2024135150A1 (ja) 情報処理装置、推論装置、機械学習装置、情報処理方法、推論方法、及び、機械学習方法
JP2024090296A (ja) 情報処理装置、推論装置、機械学習装置、情報処理方法、推論方法、及び、機械学習方法

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 23849795

Country of ref document: EP

Kind code of ref document: A1