KR102384189B1

KR102384189B1 - 머신러닝에 기초한 반도체 불량 시점 예측 장치 및 방법

Info

Publication number: KR102384189B1
Application number: KR1020210075966A
Authority: KR
Inventors: 김재성; 양여진; 최은선
Original assignee: 충북대학교 산학협력단
Priority date: 2020-09-25
Filing date: 2021-06-11
Publication date: 2022-04-08
Also published as: KR20220041711A

Abstract

본 발명은 컴퓨팅 장치에 의해 실행되는 머신러닝에 기초한 반도체 불량 시점 예측 방법으로서, 반도체 검사 장치 또는 센서로부터 불량 발생 시점을 예측하기 위한 데이터를 수집하는 단계; 수집된 데이터로부터 입력변수를 도출하여 머신러닝을 수행할 학습모델을 설계하는 단계; 설계된 학습모델에 데이터들을 입력하여 불량 발생 시점을 예측하기 위한 학습을 수행하는 단계; 학습 수행결과에 대한 정확도를 분석하여 상기 학습모델의 변수를 조정하는 단계; 및 상기 학습모델을 기반으로, 반도체 검사 장치 또는 센서로부터 데이터를 입력받아, 불량 유형별 불량 발생 시점을 확률로 예측하여 시각화하는 단계를 포함하는 것을 특징으로 한다.

Description

머신러닝에 기초한 반도체 불량 시점 예측 장치 및 방법{Method and apparatus for predicting semiconductor failure time based on machine learning}

본 발명은 머신러닝에 기초한 반도체 불량 시점 예측 장치 및 방법에 관한 것이다.

머신러닝은 인공 지능의 한 분야로, 컴퓨터가 학습할 수 있도록 하는 알고리즘과 기술을 개발하는 분야를 말한다. 머신 러닝은 대량의 빅데이터로부터 '학습'하기 위한 정교한 알고리즘을 활용한다. 알고리즘이 액세스할 수 있는 데이터가 많을수록 학습량도 많아진다. 이러한 특징을 바탕으로 머신러닝은 다양한 분야에서 활용되고 있는데 Amazon의 맞춤식 제품 추천, Facebook의 안면 인식 또는 Google Maps의 빠른 경로 추천이 바로 그러한 예다.

한편, 반도체는 다양한 전자제품에 필수적인 요소이기 때문에 반도체의 생산성 향상을 위해서는 설비진단, 공정관리, 수율 안정화 등을 향상시키고 첨단 공정기술을 개발하기 위한 노력이 필요하다.

반도체 제조업체들은 높은 수율 유지, 불량품 처리 및 역동적인 제조 환경을 고려한 프로세스 개선 등 수많은 문제 해결에 직면하고 있다. 반도체는 매우 섬세한 제품이므로, 반도체 제조 공정은 반도체 제조 단계 별로 적절한 수준의 클린룸에서 작업을 수행하는 등의 각고의 노력을 하고 있으나 복잡한 반도체의 반도체 제조 공정 시 일부 결함이 발생할 수 있으며, 불량 유형에 따라 최종 제품 생산에 실패를 할 수 있다.

따라서, 반도체 제조공정에서의 반도체 불량의 요인을 미리 파악하려 관리할 수 있는 방법이 요구된다.

삭제

국제공개공보 WO2020/100180(2020.05.22. 공개)

상술한 바와 같은 문제점들을 해결하기 위해 본 발명은 머신러닝에 기초하여 반도체 불량률에 영향을 미치는 중요 변수를 도출하고, 미지의 불량 발생 시점을 예측하는 장치 및 방법의 제공을 목적으로 한다.

상술한 목적을 달성하기 위한 본 발명에 따른 컴퓨팅 장치에 의해 실행되는 머신러닝에 기초한 반도체 불량 시점 예측 방법으로서, 반도체 검사 장치 또는 센서로부터 불량 발생 시점을 예측하기 위한 데이터를 수집하는 단계; 수집된 데이터로부터 입력변수를 도출하여 머신러닝을 수행할 학습모델을 설계하는 단계; 설계된 학습모델에 데이터들을 입력하여 불량 발생 시점을 예측하기 위한 학습을 수행하는 단계; 학습 수행결과에 대한 정확도를 분석하여 상기 학습모델의 변수를 조정하는 단계; 및 상기 학습모델을 기반으로, 반도체 검사 장치 또는 센서로부터 데이터를 입력받아, 불량 유형별 불량 발생 시점을 확률로 예측하여 시각화하는 단계를 포함하는 것을 특징으로 한다.

일 실시예에서, 머신러닝에 기초한 반도체 불량 시점 예측 방법은, 상기 학습모델을 설계하기 이전에, 상기 수집된 데이터로부터 널(null)값을 보정하고, 정규화한 후, 데이터 형 변환하여 전처리를 수행하는 단계를 더 포함하는 것을 특징으로 한다. 제1항에 있어서,

일 실시예에서, 상기 데이터를 수집하는 단계는, 나이파이(NiFi)를 사용하여 Iot 데이터를 실시간 수집하고 ETL(Extract, Transform, Load) 작업을 통해 데이터를 수집하는 것을 특징으로 한다.

일 실시예에서, 상기 입력변수를 도출하여 머신러닝을 수행할 학습모델을 설계하는 단계는, XGBoost 알고리즘에 기반하여 가중치(weight), 이득(gain), 대상의 수(coverage)에 따른 변수의 상대적 중요도를 계산하고, 계산 결과에 기초하여 입력변수를 도출하고, SHAP 게임 이론적 접근 방식에 기초하여 검증하는 것을 특징으로 하는 것을 특징으로 한다.

일 실시예에서, 상기 학습모델의 변수를 조정하는 단계는, 그리드서치 기법에 기초하여 변수의 최적 조합을 찾아 상기 학습모델의 변수를 조정하는 것을 특징으로 한다.

본 발명의 다른 실시예에 따른 머신러닝에 기초한 반도체 불량 시점 예측 장치는, 반도체 검사 장치 또는 센서로부터 불량 발생 시점을 예측하기 위한 데이터를 수집하는 데이터 수집부; 수집된 데이터로부터 입력변수를 도출하여 머신러닝을 수행할 학습모델을 설계하는 학습모델 설계부; 설계된 학습모델에 데이터들을 입력하여 불량 발생 시점을 예측하기 위한 학습을 수행하는 학습부; 학습 수행결과에 대한 정확도를 분석하여 상기 학습모델의 변수를 조정하는 모델 튜닝부; 및 상기 학습모델을 기반으로, 반도체 검사 장치 또는 센서로부터 데이터를 입력받아, 불량 유형별 불량 발생 시점을 확률로 예측하여 시각화하는 시각화부를 포함하는 것을 특징으로 한다.

일 실시예에서, 머신러닝에 기초한 반도체 불량 시점 예측 장치는 상기 학습모델을 설계하기 이전에, 상기 수집된 데이터로부터 널(null)값을 보정하고, 정규화한 후, 형변환하여 전처리를 수행하는 데이터 전처리부를 더 포함하는 것을 특징으로 한다.

일 실시예에서, 모델 튜닝부는 그리드서치 기법에 기초하여 변수의 최적 조합을 찾아 상기 학습모델의 변수를 조정하며, 조정된 변수를 적용한 학습모델의 예측결과를 데이터베이스에 저장하는 것을 특징으로 한다.

본 발명에 따른 본 개시에 따르면, 머신러닝을 활용함으로써 불량률에 영향을 미치는 중요변수를 도출하고, 불량 발생시점을 도출함으로써, 불량률을 개선할 수 있다.

또한, R shiny 기법을 통해 다양한 형식의 분석 결과를 웹 환경에서 사용자 요구에 따라 시각화하여 제공함으로써, 사용자의 신속한 의사결정을 지원할 수 있다.

또한, 자동화를 바탕으로 최적의 파라미터를 도출하도록 스스로 학습함으로써 모델의 정확도를 지속적으로 개선하여, 정확한 불량 발생 시점을 예측할 수 있게 된다. 이로써, 유지보수 비용을 절감할 수 있다는 비용적 효과 또한 가져올 수 있다.

그 밖에, 본 개시에서 얻을 수 있는 효과는 언급한 효과들로 제한되지 않으며, 언급하지 않은 다른 효과들은 아래의 기재로부터 본 개시가 속하는 기술분야에서 통상의 지식을 가진 자에게 명확하게 이해될 수 있다.

도 1은 본 개시의 일 실시예에 따른 반도체 불량 발생시점 예측 장치를 나타내는 블럭도이다.
도 2는 본 발명의 일 실시예에 따른 반도체 불량 발생시점 예측 방법을 설명하기 위한 흐름도이다.
도 3은 본 발명의 일 실시예에 따른 학습모델 설계를 설명하기 위한 흐름도이다.
도 4는 본 발명의 일 실시예에 따라 XGBoost 알고리즘에 의해 도출된 변수 중요도를 나타내는 그래프이다.
도 5는 본 발명의 일 실시예에 따른 SHAP의 그래프를 나타낸 그래프이다.

본 발명은 다양한 변경을 가할 수 있고 여러 가지 실시예를 가질 수 있는 바, 특정 실시예들을 도면을 참조하여 상세하게 설명하도록 한다. 그러나 이는 본 발명을 특정한 실시 형태에 대해 한정하려는 것이 아니며, 본 발명의 사상 및 기술 범위에 포함되는 모든 변경, 균등물 내지 대체물을 포함하는 것으로 이해되어야 한다. 각 도면을 설명하면서 유사한 참조부호를 유사한 구성요소에 대해 사용하였다.

본 출원에서 사용한 용어는 단지 특정한 실시예를 설명하기 위해 사용된 것으로, 본 발명을 한정하려는 의도가 아니다. 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다. 본 출원에서, "포함하다" 또는 "가지다" 등의 용어는 명세서상에 기재된 특징, 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것이 존재함을 지정하려는 것이지, 하나 또는 그 이상의 다른 특징들이나 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.

다르게 정의되지 않는 한, 기술적이거나 과학적인 용어를 포함해서 여기서 사용되는 모든 용어들은 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에 의해 일반적으로 이해되는 것과 동일한 의미를 가지고 있다. 일반적으로 사용되는 사전에 정의되어 있는 것과 같은 용어들은 관련 기술의 문맥 상 가지는 의미와 일치하는 의미를 가지는 것으로 해석되어야 하며, 본 출원에서 명백하게 정의하지 않는 한, 이상적이거나 과도하게 형식적인 의미로 해석되지 않는다.

명세서 및 청구범위 전체에서, 어떤 부분이 어떤 구성 요소를 포함한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성 요소를 제외하는 것이 아니라 다른 구성 요소를 더 포함할 수 있다는 것을 의미한다.

도 1은 본 개시의 일 실시예에 따른 반도체 불량 발생시점 예측 장치를 나타내는 블럭도이다.

도 1에 도시된 바와 같이 본 발명에 따른 반도체 불량 발생시점 예측 장치(100)는 데이터 수집부(110), 데이터 전처리부(120), 학습모델 설계부(130), 학습부(140), 모델 튜닝부(150), 시각화부(160) 및 데이터베이스(170)를 포함할 수 있다.

데이터 수집부(110)는 반도체 검사 장치 또는 센서로부터 불량 발생 시점을 예측하기 위한 데이터를 수집한다. 반도체 검사 장치는 예를 들어, 규정된 전압을 인가하여 open/short, 입력전류, 출력전류, 전원전류 등의 DC 특성을 측정하여, 검출량으로 양, 불량을 판단하는 DC 테스트, 펄스 신호를 인가하여 입출력 운반 지연시간, 출력신호의 시작/종료 시간 등의 동작 특성을 측정하는 AC 테스트를 포함하는 주검사 장비, 웨이퍼의 반도체 칩의 완성도를 테스트하기 위한 프로브 스테이션, 웨이퍼 내의 칩의 전기적 동작 상태를 검사하는 프로브 카드, 반도체의 전기적, 열적, 및 기능 테스트를 하는 핸들러, 고온 상태에서의 반도체 동작을 테스트하는 번인 장비 등을 포함할 수 있다.

데이터 전처리부(120)는 학습모델을 설계하기 이전에, 데이터를 통합하기 위한 전처리를 수행한다.

일 실시예에서 데이터 전처리부(120)는 상기 수집된 데이터로부터 널(null)값을 보정하고, 정규화한 후, 형변환하여 전처리를 수행한다.

학습모델 설계부(130)는 수집된 데이터로부터 입력변수를 도출하여 머신러닝을 수행할 학습모델을 설계한다.

학습부(140)는 설계된 학습모델에 데이터들을 입력하여 불량 발생 시점을 예측하기 위한 학습을 수행한다.

모델 튜닝부(150)는 모델 튜닝부 학습 수행결과에 대한 정확도를 분석하여 상기 학습모델의 변수를 조정한다.

모니터링부(160)는 상기 학습모델을 기반으로, 반도체 검사 장치 또는 센서로부터 데이터를 입력받아, 불량 유형별 불량 발생 시점을 확률로 예측하여 시각화한다.

데이터베이스(170)는 반도체 불량 발생시점 예측 장치(100)의 불량 발생시점 예측을 위한 데이터를 저장한다.

일 실시예에서 데이터베이스(170)는 수집한 데이터를 저장하는 수집 데이터 DB(172), 기계학습을 위한 학습변수 DB(174) 및 모델튜닝부(150)에 의해 서치된 최적의 변수를 저장하는 예측결과 DB(176)를 포함한다.

도 2는 본 발명의 일 실시예에 따른 반도체 불량 발생시점 예측 방법을 설명하기 위한 흐름도이다.

도 1의 반도체 불량 발생시점 예측 장치는 도 2에 도시된 바와 같은 단계를 수행한다.

단계 S110에서, 데이터 수집부(110)는 각종 검사 장비들로부터 웨이퍼 검사에 따른 측정된 데이터를 수집한다. 이를 위해 데이터 수집부(110)는 나이파이(NiFi)와 같은 자동화도구를 활용하여 실시간으로 수집할 수 있다.

데이터 수집부(110)는 실시간 수집된 데이터에 ETL(추출(Extract), 변환(Transform), 로드(Load)) 작업을 수행함으로써, 빅데이터 분석에 필요한 데이터로 정제 및 저장한다.

보다 구체적으로, 데이터 수집부(110)는 데이터베이스용 프로그래밍 언어인 SQL(Structured Query Language) 쿼리를 생성한다.

다음, SQL쿼리를 실행시켜 NiFi FlowFile로 가져온다. 여기서, FlowFile 이란 나이파이에서 처리되는 기본적인 단위로서, 처리하고자 하는 데이터와 그 데이터를 처리할 때 필요한 속성 값을 가리키고 있다. 쿼리의 결과는 Avro형식으로 변환되어 출력된다.

이후, 결과물인 Avro 데이터를 CSV형식으로 변경하고, CSV형식의 데이터의 파일이름을 CSV 확장명으로 변경한다. 이와 같이, 형식과 이름이 CSV파일로 바뀐 FlowFile을 데이터베이스(170)에 저장한다. 데이터베이스(170)는 수집데이터 저장DB(172), 최적 파라미터를 저장하는 모델 파라미터 저장 DB(174), 예측결과를 저장 DB(176)을 포함할 수 있다.

일 실시예에서, 데이터베이스는 MySql를 채택할 수 있으나, 이에 한정하는 것은 아니다.

단계 S130에서, 데이터 전처리부(120)는 자동화 도구를 사용하여 분석에 용이하도록 데이터들을 통합한다. 일 실시예에서 데이터 전처리부(120)는 KNN기법과, 데이터 정규화, 데이터 형 변환을 위해 자동화 도구를 사용하여 데이터를 전처리한다. KNN(k-Nearest Neighbors) 기법은 NULL값 보정을 위해 사용한다. KNN 기법은 거리를 이용하여 예측하는 모델로 테스트 데이터와 가장 가까운 k개의 특징을 통해 테스트 데이터를 예측하는 기법이다. 데이터 정규화(Normalization)를 위해 자동화 코드를 사용한다. 일 실시예에서, 데이터 전처리부(120)는 데이터 정규화를 위해 Z-점수 정규화 기법을 사용하여 이상치를 제거한다. 정규화 코드 실행 시 데이터들이 자동으로 정규화가 진행되며 수집데이터 DB(172)에 저장된다. 일 실시예에서 데이터 전처리부(120)는 모든 데이터의 타입을 반도체의 경우 상세한 데이터가 품질에 큰 영향을 미치기 때문에 Decimal 타입으로 데이터 형 변환한다.

이와 같이 저장된 수집 데이터 DB(172)에 저장된 데이터는 입력변수 도출을 위해 학습모델 설계부(130)에 입력된다.

단계 S130에서, 학습모델 설계부(130)는 전처리된 데이터를 입력받아 입력변수를 도출하여 머신러닝을 수행할 학습모델을 설계한다.

이와 같이 입력되는 데이터는 표 1과 같다.

항목	데이터 타입	항목	데이터 타입
CUST_CD	varchar	TSC_5	decimal
ANGLE_1 (각도)	decimal	BSC_1 (Back side Coating)	decimal
ANGLE_2	decimal	BSC_2	decimal
ANGLE_3	decimal	BSC_3	decimal
ANGLE_4	decimal	BSC_4	decimal
ANGLE_5	decimal	BSC_5	decimal
DISTNC_1 (거리)	decimal	KERF_Z1_1 (절단자국)	decimal
DISTNC_2	decimal	KERF_Z1_2	decimal
DISTNC_3	decimal	KERF_Z1_3	decimal
DISTNC_4	decimal	KERF_Z1_4	decimal
DISTNC_5	decimal	KERF_Z2_1	decimal
TSC_1 (결점)	decimal	KERF_Z2_2	decimal
TSC_2	decimal	KERF_Z2_3	decimal
TSC_3	decimal	KERF_Z2_4	decimal
TSC_4	decimal	BAD_MODE (불량유형)	varchar

표 1에 도시한 바와 같이, 입력되는 데이터는 결함의 항목 및 데이터 타입을 포함한다. 항목은, 불량유형, 코팅상태, 절단자국 상태, 결점, 거리 및 각도를 포함할 수 있다. 학습 설계에 대해서는 도 3 내지 도 5를 참조하여 후술한다.

단계 S140에서, 학습부(140)는 설계된 학습모델에 데이터들을 입력하여 불량 발생 시점을 예측하기 위한 학습을 수행한다.

단계 S150에서, 모델 튜닝부(150)는 학습 수행결과에 대한 정확도를 분석하여 학습모델 설계부(130)로 피드백한다.

모델 튜닝부(150)는 구축된 학습모델에 그리드서치(grid search) 방식을 적용하여 최적의 파라미터를 도출한다. 그리드 서치는 리스트로 지정된 여러 파라미터 값을 받아 모든 조합에 대해 모델 성능을 평가하여 최적의 파라미터 조합을 찾는 방법이다. 그리드 서치에 의해 서치된 최적화된 파라미터(변수)를 단계 S130의 학습모델 설계부(130)에 전달하여, 최적의 파라미터를 학습모델에 적용하도록 피드백한다. 최적의 파라미터에 의한 예측결과 DB(176)에 저장한다. 이와 같이 XGBoost 알고리즘을 활용한 학습모델의 최적 파라미터를 도출함으로써 성능향상을 지원한다.

단계 S160의 시각화부(160)는 최적의 파라미터가 적용된 학습모델의 머신러닝 결과를 변수 DB(174) 및 예측결과 DB(176)에서 불러와서 시각화하여 사용자에게 제공한다. 이를 위해 시각화부(160)는 R shiny 통계를 활용할 수 있다. 시각화부(160)는 사용자가 원하는 기간 및 파라미터 등을 입력받아 지정할 수 있다. 이에 따라 사용자는 실시간으로 불량 유형별 불량 시점을 확률로 예측하고 시각화할 수 있다. 또한, 필요에 따라 이전 기간의 분석 결과를 불러와 예측 결과의 정확도를 확인하거나 또 다른 의사 결정에 활용할 수 있다.

도 3은 본 발명의 일 실시예에 따른 학습모델 설계를 설명하기 위한 흐름도이다.

도 1의 학습모델 설계부(130)는 도 3에 도시된 바와 같은 단계를 수행한다.

도 3을 참조하여, 단계 S131에서, 학습모델 설계부(130)는 수집 데이터 DB(172)에 저장된 데이터를 입력받는다. 입력받은 데이터는 null 값이 제거되고 정규화된 데이터로, decimal 형 데이터이다.

단계 S132에서, 학습모델 설계부(130)는 XGBoost 알고리즘을 사용하여 변수 중요도를 도출한다. XGBoost 알고리즘에서는 모델이 학습한 내용을 바탕으로 'weight', 'gain', 'coverage'에 따른 입력 특징들의 상대적 중요도를 계산한다.

여기서, weight는 변수별 데이터를 분리하는데 쓰인 횟수이고, gain은 특징을 사용했을 때 줄어드는 평균적인 훈련 로스(training loss)이고, coverage는 변수별 데이터를 분리하는 데 쓰인 횟수이다.

도 4는 본 발명의 일 실시예에 따라 XGBoost 알고리즘에 의해 도출된 변수 중요도를 나타내는 그래프이다.

다시 도 3으로 되돌아가서, 단계 S133에서, 학습모델 설계부(130)는 XGBoost 알고리즘을 통해 도출된 변수를 SHAP(SHapley Additive exPlanations)를 사용하여 변수 중요도를 검증한다. SHAP는 기계 학습 모델의 출력을 설명하는 게임 이론적 접근 방식이다. 게임 이론 및 관련 확장의 고전적인 Shapley 값을 사용하여 통해 모델의 전역적 해석이 가능하다. SHAP를 통해 도출된 중요 변수는 SHAP 값(value)와 특징 값(Feature value)으로 구성된다. 특징 값을 통해 변수에 미치는 영향도를 확인할 수 있다. 도 5는 본 발명의 일 실시예에 따른 SHAP의 그래프를 나타낸 그래프이다. SHAP의 그래프에서 x축에서 0을 기준으로 우측은 양의 영향력을 의미하고 좌측은 음의 영향력을 의미한다.

다시 도 3으로 되돌아가서, 단계 S134에서, 학습모델 설계부(130)는 도출된 변수 중요도를 저장하고, 변수 중요도에 기초하여 중요 변수를 도출함으로써 학습모델을 설계한다.

본 발명의 반도체 불량 발생시점 예측 장치 및 방법에 따라 데이터 수집부터 시각화까지 모든 과정이 자동화로 진행될 수 있어, 사용자의 편의성을 향상시킬 수 있다. 또한, 최적의 변수를 스스로 학습하므로 발생시점 예측의 정확도를 향상시킬 수 있다. 또한, 실시간으로 변하는 데이터를 결과에 반영할 수 있고, 시각화를 통해 실시간으로 분석 결과를 보여줄 수 있으므로, 실시간으로 불량 예측 시점을 확인가능하며, 이로써 불량률 감소에 기여할 수 있다.

이상에서 설명된 장치는 하드웨어 구성요소, 소프트웨어 구성요소, 및/또는 하드웨어 구성요소 및 소프트웨어 구성요소의 조합으로 구현될 수 있다. 예를 들어, 실시예들에서 설명된 장치 및 구성요소는, 예를 들어, 프로세서, 콘트롤러, ALU(arithmetic logic unit), 디지털 신호 프로세서(digital signal processor), 마이크로컴퓨터, FPGA(field programmable gate array), PLU(programmable logic unit), 마이크로프로세서, 또는 명령(instruction)을 실행하고 응답할 수 있는 다른 어떠한 장치와 같이, 하나 이상의 범용 컴퓨터 또는 특수 목적 컴퓨터를 이용하여 구현될 수 있다. 처리 장치는 운영 체제(OS) 및 상기 운영 체제 상에서 수행되는 하나 이상의 소프트웨어 애플리케이션을 수행할 수 있다. 또한, 처리 장치는 소프트웨어의 실행에 응답하여, 데이터를 접근, 저장, 조작, 처리 및 생성할 수도 있다. 이해의 편의를 위하여, 처리 장치는 하나가 사용되는 것으로 설명된 경우도 있지만, 해당 기술분야에서 통상의 지식을 가진 자는, 처리 장치가 복수 개의 처리 요소(processing element) 및/또는 복수 유형의 처리 요소를 포함할 수 있음을 알 수 있다. 예를 들어, 처리 장치는 복수 개의 프로세서 또는 하나의 프로세서 및 하나의 콘트롤러를 포함할 수 있다. 또한, 병렬 프로세서(parallel processor)와 같은, 다른 처리 구성(processing configuration)도 가능하다.

소프트웨어는 컴퓨터 프로그램(computer program), 코드(code), 명령(instruction), 또는 이들 중 하나 이상의 조합을 포함할 수 있으며, 원하는 대로 동작하도록 처리 장치를 구성하거나 독립적으로 또는 결합적으로(collectively) 처리 장치를 명령할 수 있다. 소프트웨어 및/또는 데이터는, 처리 장치에 의하여 해석되거나 처리 장치에 명령 또는 데이터를 제공하기 위하여, 어떤 유형의 기계, 구성요소(component), 물리적 장치, 가상 장치(virtual equipment), 컴퓨터 저장 매체 또는 장치에 구체화(embody)될 수 있다. 소프트웨어는 네트워크로 연결된 컴퓨터 시스템 상에 분산되어서, 분산된 방법으로 저장되거나 실행될 수도 있다. 소프트웨어 및 데이터는 하나 이상의 컴퓨터 판독 가능 기록 매체에 저장될 수 있다.

실시예에 따른 방법은 다양한 컴퓨터 수단을 통하여 수행될 수 있는 프로그램 명령 형태로 구현되어 컴퓨터 판독 가능 매체에 기록될 수 있다. 상기 컴퓨터 판독 가능 매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 상기 매체에 기록되는 프로그램 명령은 실시예를 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다. 컴퓨터 판독 가능 기록 매체의 예에는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(magnetic media), CD-ROM, DVD와 같은 광기록 매체(optical media), 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media), 및 롬(ROM), 램(RAM), 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다. 프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함한다.

이상과 같이 실시예들이 비록 한정된 실시예와 도면에 의해 설명되었으나, 해당 기술분야에서 통상의 지식을 가진 자라면 상기의 기재로부터 다양한 수정 및 변형이 가능하다. 예를 들어, 설명된 기술들이 설명된 방법과 다른 순서로 수행되거나, 및/또는 설명된 시스템, 구조, 장치, 회로 등의 구성요소들이 설명된 방법과 다른 형태로 결합 또는 조합되거나, 다른 구성요소 또는 균등물에 의하여 대치되거나 치환되더라도 적절한 결과가 달성될 수 있다.

그러므로, 다른 구현들, 다른 실시예들 및 특허청구범위와 균등한 것들도 후술하는 특허청구범위의 범위에 속한다.

110 : 데이터 수집부
120 : 데이터 전처리부
130 : 학습모델 설계부
140 : 학습부
150 : 모델 튜닝부
160 : 시각화부
170 : 데이터베이스

Claims

컴퓨팅 장치에 의해 실행되는 머신러닝에 기초한 반도체 불량 시점 예측 방법으로서,
반도체 검사 장치 또는 센서로부터 불량 발생 시점을 예측하기 위한 데이터를 수집하는 단계;
수집된 데이터로부터 입력변수를 도출하여 머신러닝을 수행할 학습모델을 설계하는 단계;
설계된 학습모델에 데이터들을 입력하여 불량 발생 시점을 예측하기 위한 학습을 수행하는 단계;
학습 수행결과에 대한 정확도를 분석하여 상기 학습모델의 변수를 조정하는 단계; 및
상기 학습모델을 기반으로, 반도체 검사 장치 또는 센서로부터 데이터를 입력받아, 불량 유형별 불량 발생 시점을 확률로 예측하여 시각화하는 단계
를 포함하고,
상기 입력변수를 도출하여 머신러닝을 수행할 학습모델을 설계하는 단계는,
XGBoost 알고리즘에 기반하여 가중치(weight), 이득(gain), 대상의 수(coverage)에 따른 변수의 상대적 중요도를 계산하고, 계산 결과에 기초하여 입력변수를 도출하고, SHAP 게임 이론적 접근 방식을 통해 각 변수의 SHAP 값(value)와 특징 값(Feature value)을 산출하고, 상기 특징값에 기초하여 변수에 미치는 영향도를 검증하는 것을 특징으로 하는 머신러닝에 기초한 반도체 불량 시점 예측 방법.
제1항에 있어서,
상기 학습모델을 설계하기 이전에, 상기 수집된 데이터로부터 널(null)값을 보정하고, 정규화한 후, 데이터 형 변환하여 전처리를 수행하는 단계
를 더 포함하는 머신러닝에 기초한 반도체 불량 시점 예측 방법.
제1항에 있어서,
상기 데이터를 수집하는 단계는,
나이파이(NiFi)를 사용하여 Iot 데이터를 실시간 수집하고 ETL(Extract, Transform, Load) 작업을 통해 데이터를 수집하는 것을 특징으로 하는 머신러닝에 기초한 반도체 불량 시점 예측 방법.
삭제
제1항에 있어서,
상기 학습모델의 변수를 조정하는 단계는,
그리드서치 기법에 기초하여 변수의 최적 조합을 찾아 상기 학습모델의 변수를 조정하는 것을 특징으로 하는 머신러닝에 기초한 반도체 불량 시점 예측 방법.
머신러닝에 기초한 반도체 불량 시점 예측 장치로서,
반도체 검사 장치 또는 센서로부터 불량 발생 시점을 예측하기 위한 데이터를 수집하는 데이터 수집부;
수집된 데이터로부터 입력변수를 도출하여 머신러닝을 수행할 학습모델을 설계하는 학습모델 설계부;
설계된 학습모델에 데이터들을 입력하여 불량 발생 시점을 예측하기 위한 학습을 수행하는 학습부;
학습 수행결과에 대한 정확도를 분석하여 상기 학습모델의 변수를 조정하는 모델 튜닝부; 및
상기 학습모델을 기반으로, 반도체 검사 장치 또는 센서로부터 데이터를 입력받아, 불량 유형별 불량 발생 시점을 확률로 예측하여 시각화하는 시각화부
를 포함하고,
상기 학습모델 설계부는,
XGBoost 알고리즘에 기반하여 가중치(weight), 이득(gain), 대상의 수(coverage)에 따른 변수의 상대적 중요도를 계산하고, 계산 결과에 기초하여 입력변수를 도출하고, SHAP 게임 이론적 접근 방식을 통해 각 변수의 SHAP 값(value)와 특징 값(Feature value)을 산출하고, 상기 특징값에 기초하여 변수에 미치는 영향도를 검증하는 것을 특징으로 하는 것을 특징으로 하는 머신러닝에 기초한 반도체 불량 시점 예측 장치.
제6항에 있어서,
상기 학습모델을 설계하기 이전에, 상기 수집된 데이터로부터 널(null)값을 보정하고, 정규화한 후, 형변환하여 전처리를 수행하는 데이터 전처리부
를 더 포함하는 머신러닝에 기초한 반도체 불량 시점 예측 장치.
제6항에 있어서,
상기 데이터를 수집부는,
나이파이(NiFi)를 사용하여 Iot 데이터를 실시간 수집하고 ETL(Extract, Transform, Load) 작업을 통해 데이터를 수집하는 것을 특징으로 하는 머신러닝에 기초한 반도체 불량 시점 예측 장치.
삭제
제6항에 있어서,
상기 모델 튜닝부는,
그리드서치 기법에 기초하여 변수의 최적 조합을 찾아 상기 학습모델의 변수를 조정하는 것을 특징으로 하는 머신러닝에 기초한 반도체 불량 시점 예측 장치.
제10항에 있어서,
상기 모델 튜닝부는,
그리드 서치 기법에 기초하여 서치된 변수를 적용한 학습모델의 예측결과를 데이터베이스에 저장하는 것을 특징으로 하는 머신러닝에 기초한 반도체 불량 시점 예측 장치.