KR20230052450A - 딥 러닝 기반의 반도체 소자의 특성 예측 방법 및 이를 수행하는 컴퓨팅 장치 - Google Patents

딥 러닝 기반의 반도체 소자의 특성 예측 방법 및 이를 수행하는 컴퓨팅 장치 Download PDF

Info

Publication number
KR20230052450A
KR20230052450A KR1020210135526A KR20210135526A KR20230052450A KR 20230052450 A KR20230052450 A KR 20230052450A KR 1020210135526 A KR1020210135526 A KR 1020210135526A KR 20210135526 A KR20210135526 A KR 20210135526A KR 20230052450 A KR20230052450 A KR 20230052450A
Authority
KR
South Korea
Prior art keywords
data
semiconductor
deep learning
learning model
semiconductor device
Prior art date
Application number
KR1020210135526A
Other languages
English (en)
Inventor
우솔아
길광내
박세영
이종현
Original Assignee
삼성전자주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 삼성전자주식회사 filed Critical 삼성전자주식회사
Priority to KR1020210135526A priority Critical patent/KR20230052450A/ko
Priority to US17/724,009 priority patent/US20230113207A1/en
Priority to CN202210866060.6A priority patent/CN115983166A/zh
Publication of KR20230052450A publication Critical patent/KR20230052450A/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/20Design optimisation, verification or simulation
    • G06F30/27Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/30Circuit design
    • G06F30/32Circuit design at the digital level
    • G06F30/33Design verification, e.g. functional simulation or model checking
    • G06F30/3308Design verification, e.g. functional simulation or model checking using simulation
    • GPHYSICS
    • G03PHOTOGRAPHY; CINEMATOGRAPHY; ANALOGOUS TECHNIQUES USING WAVES OTHER THAN OPTICAL WAVES; ELECTROGRAPHY; HOLOGRAPHY
    • G03FPHOTOMECHANICAL PRODUCTION OF TEXTURED OR PATTERNED SURFACES, e.g. FOR PRINTING, FOR PROCESSING OF SEMICONDUCTOR DEVICES; MATERIALS THEREFOR; ORIGINALS THEREFOR; APPARATUS SPECIALLY ADAPTED THEREFOR
    • G03F7/00Photomechanical, e.g. photolithographic, production of textured or patterned surfaces, e.g. printing surfaces; Materials therefor, e.g. comprising photoresists; Apparatus specially adapted therefor
    • G03F7/70Microphotolithographic exposure; Apparatus therefor
    • G03F7/70483Information management; Active and passive control; Testing; Wafer monitoring, e.g. pattern monitoring
    • G03F7/70491Information management, e.g. software; Active and passive control, e.g. details of controlling exposure processes or exposure tool monitoring processes
    • G03F7/705Modelling or simulating from physical phenomena up to complete wafer processes or whole workflow in wafer productions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/30Circuit design
    • G06F30/31Design entry, e.g. editors specifically adapted for circuit design
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/0464Convolutional networks [CNN, ConvNet]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/09Supervised learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2111/00Details relating to CAD techniques
    • G06F2111/20Configuration CAD, e.g. designing by assembling or positioning modules selected from libraries of predesigned modules
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2119/00Details relating to the type or aim of the analysis or the optimisation
    • G06F2119/02Reliability analysis or reliability optimisation; Failure analysis, e.g. worst case scenario performance, failure mode and effects analysis [FMEA]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2119/00Details relating to the type or aim of the analysis or the optimisation
    • G06F2119/18Manufacturability analysis or optimisation for manufacturability

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Computer Hardware Design (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Software Systems (AREA)
  • Geometry (AREA)
  • Data Mining & Analysis (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Medical Informatics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

입력 데이터에 기초한 시뮬레이션을 수행하여 상기 입력 데이터에 상응하는 반도체 소자의 특성을 나타내는 시뮬레이션 결과 데이터를 출력하는 기술 컴퓨터 보조 설계(TCAD, Technology Computer Aided Design) 시뮬레이터를 이용하여 기존의 반도체 제품들에 대한 상기 입력 데이터 및 상기 시뮬레이션 결과 데이터의 서로 다른 조합들에 상응하는 기본 트레이닝 데이터들을 제공한다. 상기 기본 트레이닝 데이터들에 기초하여 상기 반도체 소자의 특성을 나타내는 예측 데이터를 출력하는 딥 러닝 모델을 학습시킨다. 상기 딥 러닝 모델 및 타겟 반도체 제품에 상응하는 상기 입력 데이터에 기초하여 상기 타겟 반도체 제품에 포함되는 반도체 소자의 특성을 나타내는 타겟 예측 데이터를 생성한다. 기존의 반도체 제품들에 대한 TCAD 시뮬레이터를 이용하여 공정 데이터, 소자 데이터 및 시뮬레이션 결과 데이터의 조합에 상응하는 기본 트레이닝 데이터를 생성하고 상기 기본 트레이닝 데이터에 기초하여 딥 러닝 모델을 학습시킴으로써 새로운 반도체 제품에 포함되는 반도체 소자의 특성을 효율적으로 예측할 수 있다.

Description

딥 러닝 기반의 반도체 소자의 특성 예측 방법 및 이를 수행하는 컴퓨팅 장치{Method of predicting characteristic of semiconductor device and computing device performing the same}
본 발명은 반도체 집적 회로에 관한 것으로서, 더욱 상세하게는 딥 러닝 기반의 반도체 소자의 특성 예측 방법 및 이를 수행하는 컴퓨팅 장치에 관한 것이다.
전자 산업이 발달함에 따라 생산이 가능한 반도체 제품을 설계하기 위해 가능한 공정 수준을 확인하며 설계하는 설계-공정 최적화 활동의 중요성이 커지고 있다. 반도체 산업에서, 설계자(위탁자)가 실제 설계에 앞서 생산자가 목표로 하는 공정 능력에 대한 소자 모델을 제공하며 설계자(위탁자)는 모델을 활용하여 실제 반도체 제품을 설계하고 시뮬레이션을 수행할 수 있다.
이 경우, 생산자가 목표로 했던 공정 수준의 변화는 제공된 모델의 변경을 의미하며 설계자(위탁자)가 제품을 설계하는데 설계 변경이 요구된다. 이는 막대한 시간이 소요되며 이에 따라 위탁자 입장에서는 시간 손실이 생산자 입장에서는 비용 손실이 발생할 수 있다.
한편, 목표로 제시한 공정 수준의 잘못된 예측과 이에 따른 시뮬레이션을 수행하는 모델의 정확도가 낮은 경우 반도체 소자의 특성에 대한 부정확한 예측으로 인하여 설계 및 제조되는 반도체 제품의 성능이 저하될 수 있다.
상기와 같은 문제점을 해결하기 위한 본 발명의 일 목적은, 반도체 소자의 특성을 효율적으로 예측할 수 있는 딥 러닝 기반의 반도체 소자의 특성 예측 방법을 제공하는 것이다.
또한 본 발명의 일 목적은, 반도체 소자의 특성을 효율적으로 예측할 수 있는 딥 러닝 기반의 반도체 소자의 특성 예측 방법을 수행하는 컴퓨팅 장치를 제공하는 것이다.
상기 일 목적을 달성하기 위해, 본 발명의 실시예들에 따른 반도체 소자의 특성 예측 방법은, 컴퓨터로 판독 가능한 기록 매체에 저장되는 프로그램 코드를 적어도 하나의 프로세서에 의해 실행하여 수행되는 반도체 소자의 특성 예측 방법으로서, 입력 데이터에 기초한 시뮬레이션을 수행하여 상기 입력 데이터에 상응하는 반도체 소자의 특성을 나타내는 시뮬레이션 결과 데이터를 출력하는 기술 컴퓨터 보조 설계(TCAD, Technology Computer Aided Design) 시뮬레이터를 이용하여 기존의 반도체 제품들에 대한 상기 입력 데이터 및 상기 시뮬레이션 결과 데이터의 서로 다른 조합들에 상응하는 기본 트레이닝 데이터들을 제공하는 단계, 상기 기본 트레이닝 데이터들에 기초하여 상기 반도체 소자의 특성을 나타내는 예측 데이터를 출력하는 딥 러닝 모델을 학습시키는 단계 및 상기 딥 러닝 모델 및 타겟 반도체 제품에 상응하는 상기 입력 데이터에 기초하여 상기 타겟 반도체 제품에 포함되는 반도체 소자의 특성을 나타내는 타겟 예측 데이터를 생성하는 단계를 포함한다.
상기 일 목적을 달성하기 위해, 본 발명의 실시예들에 따른 반도체 소자의 특성 예측 방법은, 컴퓨터로 판독 가능한 기록 매체에 저장되는 프로그램 코드를 적어도 하나의 프로세서에 의해 실행하여 수행되는 반도체 소자의 특성 예측 방법으로서, 입력 데이터에 기초한 시뮬레이션을 수행하여 상기 입력 데이터에 상응하는 반도체 소자의 특성을 나타내는 시뮬레이션 결과 데이터를 출력하는 기술 컴퓨터 보조 설계(TCAD, Technology Computer Aided Design) 시뮬레이터를 이용하여 기존의 반도체 제품들에 대한 상기 입력 데이터 및 상기 시뮬레이션 결과 데이터의 서로 다른 조합들에 상응하는 기본 트레이닝 데이터들을 제공하는 단계, 상기 기본 트레이닝 데이터들에 기초하여 상기 반도체 소자의 특성을 나타내는 예측 데이터 및 상기 예측 데이터의 불확실성을 나타내는 불확실성 데이터를 출력하는 딥 러닝 모델을 학습시키는 단계, 상기 딥 러닝 모델 및 타겟 반도체 제품에 상응하는 상기 입력 데이터에 기초하여 상기 타겟 반도체 제품에 포함되는 반도체 소자의 특성을 나타내는 타겟 예측 데이터를 생성하는 단계 및 상기 불확실성 데이터에 기초하여 상기 딥 러닝 모델을 재학습시키는 단계를 포함한다.
상기 일 목적을 달성하기 위해, 본 발명의 실시예들에 따른 컴퓨팅 장치는, 적어도 하나의 프로세서 및 컴퓨터로 판독 가능한 기록 매체를 포함한다.
상기 기록 매체는 딥 러닝 모델을 생성하도록 상기 적어도 하나의 프로세서에 의해 실행되는 프로그램 코드 및 입력 데이터에 기초한 시뮬레이션을 수행하여 상기 입력 데이터에 상응하는 반도체 소자의 특성을 나타내는 시뮬레이션 결과 데이터를 출력하는 기술 컴퓨터 보조 설계(TCAD, Technology Computer Aided Design) 시뮬레이터를 이용하여 제공되는 기존의 반도체 제품들에 대한 상기 입력 데이터 및 상기 시뮬레이션 결과 데이터의 서로 다른 조합들에 상응하는 기본 트레이닝 데이터들을 저장한다.
상기 적어도 하나의 프로세서는 상기 프로그램 코드를 실행하여, 상기 기본 트레이닝 데이터에 기초하여 상기 반도체 소자의 특성을 나타내는 예측 데이터를 출력하는 딥 러닝 모델을 학습시키고, 상기 딥 러닝 모델, 타겟 반도체 제품에 상응하는 상기 입력 데이터에 기초하여 상기 타겟 반도체 제품에 포함되는 반도체 소자의 특성을 나타내는 타겟 예측 데이터를 생성한다.
본 발명의 실시예들에 따른 반도체 소자의 특성 예측 방법 및 컴퓨팅 장치는 기존의 반도체 제품들에 대한 TCAD 시뮬레이터를 이용하여 공정 데이터, 소자 데이터 및 시뮬레이션 결과 데이터의 조합에 상응하는 기본 트레이닝 데이터를 생성하고 상기 기본 트레이닝 데이터에 기초하여 딥 러닝 모델을 학습시킴으로써 새로운 반도체 제품에 포함되는 반도체 소자의 특성을 효율적으로 예측할 수 있다.
또한, 본 발명의 실시예들에 따른 반도체 소자의 특성 예측 방법 및 컴퓨팅 장치는 반도체 소자의 특성을 나타내는 예측 데이터와 함께 상기 예측 데이터의 불확실성을 나타내는 불확실성 데이터를 출력하도록 딥 러닝 모델을 학습시키고 상기 불확실성 데이터에 기초하여 상기 딥 러닝 모델을 재학습시킴으로써 반도체 소자의 특성을 정확하게 예측할 수 있는 딥 러닝 모델을 제공할 수 있다.
상기 딥 러닝 모델의 향상된 예측 성능을 통하여 상기 반도체 소자를 포함하는 반도체 제품의 설계 및 제조의 비용 및 시간을 감소하고 반도체 제품의 성능을 향상시킬 수 있다.
도 1은 본 발명의 실시예들에 따른 반도체 소자의 특성 예측 방법을 나타내는 흐름도이다.
도 2는 본 발명의 실시예들에 따른 컴퓨팅 장치를 나타내는 블록도이다.
도 3은 본 발명의 실시예들에 따른 전자 장치를 나타내는 블록도이다.
도 4 및 5는 본 발명의 실시예들에 따른 딥 러닝 모델의 학습을 수행하는 장치에 의해 구동되는 인공 신경망 구조의 예를 설명하기 위한 도면들이다.
도 6은 인공 신경망의 예시적인 노드를 나타내는 도면이다.
도 7 및 8은 본 발명의 실시예들에 따른 반도체 소자의 특성 예측 방법에서 기존의 반도체 제품들 및 타겟 반도체 제품 사이의 관계를 설명하기 위한 도면들이다.
도 9는 본 발명의 실시예들에 따른 반도체 소자의 특성 예측 방법을 수행하는 딥 러닝 모델의 일 실시예를 나타내는 도면이다.
도 10은 본 발명의 실시예들에 따른 반도체 소자의 특성 예측 방법에서의 데이터들을 나타내는 도면이다.
도 11은 TCAD 시뮬레이터의 시뮬레이션 결과 데이터 및 학습된 딥 러닝 모델의 예측 데이터의 일 예를 나타내는 도면이다.
도 12는 시뮬레이션 결과 데이터 및 예측 데이터의 평균 제곱근 오차를 나타내는 도면이다.
도 13은 본 발명의 실시예들에 따른 반도체 소자의 특성 예측 방법을 나타내는 흐름도이다.
도 14는 본 발명의 실시예들에 따른 반도체 소자의 특성 예측 방법에서의 재학습의 기준이 되는 불확실성의 유형을 설명하기 위한 도면이다.
도 15는 본 발명의 실시예들에 따른 반도체 소자의 특성 예측 방법을 수행하는 딥 러닝 모델의 일 실시예를 나타내는 도면이다.
도 16은 본 발명의 실시예들에 따른 반도체 소자의 특성 예측 방법에 포함되는 모델 불확실성 값에 기초한 재학습 방법의 일 실시예를 나타내는 흐름도이다.
도 17은 본 발명의 실시예들에 따른 반도체 소자의 특성 예측 방법에서의 추가 데이터 범위를 나타내는 도면이다.
이하, 첨부한 도면들을 참조하여, 본 발명의 바람직한 실시예를 보다 상세하게 설명하고자 한다. 도면상의 동일한 구성요소에 대해서는 동일한 참조부호를 사용하고 동일한 구성요소에 대해서 중복된 설명은 생략한다.
도 1은 본 발명의 실시예들에 따른 반도체 소자의 특성 예측 방법을 나타내는 흐름도이다. 도 1의 반도체 소자의 특성 예측 방법은 컴퓨터로 판독 가능한 기록 매체에 저장되는 프로그램 코드를 적어도 하나의 프로세서에 의해 실행하여 수행될 수 있다.
도 1을 참조하면, 기술 컴퓨터 보조 설계(TCAD, Technology Computer Aided Design) 시뮬레이터를 이용하여 공정 데이터, 소자 데이터 및 시뮬레이션 결과 데이터의 서로 다른 조합들에 상응하는 기본 트레이닝 데이터들을 제공한다(S100).
도 7 및 8을 참조하여 후술하는 바와 같이, 상기 기본 트레이닝 데이터들은 기존의 반도체 제품들에 상응한다. 도 9를 참조하여 후술하는 바와 같이, TCAD 시뮬레이터는 입력 데이터에 기초한 시뮬레이션을 수행하여 상기 입력 데이터에 상응하는 반도체 소자의 특성을 나타내는 시뮬레이션 결과 데이터를 제공할 수 있다. 도 10을 참조하여 후술하는 바와 같이, 상기 입력 데이터는 소자 데이터 및 공정 데이터를 포함할 수 있다. 상기 소자 데이터는 상기 반도체 소자의 구조 및 동작 조건을 나타내고, 상기 공정 데이터는 상기 반도체 제품의 제조 공정의 조건을 나타낼 수 있다.
상기 기본 트레이닝 데이터들에 기초하여 상기 반도체 소자의 특성을 나타내는 예측 데이터를 출력하는 딥 러닝 모델을 학습시킨다(S200). 도 10을 참조하여 후술하는 바와 같이, 상기 시뮬레이션 결과 데이터 및 상기 예측 데이터는 상기 반도체 소자의 전기적 특성을 나타낼 수 있다.
상기 딥 러닝 모델 및 타겟 반도체 제품에 상응하는 상기 입력 데이터에 기초하여 상기 타겟 반도체 제품에 포함되는 반도체 소자의 특성을 나타내는 타겟 예측 데이터를 생성한다(S300).
도 7 및 8을 참조하여 후술하는 바와 같이, 상기 타겟 반도체 제품은, 상기 기존의 반도체 제품들에 포함되지 않는 새로운 반도체 제품에 해당한다.
이와 같이, 본 발명의 실시예들에 따른 반도체 소자의 특성 예측 방법 및 컴퓨팅 장치는 기존의 반도체 제품들에 대한 CAD 시뮬레이터의 시뮬레이션 결과 데이터를 이용하여 기본 트레이닝 데이터를 생성하고 상기 기본 트레이닝 데이터에 기초하여 딥 러닝 모델을 학습시킴으로써 새로운 반도체 제품에 포함되는 반도체 소자의 특성을 효율적으로 예측할 수 있다.
상기 딥 러닝 모델의 향상된 예측 성능을 통하여 상기 반도체 소자를 포함하는 반도체 제품의 설계 및 제조의 비용 및 시간을 감소하고 반도체 제품의 성능을 향상시킬 수 있다.
도 2는 본 발명의 실시예들에 따른 컴퓨팅 장치를 나타내는 블록도이다.
도 2를 참조하면, 컴퓨팅 장치(100)는 프로세서들(110), 랜덤 액세스 메모리(120), 장치 드라이버(130), 스토리지 장치(140), 모뎀(150) 및 사용자 인터페이스들(160)을 포함할 수 있다.
프로세서들(110) 중 적어도 하나는 딥 러닝 모델(DLM)(220) 및 딥 러닝 모델(22)의 학습을 제어하는 트레이닝 제어 모듈(TCM)(240)을 실행할 수 있다. 트레이닝 제어 모듈(240)은 도 1을 참조하여 설명한 바와 같은 반도체 소자의 특성 예측 방법을 수행하여 딥 러닝 모델(220)을 학습시킬 수 있다.
일 실시예에서, 딥 러닝 모델(220) 및 트레이닝 제어 모듈(240)은 프로세서들(110) 중 적어도 하나에 의해 실행되는 명령들(또는 프로그램 코드들)의 형태로 구현될 수 있다. 딥 러닝 모델(220) 및 트레이닝 제어 모듈(240)은 컴퓨터로 판독 가능한 기록 매체에 저장될 수 있다. 이때, 적어도 하나의 프로세서는 딥 러닝 모델(220) 및 트레이닝 제어 모듈(240)의 명령들(또는 프로그램 코드들)을 랜덤 액세스 메모리(120)에 로드할 수 있다.
다른 실시예에서, 적어도 하나의 프로세서는 딥 러닝 모델(220) 및 트레이닝 제어 모듈(240)을 구현하도록 제조될 수 있다. 다른 예로서, 적어도 하나의 프로세서는 다양한 기계 학습 모듈들 또는 딥 러닝 모델들을 구현하도록 제조될 수 있다. 적어도 하나의 프로세서는 딥 러닝 모델(220) 및 트레이닝 제어 모듈(240)에 대응하는 정보를 수신함으로써, 딥 러닝 모델(220) 및 트레이닝 제어 모듈(240)을 구현할 수 있다.
프로세서들(110)은, 예를 들어, 중앙 프로세싱 유닛(111)(CPU), 응용 프로세서(AP) 등과 같은 적어도 하나의 범용 프로세서를 포함할 수 있다. 프로세서들(110)은 또한 뉴럴 프로세싱 유닛(113), 뉴로모픽 프로세서(114), 그래픽 프로세싱 유닛(115)(GPU) 등과 같은 적어도 하나의 특수 목적 프로세서를 포함할 수 있다. 프로세서들(110)은 두 개 이상의 동일한 종류의 프로세서들을 포함할 수 있다.
랜덤 액세스 메모리(120)는 프로세서들(110)의 동작 메모리로 사용되고, 컴퓨팅 장치(100)의 주 메모리 또는 시스템 메모리로 사용될 수 있다. 랜덤 액세스 메모리(120)는 동적 랜덤 액세스 메모리 또는 정적 랜덤 액세스 메모리와 같은 휘발성 메모리, 또는 상 변화 랜덤 액세스 메모리, 강유전체 랜덤 액세스 메모리, 자기 랜덤 액세스 메모리, 또는 저항성 랜덤 액세스 메모리와 같은 불휘발성 메모리를 포함할 수 있다.
장치 드라이버(130)는 프로세서들(110)의 요청에 따라 스토리지 장치(140), 모뎀(150), 사용자 인터페이스들(160) 등과 같은 주변 장치들을 제어할 수 있다. 스토리지 장치(140)는 하드 디스크 드라이브, 솔리드 스테이트 드라이브 등과 같은 고정식 스토리지 장치, 또는 외장형 하드 디스크 드라이브, 외장형 솔리드 스테이트 드라이브, 착탈식 메모리 카드 등과 같은 착탈식 스토리지 장치를 포함할 수 있다.
모뎀(150)은 외부의 장치와 원격 통신을 제공할 수 있다. 모뎀(150)은 외부의 장치와 무선 또는 유선 통신을 수행할 수 있다. 모뎀(150)은 이더넷, 와이파이, LTE, 5G 모바일 이동 통신 등과 같은 다양한 통신 형태들 중 적어도 하나를 통해 외부의 장치와 통신할 수 있다.
사용자 인터페이스들(160)은 사용자로부터 정보를 수신하고, 그리고 사용자에게 정보를 제공할 수 있다. 사용자 인터페이스들(160)은 디스플레이(161), 스피커(162) 등과 같은 적어도 하나의 사용자 출력 인터페이스, 그리고 마우스(163)(mice), 키보드(164), 터치 입력 장치(165) 등과 같은 적어도 하나의 사용자 입력 인터페이스를 포함할 수 있다.
딥 러닝 모델(220) 및 트레이닝 제어 모듈(240)의 명령들(또는 프로그램 코드들)은 모뎀(150)을 통해 수신되어 스토리지 장치(140)에 저장될 수 있다. 딥 러닝 모델(220) 및 트레이닝 제어 모듈(240)의 명령들(또는 프로그램 코드들)은 착탈식 스토리지 장치에 저장되고 그리고 컴퓨팅 장치(100)에 결합될 수 있다. 딥 러닝 모델(220) 및 트레이닝 제어 모듈(240)의 명령들(또는 프로그램 코드들)은 스토리지 장치(140)로부터 랜덤 액세스 메모리(120)로 로드되어 실행될 수 있다.
컴퓨터 프로그램 명령, 딥 러닝 모델(MLM) 및 트레이닝 제어 모듈(TCM)은 일시적 컴퓨터 판독 가능한 매체 또는 비일시적 컴퓨터 판독 가능한 매체에 저장될 수 있다. 또한, 본 개시의 적어도 일부의 실시예들에서, 프로세서가 수행한 시뮬레이션 결과 값들 또는 프로세서가 수행한 연산 처리의 값들은 일시적 컴퓨터 판독 가능한 매체 또는 비일시적 컴퓨터 판독 가능한 매체에 저장될 수 있다. 또한, 본 개시의 적어도 일부의 실시예들에서, 딥 러닝을 진행하는 동안 발생하는 중간 값들은 일시적 컴퓨터 판독 가능한 매체 또는 비일시적 컴퓨터 판독 가능한 매체에 저장될 수 있다. 또한, 본 개시의 적어도 일부의 실시예들에서, 트레이닝 데이터, 공정 데이터, 소자 데이터, 시뮬레이션 결과 데이터, 예측 데이터 및 불확실성 데이터는 일시적 컴퓨터 판독 가능한 매체 또는 비일시적 컴퓨터 판독 가능한 매체에 저장될 수 있다. 그러나 본 개시가 이에 제한되지는 않는다.
도 3은 본 발명의 실시예들에 따른 전자 장치를 나타내는 블록도이다.
도 3을 참조하면, 전자 장치(1000)는 입력부(11), 저장부(12) 및 프로세서(13)를 포함할 수 있다.
스토리지 장치(12)는 프로그램 코드(PCODE), 데이터베이스(DB) 등을 저장할 수 있다.
데이터베이스(DB)는 기존의 반도체 제품들에 대한 기본 트레이닝 데이터들을 포함한다. TCAD 시뮬레이터(31)는 입력 데이터에 기초한 시뮬레이션을 수행하여 상기 입력 데이터에 상응하는 반도체 소자의 특성을 나타내는 시뮬레이션 결과 데이터를 제공할 수 있다.
도 10을 참조하여 후술하는 바와 같이, 상기 입력 데이터는 소자 데이터 및 공정 데이터를 포함할 수 있다. 상기 소자 데이터는 상기 반도체 소자의 구조 및 동작 조건을 나타내고, 상기 공정 데이터는 상기 반도체 제품의 제조 공정의 조건을 나타낼 수 있다. 각각의 기본 트레이닝 데이터는 기존의 반도체 제품에 대한 공정 데이터와 소자 데이터, 그리고 상기 공정 데이터와 상기 소자 데이터에 상응하는 시뮬레이션 결과 데이터의 조합에 해당한다.
데이터베이스(DB)는 공정 데이터, 소자 데이터 및 시뮬레이션 결과 데이터의 서로 다른 조합들에 상응하는 기본 트레이닝 데이터들을 포함할 수 있다. 이와 같은, 데이터베이스(DB)의 구축은 딥 러닝 모델(DLM)의 학습을 수행하는 프로세서(13)에 의해 수행될 수도 있고, 외부의 다른 프로세서에 의해 수행될 수도 있다.
프로그램 코드(PCODE)는 도 2의 딥 러닝 모델(220) 및 트레이닝 제어 모듈(240)을 구현하도록 실행될 수 있다. 이와 같이, 딥 러닝 모델(220) 및 트레이닝 제어 모듈(240)은 컴퓨터로 판독 가능한 기록 매체, 즉 스토리지 장치(12)에 저장될 수 있다. 이때, 프로세서(13)는 딥 러닝 모델(220) 및 트레이닝 제어 모듈(240)의 명령들(또는 프로그램 코드들)을 랜덤 액세스 메모리(120)에 로드할 수 있다.
프로세서(13)는 구축된 데이터베이스(DB)에 포함된 기본 트레이닝 데이터들을 이용하여 딥 러닝 모델(DLM)에 대한 학습을 수행할 수 있다.
입력부(11)는 타겟 반도체 제품에 대한 입력 데이터를 수신하여 프로세서(13)로 전달할 수 있으며, 프로세서(13)는 타겟 반도체 제품에 대한 입력 데이터를 학습된 입 러닝 모델(DLM)에 인가하여 상기 타겟 반도체 제품에 포함되는 반도체 소자의 특성을 나타내는 타겟 예측 데이터를 생성할 수 있다.
도 4 및 5는 본 발명의 실시예들에 따른 딥 러닝 모델의 학습을 수행하는 장치에 의해 구동되는 인공 신경망 구조의 예를 설명하기 위한 도면들이다.
도 4를 참조하면, 일반적인 신경망의 네트워크 구조는 입력 레이어(IL), 복수의 히든 레이어들(HL1, HL2, ..., HLn) 및 출력 레이어(OL)를 포함할 수 있다.
입력 레이어(IL)는 입력 데이터(X)에 상응하는 i(i는 자연수)개의 입력 노드들(x1, x2, ..., xi)을 포함할 수 있고, 길이가 i인 벡터 입력 데이터(X)가 각 입력 노드에 입력될 수 있다.
복수의 히든 레이어들(HL1, HL2, ..., HLn)은 n(n은 자연수)개의 히든 레이어들을 포함하며, 히든 노드들(h1 1, h1 2, h1 3, ..., h1 m, h2 1, h2 2, h2 3, ..., h2 m, hn 1, hn 2, hn 3, ..., hn m)을 포함할 수 있다. 예를 들어, 히든 레이어(HL1)는 m(m은 자연수)개의 히든 노드들(h1 1, h1 2, h1 3, ..., h1 m)을 포함할 수 있고, 히든 레이어(HL2)는 m개의 히든 노드들(h2 1, h2 2, h2 3, ..., h2 m)을 포함할 수 있으며, 히든 레이어(HLn)는 m개의 히든 노드들(hn 1, hn 2, hn 3, ..., hn m)을 포함할 수 있다.
출력 레이어(OL)는 출력 데이터(Y)에 대응하는 j(j는 자연수)개의 출력 노드들(y1, y2, ..., yj)을 포함할 수 있고, 입력 데이터(X)에 상응하는 출력 데이터(Y)를 발생할 수 있다.
도 4에 도시된 네트워크 구조는, 두 개의 노드들 사이에 직선으로 도시된 노드들 간의 연결(branch)과, 도시되지는 않았지만 각 연결에서 사용되는 가중치(weight) 값들을 포함할 수 있다. 이 때, 하나의 레이어 내의 노드들 간에는 연결이 되지 않을 수 있고, 서로 다른 레이어들에 포함되는 노드들은 완전하게 혹은 부분적으로 연결될 수 있다.
도 4의 각 노드(예를 들어, h1 1)는 이전 노드(예를 들어, x1)의 출력을 입력 받아 연산할 수 있고, 연산 결과를 이후 노드(예를 들어, h2 1)에 출력할 수 있다. 이 때, 각 노드는 입력된 값을 특정 함수, 예를 들어 비선형 함수에 적용하여 출력할 값을 연산할 수 있다.
일반적으로 인공 신경망의 네트워크 구조는 미리 결정되어 있으며, 노드들 간의 연결에 따른 가중치들은 정답이 알려진 데이터를 이용하여 적절한 값을 산정할 수 있다.
이와 같이 이미 정답이 알려진 데이터들을 '학습 데이터'라고 하고, 가중치를 결정하는 과정을 '교사 학습(supervised learning)'이라고 할 수 있다. 또한, 독립적으로 학습이 가능한 구조와 가중치의 묶음을 '모델'이라고 가정하고, 가중치가 결정된 모델이 입력 데이터가 어느 클래스에 속할지를 예측하여 그 예측값을 출력하는 것을 '테스트' 과정이라고 한다.
한편, 도 4에 도시된 일반적인 신경망은 각 노드(예를 들어, h11)가 앞쪽 레이어(previous layer)(예를 들어, IL)의 모든 노드들(예를 들어, x1, x2, ..., xi)과 연결되어 있어, 입력 데이터(X)가 영상(또는 음성)인 경우에 영상의 크기가 증가할수록 필요한 가중치의 개수가 기하급수적으로 증가하며, 따라서 영상을 다루기에 적절하지 않을 수 있다. 이에 따라, 신경망에 필터 기술을 병합하여, 신경망이 2차원 영상을 잘 습득할 수 있도록 구현된 컨볼루션(convolutional) 신경망이 연구되고 있다.
도 5를 참조하면, 컨볼루션 신경망의 네트워크 구조는 복수의 레이어들(CONV1, RELU1, CONV2, RELU2, POOL1, CONV3, RELU3, CONV4, RELU4, POOL2, CONV5, RELU5, CONV6, RELU6, POOL3, FC)을 포함할 수 있다.
일반적인 신경망과 다르게, 컨볼루션 신경망의 각 레이어는 가로(또는 폭, width), 세로(또는 높이, height), 깊이(depth)의 3개의 차원을 가질 수 있다. 이에 따라, 각 레이어에 입력되는 데이터 또한 가로, 세로, 깊이의 3개의 차원을 가지는 볼륨 데이터일 수 있다.
컨볼루션 레이어들(CONV1, CONV2, CONV3, CONV4, CONV5, CONV6)은 입력에 대한 컨볼루션 연산을 수행할 수 있다. 예를 들어, 영상 처리에서 컨볼루션이란 가중치를 갖는 마스크를 이용하여 데이터를 처리하는 것을 의미할 수 있으며, 입력 값과 마스크의 가중치를 곱한 후에 그 합을 출력 값으로 정하는 것을 나타낼 수 있다. 이 때, 마스크를 필터(filter), 윈도우(window) 또는 커널(kernel)이라고 부를 수 있다.
구체적으로, 각 컨볼루션 레이어의 파라미터들은 일련의 학습 가능한 필터들로 이루어져 있을 수 있다. 각 필터는 가로/세로 차원으로는 각 레이어의 전체 크기보다 작지만 깊이 차원으로는 각 레이어의 전체 깊이를 아우를 수 있다.
예를 들어, 각 필터를 입력 볼륨의 가로/세로 차원으로 슬라이딩(정확히는 convolve) 시키며 필터와 입력의 요소들 사이의 내적 연산(dot product)을 수행하여 2차원의 액티베이션 맵(activation map)을 생성할 수 있고, 이러한 액티베이션 맵을 깊이 차원을 따라 쌓아서 출력 볼륨을 생성할 수 있다.
예를 들어, 컨볼루션 레이어(CONV1)가 32*32*3의 크기의 입력 볼륨 데이터(X)에 네 개의 필터들을 제로 패딩(zero-padding)과 함께 적용하면, 컨볼루션 레이어(CONV1)의 출력 볼륨은 32*32*12의 크기를 가질 수 있다 (즉, 깊이 증가).
RELU 레이어들(RELU1, RELU2, RELU3, RELU4, RELU5, RELU6)은 입력에 대한 정정 선형 유닛 연산을 수행할 수 있다. 예를 들어, 정정 선형 유닛 연산은 max(0, x)와 같이 음수에 대해서만 0으로 처리하는 함수를 나타낼 수 있다. 예를 들어, RELU 레이어(RELU1)가 컨볼루션 레이어(CONV1)로부터 제공된 32*32*12의 크기의 입력 볼륨에 정정 선형 유닛 연산을 수행하면, RELU 레이어(RELU1)의 출력 볼륨은 32*32*12의 크기를 가질 수 있다 (즉, 볼륨 유지).
풀링 레이어들(POOL1, POOL2, POOL3)은 입력 볼륨의 가로/세로 차원에 대해 다운 샘플링을 수행할 수 있다. 예를 들어, 2*2 필터를 적용하는 경우에 2*2 영역의 네 개의 입력들을 하나의 출력으로 변환할 수 있다. 구체적으로, 2*2 최대 값 풀링과 같이 2*2 영역의 네 개의 입력들 중 최대 값을 선택하거나, 2*2 평균 값 풀링과 같이 2*2 영역의 네 개의 입력들의 평균 값을 연산할 수 있다. 예를 들어, 풀링 레이어(POOL1)가 32*32*12의 크기의 입력 볼륨에 2*2 필터를 적용하면, 풀링 레이어(POOL1)의 출력 볼륨은 16*16*12의 크기를 가질 수 있다 (즉, 가로/세로 감소, 깊이 유지, 볼륨 감소).
일반적으로 컨볼루션 신경망에서는 하나의 컨볼루션 레이어(예를 들어, CONV1)와 하나의 RELU 레이어(예를 들어, RELU1)가 한 쌍을 형성할 수 있고, 컨볼루션/RELU 레이어들의 쌍이 반복 배치될 수 있으며, 컨볼루션/RELU 레이어들의 쌍이 반복 배치되는 중간 중간에 풀링 레이어를 삽입함으로써, 입력 데이터(X)의 특징을 추출할 수 있다. 컨볼루션 신경망에 포함되는 레이어들의 종류 및 개수는 실시예에 따라서 다양하게 변경될 수 있다.
본 발명의 실시예들이 특정한 신경망에 한정되는 것은 아니다, 딥 러닝 모델은 PNN(Perceptron Neural Network), CNN(Convolution Neural Network), R-CNN(Region with Convolution Neural Network), RPN(Region Proposal Network), RNN(Recurrent Neural Network), S-DNN(Stacking-based deep Neural Network), S-SDNN(State-Space Dynamic Neural Network), Deconvolution Network, DBN(Deep Belief Network), RBM(Restricted Boltzman Machine), Fully Convolutional Network, LSTM(Long Short-Term Memory) Network, Classification Network 및 BNN(Bayesian Neural Network) 중 적어도 하나를 포함할 수 있다.
도 6은 인공 신경망의 예시적인 노드를 나타내는 도면이다.
도 6에는 인공 신경망에 포함되는 하나의 노드(ND)에서 수행되는 연산의 일 예를 나타낸다.
하나의 노드(ND)에 N개의 입력들(a1, a2, a3, ..., aN)이 제공되는 경우에, 노드(ND)는 N개의 입력들(a1, a2, a3, ..., aN) 및 이에 대응하는 N개의 가중치들(w1, w2, w3, ..., wN)을 각각 곱하여 합산하고, 상기 합산된 입력 값에 오프셋(b)을 더하며, 상기 오프셋이 반영된 입력 값을 특정 함수(σ)에 적용하여 하나의 출력 신호를 발생할 수 있다. 트레이닝 데이터(TRD)에 기초하여 학습 동작을 수행하여 신경망에 포함된 모든 노드들을 갱신할 수 있다.
딥 러닝(deep learning) 기반의 반도체 소자의 특성 예측의 경우, 학습을 위하여 충분한 수량의 트레이닝 데이터 또는 학습 데이터가 필요하다. 딥 러닝 기반의 알고리즘에 활용하기 위한 트레이닝 데이터의 경우 학습 시 과적합(over-fitting)을 방지하고 성능을 향상시키기 위해 다양한 종류의 데이터를 충분히 확보해야 한다.
본 발명의 실시예들에 따라서, TCAD 시뮬레이터를 이용하여 트레이닝 데이터를 생성함으로써 효율적으로 딥 러닝 모델의 학습을 위한 데이터베이스(DB)를 구축할 수 있다.
도 7 및 8은 본 발명의 실시예들에 따른 반도체 소자의 특성 예측 방법에서 기존의 반도체 제품들 및 타겟 반도체 제품 사이의 관계를 설명하기 위한 도면들이다.
도 7 및 8을 참조하면, 공정 데이터(PT)는 반도체 제품(SP)의 제조 공정을 나타내는 공정 타입(PT) 및 반도체 제품(SP)이 속하는 제품 그룹(PG)의 공정-그룹 조합(PGC)에 따라서 결정될 수 있다. 예를 들어, 공정 타입(PT)은 제조 공정의 임계 치수(CD, critical dimension)를 나타낼 수 있다. 제품 그룹(PG)은 서버향 제품 그룹, 모바일 제품 그룹, 그래픽 제품 그룹, 고대역폭 메모리 제품 그룹 등을 포함할 수 있다.
제1 반도체 제품(SP1)은 제1 공정 타입(PT1) 및 제1 제품 그룹(PG1)의 제1 조합(CB1)에 해당하고 제1 반도체 제품(SP1)의 공정 데이터(PR)는 제1 공정 데이터(PR1)로 결정될 수 있다. 제2 반도체 제품(SP2)은 제1 공정 타입(PT1) 및 제2 제품 그룹(PG2)의 제2 조합(CB2)에 해당하고 제2 반도체 제품(SP2)의 공정 데이터(PR)는 제2 공정 데이터(PR2)로 결정될 수 있다. 제3 반도체 제품(SP3)은 제1 공정 타입(PT1) 및 제3 제품 그룹(PG3)의 제3 조합(CB3)에 해당하고 제3 반도체 제품(SP3)의 공정 데이터(PR)는 제3 공정 데이터(PR3)로 결정될 수 있다.
제4 반도체 제품(SP4)은 제2 공정 타입(PT2) 및 제1 제품 그룹(PG1)의 제4 조합(CB1)에 해당하고 제4 반도체 제품(SP4)의 공정 데이터(PR)는 제4 공정 데이터(PR4)로 결정될 수 있다. 제5 반도체 제품(SP5)은 제2 공정 타입(PT2) 및 제2 제품 그룹(PG2)의 제5 조합(CB5)에 해당하고 제5 반도체 제품(SP5)의 공정 데이터(PR)는 제5 공정 데이터(PR5)로 결정될 수 있다. 제6 반도체 제품(SP6)은 제2 공정 타입(PT2) 및 제3 제품 그룹(PG3)의 제6 조합(CB6)에 해당하고 제6 반도체 제품(SP6)의 공정 데이터(PR)는 제6 공정 데이터(PR6)로 결정될 수 있다.
제7 반도체 제품(SP7)은 제3 공정 타입(PT3) 및 제1 제품 그룹(PG1)의 제7 조합(CB7)에 해당하고 제7 반도체 제품(SP7)의 공정 데이터(PR)는 제7 공정 데이터(PR7)로 결정될 수 있다. 제8 반도체 제품(SP8)은 제3 공정 타입(PT3) 및 제3 제품 그룹(PG3)의 제8 조합(CB8)에 해당하고 제8 반도체 제품(SP8)의 공정 데이터(PR)는 제8 공정 데이터(PR8)로 결정될 수 있다.
이와 같은, 제1 내지 제8 반도체 제품들(SP1~SP8)에 대하여 도 3을 참조하여 설명한 바와 같이 TCAD 시뮬레이터를 이용하여 제1 내지 제8 시뮬레이션 결과 데이터들(SR1~SR8)이 생성될 수 있다. 제1 내지 제8 시뮬레이션 결과 데이터들(SR1~SR8)을 이용하여 도 1을 참조하여 설명한 기본 트레이닝 데이터들을 생성할 수 있고, 제1 내지 제8 반도체 제품들(SP1~SP8)는 도 1에서 언급한 기존의 반도체 제품들(ESP)에 해당할 수 있다.
제9 반도체 제품(SP9)은 제3 공정 타입(PT3) 및 제2 제품 그룹(PG2)의 제9 조합(CB9)에 해당하고 제9 반도체 제품(SP9)의 공정 데이터(PR)는 제9 공정 데이터(PR9)로 결정될 수 있다.
제1 내지 제8 반도체 제품들(SP1~SP8)과는 다르게, 제9 반도체 제품(SP9)은 설계 단계에 있고 제9 반도체 제품(SP9)에 상응하는 시뮬레이션 결과 데이터는 아직 생성되기 전일 수 있다. 제9 반도체 제품(SP9)은 도 1에서 언급한 타겟 반도체 제품에 해당할 수 있다.
이와 같이, 공정 데이터(PT)는 반도체 제품(SP)의 제조 공정을 나타내는 공정 타입(PT) 및 반도체 제품(SP)의 그룹이 속하는 제품 그룹(PG)의 공정-그룹 조합(PGC)에 따라서 결정될 수 있고, 타겟 반도체 제품(예를 들어, 제9 반도체 제품(SP9))의 공정-그룹 조합(예를 들어, 제9 공정-그룹 조합(CB9))은 상기 기존의 반도체 제품들(예를 들어, 제1 내지 제8 반도체 제품들(SP1~SP8))의 공정-제품 조합들(예를 들어, 제1 내지 제8 공정-그룹 조합들(CB1~CB8)에 포함되지 않는 새로운 조합일 수 있다.
다시 말해, 타겟 반도체 제품(예를 들어, 제9 반도체 제품(SP9))은 기본 트레이닝 데이터를 제공하기 위한 기존의 시뮬레이션 결과 데이터들(예를 들어, 제1 내지 제8 제1 내지 제8 시뮬레이션 결과 데이터들(SR1~SR8)에 각각 상응하는 상기 기존의 반도체 제품들(예를 들어, 제1 내지 제8 반도체 제품들(SP1~SP8))에 포함되지 않는 새로운 반도체 제품일 수 있다.
TCAD 시뮬레이터의 대안으로서 또는 TCAD 시뮬레이터와 함께 반도체 제품의 설계에 이용되는 컴팩트 모델은 회로 설계에 필요한 소자 데이터의 범위에서 반도체 소자의 특성을 제공하여야 하고, 컴팩트 모델의 생성을 위한 측정 데이터의 제공을 위해 테스트 엘리먼트 그룹(Test element group)을 웨이퍼의 스크라이브 레인(scribe lane)에 배치한다. 그러나 스크라이브 레인의 제한적인 면적, 공정 TAT(turnaround time) 등에 따라서 특성 확인에 소요되는 시간이 증대하고 커버리지(coverage) 확보의 어려움이 발생한다.
본 발명의 실시예들에 따라서, 기존에 개발되어진 이전 세대의 모제품들, 즉 제1 내지 제8 반도체 제품들(SP1~SP8)의 제1 내지 제8 제1 내지 제8 시뮬레이션 결과 데이터들(SR1~SR8)을 이용하여 딥 러닝 모델의 학습을 위한 한 기본 트레이닝 데이터를 데이터베이스화 함으로써, 스크라이브 레인의 제한적인 면적, 공정 TAT(turnaround time) 등과 같은 문제를 극복하고, 타겟 반도체 제품, 즉 제9 반도체 제품(SP9)에 포함되는 반도체 소자의 전기적 특성을 효율적이고도 신속하게 제공할 수 있다.
상기 기존의 반도체 제품들 및 상기 타겟 반도체 제품은 메모리 장치들일 수 있다. 본 발명의 실시예들은 메모리 장치의 특성 예측에 특히 유용하다. 메모리 비즈니스에서는 회로 설계 및 소자 공정의 동시 최적화(DTCO, Design Technology Co-optimization)의 중요성이 점점 대두되고 있으며 따라서 차세대 제품에 포함되는 반도체 소자의 특성을 예측하여 설계에 필요한 소자 모델을 신속하게 제공할 필요가 있다. 또한, 메모리 비즈니스의 특성상 동일 또는 유사한 구조의 제품이 축소(shrink)되는 경향이 있으며, 기존의 메모리 장치들의 TCAD 시뮬레이터에 의한 시뮬레이션 결과 데이터들을 이용하여 새로운 메모리 장치의 성능 예측을 위한 데이터베이스 구축이 가능하다.
도 9는 본 발명의 실시예들에 따른 반도체 소자의 특성 예측 방법을 수행하는 딥 러닝 모델의 일 실시예를 나타내는 도면이다. 도 9에는 도시의 편의상 딥 러닝 모델의 구체적인 구성의 도시를 생략하고 입력 데이터(X)를 수신하는 입력 레이어(IL) 및 출력 데이터(Y)를 제공하는 출력 레이어(Y)만이 도시되어 있다.
설계된 반도체 레이아웃을 기초로 반도체 형상 모델링을 수행할 수 있다. 반도체 형상 모델링은 예를 들면, TCAD(Technology Computer Aided Design) 시뮬레이터를 이용하여 수행될 수 있다. 반도체 형상 모델링에는 예를 들면, 반도체 소자의 제조 공정을 모델링한 프로세스 TCAD가 사용될 수 있으나, 이에 한정되지 않으며, 반도체 소자의 동작을 모델링한 디바이스 TCAD도 함께 사용될 수 있다.
예를 들면, TCAD를 수행하기 위한 TCAD 툴은 Synopsys, Silvaco, Crosslight, Cogenda Software|VisualTCAD, Global TCAD Solutions, 또는 Tiberlab 등일 수 있다.
반도체 형상 모델링은 반도체 레이아웃을 기초로, 물리기반 박막 증착 공정 모사 및 에칭 공정 모사를 통하여 수행되어, 모델링된 반도체 형상을 구현할 수 있다. 여기에서 반도체 형상이란, 반도체 소자를 이루는 각 구성요소의 배치와 같은 구조, 반도체 소자를 이루는 각 구성 요소가 가지는 수치들(예를 들면, 박막의 두께, 에칭 공정을 통하여 제거된 부분의 깊이, 포함된 물질의 물리적 특성 등)을 포괄하는 의미로, 타겟 스펙(target spec.)이라고도 호칭될 수 있다. 여기에서 각 구성 요소가 가지는 수치들은 고정된 상수만을 의미하는 것이 아니고, 물리기반 박막 증착 공정 모사 및 에칭 공정 모사에서 선택되거나 변경될 수 있는 공정 변수들을 의미할 수도 있다.
반도체 형상 모델링을 통하여 구현된 모델링된 반도체 형상에 대하여, 물리기반 박막 증착 공정 모사 및 에칭 공정 모사에 사용되는 공정 변수들을 결합하여 복수의 샘플링 표본을 추출할 수 있다. 예를 들면, 복수의 샘플링 표본은 물리기반 박막 증착 공정 모사 및 에칭 공정 모사에 사용되는 공정 변수들의 독립적인 선형 결합을 통하여 추출될 수 있다. 예를 들면, 복수의 샘플링 표본은 라틴 하이퍼큐브 샘플링(Latin Hypercube Sampling, LHS)에 의하여 추출될 수 있다.
복수의 샘플링 표본은, 모든 공정 단계의 모사에 사용되는 공정 변수들을 결합하지 않고, 일부 선정된 공정 단계들의 모사에 사용되는 공정 변수들만을 결합하여 추출할 수 있다. 복수의 샘플링 표본을 추출하기 위하여 선정되는 공정 단계들 및 공정 변수들은 반도체 형상을 결정하는 데에 지배적인(dominant) 공정 단계들 및 공정 변수들일 수 있다. 일부 실시 예에서, 복수의 샘플링 표본을 추출하기 위하여 선정되는 공정 단계들은 완성된 반도체 소자를 이루는 각 구성 요소를 형성하는 물질막을 형성하는 박막 증착 공정, 형성된 물질막의 일부를 제거하는 에칭 공정이나 CMP(Chemical Mechanical Polishing) 공정일 수 있고, 공정 변수들은 박막 증착 공정의 증착 시간 및/또는 그 결과인 형성되는 박막의 두께, 에칭 공정의 에칭 시간 및/또는 결과인 에칭 깊이, CMP 공정의 수행 시간 및/또는 결과인 제거된 두께나 잔류 두께일 수 있다.
추출된 복수의 샘플링 표본은 다른 공정 변수들에 대하여 반도체 형상 모델링을 통하여 구현된 복수의 모델링된 반도체 형상일 수 있다. 예를 들면, 추출된 복수의 샘플링 표본은 박막의 두께 또는 박막의 증착 시간, 에칭 깊이 또는 에칭 시간 등과 같은 공정 변수를 다르게 하여 반도체 형상 모델링을 통하여 구현된 복수의 모델링된 반도체 형상일 수 있다.
TCAD 시뮬레이터는 이와 같이 모델링된 반도체 형상, 즉 반도체 소자의 구조 및 동작 조건을 나타내는 소자 데이터에 기초한 시뮬레이션을 수행하여, 입력 데이터, 즉 공정 데이터 및 소자 데이터에 상응하는 반도체 소자의 특성을 나타내는 시뮬레이션 결과 데이터를 제공할 수 있다.
기존에는 이와 같은 TCAD 시뮬레이터를 이용하여 소자 특성을 예측하고, 이를 기반으로 엔지니어가 캘리브레이션을 통해 소자 모델을 개발해왔다. 그러나, 제품별/세대별로 소자 모델을 개발하기 위해서는 TCAD 시뮬레이터를 활용하여 각각의 데이터베이스를 구축하여 모델을 개발해야 하며, 이로 인한 개발 TAT가 길다는 단점이 있다. 특히 TCAD 시뮬레이터를 통해 소자 특성을 예측하는 것은 TCAD 시뮬레이터의 특성상 시간이 오래 걸리며 이는 모델 개발의 병목(bottleneck)이 된다.
따라서 본 발명은 기존 기술들의 한계점을 해결하고자 기존에 축적된 TCAD 시뮬레이터를 통해 얻어진 기존의 반도체 제품들에 대한 입력 및 출력 정보를 이용하여 통합 데이터베이스를 구축하고, 상기 통합 데이터베이스에 기초하여 TCAD 시뮬레이터를 딥 러닝 모델로 대체하는 것이다. TCAD 시뮬레이터를 딥 러닝 모델로 대체함으로써 실시간으로 반도체 소자의 특성을 예측하고 새로운 반도체 제품의 개발을 위한 TAT를 현저히 감소할 수 있다.
도 9를 참조하면, TCAD 시뮬레이터를 대체할 수 있는 딥 러닝 모델(DLM1)을 생성할 수 있다.
복수의 기존 반도체 제품들에 해당하는 공정 데이터(PR) 및 소자 데이터(DV)에 상응하는 시뮬레이션 결과 데이터(SR)에 기초하여 기본 트레이닝 데이터(TRD)를 생성할 수 있다. 기본 트레이닝 데이터(TRD)는 공정 데이터(PR), 소자 데이터(DV) 및 시뮬레이션 결과 데이터(SR)의 조합에 상응한다. 서로 다른 공정 데이터(PR) 및 소자 데이터(DV)의 값들에 기초하여 서로 다른 조합들에 상응하는 복수의 기본 트레이닝 데이터들(TRD)을 생성할 수 있다.
이 경우, 딥 러닝 모델(DLM1)의 입력 데이터(X)는 공정 데이터(PR) 및 소자 데이터(DV)를 모두 포함할 수 있다. 출력 데이터(Y)는 예측 데이터(PD)를 포함할 수 있다. 기본 트레이닝 데이터(TRD)의 시뮬레이션 결과 데이터(SR)를 공정 데이터(PR) 및 소자 데이터(DV)의 입력에 대한 예측 데이터(PD)의 정답으로 이용하여 딥 러닝 모델(DLM1)의 교사 학습(supervised learning)이 수행될 수 있다.
도 10은 본 발명의 실시예들에 따른 반도체 소자의 특성 예측 방법에서의 데이터들을 나타내는 도면이다. 도 10에는 예시적으로 반도체 소자가 트랜지스터에 해당하는 경우의 데이터들이 도시되어 있으나, 본 발명의 실시예들이 트랜지스터에 한정되는 것은 아니며 다른 반도체 소자들에 대해서도 본 발명의 실시예들이 적용될 수 있다
도 10을 참조하면, 딥 러닝 모델의 입력 데이터(X)는 소자 데이터(DV) 및/또는 공정 데이터(PR)를 포함할 수 있다.
도 9를 참조하여 전술한 바와 같이, 입력 데이터(X)는 소자 데이터(DV) 및 공정 데이터(PR)를 모두 포함할 수 있다.
소자 데이터(DV)는 반도체 소자의 구조 및 동작 조건을 나타낼 수 있다. 예를 들어, 소자 데이터(DV)는 트랜지스터의 폭(W), 트랜지스터의 길이(L)와 같은 반도체 소자의 구조에 관한 정보를 포함할 수 있다. 또한, 소자 데이터(DV)는 트랜지스터의 동작 온도(Top), 트랜지스터의 드레인 전압(Vd), 트랜지스터의 게이트 전압(Vg), 트랜지스터의 바디 전압(Vb), 트랜지스터의 소스 전압(Vs) 등과 같은 동작 조건에 관한 정보를 포함할 수 있다.
공정 데이터(PR)는 반도체 소자의 제조 공정의 조건을 나타낼 수 있다. 예를 들어, 공정 데이터(PR)는 이온-임플랜트 공정의 도펀트의 종류(Dk), 도펀트의 농도(Dd), 액티베이션 온도(Tact), 게이트 산화막의 두께(tOG), 트랜지스터의 게이트 구조물 중 하나인 스페이서의 두께(tSP) 등을 포함할 수 있다.
딥 러닝 모델의 출력 데이터(Y)는 도 9에 도시된 바와 같이 예측 데이터(PD)를 포함할 수 있다. 실시예들에 따라서, 도 15을 참조하여 후술하는 바와 같이 딥 러닝 모델의 출력 데이터(Y)는 예측 데이터(PD) 및 불확실성 데이터(UC)를 포함할 수 있다.
예측 데이터(PD)는 반도체 소자의 전기적 특성을 나타낼 수 있다. 예를 들어, 예측 데이터(PD)는 트랜지스터의 문턱 전압(Vt), 트랜지스터의 이득(G), 트랜지스터의 파괴(breakdown) 전압(Vbk), 트랜지스터의 드레인 전류(Id) 등을 포함할 수 있다.
불확실성 데이터(UC)는 예측 데이터(PD)의 불확실성을 나타낼 수 있다. 불확실성 데이터(UC)는 모델 불확실성 값(Um) 및/또는 데이터 불확실성 값(Ud)를 포함할 수 있다. 후술하는 바와 같이, 모델 불확실성 값(Um)은 기본 트레이닝 데이터의 부족에 기인한 예측 데이터(PD)의 불확실성을 나타내고, 데이터 불확실성 값(Ud)은 기본 트레이닝 데이터의 노이즈에 기인한 예측 데이터(PD)의 불확실성을 나타낼 수 있다.
도 11은 TCAD 시뮬레이터의 시뮬레이션 결과 데이터 및 학습된 딥 러닝 모델의 예측 데이터의 일 예를 나타내는 도면이다.
도 11은 반도체 소자가 트랜지스터인 경우에 대하여 입력 데이터의 값들 중에서 트랜지스터의 게이트 전압(Vg)의 변화에 따른 트랜지스터의 드레인 전류(Id)를 나타낸다. 트랜지스터의 게이트 전압(Vg)을 제외한 입력 데이터의 다른 값들은 고정된 값을 갖는 경우를 나타낸다. 트랜지스터의 드레인 전류(Id)는 트랜지스터의 전기적 특성의 일 예에 해당한다. 도 11에서 가로축은 트랜지스터의 게이트 전압(Vg)을 볼트(V) 단위로 나타내고 세로축은 드레인 전류(Id)를 암페어(A) 단위로 나타낸다.
딥 러닝 모델의 학습이 진행될수록 딥 러닝 모델의 출력인 예측 데이터(PD)는 TCAD 시뮬레이터의 시뮬레이션 결과 데이터(SR)에 수렴하게 된다. TCAD 시뮬레이터의 시뮬레이션 결과 데이터(SR) 및 딥 러닝 모델의 예측 데이터(PD)의 차이에 기초하여 딥 러닝 모델의 학습 종료를 결정할 수 있다. 즉, 예측 데이터(PD)가 시뮬레이션 결과 데이터(SR)에 충분히 수렴하였다고 판단되는 경우 딥 러닝 모델의 학습을 종료하고 학습된 딥 러닝 모델을 새로운 반도체 제품의 설계 및 제조를 위해 제공할 수 있다.
도 12는 시뮬레이션 결과 데이터 및 예측 데이터의 평균 제곱근 오차를 나타내는 도면이다.
도 12에서 가로축은 TCAD 시뮬레이터의 시뮬레이션 결과 데이터(SR)를 나타내고 세로축은 딥 러닝 모델의 예측 데이터(PD)를 나타낸다.
도 12를 참조하면, 입력 데이터의 복수의 값들에 대하여 TCAD 시뮬레이터의 시뮬레이션 결과 데이터(SR) 및 딥 러닝 모델의 예측 데이터의 평균 제곱근 오차(RMSE, Root Mean Square Error)를 수학식 1과 같이 계산할 수 있다.
[수학식 1]
RSME=[SUM(Si-Pi)2 ]1/2/n
수학식 1에서 Si 및 Pi 는 동일한 입력 데이터(i)에 대한 시뮬레이션 결과 데이터(SR)의 값 및 예측 데이터(PD)의 값을 나타내고, SUM은 입력 데이터들의 서로 다른 n개의 값들에 상응하는 합을 나타낸다. 딥 러닝 모델이 TCAD 시뮬레이터와 동일하게 학습될수록 평균 제곱근 오차(RMSE)는 0으로 수렴한다.
이와 같은 평균 제곱근 오차(RMSE)를 기준 값과 비교하고, 평균 제곱근 오차(RMSE)가 상기 기준 값 이하인 경우 딥 러닝 모델의 학습을 종료할 수 있다. 상기 기준 값을 작게 설정할수록 기본 트레이닝 데이터의 양 및 학습 시간이 증가될 수 있으나, 학습된 딥 러닝 모델의 예측 성능이 향상될 수 있다.
도 13은 본 발명의 실시예들에 따른 반도체 소자의 특성 예측 방법을 나타내는 흐름도이다. 도 13의 반도체 소자의 특성 예측 방법은 컴퓨터로 판독 가능한 기록 매체에 저장되는 프로그램 코드를 적어도 하나의 프로세서에 의해 실행하여 수행될 수 있다.
도 13을 참조하면, 기술 컴퓨터 보조 설계(TCAD, Technology Computer Aided Design) 시뮬레이터를 이용하여 공정 데이터, 소자 데이터 및 시뮬레이션 결과 데이터의 서로 다른 조합들에 상응하는 기본 트레이닝 데이터를 제공한다(S101).
도 7 및 8을 참조하여 전술한 바와 같이, 상기 기본 트레이닝 데이터들은 기존의 반도체 제품들에 상응한다. 도 9를 참조하여 전술한 바와 같이, TCAD 시뮬레이터는 입력 데이터에 기초한 시뮬레이션을 수행하여 상기 입력 데이터에 상응하는 반도체 소자의 특성을 나타내는 시뮬레이션 결과 데이터를 제공할 수 있다. 도 10을 참조하여 전술한 바와 같이, 상기 입력 데이터는 소자 데이터 및 공정 데이터를 포함할 수 있다. 상기 소자 데이터는 상기 반도체 소자의 구조 및 동작 조건을 나타내고, 상기 공정 데이터는 상기 반도체 제품의 제조 공정의 조건을 나타낼 수 있다.
상기 기본 트레이닝 데이터에 기초하여 상기 반도체 소자의 특성을 나타내는 예측 데이터 및 상기 예측 데이터의 불확실성을 나타내는 불확실성 데이터를 출력하는 딥 러닝 모델을 학습시킨다(S201). 상기 시뮬레이션 결과 데이터 및 상기 예측 데이터는 상기 반도체 소자의 전기적 특성을 나타낼 수 있다.
상기 딥 러닝 모델 및 타겟 반도체 제품에 상응하는 상기 입력 데이터에 기초하여 상기 타겟 반도체 제품에 포함되는 반도체 소자의 특성을 나타내는 타겟 예측 데이터를 생성한다(S301).
도 7 및 8을 참조하여 전술한 바와 같이, 상기 타겟 반도체 제품은, 상기 기본 트레이닝 데이터들에 상응하는 상기 기존의 반도체 제품들에 포함되지 않는 새로운 반도체 제품에 해당한다.
상기 불확실성 데이터에 기초하여 상기 딥 러닝 모델을 재학습시킨다(S401).
일 실시예에서, 도 16을 참조하여 후술하는 바와 같이, 상기 기본 트레이닝 데이터에 의해 학습된 딥 러닝 모델을 상기 모델 불확실성에 기초하여 추가적으로 학습시킬 수 있다.
이와 같이, 본 발명의 실시예들에 따른 반도체 소자의 특성 예측 방법 및 컴퓨팅 장치는 기존의 반도체 제품들에 대한 TCAD 시뮬레이터를 이용하여 공정 데이터, 소자 데이터 및 시뮬레이션 결과 데이터의 조합에 상응하는 기본 트레이닝 데이터를 생성하고 상기 기본 트레이닝 데이터에 기초하여 딥 러닝 모델을 학습시킴으로써 새로운 반도체 제품에 포함되는 반도체 소자의 특성을 효율적으로 예측할 수 있다.
또한, 본 발명의 실시예들에 따른 반도체 소자의 특성 예측 방법 및 컴퓨팅 장치는 반도체 소자의 특성을 나타내는 예측 데이터와 함께 상기 예측 데이터의 불확실성을 나타내는 불확실성 데이터를 출력하도록 딥 러닝 모델을 학습시키고 상기 불확실성 데이터에 기초하여 상기 딥 러닝 모델을 재학습시킴으로써 반도체 소자의 특성을 정확하게 예측할 수 있는 딥 러닝 모델을 제공할 수 있다.
상기 딥 러닝 모델의 향상된 예측 성능을 통하여 상기 반도체 소자를 포함하는 반도체 제품의 설계 및 제조의 비용 및 시간을 감소하고 반도체 제품의 성능을 향상시킬 수 있다.
도 14는 본 발명의 실시예들에 따른 반도체 소자의 특성 예측 방법에서의 재학습의 기준이 되는 불확실성의 유형을 설명하기 위한 도면이다.
도 14에서, 가로축은 딥 러닝 모델의 입력 데이터를 나타내고 세로축은 딥 러닝 모델에서 출력되는 예측 데이터를 나타낸다. 도 14에는 딥 러닝 모델에 의해 제공되는 예측 데이터의 예시적인 분포가 도시되어 있다. 예측 데이터의 분포에 따라서, 입력 데이터는 제1 내지 제5 데이터 범위들(RG1~RG5)로 구분될 수 있다.
예를 들어, 반도체 소자의 특성을 나타내는 예측 데이터는 입력 데이터에 대하여 선형적으로 증가할 수 있다. 이 경우 이상적인 딥 러닝 모델은 도 14의 일정한 기울기를 갖는 점선과 일치하는 분포를 가질 것이다.
제1 데이터 범위(RG1)에서는 예측 데이터가 비교적 큰 산포를 갖는다. 반면에 제5 데이터 범위(RG5)에서는 예측 데이터가 상대적으로 작은 산포를 갖는다.
예측 데이터의 큰 산포는 트레이닝 데이터의 노이즈에 기인하며, 이와 같이 트레이닝 데이터의 노이즈에 기인한 불확실성을 데이터 불확실성(data uncertainty) 또는 우연적 불확실성(aleatoric uncertainty)라 칭할 수 있다.
한편, 제2 및 제4 데이터 범위들(RG2, RG4)에서와 같이, 트레이닝 데이터의 부족에 기인한 예측 데이터의 불확실성을 모델 불확실성(model uncertainty) 또는 인식적 불확실성(epistemic uncertainty)라 칭할 수 있다.
일 실시예에서, 딥 러닝 모델에서 출력되는 불확실성 데이터는 기본 트레이닝 데이터의 부족에 기인한 예측 데이터의 불확실성, 즉 모델 불확실성을 나타내는 모델 불확실성 값을 포함할 수 있다. 이 경우, 도 16을 참조하여 후술하는 바와 같이, 상기 기본 트레이닝 데이터에 의해 학습된 딥 러닝 모델을 상기 모델 불확실성에 기초하여 추가적으로 학습시킬 수 있다.
본 발명의 실시예들은 기존의 TCAD 시뮬레이터를 대체하기 위한 학습된 딥 러닝 모델을 제공하는 것이다. 즉, 기존의 TCAD 시뮬레이터는 충분히 신뢰할 수 있는 시뮬레이션 결과 데이터를 제공하는 것을 전제로 한다. 따라서, 상기 기본 트레이닝 데이터의 노이즈에 기인한 상기 예측 데이터의 불확실성, 즉 데이터 불확실성을 나타내는 데이터 불확실성 값은 고려되지 않을 수 있다.
딥 러닝 모델은 모델 불확실성을 정량화(quantification)하여 모델 불확실성 값을 출력하도록 구현될 수 있다.
일 실시예에서, 딥 러닝 모델은 베이지안 신경망(BNN, Bayesian Neural Network)을 포함할 수 있다. 딥 러닝 모델은 몬테 카를로 드롭아웃(Monter-Carlo Droupout) 기법, 심층 앙상블(Deep Ensemble) 기법, 분위 회귀분석(quantile regression) 기법, 가우션 프로세스 추론(Gaussian Process Inference) 기법 등 또는 이들의 조합을 이용하여 불확실성을 정량화할 수 있다.
도 15는 본 발명의 실시예들에 따른 반도체 소자의 특성 예측 방법을 수행하는 딥 러닝 모델의 일 실시예를 나타내는 도면이다. 도 15에는 도시의 편의상 딥 러닝 모델의 구체적인 구성의 도시를 생략하고 입력 데이터(X)를 수신하는 입력 레이어(IL) 및 출력 데이터(Y)를 제공하는 출력 레이어(Y)만이 도시되어 있다.
도 9를 참조하여 전술한 바와 같이, 제품별/세대별로 소자 모델을 개발하기 위해서는 TCAD 시뮬레이터를 활용하여 각각의 데이터베이스를 구축하여 모델을 개발해야 하며, 이로 인한 개발 TAT가 길다는 단점이 있다. 특히 TCAD 시뮬레이터를 통해 소자 특성을 예측하는 것은 TCAD 시뮬레이터의 특성상 시간이 오래 걸리며 이는 모델 개발의 병목(bottleneck)이 된다.
따라서 본 발명은 기존 기술들의 한계점을 해결하고자 기존에 축적된 TCAD 시뮬레이터를 통해 얻어진 기존의 반도체 제품들에 대한 입력 및 출력 정보를 이용하여 통합 데이터베이스를 구축하고, 상기 통합 데이터베이스에 기초하여 TCAD 시뮬레이터를 딥 러닝 모델로 대체하는 것이다. TCAD 시뮬레이터를 딥 러닝 모델로 대체함으로써 실시간으로 반도체 소자의 특성을 예측하고 새로운 반도체 제품의 개발을 위한 TAT를 현저히 감소할 수 있다.
도 15를 참조하면, TCAD 시뮬레이터를 대체할 수 있는 딥 러닝 모델(DLM2)을 생성할 수 있다.
복수의 기존 반도체 제품들에 해당하는 공정 데이터(PR) 및 소자 데이터(DV)에 상응하는 시뮬레이션 결과 데이터(SR)에 기초하여 기본 트레이닝 데이터(TRD)를 생성할 수 있다. 기본 트레이닝 데이터(TRD)는 공정 데이터(PR), 소자 데이터(DV) 및 시뮬레이션 결과 데이터(SR)의 조합에 상응한다. 서로 다른 공정 데이터(PR) 및 소자 데이터(DV)의 값들에 기초하여 서로 다른 조합들에 상응하는 복수의 기본 트레이닝 데이터들(TRD)을 생성할 수 있다.
이 경우, 딥 러닝 모델(DLM2)의 입력 데이터(X)는 공정 데이터(PR) 및 소자 데이터(DV)를 모두 포함할 수 있다. 출력 데이터(Y)는 예측 데이터(PD) 및 예측 데이터(PD)의 불확실성을 나타내는 불확실성 데이터(UC)를 포함할 수 있다. 기본 트레이닝 데이터(TRD)의 시뮬레이션 결과 데이터(SR)를 공정 데이터(PR) 및 소자 데이터(DV)의 입력에 대한 예측 데이터(PD)의 정답으로 이용하여 딥 러닝 모델(DLM2)의 교사 학습(supervised learning)이 수행될 수 있다.
도 16은 본 발명의 실시예들에 따른 반도체 소자의 특성 예측 방법에 포함되는 모델 불확실성 값에 기초한 재학습 방법의 일 실시예를 나타내는 흐름도이고, 도 17은 본 발명의 실시예들에 따른 반도체 소자의 특성 예측 방법에서의 추가 데이터 범위를 나타내는 도면이다.
도 16에는 기본 트레이닝 데이터에 의해 학습된 딥 러닝 모델을 모델 불확실성에 기초하여 추가적으로 학습시키는 과정이 도시되어 있다.
도 2 및 16을 참조하면, 프로세서들(110) 중 적어도 하나에 의해 실행되는 트레이닝 제어 모듈(240)은, 모델 불확실성 값을 모델 기준 값과 비교한다(S311). 전술한 바와 같이, 모델 불확실성 값은 기본 트레이닝 데이터의 부족에 기인한 예측 데이터의 불확실성을 나타낸다. 모델 기준 값은 구현하고자 하는 딥 러닝 모델의 목표 성능에 따라서 적절한 값으로 설정될 수 있다.
트레이닝 제어 모듈(240)은 상기 모델 불확실성 값이 상기 모델 기준 값보다 큰 경우, TCAD 시뮬레이터를 이용하여 기본 트레이닝 데이터와 다른 추가 트레이닝 데이터를 생성한다(S312).
트레이닝 제어 모듈(240)은 상기 추가 트레이닝 데이터에 기초하여 상기 딥 러닝 모델을 재학습시킨다(S313). 트레이닝 제어 모듈(240)은 기본 트레이닝 데이터에 의해 학습된 딥 러닝 모델을 초기화하지 않고 상기 추가 트레이닝 데이터에 기초하여 추가적으로 학습시킬 수 있다.
도 17에는 기본 트레이닝 데이터에 의해 학습된 딥 러닝 모델에서 제공되는 모델 불확실성 값의 분포의 일 예가 도시되어 있다. 도 17에서, 가로축들은 트랜지스터의 길이(L) 및 폭(W)을 나타내고 세로축은 모델 불확실성 값(Um)을 나타낸다.
트레이닝 제어 모듈(240)은 모델 불확실성 값의 분포에 기초하여 모델 불확실성 값(Um)이 모델 기준 값보다 큰 소자 데이터(예를 들어, 트랜지스터의 길이(L) 및 폭(W))의 범위를 나타내는 추가 데이터 범위(RGm)를 결정할 수 있다. 트레이닝 제어 모듈(240)은 TCAD 시뮬레이터를 이용하여 추가 트레이닝 데이터가 추가 데이터 범위(RGm)에 속하는 소자 데이터 및 시뮬레이션 결과 데이터의 조합에 상응하도록 추가 트레이닝 데이터를 생성할 수 있다.
이상 설명한 바와 같이, 본 발명의 실시예들에 따른 반도체 소자의 특성 예측 방법 및 컴퓨팅 장치는 기존의 반도체 제품들에 TCAD 시뮬레이터를 이용하여 공정 데이터, 소자 데이터 및 시뮬레이션 결과 데이터의 조합에 상응하는 기본 트레이닝 데이터를 생성하고 상기 기본 트레이닝 데이터에 기초하여 딥 러닝 모델을 학습시킴으로써 새로운 반도체 제품에 포함되는 반도체 소자의 특성을 효율적으로 예측할 수 있다.
또한, 본 발명의 실시예들에 따른 반도체 소자의 특성 예측 방법 및 컴퓨팅 장치는 반도체 소자의 특성을 나타내는 예측 데이터와 함께 상기 예측 데이터의 불확실성을 나타내는 불확실성 데이터를 출력하도록 딥 러닝 모델을 학습시키고 상기 불확실성 데이터에 기초하여 상기 딥 러닝 모델을 재학습시킴으로써 반도체 소자의 특성을 정확하게 예측할 수 있는 딥 러닝 모델을 제공할 수 있다.
상기 딥 러닝 모델의 향상된 예측 성능을 통하여 상기 반도체 소자를 포함하는 반도체 제품의 설계 및 제조의 비용 및 시간을 감소하고 반도체 제품의 성능을 향상시킬 수 있다.
해당 기술 분야의 숙련된 당업자는 본 발명의 실시예들이 시스템, 방법, 컴퓨터로 판독 가능한 매체에 저장된 컴퓨터로 판독 가능한 프로그램 코드를 포함하는 제품 등의 형태로 구현될 수 있음을 이해할 것이다. 상기 컴퓨터로 판독 가능한 프로그램 코드는 다양한 컴퓨터 또는 다른 데이터 처리 장치의 프로세서로 제공될 수 있다. 상기 컴퓨터로 판독 가능한 매체는 컴퓨터로 판독 가능한 신호 매체 또는 컴퓨터로 판독 가능한 기록 매체일 수 있다. 상기 컴퓨터로 판독 가능한 기록 매체는 명령어 실행 시스템, 장비 또는 장치 내에 또는 이들과 접속되어 프로그램 코드 저장하거나 포함할 수 있는 임의의 유형적인 매체일 수 있다.
본 개시에서 '모듈'이라는 용어는 소프트웨어 또는 FPGA(Field Programmable Gate Array)또는 ASIC(Application Specific Integrated Circuit)과 같은 하드웨어 구성요소를 의미하며, '모듈'은 어떤 역할들을 수행한다. 그렇지만 '모듈'은 소프트웨어 또는 하드웨어에 한정되는 의미는 아니다. '모듈'은 어드레싱 할 수 있는 저장 매체에 있도록 구성될 수도 있고, 하나 또는 그 이상의 프로세서들을 재생시키도록 구성될 수도 있다. 따라서, 일 예로서 '모듈'은 소프트웨어 구성요소들, 객체지향 소프트웨어 구성요소들, 클래스 구성요소들 및 태스크 구성요소들과 같은 구성요소들과, 프로세스들, 함수들, 속성들, 프로시저들, 서브루틴들, 프로그램 코드의 세그먼트들, 드라이버들, 펌웨어, 마이크로코드, 회로, 데이터, 데이터베이스, 데이터 구조들, 테이블들, 어레이들, 및 변수들을 포함할 수 있다. 구성요소들과 '모듈'들 안에서 제공되는 기능은 더 작은 수의 구성요소들 및 '모듈'들로 결합되거나 추가적인 구성요소들과 '모듈'들로 더 분리될 수 있다.
본 발명의 실시예들은 반도체 집적 회로의 제조 및 설계에 유용하게 이용될 수 있다. 특히 본 발명의 실시예들은 메모리 카드, 솔리드 스테이트 드라이브(Solid State Drive; SSD), 임베디드 멀티미디어 카드(eMMC, embedded multimedia card), 유니버셜 플래시 스토리지(UFS, universal flash storage), 컴퓨터(computer), 노트북(laptop), 핸드폰(cellular phone), 스마트폰(smart phone), MP3 플레이어, 피디에이(Personal Digital Assistants; PDA), 피엠피(Portable Multimedia Player; PMP), 디지털 TV, 디지털 카메라, 포터블 게임 콘솔(portable game console), 네비게이션(navigation) 기기, 웨어러블(wearable) 기기, IoT(internet of things;) 기기, IoE(internet of everything:) 기기, e-북(e-book), VR(virtual reality) 기기, AR(augmented reality) 기기, 서버 시스템, 자율 주행 시스템 등과 같은 전자 기기에 더욱 유용하게 적용될 수 있다.
상기에서는 본 발명이 바람직한 실시예를 참조하여 설명하였지만, 해당 기술분야의 숙련된 당업자는 하기의 청구범위에 기재된 본 발명의 사상 및 영역으로부터 벗어나지 않는 범위 내에서 본 발명을 다양하게 수정 및 변경시킬 수 있음을 이해할 것이다.

Claims (10)

  1. 컴퓨터로 판독 가능한 기록 매체에 저장되는 프로그램 코드를 적어도 하나의 프로세서에 의해 실행하여 수행되는 반도체 소자의 특성 예측 방법으로서,
    입력 데이터에 기초한 시뮬레이션을 수행하여 상기 입력 데이터에 상응하는 반도체 소자의 특성을 나타내는 시뮬레이션 결과 데이터를 출력하는 기술 컴퓨터 보조 설계(TCAD, Technology Computer Aided Design) 시뮬레이터를 이용하여 기존의 반도체 제품들에 대한 상기 입력 데이터 및 상기 시뮬레이션 결과 데이터의 서로 다른 조합들에 상응하는 기본 트레이닝 데이터들을 제공하는 단계;
    상기 기본 트레이닝 데이터들에 기초하여 상기 반도체 소자의 특성을 나타내는 예측 데이터를 출력하는 딥 러닝 모델을 학습시키는 단계; 및
    상기 딥 러닝 모델 및 타겟 반도체 제품에 상응하는 상기 입력 데이터에 기초하여 상기 타겟 반도체 제품에 포함되는 반도체 소자의 특성을 나타내는 타겟 예측 데이터를 생성하는 단계를 포함하는 반도체 소자의 특성 예측 방법.
  2. 제1 항에 있어서,
    상기 타겟 반도체 제품은 상기 기존의 반도체 제품들에 포함되지 않는 새로운 반도체 제품인 것을 특징으로 하는 반도체 소자의 특성 예측 방법.
  3. 제1 항에 있어서,
    상기 입력 데이터는 반도체 제품의 제조 공정을 나타내는 공정 타입 및 상기 반도체 제품이 속하는 제품 그룹의 공정-그룹 조합에 따라서 결정되고,
    상기 타겟 반도체 제품의 공정-그룹 조합은 상기 복수의 반도체 제품들의 공정-제품 조합들에 포함되지 않는 새로운 조합인 것을 특징으로 하는 반도체 소자의 특성 예측 방법.
  4. 제1 항에 있어서,
    상기 기존의 반도체 제품들 및 상기 타겟 반도체 제품은 메모리 장치인 것을 특징으로 하는 반도체 소자의 특성 예측 방법.
  5. 제1 항에 있어서,
    상기 입력 데이터는,
    반도체 제품의 제조 공정의 조건을 나타내는 공정 데이터; 및
    상기 반도체 소자의 구조 및 동작 조건을 나타내는 소자 데이터를 포함하는 것을 특징으로 하는 반도체 소자의 특성 예측 방법.
  6. 제5 항에 있어서,
    상기 TCAD 시뮬레이터의 상기 입력 데이터는 상기 공정 데이터 및 상기 소자 데이터를 모두 포함하고,
    상기 딥 러닝 모델의 상기 입력 데이터는 상기 공정 데이터 및 상기 소자 데이터를 모두 포함하는 것을 특징으로 하는 반도체 소자의 특성 예측 방법.
  7. 제1 항에 있어서,
    상기 딥 러닝 모델을 학습시키는 단계는,
    상기 입력 데이터의 복수의 값들에 대하여 상기 TCAD 시뮬레이터의 상기 시뮬레이션 결과 데이터 및 상기 딥 러닝 모델의 상기 예측 데이터의 평균 제곱근 오차(RMSE, Root Mean Square Error)를 계산하는 단계;
    상기 평균 제곱근 오차를 기준 값과 비교하는 단계; 및
    상기 평균 제곱근 오차가 상기 기준 값 이하인 경우 상기 딥 러닝 모델의 학습을 종료하는 단계를 포함하는 것을 특징으로 하는 반도체 소자의 특성 예측 방법.
  8. 제1 항에 있어서,
    상기 예측 데이터의 불확실성을 나타내는 불확실성 데이터를 더 출력하도록 상기 딥 러닝 모델을 학습시키고,
    상기 반도체 소자의 특성 예측 방법은,
    상기 불확실성 데이터에 기초하여 상기 딥 러닝 모델을 재학습시키는 단계를 더 포함하는 것을 특징으로 하는 반도체 소자의 특성 예측 방법.
  9. 제8 항에 있어서,
    상기 불확실성 데이터는 상기 기본 트레이닝 데이터의 부족에 기인한 상기 예측 데이터의 불확실성을 나타내는 모델 불확실성 값을 포함하고,
    상기 딥 러닝 모델을 재학습시키는 단계는,
    상기 모델 불확실성 값을 모델 기준 값과 비교하는 단계;
    상기 모델 불확실성 값이 상기 모델 기준 값보다 큰 경우, 상기 TCAD 시뮬레이터를 이용하여 상기 복수의 기본 트레이닝 데이터들과 다른 추가 트레이닝 데이터들을 생성하는 단계; 및
    상기 추가 트레이닝 데이터들에 기초하여 상기 딥 러닝 모델을 재학습시키는 단계를 포함하는 것을 특징으로 하는 반도체 소자의 특성 예측 방법.
  10. 적어도 하나의 프로세서; 및
    딥 러닝 모델을 생성하도록 상기 적어도 하나의 프로세서에 의해 실행되는 프로그램 코드 및 입력 데이터에 기초한 시뮬레이션을 수행하여 상기 입력 데이터에 상응하는 반도체 소자의 특성을 나타내는 시뮬레이션 결과 데이터를 출력하는 기술 컴퓨터 보조 설계(TCAD, Technology Computer Aided Design) 시뮬레이터를 이용하여 제공되는 기존의 반도체 제품들에 대한 상기 입력 데이터 및 상기 시뮬레이션 결과 데이터의 서로 다른 조합들에 상응하는 기본 트레이닝 데이터들을 저장하는 컴퓨터로 판독 가능한 기록 매체를 포함하고,
    상기 적어도 하나의 프로세서는 상기 프로그램 코드를 실행하여,
    상기 기본 트레이닝 데이터에 기초하여 상기 반도체 소자의 특성을 나타내는 예측 데이터를 출력하는 딥 러닝 모델을 학습시키고,
    상기 딥 러닝 모델, 타겟 반도체 제품에 상응하는 상기 입력 데이터에 기초하여 상기 타겟 반도체 제품에 포함되는 반도체 소자의 특성을 나타내는 타겟 예측 데이터를 생성하는 컴퓨팅 장치.
KR1020210135526A 2021-10-13 2021-10-13 딥 러닝 기반의 반도체 소자의 특성 예측 방법 및 이를 수행하는 컴퓨팅 장치 KR20230052450A (ko)

Priority Applications (3)

Application Number Priority Date Filing Date Title
KR1020210135526A KR20230052450A (ko) 2021-10-13 2021-10-13 딥 러닝 기반의 반도체 소자의 특성 예측 방법 및 이를 수행하는 컴퓨팅 장치
US17/724,009 US20230113207A1 (en) 2021-10-13 2022-04-19 Method of predicting characteristic of semiconductor device and computing device performing the same
CN202210866060.6A CN115983166A (zh) 2021-10-13 2022-07-22 预测半导体器件的特性的方法和执行该方法的计算装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020210135526A KR20230052450A (ko) 2021-10-13 2021-10-13 딥 러닝 기반의 반도체 소자의 특성 예측 방법 및 이를 수행하는 컴퓨팅 장치

Publications (1)

Publication Number Publication Date
KR20230052450A true KR20230052450A (ko) 2023-04-20

Family

ID=85798045

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020210135526A KR20230052450A (ko) 2021-10-13 2021-10-13 딥 러닝 기반의 반도체 소자의 특성 예측 방법 및 이를 수행하는 컴퓨팅 장치

Country Status (3)

Country Link
US (1) US20230113207A1 (ko)
KR (1) KR20230052450A (ko)
CN (1) CN115983166A (ko)

Also Published As

Publication number Publication date
US20230113207A1 (en) 2023-04-13
CN115983166A (zh) 2023-04-18

Similar Documents

Publication Publication Date Title
US11556690B2 (en) Generating integrated circuit placements using neural networks
CN111797581A (zh) 用于生成晶体管的模型的系统和方法
US11625855B2 (en) Method and system for updating map for pose estimation based on images
US20210295167A1 (en) Generative networks for physics based simulations
JP5044635B2 (ja) 回路動作の最悪条件決定システム、方法およびプログラム
US20190065962A1 (en) Systems And Methods For Determining Circuit-Level Effects On Classifier Accuracy
US11697205B2 (en) Determining control policies for robots with noise-tolerant structured exploration
CN116324795A (zh) 使用网格表示和图形神经网络模拟物理环境
KR20230057673A (ko) 딥 러닝 기반의 반도체 소자의 특성 예측 방법 및 이를 수행하는 컴퓨팅 장치
KR20230027585A (ko) 딥 러닝 기반의 반도체 소자의 특성 예측 방법 및 이를 수행하는 컴퓨팅 장치
JP2023552048A (ja) ハードウェアアクセラレータのためのニューラルアーキテクチャスケーリング
KR20230052450A (ko) 딥 러닝 기반의 반도체 소자의 특성 예측 방법 및 이를 수행하는 컴퓨팅 장치
US10339240B2 (en) Adaptive high sigma yield prediction
CN111527502B (zh) 用于部分数字再训练的系统和方法
KR20230092670A (ko) 소자 모델의 생성 방법 및 이를 수행하는 컴퓨팅 장치
KR20230027588A (ko) 딥 러닝 모델의 생성 방법 및 이를 수행하는 컴퓨팅 장치 장치
Souza et al. A Geometric Surrogate for Simulation Calibration
EP4310720A1 (en) Modeling method of neural network for simulation in semiconductor design process, and simulation method in semiconductor design process using the same
CN116415409A (zh) 生成装置模型的方法和执行其的计算装置
JP7331877B2 (ja) システム計算装置、及びシステム計算プログラム
US11842130B1 (en) Model-based simulation result predictor for circuit design
US10650581B1 (en) Sketch-based 3D fluid volume generation using a machine learning system
US20240142960A1 (en) Automated simulation method based on database in semiconductor design process, automated simulation generation device and semiconductor design automation system performing the same, and manufacturing method of semiconductor device using the same
US20240095424A1 (en) Alignment Cost for Integrated Circuit Placement
Rathod et al. Parameter Extraction of PSP MOSFET Model Using Particle Swarm Optimization-SoC Approach