KR20230031753A - 표적 산출물의 생성을 위한 합성 조건을 최적화하는 방법 및 장치 - Google Patents

표적 산출물의 생성을 위한 합성 조건을 최적화하는 방법 및 장치 Download PDF

Info

Publication number
KR20230031753A
KR20230031753A KR1020210155792A KR20210155792A KR20230031753A KR 20230031753 A KR20230031753 A KR 20230031753A KR 1020210155792 A KR1020210155792 A KR 1020210155792A KR 20210155792 A KR20210155792 A KR 20210155792A KR 20230031753 A KR20230031753 A KR 20230031753A
Authority
KR
South Korea
Prior art keywords
combinations
conditions
yield
synthesis conditions
combination
Prior art date
Application number
KR1020210155792A
Other languages
English (en)
Inventor
권영천
강석호
김진우
이동선
최윤석
Original Assignee
삼성전자주식회사
성균관대학교산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 삼성전자주식회사, 성균관대학교산학협력단 filed Critical 삼성전자주식회사
Priority to US17/745,374 priority Critical patent/US20230063171A1/en
Priority to EP22181239.9A priority patent/EP4141876A1/en
Priority to CN202210889560.1A priority patent/CN115730677A/zh
Publication of KR20230031753A publication Critical patent/KR20230031753A/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Artificial Intelligence (AREA)
  • Medical Informatics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Computational Linguistics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

일 실시예에 따르면, 합성 조건을 최적화하는 방법은 반응물의 구조 정보 및 반응물에 의해 합성할 표적 산출물의 구조 정보를 포함하는 그래프 형태의 표현자를 수신하고, 신경망 기반의 예측 모델에 표현자를 인가함으로써 표적 산출물의 생성을 위한 합성 조건들의 조합들을 결정하고, 조합들의 수율에 대응하는 제1 신뢰도에 기초하여 조합들 중 하나 이상의 초기 조건 조합을 선택하고, 초기 조건 조합에 의한 실험 결과의 실측 수율을 기초로 예측 모델을 업데이트하고, 업데이트된 예측 모델에 기초하여 조합들 간의 우선 순위를 결정하며, 우선 순위에 따라 다음 합성 조건들의 조합들을 결정합니다.

Description

표적 산출물의 생성을 위한 합성 조건을 최적화하는 방법 및 장치{METHOD AND APPARATUS OF OPTIMIZING SYNTHETIC CONDITIONS FOR GENERATION OF TARGET PRODUCTS}
아래의 개시는 표적 산출물의 생성을 위한 합성 조건을 최적화하는 방법 및 장치에 관한 것이다.
신경망(neural network)은 생물학적 뇌를 모델링한 컴퓨팅 아키텍쳐(computing architecture)를 참조할 수 있다. 신경망이 발전함에 따라, 다양한 분야의 전자 장치들이 신경망에 기반한 모델에 의해 입력 데이터를 분석하고, 유효한 정보를 추출 및/또는 출력할 수 있다.
예를 들어, 합성하고자 하는 표적 산출물을 합성하기 위해 많은 인력들에 의해 많은 횟수의 실험들이 수반되어야 하고, 이러한 실험 결과를 통해 획득한 합성 조건에 대한 안정성 또한 용이하게 파악하기 어려운 실정이다. 따라서, 신경망에 기반한 모델에 의해 합성 실험의 횟수를 줄이고, 높은 수율로 표적 산출물을 획득할 수 있는 기술이 요구된다.
일 실시예에 따르면, 합성 조건을 최적화하는 방법은 하나 이상의 반응물의 구조 정보 및 상기 반응물에 의해 합성할 표적 산출물의 구조 정보 중 적어도 하나를 포함하는 그래프 형태의 표현자를 수신하는 단계, 신경망 기반의 예측 모델에 상기 표현자를 인가함으로써 상기 표적 산출물의 생성을 위한 합성 조건들의 조합들을 결정하는 단계, 상기 조합들의 수율(yield)에 대응하는 제1 신뢰도에 기초하여, 상기 조합들 중 하나 이상의 초기 조건 조합을 선택하는 단계, 상기 초기 조건 조합에 의한 실험 결과의 실측 수율을 기초로, 상기 예측 모델을 업데이트하는 단계, 상기 업데이트된 예측 모델에 기초하여 상기 조합들 간의 우선 순위를 결정하는 단계, 및 상기 우선 순위에 따라 다음 합성 조건들의 조합들을 결정하는 단계를 포함한다.
상기 초기 조건 조합을 선택하는 단계는 상기 제1 신뢰도에 기초하여, 상기 초기 조건 조합을 위한 선택 비율을 결정하는 단계, 및 상기 선택 비율에 따라 상기 초기 조건 조합을 선택하는 단계를 포함할 수 있다.
상기 선택 비율을 결정하는 단계는 상기 제1 신뢰도에 기초하여, 상기 예측 모델에 의해 예측된 합성 조건들을 상기 초기 조건 조합으로 선택하는 제1 비율 및 랜덤한 조건들을 상기 초기 조건 조합으로 선택하는 제2 비율을 포함하는 상기 선택 비율을 결정하는 단계를 포함할 수 있다.
상기 선택 비율을 결정하는 단계는 상기 제1 신뢰도가 미리 설정된 기준보다 높은 경우, 상기 제1 비율을 증가시키고, 상기 제2 비율을 감소시키는 단계, 및 상기 제1 신뢰도가 상기 미리 설정된 기준보다 낮은 경우, 상기 제2 비율을 증가시키고, 상기 제1 비율을 감소시키는 단계를 포함할 수 있다.
상기 예측 모델은 상기 조합들, 상기 조합들에 대응하는 예측 수율들, 및 상기 예측 수율들에 대응하는 제1 신뢰도 중 하나 이상을 예측하도록 학습된 신경망을 포함할 수 있다.
상기 신경망은 상기 그래프 형태의 표현자에 기초하여 상기 반응물에서 서로 인접한 원자들 간의 연관 관계에 따라 상기 조합들을 결정하는 메시지 전달 신경망(Message Passing Neural Networks, MPNN)을 포함할 수 있다.
상기 예측 모델을 업데이트하는 단계는 상기 예측 모델에 의해 결정된 합성 조건들의 조합에 대응하는 예측 수율과 상기 실측 수율 간의 비교 결과에 기초하여, 상기 예측 모델을 업데이트하는 단계를 포함할 수 있다.
상기 우선 순위를 결정하는 단계는 상기 업데이트 이전의 예측 모델에 의해 예측된 합성 조건들의 조합에 대응하는 제1 수율과 상기 업데이트된 예측 모델에 의해 예측된 합성 조건들의 조합에 대응하는 제2 수율을 비교하는 단계, 및 상기 비교 결과에 기초하여, 상기 조합들 간의 우선 순위를 결정하는 단계를 포함할 수 있다.
상기 비교 결과에 기초하여, 상기 조합들 간의 우선 순위를 결정하는 단계는 상기 제1 수율보다 상기 제2 수율이 작거나 같은 경우, 상기 제1 수율에 대응하는 제1 조합을 선순위로 결정하고, 상기 제2 수율에 대응하는 제2 조합을 후순위로 결정하는 단계, 및 상기 제1 수율보다 상기 제2 수율이 큰 경우, 상기 제2 조합을 선순위로 결정하고, 상기 제1 조합을 후순위로 결정하는 단계를 포함할 수 있다.
상기 다음 합성 조건들의 조합들을 결정하는 단계는 상기 다음 합성 조건들의 조합들에 따른 실험 결과의 실측 수율에 따라 상기 예측 모델이 업데이트 됨에 따라 상기 우선 순위를 재결정하는 단계, 상기 재결정된 우선 순위에 따라 그 다음 합성 조건들의 조합들을 결정하는 단계, 및 상기 그 다음 합성 조건들의 조합들에 따른 실험 결과의 실측 수율이 미리 설정된 목표 수율을 만족할 때까지 상기 우선 순위를 재결정하는 단계 및 상기 그 다음 합성 조건들의 조합들을 결정하는 단계를 반복적으로 수행하는 단계를 포함할 수 있다.
상기 합성 조건들은 촉매(Catalyst) 조건, 리간드(ligand) 조건, 염기(Bases) 조건, 용매(Solvents) 조건, 온도 조건, 밀도 조건, 습도 조건, 반응 시간 조건, 및 압력 조건 중 하나 이상을 포함할 수 있다.
상기 그래프 형태의 표현자는 상기 반응물의 치환기들 및 반응기들 중 하나 이상을 포함하는 합성 경로를 더 포함할 수 있다.
상기 합성 조건들의 조합들을 결정하는 단계는 상기 신경망 기반의 예측 모델에 상기 표현자를 인가함으로써 상기 반응물의 반응 방식을 만족하도록 상기 합성 조건들의 조합들을 결정하는 단계를 포함할 수 있다.
일 실시예에 따르면, 합성 조건을 최적화하는 방법은 반응물의 구조 정보, 상기 반응물에 의해 합성할 표적 산출물의 구조 정보, 및 상기 반응물의 합성 경로를 포함하는 그래프 형태의 표현자 및 상기 반응물의 반응 방식을 수신하는 단계, 신경망 기반의 예측 모델에 상기 표현자를 인가함으로써, 상기 반응 방식을 만족하는 상기 표적 산출물의 생성을 위한 합성 조건들의 조합들 및 합성 경로를 포함하는 검색 공간을 결정하는 단계, 상기 검색 공간에서 상기 조합들의 수율에 대응하는 제1 신뢰도에 기초하여, 상기 조합들 중 하나 이상의 초기 조건 조합을 샘플링하는 단계, 상기 초기 조건 조합에 의한 실험 결과의 실측 수율을 기초로, 상기 예측 모델을 업데이트하는 단계, 상기 업데이트된 예측 모델에 기초하여 상기 조합들 간의 우선 순위를 결정하는 단계, 및 상기 우선 순위에 따라 다음 합성 조건들의 조합들 및 다음 합성 경로를 포함하도록 상기 검색 공간을 재결정하는 단계를 포함한다. 이때, 상기 다음 합성 조건들의 조합들에 따른 실험 결과에 따라 상기 예측 모델이 업데이트되어 상기 우선 순위가 재결정되며, 상기 재결정된 우선 순위에 따라 그 다음 합성 조건들의 조합들을 포함하도록 상기 검색 공간이 결정된다.
상기 초기 조건 조합을 샘플링하는 단계는 상기 제1 신뢰도에 기초하여, 상기 예측 모델에 의해 예측된 합성 조건들을 상기 초기 조건 조합으로 선택하는 제1 비율 및 랜덤한 조건들을 상기 초기 조건 조합으로 선택하는 제2 비율을 포함하는 선택 비율을 결정하는 단계를 포함할 수 있다.
상기 선택 비율을 결정하는 단계는 상기 제1 신뢰도가 미리 설정된 기준보다 높은 경우, 상기 제1 비율을 증가시키고, 상기 제2 비율을 감소시키는 단계, 및 상기 제1 신뢰도가 상기 미리 설정된 기준보다 낮은 경우, 상기 제2 비율을 증가시키고, 상기 제1 비율을 감소시키는 단계를 포함할 수 있다.
상기 예측 모델은 상기 반응 방식을 만족하는, 상기 조합들, 상기 조합들에 대응하는 예측 수율들, 상기 예측 수율들에 대응하는 제1 신뢰도, 및 합성 경로 중 하나 이상을 예측하도록 학습된 신경망을 포함할 수 있다.
상기 예측 모델을 업데이트하는 단계는 상기 예측 모델에 의해 결정된 합성 조건들의 조합에 대응하는 예측 수율과 상기 초기 조건 조합에 의한 실험 결과에 따른 실측 수율(yield) 간의 비교 결과에 기초하여, 상기 예측 모델을 업데이트하는 단계를 포함할 수 있다.
상기 우선 순위를 결정하는 단계는 상기 업데이트 이전의 예측 모델에 의해 예측된 합성 조건들의 조합에 대응하는 제1 수율과 상기 업데이트된 예측 모델에 의해 예측된 합성 조건들의 조합에 대응하는 제2 수율을 비교하는 단계, 상기 제1수율보다 상기 제2 수율이 작거나 같은 경우, 상기 제1 수율에 대응하는 제1 조합을 선순위로 결정하고, 상기 제2 수율에 대응하는 제2 조합을 후순위로 결정하는 단계, 및 상기 제1 수율보다 상기 제2 수율이 큰 경우, 상기 제2 조합을 선순위로 결정하고, 상기 제1 조합을 후순위로 결정하는 단계를 포함할 수 있다.
일 실시예에 따르면, 합성 조건을 최적화하는 장치는 하나 이상의 반응물의 구조 정보 및 상기 반응물에 의해 합성할 표적 산출물의 구조 정보 중 적어도 하나를 포함하는 그래프 형태의 표현자를 수신하는 사용자 인터페이스, 적어도 하나의 프로그램이 저장된 메모리, 및 상기 적어도 하나의 프로그램을 실행함으로써 신경망을 구동하는 프로세서를 포함하고, 상기 프로세서는 상기 신경망 기반의 예측 모델에 상기 표현자를 인가함으로써 상기 표적 산출물의 생성을 위한 합성 조건들의 조합들을 결정하고, 상기 조합들의 수율에 대응하는 제1 신뢰도에 기초하여, 상기 조합들 중 하나 이상의 초기 조건 조합을 선택하고, 상기 초기 조건 조합에 의한 실험 결과의 실측 수율에 따라 상기 예측 모델을 업데이트하고, 상기 업데이트된 예측 모델에 기초하여 상기 조합들 간의 우선 순위를 결정하고, 상기 우선 순위에 따라 다음 합성 조건들의 조합들을 결정한다. 상기 프로세서는 상기 제1 신뢰도에 기초하여, 상기 초기 조건 조합을 위한 선택 비율을 결정하고, 상기 선택 비율에 따라 상기 초기 조건 조합을 선택할 수 있다.
상기 프로세서는 상기 제1 신뢰도에 기초하여, 상기 예측 모델에 의해 예측된 합성 조건들을 상기 초기 조건 조합으로 선택하는 제1 비율 및 랜덤한 조건들을 상기 초기 조건 조합으로 선택하는 제2 비율을 포함하는 상기 선택 비율을 결정할 수 있다.
상기 프로세서는 상기 제1 신뢰도가 미리 설정된 기준보다 높은 경우, 상기 제1 비율을 증가시키고, 상기 제2 비율을 감소시키며, 상기 제1 신뢰도가 상기 미리 설정된 기준보다 낮은 경우, 상기 제2 비율을 증가시키고, 상기 제1 비율을 감소시킬 수 있다.
상기 예측 모델은 상기 조합들, 상기 조합들에 대응하는 예측 수율들, 및 상기 예측 수율들에 대응하는 제1 신뢰도 중 하나 이상을 예측하도록 학습된 상기 신경망을 포함할 수 있다.
상기 신경망은 상기 그래프 형태의 표현자에 기초하여 상기 반응물에서 서로 인접한 원자들 간의 연관 관계에 따라 상기 조합들을 결정하는 메시지 전달 신경망(Message Passing Neural Networks, MPNN)을 포함할 수 있다.
상기 프로세서는 상기 예측 모델에 의해 결정된 합성 조건들의 조합에 대응하는 예측 수율과 상기 실측 수율 간의 비교 결과에 기초하여, 상기 예측 모델을 업데이트할 수 있다.
상기 프로세서는 상기 업데이트 이전의 예측 모델에 의해 예측된 합성 조건들의 조합에 대응하는 제1 수율과 상기 업데이트된 예측 모델에 의해 예측된 합성 조건들의 조합에 대응하는 제2 수율을 비교하고, 상기 비교 결과에 기초하여, 상기 조합들 간의 우선 순위를 결정할 수 있다.
상기 프로세서는 상기 1수율보다 상기 제2 수율이 작거나 같은 경우, 상기 제1 수율에 대응하는 제1 조합을 선순위로 결정하고, 상기 제2 수율에 대응하는 제2 조합을 후순위로 결정하고, 상기 제1 수율보다 상기 제2 수율이 큰 경우, 상기 제2 조합을 선순위로 결정하고, 상기 제1 조합을 후순위로 결정할 수 있다.
상기 프로세서는 상기 다음 합성 조건들의 조합들에 따른 실험 결과의 실측 수율에 따라 상기 예측 모델이 업데이트 됨에 따라 상기 우선 순위를 재결정하고, 상기 재결정된 우선 순위에 따라 그 다음 합성 조건들의 조합들을 결정하며, 상기 그 다음 합성 조건들의 조합들에 따른 실험 결과의 실측 수율이 미리 설정된 목표 수율을 만족할 때까지 상기 우선 순위를 재결정하는 동작 및 상기 그 다음 합성 조건들의 조합들을 결정하는 동작을 반복적으로 수행할 수 있다.
상기 합성 조건들은 촉매 조건, 리간드(ligand) 조건, 염기(Bases) 조건, 용매(Solvents) 조건, 온도 조건, 밀도 조건, 습도 조건, 반응 시간 조건, 및 압력 조건 중 하나 이상을 포함할 수 있다.
상기 그래프 형태의 표현자는 상기 반응물의 반응 방식을 더 포함할 수 있다.
상기 프로세서는 상기 신경망 기반의 예측 모델에 상기 표현자를 인가함으로써 상기 반응물의 반응 방식을 만족하도록 상기 합성 조건들의 조합들을 결정할 수 있다.
일 실시예에 따르면, 합성 조건을 최적화하는 장치는 반응물의 구조 정보, 상기 반응물에 의해 합성할 표적 산출물의 구조 정보, 및 상기 반응물의 치환기들 및 반응기들 중 하나 이상을 포함하는 합성 경로를 포함하는 그래프 형태의 표현자 및 상기 반응물의 반응 방식을 수신하는 사용자 인터페이스, 적어도 하나의 프로그램이 저장된 메모리, 및 상기 적어도 하나의 프로그램을 실행함으로써 신경망을 구동하는 프로세서를 포함하고, 상기 프로세서는 상기 신경망 기반의 예측 모델에 상기 표현자를 인가함으로써, 상기 반응 방식을 만족하는 상기 표적 산출물의 생성을 위한 합성 조건들의 조합들 및 합성 경로를 포함하는 검색 공간을 결정하고, 상기 검색 공간에서 상기 조합들의 수율에 대응하는 제1 신뢰도에 기초하여, 상기 조합들 중 하나 이상의 초기 조건 조합을 샘플링하고, 상기 초기 조건 조합에 의한 실험 결과의 실측 수율에 따라 상기 예측 모델을 업데이트하고, 상기 업데이트된 예측 모델에 기초하여 상기 조합들 간의 우선 순위를 결정하고, 상기 우선 순위에 따라 다음 합성 조건들의 조합들을 포함하도록 상기 검색 공간을 재결정한다. 이때, 상기 다음 합성 조건들의 조합들에 따른 실험 결과의 실측 수율에 따라 상기 예측 모델이 업데이트되어 상기 우선 순위가 재결정되며, 상기 재결정된 우선 순위에 따라 그 다음 합성 조건들의 조합들을 포함하도록 상기 검색 공간이 결정된다.
상기 예측 모델은 상기 반응 방식을 만족하는, 상기 조합들, 상기 조합들에 대응하는 예측 수율들, 상기 예측 수율들에 대응하는 제1 신뢰도, 및 합성 경로 중 하나 이상을 예측하도록 학습된 신경망을 포함할 수 있다.
도 1는 일 실시예에 따른 반응물, 표적 산출물, 합성 경로, 합성 조건들, 및 반응 방식을 설명하기 위한 도면이다.
도 2는 일 실시예에 따른 합성 조건을 최적화하는 방법을 개념적으로 설명하기 위한 도면이다.
도 3은 일 실시예에 따른 합성 조건을 최적화하는 방법을 나타낸 흐름도이다.
도 4는 일 실시예에 따라 합성 조건들의 조합들을 결정하는 방법을 설명하기 위한 도면이다.
도 5는 일 실시예에 따라 초기 조건 조합을 선택하는 방법을 설명하기 위한 도면이다.
도 6은 일 실시예에 따라 조합들의 우선 순위를 결정하는 방법을 나타낸 흐름도이다.
도 7은 일 실시예에 따라 다음 합성 조건들의 조합들을 결정하는 방법을 나타낸 흐름도이다.
도 8은 다른 실시예에 따른 합성 조건을 최적화하는 방법을 나타낸 흐름도이다.
도 9는 다른 실시예에 따른 합성 조건을 최적화하는 방법을 나타낸 흐름도이다.
도 10은 다른 실시예에 따른 합성 조건을 최적화하는 방법을 설명하기 위한 도면이다.
도 11은 일 실시예에 따른 합성 조건을 최적화하는 장치의 블록도이다.
실시예들에 대한 특정한 구조적 또는 기능적 설명들은 단지 예시를 위한 목적으로 개시된 것으로서, 다양한 형태로 변경되어 구현될 수 있다. 따라서, 실제 구현되는 형태는 개시된 특정 실시예로만 한정되는 것이 아니며, 본 명세서의 범위는 실시예들로 설명한 기술적 사상에 포함되는 변경, 균등물, 또는 대체물을 포함한다.
제1 또는 제2 등의 용어를 다양한 구성요소들을 설명하는데 사용될 수 있지만, 이런 용어들은 하나의 구성요소를 다른 구성요소로부터 구별하는 목적으로만 해석되어야 한다. 예를 들어, 제1 구성요소는 제2 구성요소로 명명될 수 있고, 유사하게 제2 구성요소는 제1 구성요소로도 명명될 수 있다.
어떤 구성요소가 다른 구성요소에 "연결되어" 있다고 언급된 때에는, 그 다른 구성요소에 직접적으로 연결되어 있거나 또는 접속되어 있을 수도 있지만, 중간에 다른 구성요소가 존재할 수도 있다고 이해되어야 할 것이다.
단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다. 본 명세서에서, "포함하다" 또는 "가지다" 등의 용어는 설명된 특징, 숫자, 단계, 단계, 구성요소, 부분품 또는 이들을 조합한 것이 존재함으로 지정하려는 것이지, 하나 또는 그 이상의 다른 특징들이나 숫자, 단계, 단계, 구성요소, 부분품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.
다르게 정의되지 않는 한, 기술적이거나 과학적인 용어를 포함해서 여기서 사용되는 모든 용어들은 해당 기술 분야에서 통상의 지식을 가진 자에 의해 일반적으로 이해되는 것과 동일한 의미를 가진다. 일반적으로 사용되는 사전에 정의되어 있는 것과 같은 용어들은 관련 기술의 문맥상 가지는 의미와 일치하는 의미를 갖는 것으로 해석되어야 하며, 본 명세서에서 명백하게 정의하지 않는 한, 이상적이거나 과도하게 형식적인 의미로 해석되지 않는다.
이하, 실시예들을 첨부된 도면들을 참조하여 상세하게 설명한다. 첨부 도면을 참조하여 설명함에 있어, 도면 부호에 관계없이 동일한 구성 요소는 동일한 참조 부호를 부여하고, 이에 대한 중복되는 설명은 생략하기로 한다.
도 1은 일 실시예에 따른 반응물, 표적 산출물, 합성 경로들, 합성 조건들 및 반응 방식을 설명하기 위한 도면이다. 도 1을 참조하면, 일 실시예에 따른 반응물들(110, 120), 표적 산출물(130), 합성 경로들(130, 140), 합성 조건들(150, 160, 170) 및 반응 방식이 도시된다.
'반응물(들)'은 화학 반응을 할 때 반응에 참여하는 물질(반응 물질)(reactants)에 해당하고, '산출물'은 화학 반응의 결과로서 생성되는 물질에 해당할 수 있다. 다시 말해, 어떤 물질이 화학 반응을 통하여 다른 물질로 변화할 때 반응하는 물질을 반응물이라 부르고, 화학 반응을 통해 변화 또는 새로 생성된 물질을 산출물이라고 부를 수 있다.
'표적 산출물'(130)은 반응물(들)에 대한 화학 반응을 통해 생성하고자 목표한 산출물에 해당할 수 있다. 표적 산출물은 '표적 화합물(target compound)'이라고 부를 수도 있다.
예를 들어, 반응물1(110)과 반응물 2(120)을 합성하여 표적 산출물(130)을 생성하고자 할 수 있다. 이때, 표적 산출물은 이미 알려진 물질일 수도 있고, 알려지지 않은 물질일 수도 있다.
표적 산출물(130)의 생성을 위해 반응물1(110)과 반응물 2(120)을 합성하는 경우, 예를 들어, 6.25 mol% Pd(OAc)2의 촉매, 12.5mol%의 12리간드들(Ligans) 및 2.5 equiv의 8 염기들(Bases)과 같은 촉매 조건, 리간드 조건, 염기 조건뿐만 아니라, 1min, 100℃, Flow rate 1mL/min at 100bar와 같은 온도 조건, 반응 시간 조건, 및 압력 조건 등이 적용될 수 있다.
이와 같이 반응물들(110, 120)의 합성에는 예를 들어, 촉매(Catalyst) 조건, 리간드(ligand) 조건(150), 염기(Bases) 조건(160), 용매(Solvents) 조건(170), 온도 조건, 밀도 조건, 습도 조건, 반응 시간 조건, 및 압력 조건 등과 같은 다양한 합성 조건들이 적용될 수 있으며, 반드시 이에 한정되지는 않는다. 합성 조건들 중 촉매(Catalyst) 조건, 리간드(ligand) 조건(150), 염기(Bases) 조건(160), 용매(Solvents) 조건(170) 등은 '시약(reagent) 조건'이라고 부를 수도 있다.
반응물들(110, 120)의 합성 시에 적용되는 합성 조건들이 달라짐에 따라 산출물 또한 달라질 수 있다. 여기서, '리간드(ligand)'는 유기 화학에서 분자들의 특징적인 화학 반응을 담당하는 분자 내의 특정 치환기 또는 특정 부분에 해당할 수 있다. 리간드는 예를 들어, 수용체와 같은 큰 분자에서 정해진 부위(리간드 결합 사이트)에 특이적으로 결합하는 물질 또는 착화합물에서 중심 금속 원자에 전자쌍을 제공하면서 배위 결합을 형성하는 원자나 원자단에 해당할 수 있다. 리간드는 특성적인 화학적 거동을 가진 원자들의 집단이라는 점에서 '작용기(functional group)'라고 불릴 수도 있다.
'합성 조건들'은 반응물(들)(110, 120)을 이용하여 표적 산출물(130)을 생성하는 실험을 진행하기 위해 설정되는 여러 가지 조건들을 의미할 수 있다. 합성 조건들은 반응 방식에 따라 다양하게 결정될 수 있다.
'반응 방식'은 합성되는 반응물(들)(110, 120)을 이용하여 표적 산출물(130)을 생성하기 위한 화학 반응 방법을 의미할 수 있다. 반응 방식은 예를 들어, 스즈키 미야우라(suzuki-miyaura) 반응 방식, 부흐발트(Buchwald) 반응 방식, 아릴화(arylation) 반응 방식 등을 포함할 수 있으며, 반드시 이에 한정되지는 않는다. 예를 들어, 반응물 유기 붕소(R1-BY2)를 이용하여 표적 산출물 할라이드(R2-BY2)를 생성하는 경우, 반응 방식은 스즈키 미야우라 (suzuki-miyaura) 방식일 수 있다. 반응 방식은 예를 들어, 반응물의 구조 정보 및 표적 산출물의 구조 정보(예를 들어, A분자 구조 + B분자 구조 = C 분자 구조)에 따라 복수 개로 제공될 수도 있다. 여기서, '구조(structure)'는 물질의 원자(atom) 레벨의 구조를 의미할 수 있다. 구조는, 원자와 원자 간의 연결 관계(bond)에 기반하는 구조식일 수 있다.
전술한 합성 조건들 이외에 다양한 합성 경로들(130, 140)이 제안될 수 있으며, 이 경우 합성 경로들(130, 140) 또한 하나의 최적화 대상이 되어 합성 조건과 함께 최적화될 수 있다.
합성 경로들은 예를 들어, 반응물(들)(110, 120)의 치환기들(substituents)(130) 및 반응기들(140) 중 하나 이상을 포함할 수 있다.
치환기(들)(130)은 예를 들어, 유기 화학 및/또는 생화학에서 탄화 수소의 모체 사슬 상의 한 개 이상의 수소 원자(R1)를 대체하는 원자 또는 원자단에 해당할 수 있다. 예를 들어, 벤젠(C6H6)에서 수소(H) 원자 1개를 염소(Cl) 원자로 치환하면 클로로벤젠(C6H5Cl)이 되고, 벤젠의 수소(H) 원자 1개를 니트로기(NO2)로 치환하면 니트로벤젠(C6H5NO2)이 될 수 있다. 이 경우, 수소 원자 1개와 치환되는 염소 원자와 니트로기가 치환기에 해당할 수 있다.
반응기(들)(140)은 표적 산출물을 생성하기 위한 시작 물질(starting material)에 해당할 수 있다.
표적 산출물(130)을 획득하기 위해서는 대량의 시약 비용, 많은 실험 시간, 및 많은 연구 인력이 사용되는 것이 일반적이다.
일 실시예에서는 신경망 기반의 예측 모델을 이용하여 고수율로 표적 산출물을 합성하기 위한 최적의 합성 조건들의 조합(들)을 획득하거나, 반응물들(140)을 예측하거나, 및/또는 합성 조건들(150, 160, 170) 및 합성 경로들(130, 140)을 포함하는 검색 공간(search space)을 결정할 수 있다.
또한, 일 실시예에서는 합성 경로(들)를 하나의 합성 조건의 대상으로 분류하고, 예측 모델과 연계해 다양한 합성 경로들을 탐색할 수 있다. 일 실시예에서는 초기 조건 조합에 의한 실험 결과의 실측 수율과 예측 모델의 예측 수율 간의 차이를 기초로 예측 모델을 업데이트하여 합성 조건들의 조합들 간의 우선 순위를 결정하고, 우선 순위에 따라 다음 번 실험을 위한 다음 합성 조건들의 조합들 및 합성 경로를 포함하는 검색 공간을 반복적으로 재결정함으로써 최적의 수율을 획득할 수 있는 합성 조건들의 조합 및 합성 경로를 산출할 수 있다.
도 2는 일 실시예에 따른 합성 조건을 최적화하는 방법을 개념적으로 설명하기 위한 도면이다. 도 2를 참조하면, 일 실시예에 따른 합성 조건을 최적화하는 장치(이하, '최적화 장치')가 합성 조건을 최적화하는 과정이 도시된다.
단계 210에서, 최적화 장치는 합성하고자 하는 합성 대상을 수신할 수 있다. 합성 대상은 예를 들어, 하나 이상의 반응물(reactant)의 3차원 구조 정보 및 반응물에 의해 합성할 표적 산출물의 3차원 구조 정보를 포함하는 그래프 형태의 표현자일 수도 있고, 또는 표적 산출물의 3차원 구조 정보를 포함하는 그래프 형태의 표현자일 수도 있으며, 반드시 이에 한정되지는 않는다. 합성 대상은 전술한 합성 경로를 더 포함할 수도 있고, 또는 합성 조건들의 조합 및 합성 경로를 포함하는 검색 공간에 해당할 수도 있다.
단계 220에서, 최적화 장치는 단계 210에서 수신한 합성 대상에 대하여 미리 학습된 예측 모델이 예측한 합성 조건들의 조합들을 기초로, 초기 조건 조합(225)을 선택하여 초기 실험을 수행할 수 있다. 최적화 장치는 예측 모델이 예측한 합성 조건들의 조합들('조합'), 해당 조합들에 대응하는 수율들 및 해당 수율들에 대응하는 신뢰도를 기반으로 초기 실험에 이용할 복수 개(예를 들어, 10개)의 초기 조건 조합(225)을 선택하여 초기 실험을 수행할 수 있다. 초기 조건 조합은 표적 산출물을 합성하기 위한 초기 실험에 적용할 합성 조건들의 조합들 또는 합성 조건들의 그룹에 해당할 수 있다.
예측 모델은 예를 들어, 논문, 특허 등에서 최적화되어 인용된 100만개 또는 그 이상의 최적화된 조건들을 데이터 베이스 형태로 저장, 및/또는 가공한 데이터 기반의 머신 러닝으로 학습한 것일 수 있다. 예측 모델은 단계 210에서 수신한 표현자를 수신하여 표적 산출물의 합성 조건들의 조합들을 출력할 수 있다. 예측 모델의 일 예시는 아래의 도 4를 참조하여 보다 구체적으로 설명한다.
예측 모델은 학습에 이용된 데이터들(예: 합성 조건들의 조합들)에 대응한 점수를 예측할 수 있으므로, 최적화 장치는 데이터들 중 점수가 가장 높은, 다시 말해 수율이 가장 좋은 10개의 데이터들을 이용하여 초기 실험을 수행할 수 있다.
예측 모델이 합성 조건들의 조합을 예측하기는 하지만 상대적으로 흔하지 않은 실험 데이터인 경우에는 예측 모델이 예측해낸 합성 조건들의 조합이 불확실할 수 있다. 때문에 일 실시예에서는 예측 모델의 예측 결과(예: 합성 조건들의 조합들 및 합성 조건들의 조합들에 대응하는 수율)와 예측 결과에 대응하는 신뢰도('제1 신뢰도')를 함께 출력하고, 신뢰도에 따라 예측 결과를 일정 비율만큼 사용할 수 있다.
예를 들어, 초기 실험에 10개의 합성 조건들의 조합을 이용한다고 하자. 이 경우, 최적화 장치는 예측 모델의 예측 결과와 신뢰도를 기반으로 10개의 데이터들 중 실험에 이용할 하나 이상의 초기 조건 조합을 선택할 수 있다. 이때, 예측 모델의 예측 결과에 대응하는 제1 신뢰도가 높은 경우, 10회 모두 예측 모델이 예측한 합성 조건들의 조합들을 선택하는 것이 최적화 효율 측면에서 유리할 수 있다. 이와 달리, 예측 모델의 예측 결과에 대응하는 제1 신뢰도가 낮은 경우, 10회 모두 예측 모델이 예측한 합성 조건들로 실험하는 것이 바람직하지 않으므로 10회 중 일부는 다른 합성 조건들을 이용하는 것이 바람직할 수 있다.
여기서, 제1 신뢰도는 예측 모델의 예측 결과가 확실한지 또는 불확실한지 여부를 나타낸다는 점에서 예측 모델의 '불확실성(uncertainty)'이라고도 부를 수도 있다. 이하, 용어 '해당 수율에 대응하는 신뢰도', '제1 신뢰도' 및 '불확실성'은 서로 혼용될 수 있다.
단계 220에서, 최적화 장치는 제1 신뢰도를 기초로, 초기 실험에 이용할 10개의 합성 조건들 중 예측 모델에 의해 예측된 합성 조건들의 조합을 제1 비율로 선택할 수도 있고, 또는 새로운 합성 조건들의 조합을 제2 비율로 선택할 수도 있다. 예를 들어, 예측 모델의 예측 결과가 불명확하다, 다시 말해, 제1 신뢰도가 미리 설정된 기준보다 낮다고 결정되면, 최적화 장치는 초기 실험이 이용할 10개의 합성 조건들의 조합들 중 예측 모델이 예측한 합성 조건들의 조합이 차지하는 제1 비율은 낮추고, 예측 모델이 예측한 합성 조건들의 조합과 상이한 새로운 합성 조건들의 조합이 차지하는 제2 비율은 높일 수 있다. 이와 달리, 예측 모델의 예측 결과가 명확하다, 다시 말해 제1 신뢰도가 높다고 결정되면, 최적화 장치는 예측 모델이 예측한 합성 조건들의 조합이 차지하는 제1 비율은 높이고, 새로운 합성 조건들의 조합이 차지하는 제2 비율은 낮출 수 있다.
단계 230에서, 최적화 장치는 단계 220에서 선택된 10개의 초기 조건 조합에 의해 실험을 수행한 결과에 따른 실측 수율을 획득할 수 있다.
단계 240에서 최적화 장치는 단계 230에서 획득한 실측 수율을 기초로, 다음 번 실험을 위한 합성 조건들의 조합들('다음 합성 조건들의 조합들') 간의 우선 순위를 산출할 수 있다. 최적화 장치는 실험 진행에 따라 획득한 실측 수율과 예측 모델의 예측 수율 간의 차이를 확인하여 다음 번 실험을 위한 합성 조건들의 조합을 최적화할 수 있다.
단계 240에서 최적화 장치는 미리 알려진 데이터를 사용한 예측 모델에 의한 합성 조건들의 조합과 실제 실험 결과를 활용한 베이지언 최적화(Bayesian Optimization)에 의한 합성 조건들의 조합을 함께 사용하여 빠르게 고수율의 최적 합성 조건들의 조합을 찾을 수 있다.
최적화 장치는 예를 들어, 245와 같이, 데이터를 통해 학습된 모델인 예측 모델에 예측된 예측 수율(GNN), 예측 모델의 불확실성(uncertainty(u)), 베이지언 최적화(Bayesian Optimization) 방법과 같이 실제 실험 결과에 의존한 수율 추론 방법에 의해 산출한 수율(BO) 및 반복 횟수 T에 기초한 종합적인 판단을 통해 250과 같이 다음 번 실험을 위한 합성 조건들의 조합들(다음 합성 조건들의 조합)의 우선 순위를 결정할 수 있다. 이때, 다음 합성 조건들의 조합들에 따른 실험 결과의 실측 수율에 따라 예측 모델이 업데이트되어 우선 순위가 재결정되고, 재결정된 우선 순위에 따라 그 다음 합성 조건들의 조합들이 결정되는 방식으로 반복적으로 우선 순위가 결정될 수 있다.
최적화 장치는 재결정된 우선 순위에 따른 실측 수율이 목표 수율에 해당하지 않는 경우, 실측 수율을 피드백하여 단계 230 및 단계 240의 과정을 반복 수행할 수 있다. 최적화 장치는 재결정된 우선 순위에 따른 실측 수율이 목표 수율에 해당하거나, 또는 목표 수율을 초과하는 경우, 동작을 종료할 수 있다.
도 3은 일 실시예에 따른 합성 조건을 최적화하는 방법을 나타낸 흐름도이다. 이하 실시예에서 각 단계들은 순차적으로 수행될 수도 있으나, 반드시 순차적으로 수행되는 것은 아니다. 예를 들어, 각 단계들의 순서가 변경될 수도 있으며, 적어도 두 단계들이 병렬적으로 수행될 수도 있다.
도 3을 참조하면, 일 실시예에 따른 합성 조건을 최적화하는 장치(이하, '최적화 장치')가 단계 310 내지 단계360을 통해 표적 산출물의 생성을 위한 합성 조건들을 최적화하는 과정이 도시된다.
일 실시예에 따른 최적화 장치는 PC(personal computer), 서버 디바이스, 모바일 디바이스, 임베디드 디바이스 등의 다양한 종류의 디바이스들로 구현될 수 있고, 구체적인 예로서 뉴럴 네트워크를 이용한 음성 인식, 영상 인식, 영상 분류 등을 수행하는 스마트폰, 태블릿 디바이스, AR(Augmented Reality) 디바이스, IoT(Internet of Things) 디바이스, 자율주행 자동차, 로보틱스, 의료기기 등에 해당될 수 있으나, 이에 제한되지 않는다. 나아가서, 최적화 장치는 위와 같은 디바이스에 탑재되는 전용 하드웨어 가속기(HW accelerator)에 해당될 수도 있고, 또는 뉴럴 네트워크 구동을 위한 전용 모듈인 NPU(neural processing unit), TPU(Tensor Processing Unit), Neural Engine 등과 같은 하드웨어 가속기일 수 있으나, 이에 제한되지 않는다.
단계 310에서, 최적화 장치는 하나 이상의 반응물의 구조 정보 및 반응물에 의해 합성할 표적 산출물의 구조 정보 주 적어도 하나를 포함하는 그래프 형태의 표현자를 수신한다. 반응물의 구조 정보 및 표적 산출물의 구조 정보는 3차원 구조 정보에 해당할 수 있다. 구조 정보는 물질의 구조를 표현하기 위해 사용되는 지표 값으로써 특정한 부분 구조의 포함 여부를 표시하는 구조 특징 값을 의미할 수 있다. 그래프 형태의 표현자는 예를 들어, 반응물의 치환기들 및 반응기들 중 하나 이상을 포함하는 합성 경로를 더 포함할 수 있다.
최적화 장치는 사용자 인터페이스(예를 들어, 도 11의 사용자 인터페이스(1110))를 통해 하나 이상의 반응물의 구조 정보 및 표적 산출물의 구조 정보 중 적어도 하나를 수신할 수 있다.
최적화 장치는 반응물(들)의 구조 정보 및 표적 산출물의 구조 정보를 그래프 형태의 표현자(descriptor)로 수신할 수 있다. '표현자'는 반응물 및/또는 산출물과 같은 물질의 특징을 표현하기 위해 사용되는 지표 값에 해당할 수 있다.
실시예에 따라, 최적화 장치는 반응물(들)을 통해 표적 산출물을 생성하기 위한 반응 방식을 함께 수신할 수 있다. 최적화 장치는 반응 방식을 원-핫 벡터(one-hot vector) 형태로 수신할 수 있다. 예를 들어, 최적화 장치가 4개의 반응 방식 중 두 번째 반응 방식을 수신한 경우, 최적화 장치에 수신되는 원-핫 벡터(one-hot vector)는 0100로 표현될 수 있다.
단계 320에서, 최적화 장치는 신경망 기반의 예측 모델에 표현자를 인가함으로써 표적 산출물의 생성을 위한 합성 조건들의 조합들을 결정한다. '합성 조건들의 조합(들)'은 최적 수율을 도출하기 위한 것으로서, 각 합성 조건 별로 포함된 다수의 조건들의 조합에 해당할 수 있다. 일 실시예에서, 최적화 장치는 반응물(들)의 구조 정보 및 표적 산출물의 구조 정보에 기초하여 합성 조건들의 조합들을 생성할 수 있다. 예측 모델은 표현자를 수신하여 표적 산출물을 생성하기 위한 합성 조건들의 조합들을 출력할 수 있다. 이때, 신경망은 예를 들어, 노드와 엣지로 이루어진 관계를 나타내는 그래프 형태의 표현자에 기초하여 반응물에서 서로 인접한 원자들 간의 연관 관계에 따라 합성 조건들의 조합들을 결정하는 메시지 전달 신경망(Message Passing Neural Networks; MPNN)을 포함할 수 있다. 메시지 전달 신경망은 그래프 구조 데이터에 기반한 GNN(Graph Neural Networks) 중 전체 입력 그래프의 기능을 계산하기 위해 메시지 전달 알고리즘과 집계 절차를 학습한 것일 수 있다.
또한, 예측 모델에는 반응물의 구조 정보, 표적 산출물의 구조 정보, 반응 방식 및 합성 조건에 따른 예측 수율과 예측 수율에 대응하는 신뢰도가 저장될 수 있다. 최적화 장치는 예측 모델로부터 예측 수율과 예측 수율에 대응하는 신뢰도('제1 신뢰도')를 제공받거나, 사용자 입력을 피드백 받음으로써, 예측 모델을 수정할 수 있다. 예측 모델에는 반응물의 구조 정보, 표적 산출물의 구조 정보 및 반응 방식이 저장될 수 있다.
실시예에 따라서, 반응물의 구조 정보 및 표적 산출물의 구조 정보와 반응 방식을 함께 수신한 경우, 최적화 장치는 반응 방식을 만족하는 합성 조건 조합들을 생성할 수 있다. 예를 들어, 수신한 반응 방식이 스즈키 미야우라(suzuki-miyaura) 방식인 경우, 최적화 장치는 반응 방식을 만족하도록 촉매 조건으로 팔라듐(palladium)과 같은 친핵제(nucleophile)의 화학종(chemical species)이 포함되고, 반응 시간 조건이 15분인 합성 조건들의 조합을 선택할 수 있다.
일 실시예에서, 최적화 장치는 복수의 합성 조건들의 조합들 각각에 대한 합성 조건의 종류가 공통되도록 복수의 합성 조건들의 조합들을 설정할 수도 있다. 예를 들어, 최적화 장치는 제1 합성 조건들의 조합에 촉매 A, 반응 시간 10분이 포함되도록 설정하고, 제1 합성 조건들의 조합에 촉매 B, 반응 시간 20분이 포함되도록 설정할 수 있다. 다시 말해, 최적화 장치는 촉매 조건 및 반응 시간 조건이 제1 합성 조건들의 조합 및 제2 합성 조건들의 조합에 동일하게 포함되도록 복수의 합성 조건들의 조합들을 설정할 수 있다.
다른 실시예에서, 최적화 장치는 복수의 합성 조건들의 조합들 각각에 대한 합성 조건의 종류 중 적어도 하나가 상이하도록 복수의 합성 조건들의 조합들을 설정할 수 있다. 예를 들어, 최적화 장치는 제1 합성 조건들의 조합에 촉매 C, 반응 시간 30분이 포함되도록 설정하고, 제2 합성 조건들의 조합에 염기 D, 온도 E도(℃)가 포함되도록 설정할 수 있다. 다시 말해, 최적화 장치는 촉매 조건 및 반응 시간 조건이 제1 합성 조건들의 조합에 포함되도록 설정하고, 제1 합성 조건들의 조합에 포함된 합성 조건의 종류와는 상이한 염기 조건 및 온도 조건이 제2 합성 조건들의 조합에 포함되도록 설정할 수도 있다.
또는 최적화 장치는 복수의 합성 조건들의 조합들을 포함하는 합성 조건 그룹을 생성할 수 있다. 합성 조건 그룹은 실험 우선 순위를 결정해야 할 합성 조건들의 조합들의 집합을 의미할 수 있다. 최적화 장치는 합성 조건 그룹에 포함된 합성 조건들의 조합들 사이의 실험 우선 순위를 결정할 수 있다.
단계 320에서, 최적화 장치는 신경망 기반의 예측 모델을 이용하여, 합성 조건들의 조합들 각각에 대응하는 표적 산출물의 예측 수율과 예측 수율에 대응하는 제1 신뢰도를 연산할 수 있다. 여기서, '예측 수율'은 반응물(들)이 소정 반응 방식 및 소정 합성 조건 하에서 실험될 때, 반응물(들)로부터 생성되는 표적 산출물의 수율에 대한 기대치를 의미할 수 있다. 예측 수율은 예측 모델에 의해 연산될 수 있다. 예측 수율은 실제 실험에 의한 실측 수율과는 상이할 수도 있다.
예측 모델은 합성 조건들의 조합들, 합성 조건들의 조합들에 대응하는 예측 수율들 및 예측 수율들에 대응하는 제1 신뢰도 중 하나 이상의 예측하도록 학습된 신경망을 포함할 수 있다. 제1 신뢰도는 합성 조건들의 조합에 의해 생성되는 표적 산출물의 예측 수율이 실측 수율에 얼마나 근접한지에 대한 정도를 나타내는 지표에 해당하며, '예측 정확도'라고도 부를 수 있다. 예측 모델에는 반응 방식에 대응하는 적어도 하나의 합성 조건이 저장될 수 있다.
일 실시예에 따른 예측 모델은 합성 조건들의 조합들을 예측하지만 상대적으로 흔하지 않은 실험 데이터인 경우에는 예측 모델이 예측한 합성 조건들의 조합이 불확실하기 때문에 예측 모델의 예측 결과와 대응하는 신뢰도를 함께 출력할 수 있다. 최적화 장치가 합성 조건들의 조합들을 결정하는 방법은 아래의 도 4를 참조하여 보다 구체적으로 설명한다.
단계 330에서, 최적화 장치는 단계 320에서 결정된 조합들의 수율(yield)에 대응하는 제1 신뢰도에 기초하여, 합성 조건들의 조합들 중 하나 이상의 초기 조건 조합을 선택한다. 초기 조건 조합은 예를 들어, 초기 실험에 이용되는 10개 또는 20개의 합성 조건들의 조합들일 수 있으며, 반드시 이에 한정되지는 않는다.
최적화 장치는 제1 신뢰도에 기초하여, 초기 조건 조합을 위한 선택 비율을 결정할 수 있다. '선택 비율'은 예를 들어, 예측 모델에 의해 예측된 합성 조건들을 초기 조건 조합으로 선택하는 제1 비율 및 랜덤한 조건들을 초기 조건 조합으로 선택하는 제2 비율을 포함할 수 있으며, 반드시 이에 한정되지는 않는다. 제1 비율은 예를 들어, 논문, 특허 등에서 인용된, 다시 말해 알려진 최적화된 조건들에 기반하여 선택된다는 점에서 '이용(Exploitation) 비율'이라 부를 수 있다. 또한, 제2 비율은 미리 알려지지 않은 랜덤한 조건들 또는 제1 비율에 해당하는 합성 조건들과 상이한 조건들 중에서 선택된다는 점에서 '탐색(Exploration) 비율'이라 부를 수도 있다.
제1 신뢰도가 미리 설정된 기준보다 높은 경우, 최적화 장치는 제1 비율을 증가시키고, 제2 비율을 감소시킬 수 있다. 또는 데이터 부족, 새로운 합성 종류 등의 이유로 제1 신뢰도가 미리 설정된 기준보다 낮은 경우, 최적화 장치는 제2 비율을 증가시키고, 제1 비율을 감소시킬 수 있다. 최적화 장치가 초기 조건 조합을 선택하는 방법은 아래의 도 5를 참조하여 보다 구체적으로 설명한다.
단계 340에서, 최적화 장치는 단계 330에서 선택된 초기 조건 조합에 의한 실험 결과의 실측 수율을 기초로, 예측 모델을 업데이트한다. 최적화 장치는 예측 모델에 의해 결정된 합성 조건들의 조합에 대응하는 예측 수율과 실측 수율 간의 비교 결과에 기초하여 선택 비율을 조절함으로써 합성 조건들을 최적화하는 한편, 예측 모델을 업데이트할 수 있다. 최적화 장치는 예측 수율이 실측 수율보다 높은 경우, 예측 수율에 대응하는 합성 조건들의 조합이 더 많이 포함되도록 예측 모델을 업데이트할 수 있다. 또는 최적화 장치는 예측 수율이 실측 수율보다 낮은 경우, 실측 수율에 대응하는 합성 조건들의 조합이 더 많이 포함되도록 예측 모델을 업데이트할 수 있다.
단계 350에서, 최적화 장치는 단계 340에서 업데이트된 예측 모델에 기초하여 합성 조건들의 조합들 간의 우선 순위를 결정한다. 최적화 장치는 업데이트 이전의 예측 모델에 의해 예측된 합성 조건들의 조합에 대응하는 제1 수율과 단계 340에서 업데이트된 예측 모델에 의해 예측된 합성 조건들의 조합에 대응하는 제2 수율의 비교 결과에 기초하여, 다음 번 실험을 위한 합성 조건들의 조합들('다음 합성 조건들의 조합들') 간의 우선 순위를 결정할 수 있다.
최적화 장치는 예를 들어, 아래의 수학식 1을 이용하여 다음 합성 조건들의 조합들 간의 우선 순위 (
Figure pat00001
)를 산출할 수 있다.
Figure pat00002
여기서, GNN은 그래프 신경망에 기반한 예측 모델에 의해 예측된 합성 조건들의 조합에 대응하는 예측 수율을 나타내고, Uncertainty(u)는 예측 모델의 불확실성을 나타낼 수 있다. 예측 모델의 불확실성은 예측 모델 자체에 대한 신뢰도로서, '제2 신뢰도'라고 부를 수 있다.
BO는 실제 실험 결과에 포맷팅된 베이지언 최적화(Bayesian Optimization; BO)를 통해 최적화된 합성 조건에 대응하는 실측 수율에 해당하고, T는 반복 횟수에 해당할 수 있다.
예측 모델이 신뢰하기 어렵다고 판단되는 경우, 최적화 장치는 예측 모델의 예측 결과 보다 실제 실험에 기반한 베이지언 최적화 결과에 더 높은 가중치를 부여하여 합성 조건들의 조합을 최적화할 수 있다. 예를 들어, 예측 모델에 의해 예측된 실측 수율이 30%이고, 목표 수율 95%인 경우, 예측 모델을 신뢰하기 어렵다고 판단할 수 있다. 이 경우, 최적화 장치는 베이지언 최적화(BO)에 의해 현재 실험 결과에 포맷팅된 합성 조건들의 조합에 더 높은 가중치를 부여함으로써 최적화된 합성 조건들의 조합들을 보다 빨리 찾을 수 있다. 최적화 장치가 우선 순위를 결정하는 방법은 아래의 도 6을 참조하여 보다 구체적으로 설명한다.
단계 360에서, 최적화 장치는 단계 350에서 결정된 우선 순위에 따라 다음 합성 조건들의 조합들을 결정한다.
단계 360에서, 최적화 장치는 다음 합성 조건들의 조합들에 따른 실험 결과의 실측 수율에 따라 예측 모델이 업데이트 됨에 따라 우선 순위를 재결정할 수 있다. 최적화 장치는 재결정된 우선 순위에 따라 그 다음 합성 조건들의 조합들을 결정할 수 있다. 최적화 장치는 그 다음 합성 조건들의 조합들에 따른 실험 결과의 실측 수율이 미리 설정된 목표 수율을 만족할 때까지 우선 순위를 재결정하는 동작 및 그 다음 합성 조건들의 조합들을 결정하는 동작을 반복적으로 수행할 수 있다. 최적화 장치가 다음 합성 조건들의 조합을 결정하는 방법은 아래의 도 7을 참조하여 보다 구체적으로 설명한다.
도 4는 일 실시예에 따라 합성 조건들의 조합들을 결정하는 방법을 설명하기 위한 도면이다. 도 4를 참조하면, 일 실시예에 따른 그래프 형태의 표현자들(G1, G2, G3)(410)을 수신하여 표적 산출물의 생성을 위한 합성 조건들의 조합들을 결정하는 제1 신경망(420), 제1 신경망(420)이 예측한 합성 조건들의 조합들에 대응하는 예측값(
Figure pat00003
)을 출력하는 제2 신경망(430) 및 예측 모델(400)이 잘 학습되는지를 나타내는 튜닝 요소 (
Figure pat00004
)를 예측하는 제3 신경망(440)이 도시된다. 제3신경망(440)은 예측 모델(400)의 학습 시에 사용되며, 실제 추론 시에는 포함되지 않을 수 있다.
제1 신경망들(420)은 예를 들어, 표현자(G1)을 수신하는 제1-1 신경망(MPNN Mθ(G1))(420-1), 표현자(G2)을 수신하는 제1-2 신경망(MPNN Mθ(G2))(420-2), 및 표현자(G3)을 수신하는 제1-3 신경망(MPNN Mθ(G3))(420-3)을 포함할 수 있으며, 반드시 이에 한정되지는 않는다. 이때, 표현자들(G1, G2)은 표적 산출물을 생성하기 위한 반응물들의 3차원 구조를 나타내는 그래프 형태의 표현자이고, 표현자(G3)는 표적 산출물의 3차원 구조를 나타내는 그래프 형태의 표현자에 해당할 수 있다.
제1 신경망(420)은 각 표현자에 대응하는 합성 조건들의 특징 또는 특징 벡터를 추출할 수 있다. 제1 신경망(420)에 의해 추출된 각 표현자에 대응하는 합성 조건들의 특징 벡터들은 제2 신경망(430) 및 제3 신경망(440)으로 각각 인가될 수 있다. 이때, 제2 신경망(430) 및 제3 신경망(440) 각각은 예를 들어, 복수 개의 레이어들을 포함하는 완전 연결된 신경망(fully-connected neural network)일 수 있다.
제2 신경망(430)은 각 표현자에 대응하는 합성 조건들의 특징 벡터에 대응하는 예측값(
Figure pat00005
)을 출력할 수 있다. 예측값(
Figure pat00006
)은 예를 들어, 합성 조건들의 조합들 및 해당 조합들에 대응하는 불확실성을 함께 포함할 수 있다. 예측값(
Figure pat00007
)은 예를 들어, 리간드에 대응하는 수율(
Figure pat00008
)을 나타내는 벡터(431), 염기 조건에 대응하는 수율(
Figure pat00009
)을 나타내는 벡터(433) 및 용매 조건에 대응하는 수율(
Figure pat00010
)을 나타내는 벡터(435)를 포함할 수 있으며, 반드시 이에 한정되지는 않는다. 이때, 벡터(431), 벡터(433) 및 벡터(435) 각각은 리간드 조건, 염기 조건 및 용매 조건과 같은 각 합성 조건 별로 유력한 조건들을 예를 들어, 10차원의 벡터로 나타낼 수 있다. 벡터(431), 벡터(433) 및 벡터(435)에서 진한 색상에 대응하는 벡터가 더 유력한 조건, 다시 말해 더 높은 수율을 나타내는 합성 조건에 해당할 수 있다.
최적화 장치는 예를 들어, 벡터(431), 벡터(433) 및 벡터(435)에서 더 유력한 조건들을 결합한 20개의 벡터들을 합성 조건들의 조합들(450)로 선택할 수 있다. 합성 조건들의 조합들(450)은 합성 조건들의 조합들에 대응하는 수율이 높은 순서에 따라 합성 조건들의 조합이 순차적으로 정렬된 것일 수 있다.
일 실시예에서 합성 조건들의 조합들(450)을 선택하는 것은 해당 반응 방식에 맞는 최적화할 조건 범위에 대한 바이어스를 설정하는 것에 해당할 수 있다. 이는 반응 방식에 따라 합성 조건의 종류가 다르며, 반응 방식 별로 수율의 변화 요인이 각각 다르기 때문이다.
또한, 제3 신경망(440)이 출력하는 튜닝 요소(
Figure pat00011
)는 예측 모델(400)이 잘 학습되는지를 나타내는 값에 해당할 수 있다. 예를 들어, 튜닝 요소(
Figure pat00012
)는 해당 예측 모델이 잘 학습되는 경우에는 1의 값을 가질 수 있고, 해당 예측 모델이 잘 학습되지 않는 경우에는 0의 값을 가질 수 있다.
이하에서는 설명의 편의를 위하여 반응물들 및 표적 산출물에 대응하는 표현자들이 제1 신경망들(420)에 입력되는 경우를 위주로 설명하지만, 반드시 이에 한정되는 것은 아니다.
예를 들어, 표적 산출물의 합성을 위한 합성 조건들의 조합들(450)을 예측하고자 하는 경우, 제1 신경망들(420)에는 표현자들(G1, G2, G3)이 입력될 수 있다. 이 경우, 제1 신경망들(420)은 표현자들(G1, G2, G3)로부터 추출한 합성 조건들의 특징들을 결합(concatenation)하여 예를 들어, 벡터 형태로 출력할 수 있다. 제1 신경망들(420)은 동일한 파라미터를 공유(parameter sharing)할 수 있다. 제1 신경망들(420)은 논문 등에서 수집한 데이터를 학습하여 최종적으로 특정 반응에 대해서 최적의 조건을 추천하는 머신 러닝 알고리즘을 학습한 신경망들일 수 있다.
이와 달리, 표적 산출물을 합성하기 위한 합성 조건들의 조합들 및 합성 경로를 예측하고자 하는 경우, 제1 신경망들(420)에는 반응물들에 대응하는 표현자들 없이 표적 산출물에 대응하는 표현자(G3)가 입력될 수도 있다. 이 경우, 제2 신경망(430)은 표적 산출물을 합성하기 위한 반응물들 및 합성 경로들에 대응하는 합성 조건들의 조합들을 출력할 수 있다. 또한, 제2 신경망(430)은 벡터(431), 벡터(433) 및 벡터(435)에 의해 반응물들의 표현자들(G1, G2)을 분류(classification)할 수 있다. 또한, 제2 신경망(430)은 예측 값에 대응하는 불확실성을 더 출력할 수 있다.
일 실시예에서는 표적 산출물의 합성 실험에 있어 높은 수율을 얻기 위한 합성 조건들의 최적화를 머신 러닝을 기반으로 효율화할 수 있으며, 예측 모델의 예측값과 불확실성(또는 신뢰성)을 함께 출력함으로써 최적화 전략을 유동적으로 변화시킬 수 있다.
도 5는 일 실시예에 따라 초기 조건 조합을 선택하는 방법을 설명하기 위한 도면이다. 도 5를 참조하면, 전술한 도 4를 통해 획득한 합성 조건들의 조합들의 수율에 대응하는 신뢰도('제1 신뢰도')에 기초하여 초기 조건 조합을 선택하여 실험을 수행하는 과정을 설명하기 위한 도면이 도시된다.
도 4를 통해 전술한 것과 같이, 최적화 장치는 예를 들어, 벡터(431), 벡터(433) 및 벡터(435)에서 더 유력한 조건들을 결합한 합성 조건들의 조합들(450) 중 초기 조건 조합을 선택할 수 있다.
최적화 장치는 복수 개의 레이어들을 포함하는 제2 신경망(430)에 각 레이어들을 연결하는 선들, 다시 말해 에지들(edges)의 연결을 랜덤하게 드롭-아웃(drop out)시킴으로써 서로 다른 20개의 벡터들을 예측할 수 있다. 다시 말해, 최적화 장치는 벡터(431), 벡터(433) 및 벡터(435)를 출력하는 복수의 레이어들의 연결 중 일부는 연결하고, 일부는 끊은 상태에서 연결을 다양하게 함으로써 합성 조건들의 조합들(450) 중 초기 조건 조합에 대응하는 20개의 벡터들을 예측할 수 있다.
이때, 20개의 벡터들 간의 편차가 미리 설정된 기준보다 높은 경우, 예측 모델의 예측 결과에 대응하는 제1 신뢰도(또는 불확실성)는 낮게 결정될 수 있다. 또한. 20개의 벡터들 간의 편차가 미리 설정된 기준보다 낮은 경우, 예측 모델의 예측 결과에 대응하는 제1 신뢰도(또는 불확실성)는 높게 낮게 결정될 수 있다.
단계 510에서, 최적화 장치는 합성 조건들의 조합들(450)의 수율(yield)에 대응하는 신뢰도('제1 신뢰도')에 기초하여, 합성 조건들의 조합들(450) 중 초기 조건 조합의 선택 비율을 결정할 수 있다. 최적화 장치는 초기 조건 조합을 선택할 때 예측 모델의 예측값에 의존하여 초기 조건 조합을 선택하는 제1 비율(exploitation), 또는 다양한 조건들을 초기 조건 조합으로 선택하는 제2 비율(exploration)을 포함하는 선택 비율을 결정할 수 있다.
최적화 장치는 예를 들어, 제1 신뢰도가 미리 설정된 기준보다 높은 경우, 제1 비율을 증가시키고, 제2 비율을 감소시킬 수 있다. 또는 최적화 장치는 예를 들어, 데이터 부족, 새로운 합성 종류 등의 이유로 신뢰도가 미리 설정된 기준보다 낮은 경우, 제2 비율을 증가시키고, 제1 비율을 감소시킬 수 있다.
일 실시예에서는 예측 모델의 예측값을 신뢰도('제1 신뢰도')와 함께 제공하고, 최적화 장치가 제1 신뢰도를 바탕으로 초기 조건 조합의 선택 비율을 결정할 수 있다. 미리 알려진 쉬운 합성 조건에 해당하여 제1 신뢰도가 미리 설정된 기준보다 높은 경우, 최적화 장치는 합성 조건들의 조합을 조기에 발견할 수 있도록 초기 조건 조합의 선택 비율에서 제2 비율보다 제1 비율을 높일 수 있다. 이와 반대로, 데이터 부족, 새로운 합성 종류 등의 이유로 제1 신뢰도가 미리 설정된 기준보다 낮은 경우, 최적화 장치는 다양한 조건들이 채택되어 충분히 다양한 조건들로 표적 산출물이 합성되도록 제1 비율보다 제2 비율을 높일 수 있다. 최적화 장치는 선택 비율에 따라 초기 조건 조합을 선택할 수 있다.
단계 520에서, 최적화 장치는 단계 510에서 결정된 초기 조건 조합의 선택 비율에 따라 실험을 수행할 수 있다.
단계 530에서, 최적화 장치는 예측 모델(GNN)의 예측 결과에 해당하는 예측 수율과 베이지언 최적화(BO)에 의해 현재 실험 결과에 포맷팅된 최적화된 방법에 대응하는 실측 수율 간의 차이를 기초로 고수율의 최적 합성 조건들의 조합을 찾을 수 있다. 최적화 장치는 예측 수율과 실측 수율 간의 차이 및 예측 모델에 대한 신뢰도에 따라 예측 수율에 대응하는 합성 조건들의 조합 또는 실측 수율에 대응하는 합성 조건들의 조합에 서로 다른 가중치를 부여하여 합성 조건들의 조합들 간의 우선 순위를 조절함으로써 합성 조건들의 조합을 최적화할 수 있다.
도 6은 일 실시예에 따라 조합들의 우선 순위를 결정하는 방법을 나타낸 흐름도이다. 이하 실시예에서 각 단계들은 순차적으로 수행될 수도 있으나, 반드시 순차적으로 수행되는 것은 아니다. 예를 들어, 각 단계들의 순서가 변경될 수도 있으며, 적어도 두 단계들이 병렬적으로 수행될 수도 있다.
최적화 장치는 업데이트 이전의 예측 모델에 의해 예측된 합성 조건들의 조합에 대응하는 제1 수율과 단계 340에서 업데이트된 예측 모델에 의해 예측된 합성 조건들의 조합에 대응하는 제2 수율 간의 비교 결과에 기초하여, 다음 번 실험을 위한 합성 조건들의 조합들의 우선 순위를 결정할 수 있다.
도 6을 참조하면, 일 실시예에 따른 최적화 장치가 단계 610 내지 630을 통해 합성 조건들의 조합들의 우선 순위를 결정하는 방법이 도시된다.
단계 610에서, 최적화 장치는 제1 수율보다 제2 수율이 작거나 같은지 여부를 결정할 수 있다. 단계 610에서 제1 수율보다 제2 수율이 작거나 같다고 결정된 경우, 단계 620에서 최적화 장치는 제1 수율에 대응하는 제1 조합을 선순위로 결정하고, 제2 수율에 대응하는 제2 조합을 후순위로 결정할 수 있다.
이와 달리, 단계 610에서, 제1 수율보다 제2 수율이 크다고 결정된 경우, 단계 630에서 최적화 장치는 제2 조합을 선순위로 결정하고, 제1 조합을 후순위로 결정할 수 있다.
최적화 장치는 결정된 우선 순위에 따라 다음 번 실험을 수행할 수 있다.
도 7은 일 실시예에 따라 다음 합성 조건들의 조합들을 결정하는 방법을 나타낸 흐름도이다. 이하 실시예에서 각 단계들은 순차적으로 수행될 수도 있으나, 반드시 순차적으로 수행되는 것은 아니다. 예를 들어, 각 단계들의 순서가 변경될 수도 있으며, 적어도 두 단계들이 병렬적으로 수행될 수도 있다.
도 7을 참조하면, 일 실시예에 따른 최적화 장치가 단계 710 내지 단계 750을 통해 다음 합성 조건들의 조합들을 결정하는 방법이 도시된다.
단계 710에서, 최적화 장치는 도 6을 통해 전술한 과정에서 결정된 우선 순위에 따라 다음 합성 조건들의 조합들을 결정할 수 있다. 여기서, '다음 합성 조건들의 조합(들)'은 다음 번 실험을 위한 합성 조건들의 조합(들)에 해당할 수 있다.
단계 720에서, 최적화 장치는 단계 710에서 결정된 다음 합성 조건들의 조합들에 따른 실험 결과의 실측 수율을 피드백할 수 있다.
단계 730에서, 최적화 장치는 단계720에서 피드백된 실측 수율과 미리 설정된 목표 수율을 비교할 수 있다. 최적화 장치는 피드백된 실측 수율이 목표 수율보다 큰 지 여부를 결정할 수 있다. 예를 들어, 단계 730에서 실측 수율이 목표 수율보다 크다고 결정된 경우, 최적화 장치는 단계를 종료할 수 있다.
이와 달리, 단계 730에서 실측 수율이 목표 수율보다 작거나 같다고 결정된 경우, 단계 740에서 최적화 장치는 실측 수율에 따라 예측 모델을 업데이트할 수 있다.
단계 750에서 최적화 장치는 단계 740에서 업데이트된 예측 모델에 의해 다음 합성 조건들의 우선 순위를 재결정한 후, 재결정된 우선 순위에 의해 단계 710을 수행할 수 있다.
도 8은 다른 실시예에 따른 합성 조건을 최적화하는 방법을 나타낸 흐름도이다. 이하 실시예에서 각 단계들은 순차적으로 수행될 수도 있으나, 반드시 순차적으로 수행되는 것은 아니다. 예를 들어, 각 단계들의 순서가 변경될 수도 있으며, 적어도 두 단계들이 병렬적으로 수행될 수도 있다.
도 8을 참조하면, 일 실시예에 따른 최적화 장치가 단계 810 내지 단계860을 통해 합성 조건들의 최적화하는 과정이 도시된다.
단계 810에서, 최적화 장치는 그래프 형태의 표현자를 수신할 수 있다. 최적화 장치는 예를 들어, 사용자 인터페이스를 통해 반응물의 3차원 구조 정보 및 반응물에 의해 합성할 표적 산출물의 3차원 구조 정보를 포함하는 그래프 형태의 표현자를 수신할 수 있다. 또는 최적화 장치는 반응물(들)을 통해 표적 산출물을 생성하기 위한 반응 방식도 수신할 수 있다.
단계 820에서, 최적화 장치는 그래프 형태의 분자 구조를 포함하는 표현자를 신경망 기반의 예측 모델에 인가하여 표적 산출물의 생성을 위한 합성 조건들의 조합들을 결정할 수 있다.
단계 830에서, 최적화 장치는 예측 모델에 의해 단계820에서 결정된 합성 조건들의 조합들에 대응하는 수율들 및/또는 해당 수율들에 대응하는 신뢰도를 출력할 수 있다.
단계 840에서, 최적화 장치는 실험을 위한 초기 조건 및/또는 초기 조건 조합을 선택할 수 있다. 최적화 장치는 합성 조건들의 조합들의 수율에 대응하는 신뢰도('제1 신뢰도')에 기반하여 초기 조건 조합을 선택할 수 있다.
예를 들어, 초기 실험을 10회 수행하는 경우, 최적화 장치는 10회 실험을 위해 예측 모델이 예측한 합성 조건들의 조합을 우선으로 선택하되, 제1 신뢰도가 낮은 경우, 예측 모델이 예측한 조합과는 상대적으로 다른 조건들을 우선적으로 선택할 수 있다.
예를 들어, 제1 신뢰도가 90%로서 미리 설정된 기준인 75% 보다 높다고 가정하자. 최적화 장치는 10회 중 90%(제1 비율)에 해당하는 9회는 예측 모델이 예측한 합성 조건들의 조합을 선택하고, 10회 중 10%(제2 비율)에 해당하는 나머지 1회는 랜덤한 합성 조건들의 조합 또는 예측 모델이 예측한 합성 조건들의 조합과 상이한 조합을 선택할 수 있다.
또는 예측 모델이 예측한 결과의 신뢰도가 20% 로서 미리 설정된 기준인 75% 보다 낮다고 가정하자. 최적화 장치는 10회 중 20%에 해당하는 2회는 예측 모델이 예측한 합성 조건들의 조합을 초기 조건 조합으로 선택하고, 10회 중 80%에 해당하는 8회는 예측 모델이 선택하지 않은 다른 합성 조건들의 조합을 초기 조건 조합으로 선택할 수 있다.
단계 850에서, 최적화 장치는 단계 840에서 결정된 초기 조건 조합에 의해 실험을 수행할 수 있다. 최적화 장치는 예를 들어, 로봇에 의해 단계 840에서 결정된 초기 조건 조합에 따라 실험을 수행하고, 초기 조건 조합에 의한 실험 결과에 따른 실측 수율을 출력할 수 있다.
단계 860에서, 최적화 장치는 예를 들어, 예측 모델의 신뢰성('제2 신뢰성'), 예측 모델의 오차, 반복 횟수 등을 고려해 최적의 합성 조건들의 조합을 선택할 수 있다. 최적화 장치는 예를 들어, 초기 10회의 실험 결과에 따른 실측 수율을 확인 후, 예측 모델의 예측 수율과 실측 수율 간의 차이에 기초하여 합성 조건들의 조합들의 우선 순위를 결정할 수 있다. 이때, 최적화 장치는 제2 신뢰성을 기초로, 예측 수율과 실측 수율 각각에 대응하는 합성 조건들의 조합에 서로 다른 가중치를 부여하여 합성 조건들의 조합들의 우선 순위를 조절함으로써 높은 수율을 얻을 수 있도록 합성 조건들의 조합들을 최적화할 수 있다.
단계 860에서, 최적화 장치는 데이터를 통해 학습된 모델인 예측 모델과 베이지언 최적화(Bayesian Optimization) 방법과 같이 실제 실험 결과에 의존한 수율 추론 방법을 결합한 종합적인 판단을 통해 다음 번 실험을 위한 합성 조건들의 조합들을 우선 순위를 결정할 수 있다.
최적화 장치는 전술한 과정을 통해 의도한 목표 수율을 얻게 되면, 단계 860에서 결정된 우선 순위에 대응하는 합성 조건들의 조합을 예측 모델의 학습에 활용된 데이터베이스에 업데이트 함으로써 추후 유사한 반응에 활용되도록 할 수 있다.
도 9는 다른 실시예에 따른 합성 조건을 최적화하는 방법을 나타낸 흐름도이다. 이하 실시예에서 각 단계들은 순차적으로 수행될 수도 있으나, 반드시 순차적으로 수행되는 것은 아니다. 예를 들어, 각 단계들의 순서가 변경될 수도 있으며, 적어도 두 단계들이 병렬적으로 수행될 수도 있다.
도 9를 참조하면, 일 실시예에 따른 최적화 장치가 단계 910 내지 단계 960을 통해 검색 공간을 재결정함으로써 합성 조건을 최적화하는 과정이 도시된다.
단계 910에서, 최적화 장치는 하나 이상의 반응물의 구조 정보, 반응물에 의해 합성할 표적 산출물의 구조 정보, 및 반응물의 합성 경로를 포함하는 그래프 형태의 표현자 및 반응물의 반응 방식을 수신한다.
단계 920에서, 최적화 장치는 신경망 기반의 예측 모델에 표현자를 인가함으로써, 반응 방식을 만족하는 표적 산출물의 생성을 위한 합성 조건들의 조합들 및 합성 경로를 포함하는 검색 공간을 결정한다. 이때, 예측 모델은 수신한 반응물의 반응 방식을 만족하는, 합성 조건들의 조합들, 합성 조건들의 조합들에 대응하는 예측 수율들, 예측 수율들에 대응하는 제1 신뢰도, 및 합성 경로 중 하나 이상을 예측하도록 학습된 신경망을 포함할 수 있다.
단계 930에서, 최적화 장치는 단계 920에서 결정된 검색 공간에서 조합들의 수율에 대응하는 제1 신뢰도에 기초하여, 조합들 중 하나 이상의 초기 조건 조합을 샘플링한다. 최적화 장치는 제1 신뢰도에 기초하여, 예측 모델에 의해 예측된 합성 조건들을 초기 조건 조합으로 선택하는 제1 비율 및 랜덤한 조건들을 초기 조건 조합으로 선택하는 제2 비율을 포함하는 선택 비율을 결정하고, 선택 비율에 따라 초기 조건 조합을 샘플링할 수 있다. 최적화 장치는 제1 신뢰도가 미리 설정된 기준보다 높은 경우, 제1 비율을 증가시키고, 제2 비율을 감소시킬 수 있다. 이와 달리, 제1 신뢰도가 미리 설정된 기준보다 낮은 경우, 최적화 장치는 제2 비율을 증가시키고, 제1 비율을 감소시킬 수 있다.
단계 940에서, 최적화 장치는 단계 930에서 샘플링된 초기 조건 조합에 의한 실험 결과의 실측 수율을 기초로, 예측 모델을 업데이트한다. 최적화 장치는 예측 모델에 의해 결정된 합성 조건들의 조합에 대응하는 예측 수율과 초기 조건 조합에 의한 실험 결과에 따른 실측 수율(yield) 간의 비교 결과에 기초하여, 예측 모델을 업데이트할 수 있다.
단계 950에서, 최적화 장치는 단계 940에서 업데이트된 예측 모델에 기초하여 조합들 간의 우선 순위를 결정한다. 최적화 장치는 업데이트 이전의 예측 모델에 의해 예측된 합성 조건들의 조합에 대응하는 제1 수율과 업데이트된 예측 모델에 의해 예측된 합성 조건들의 조합에 대응하는 제2 수율을 비교할 수 있다. 예를 들어, 제1수율보다 제2 수율이 작거나 같은 경우, 최적화 장치는 제1 수율에 대응하는 제1 조합을 선순위로 결정하고, 제2 수율에 대응하는 제2 조합을 후순위로 결정할 수 있다. 이와 달리, 제1 수율보다 제2 수율이 큰 경우, 최적화 장치는 제2 조합을 선순위로 결정하고, 제1 조합을 후순위로 결정할 수 있다.
단계 960에서, 최적화 장치는 단계 950에서 결정된 우선 순위에 따라 다음 합성 조건들의 조합들 및 다음 합성 경로를 포함하도록 검색 공간을 재결정한다. 이때, 다음 합성 조건들의 조합들에 따른 실험 결과에 따라 예측 모델이 업데이트되어 우선 순위가 재결정되며, 재결정된 우선 순위에 따라 그 다음 합성 조건들의 조합들을 포함하도록 검색 공간이 결정된다.
도 10은 다른 실시예에 따른 합성 조건을 최적화하는 방법을 설명하기 위한 도면이다. 도 10을 참조하면, 일 실시예에 따른 최적화 장치가 검색 공간을 재결정하는 과정이 도시된다.
최적화 장치는 반복 과정을 수행함으로써 하나 이상의 반응물이 주어졌을 때 다음 실험을 위한 합성 조건들의 조합들 간의 우선 순위를 계산하기 위한 획득 함수(예:
Figure pat00013
)를 자동으로 업데이트할 수 있다.
단계 1010에서, 최적화 장치는 하나 이상의 반응물의 구조 정보, 반응물에 의해 합성할 표적 산출물의 구조 정보, 및 반응물의 합성 경로를 포함하는 그래프 형태의 표현자(G(r1, r2, p))를 수신할 수 있다.
단계 1020에서, 최적화 장치는 신경망 기반의 예측 모델에 표현자(G(r1, r2, p)를 인가함으로써 반응 방식을 만족하는 표적 산출물의 생성을 위한 합성 조건들의 조합들 및 합성 경로를 포함하는 검색 공간(1025)을 결정할 수 있다. 최적화 장치는 예를 들어, 그래프 형태의 분자 구조로 표적 산출물과 반응물 구조를 포함하는 반응을 고려하여 검색 공간(1025)을 정의할 수 있다. 검색 공간(1025)은 그래프 신경망
Figure pat00014
의 예측 결과 및 예측 결과에 대응하는 불확실성(uncertainty)을 반영한 공간일 수 있다. 최적화 장치는 반응물의 구조 및/또는 표적 산출물의 구조가 주어진 특정 유기 반응에 가장 적합한 화학적 컨텍스트(context)(예: 촉매, 염기 용매, 리간드)를 예측할 수 있는 GNN 모델(예:
Figure pat00015
)을 사용하여 검색 공간(1025)을 좁힐 수 있다.
단계 1030에서, 최적화 장치는 초기 조건 조합을 샘플링할 수 있다. 최적화 장치는 초기 조건 조합으로, 예를 들어, 1035와 같이 GNN에 의해 예측된 합성 조건들의 조합들(제1 조합 및 제2 조합)을 제1 비율(50%)만큼 샘플링하고, Maximum-LHS(Maximin Latin Hypercube Sample)에 의해 예측된 합성 조건들의 조합들(제3 조합 및 제4조합)을 제2 비율(50%)만큼 샘플링하는 선택 비율을 결정할 수 있다.
최적화 장치는 예를 들어, Reaxys 데이터베이스에서 1천만 개 정도의 예제를 학습한 각 컨텍스트 조건 영역(context condition area)에 의해 여러 후보 조건 물질들을 정의하는 다중 레이블 분류 모델인 독립적인 예측 모델을 포함할 수 있다. 최적화 장치는 제한된 후보들(합성 조건들의 조합들의 후보들) 중 목표 수율을 얻을 것으로 예상되는 합성 조건들의 조합을 초기 실험을 통해 선택할 수 있다.
최적화 장치는 초기 조건 조합을 샘플링하기 위해 검색 공간(1025) 내에서 이용(Exploitation)과 탐색(Exploration)의 균형을 고려하여 합성 조건들의 조합들의 선택 비율을 결정할 수 있다. 최적화 장치는 GNN 모델(예:
Figure pat00016
)에서 예측한 조건의 후보를 제1 비율만큼 채택하고, Maximin-Latin Hypercube 샘플 방법을 사용하여 예측된 합성 조건들의 조합들을 제2 비율만큼 샘플링하여 채택할 수 있다.
단계 1040에서, 최적화 장치는 단계 1030에서 샘플링된 초기 조건 조합에 의해 실험(초기 실험)을 수행하고, 1045와 같이 실험 결과에 따른 실측 수율을 출력할 수 있다. 이때, 실측 수율은 단계 1030에서 샘플링된 4개의 초기 조건 조합에 대응할 수 있다. 단계 1030에서 샘플링된 초기 조건 조합에 의해 실험을 수행했을 때, 최적화 장치는 실측 수율에 대한 베이지언 최적화(BO)에 따른 불확실성을 반영한 모델
Figure pat00017
에 대한 목적 함수를 만들기 위해 액체 크로마토그래피-질량 분석기(liquid chromatography-mass spectrometry; LC-MS)에서 측정한 전환 수율(conversion yields)로 반응의 결과를 학습할 수 있다. 원하는 목표 수율을 달성하는 초기 실험에서 조건의 최적 조합을 찾는 것이 좋지만, 많은 경우에 초기 조건 조합에 의해 최적 조합을 찾는 것은 쉽지 않다.
단계 1050에서, 최적화 장치는 실측 수율을 기초로 예측 모델은 업데이트함으로써 합성 조건들을 최적화할 수 있다. 이때, 최적화 장치는 1055와 같이 그래프 신경망
Figure pat00018
의 예측 결과 및 실측 수율에 대한 베이지언 최적화(BO)에 따른 불확실성
Figure pat00019
을 반영한 예측 결과에 의해 합성 조건들을 최적화할 수 있다.
단계 1060에서, 최적화 장치는 단계 1050에서 업데이트된 예측 모델에 기초하여 합성 조건들의 조합들 간의 우선 순위를 결정할 수 있다. 최적화 장치는 결과 이력, GNN 모델(예:
Figure pat00020
) 및 최적화 모델 GP를 고려하여 앙상블 형태로 다음 합성 조건들의 조합들의 우선 순위를 계산할 수 있다. 최적화 장치는 효율성을 극대화하기 위해 GNN 모델(예:
Figure pat00021
)의 예측 결과뿐만 아니라 실험 결과, 과거 실험의 빈도, 및 예측 모델의 목적 함수의 불확실성을 사용한 포괄적인 판단을 통해 우선 순위를 결정할 수 있다.
최적화 장치는 예를 들어, 아래의 수학식 2를 통해 우선 순위 (
Figure pat00022
)를 결정할 수 있다.
Figure pat00023
여기서, t는 반복 횟수를 나타내고, N 은 어느 한쪽의 값이 너무 튀어 다른 쪽의 정보를 흡수해 버리는 것을 막기 위한 정규화(Nomalization) 값을 나타낼 수 있다. a, 및 b는 가중치(weight)에 나타낼 수 있다.
최적화 장치는 1065에서 가장 높은 수율에 대응하는 합성 조건들의 조합에 가장 높은 우선 순위를 부여하는 방식으로 합성 조건들의 조합들 간의 우선 순위를 결정할 수 있다.
단계 1070에서, 최적화 장치는 단계 1060에서 결정된 우선 순위에 따라 다음 합성 조건들의 조합들 및 다음 합성 경로를 포함하도록 1075와 같이 검색 공간을 재결정한 후, 재결정된 공간에 대해 단계 1040에 의한 실험을 수행할 수 있다.
최적화 장치는 목표 수율을 얻을 수 있는 합성 조건들의 최적 조합을 찾을 때까지 전술한 과정을 반복하고, 반복되는 실험의 결과가 완료될 때마다 예측 모델을 업데이트할 수 있다.
전술한 과정은 예를 들어, 수행 로봇, 및 관리 소프트웨어 등을 사용하여 유기 합성 실험을 완전 자동화로 수행할 수 있는 플랫폼에 적용될 수 있다.
도 11은 일 실시예에 따른 합성 조건을 최적화하는 장치의 블록도이다. 도 11을 참조하면, 일 실시예에 따른 최적화 장치(1100)는 사용자 인터페이스(1110), 메모리(1150) 및 프로세서(1130)를 포함할 수 있다. 사용자 인터페이스(1110), 메모리(1150) 및 프로세서(1130)는 통신 버스(1105)를 통해 서로 연결될 수 있다.
사용자 인터페이스(1110)는 하나 이상의 반응물의 구조 정보 및 반응물에 의해 합성할 표적 산출물의 구조 정보를 포함하는 그래프 형태의 표현자를 수신한다. 또한, 사용자 인터페이스(1110)는 실험 결과를 피드백(feedback) 받는 입력 수단을 의미할 수도 있다. 사용자 인터페이스(1110)는 예를 들어, 키 패드(key pad), 돔 스위치(dome switch), 터치 패드, 조그휠, 및 조그 스위치 등을 포함할 수 있으나 반드시 이에 한정되는 것은 아니다. 터치 패드는 예를 들어, 접촉식 정전 용량 방식, 압력식 저항막 방식, 적외선 감지 방식, 표면 초음파 전도 방식, 적분식 장력 측정 방식, 피에조 효과 방식 등을 포함할 수 있으나 반드시 이에 한정되는 것은 아니다.
또는 실시예에 따라서, 사용자 인터페이스(1110)는 하나 이상의 반응물의 구조 정보, 반응물에 의해 합성할 표적 산출물의 구조 정보, 및 반응물의 치환기들 및 반응기들 중 하나 이상을 포함하는 합성 경로를 포함하는 그래프 형태의 표현자 및 반응물의 반응 방식을 입력받을 수도 있다.
프로세서(1130)는 메모리(1150)에 저장된 적어도 하나의 프로그램을 실행함으로써 신경망을 구동한다. 프로세서(1130)는 신경망 기반의 예측 모델에 표현자를 인가함으로써 표적 산출물의 생성을 위한 합성 조건들의 조합들을 결정한다. 프로세서(1130)는 합성 조건들의 조합들의 수율에 대응하는 제1 신뢰도에 기초하여, 조합들 중 하나 이상의 초기 조건 조합을 선택한다. 프로세서(1130)는 초기 조건 조합에 의한 실험 결과의 실측 수율에 따라 예측 모델을 업데이트한다. 프로세서(1130)는 업데이트된 예측 모델에 기초하여 조합들 간의 우선 순위를 결정한다. 프로세서(1130)는 우선 순위에 따라 다음 합성 조건들의 조합들을 결정한다. 프로세서(1130)는 다음 합성 조건들의 조합들에 따른 실험 결과의 실측 수율에 따라 예측 모델이 업데이트 됨에 따라 우선 순위를 재결정할 수 있다. 프로세서(1130)는 재결정된 우선 순위에 따라 그 다음 합성 조건들의 조합들을 결정하고, 그 다음 합성 조건들의 조합들에 따른 실험 결과의 실측 수율이 미리 설정된 목표 수율을 만족할 때까지 우선 순위를 재결정하는 동작 및 그 다음 합성 조건들의 조합들을 결정하는 동작을 반복적으로 수행할 수 있다.
프로세서(1130)는 사용자 인터페이스(1110)를 통해 실험 결과를 피드백 받음으로써 예측 모델을 업데이트할 수 있다.
프로세서(1130)는 메모리(1150)에 포함된 실행가능한 명령어들을 실행한다. 명령어들이 프로세서(1130)에서 실행되면, 프로세서(1130)는 메모리(1150)에서 신경망 기반의 예측 모델을 호출하고, 예측 모델에 표현자를 인가한다. 프로세서(1130)는 프로그램을 실행하고, 최적화 장치(1100)를 제어할 수 있다. 프로세서(1130)에 의하여 실행되는 프로그램 코드는 메모리(1150)에 저장될 수 있다.
또는 실시예에 따라서, 프로세서(1130)는 신경망 기반의 예측 모델에 표현자를 인가함으로써, 반응 방식을 만족하는 표적 산출물의 생성을 위한 합성 조건들의 조합들 및 합성 경로를 포함하는 검색 공간을 결정한다. 프로세서(1130)는 검색 공간에서 조합들의 수율에 대응하는 제1 신뢰도에 기초하여, 합성 조건들의 조합들 중 하나 이상의 초기 조건 조합을 샘플링한다. 프로세서(1130)는 초기 조건 조합에 의한 실험 결과의 실측 수율에 따라 예측 모델을 업데이트한다. 프로세서(1130)는 업데이트된 예측 모델에 기초하여 조합들 간의 우선 순위를 결정한다. 프로세서(1130)는 우선 순위에 따라 다음 합성 조건들의 조합들을 포함하도록 검색 공간을 재결정한다. 이때, 다음 합성 조건들의 조합들에 따른 실험 결과의 실측 수율에 따라 예측 모델이 업데이트되어 우선 순위가 재결정되며, 재결정된 우선 순위에 따라 그 다음 합성 조건들의 조합들을 포함하도록 검색 공간이 결정된다.
또한, 프로세서(1130)는 도 1 내지 도 10을 통해 전술한 적어도 하나의 방법 또는 적어도 하나의 방법에 대응되는 기법을 수행할 수 있다. 프로세서(1130)는 목적하는 동작들(desired operations)을 실행시키기 위한 물리적인 구조를 갖는 회로를 가지는 하드웨어로 구현된 최적화 장치일 수 있다. 예를 들어, 목적하는 동작들은 프로그램에 포함된 코드(code) 또는 인스트럭션들(instructions)을 포함할 수 있다. 예를 들어, 하드웨어로 구현된 최적화 장치(1100)는 마이크로프로세서(microprocessor), 중앙 처리 장치(Central Processing Unit; CPU), 그래픽 처리 장치(Graphic Processing Unit; GPU), 프로세서 코어(processor core), 멀티-코어 프로세서(multi-core processor), 멀티프로세서(multiprocessor), ASIC(Application-Specific Integrated Circuit), FPGA(Field Programmable Gate Array), NPU(Neural Processing Unit) 등을 포함할 수 있다.
메모리(1150)는 적어도 하나의 프로그램을 저장한다. 또한, 메모리(1150)는 프로세서(1130)의 처리 과정에서 생성되는 다양한 정보를 저장할 수 있다. 또는 메모리(1150)는 신경망 기반의 예측 모델을 저장할 수도 있다. 이 밖에도, 메모리(1150)는 각종 데이터와 프로그램 등을 저장할 수 있다. 메모리(1150)는 휘발성 메모리 또는 비휘발성 메모리를 포함할 수 있다. 메모리(1150)는 하드 디스크 등과 같은 대용량 저장 매체를 구비하여 각종 데이터를 저장할 수 있다.
이상에서 설명된 실시예들은 하드웨어 구성요소, 소프트웨어 구성요소, 및/또는 하드웨어 구성요소 및 소프트웨어 구성요소의 조합으로 구현될 수 있다. 예를 들어, 실시예들에서 설명된 장치, 방법 및 구성요소는, 예를 들어, 프로세서, 콘트롤러, ALU(arithmetic logic unit), 디지털 신호 프로세서(digital signal processor), 마이크로컴퓨터, FPGA(field programmable gate array), PLU(programmable logic unit), 마이크로프로세서, 또는 명령(instruction)을 실행하고 응답할 수 있는 다른 어떠한 장치와 같이, 범용 컴퓨터 또는 특수 목적 컴퓨터를 이용하여 구현될 수 있다. 처리 장치는 운영 체제(OS) 및 상기 운영 체제 상에서 수행되는 소프트웨어 애플리케이션을 수행할 수 있다. 또한, 처리 장치는 소프트웨어의 실행에 응답하여, 데이터를 접근, 저장, 조작, 처리 및 생성할 수도 있다. 이해의 편의를 위하여, 처리 장치는 하나가 사용되는 것으로 설명된 경우도 있지만, 해당 기술분야에서 통상의 지식을 가진 자는, 처리 장치가 복수 개의 처리 요소(processing element) 및/또는 복수 유형의 처리 요소를 포함할 수 있음을 알 수 있다. 예를 들어, 처리 장치는 복수 개의 프로세서 또는 하나의 프로세서 및 하나의 컨트롤러를 포함할 수 있다. 또한, 병렬 프로세서(parallel processor)와 같은, 다른 처리 구성(processing configuration)도 가능하다.
소프트웨어는 컴퓨터 프로그램(computer program), 코드(code), 명령(instruction), 또는 이들 중 하나 이상의 조합을 포함할 수 있으며, 원하는 대로 동작하도록 처리 장치를 구성하거나 독립적으로 또는 결합적으로(collectively) 처리 장치를 명령할 수 있다. 소프트웨어 및/또는 데이터는, 처리 장치에 의하여 해석되거나 처리 장치에 명령 또는 데이터를 제공하기 위하여, 어떤 유형의 기계, 구성요소(component), 물리적 장치, 가상 장치(virtual equipment), 컴퓨터 저장 매체 또는 장치, 또는 전송되는 신호 파(signal wave)에 영구적으로, 또는 일시적으로 구체화(embody)될 수 있다. 소프트웨어는 네트워크로 연결된 컴퓨터 시스템 상에 분산되어서, 분산된 방법으로 저장되거나 실행될 수도 있다. 소프트웨어 및 데이터는 컴퓨터 판독 가능 기록 매체에 저장될 수 있다.
실시예에 따른 방법은 다양한 컴퓨터 수단을 통하여 수행될 수 있는 프로그램 명령 형태로 구현되어 컴퓨터 판독 가능 매체에 기록될 수 있다. 컴퓨터 판독 가능 매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있으며 매체에 기록되는 프로그램 명령은 실시예를 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다. 컴퓨터 판독 가능 기록 매체의 예에는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(magnetic media), CD-ROM, DVD와 같은 광기록 매체(optical media), 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media), 및 롬(ROM), 램(RAM), 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다. 프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함한다.
위에서 설명한 하드웨어 장치는 실시예의 동작을 수행하기 위해 하나 또는 복수의 소프트웨어 모듈로서 작동하도록 구성될 수 있으며, 그 역도 마찬가지이다.
이상과 같이 실시예들이 비록 한정된 도면에 의해 설명되었으나, 해당 기술분야에서 통상의 지식을 가진 자라면 이를 기초로 다양한 기술적 수정 및 변형을 적용할 수 있다. 예를 들어, 설명된 기술들이 설명된 방법과 다른 순서로 수행되거나, 및/또는 설명된 시스템, 구조, 장치, 회로 등의 구성요소들이 설명된 방법과 다른 형태로 결합 또는 조합되거나, 다른 구성요소 또는 균등물에 의하여 대치되거나 치환되더라도 적절한 결과가 달성될 수 있다.
그러므로, 다른 구현들, 다른 실시예들 및 특허청구범위와 균등한 것들도 후술하는 특허청구범위의 범위에 속한다.
1100: 최적화 장치
1105: 통신 버스
1110: 사용자 인터페이스
1130: 프로세서
1150: 메모리

Claims (35)

  1. 하나 이상의 반응물의 구조 정보 및 상기 반응물에 의해 합성할 표적 산출물의 구조 정보 중 적어도 하나를 포함하는 그래프 형태의 표현자를 수신하는 단계;
    신경망 기반의 예측 모델에 상기 표현자를 인가함으로써 상기 표적 산출물의 생성을 위한 합성 조건들의 조합들을 결정하는 단계;
    상기 조합들의 수율(yield)에 대응하는 제1 신뢰도에 기초하여, 상기 조합들 중 하나 이상의 초기 조건 조합을 선택하는 단계;
    상기 초기 조건 조합에 의한 실험 결과의 실측 수율을 기초로, 상기 예측 모델을 업데이트하는 단계;
    상기 업데이트된 예측 모델에 기초하여 상기 조합들 간의 우선 순위를 결정하는 단계; 및
    상기 우선 순위에 따라 다음 합성 조건들의 조합들을 결정하는 단계
    를 포함하는,
    합성 조건을 최적화하는 방법.
  2. 제1항에 있어서,
    상기 초기 조건 조합을 선택하는 단계는
    상기 제1 신뢰도에 기초하여, 상기 초기 조건 조합을 위한 선택 비율을 결정하는 단계; 및
    상기 선택 비율에 따라 상기 초기 조건 조합을 선택하는 단계
    를 포함하는, 합성 조건을 최적화하는 방법.
  3. 제2항에 있어서,
    상기 선택 비율을 결정하는 단계는
    상기 제1 신뢰도에 기초하여, 상기 예측 모델에 의해 예측된 합성 조건들을 상기 초기 조건 조합으로 선택하는 제1 비율 및 랜덤한 조건들을 상기 초기 조건 조합으로 선택하는 제2 비율을 포함하는 상기 선택 비율을 결정하는 단계
    를 포함하는, 합성 조건을 최적화하는 방법.
  4. 제3항에 있어서,
    상기 선택 비율을 결정하는 단계는
    상기 제1 신뢰도가 미리 설정된 기준보다 높은 경우, 상기 제1 비율을 증가시키고, 상기 제2 비율을 감소시키는 단계; 및,
    상기 제1 신뢰도가 상기 미리 설정된 기준보다 낮은 경우, 상기 제2 비율을 증가시키고, 상기 제1 비율을 감소시키는 단계
    을 포함하는, 합성 조건을 최적화하는 방법.
  5. 제1항에 있어서,
    상기 예측 모델은
    상기 조합들, 상기 조합들에 대응하는 예측 수율들, 및 상기 예측 수율들에 대응하는 제1 신뢰도 중 하나 이상을 예측하도록 학습된 신경망
    를 포함하는, 합성 조건을 최적화하는 방법.
  6. 제1항에 있어서,
    상기 신경망은
    상기 그래프 형태의 표현자에 기초하여 상기 반응물에서 서로 인접한 원자들 간의 연관 관계에 따라 상기 조합들을 결정하는 메시지 전달 신경망(Message Passing Neural Networks; MPNN)을 포함하는, 합성 조건을 최적화하는 방법.
  7. 제1항에 있어서,
    상기 예측 모델을 업데이트하는 단계는
    상기 예측 모델에 의해 결정된 합성 조건들의 조합에 대응하는 예측 수율과 상기 실측 수율 간의 비교 결과에 기초하여, 상기 예측 모델을 업데이트하는 단계
    를 포함하는, 합성 조건을 최적화하는 방법.
  8. 제1항에 있어서,
    상기 우선 순위를 결정하는 단계는
    상기 업데이트 이전의 예측 모델에 의해 예측된 합성 조건들의 조합에 대응하는 제1 수율과 상기 업데이트된 예측 모델에 의해 예측된 합성 조건들의 조합에 대응하는 제2 수율을 비교하는 단계; 및
    상기 비교 결과에 기초하여, 상기 조합들 간의 우선 순위를 결정하는 단계
    를 포함하는, 합성 조건을 최적화하는 방법.
  9. 제8항에 있어서,
    상기 비교 결과에 기초하여, 상기 조합들 간의 우선 순위를 결정하는 단계는
    상기 제1 수율보다 상기 제2 수율이 작거나 같은 경우, 상기 제1 수율에 대응하는 제1 조합을 선순위로 결정하고, 상기 제2 수율에 대응하는 제2 조합을 후순위로 결정하는 단계; 및
    상기 제1 수율보다 상기 제2 수율이 큰 경우, 상기 제2 조합을 선순위로 결정하고, 상기 제1 조합을 후순위로 결정하는 단계
    를 포함하는, 합성 조건을 최적화하는 방법.
  10. 제1항에 있어서,
    상기 다음 합성 조건들의 조합들을 결정하는 단계는
    상기 다음 합성 조건들의 조합들에 따른 실험 결과의 실측 수율에 따라 상기 예측 모델이 업데이트 됨에 따라 상기 우선 순위를 재결정하는 단계;
    상기 재결정된 우선 순위에 따라 그 다음 합성 조건들의 조합들을 결정하는 단계; 및
    상기 그 다음 합성 조건들의 조합들에 따른 실험 결과의 실측 수율이 미리 설정된 목표 수율을 만족할 때까지 상기 우선 순위를 재결정하는 단계 및 상기 그 다음 합성 조건들의 조합들을 결정하는 단계를 반복적으로 수행하는 단계
    를 포함하고, 합성 조건을 최적화하는 방법.
  11. 제1항에 있어서,
    상기 합성 조건들은
    촉매 조건, 리간드(ligand) 조건, 염기(Bases) 조건, 용매(Solvents) 조건, 온도 조건, 밀도 조건, 습도 조건, 반응 시간 조건, 및 압력 조건 중 하나 이상을 포함하는, 합성 조건을 최적화하는 방법.
  12. 제1항에 있어서,
    상기 그래프 형태의 표현자는
    상기 반응물의 치환기들 및 반응기들 중 하나 이상을 포함하는 합성 경로를 더 포함하는, 합성 조건을 최적화하는 방법.
  13. 제12항에 있어서,
    상기 합성 조건들의 조합들을 결정하는 단계는
    상기 신경망 기반의 예측 모델에 상기 표현자를 인가함으로써 상기 반응물의 반응 방식을 만족하도록 상기 합성 조건들의 조합들을 결정하는 단계
    를 포함하는, 합성 조건을 최적화하는 방법.
  14. 하나 이상의 반응물의 구조 정보, 상기 반응물에 의해 합성할 표적 산출물의 구조 정보, 및 상기 반응물의 합성 경로를 포함하는 그래프 형태의 표현자 및 상기 반응물의 반응 방식을 수신하는 단계;
    신경망 기반의 예측 모델에 상기 표현자를 인가함으로써, 상기 반응 방식을 만족하는 상기 표적 산출물의 생성을 위한 합성 조건들의 조합들 및 합성 경로를 포함하는 검색 공간을 결정하는 단계;
    상기 검색 공간에서 상기 조합들의 수율에 대응하는 제1 신뢰도에 기초하여, 상기 조합들 중 하나 이상의 초기 조건 조합을 샘플링하는 단계;
    상기 초기 조건 조합에 의한 실험 결과의 실측 수율을 기초로, 상기 예측 모델을 업데이트하는 단계;
    상기 업데이트된 예측 모델에 기초하여 상기 조합들 간의 우선 순위를 결정하는 단계; 및
    상기 우선 순위에 따라 다음 합성 조건들의 조합들 및 다음 합성 경로를 포함하도록 상기 검색 공간을 재결정하는 단계
    를 포함하고,
    상기 다음 합성 조건들의 조합들에 따른 실험 결과에 따라 상기 예측 모델이 업데이트되어 상기 우선 순위가 재결정되며, 상기 재결정된 우선 순위에 따라 그 다음 합성 조건들의 조합들을 포함하도록 상기 검색 공간이 결정되는, 합성 조건을 최적화하는 방법.
  15. 제14항에 있어서,
    상기 초기 조건 조합을 샘플링하는 단계는
    상기 제1 신뢰도에 기초하여, 상기 예측 모델에 의해 예측된 합성 조건들을 상기 초기 조건 조합으로 선택하는 제1 비율 및 랜덤한 조건들을 상기 초기 조건 조합으로 선택하는 제2 비율을 포함하는 선택 비율을 결정하는 단계
    를 포함하는, 합성 조건을 최적화하는 방법.
  16. 제15항에 있어서,
    상기 선택 비율을 결정하는 단계는
    상기 제1 신뢰도가 미리 설정된 기준보다 높은 경우, 상기 제1 비율을 증가시키고, 상기 제2 비율을 감소시키는 단계; 및,
    상기 제1 신뢰도가 상기 미리 설정된 기준보다 낮은 경우, 상기 제2 비율을 증가시키고, 상기 제1 비율을 감소시키는 단계
    를 포함하는, 합성 조건을 최적화하는 방법.
  17. 제14항에 있어서,
    상기 예측 모델은
    상기 반응 방식을 만족하는, 상기 조합들, 상기 조합들에 대응하는 예측 수율들, 상기 예측 수율들에 대응하는 제1 신뢰도, 및 합성 경로 중 하나 이상을 예측하도록 학습된 신경망
    을 포함하는, 합성 조건을 최적화하는 방법.
  18. 제14항에 있어서,
    상기 예측 모델을 업데이트하는 단계는
    상기 예측 모델에 의해 결정된 합성 조건들의 조합에 대응하는 예측 수율과 상기 초기 조건 조합에 의한 실험 결과에 따른 실측 수율(yield) 간의 비교 결과에 기초하여, 상기 예측 모델을 업데이트하는 단계
    를 포함하는, 합성 조건을 최적화하는 방법.
  19. 제14항에 있어서,
    상기 우선 순위를 결정하는 단계는
    상기 업데이트 이전의 예측 모델에 의해 예측된 합성 조건들의 조합에 대응하는 제1 수율과 상기 업데이트된 예측 모델에 의해 예측된 합성 조건들의 조합에 대응하는 제2 수율을 비교하는 단계; 및
    상기 제1 수율보다 상기 제2 수율이 작거나 같은 경우, 상기 제1 수율에 대응하는 제1 조합을 선순위로 결정하고, 상기 제2 수율에 대응하는 제2 조합을 후순위로 결정하는 단계; 및
    상기 제1 수율보다 상기 제2 수율이 큰 경우, 상기 제2 조합을 선순위로 결정하고, 상기 제1 조합을 후순위로 결정하는 단계
    를 포함하는, 합성 조건을 최적화하는 방법.
  20. 하드웨어와 결합되어 제1항 내지 제19항 중 어느 하나의 항의 방법을 실행시키기 위하여 컴퓨터 판독 가능한 기록매체에 저장된 컴퓨터 프로그램.
  21. 하나 이상의 반응물의 구조 정보 및 상기 반응물에 의해 합성할 표적 산출물의 구조 정보 중 적어도 하나를 포함하는 그래프 형태의 표현자를 수신하는 사용자 인터페이스;
    적어도 하나의 프로그램이 저장된 메모리; 및
    상기 적어도 하나의 프로그램을 실행함으로써 신경망을 구동하는 프로세서
    를 포함하고,
    상기 프로세서는
    상기 신경망 기반의 예측 모델에 상기 표현자를 인가함으로써 상기 표적 산출물의 생성을 위한 합성 조건들의 조합들을 결정하고, 상기 조합들의 수율에 대응하는 제1 신뢰도에 기초하여, 상기 조합들 중 하나 이상의 초기 조건 조합을 선택하고, 상기 초기 조건 조합에 의한 실험 결과의 실측 수율에 따라 상기 예측 모델을 업데이트하고, 상기 업데이트된 예측 모델에 기초하여 상기 조합들 간의 우선 순위를 결정하고, 상기 우선 순위에 따라 다음 합성 조건들의 조합들을 결정하며,
    상기 다음 합성 조건들의 조합들에 따른 실험 결과의 실측 수율에 따라 상기 예측 모델이 업데이트되어 상기 우선 순위가 재결정되며, 상기 재결정된 우선 순위에 따라 그 다음 합성 조건들의 조합들이 결정되는, 합성 조건을 최적화하는 장치.
  22. 제21항에 있어서,
    상기 프로세서는
    상기 제1 신뢰도에 기초하여, 상기 초기 조건 조합을 위한 선택 비율을 결정하고, 상기 선택 비율에 따라 상기 초기 조건 조합을 선택하는, 합성 조건을 최적화하는 장치.
  23. 제22항에 있어서,
    상기 프로세서는
    상기 제1 신뢰도에 기초하여, 상기 예측 모델에 의해 예측된 합성 조건들을 상기 초기 조건 조합으로 선택하는 제1 비율 및 랜덤한 조건들을 상기 초기 조건 조합으로 선택하는 제2 비율을 포함하는 상기 선택 비율을 결정하는, 합성 조건을 최적화하는 장치.
  24. 제23항에 있어서,
    상기 프로세서는
    상기 제1 신뢰도가 미리 설정된 기준보다 높은 경우, 상기 제1 비율을 증가시키고, 상기 제2 비율을 감소시키며,
    상기 제1 신뢰도가 상기 미리 설정된 기준보다 낮은 경우, 상기 제2 비율을 증가시키고, 상기 제1 비율을 감소시키는,
    합성 조건을 최적화하는 장치.
  25. 제21항에 있어서,
    상기 예측 모델은
    상기 조합들, 상기 조합들에 대응하는 예측 수율들, 및 상기 예측 수율들에 대응하는 제1 신뢰도 중 하나 이상을 예측하도록 학습된 신경망을 포함하는, 합성 조건을 최적화하는 장치.
  26. 제21항에 있어서,
    상기 신경망은
    상기 그래프 형태의 표현자에 기초하여 상기 반응물에서 서로 인접한 원자들 간의 연관 관계에 따라 상기 조합들을 결정하는 메시지 전달 신경망(Message Passing Neural Networks; MPNN)
    을 포함하는, 합성 조건을 최적화하는 장치.
  27. 제21항에 있어서,
    상기 프로세서는
    상기 예측 모델에 의해 결정된 합성 조건들의 조합에 대응하는 예측 수율과 상기 실측 수율 간의 비교 결과에 기초하여, 상기 예측 모델을 업데이트하는, 합성 조건을 최적화하는 장치.
  28. 제21항에 있어서,
    상기 프로세서는
    상기 업데이트 이전의 예측 모델에 의해 예측된 합성 조건들의 조합에 대응하는 제1 수율과 상기 업데이트된 예측 모델에 의해 예측된 합성 조건들의 조합에 대응하는 제2 수율을 비교하고,
    상기 비교 결과에 기초하여, 상기 조합들 간의 우선 순위를 결정하는, 합성 조건을 최적화하는 장치.
  29. 제28항에 있어서,
    상기 프로세서는
    상기 1수율보다 상기 제2 수율이 작거나 같은 경우, 상기 제1 수율에 대응하는 제1 조합을 선순위로 결정하고, 상기 제2 수율에 대응하는 제2 조합을 후순위로 결정하고,
    상기 제1 수율보다 상기 제2 수율이 큰 경우, 상기 제2 조합을 선순위로 결정하고, 상기 제1 조합을 후순위로 결정하는,
    합성 조건을 최적화하는 장치.
  30. 제21항에 있어서,
    상기 프로세서는
    상기 다음 합성 조건들의 조합들에 따른 실험 결과의 실측 수율에 따라 상기 예측 모델이 업데이트 됨에 따라 상기 우선 순위를 재결정하고,
    상기 재결정된 우선 순위에 따라 그 다음 합성 조건들의 조합들을 결정하며,
    상기 그 다음 합성 조건들의 조합들에 따른 실험 결과의 실측 수율이 미리 설정된 목표 수율을 만족할 때까지 상기 우선 순위를 재결정하는 동작 및 상기 그 다음 합성 조건들의 조합들을 결정하는 동작을 반복적으로 수행하는,
    합성 조건을 최적화하는 장치.
  31. 제21항에 있어서,
    상기 합성 조건들은
    촉매 조건, 염기 조건, 용매 조건, 온도 조건, 밀도 조건, 습도 조건, 반응 시간 조건, 및 압력 조건 중 하나 이상을 포함하는, 합성 조건을 최적화하는 장치.
  32. 제21항에 있어서,
    상기 그래프 형태의 표현자는
    상기 반응물의 반응 방식을 더 포함하는, 합성 조건을 최적화하는 장치.
  33. 제21항에 있어서,
    상기 프로세서는
    상기 신경망 기반의 예측 모델에 상기 표현자를 인가함으로써 상기 반응물의 반응 방식을 만족하도록 상기 합성 조건들의 조합들을 결정하는, 합성 조건을 최적화하는 장치.
  34. 하나 이상의 반응물의 구조 정보, 상기 반응물에 의해 합성할 표적 산출물의 구조 정보, 및 상기 반응물의 치환기들 및 반응기들 중 하나 이상을 포함하는 합성 경로를 포함하는 그래프 형태의 표현자 및 상기 반응물의 반응 방식을 수신하는 사용자 인터페이스;
    적어도 하나의 프로그램이 저장된 메모리; 및
    상기 적어도 하나의 프로그램을 실행함으로써 신경망을 구동하는 프로세서
    를 포함하고,
    상기 프로세서는
    상기 신경망 기반의 예측 모델에 상기 표현자를 인가함으로써, 상기 반응 방식을 만족하는 상기 표적 산출물의 생성을 위한 합성 조건들의 조합들 및 합성 경로를 포함하는 검색 공간을 결정하고,
    상기 검색 공간에서 상기 조합들의 수율에 대응하는 제1 신뢰도에 기초하여, 상기 조합들 중 하나 이상의 초기 조건 조합을 샘플링하고,
    상기 초기 조건 조합에 의한 실험 결과의 실측 수율에 따라 상기 예측 모델을 업데이트하고,
    상기 업데이트된 예측 모델에 기초하여 상기 조합들 간의 우선 순위를 결정하고,
    상기 우선 순위에 따라 다음 합성 조건들의 조합들을 포함하도록 상기 검색 공간을 재결정하며,
    상기 다음 합성 조건들의 조합들에 따른 실험 결과의 실측 수율에 따라 상기 예측 모델이 업데이트되어 상기 우선 순위가 재결정되며, 상기 재결정된 우선 순위에 따라 그 다음 합성 조건들의 조합들을 포함하도록 상기 검색 공간이 결정되는, 합성 조건을 최적화하는 장치.
  35. 제34항에 있어서,
    상기 예측 모델은
    상기 반응 방식을 만족하는, 상기 조합들, 상기 조합들에 대응하는 예측 수율들, 상기 예측 수율들에 대응하는 제1 신뢰도, 및 합성 경로 중 하나 이상을 예측하도록 학습된 신경망
    을 포함하는, 합성 조건을 최적화하는 장치.
KR1020210155792A 2021-08-27 2021-11-12 표적 산출물의 생성을 위한 합성 조건을 최적화하는 방법 및 장치 KR20230031753A (ko)

Priority Applications (3)

Application Number Priority Date Filing Date Title
US17/745,374 US20230063171A1 (en) 2021-08-27 2022-05-16 Method and apparatus for optimizing synthetic conditions for generation of target products
EP22181239.9A EP4141876A1 (en) 2021-08-27 2022-06-27 Method and apparatus for optimizing synthetic conditions for generation of target products
CN202210889560.1A CN115730677A (zh) 2021-08-27 2022-07-27 优化合成条件的方法、非瞬时性计算机可读存储介质、和用于合成条件的装置

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR1020210114066 2021-08-27
KR20210114066 2021-08-27

Publications (1)

Publication Number Publication Date
KR20230031753A true KR20230031753A (ko) 2023-03-07

Family

ID=85512258

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020210155792A KR20230031753A (ko) 2021-08-27 2021-11-12 표적 산출물의 생성을 위한 합성 조건을 최적화하는 방법 및 장치

Country Status (1)

Country Link
KR (1) KR20230031753A (ko)

Similar Documents

Publication Publication Date Title
Gentile et al. Artificial intelligence–enabled virtual screening of ultra-large chemical libraries with deep docking
CN110277144B (zh) 使用累积的化学数据创建具有期望性质的新化学化合物以构建用于合成的新化学结构
Guha On exploring structure–activity relationships
Betz et al. How effectively can adaptive sampling methods capture spontaneous ligand binding?
Lampa et al. SciPipe: A workflow library for agile development of complex and dynamic bioinformatics pipelines
Xanthopoulos et al. Putting the Human Back in the AutoML Loop.
Harada Simple, yet efficient conformational sampling methods for reproducing/predicting biologically rare events of proteins
JP2022027571A (ja) ニューラルネットワークを利用して標的生成物を合成する装置及びその方法
KR20210050952A (ko) 뉴럴 네트워크를 이용하여 실험 조건을 최적화하는 장치 및 방법
JP2023537933A (ja) 簡易化された分子入力線エントリ・システム反応からの有機合成手順の生成
US20230223112A1 (en) Retrosynthesis using neural networks
Clancy et al. From proteomes to complexomes in the era of systems biology
Dong et al. XGBoost‐based intelligence yield prediction and reaction factors analysis of amination reaction
Wang et al. Identifying general reaction conditions by bandit optimization
Wang et al. A web server for identifying circRNA-RBP variable-length binding sites based on stacked generalization ensemble deep learning network
Ueda et al. RNA Modification Detection Using Nanopore Direct RNA Sequencing and nanoDoc2
KR20230031753A (ko) 표적 산출물의 생성을 위한 합성 조건을 최적화하는 방법 및 장치
Fonseca et al. Force Field Analysis Software and Tools (FFAST): Assessing Machine Learning Force Fields under the Microscope
US20230335231A1 (en) Prediction of chemical compounds with desired properties
JP6500698B2 (ja) 組み合わせ計算によるイベント駆動ソフトウェアのイベント・シーケンス構築
Mendiburu et al. Parallel EDAs to create multivariate calibration models for quantitative chemical applications
US20220165365A1 (en) Complex architecture for reaction condition determination
US20230063171A1 (en) Method and apparatus for optimizing synthetic conditions for generation of target products
Siramshetty et al. Artificial Intelligence in ADME Property Prediction
Mardikoraem et al. Machine Learning-Driven Protein Library Design: A Path Toward Smarter Libraries