KR102494470B1 - 약물 상호 작용을 예측하는 전자장치 및 그 제어방법 - Google Patents

약물 상호 작용을 예측하는 전자장치 및 그 제어방법 Download PDF

Info

Publication number
KR102494470B1
KR102494470B1 KR1020210165331A KR20210165331A KR102494470B1 KR 102494470 B1 KR102494470 B1 KR 102494470B1 KR 1020210165331 A KR1020210165331 A KR 1020210165331A KR 20210165331 A KR20210165331 A KR 20210165331A KR 102494470 B1 KR102494470 B1 KR 102494470B1
Authority
KR
South Korea
Prior art keywords
drug
information
gene expression
expression information
electronic device
Prior art date
Application number
KR1020210165331A
Other languages
English (en)
Inventor
남호정
김은영
Original Assignee
광주과학기술원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 광주과학기술원 filed Critical 광주과학기술원
Priority to KR1020210165331A priority Critical patent/KR102494470B1/ko
Priority to PCT/KR2022/004438 priority patent/WO2023096034A1/ko
Application granted granted Critical
Publication of KR102494470B1 publication Critical patent/KR102494470B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/042Knowledge-based neural networks; Logical representations of neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H20/00ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance
    • G16H20/10ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance relating to drugs or medications, e.g. for ensuring correct administration to patients
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/50ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for simulation or modelling of medical disorders
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H70/00ICT specially adapted for the handling or processing of medical references
    • G16H70/40ICT specially adapted for the handling or processing of medical references relating to drugs, e.g. their side effects or intended usage

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Public Health (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Epidemiology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biomedical Technology (AREA)
  • Mathematical Physics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Primary Health Care (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biophysics (AREA)
  • Chemical & Material Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Molecular Biology (AREA)
  • Computational Linguistics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Medicinal Chemistry (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Evolutionary Biology (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Pathology (AREA)
  • Biotechnology (AREA)
  • Toxicology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioethics (AREA)
  • Medical Treatment And Welfare Office Work (AREA)

Abstract

본 발명의 일 실시예에 따른 약물 상호 작용(DDI)을 예측하는 전자장치에 있어서, 약물 구조 정보 및 약물 속성 정보를 이용하여 약물의 유전자 발현 정보를 식별하고, 상기 유전자 발현 정보와 약물의 조합에 따른 부작용에 관한 정보를 이용하여 제1약물 및 제2약물의 동시 복용에 따른 약물 상호 작용에 관한 정보를 식별하는 프로세서를 포함한다.

Description

약물 상호 작용을 예측하는 전자장치 및 그 제어방법{Electronic device for predicting Drug-Drug Interactions and the control method thereof}
본 발명은 약물 상호 작용을 예측하는 전자장치 및 그 제어방법에 관한 것이다.
다약제(Polypharmacy)로 인해 여러 약물을 동시에 복용하는 환자 수가 증가하는 추세이다. 여러 약물을 동시에 복용하는 경우 각 약물에 대해 기대하는 반응이 변경되어, 경우에 따라 예상치 못한 부작용이 발생하거나 치료 효능이 저하되는 등의 문제가 발생할 수 있다.
이와 같이 두 개 이상의 약물을 동시 투여하는 경우 그 효과에 변화가 나타나는 현상을 약물-약물 상호 작용(DDI: Drug-Drug Interactions)이라고 한다. 잠재적인 DDI를 사전에 식별하는 것은 다약제의 주요 대상이 되는 환자나 노인에게 중요하다.
DDI는 일반적으로 실험을 통해 발견되나, DDI의 시험관 내(in vitro) 및 생체 내(in vivo) 식별은 시간과 비용을 증가시킬 뿐 아니라, 환자 안전 및 윤리적인 문제로 인해 실행이 어려운 실정이다.
현재 DDI는 과거 연구, 전자 건강 기록 및 소셜 미디어에서 검색한 데이터 세트를 사용하는 등의 유사성 기반 및 네트워크 기반 접근 방식으로 예측할 수 있다.
그러나 대부분의 연구는 모델의 해석 가능성(interpretability)을 무시하고 약물 화합물에서 유래한 특징만을 사용했기 때문에 모델은 약물 치료에서 파생된 DDI 메커니즘의 특성을 포착할 수 없다. 또한, 학습에 사용되지 않은 새로운 화합물의 상호 작용을 예측하는 것은 여전히 해결해야 할 과제 중 하나이다.
본 발명의 목적은 약물 상호 작용의 해석 가능한 예측을 수행하는 전자장치 및 그 제어방법을 제공하는 것이다.
본 발명의 목적은 학습에 사용되지 않은 새로운 약물에 대해서도 잠재적인 약물 상호 작용을 예측할 수 있는 전자장치 및 그 제어방법을 제공하는 것이다.
본 발명의 일 실시예에 따른 약물 상호 작용(DDI)을 예측하는 전자장치에 있어서, 약물 구조 정보 및 약물 속성 정보를 이용하여 약물의 유전자 발현 정보를 식별하고, 상기 유전자 발현 정보와 약물의 조합에 따른 부작용에 관한 정보를 이용하여 제1약물 및 제2약물의 동시 복용에 따른 약물 상호 작용에 관한 정보를 식별하는 프로세서를 포함한다.
상기 프로세서는, 상기 약물 구조 정보 및 상기 약물 속성 정보에 따라 상기 유전자 발현 정보의 연산을 수행하도록 학습된 제1모델에 기초하여 상기 유전자 발현 정보를 식별할 수 있다.
상기 프로세서는, 상기 유전자 발현 정보와 상기 부작용에 관한 정보에 따라 상기 약물 상호 작용에 관한 정보의 연산을 수행하도록 학습된 제2모델에 기초하여 상기 약물 상호 작용에 관한 정보를 식별할 수 있다.
상기 제2모델은 상기 유전자 발현 정보에 가중치(weight)를 부여하여 상기 약물 상호 작용에 관한 정보의 연산을 수행하도록 학습된 모델일 수 있다.
상기 프로세서는, 상기 제2모델에 기초하여 부작용 차원 상에서 상기 제1약물의 유전자 발현 정보 및 상기 제2약물의 유전자 발현 정보 간 거리를 계산하여 상기 약물 상호 작용에 관한 정보를 식별할 수 있다.
상기 약물 상호 작용에 관한 정보는 상기 제1약물 및 상기 제2약물의 동시 복용에 따른 부작용 여부 및 부작용의 정도에 관한 정보를 포함할 수 있다.
본 발명의 일 실시예에 따른 약물 상호 작용(DDI)을 예측하는 전자장치의 제어방법에 있어서, 약물 구조 정보 및 약물 속성 정보를 이용하여 약물의 유전자 발현 정보를 식별하는 단계; 및 상기 유전자 발현 정보와 약물의 조합에 따른 부작용에 관한 정보를 이용하여 제1약물 및 제2약물의 동시 복용에 따른 약물 상호 작용에 관한 정보를 식별하는 단계를 포함한다.
상기 약물의 유전자 발현 정보를 식별하는 단계는, 상기 약물 구조 정보 및 상기 약물 속성 정보에 따라 상기 유전자 발현 정보의 연산을 수행하도록 학습된 제1모델에 기초하여 상기 유전자 발현 정보를 식별하는 단계를 포함할 수 있다.
상기 약물 상호 작용에 관한 정보를 식별하는 단계는, 상기 유전자 발현 정보와 상기 부작용에 관한 정보에 따라 상기 약물 상호 작용에 관한 정보의 연산을 수행하도록 학습된 제2모델에 기초하여 상기 약물 상호 작용에 관한 정보를 식별하는 단계를 포함할 수 있다.
본 발명의 일 실시예에 따르면, 2 이상의 약물 복용 시 발생할 수 있는 부작용에 대해 학습된 모델을 통해 보다 빠르고 간편하게 예측할 수 있다.
본 발명의 일 실시예에 따르면, 새로운 약물 혹은 화합물과의 상호작용 가능성을 보다 신뢰도 높게 예측할 수 있다.
본 발명의 일 실시예에 따르면, 게이팅 메커니즘과 부작용 정보를 반영하여 모델 해석성을 제공하면서 높은 DDI 예측 정확도를 가지는 모델을 제공할 수 있다.
도 1은 약물 상호 작용을 도시한 도면이다.
도 2는 본 발명의 일 실시예에 따른 전자장치의 구성을 도시한 블럭도이다.
도 3은 본 발명의 일 실시예에 따른 전자장치의 동작 흐름도를 도시한 도면이다.
도 4는 본 발명의 일 실시예에 따른 제1모델을 학습하는 모습을 도시한 도면이다.
도 5는 본 발명의 일 실시예에 따른 제2모델을 학습하는 모습을 도시한 도면이다.
도 6은 본 발명의 일 실시예에 따른 제2모델의 점수 계산 모듈을 도시한 도면이다.
이하, 본 발명에 따른 바람직한 실시 형태를 첨부된 도면을 참조하여 상세하게 설명한다. 첨부된 도면과 함께 이하에 개시될 상세한 설명은 본 발명의 예시적인 실시형태를 설명하고자 하는 것이며, 본 발명이 실시될 수 있는 유일한 실시형태를 나타내고자 하는 것이 아니다. 도면에서 본 발명을 명확하게 설명하기 위해서 설명과 관계없는 부분은 생략할 수 있고, 명세서 전체를 통하여 동일 또는 유사한 구성 요소에 대해서는 동일한 참조 부호를 사용할 수 있다. 또한, 본 발명의 실시예에서, 제1, 제2 등과 같이 서수를 포함하는 용어는 하나의 구성요소를 다른 구성요소로부터 구별하는 목적으로만 사용되며, 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다.
도 1은 본 발명의 일 실시예에 따른 약물 상호 작용을 도시한 도면이다.
약물 상호 작용(DDI, 이하 양자 혼용하여 사용한다.)은 2 이상의 약물을 동시에 복용하는 경우 상협 작용(synergetic), 상합 작용(additive)과 같이 시너지 효과를 보이는 긍정적인 방향으로 나타나기도 하지만, 길항 작용(antagonistic)이나 독성(toxic) 등 부작용을 보이는 부정적인 방향으로도 나타난다.
약물 상호 작용은 약물의 개수가 늘어날 수록 빈도가 크며, 따라서 약을 많이 복용하는 환자나 노인들에게 발생할 가능성이 높다. 모든 경우의 약물의 쌍(pair)에 대한 실험은 시간적으로나 비용적 측면에서 불가능하며, 부작용은 빈도수가 상대적으로 낮으며 다양하게 발생할 수 있기 때문에 실험을 통해 발견하는데 어려움이 있다.
이하 설명에서는 약물의 유전자 발현 정보를 반영하고, 약물 상호 작용의 모델 해석성을 통해 약물 상호 작용의 정확도 높은 예측을 수행하고, 학습에 사용되지 않은 새로운 약물에 대해서도 잠재적인 약물 상호 작용의 예측을 수행하는 전자장치(100)에 대해서 구체적으로 설명한다.
도 2는 본 발명의 일 실시예에 따른 전자장치의 구성을 도시한 블럭도이다.
본 발명의 일 실시예에 따른 약물 상호 작용을 예측하는 장치인 전자장치(100)는 입력부(110), 통신부(120), 표시부(130), 메모리(140) 및 프로세서(150)를 포함한다.
입력부(110)는 전자장치(100)의 사용자 입력에 대응하여 입력데이터를 발생시킨다. 입력부(110)는 적어도 하나의 입력수단을 포함한다. 입력부(110)는 키보드(key board), 키패드(key pad), 돔 스위치(dome switch), 터치패널(touch panel), 터치 키(touch key), 마우스(mouse), 메뉴 버튼(menu button) 등을 포함할 수 있다.
통신부(120)는 외부 장치(미도시), 예컨대, 약물 구조 정보나 약물 속성 정보 등 2 이상의 약물 복용 시 나타나는 약물 상호 작용에 대한 정보를 예측하기 위해 필요한 정보를 제공하는 서버와의 통신을 수행한다. 이를 위해, 통신부(120)는 5G(5th generation communication), LTE-A(long term evolution-advanced), LTE(long term evolution), Wi-Fi(wireless fidelity) 등의 통신을 수행할 수 있다.
표시부(130)는 전자장치(100)의 동작에 따른 표시 데이터를 표시한다. 표시부(130)는 액정 디스플레이(LCD; liquid crystal display), 발광 다이오드(LED; light emitting diode) 디스플레이, 유기 발광 다이오드(OLED; organic LED) 디스플레이, 마이크로 전자기계 시스템(MEMS; micro electro mechanical systems) 디스플레이 및 전자 종이(electronic paper) 디스플레이를 포함한다. 표시부(130)는 입력부(110)와 결합되어 터치 스크린(touch screen)으로 구현될 수 있다.
메모리(140)는 전자장치(100)의 동작 프로그램들을 저장한다. 메모리(140)는 전원의 제공 유무와 무관하게 데이터(정보)를 보존할 수 있는 비휘발성 속성의 스토리지(storage)와, 프로세서(150)에 의해 처리되기 위한 데이터가 로딩되며 전원이 제공되지 않으면 데이터를 보존할 수 없는 휘발성 속성의 메모리(memory)를 포함한다. 스토리지에는 플래시메모리(flash-memory), HDD(hard-disc drive), SSD(solid-state drive) ROM(Read Only Memory) 등이 있으며, 메모리에는 버퍼(buffer), 램(RAM; Random Access Memory) 등이 있다.
메모리(140)는 약물 구조 정보 및 약물 속성 정보를 저장하거나, 프로세서(150)에 의해 식별된 약물의 유전자 발현 정보를 저장할 수 있다. 또한, 메모리(140)는 약물 구조 정보 및 약물 속성 정보에 따라 유전자 발현 정보의 연산을 수행하도록 학습된 제1모델에 관한 정보, 유전자 발현 정보에 따라 2 이상의 약물 복용 시 나타나는 약물 상호 작용에 관한 정보의 연산을 수행하도록 학습된 제2모델에 관한 정보를 저장할 수 있다.
프로세서(150)는 프로그램 등 소프트웨어를 실행하여 전자장치(100)의 적어도 하나의 다른 구성요소(예: 하드웨어 또는 소프트웨어 구성요소)를 제어할 수 있고, 다양한 데이터 처리 또는 연산을 수행할 수 있다.
한편, 프로세서(150)는 약물 구조 정보 및 약물 속성 정보를 이용하여 약물의 유전자 발현 정보를 식별하고, 유전자 발현 정보와 약물의 조합에 따른 부작용에 관한 정보를 이용하여 제1약물 및 제2약물의 동시 복용에 따른 약물 상호 작용에 관한 정보를 식별하기 위한 데이터 분석, 처리, 및 결과 정보 생성 중 적어도 일부를 규칙 기반 또는 인공지능(Artificial Intelligence) 알고리즘으로서 기계학습, 신경망 네트워크(neural network), 또는 딥러닝 알고리즘 중 적어도 하나를 이용하여 수행할 수 있다. 신경망 네트워크의 예로는, CNN (Convolutional Neural Network), DNN (Deep Neural Network), RNN (Recurrent Neural Network)과 같은 모델을 포함할 수 있다.
도 3은 본 발명의 일 실시예에 따른 전자장치의 동작 흐름도를 도시한 도면이다.
본 발명의 일 실시예에 따르면, 프로세서(150)는 약물 구조 정보 및 약물 속성 정보를 이용하여 약물의 유전자 발현 정보를 식별한다(S310).
약물 구조 정보 및 약물 속성 정보는 약물을 표현하기 위해 주로 사용되는 인자이다. 약물 구조 정보는 분자 구조 핑거프린트(fingerprint), 예를 들어, Morgan Fingerprint를 사용하여 컴파운드(compound) 내 각 원자마다 특정 반경(radius) 이내의 수조를 수치화하여 해싱 함수(hashing function)를 이용하여 바이너리 벡터(binary vector)로 표현할 수 있다.
약물 속성 정보는 컴파운드의 분자 구조에 대한 분자의 물리적, 화학적 정보를 정량적으로 기술한 정보를 의미한다.
프로세서(150)는 수많은 속성 정보 중 유전자 발현 정보를 식별하기 위해 필요한 일부 속성 정보를 이용하도록 전처리 작업을 수행하거나, 이용할 정보를 선별할 수 있다. 예를 들어, 프로세서(150)는 모드레드 디스크립터(Mordred descriptor)와 같은 공지된 데이터베이스로부터 컴파운드에 대한 데이터를 얻은 후, random forest 모델을 이용하여 유의미한 100개의 속성 정보만을 선택할 수 있다. 혹은 프로세서(150)는 이러한 과정을 거쳐 선택된 속성 정보를 외부로부터 수신할 수 있으며, 어느 하나에 한정되는 것은 아니다.
본 발명의 일 실시예에 따라, 제1약물 및 제2약물을 동시 복용한 경우의 약물 상호 작용에 대해 예측을 수행한다고 가정한다. 프로세서(150)는 제1약물의 약물 구조 정보 및 약물 속성 정보를 이용하여 제1약물의 유전자 발현 정보를 식별하고, 제2약물의 약물 구조 정보 및 약물 속성 정보를 이용하여 제2약물의 유전자 발현 정보를 식별할 수 있다.
이때, 프로세서(150)는 약물 구조 정보 및 약물 속성 정보에 따라 유전자 발현 정보의 연산을 수행하도록 학습된 제1모델에 기초하여, 제1약물 및 제2약물의 유전자 발현 정보를 식별할 수 있다. 제1모델에 관한 자세한 내용은 도 4에서 서술한다.
본 발명의 일 실시예에 따르면, 프로세서(150)는 유전자 발현 정보와 약물의 조합에 따른 부작용에 관한 정보를 이용하여 제1약물 및 제2약물의 동시 복용에 따른 약물 상호 작용에 관한 정보를 식별한다(S320).
본 발명의 일 실시예에서 약물의 조합에 따른 부작용에 관한 정보는 특정 두 약물을 동시 복용한 경우 발생하는 것으로 알려지거나 실험된 부작용 정보를 포함한다.
본 발명의 일 실시예에서 약물 상호 작용에 관한 정보는 제1약물 및 제2약물의 동시 복용에 따른 부작용 여부 및 그 부작용의 정도에 관한 정보를 포함한다. 보다 구체적으로, 부작용 차원 상에서 두 약물의 유전자 발현 정보 간 거리를 계산하여 부작용 여부 및 그 부작용의 정도에 관한 정보를 식별한다. 관련하여 도 6에서 자세히 서술한다.
이때, 프로세서(150)는 유전자 발현 정보에 따라 상기 제1약물 및 상기 제2약물의 동시 복용 시 나타나는 약물 상호 작용에 관한 정보의 연산을 수행하도록 학습된 제2모델에 기초하여 약물 상호 작용에 관한 정보를 식별할 수 있다. 제2모델에 관한 자세한 내용은 도 5에서 서술한다.
본 발명의 일 실시예에 따르면, 두 개 이상의 약물 복용 시 부작용이 발생할 수 있는 약물 쌍 및 어떤 부작용이 발생할 것인지 예측하여 약물 복용의 위험도를 낮출 수 있다.
도 4는 본 발명의 일 실시예에 따른 제1모델(400)을 학습하는 모습을 도시한 도면이다.
본 발명의 일 실시예에서는 약물 구조 정보(410) 및 약물 속성 정보(420)에 따라 유전자 발현 정보(430)의 연산을 수행하도록 학습된 제1모델(400)에 대해 자세히 설명한다. 이때, 프로세서(150)가 제1모델(400)을 학습하거나, 기 학습되어 생성된 제1모델(400)을 외부로부터 수신 및 저장하여 이용할 수 있으며 어느 하나에 한정된 것은 아니다. 이하 프로세서(150)가 제1모델(400)을 학습하는 경우의 동작을 설명한다.
제1모델(400)은 약물 정보를 기반하여 약물 처리 유전자 발현 정보를 생성하는 모델로, 약물의 구조 정보(410) 및 속성 정보(420)를 입력값으로 사용하고, 입력값에 따라 예측된 유전자 발현 정보(430)를 출력값으로 출력한다.
제1모델(400)의 학습 데이터로 약물을 다양한 세포주에 처리하여 일정 시간 후 변화한 유전자 발현을 측정한 데이터를 사용할 수 있다. 일 예로, 표준 데이터 세트는 LINCS(Library of Integrated Network-Based Cellular Signatures) L1000 데이터베이스일 수 있다. LINCS 데이터는 컴파운드(compound), 세포주(cell lines), 유전자(genes), 반응 시그니처(response signature)의 유전자 발현 정보를 포함한다.
이때, 프로세서(150)는 학습 데이터를 이용하여 신경망 네트워크를 학습시키기 전에, 획득된 학습 데이터에 대하여 기 설정된 포맷으로 가공하거나, 노이즈를 제거하여 적절한 데이터 형태로 가공하는 등 전처리 작업을 수행하거나, 또는 복수의 학습 데이터 중에서 학습에 이용될 데이터를 선별할 수 있다.
따라서, 프로세서(150)는 제1모델(400)을 생성하기 위한 학습 데이터로써 LINCS 로 데이터(Raw data)를 가공한 LINCS 데이터를 사용할 수 있다. 먼저, 신뢰도를 위해 직접 측정한 978개의 유전자(genes)의 유전자 발현 정보를 추출하고, 컴파운드의 각 유전자 발현 정보를 다양한 실험 조건에서 취하였기 때문에 변화량을 수치화한 'Signature Strength'(SS) 값을 사용하여 컴파운드의 대표 시그니처를 선별할 수 있다. 마지막으로, 유기 화합물을 선택하고 19,156개의 컴파운드의 유전자 발현 정보를 얻을 수 있다.
제1모델(400)은 기본 덴스 레이어(dense layer)로 구성되며, 알려진 유전자 발현 정보와의 차이를 줄이는 방향으로 학습될 수 있다.
본 발명의 일 실시예에 따르면, 모든 약물에 대한 약물 반응성 정보인 유전자 발현 정보를 얻기 힘들기 때문에, 이를 예측하는 모델을 통해 유전자 발현 정보가 없는 약물에 대해서도 약물 상호 작용을 예측할 수 있다.
도 5는 본 발명의 일 실시예에 따른 제2모델(500)을 학습하는 모습을 도시한 도면이다.
본 발명의 일 실시예에서는 유전자 발현 정보(510)와 약물의 조합에 따른 부작용에 관한 정보(520)에 따라, 2 이상의 약물 복용 시 나타나는 약물 상호 작용에 관한 정보(530)의 연산을 수행하도록 학습된 제2모델(500)에 대해 자세히 설명한다. 이때, 프로세서(150)가 제2모델(500)을 학습하거나, 기 학습되어 생성된 제2모델(500)을 외부로부터 수신 및 저장하여 이용할 수 있으며 어느 하나에 한정된 것은 아니다. 이하 프로세서(150)가 제2모델(500)을 학습하는 경우의 동작을 설명한다.
제2모델(500)은 DDI 예측 모델로, 약물의 유전자 발현 정보(510) 및 부작용에 관한 정보(520)를 입력값으로 사용하고, 입력값에 따라 예측된 약물 상호 작용에 관한 정보(530)를 출력값으로 출력한다.
이때, 약물의 유전자 발현 정보(510)는 도 3의 S310에서 설명한 바와 같이 약물의 구조 정보 및 약물의 속성 정보를 이용하여 식별하거나, 도 4에서 설명한 제1모델(400)을 이용하여 식별한 유전자 발현 정보(430)일 수 있으며, 어느 하나에 한정되는 것은 아니다.
제2모델(500)은 학습 데이터로 약물의 유전자 발현 정보(510)와, 공지된 약물 쌍(pair)에 대한 부작용 정보(520)를 사용할 수 있다. 부작용 정보(520)는, 예를 들어, 미국 FDA의 부작용 보고 시스템에서 검색된 다제약제 부작용에 관한 정보일 수 있다.
이때, 프로세서(150)는 학습 데이터를 이용하여 신경망 네트워크를 학습시키기 전에, 획득된 학습 데이터에 대하여 기 설정된 포맷으로 가공하거나, 노이즈를 제거하여 적절한 데이터 형태로 가공하는 등 전처리 작업을 수행하거나, 또는 복수의 학습 데이터 중에서 학습에 이용될 데이터를 선별할 수 있다.
따라서, 프로세서(150)는 제2모델(500)을 생성하기 위한 학습 데이터로써 미국 FDA의 부작용 보고 시스템에서 검색된 다제약제 부작용에 관한 정보를 전처리하여 사용할 수 있다.
제2모델(500)은 두 개의 약물을 복용한 경우의 약물 상호 작용에 관한 정보를 식별하므로, 유전자 발현 정보(510)를 처리하는 레이어 세트가 두 개 존재한다.
입력 레이어에서 덴스 레이어(dense layer)를 통해 차원을 줄이고, 두 레이어를 다시 컨캣 레이어(concat layer)에서 조합하여 처리한다. 이때, 프로세서(150)는 약물이 서로 미치는 영향인 두 개의 약물의 공동 투여 효과(co-administration effect)를 나타내기 위해 GLU(Gated Linear Unit, 540)를 사용한다.
GLU(540)는 중요한 유전자 발현 정보(510)에 가중치(weight)를 주도록 학습할 수 있는 게이팅 메커니즘으로, 시그모이드(Sigmoid) 함수를 사용하여 유전자 발현 정보(510)를 0에서 1사이 값으로 산출한다.
그 후, 산출한 유전자 발현 정보(510)의 값에 실제 유전자 발현 정보(510)의 값을 곱하여 유전자 발현 정보(510) 중 중요한 정보를 선별하므로 전달될 정보량을 조절할 수 있다.
보다 구체적으로, GLU(540)는 주어진 약물 간의 상호 작용과 관련된 중요한 유전자 발현 정보(510)를 선택하는 과정이다. 따라서, GLU(540)는 단기 기억을 가진 출력 게이트로 레이어를 전달할 때 전파되는 정보를 제어하기 위해 언어 모델을 위해 개발된 게이팅 메커니즘으로, [수식 1]로 나타낼 수 있다.
[수식 1]
Figure 112021136880519-pat00001
A는 전파할 정보인 이전 레이어의 출력이고, B는 시그모이드 비선형성을 적용하여 A를 얼마나 사용할지 제어하는 게이트 σ의 입력이다. 두 부분의 요소별 곱셈으로 출력한다.
프로세서(150)는 GLU(540)를 통해 조절된 유전자 발현 정보(510)와 부작용에 관한 정보(520)를 점수 계산 모듈(550)에 입력하여 약물 상호 작용에 관한 정보(530)를 식별할 수 있다. 점수 계산 모듈(550)에 관한 보다 자세한 내용은 도 6에서 설명한다.
본 발명의 일 실시예에 따르면, 프로세서(150)는 유전자 발현 정보에 대해 공동 투여 효과를 반영하는 게이팅 메커니즘을 사용하여 동적으로 유전자 발현 정보를 선별하여 제2모델(500)을 학습시킨다.
본 발명의 일 실시예에 따르면, 게이팅 메커니즘과 부작용 정보를 반영하여 모델 해석성을 제공하면서 높은 DDI 예측 정확도를 가지는 모델을 제공할 수 있다.
도 6은 본 발명의 일 실시예에 따른 점수 계산 모듈(550)을 도시한 도면이다.
본 발명의 일 실시예에 따르면, 프로세서(150)는 앞서 도 5와 관련하여 서술한 제2모델(500)의 게이팅 메커니즘을 통해 조절한 약물의 유전자 발현 정보를 부작용 공간(side effect space)상에서의 거리를 계산함으로써 부작용 점수(side effect score)를 계산할 수 있다.
게이팅 메커니즘에 의해 조절된 제1약물의 유전자 발현 정보(511) 및 제2약물의 유전자 발현 정보(512)는 부작용 정보(520)의 번역 임베딩 (translating embedding)을 통해 부작용 공간으로 투영된다. 부작용 공간은 각 부작용을 나타내며, 관계 벡터로 연결된 시작점과 끝점을 각각 나타내는 머리와 꼬리 노드에는 약물에 관한 정보가 주어진다.
이때, 프로세서(150)는 마진 기반 손실 함수를 적용하여 부작용에 관한 정보(520)에 포함된 부작용을 보이는 약물 쌍은 거리가 가깝도록, 아닌 경우 멀어지도록 점수 계산 모듈(550)을 학습시킬 수 있다. 프로세서(150)는 부작용에 관한 정보(520)에 포함된 각 부작용마다 해당 약물 쌍에 대한 부작용 점수를 계산할 수 있다.
제1약물(d_i) 및 제2약물(d_j)에 대한 부작용(r) 점수는 [수식 2]에 의해 계산될 수 있다.
[수식 2]
Figure 112021136880519-pat00002
여기서 h 및 t는 약물의 임베딩 벡터이고, r은 관계의 임베딩 벡터이며, Mrh 및 Mrt는 각각 약물 기능을 부작용 공간에 투영하기 위해 h 및 t에 곱한 매핑 행렬이다. 여기서 약물 조합 데이터에 방향성이 없기 때문에 어느 방향이든 고려하여 거리를 계산한다.
결론적으로, 약물의 유전자 발현 정보를 사용한 후 게이팅 메커니즘 및 부작용 정보의 번역 임베딩을 사용하면 모델 해석성을 제공하면서 DDI 예측 정확도를 높일 수 있다.
100: 전자장치
110: 입력부
120: 통신부
130: 표시부
140: 메모리
150: 프로세서

Claims (9)

  1. 약물 상호 작용(DDI)을 예측하는 전자장치에 있어서,
    약물 구조 정보 및 약물 속성 정보에 따라 유전자 발현 정보의 연산을 수행하도록 학습된 제1모델에 기초하여 제1약물의 제1유전자 발현 정보 및 제2약물의 제2유전자 발현 정보를 각각 식별하고,
    상기 유전자 발현 정보와 약물의 조합에 따른 부작용에 관한 정보를 이용하여 약물 상호 작용에 관한 정보의 연산을 수행하도록 학습된 제2모델에 기초하여 부작용 공간 상에서 상기 제1유전자 발현 정보 및 상기 제2유전자 발현 정보 간 거리를 계산하여 상기 제1약물 및 상기 제2약물의 동시 복용에 따른 제1약물 상호 작용에 관한 정보를 식별하는 프로세서를 포함하는 전자장치.
  2. 삭제
  3. 삭제
  4. 제1항에 있어서,
    상기 제2모델은 상기 유전자 발현 정보에 가중치(weight)를 부여하여 상기 약물 상호 작용에 관한 정보의 연산을 수행하도록 학습된 모델인 것을 특징으로 하는 전자장치.
  5. 삭제
  6. 제1항에 있어서,
    상기 약물 상호 작용에 관한 정보는 상기 제1약물 및 상기 제2약물의 동시 복용에 따른 부작용 여부 및 부작용의 정도에 관한 정보를 포함하는 전자장치.
  7. 약물 상호 작용(DDI)을 예측하는 전자장치의 제어방법에 있어서,
    약물 구조 정보 및 약물 속성 정보에 따라 유전자 발현 정보의 연산을 수행하도록 학습된 제1모델에 기초하여 제1약물의 제1유전자 발현 정보 및 제2약물의 제2유전자 발현 정보를 식별하는 단계; 및
    상기 유전자 발현 정보와 약물의 조합에 따른 부작용에 관한 정보를 이용하여 약물 상호 작용에 관한 정보의 연산을 수행하도록 학습된 제2모델에 기초하여 부작용 공간 상에서 상기 제1유전자 발현 정보 및 상기 제2유전자 발현 정보 간 거리를 계산하여 상기 제1약물 및 상기 제2약물의 동시 복용에 따른 제1약물 상호 작용에 관한 정보를 식별하는 단계를 포함하는 전자장치의 제어방법.
  8. 삭제
  9. 삭제
KR1020210165331A 2021-11-26 2021-11-26 약물 상호 작용을 예측하는 전자장치 및 그 제어방법 KR102494470B1 (ko)

Priority Applications (2)

Application Number Priority Date Filing Date Title
KR1020210165331A KR102494470B1 (ko) 2021-11-26 2021-11-26 약물 상호 작용을 예측하는 전자장치 및 그 제어방법
PCT/KR2022/004438 WO2023096034A1 (ko) 2021-11-26 2022-03-29 약물 상호 작용을 예측하는 전자장치 및 그 제어방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020210165331A KR102494470B1 (ko) 2021-11-26 2021-11-26 약물 상호 작용을 예측하는 전자장치 및 그 제어방법

Publications (1)

Publication Number Publication Date
KR102494470B1 true KR102494470B1 (ko) 2023-02-06

Family

ID=85224557

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020210165331A KR102494470B1 (ko) 2021-11-26 2021-11-26 약물 상호 작용을 예측하는 전자장치 및 그 제어방법

Country Status (2)

Country Link
KR (1) KR102494470B1 (ko)
WO (1) WO2023096034A1 (ko)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20200129367A (ko) * 2019-05-08 2020-11-18 고려대학교 산학협력단 신약 후보 물질의 발굴 시스템 및 그 방법

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101953762B1 (ko) * 2017-09-25 2019-03-04 (주)신테카바이오 이종 특성정보 병합 데이터 기반 인공지능 딥러닝 모델을 이용한 약물 적응증 및 반응 예측 시스템 및 방법
KR102268144B1 (ko) * 2020-09-15 2021-06-22 (주)팜캐드 빅데이터를 이용한 신약 후보 물질의 독성 산출 장치 및 방법

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20200129367A (ko) * 2019-05-08 2020-11-18 고려대학교 산학협력단 신약 후보 물질의 발굴 시스템 및 그 방법

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
huyi Ma외 6인. "Transcriptomic Signatures Predict Regulators of Drug Synergy and Clinical Regimen Efficacy against Tuberculosis". mBio. 제10권, 제6호, pp.1-16, 2019년 공개* *
Qichao Luo외 9인. "Novel deep learning-based transcriptome data analysis for drug-drug interaction prediction with an application in diabetes". BMC Bioinformatics 22,pp.1-23, 2021.6.11. 공개* *

Also Published As

Publication number Publication date
WO2023096034A1 (ko) 2023-06-01

Similar Documents

Publication Publication Date Title
Murdoch et al. Definitions, methods, and applications in interpretable machine learning
US11144825B2 (en) Interpretable deep learning framework for mining and predictive modeling of health care data
Bolón-Canedo et al. Feature selection for high-dimensional data
Moor et al. Early recognition of sepsis with Gaussian process temporal convolutional networks and dynamic time warping
Iniesta et al. Machine learning, statistical learning and the future of biological research in psychiatry
US10872699B2 (en) Case-based reasoning in the cloud using deep learning
US11816457B2 (en) Program predictor
US20230316092A1 (en) Systems and methods for enhanced user specific predictions using machine learning techniques
Jakobsen et al. Applying machine learning in motor activity time series of depressed bipolar and unipolar patients compared to healthy controls
Singh et al. Impact of train/test sample regimen on performance estimate stability of machine learning in cardiovascular imaging
Gomathy et al. The prediction of disease using machine learning
Huang et al. A scalable approach for statistical learning in semantic graphs
Naik et al. Efficient modeling and active learning discovery of biological responses
Elshoky et al. Comparing automated and non‐automated machine learning for autism spectrum disorders classification using facial images
Mirtaheri et al. Machine learning: theory to applications
JP2023533587A (ja) モデルを訓練する訓練データセットの選択
Byerly et al. Machine learning and artificial intelligence for surgical decision making
Rajesh et al. Penguin search optimization algorithm with multi-agent reinforcement learning for disease prediction and recommendation model
Parimanam et al. Hybrid optimization based learning technique for multi‐disease analytics from healthcare big data using optimal pre‐processing, clustering and classifier
Sampath et al. Ensemble Nonlinear Machine Learning Model for Chronic Kidney Diseases Prediction
Guo et al. Application of a time-series deep learning model to predict cardiac dysrhythmias in electronic health records
KR102494470B1 (ko) 약물 상호 작용을 예측하는 전자장치 및 그 제어방법
McDermott et al. Defining the players in higher-order networks: predictive modeling for reverse engineering functional influence networks
Bahra et al. Parameterizing neural networks for disease classification
Rafiei et al. Meta-learning in healthcare: A survey

Legal Events

Date Code Title Description
E701 Decision to grant or registration of patent right
GRNT Written decision to grant