KR102475057B1 - Screening method for drugs that cause cardiac arrhythmia using artificial neural networks - Google Patents

Screening method for drugs that cause cardiac arrhythmia using artificial neural networks Download PDF

Info

Publication number
KR102475057B1
KR102475057B1 KR1020210007728A KR20210007728A KR102475057B1 KR 102475057 B1 KR102475057 B1 KR 102475057B1 KR 1020210007728 A KR1020210007728 A KR 1020210007728A KR 20210007728 A KR20210007728 A KR 20210007728A KR 102475057 B1 KR102475057 B1 KR 102475057B1
Authority
KR
South Korea
Prior art keywords
neural network
characteristic factor
factor index
calcium
artificial neural
Prior art date
Application number
KR1020210007728A
Other languages
Korean (ko)
Other versions
KR20220105093A (en
Inventor
임기무
유예담
정다운
Original Assignee
금오공과대학교 산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 금오공과대학교 산학협력단 filed Critical 금오공과대학교 산학협력단
Priority to KR1020210007728A priority Critical patent/KR102475057B1/en
Publication of KR20220105093A publication Critical patent/KR20220105093A/en
Application granted granted Critical
Publication of KR102475057B1 publication Critical patent/KR102475057B1/en

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H70/00ICT specially adapted for the handling or processing of medical references
    • G16H70/40ICT specially adapted for the handling or processing of medical references relating to drugs, e.g. their side effects or intended usage
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/30Prediction of properties of chemical compounds, compositions or mixtures
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/70Machine learning, data mining or chemometrics
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/50ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for simulation or modelling of medical disorders
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/70ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • General Health & Medical Sciences (AREA)
  • Public Health (AREA)
  • Software Systems (AREA)
  • Computing Systems (AREA)
  • Artificial Intelligence (AREA)
  • Epidemiology (AREA)
  • Databases & Information Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biomedical Technology (AREA)
  • Chemical & Material Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Primary Health Care (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Pathology (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • General Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • Computational Linguistics (AREA)
  • Toxicology (AREA)
  • Medicinal Chemistry (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Measuring And Recording Apparatus For Diagnosis (AREA)
  • Investigating Or Analysing Biological Materials (AREA)

Abstract

인공 신경망을 이용한 심장부정맥 유발약물의 스크리닝 방법은 부정맥과 관련 있는 활동전위 특성인자 지표, 칼슘 특성인자 지표, 전하(net charge) 특성인자 지표를 정규화하여 인공 신경망의 입력층 노드에 입력하는 단계와, 활성함수 ReLU 함수 (Rectified Linear Unit)를 이용하여 상기 입력층에서 상기 신경망의 은닉층으로 전달하는 단계와, 활성함수 Softmax 함수를 이용하여 상기 은닉층에서 예측된 심장 부정맥 위험도를 출력층 노드로 출력하는 단계를 포함하는 것을 특징으로 한다.A method for screening cardiac arrhythmia-inducing drugs using an artificial neural network includes the steps of normalizing an action potential characteristic factor index, a calcium characteristic factor index, and a net charge characteristic factor index related to arrhythmias and inputting them to an input layer node of the artificial neural network; Transferring from the input layer to the hidden layer of the neural network using an activation function ReLU function (Rectified Linear Unit), and outputting the risk of cardiac arrhythmia predicted in the hidden layer to a node in the output layer using an activation function Softmax function It is characterized by doing.

Description

인공 신경망을 이용한 심장부정맥 유발약물의 스크리닝 방법{Screening method for drugs that cause cardiac arrhythmia using artificial neural networks}Screening method for drugs that cause cardiac arrhythmia using artificial neural networks}

본 발명은 심장부정맥 스크리닝 방법에 관한 것으로서, 더 상세하게는 인공 신경망을 이용한 심장부정맥 유발약물의 스크리닝 방법에 관한 것이다.The present invention relates to a method for screening cardiac arrhythmia, and more particularly, to a method for screening a drug that induces cardiac arrhythmia using an artificial neural network.

1999년에는 소화 촉진제인 cisapride가 Torsades de Ponte (TdP)로 인해 유럽 의약 시장에서 퇴출되는 사건이 발생하였다. 이후 2005년 모든 약물에 대해 심장부정맥 유발 가능성을 평가하는 가이드라인이 The International Council for Harmonisation of Technical Requirements for Pharmaceuticals for Human Use (ICH)를 통해 발제 되었다. 이후 가이드라인은 비임상 평가인 S7B와 임상평가인 E14에 따라 약물에 대한 심장독성평가를 할 것을 제시하였다. 이 가이드라인은 광범위한 임상실험을 요구해서 이 임상시험에 따른 심장독성 분류방법은 높은 민감도를 가지나 낮은 특이도를 보인다. 이것은 TdP를 유발하지 않는 약물에 대해서도 엄격한 규제가 이루어져 약물 개발에 부정적인 영향을 준다는 것을 의미한다. In 1999, the digestive stimulant cisapride was withdrawn from the European pharmaceutical market due to Torsades de Ponte (TdP). In 2005, a guideline evaluating the possibility of inducing cardiac arrhythmias for all drugs was presented through The International Council for Harmonization of Technical Requirements for Pharmaceuticals for Human Use (ICH). Since then, the guideline has suggested that cardiotoxicity evaluation of drugs be performed according to S7B, which is a non-clinical evaluation, and E14, which is a clinical evaluation. This guideline requires extensive clinical trials, and the cardiotoxicity classification method according to these clinical trials has high sensitivity but low specificity. This means that even drugs that do not induce TdP are subject to strict regulation, negatively affecting drug development.

기존의 이러한 약물 개발 가이드라인을 개정하는 목표로 2013년 FDA 본사에서 주최한 Think-tank 회의에 13개의 선진 의료기관들이 참석하여 Comprehensive in vitro Proarrhythmia Assay (CiPA) 프로젝트가 수립되었다. CiPA 프로젝트를 통해 개정하고자 하는 가이드라인 중 비임상 평가 가이드라인 S7B에서 변경하고자 하는 주된 내용은 in vitro 실험을 통한 hERG채널 단일 분석 평가 방식에서 in silico 방식을 이용하여 다중 이온채널의 약물 반응을 복합적으로 평가하는 것이다.A Comprehensive in vitro Proarrhythmia Assay (CiPA) project was established with the participation of 13 advanced medical institutions at the Think-tank conference hosted by the FDA headquarters in 2013 with the goal of revising these existing drug development guidelines. Among the guidelines to be revised through the CiPA project, the main content to be changed in the non-clinical evaluation guideline S7B is to comprehensively evaluate the drug response of multiple ion channels using the in silico method instead of the hERG channel single analysis evaluation method through in vitro experiments. to evaluate

또한, 2017년 Parikh 그룹에서는 다중이온채널의 약물반응을 복합적으로 평가하기 위해 Ord모델에 약물의 영향을 부여하였으며, 이를 통해 도출된 반응들을 논리회귀 기법을 사용하여 TdP유발약물군을 분류하였다. 논리회귀 모델의 입력으로는 최대 효과 농도(EFTPC)일 때와 IKr 채널을 60% 블록 할 때의 약물농도 조건하에 Ord모델을 이용한 In silico 시뮬레이션으로 도출된 13개의 전기생리학적 특성( Upstroke velocity, Peak voltage, APD50, APD @-60 mV, APD90, Resting voltage, AP triangulation, diastolic [Ca2+]I, amplitude of CaT, peak [Ca2+]I, CaTD50, CaTD90, CaT triangulation)을 개별적으로 사용하였다. IKr 채널을 60% 블록할때의 약물농도 조건하에서 EAD 발생 유무 예측의 정확도로 최소 76점에서 최대 100점의 검증 점수를 보였다. In addition, in 2017, the Parikh group assigned the effect of drugs to the Ord model to comprehensively evaluate the drug response of multiple ion channels, and classified the TdP-inducing drug groups using the logical regression technique. As inputs for the logical regression model, 13 electrophysiological characteristics (Upstroke velocity, Peak voltage, APD50, APD @ -60 mV, APD90, Resting voltage, AP triangulation, diastolic [Ca 2+ ]I, amplitude of CaT, peak [Ca 2+ ]I, CaTD50, CaTD90, CaT triangulation) were used individually. . Under the drug concentration condition when the IKr channel was blocked by 60%, the accuracy of predicting the presence or absence of EAD showed a verification score of at least 76 points and a maximum of 100 points.

2017년 Dutta 그룹에서는 약물의 영향을 반영하기 위해 ORD 모델을 수정한 In silico 모델을 이용하여 qNet 지표 (6개 이온채널 (INaL, ICaL, IKr, Ito, IK1, IKs)의 시간에 따른 전류그래프의 아래면적의 합) 를 도출하여 약물의 TdP 발생 위험도를 고위험군, 중위험군, 저위험군으로 분류할수 있는 기준을 마련하였다. In 2017, the Dutta group used an in silico model that modified the ORD model to reflect the effects of drugs, and analyzed the current graph over time for qNet indicators (6 ion channels (INaL, ICaL, IKr, Ito, IK1, IKs)). The sum of the areas below) was derived to establish a standard for classifying the risk of TdP occurrence of drugs into high-risk, medium-risk, and low-risk groups.

qNet 지표를 특징점으로 하는 선형회귀 모델을 통해 2018년도 Li 그룹은 qNet을 논리 회귀 모델의 입력으로 사용하여 약물의 위험도 분류를 수행하였다. qNet은 Dutta 그룹에서 수정한 ORD심근세포모델5에 herg dynamic 모델을 추가하여 계산되었다. 약물의 위험군 분류는 두 번의 이진 분류를 통해 구해진 두개의 임계값으로 약물의 위험군을 분류하였다. hERG-dynamic 모델을 추가함으로써 분류의 정확도가 향상 되었지만 파라메터 평가를 위한 in vitro 실험과 그에 따른 불확정성의 정량화 등 대량의 데이터 처리와 수학적 복잡성이라는 단점이 존재하였다.Through a linear regression model with qNet indicators as feature points, the Li group in 2018 performed drug risk classification using qNet as an input to a logical regression model. The qNet was calculated by adding a herg dynamic model to the ORD cardiomyocyte model5 modified by Dutta's group. The drug risk group classification was classified into the drug risk group with two critical values obtained through two binary classifications. Although the accuracy of classification was improved by adding the hERG-dynamic model, there were disadvantages such as large amount of data processing and mathematical complexity, such as in vitro experiments for parameter evaluation and subsequent quantification of uncertainty.

따라서 2020년 Liopis-Lorente 그룹에서는 새로운 분류방법으로 약물의 위험군을 9개의 의사결정나무를 사용하였다. 입력으로 사용된 지표는 Dutta의 수정된ORD 모델을 통해 계산된 APD90이 10% 증가 될때의 약물 농도와 EFTPC 농도의 비율인 Tx (Romero et al., 2018)와 EFTPC 농도의 10배일 때 계산된 qNet값과 정상상태일때 qNet값의 비율인 TqNet 그리고 EFTPC의 10배농도에서 계산된 APD90과 APD30의 차이와 정상상태일 때 계산된 APD90과 APD30의 차이의 비율인 Ttriang이다. 약물의 위험군의 분류 정확도는 지표에 따라 Tx를 입력으로 사용한 경우 0.899, Ttriang을 입력으로 사용한 경우 0.908, Tqnet은 0.917을 보였다. Therefore, in 2020, the Liopis-Lorente group used nine decision trees for drug risk groups as a new classification method. The indicators used as inputs are Tx (Romero et al., 2018), the ratio of drug concentration to EFTPC concentration when APD90 is increased by 10%, calculated through Dutta's modified ORD model (Romero et al., 2018), and qNet calculated when EFTPC concentration is 10 times higher. TqNet, which is the ratio between the value and the qNet value at steady state, and Ttriang, which is the ratio between the difference between APD90 and APD30 calculated at 10-fold concentration of EFTPC and the difference between APD90 and APD30 calculated at steady state. The classification accuracy of drug risk groups was 0.899 when Tx was used as an input, 0.908 when Ttriang was used as an input, and 0.917 when Tqnet was used.

현재까지 수행된 선행연구들의 흐름은 TdP와 상관관계가 매우 높다고 할 수 있는 활동전위 모폴로지 특성(APD) 또는 전하특성(Qnet)을 ORD in silico 모델로부터 도출하고 이것들을 이용하여 논리회귀, 의사결정나무와 같은 선형적 패턴으로 분류하는 고전적인 이진분류법을 사용하였다. 그러나 약물의 독성 영향이 활동전위 특성과 전하특성에서 위험군에 따라 선형적인 분포가 나와야 한다는 보장은 없다. 또한 활동전위 모폴로지와 전하특성 외에도 Dutta 가 제시한 Ca 농도의 모폴로지 또한 TdP 발생과 높은 상관관계를 가진다. The flow of preceding studies conducted so far is to derive the action potential morphology characteristics (APD) or charge characteristics (Qnet), which can be said to have a very high correlation with TdP, from the ORD in silico model, and use these to derive logical regression and decision trees. We used a classical binary classification method that classifies in a linear pattern such as However, there is no guarantee that the toxic effect of a drug should have a linear distribution according to the risk group in the action potential characteristics and charge characteristics. In addition to the action potential morphology and charge characteristics, the Ca concentration morphology proposed by Dutta also has a high correlation with TdP generation.

J. Parikh, V. Gurev, and J. J. Rice, "Novel two-step classifier for Torsades de Pointes risk stratification from direct features," Front. Pharmacol., vol. 8, no. NOV, pp. 1-18, 2017, doi: 10.3389/fphar.2017.00816.J. Parikh, V. Gurev, and J. J. Rice, "Novel two-step classifier for Torsades de Pointes risk stratification from direct features," Front. Pharmacol., vol. 8, no. NOV, pp. 1-18, 2017, doi: 10.3389/fphar.2017.00816.

본 발명은 상기와 같은 기술적 과제를 해결하기 위해 제안된 것으로, 기존에 사용하는 IC50와 hill 계수를 이용한 정적 모델을 사용하여도 개선된 분류 성능을 보이는 모델을 제안하고자 한다. 제안하는 모델은 전통적인 방식인 IC50와 hill 계수를 이용한 정적 모델을 이용한다. 정적인 모델의 데이터를 입력으로 하여 활동전위 시뮬레이션을 통해 계산되는 TdP와 높은 상관성이 있는 9개의 지표를 인공신경망 모델의 입력으로 이용하여 약물 위험군을 고위험군, 중위험군, 저위험군으로 구분하고 기존의 연구의 분류성능을 개선한 모델을 제시한다.The present invention has been proposed to solve the above technical problem, and proposes a model showing improved classification performance even when using a static model using the previously used IC50 and hill coefficient. The proposed model uses the traditional static model using IC50 and hill coefficients. Using static model data as input and nine indices highly correlated with TdP calculated through action potential simulation as input to the artificial neural network model, drug-risk groups are classified into high-risk, medium-risk, and low-risk groups, and existing studies A model with improved classification performance is presented.

또한, 본 발명에서는 약물의 독성평가 정확도를 더 높이기 위해, 활동전위 모폴로지, 칼슘농도 모폴로지, 전하특성을 모두 고려한 9가지 다중 특성값들을 입력으로 하는 인공 신경망을 이용한 심장부정맥 유발약물의 스크리닝 방법을 제안한다. In addition, the present invention proposes a screening method for cardiac arrhythmia-inducing drugs using an artificial neural network that takes 9 multi-characteristic values considering all of the action potential morphology, calcium concentration morphology, and charge characteristics as inputs in order to further increase the accuracy of drug toxicity evaluation. do.

상기 문제점을 해결하기 위한 본 발명의 일 실시예에 따르면, 부정맥과 관련 있는 활동전위 특성인자 지표, 칼슘 특성인자 지표, 전하(net charge) 특성인자 지표를 정규화하여 인공 신경망의 입력층 노드에 입력하는 단계와, 활성함수 ReLU 함수 (Rectified Linear Unit)를 이용하여 상기 입력층에서 상기 신경망의 은닉층으로 전달하는 단계와, 활성함수 Softmax 함수를 이용하여 상기 은닉층에서 예측된 심장 부정맥 위험도를 출력층 노드로 출력하는 단계를 포함하는 인공 신경망을 이용한 심장부정맥 유발약물의 스크리닝 방법이 제공된다.According to an embodiment of the present invention to solve the above problem, normalizing the action potential characteristic factor index, calcium characteristic factor index, and net charge characteristic factor index related to arrhythmia and inputting them to the input layer node of the artificial neural network and transmitting from the input layer to the hidden layer of the neural network using an activation function ReLU function (Rectified Linear Unit), and outputting the risk of cardiac arrhythmia predicted in the hidden layer to an output layer node using an activation function Softmax function. A screening method for a cardiac arrhythmia-inducing drug using an artificial neural network comprising the steps is provided.

또한, 본 발명에서 인공신경망은, 9개 노드를 가지는 상기 입력층, 5개 노드를 가지는 상기 은닉층 및 3개의 노드를 가지는 상기 출력층을 포함하는 것을 특징으로 한다.In addition, the artificial neural network in the present invention is characterized by including the input layer having 9 nodes, the hidden layer having 5 nodes, and the output layer having 3 nodes.

또한, 본 발명에서 활동전위 특성인자 지표는, dVm/dtmax(활동전위 형상에서 막전위가 탈분극될 때의 최대 기울기), APD50(막전위의 탈분극 부터 최대 진폭에서 50% 재분극 시점까지의 기간), APD90(막전위의 탈분극 부터 최대 진폭에서 90% 재분극 시점까지의 기간) 및 APresting(휴지기 막전위)를 포함하는 것을 특징으로 한다.In addition, in the present invention, the action potential characteristic factor index is dVm/dtmax (the maximum slope when the membrane potential is depolarized in the shape of the action potential), APD50 (the period from the depolarization of the membrane potential to the point of 50% repolarization from the maximum amplitude), APD90 ( It is characterized by including the period from the depolarization of the membrane potential to the point of 90% repolarization at the maximum amplitude) and APresting (resting membrane potential).

또한, 본 발명에서 칼슘 특성인자 지표는, CaD50 (calcium transient duration 50) - 칼슘의 과도기간 중 최대 진폭을 기준으로 50% 지점 사이의 기간 - , CaD90 (calcium transient duration 50) - 칼슘의 과도기간 중 최대 진폭을 기준으로 90% 지점 사이의 기간 - 및 , Caresting(칼슘의이완기 농도)를 포함하는 것을 특징으로 한다.In addition, the calcium characteristic factor index in the present invention is CaD50 (calcium transient duration 50) - the period between the 50% points based on the maximum amplitude during the calcium transient period -, CaD90 (calcium transient duration 50) - during the calcium transient period It is characterized by including the period between the 90% points based on the maximum amplitude - and , Caresting (diastolic concentration of calcium).

또한, 본 발명에서 전하(net charge) 특성인지 지표는, qinward(정상상태와 약물 상태에 따라 INaL, ICaL 이온 채널들을 통해 이동하는 전하량 비율), qnet(이온 채널들을 통해 세포 안과 밖으로 향하는 이온 전하들의 총합)를 포함하는 것을 특징으로 한다.In addition, in the present invention, the indicator of whether the net charge is characteristic is qinward (rate of charges moving through INaL and ICaL ion channels depending on the steady state and drug state), qnet (the ratio of ion charges moving in and out of the cell through ion channels) It is characterized in that it includes the total).

또한, 본 발명에서 입력층 노드에 입력되는 입력 데이터는 지표 간의 단위차이로 발생하는 과대적합 또는 과소적합을 피하기 위해 MinMaxScaler를 이용하여 전처리 하는 것을 특징으로 한다.In addition, in the present invention, the input data input to the input layer node is characterized in that it is preprocessed using MinMaxScaler to avoid overfitting or underfitting caused by unit differences between indices.

본 발명에서 제안한 인공신경망 모델이 기존 모델의 약물 위험도 분류 정확도를 개선하였다. 하나의 인공신경망 모델을 이용하여 고위험도, 중위험도, 저 위험도의 개별적인 분류 정확도를 알 수 있다. 이 모델은 약물로 인해 변화되는 활동전위 형상 변화, 칼슘농도의 변화, 이동하는 이온 전하들의 변화들을 반영할 수 있는 모델이다. 기존의 약물의 심장독성 평가 분류 기준이 재분극을 기준으로 두었으나, 변화하는 가이드라인에서는 TdP 유발가능성을 기준으로 분류하고자 하였다. 하지만 부정맥 발생가능성을 구분할 정확한 종점을 선정하기 어려우며, 부정맥과 관련도 높은 복합 지표를 이용하여 약물의 부정맥이 구분된 것은 합리적으로 받아드릴 수 있다. The artificial neural network model proposed in the present invention improved the drug risk classification accuracy of the existing model. Using one artificial neural network model, it is possible to know the individual classification accuracy of high-risk, medium-risk, and low-risk. This model is a model that can reflect changes in action potential shapes, changes in calcium concentration, and changes in moving ionic charges caused by drugs. The existing cardiotoxicity evaluation classification criteria of drugs were based on repolarization, but the changing guidelines tried to classify based on the possibility of inducing TdP. However, it is difficult to select an accurate end point to classify the possibility of arrhythmia, and it is reasonable to accept that arrhythmia of a drug is classified using a composite index highly related to arrhythmia.

이 연구의 제한점으로는 in vitro 실험데이터를 입력으로 전기생리학의 약물 변화를 구현하기 때문에 in vitro 실험데이터에 의존적이다. 인공지능 분류는 학습 파라미터에 의해 분류되며 계산과정 중의 값에 대해 정확한 생리학적 의미를 알 수 없다. 하지만 제안한 모델의 9개의 입력 지표를 in silico 결과와 in vitro 결과를 복합적으로 사용하여 더 정확한 약물평가를 수행을 기대할 수 있다. 중위험군의 histogram에서 두 개의 peak는 계층화된 결과가 나온 것으로 알 수 있다. 중위험군이 고위험군 또는 저위험군 두개의 범주에 근접하는 데이터가 많다는 결과로 해석할 수 있다. The limitation of this study is that it is dependent on in vitro experimental data because it implements drug changes in electrophysiology by inputting in vitro experimental data. AI classification is classified by learning parameters, and the exact physiological meaning of the value during the calculation process cannot be known. However, more accurate drug evaluation can be expected by using the 9 input indicators of the proposed model as a combination of in silico and in vitro results. It can be seen that the two peaks in the histogram of the medium-risk group resulted in stratified results. It can be interpreted as the result that the medium-risk group has many data that are close to the two categories of high-risk group or low-risk group.

또한, 본 발명에서는 약물의 독성평가를 위해 활동전위 모폴로지 특성(APD90, APD50, dV/dtmax, APresting), 칼슘농도 모폴로지 (CaD90, CaD50, Caresting), 전하특성 (qNet, aInward)을 모두 고려한 9가지 다중 특성값들을 입력으로 하는 인공신경망 기반의 딥러닝 알고리즘을 개발하였다. 9가지 특성값들을 도출하기 위해 수정된 ORD 모델을 이용한 in silico 시뮬레이션을 수행하였다. 이 분류 알고리즘의 성능으로 같은 in silico 모델을 사용한 Li 그룹과 같은 기준으로 성능평가를 했을 때, Li 그룹에서 제시한 분류성능보다 고위험군에서 10.2%, 저위험군 AUC 6.7% 더 높았다. 또한 Li 그룹에서 사용한 논리회귀 분류법 대신에 인공신경망을 사용함으로써 고위험군, 저위험군 뿐만 아니라 중간위험군 분류도 명시적으로 할 수 있었다. In addition, in the present invention, action potential morphology characteristics (APD90, APD50, dV/dtmax, APresting), calcium concentration morphology (CaD90, CaD50, Caresting), and charge characteristics (qNet, aInward) were all considered for the toxicity evaluation of drugs in the present invention. An artificial neural network-based deep learning algorithm with multiple feature values as input was developed. In silico simulation was performed using the modified ORD model to derive 9 characteristic values. When the performance of this classification algorithm was evaluated with the same criteria as the Li group using the same in silico model, the classification performance presented by the Li group was 10.2% higher in the high-risk group and 6.7% higher in the low-risk group AUC. In addition, by using an artificial neural network instead of the logical regression classification method used by the Li group, it was possible to explicitly classify not only high-risk and low-risk groups, but also medium-risk groups.

본 발명의 한계점으로 독성평가 분류기의 입력값으로 9가지 파라메터들이 제공되어야한다. 이것은 선행연구들에서 필요로 하는 입력값이 1개인 것에 비하면 매우 많은 편이다. 9개의 신뢰성 있는 파라메터를 획득하기 위해서는 심근세포의 생리/약리 In silico 모델의 충분한 신뢰성이 뒷받침되어야 할 것이다. 두번째 한계점으로, 선행연구에서 제시한 qNet, qInward, TqNet 등과 같이 생리/약리적으로 의미있는 파라메터들의 임계값을 기준으로 분류한 것에 비해서 본 발명에서 제안한 인공신경망은 분류를 위한 명시적인 임계값을 제시하지 못한다는 것이다. 이것은 신약개발 연구자가 심장독성평가를 위해 본 인공신경망 분류기를 사용했을 때, 분류된 결과에 대한 타당성을 인과적으로 평가하기가 어렵다는 의미이다. 위 두 가지 한계점은 인공신경망 기반의 딥러닝 방법을 사용한다면 필연적으로 만날 수밖에 없다. 그럼 불구하고, 선행연구에 비해 더 높은 독성평가 분류 성능을 가지는 알고리즘을 개발했다는 것은 신약개발 연구분야에서 매우 의미있는 일이다.As a limitation of the present invention, nine parameters must be provided as input values for the toxicity evaluation classifier. This is very large compared to the one input required in previous studies. In order to acquire the 9 reliable parameters, sufficient reliability of the physiological/pharmacological in silico model of cardiomyocytes should be supported. As a second limitation, the artificial neural network proposed in the present invention does not present an explicit threshold for classification, compared to classification based on threshold values of physiologically/pharmacologically meaningful parameters such as qNet, qInward, and TqNet suggested in previous studies. that it can't This means that when a new drug development researcher uses this artificial neural network classifier for cardiotoxicity evaluation, it is difficult to causally evaluate the validity of the classified results. The above two limitations are inevitably met if the artificial neural network-based deep learning method is used. Nevertheless, it is very meaningful in the field of new drug development research to develop an algorithm with higher toxicity evaluation classification performance than previous studies.

도 1은 본 발명의 실시예에 따른 인공 신경망을 이용한 심장부정맥 유발약물의 스크리닝 방법을 나타낸 도면
도 2는 10,000번의 테스트를 통해 얻은 AUC(Artificial Neuron Network)들의 도수를 나타내는 히스토그램
1 is a diagram showing a method for screening cardiac arrhythmia-inducing drugs using an artificial neural network according to an embodiment of the present invention.
2 is a histogram showing the frequency of AUCs (Artificial Neuron Networks) obtained through 10,000 tests

이하, 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자가 본 발명의 기술적 사상을 용이하게 실시할 수 있을 정도로 상세히 설명하기 위하여, 본 발명의 실시예를 첨부한 도면을 참조하여 설명하기로 한다.Hereinafter, embodiments of the present invention will be described with reference to the accompanying drawings in order to describe in detail enough for those skilled in the art to easily implement the technical idea of the present invention.

도 1은 본 발명의 실시예에 따른 인공 신경망을 이용한 심장부정맥 유발약물의 스크리닝 방법을 나타낸 도면이다. 도 1을 참조하여 인공 신경망을 이용한 심장부정맥 유발약물의 스크리닝 방법을 설명하면 다음과 같다.1 is a diagram showing a method for screening cardiac arrhythmia-inducing drugs using an artificial neural network according to an embodiment of the present invention. Referring to FIG. 1, a method for screening cardiac arrhythmia-inducing drugs using an artificial neural network will be described as follows.

[소프트웨어와 데이터][Software and Data]

본 발명을 검증하기 위한 실험에 실행되는 시뮬레이션의 코드는 CiPA 프로젝트 그룹에서 github 웹 사이트 (https://github.com/FDA/CiPA/)에 업로드한 데이터들을 기반으로 사용하였다. 힐 적합에 사용된 패치클램프 실험 데이터는 Crumble et al. (2016) 그룹이 생리학적 온도 환경에서 수동 패치클램프 기술을 이용하여 6개 이온채널에 대한 실험 결과가 사용되었다. 불확실성 정량화 및 시뮬레이션 수행은 CiPA initiative를 따라 수행되었다.The simulation code used in the experiment to verify the present invention was used based on the data uploaded to the github website (https://github.com/FDA/CiPA/) by the CiPA project group. Patch-clamp experimental data used for Hill fit are from Crumble et al. (2016) group used the experimental results for six ion channels using a manual patch-clamp technique in a physiological temperature environment. Uncertainty quantification and simulation performance were conducted in accordance with the CiPA initiative.

[피팅(부스트랩 방법)][Fitting (bootstrap method)]

약물로 인해 발생하는 각 이온채널들의 특성을 얻기 위해 패치클램프 실험 데이터를 입력으로 하여 힐 적합 한다. 약물에 의한 채널의 영향은 힐 방정식에 따라 약물의 채널 막음 정도로 나타나는 최대전도도의 변화를 계산한다. 힐 적합 과정은 Chang et al. (2017) 그룹이 제안한 MCMC(Markov-chain Monte Carlo) 모델을 통해 신뢰구간 95%이내의 부트스트랩 된 2,000개의 힐 계수와 IC50 을 추출한다. 이 시뮬레이션을 통해 계산된 2,000개의 IC50 와 힐 계수를 단일 심근세포 시뮬레이션의 입력으로 사용한다. CiPA 그룹에서 게시한 데이터와 R코드를 통해 계산된 결과 값이 같음을 확인하고 R 코드를 실행한 결과 데이터를 사용하였다.In order to obtain the characteristics of each ion channel generated by the drug, the patch clamp experiment data is used as an input and fit. The effect of the drug on the channel is calculated according to the Hill equation, and the change in maximum conductance that appears to the degree of blockage of the channel by the drug is calculated. The Hill fitting process was described by Chang et al. (2017) extracts 2,000 Hill coefficients and IC50 bootstrapped within a 95% confidence interval through the MCMC (Markov-chain Monte Carlo) model proposed by the group. The 2,000 IC50s and Hill coefficients calculated through this simulation are used as inputs for a single cardiomyocyte simulation. After confirming that the data published by the CiPA group and the result value calculated through the R code were the same, the R code was executed and the result data was used.

[In silico 모델 설명][In silico model description]

전기생리 단일세포 시뮬레이션의 모델은 Ohara Rudy et al.(2011) 가 제안한 심근 세포 모델의 이온채널의 최대전도도를 수정한 모델을 사용하였다. 모델은 각 이온채널들이 활동전위 형상에 주는 영향을 정량화 하고 약물에 의해 변화되는 이온채널의 반응에 의해 변화되는 활동전위 기간의 변화를 더 잘 표현하기 위해 채널의 과소평가되거나 과대평가된 최대전도도에 대해 수정이 이루어졌다. 수정된 모델은 이온 채널 INaL, ICaL, IKr, IKs, IK1의 전도도에 대해 각 2.661, 1.007, 1.013, 1.870, 1.698 환산계수가 적용된 모델이다.For the electrophysiological single-cell simulation model, a modified maximum conductance of the ion channel of the myocardial cell model proposed by Ohara Rudy et al. (2011) was used. The model quantifies the effect of each ion channel on the shape of the action potential, and in order to better represent the change in the duration of the action potential caused by the response of the ion channel changed by the drug, the model is based on the underestimated or overestimated maximum conductance of the channel. Corrections have been made to The modified model applied conversion factors of 2.661, 1.007, 1.013, 1.870, and 1.698 for the conductivities of the ion channels INaL, ICaL, IKr, IKs, and IK1, respectively.

[EP 시뮬레이션 프로토콜][EP simulation protocol]

<표 1><Table 1>

Figure 112021007288709-pat00001
Figure 112021007288709-pat00001

표 1은 CiPA 연구그룹에서 부정맥 유발 가능성에 따라 고 위험군, 중 위험군,저 위험군으로 구분하여 선정한 28개 약물 및 기계학습의 훈련에 사용되는 12개 약물과 테스트에 사용되는 약물 16개를 나타낸 표이다.Table 1 is a table showing 28 drugs selected by the CiPA research group into high-risk, medium-risk, and low-risk groups according to their arrhythmia-inducing potential, and 12 drugs used for machine learning training and 16 drugs used for testing. .

단일세포 전기생리학 시뮬레이션은 1000번의 활동전위를 생성하였으며 자극주기는 2s로 설정하였다. 자극의 세기는 -80μA/μF, 자극지속시간은 0.5ms로 설정하였다. 약물의 농도는 각 약물의 특성인 최고 단백 비 결합 혈중농도 (free Cmax)을 기준으로 1-4배 (1씩 증가)로 설정하였다. 사용한 약물은 CiPA 프로젝트 그룹에서 심부정맥 유발 위험도에 따라 고위험군, 중 위험군, 저위험군으로 구분된 라벨을 가지는 약물 28개를 사용하였다. 28개 약물 중 인공신경망 모델의 훈련으로 12개 약물을 사용하였으며, 모델 테스트 용으로 16개의 약물을 사용하였다. 전기생리학 시뮬레이션의 입력으로는 힐 적합으로 추출된 2,000개의 IC50와 힐 계수를 사용하였다. 설정한 약물 농도인 Cmax의 1배, 2배, 3배, 4배에 따라 9개 지표가 개별적으로 2000개 계산된다. 인공신경망에 사용하는 데이터는 농도에 따라 개별적으로 계산된 Cmax1-4농도의 평균으로 하나의 지표마다 2,000개 결과값을 가진다.The single-cell electrophysiology simulation generated 1000 action potentials, and the stimulation cycle was set to 2 s. The intensity of stimulation was set to -80 μA/μF, and the duration of stimulation was set to 0.5 ms. The concentration of the drug was set to 1-4 times (increase by 1) based on the highest protein-free Cmax, which is a characteristic of each drug. The drugs used were 28 drugs with labels classified into high-risk, medium-risk, and low-risk groups according to the risk of cardiac arrhythmia in the CiPA project group. Among the 28 drugs, 12 drugs were used for training of the artificial neural network model, and 16 drugs were used for model testing. As inputs for the electrophysiology simulation, 2,000 IC50s and Hill coefficients extracted by Hill fit were used. According to the set drug concentration Cmax 1, 2, 3, 4 times, 2000 9 indicators are calculated individually. The data used for the artificial neural network is the average of the Cmax1-4 concentrations individually calculated according to the concentration, and has 2,000 result values for each indicator.

[인공신경망 입력으로 사용되는biomarker 계산][Biomarker calculation used as an artificial neural network input]

<식 1><Equation 1>

Figure 112021007288709-pat00002
Figure 112021007288709-pat00002

<식 2><Equation 2>

Figure 112021007288709-pat00003
Figure 112021007288709-pat00003

부정맥과 관련 있는 지표 9개를 단일세포 전기생리 시뮬레이션을 통해 도출한다. 지표는 활동전위 특성, 칼슘 특성, 이온 전하 특성으로 나뉜다. 활동전위 특성 중 APD90 (Action potential duration)은 활동전위 형상에서 최대 진폭으로부터 90% 아래의 탈분극 지점과 재분극 지점 사이의 기간이다. APD50 활동전위 형상에서 최대 진폭으로부터 50% 아래의 탈분극 지점과 재분극 지점 사이의 기간이다. dvm/dtmax는 활동전위 형상에서 막전위가 탈분극될 때의 최대 기울기이며, APresting은 휴지기 막전위이다. 칼슘 특성으로는 CaD90 (Calcium transient Duration) 세포내 칼슘의 과도기간 중 최대 진폭에서 90% 이하 지점 사이의 기간이다. CaD50 세포내 칼슘의 과도기간 중 최대 진폭에서 50% 이하 지점 사이의 기간이다. Caresting는 세포내 칼슘의 이완기 때의 농도이고, 이온전하 특성의 qNet은 활동전위 기간 동안 6개 이온 채널 (INaL, ICaL, IKr, IKs, IK1, Ito)을 통해 이동하는 이온전하들의 총량이며, 시간에 따른 전류 그래프의 적분의 합으로 계산된다 - 식 1- . qNet은 Li et al. (2018) 그룹에서 수행한 논리회귀 모델을 이용한 약물의 부정맥 유발 위험도 분류의 입력지표로 사용되었다. qInward는 활동 전위기간 동안 ICaL, INaL 이온채널을 통해 세포내로 향하는 전하들의 약물반응일 때와 정상상태의 비율의 평균이며 (식 2) 로 표현된다. 여기에서 _drug_AUC는 약물 특성이 반영된 상태 일 때 각 이온 채널의 시간에 따른 전류 변화 그래프 아래 면적, _control_AUC 은 정상상태일때 각 이온 채널의 시간에 따른 전류 변화 그래프 아래 면적이다. 지표 계산을 위해 하나의 활동전위 선택 기준은 1,000개의 활동전위에서 마지막 250개의 활동전위에 대해 탈분극 또는 재분극이 실패한 것을 제외하고, 재분극 시의 dVm/dtrepol 값이 가장 큰 하나의 활동 전위를 선택하여 9개 지표들이 계산된다. Nine indices related to arrhythmias are derived through single-cell electrophysiological simulation. Indicators are divided into action potential characteristics, calcium characteristics, and ionic charge characteristics. Among action potential characteristics, APD90 (Action potential duration) is the period between the depolarization point and the repolarization point below 90% of the maximum amplitude in the shape of the action potential. APD50 is the period between the point of depolarization and repolarization below 50% of the maximum amplitude in the action potential profile. dvm/dtmax is the maximum slope when the membrane potential depolarizes in the action potential shape, and APresting is the resting membrane potential. Calcium characteristics include CaD90 (Calcium transient Duration), which is the period between the maximum amplitude and the point below 90% during the transient period of intracellular calcium. CaD50 The period between the maximum amplitude and the point below 50% during the transient period of intracellular calcium. Caresting is the concentration of intracellular calcium during relaxation, and qNet of the ionic charge characteristic is the total amount of ion charges moving through six ion channels (INaL, ICaL, IKr, IKs, IK1, Ito) during the action potential period, and time - Calculated as the sum of the integrals of the current graph according to Equation 1-. qNet was developed by Li et al. (2018) was used as an input index for the classification of arrhythmia-inducing risk of drugs using a logistic regression model performed by the group. qInward is the average of the drug response and steady-state ratios of charges directed into the cell through the ICaL and INaL ion channels during the action potential period and is expressed as (Equation 2). Here, _drug_AUC is the area under the graph of current change over time of each ion channel when the drug properties are reflected, and _control_AUC is the area under the graph of current change over time of each ion channel under steady state. The criterion for selecting one action potential for index calculation is to select one action potential with the largest dVm/dtrepol value at the time of repolarization, excluding failures in depolarization or repolarization for the last 250 action potentials out of 1,000 action potentials. Dog indicators are calculated.

[기계학습 모델 구조설명과 학습/테스트 방법][Description of machine learning model structure and learning/test method]

본 발명의 실시예에 따른 인공신경망 모델은 9개의 지표 (dvm/dtmax, APresting, APD90, APD50, Caresting, CaD90, CaD50, qNet, qInward)를 입력으로 하는 9개 노드를 가지는 입력층과 5개의 노드를 가지는 은닉 층, 3개 노드를 가지는 출력층으로 구성된 인공신경망 모델을 구성했다. 지표 간의 단위차이로 발생하는 과대적합 혹은 과소적합을 피하고자 입력 데이터들에 대해 MinMaxScaler를 사용하였다. 훈련과정 중 과대적합을 예방하기 위해 10-차 교차 검증을 하였다. 은닉층의 활성함수는 'ReLu'를 사용하였으며, 출력층의 활성함수는 'Softmax'를 사용하였다. 출력 층 노드를 통해 고 위험군, 중위험군, 저 위험군으로 다중 분류하였다. 사용한 자료개수는 활동전위 시뮬레이션의 입력으로 사용한 힐 계수와 IC50 파라미터로 계산된 2,000개의 자료를 가지며, 한 약물의 자료의 개수는 9개 지표로 18,000개이다. 훈련에 사용한 약물은 12개로 216,600개의 자료를 기계학습 모델의 훈련 데이터로 사용하였다. 검증에 사용한 데이터 또한 힐 계수와 IC50로부터 계산되어진 지표당 2,000개의 자료를 가지며 9개의 지표를 사용하였다. 테스트 약물은 16개로 총 자료 수는288,000개이다. 모델의 테스트에 사용한 자료집합은 16개 약물이 속하며, 각 약물에 대해 같은 힐 계수와 IC50로 계산되어진 9개 지표를 2,000개의 자료 중 임의로 하나씩 선정하여 만들어진다. 모델의 테스트는 16개 테스트 약물의 자료를 하나씩 포함하는 10,000개의 자료집합을 이용하여 10,000번을 수행한다. 테스트 결과로는 수신자 조작 특성 곡선(receiver operating characteristic; ROC curve)의 면적에 해당하는 AUC(Area under the curve)를 사용하여 모델의 성능을 평가하였다. 결과 비교는 10,000개의 AUC 결과의 도수 분포 중 AUC의 신뢰구간 95% 범위와 중앙 값을 대표 값으로 설정하였다.The artificial neural network model according to an embodiment of the present invention has 9 nodes that take 9 indicators (dv m /dt max , AP resting , APD 90 , APD 50 , Ca resting , CaD 90 , CaD 50 , qNet, qInward) as inputs. An artificial neural network model consisting of an input layer with , a hidden layer with 5 nodes, and an output layer with 3 nodes was constructed. MinMaxScaler was used for the input data to avoid overfitting or underfitting caused by unit differences between indicators. To prevent overfitting during the training process, 10-order cross-validation was performed. 'ReLu' was used as the activation function of the hidden layer, and 'Softmax' was used as the activation function of the output layer. Through the node of the output layer, multiple classifications were made into high-risk, medium-risk, and low-risk groups. The number of data used has 2,000 data calculated by the Hill coefficient and IC50 parameter used as input for action potential simulation, and the number of data for one drug is 18,000 with 9 indicators. Twelve drugs were used for training, and 216,600 data were used as training data for the machine learning model. The data used for verification also had 2,000 data per indicator calculated from the Hill coefficient and IC50, and 9 indicators were used. There were 16 tested drugs, and the total number of data was 288,000. The data set used for the test of the model includes 16 drugs, and 9 indicators calculated with the same Hill coefficient and IC50 for each drug are randomly selected from among 2,000 data. The test of the model is performed 10,000 times using 10,000 data sets each containing data of 16 test drugs. As a test result, the performance of the model was evaluated using AUC (Area under the curve) corresponding to the area of the receiver operating characteristic (ROC curve). For comparison of results, the 95% range and median value of the AUC confidence interval among the frequency distributions of 10,000 AUC results were set as representative values.

<표 2><Table 2>

Figure 112021007288709-pat00004
Figure 112021007288709-pat00004

표 2는 제안한 인공신경망(Artificial Neuronal Network; ANN) 모델과 Li 그룹에서 제안한 논리회귀모델을 이용하였을 때 부정맥 유발 위험군 예측 정확도의 비교표이고, 도 2는 10,000번의 테스트를 통해 얻은 AUC(Artificial Neuron Network)들의 도수를 나타내는 히스토그램이다.((a) 고위험군, (b)중위험군, (c)저위험군)Table 2 is a comparison table of the prediction accuracy of the arrhythmia risk group using the proposed Artificial Neuronal Network (ANN) model and the logical regression model proposed by the Li group. It is a histogram showing the frequency of ((a) high-risk group, (b) medium-risk group, (c) low-risk group)

본 발명에서 개발한 학습된 ANN 분류기를 이용하여 10,000번의 테스트를 통해 얻어진 AUC들의 대표값은 고위험군에서 0.958, 중위험군에서 0.73, 저위험군에서 0.927이었다 (도 2에 있는 히스토그램에서의 중간값이 AUC의 대표 값이며, 데이터셋의 신뢰구간 95% 범위가 검증범위임). Li 그룹에서 제시한 논리회귀 모델의 분류 정확도로서 고 위험군의 대표 AUC는 0.856이고 저 위험군의 대표 AUC는 0.86이다 (방법론상 중위험군의 AUC는 제시할 수 없었음). 따라서 본 발명에서 개발된 ANN 분류기의 정확도가 선행연구 (Li et al. 2018)에서 제시한 정확도에 비해 고위험군에서 10.2%, 저위험군 AUC 6.7% 더 높았다. 신뢰구간의 최소 값은 ANN 분류기가 고 위험군에서 9 %, 저위험군에서 7% 더 높았으며, 신뢰구간에서의 최대 값도 ANN 분류기가 고위험군에서 10%, 저위험군에서 10.5% 로 더 높았다. The representative values of the AUCs obtained through 10,000 tests using the learned ANN classifier developed in the present invention were 0.958 in the high-risk group, 0.73 in the medium-risk group, and 0.927 in the low-risk group (the median value in the histogram in FIG. It is a representative value, and the 95% range of the confidence interval of the dataset is the validation range). As the classification accuracy of the logical regression model presented by the Li group, the representative AUC of the high-risk group was 0.856 and the representative AUC of the low-risk group was 0.86 (due to the methodology, the AUC of the medium-risk group could not be presented). Therefore, the accuracy of the ANN classifier developed in the present invention was 10.2% higher in the high-risk group and 6.7% higher in AUC in the low-risk group than the accuracy presented in the preceding study (Li et al. 2018). The minimum value of the confidence interval was higher for the ANN classifier by 9% in the high-risk group and 7% in the low-risk group, and the maximum value of the confidence interval was also higher in the ANN classifier by 10% in the high-risk group and 10.5% in the low-risk group.

상술한 바와 같이, 제안된 인공 신경망을 이용한 심장부정맥 유발약물의 스크리닝 방법은 As described above, the screening method for cardiac arrhythmia-inducing drugs using the proposed artificial neural network is

부정맥과 관련 있는 활동전위 특성인자 지표, 칼슘 특성인자 지표, 전하(net charge) 특성인자 지표를 정규화하여 인공 신경망의 입력층 노드에 입력하는 단계와, 활성함수 ReLU 함수 (Rectified Linear Unit)를 이용하여 입력층에서 상기 신경망의 은닉층으로 전달하는 단계와, 활성함수 Softmax 함수를 이용하여 은닉층에서 예측된 심장 부정맥 위험도를 출력층 노드로 출력하는 단계를 포함하여 진행된다.The step of normalizing the action potential characteristic factor index, calcium characteristic factor index, and net charge characteristic factor index related to arrhythmias and inputting them to the input layer node of the artificial neural network, and using the activation function ReLU function (Rectified Linear Unit) The process includes transferring from the input layer to the hidden layer of the neural network, and outputting the risk of cardiac arrhythmia predicted in the hidden layer to a node in the output layer using the Softmax activation function.

이때, 인공신경망은, 9개 노드를 가지는 입력층, 5개 노드를 가지는 은닉층 및 3개의 노드를 가지는 출력층을 포함한다.At this time, the artificial neural network includes an input layer having 9 nodes, a hidden layer having 5 nodes, and an output layer having 3 nodes.

또한, 활동전위 특성인자 지표는, dVm/dtmax(활동전위 형상에서 막전위가 탈분극될 때의 최대 기울기), APD50(막전위의 탈분극 부터 최대 진폭에서 50% 재분극 시점까지의 기간), APD90(막전위의 탈분극 부터 최대 진폭에서 90% 재분극 시점까지의 기간) 및 APresting(휴지기 막전위)를 포함한다.In addition, the action potential characteristic factor index is dVm/dtmax (the maximum slope when the membrane potential is depolarized in the shape of the action potential), APD50 (the period from the depolarization of the membrane potential to the point of 50% repolarization from the maximum amplitude), APD90 (the depolarization of the membrane potential) period from maximum amplitude to the time of 90% repolarization) and APresting (resting membrane potential).

또한, 칼슘 특성인자 지표는, CaD50 (calcium transient duration 50) - 칼슘의 과도기간 중 최대 진폭을 기준으로 50% 지점 사이의 기간 - , CaD90 (calcium transient duration 50) - 칼슘의 과도기간 중 최대 진폭을 기준으로 90% 지점 사이의 기간 - 및 , Caresting(칼슘의이완기 농도)를 포함한다.In addition, CaD50 (calcium transient duration 50) - the period between the 50% points based on the maximum amplitude during the transient period of calcium - and CaD90 (calcium transient duration 50) - the maximum amplitude during the transient period of calcium The period between the 90% points as a criterion - and , including Caresting (diastolic concentration of calcium).

또한, 전하(net charge) 특성인지 지표는, qinward(정상상태와 약물 상태에 따라 INaL, ICaL 이온 채널들을 통해 이동하는 전하량 비율), qnet(이온 채널들을 통해 세포 안과 밖으로 향하는 이온 전하들의 총합)를 포함하는 것을 특징으로 한다.In addition, as indicators of net charge characteristics, qinward (rate of charges moving through INaL and ICaL ion channels depending on the normal state and drug state) and qnet (the total sum of ion charges moving in and out of the cell through ion channels) It is characterized by including.

또한, 입력층 노드에 입력되는 입력 데이터는 지표 간의 단위차이로 발생하는 과대적합 또는 과소적합을 피하기 위해 MinMaxScaler를 이용하여 전처리 하는 것을 특징으로 한다.In addition, the input data input to the input layer node is characterized in that it is preprocessed using MinMaxScaler to avoid overfitting or underfitting caused by unit differences between indices.

이와 같이, 본 발명이 속하는 기술분야의 당업자는 본 발명이 그 기술적 사상이나 필수적 특징을 변경하지 않고서 다른 구체적인 형태로 실시될 수 있다는 것을 이해할 수 있을 것이다. 그러므로 이상에서 기술한 실시예들은 모든 면에서 예시적인 것이며 한정적인 것이 아닌 것으로서 이해해야만 한다. 본 발명의 범위는 상기 상세한 설명보다는 후술하는 특허청구범위에 의하여 나타내어지며, 특허청구범위의 의미 및 범위 그리고 그 등가개념으로부터 도출되는 모든 변경 또는 변형된 형태가 본 발명의 범위에 포함되는 것으로 해석되어야 한다.As such, those skilled in the art to which the present invention pertains will be able to understand that the present invention may be embodied in other specific forms without changing its technical spirit or essential features. Therefore, the embodiments described above should be understood as illustrative in all respects and not limiting. The scope of the present invention is indicated by the following claims rather than the detailed description above, and all changes or modifications derived from the meaning and scope of the claims and their equivalent concepts should be interpreted as being included in the scope of the present invention. do.

Claims (6)

삭제delete 부정맥과 관련 있는 활동전위 특성인자 지표, 칼슘 특성인자 지표, 전하(net charge) 특성인자 지표를 정규화하여 인공 신경망의 입력층 노드에 입력하는 단계;
활성함수 ReLU 함수 (Rectified Linear Unit)를 이용하여 상기 입력층에서 상기 신경망의 은닉층으로 전달하는 단계; 및
활성함수 Softmax 함수를 이용하여 상기 은닉층에서 예측된 심장 부정맥 위험도를 출력층 노드로 출력하는 단계;를 포함하고,
상기 인공신경망은, 9개 노드를 가지는 상기 입력층, 5개 노드를 가지는 상기 은닉층 및 3개의 노드를 가지는 상기 출력층을 포함하는 것을 특징으로 하는 인공 신경망을 이용한 심장부정맥 유발약물의 스크리닝 방법.
normalizing an action potential characteristic factor index, a calcium characteristic factor index, and a net charge characteristic factor index related to arrhythmias and inputting them to an input layer node of an artificial neural network;
transmitting from the input layer to the hidden layer of the neural network using an activation function ReLU function (Rectified Linear Unit); and
Outputting a cardiac arrhythmia risk predicted in the hidden layer to an output layer node by using an activation function Softmax function;
The artificial neural network includes the input layer having 9 nodes, the hidden layer having 5 nodes, and the output layer having 3 nodes.
부정맥과 관련 있는 활동전위 특성인자 지표, 칼슘 특성인자 지표, 전하(net charge) 특성인자 지표를 정규화하여 인공 신경망의 입력층 노드에 입력하는 단계;
활성함수 ReLU 함수 (Rectified Linear Unit)를 이용하여 상기 입력층에서 상기 신경망의 은닉층으로 전달하는 단계; 및
활성함수 Softmax 함수를 이용하여 상기 은닉층에서 예측된 심장 부정맥 위험도를 출력층 노드로 출력하는 단계;를 포함하고,
상기 활동전위 특성인자 지표는, dVm/dtmax(활동전위 형상에서 막전위가 탈분극될 때의 최대 기울기), APD50(막전위의 탈분극 부터 최대 진폭에서 50% 재분극 시점까지의 기간), APD90(막전위의 탈분극 부터 최대 진폭에서 90% 재분극 시점까지의 기간) 및 APresting(휴지기 막전위)를 포함하는 것을 특징으로 하는 인공 신경망을 이용한 심장부정맥 유발약물의 스크리닝 방법.
normalizing an action potential characteristic factor index, a calcium characteristic factor index, and a net charge characteristic factor index related to arrhythmias and inputting them to an input layer node of an artificial neural network;
transmitting from the input layer to the hidden layer of the neural network using an activation function ReLU function (Rectified Linear Unit); and
Outputting a cardiac arrhythmia risk predicted in the hidden layer to an output layer node by using an activation function Softmax function;
The action potential characteristic factor index is dVm/dtmax (the maximum slope when the membrane potential is depolarized in the shape of the action potential), APD50 (the period from the depolarization of the membrane potential to the point of 50% repolarization from the maximum amplitude), APD90 (from the depolarization of the membrane potential) A method for screening cardiac arrhythmia-inducing drugs using an artificial neural network, characterized in that it includes period from maximum amplitude to 90% repolarization) and APresting (resting membrane potential).
부정맥과 관련 있는 활동전위 특성인자 지표, 칼슘 특성인자 지표, 전하(net charge) 특성인자 지표를 정규화하여 인공 신경망의 입력층 노드에 입력하는 단계;
활성함수 ReLU 함수 (Rectified Linear Unit)를 이용하여 상기 입력층에서 상기 신경망의 은닉층으로 전달하는 단계; 및
활성함수 Softmax 함수를 이용하여 상기 은닉층에서 예측된 심장 부정맥 위험도를 출력층 노드로 출력하는 단계;를 포함하고,
상기 칼슘 특성인자 지표는, CaD50 (calcium transient duration 50) - 칼슘의 과도기간 중 최대 진폭을 기준으로 50% 지점 사이의 기간 - , CaD90 (calcium transient duration 50) - 칼슘의 과도기간 중 최대 진폭을 기준으로 90% 지점 사이의 기간 - 및 , Caresting(칼슘의이완기 농도)를 포함하는 것을 특징으로 하는 인공 신경망을 이용한 심장부정맥 유발약물의 스크리닝 방법.
normalizing an action potential characteristic factor index, a calcium characteristic factor index, and a net charge characteristic factor index related to arrhythmias and inputting them to an input layer node of an artificial neural network;
transmitting from the input layer to the hidden layer of the neural network using an activation function ReLU function (Rectified Linear Unit); and
Outputting a cardiac arrhythmia risk predicted in the hidden layer to an output layer node by using an activation function Softmax function;
The calcium characteristic factor index, CaD50 (calcium transient duration 50) - period between 50% points based on the maximum amplitude during the transient period of calcium -, CaD90 (calcium transient duration 50) - based on the maximum amplitude during the transient period of calcium A method for screening cardiac arrhythmia-inducing drugs using an artificial neural network, characterized in that it includes a period between the 90% points - and , Caresting (diastolic concentration of calcium).
부정맥과 관련 있는 활동전위 특성인자 지표, 칼슘 특성인자 지표, 전하(net charge) 특성인자 지표를 정규화하여 인공 신경망의 입력층 노드에 입력하는 단계;
활성함수 ReLU 함수 (Rectified Linear Unit)를 이용하여 상기 입력층에서 상기 신경망의 은닉층으로 전달하는 단계; 및
활성함수 Softmax 함수를 이용하여 상기 은닉층에서 예측된 심장 부정맥 위험도를 출력층 노드로 출력하는 단계;를 포함하고,
상기 전하(net charge) 특성인지 지표는, qinward(정상상태와 약물 상태에 따라 INaL, ICaL 이온 채널들을 통해 이동하는 전하량 비율), qnet(이온 채널들을 통해 세포 안과 밖으로 향하는 이온 전하들의 총합)를 포함하는 것을 특징으로 하는 인공 신경망을 이용한 심장부정맥 유발약물의 스크리닝 방법.
normalizing an action potential characteristic factor index, a calcium characteristic factor index, and a net charge characteristic factor index related to arrhythmias and inputting them to an input layer node of an artificial neural network;
transmitting from the input layer to the hidden layer of the neural network using an activation function ReLU function (Rectified Linear Unit); and
Outputting a cardiac arrhythmia risk predicted in the hidden layer to an output layer node by using an activation function Softmax function;
The net charge characteristic index includes qinward (rate of charges moving through INaL and ICaL ion channels depending on the steady state and drug state), qnet (total sum of ion charges moving in and out of the cell through ion channels) A screening method for cardiac arrhythmia-inducing drugs using an artificial neural network, characterized in that.
부정맥과 관련 있는 활동전위 특성인자 지표, 칼슘 특성인자 지표, 전하(net charge) 특성인자 지표를 정규화하여 인공 신경망의 입력층 노드에 입력하는 단계;
활성함수 ReLU 함수 (Rectified Linear Unit)를 이용하여 상기 입력층에서 상기 신경망의 은닉층으로 전달하는 단계; 및
활성함수 Softmax 함수를 이용하여 상기 은닉층에서 예측된 심장 부정맥 위험도를 출력층 노드로 출력하는 단계;를 포함하고,
상기 입력층 노드에 입력되는 입력 데이터는 지표 간의 단위차이로 발생하는 과대적합 또는 과소적합을 피하기 위해 MinMaxScaler를 이용하여 전처리 하는 것을 특징으로 하는 인공 신경망을 이용한 심장부정맥 유발약물의 스크리닝 방법.
normalizing an action potential characteristic factor index, a calcium characteristic factor index, and a net charge characteristic factor index related to arrhythmias and inputting them to an input layer node of an artificial neural network;
transmitting from the input layer to the hidden layer of the neural network using an activation function ReLU function (Rectified Linear Unit); and
Outputting a cardiac arrhythmia risk predicted in the hidden layer to an output layer node by using an activation function Softmax function;
The input data input to the input layer node is preprocessed using MinMaxScaler to avoid overfitting or underfitting caused by unit differences between indicators.
KR1020210007728A 2021-01-19 2021-01-19 Screening method for drugs that cause cardiac arrhythmia using artificial neural networks KR102475057B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020210007728A KR102475057B1 (en) 2021-01-19 2021-01-19 Screening method for drugs that cause cardiac arrhythmia using artificial neural networks

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020210007728A KR102475057B1 (en) 2021-01-19 2021-01-19 Screening method for drugs that cause cardiac arrhythmia using artificial neural networks

Publications (2)

Publication Number Publication Date
KR20220105093A KR20220105093A (en) 2022-07-26
KR102475057B1 true KR102475057B1 (en) 2022-12-06

Family

ID=82609876

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020210007728A KR102475057B1 (en) 2021-01-19 2021-01-19 Screening method for drugs that cause cardiac arrhythmia using artificial neural networks

Country Status (1)

Country Link
KR (1) KR102475057B1 (en)

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102003412B1 (en) * 2017-12-22 2019-07-24 주식회사 데이터젠 Method and system for predicting disease risk data related to cardiovascular and cerebrovascular

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Heikhmakhtiar Aulia Khamas. "In silico assessment of toxicity of proarrhythmia drugs using electrophysiological model of human ventricle". Graduate School Kumoh Institute. pp.1-65, 2019년 12월 공개 1부.*

Also Published As

Publication number Publication date
KR20220105093A (en) 2022-07-26

Similar Documents

Publication Publication Date Title
KR101927910B1 (en) System and method for predicting disease inforamtion using deep neural network
Bologna et al. Investigating neuronal activity by SPYCODE multi-channel data analyzer
Lütcke et al. Inference of neuronal network spike dynamics and topology from calcium imaging data
Wong et al. Intrinsic physiological properties of rat retinal ganglion cells with a comparative analysis
CN112382411B (en) Drug-protein targeting effect prediction method based on heterogeneous graph
CN111128380A (en) Method and system for constructing chronic disease health management model for simulating doctor diagnosis and accurate intervention strategy
CN111105877A (en) Chronic disease accurate intervention method and system based on deep belief network
WO2020067463A1 (en) Method, computer system, and program for predicting characteristics of target compound
Santamaria et al. Modulatory effects of parallel fiber and molecular layer interneuron synaptic activity on Purkinje cell responses to ascending segment input: a modeling study
Li et al. Vertical ground motion model for the NGA-West2 database using deep learning method
KR102475057B1 (en) Screening method for drugs that cause cardiac arrhythmia using artificial neural networks
Vertes et al. Effect of network topology on neuronal encoding based on spatiotemporal patterns of spikes
Moon et al. Neural connectivity inference with spike-timing dependent plasticity network
Nuñez et al. The first artificial intelligence algorithm for identification of bat species in Uruguay
CN109558911A (en) Electromyography signal Feature fusion based on genetic algorithm broad sense canonical correlation analysis
Moradi et al. Systematic data mining of hippocampal synaptic properties
Seo et al. Predicting transgenic markers of a neuron by electrophysiological properties using machine learning
Kharche et al. A global sensitivity index for biophysically detailed cardiac cell models: a computational approach
Aghasafari et al. A deep learning algorithm to translate and classify cardiac electrophysiology: from iPSC-CMs to adult cardiac cells
Wang et al. A gene expression clustering method to extraction of cell-to-cell biological communication
CN117789828B (en) Anti-aging target spot detection system based on single-cell sequencing and deep learning technology
Danadibrata et al. Application of qNet Variability Through the Convolution Neural Network for Assessment of Drug Proarrhythmicity
Kernik et al. A deep learning algorithm to translate and classify cardiac electrophysiology.
Vilette et al. Determining temporal stability in dominance hierarchies
CN116959561B (en) Gene interaction prediction method and device based on neural network model

Legal Events

Date Code Title Description
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant