WO2021091348A1 - 신약 재창출 후보 선정 방법 및 장치 - Google Patents

신약 재창출 후보 선정 방법 및 장치 Download PDF

Info

Publication number
WO2021091348A1
WO2021091348A1 PCT/KR2020/015634 KR2020015634W WO2021091348A1 WO 2021091348 A1 WO2021091348 A1 WO 2021091348A1 KR 2020015634 W KR2020015634 W KR 2020015634W WO 2021091348 A1 WO2021091348 A1 WO 2021091348A1
Authority
WO
WIPO (PCT)
Prior art keywords
drug
predetermined
change
amount
creation
Prior art date
Application number
PCT/KR2020/015634
Other languages
English (en)
French (fr)
Inventor
오지선
김용길
김도훈
이정은
Original Assignee
울산대학교 산학협력단
재단법인 아산사회복지재단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 울산대학교 산학협력단, 재단법인 아산사회복지재단 filed Critical 울산대학교 산학협력단
Publication of WO2021091348A1 publication Critical patent/WO2021091348A1/ko

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/30Prediction of properties of chemical compounds, compositions or mixtures
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C60/00Computational materials science, i.e. ICT specially adapted for investigating the physical or chemical properties of materials or phenomena associated with their design, synthesis, processing, characterisation or utilisation
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/60ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H20/00ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance
    • G16H20/10ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance relating to drugs or medications, e.g. for ensuring correct administration to patients

Definitions

  • the embodiment relates to a method and apparatus for selecting a candidate for re-creation of a new drug, and more particularly, to a method and apparatus for selecting a candidate for re-creation of a new drug for discovering the re-creation of a drug and evaluating its potential use.
  • Drug repositioning is a method of finding a new drug efficacy, that is, a new medical use (indication), by reevaluating drugs already used for a specific purpose after being recognized for its efficacy and safety for a specific disease through clinical trials. It can be said that it is a means of creating a new drug with a high probability of success as it can be expected to reduce costs and shorten the development period by using drugs that have been proven to be safe to some extent.
  • cardiovascular disease accounts for 30% of deaths worldwide and is well known as a risk factor for high blood pressure, diabetes, and dyslipidemia.
  • Many drugs have been developed and used clinically to properly manage major chronic diseases such as.
  • In order to sufficiently overcome these chronic diseases or numerous intractable diseases it is urgent to discover new drugs that can continuously replace or supplement existing drugs, and in order to meet these demands, a means to efficiently create new drugs within a short period of time. This is the time to develop.
  • the embodiment relates to a method and an apparatus for selecting a candidate for re-creation of a new drug for selecting a candidate for re-creation of a new drug with high reliability.
  • the embodiment relates to a method and apparatus for selecting a candidate for re-creation of a new drug for providing an algorithm for analyzing a large amount of information.
  • the embodiment is a method for selecting a candidate for re-creation of a new drug performed by a device for selecting a candidate for re-creation of a new drug, the step of obtaining a clinical index value before and after exposure to a predetermined drug for each patient within a predetermined period, and the obtained clinical trial Calculating the amount of change in the clinical index value before and after exposure to the predetermined drug for each index; calculating the total number of drugs exposed including the predetermined drug for each of the plurality of patients; and Compensating the calculated amount of change for each of the plurality of patients using the total number or weight for each drug, determining an effect other than a predetermined effect of the predetermined drug based on the corrected amount of change, and each drug It may include the step of obtaining a ranking with a high probability of creating a new drug by combining the effects of these.
  • a clinical index value before and after the exposure may be obtained based on clinical data obtained before administration of the predetermined drug for each of the plurality of patients and clinical data obtained after administration of the predetermined drug.
  • the clinical indicator may include test information including cholesterol level, glycated hemoglobin level, and lung capacity, or diagnosis information including diagnosis name, procedure, and prescription, or a combination thereof.
  • Correcting the amount of change may include dividing the calculated amount of change for each of the plurality of patients by the calculated total number of drugs or correcting by assigning a weight for each drug.
  • the determining of effects other than the predetermined effect includes calculating the average amount of change for each drug by calculating the average of the corrected amount of change, and the difference between the predetermined ideal change amount for each clinical index and the average change amount. As such, it may further include determining the effect of the predetermined drug for each clinical indicator.
  • a distance may be calculated based on a difference between the ideal change amount and the average change amount, and may be determined in consideration of the direction of the calculated distance.
  • a first weight is given, and if the direction of the calculated distance is different from the ideal change amount of the drug, a second weight greater than the first weight is applied.
  • a third weight between the first weight and the second weight may be assigned.
  • a value having the lowest value to which the first to third weights are applied may be ranked as the highest priority.
  • the step of estimating the amount of change in the value of the clinical index before and after exposure to the predetermined drug for each obtained clinical index includes setting a period within a predetermined period from the point of use and the end of the drug as a threshold value, and the threshold value
  • the amount of change in the clinical index value can be calculated using the test result within the range.
  • the predetermined effect of the predetermined drug is analyzed using a one-sample T-test method or a Wilcoxon rank sum test method in which a significance level is set. And, it is possible to adjust the error of the analysis using Bonferroni and FDR (False Discovery Rate).
  • the embodiment includes a memory and a processor for storing clinical index values before and after exposure to a predetermined drug for each patient, wherein the processor includes values of the clinical index before and after exposure to the predetermined drug for each of the acquired clinical indicators. Calculate the amount of change in, and calculate the total number of exposed drugs including the predetermined drug for each of the plurality of patients, and the calculated amount of change for each of the plurality of patients using the total number of selected drugs or weights for each drug. And, based on the corrected amount of change, an effect other than a predetermined effect of the predetermined drug is determined, and effects of each of the drugs are combined to obtain a ranking with a high possibility of re-creation of a new drug.
  • the device may further include a communication interface for acquiring test index values before and after exposure by using clinical data obtained before administration of the predetermined drug for each of the plurality of patients and clinical data obtained after administration of the predetermined drug. .
  • the clinical indicator may include test information including cholesterol level, glycated hemoglobin level, and lung capacity, or diagnosis information including diagnosis name, procedure, and prescription, or a combination thereof.
  • the processor may correct the calculated amount of change for each of the plurality of patients by dividing the calculated amount of change for each of the plurality of patients by the calculated total number of drugs.
  • the processor calculates an average of the corrected amount of change for each of the plurality of patients, calculates an average amount of change for each drug for the clinical index, and the difference between the predetermined ideal change amount for each clinical index and the average amount of change Based on, it is possible to determine the effect of the predetermined drug for each clinical indicator.
  • the processor may calculate a distance based on a difference between the ideal change amount and the average change amount, and determine the effect of the predetermined drug in consideration of the direction of the calculated distance.
  • the processor assigns a first weight, and if the direction of the calculated distance is different from the ideal change amount of the drug, the first weight When a larger second weight is assigned and the direction of the calculated distance is not known, a third weight between the first weight and the second weight may be assigned.
  • the processor may set a lowest value among values to which the first to third weights are applied as the highest priority.
  • the embodiment selects candidates for re-creation of new drugs using a large amount of information, thereby improving the reliability of selection of candidates for re-creation of Shinyang.
  • the embodiment provides an analysis algorithm capable of using a large amount of information, thereby effectively selecting candidates for re-creation of new materials.
  • FIG. 1 is a flowchart illustrating a method of selecting a candidate for re-creation of a new drug according to an embodiment.
  • 2 to 6 are diagrams for explaining a method of selecting a candidate for re-creation of a new drug according to an embodiment.
  • FIG. 7 is a flowchart illustrating an apparatus for selecting a candidate for re-creation of a new drug according to an embodiment.
  • FIG. 8 is a diagram showing a sequence of drugs selected by the device for selecting a candidate for re-creation of a new drug according to an embodiment.
  • FIGS. 2 to 6 are diagrams for explaining a method of selecting a candidate for re-creation of a new drug according to an exemplary embodiment.
  • the step of obtaining a clinical index value before and after exposure to a predetermined drug for each patient within a predetermined period (S110), and the obtained clinical index Calculating the amount of change in the clinical index value before and after exposure to the predetermined drug for each (S120), and calculating the total number of exposed drugs including the predetermined drug for each of the plurality of patients (S130), Compensating the calculated amount of change for each of the plurality of patients using the calculated total number of drugs (S140), and effects other than the clinical effect and the predetermined effect of the predetermined drug based on the corrected amount of change.
  • It may include a determining step (S150) and a step (S160) of combining various clinical effects of each drug to obtain a ranking with high clinical usefulness and possibility of re-creation of a new drug.
  • the method of selecting a candidate for re-creation of a new drug may be performed by an apparatus for selecting a candidate for re-creation of a new drug.
  • a step (S110) of acquiring clinical index values before and after exposure to a predetermined drug for each patient may be performed.
  • Clinical index values before and after exposure to a predetermined drug for each patient may be collected from the server.
  • the server is a separate database that generally contains electronic medical record (EMR) data, and may include, for example, a clinical data warehouse (CDW) or common data mode (CDM) server. I can.
  • EMR electronic medical record
  • CDW clinical data warehouse
  • CDDM common data mode
  • the server 200 includes serial number (delimiter) for each patient, prescription information, test information (cholesterol level, glycated hemoglobin level, lung capacity, etc.), diagnostic information (diagnosis name, procedure, prescription). And the like may be included.
  • the server 200 stores drug prescription history for each patient, laboratory tests, and execution dates and results for each test by combining them in the server 200.
  • a patient-specific visit (outpatient, hospitalization, emergency room) history and diagnosis, surgery/procedure history, and the like may be further included.
  • the server 200 since the prescription history and laboratory test results for each patient with a prescription history are recorded, it is possible to collect data with high reliability.
  • the clinical index value may include test results such as cholesterol level, glycated hemoglobin (HbAlc) level, lung capacity, etc., various clinical data items such as diagnosis name, procedure, prescription, or operational definition through a combination thereof.
  • test results such as cholesterol level, glycated hemoglobin (HbAlc) level, lung capacity, etc.
  • various clinical data items such as diagnosis name, procedure, prescription, or operational definition through a combination thereof.
  • the scope and criteria of the period of not being exposed to the drug and the period of exposure are assigned differently depending on the drug or clinical indicator, and according to this criterion, the process of obtaining clinical data before and after exposure may be included. .
  • a step (S120) of calculating a change amount of the clinical index value before and after exposure to the predetermined drug for each acquired clinical index may be performed.
  • the amount of change in the value of the clinical index before and after exposure to a predetermined drug for each extracted clinical index may be calculated.
  • a representative value eg, mean, median, frequency, logical value [presence/absence, etc.]
  • the difference eg, change amount.
  • the data obtained from the server 200 were exposed to a specific drug for each patient at least once, and the data of the patient who received the laboratory test result before and after the administration was used for research evaluation.
  • the data (exposed group) the test results performed during the use period of the drug were used, and the data at the time point when not exposed to the drug (non-exposed group) was used for comparative evaluation.
  • the threshold value reflects a period in which the effect of the drug can potentially appear, and a period within a predetermined period from the start point and the end point of drug use may be set as the threshold value.
  • the test result within 1 day after the start of drug use or 1 week after the drug withdrawal (interruption) may be set to a period of no exposure.
  • the threshold value is not limited thereto, and may be changed to various reference values to reflect the characteristics of the target drug or the characteristics of clinical indicators.
  • the maximum interval used to compare the unexposed time point and the exposed time point for an individual patient is determined within a separate threshold range, where the threshold value is set to a period within one year. This threshold value is not limited thereto, and may be changed according to various criteria.
  • the exposed group (G1) used for the study evaluation and the non-exposed group (G2) used for the comparative evaluation may be paired.
  • FIG. 3 as an example, two pairing groups are shown.
  • the left group may be referred to as a first pairing group P1
  • the right group may be referred to as a second pairing group P2.
  • the first pairing group P1 shows a state in which the exposed group G1 and the non-exposed group G2 are paired.
  • a step (S120) of calculating the total number of exposed drugs including the predetermined drug for each patient may be performed.
  • a drug prescription for a patient includes several drugs at each time point
  • the cause of the drug's effect on the test results at each test time point may be ambiguous.
  • a patient exposed to a specific drug may be simultaneously exposed to various drugs of different types for each time point. This can obscure the cause of the effect on the drug.
  • a step (S130) of calculating the total number of exposed drugs may be performed. This can calculate the total number of drugs exposed for each time point by using data obtained from the server 200.
  • a step S140 of correcting the calculated amount of change for each of the plurality of patients by dividing by using the calculated total number of drugs or reflecting individual characteristic information (weight) of the drugs exposed at the same time may be performed.
  • the calculated amount of change may be corrected by grouping them and dividing them by the number of two drugs.
  • the number of prescribed drugs is n, it can be adjusted to reflect ambiguity by dividing the amount of change of the drug by n.
  • step (S150) of estimating the effect of the drug on the paired group may be performed.
  • the effect of the drug can be estimated through statistical analysis. For example, drugs using the paired-sample T-test (one-sample T-test for the corrected difference value of the corresponding sample), the Wilcoxon code ranking test (the Wilcoxon rank sum test for the corrected difference value of the corresponding sample)). The effect of can be estimated.
  • the paired-sample T-test method uses two corresponding values as it is, and the one-sample T-test method may be a method of obtaining a difference value between corresponding samples and using one value. In the examples, a one-sample T-test may be used.
  • the statistical analysis method is not limited thereto, and as an example, other statistical analysis methods may be used when the measured value is not a number.
  • Corresponding sample T-test, Wilcoxon's code ranking test may be one of widely used statistical analysis methods to evaluate the significance of treatment effects by comparing the size of measurements before and after treatment.
  • HbA1c glycated hemoglobin
  • the step (S150) of selecting an effect other than a predetermined effect of a predetermined drug may be performed based on the amount of change corrected for drugs having a significant effect on a specific clinical index.
  • a drug having an effect of improving the clinical index is selected from among drugs having a significant effect on a specific clinical index, and then the corresponding clinical index is improved. It can be carried out in a way that excludes the prescribed drugs.
  • Determining the effect of improving a specific clinical indicator can be determined by comparing the corrected change amount for each drug, that is, the estimated effect with the ideal change amount, and whether the direction of the effect coincides.
  • Drugs for which the effect (i.e., use) for a specific clinical indicator has been determined can be confirmed through a drug classification system (e.g. Anatomical Therapeutic Chemical Classification) or country-specific drug approval information (e.g., U.S. Food and Drug Administration).
  • a drug classification system e.g. Anatomical Therapeutic Chemical Classification
  • country-specific drug approval information e.g., U.S. Food and Drug Administration
  • a step (S160) of prioritizing important drugs among the candidate groups for new drug re-creation selected as having significant effects other than the predetermined effects may be performed.
  • the step of prioritizing important drugs can be performed in two ways: a method for ranking individual clinical indicators and a complex advantageous ranking for a plurality of clinical indicators.
  • the step of prioritizing important drugs (S160) may be performed alone or in combination with the effects of each drug.
  • the ideal effect ranking of each drug for a specific clinical indicator can be determined based on the magnitude and direction of the effect of each drug's corrected variance (positive or negative).
  • low-density lipoprotein (LDL) cholesterol must have a negative direction ( ⁇ 0) to be effective
  • high-density lipoprotein (HDL) cholesterol must have a positive direction (>0) to be effective.
  • Fat (TG) must have a negative direction ⁇ 0) to be effective
  • glycated hemoglobin (HbA1c) must have a negative direction ( ⁇ 0) to be effective. Based on these criteria, priority is given to the ideal effect direction (positive or negative) as well as the greater the magnitude of the effect, thereby giving priority to drugs with higher potential for new drug re-creation for specific clinical indicators among multiple new drug re-creation candidates. Can help you choose.
  • each clinical indicator can be weighted. For example, if the calculated distance direction is the same as the abnormal change amount, a first weight is given, and if the calculated distance direction is different from the abnormal change amount, a second weight greater than the first weight is given, and the calculated distance direction is known. If not, a third weight between the first weight and the second weight may be assigned.
  • drug A has a negative effect direction for low-density lipoprotein (LDL) cholesterol, a positive direction for high-density lipoprotein (HDL) cholesterol, and a negative direction for triglyceride (TG). And has a negative direction for glycated hemoglobin (HbA1c).
  • LDL low-density lipoprotein
  • HDL high-density lipoprotein
  • TG triglyceride
  • HbA1c glycated hemoglobin
  • drug A can have a total value of 0 as (0,0,0,0).
  • Drug B may have a total value of 2 as (0,1,0,1).
  • Drug C may have a total value of 2 as (0,0,0,2). From this, as for the effect of the drug, a value having the lowest value to which the first to third weights are applied can be ranked as a higher priority.
  • drug A may be measured as a first priority, and drug B and drug C have the same value, and thus may be measured as a second priority.
  • Drug A has more ideal effects on multiple clinical indicators at the same time compared to Drug B or C, so it may be more advantageous for actual clinical use, and thus, the possibility of re-creation of new drugs is more likely. It can be evaluated as high.
  • FIG. 7 is a block diagram showing an apparatus for selecting a candidate for re-creation of a new drug according to an embodiment.
  • the apparatus 100 for selecting a candidate for re-creation of a new drug includes an acquisition unit 110 for acquiring values of clinical indicators before and after exposure to predetermined drugs for each patient, and for each of the extracted clinical indicators.
  • a change amount calculation unit 120 that calculates a change amount of the value of the clinical index before and after exposure to the prescribed drug, and a drug calculation unit that calculates the total number of exposed drugs including the prescribed drug for each of the plurality of patients ( 130), and a correction unit 140 for correcting the calculated amount of change for each of the plurality of patients using the total number of the selected drugs, and effects other than the predetermined effect of the predetermined drug based on the corrected amount of change.
  • It may include an effect determination unit 150 for determining the, and a ranking determination unit 160 and a memory 170 that combine various clinical effects of each drug to obtain a ranking with high clinical usefulness and the possibility of re-creation of a new drug. have.
  • the acquisition unit 110 may collect patient, disease, and laboratory test result information using data existing in the server 200.
  • the server 200 is generally a separate database containing electronic medical record (EMR) data, for example, a clinical data warehouse (CDW) or a common data model (common data mode, CDM). ) May include a server.
  • EMR electronic medical record
  • CDW clinical data warehouse
  • CDM common data model
  • the clinical index value may include test results such as cholesterol level, HbAlc level, lung capacity, etc., as well as various clinical data items such as diagnosis name, procedure, prescription, or operational definition through a combination thereof.
  • the information collected by the acquisition unit 110 may be stored in the memory 170.
  • the acquisition unit 110 may acquire and store a clinical index value from the server 20, and may include a communication interface 190.
  • the change amount calculation unit 120 may calculate a change amount of the value of the clinical index before and after exposure to a predetermined drug for each extracted clinical index.
  • the exposed group and the non-exposed group may be paired, and grouping may be performed for a plurality of drugs among the exposed groups.
  • the drug calculation unit 130 may calculate the total number of a plurality of drugs exposed for each patient.
  • the drug calculation unit 130 may calculate the total number of drugs using data provided from the server 200.
  • the correction unit 140 may divide by using the total number of drugs (ie, give the same weight) or correct the amount of change calculated for each of the plurality of patients by reflecting individual characteristic information (weight) of the drugs exposed at the same time.
  • the effect determination unit 150 may estimate the effect and significance of the drug through a statistical analysis method. Determining the effect of improving a specific clinical indicator can be determined by comparing the corrected change amount for each drug, that is, the estimated effect with the ideal change amount, and whether the direction of the effect coincides.
  • a first weight is given, and if the calculated distance direction is different from the abnormal change amount, a second weight greater than the first weight is given, and the calculated distance direction is unknown.
  • a third weight between the first weight and the second weight is assigned, and a value having the lowest value to which the first to third weights are applied is assigned a higher priority.
  • the priority determination unit 160 may perform a step of prioritizing important drugs among the candidate group for new drug re-creation by combining various clinical effects of each drug.
  • a method of prioritizing important drugs there are two methods: ranking individual clinical indicators and ranking multiple clinical indicators in combination.
  • the ideal effect ranking of each drug for a specific clinical indicator can be determined based on the magnitude and direction of the effect of each drug's corrected variance (positive or negative). In order to rank advantageously for multiple clinical indicators, it is possible to calculate the distance between the effect of the ideal drug and the effect of individual drugs for each clinical indicator.
  • the acquisition unit 110, the change amount calculation unit 120, the drug calculation unit 130, the correction unit 140, the effect determination unit 150, and the ranking determination unit 160 are It may be implemented by, and the program may be stored in the memory 170.
  • FIG. 8 is a diagram showing a sequence of drugs selected by the device for selecting a candidate for re-creation of a new drug according to an embodiment.
  • a candidate drug search algorithm was proposed based on new clinical big data in order to identify candidate drugs that have a significant influence on the laboratory results selected after administration in the same patient.
  • LDL low density lipoprotein
  • HDL high density lipoprotein
  • TG triglyceride
  • HbA1c glycated hemoglobin
  • low-density lipoprotein (LDL) cholesterol, high-density lipoprotein (HDL) cholesterol, triglyceride (TG), and glycated hemoglobin (HbA1c) were selected as clinical index values.
  • LDL low-density lipoprotein
  • HDL high-density lipoprotein
  • TG triglyceride
  • HbA1c glycated hemoglobin
  • the method and apparatus for selecting a candidate for re-creation of a new drug according to an embodiment has an effect of achieving re-creation of a new drug according to the selection of various clinical indicators.

Landscapes

  • Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Theoretical Computer Science (AREA)
  • Computing Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Epidemiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Primary Health Care (AREA)
  • Public Health (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Medicinal Chemistry (AREA)
  • Medical Treatment And Welfare Office Work (AREA)
  • Investigating Or Analysing Biological Materials (AREA)

Abstract

실시예는 신약 재창출 후보 선정 장치에서 수행되는 신약 재창출 후보 선정 방법에 있어서, 복수의 환자 별 소정 약물에 대한 노출 전후의 임상 지표 값을 일정 기간 범위 내에서 획득하는 단계와, 상기 획득된 임상 지표 별 상기 소정 약물에 대한 노출 전후의 상기 임상 지표 값의 변화량을 산정하는 단계와, 상기 복수의 환자 별 상기 소정 약물을 포함하여 노출된 약물의 총 개수를 산정하는 단계와, 상기 산정된 약물의 총 개수나 약물 별 가중치를 이용하여 상기 복수의 환자 별 상기 산정된 변화량을 보정하는 단계와, 상기 보정된 변화량을 기초로 상기 소정 약물의 기지정된 효과 이외의 효과를 판단하는 단계와, 상기 각 약물들이 가진 효과들을 단독 또는 조합하여 신약재창출 가능성이 높은 순위를 구하는 단계를 포함할 수 있다.

Description

신약 재창출 후보 선정 방법 및 장치
실시예는 신약 재창출 후보 선정 방법 및 장치에 관한 것으로, 보다 상세하게는 약물의 재창출을 발견하고 이의 잠재적인 사용을 평가하기 위한 신약 재창출 후보 선정 방법 및 장치에 관한 것이다.
최근 다국적 제약 회사들은 특허 기간만료와 신약 개발비용의 증가에 따른 수익성 악화로 큰 위기를 맞고 있다. 다양한 신약 개발 기술과 생명공학 분야의 대용량 데이터의 축적에도 불구하고, 신약 허가 건수는 감소하고 있다.
이는 신약 물질 발굴에 요구되는 비용 증가와 높아진 안전성 규정에 따른 결과로 이런 위기를 극복하기 위해 저비용/고효율의 신약 개발 방안이 요구되는데, 신약 재창출(drug repositioning)이 그 요구를 충족시킬 수 있는 새로운 방법으로 주목받고 있다.
신약 재창출(drug repositioning)이란 임상시험을 통해 특정 질환에 대해 그 효능과 안전성을 인정받아 특정 용도로 이미 사용되고 있는 약물을 다시 평가하여 새로운 약효, 즉 새로운 의학적 용도(적응증)를 찾아가는 방법으로, 이미 안전성이 어느 정도 검증된 약물을 활용함으로써 비용절감 및 개발기간의 단축을 기대할 수 있어 그 만큼 성공 가능성이 높은 신약 창출의 수단이라 할 수 있다.
인구고령화 심화 및 만성, 난치질환 등으로 신약에 대한 수요는 갈수록 증가하고 있는데, 예로서, 심혈관 질환은 전 세계적으로 사망 원인의 30%를 차지하며 그 위험인자로 잘 알려진 고혈압, 당뇨병, 이상지질혈증과 같은 주요 만성 질환들을 적절히 관리하기 위해 많은 약물이 개발되어 임상적으로 사용되고 있다. 이러한 만성질환들이나 수많은 난치질환들을 충분히 극복하기 위해서는 계속해서 기존 약을 대체하거나 보완할 수 있는 새로운 약물의 발굴이 절실한 상태이며, 이러한 요구에 부응하기 위해서는 빠른 기간 내에 효율적으로 신약을 창출할 수 있는 수단의 개발이 필요한 시점이다.
하지만, 이미 사용하고 있는 약들에 대해 재평가를 통해 신약 재창출을 하기 위해서는 약물에 대한 수많은 정보를 필요로 하며, 이를 위해 대규모의 의료 빅데이터를 효과적으로 분석하여 다량의 유용한 정보를 획득하기 위한 방법의 개발이 필요한 상황이다.
상술한 문제점을 해결하기 위해, 실시예는 신뢰도가 높은 신약 재창출 후보를 선정하기 위한 신약 재창출 후보 선정 방법 및 장치에 관한 것이다.
또한, 실시예는 대용량의 정보를 분석하기 위한 알고리즘을 제공하기 위한 신약 재창출 후보 선정 방법 및 장치에 관한 것이다.
실시예는 신약 재창출 후보 선정 장치에서 수행되는 신약 재창출 후보 선정 방법에 있어서, 복수의 환자 별 소정 약물에 대한 노출 전후의 임상 지표 값을 일정 기간 범위 내에서 획득하는 단계와, 상기 획득된 임상 지표 별 상기 소정 약물에 대한 노출 전후의 상기 임상 지표 값의 변화량을 산정하는 단계와, 상기 복수의 환자 별 상기 소정 약물을 포함하여 노출된 약물의 총 개수를 산정하는 단계와, 상기 산정된 약물의 총 개수나 약물 별 가중치를 이용하여 상기 복수의 환자 별 상기 산정된 변화량을 보정하는 단계와, 상기 보정된 변화량을 기초로 상기 소정 약물의 기지정된 효과 이외의 효과를 판단하는 단계와, 상기 각 약물들이 가진 효과들을 조합하여 신약재창출 가능성이 높은 순위를 구하는 단계를 포함할 수 있다.
상기 방법은, 상기 복수의 환자 별 상기 소정 약물의 투여 전에 획득된 임상 데이터와 상기 소정 약물의 투여 후 획득된 임상 데이터를 기초로 상기 노출 전후의 임상 지표 값이 획득될 수 있다.
상기 임상 지표는 콜레스테롤 수치, 당화혈색소 수치, 폐활량을 포함하는 검사 정보 또는 진단명, 시술, 처방을 포함하는 진단 정보, 또는 이들의 조합을 포함할 수 있다.
상기 변화량을 보정하는 단계는 상기 복수의 환자 별 상기 산정된 변화량을 상기 산정된 약물의 총 개수로 나누거나 약물 별 가중치를 부여하여 보정하는 단계를 포함할 수 있다.
상기 기지정된 효과 이외의 효과를 판단하는 단계는 보정된 변화량의 평균을 산출하여 각 약물 별 평균 변화량을 산출하는 단계와, 상기 임상 지표 별 기지정된 이상(ideal) 변화량과 상기 평균 변화량의 차이를 기초로, 상기 임상 지표 별 상기 소정 약물의 효과를 판단하는 단계를 더 포함할 수 있다.
상기 소정 약물의 효과를 판단하는 단계는 상기 이상(ideal) 변화량과 상기 평균 변화량의 차이로 거리를 계산하고, 상기 계산된 거리의 방향을 고려하여 판단할 수 있다.
상기 계산된 거리의 방향이 상기 약물의 이상(ideal) 변화량과 동일하면 제1 가중치를 부여하고, 상기 계산된 거리의 방향이 상기 약물의 이상(ideal) 변화량과 다르면 상기 제1 가중치보다 큰 제2 가중치를 부여하고, 상기 계산된 거리의 방향을 알 수 없을 경우, 상기 제1 가중치와 상기 제2 가중치 사이의 제3 가중치를 부여할 수 있다.
상기 소정 약물의 효과는 상기 제1 가중치 내지 상기 제3 가중치를 적용한 값이 가장 낮은 값을 가장 높은 순위로 책정할 수 있다.
상기 획득된 임상 지표 별 상기 소정 약물에 대한 노출 전후의 상기 임상 지표 값의 변화량을 산정하는 단계는, 상기 약물의 사용 시점과 종료 시점으로부터 각각 일정 기간 내의 기간을 임계값으로 설정하고, 상기 임계값 범위 내의 검사 결과를 이용하여 상기 임상 지표값의 변화량을 산정할 수 있다.
상기 보정된 변화량을 기초로 상기 소정 약물의 기지정된 효과 이외의 효과를 판단하는 단계에서, 상기 소정 약물의 기지정된 효과는 유의 수준이 설정된 일표본 T-검정법 또는 윌콕슨 순위합 검정법을 이용하여 분석하고, Bonferroni 및 FDR(False Discovery Rate) 을 이용하여 상기 분석의 오류를 조정할 수 있다.
실시예는 복수의 환자 별 소정 약물에 대한 노출 전후의 임상 지표 값이 저장되는 메모리와 프로세서를 포함하되, 상기 프로세서는, 상기 획득된 임상 지표 별 상기 소정 약물에 대한 노출 전후의 상기 임상 지표의 값의 변화량을 산정하고, 상기 복수의 환자 별 상기 소정 약물을 포함하여 노출된 약물의 총 개수를 산정하고, 상기 선정된 약물의 총 개수나 약물별 가중치를 이용하여 상기 복수의 환자 별 상기 산정된 변화량을 보정하고, 상기 보정된 변화량을 기초로 상기 소정 약물의 기지정된 효과 이외의 효과를 판단하고, 상기 각 약물들이 가진 효과들을 조합하여 신약재창출 가능성이 높은 순위를 구할 수 있다.
상기 장치는, 상기 복수의 환자 별 상기 소정 약물의 투여 전에 획득된 임상 데이터와 상기 소정 약물의 투여 후 획득된 임상 데이터를 이용하여 노출 전후의 검사 지표 값을 획득하는 통신용 인터페이스를 더 포함할 수 있다.
상기 임상 지표는 콜레스테롤 수치, 당화혈색소 수치, 폐활량을 포함하는 검사 정보 또는 진단명, 시술, 처방을 포함하는 진단 정보, 또는 이들의 조합을 포함할 수 있다.
상기 프로세서는, 상기 복수의 환자 별 상기 산정된 변화량을 상기 산정된 약물의 총 개수로 나누어 상기 복수의 환자 별 상기 산정된 변화량을 보정할 수 있다.
상기 프로세서는, 상기 복수의 환자 별 상기 보정된 변화량의 평균을 산출하여, 상기 임상 지표에 대한 각 약물 별 평균 변화량을 산출하고, 상기 임상 지표 별 기지정된 이상(ideal) 변화량과 상기 평균 변화량의 차이를 기초로, 상기 임상 지표 별 상기 소정 약물의 효과를 판단할 수 있다.
상기 프로세서는, 상기 이상(ideal) 변화량과 상기 평균 변화량의 차이로 거리를 계산하고, 상기 계산된 거리의 방향을 고려하여 상기 소정 약물의 효과를 판단할 수 있다.
상기 프로세서는, 상기 계산된 거리의 방향이 상기 약물의 이상(ideal) 변화량과 동일하면 제1 가중치를 부여하고, 상기 계산된 거리의 방향이 상기 약물의 이상(ideal) 변화량과 다르면 상기 제1 가중치보다 큰 제2 가중치를 부여하고, 상기 계산된 거리의 방향을 알 수 없을 경우, 상기 제1 가중치와 상기 제2 가중치 사이의 제3 가중치를 부여할 수 있다.
상기 프로세서는, 상기 제1 가중치 내지 상기 제3 가중치를 적용한 값 중 가장 낮은 값을 가장 높은 순위로 책정할 수 있다.
실시예는 대용량의 정보를 이용하여 신약 재창출 후보를 선정함으로써, 신양 재창출 후보의 선정 신뢰도를 향상시킬 수 있는 효과가 있다.
또한, 실시예는 대용량의 정보를 이용할 수 있는 분석 알고리즘을 제공함으로써, 신양 재창출 후보를 효과적으로 선정할 수 있는 효과가 있다.
도 1은 실시예에 따른 신약 재창출 후보 선정 방법을 나타낸 순서도이다.
도 2 내지 도 6은 실시예에 따른 신약 재창출 후보 선정 방법을 설명하기 위한 도면이다.
도 7은 실시예에 따른 신약 재창출 후보 선정 장치를 나타낸 순서도이다.
도 8은 실시예에 따른 신약 재창출 후보 선정 장치에 의해 선정된 약물의 순서를 나타낸 도면이다.
이하, 도면을 참조하여 실시예를 상세히 설명하기로 한다
도 1은 실시예에 따른 신약 재창출 후보 선정 방법을 나타낸 순서도이고, 도 2 내지 도 6은 실시예에 따른 신약 재창출 후보 선정 방법을 설명하기 위한 도면이다.
도 1을 참조하면, 실시예에 따른 신약 재창출 후보 선정 방법은 복수의 환자 별 소정 약물에 대한 노출 전후의 임상 지표 값을 일정 기간 범위 내에서 획득하는 단계(S110)와, 상기 획득된 임상 지표 별 상기 소정 약물에 대한 노출 전후의 상기 임상 지표 값의 변화량을 산정하는 단계(S120)와, 상기 복수의 환자 별 상기 소정 약물을 포함하여 노출된 약물의 총 개수를 산정하는 단계(S130)와, 상기 산정된 약물의 총 개수를 이용하여 상기 복수의 환자 별 상기 산정된 변화량을 보정하는 단계(S140)와, 상기 보정된 변화량을 기초로 상기 소정 약물의 임상적 효과 및 기지정된 효과 이외의 효과를 판단하는 단계(S150)와, 각 약물들이 가진 다양한 임상적 효과들을 조합하여 임상적 유용성 및 신약재창출 가능성이 높은 순위를 구하는 단계(S160)를 포함할 수 있다. 여기서, 신약 재창출 후보 선정 방법은 신약 재창출 후보 선정 장치에서 수행될 수 있다.
먼저, 복수의 환자 별 소정 약물에 대한 노출 전후의 임상 지표 값을 획득하는 단계(S110)를 수행할 수 있다.
환자 별 소정 약물에 대한 노출 전후의 임상 지표 값은 서버로부터 수집될 수 있다. 서버는 일반적으로 전자의무기록(electronic medical record, EMR) 데이터를 담고 있는 별도의 데이터베이스로서, 예컨대 임상 데이터 웨어하우스(clinical data warehouse, CDW) 또는 공통 데이터 모델(common data mode, CDM) 서버를 포함할 수 있다.
일예로, 도 2에 도시된 바와 같이, 서버(200)에는 환자별 일련번호(구분자), 처방 정보, 검사 정보(콜레스테롤 수치, 당화혈색소 수치, 폐활량 등), 진단 정보(진단명, 시술, 처방) 등이 포함될 수 있다. 서버(200)에는 이를 조합하여 환자별 약물 처방 이력(Prescription history), 실험실 검사를 비롯한 각종 검사별 시행일시와 결과값(Laboratory test history)이 저장되어 있다. 서버(200)에는 이외에도 환자별 내원(외래, 입원, 응급실) 이력과 진단, 수술/시술 이력 등을 더 포함할 수 있다.
서버(200)에는 그 동안 처방 이력이 있는 환자별 처방 이력 및 실험실 검사 결과가 기록되어 있기 때문에 신뢰성이 높은 데이터 수집이 가능하다.
여기서, 임상 지표 값은 콜레스테롤 수치, 당화혈색소(HbAlc) 수치, 폐활량 등과 같은 검사결과를 비롯하여 진단명, 시술, 처방과 같은 다양한 임상 데이터 항목, 또는 이들의 조합을 통한 조작적 정의를 포함할 수 있다.
약물에 노출되지 않은 기간 및 노출된 기간(약물에 의해 영향을 받는 기간)의 범위와 기준은 약물이나 임상 지표에 따라 다르게 부여하고 이 기준에 따라 노출 전과 후의 임상 데이터를 획득하는 과정이 포함될 수 있다.
데이터 획득이 완료되면, 획득된 임상 지표 별 상기 소정 약물에 대한 노출 전후의 상기 임상 지표 값의 변화량을 산정하는 단계(S120)를 수행할 수 있다.
변화량을 산정하는 단계(S120)는 추출된 임상 지표 별 소정 약물에 대한 노출 전후의 상기 임상 지표의 값의 변화량을 산정할 수 있다.
노출 전 구간 또는 노출 후 구간의 복수의 임상 데이터의 변화량을 산정하기 위해 각 구간별로 대푯값(예: 평균, 중위값, 빈도, 논리값[유/무 등] 등)을 얻은 뒤 그 차이(예: 변화량, 비율, 논리값 등)를 구하는 과정이 포함될 수 있다.
실시예에서는 동일한 환자에서 투약 후 선택된 실험실 결과에 중요한 영향을 미치는 후보 약물을 확인하는 것이다.
따라서, 서버(200)로부터 획득된 데이터를 개별 환자에 대해 특정 약물에 적어도 한번 이상 노출되어 투약 전과 후에 실험실 검사 결과를 받은 환자의 데이터를 연구 평가에 사용하였으며, 각각의 연구 약물에 노출된 시점의 데이터(노출 그룹)는 해당 약물의 사용기간 내 시행된 검사 결과를 사용하고, 해당 약물에 노출되지 않은 시점의 데이터(비노출 그룹)는 노출 임계 값 범위 내의 검사 결과를 비교 평가에 사용하였다. 여기서, 임계값은 약물의 효과가 잠재적으로 나타날 수 있는 기간을 반영하는 것으로서, 약물 사용 시작시점과 종료시점으로부터 각각 일정 기간 내의 기간을 임계값으로 설정할 수 있다. 일 예로서, 약물 사용 시작 후 1일 이내 또는 약물 회수(중단) 후 1주일 이후의 검사 결과는 노출되지 않은 기간으로 설정할 수 있다.
물론, 임계값은 이에 한정되지 않으며 대상 약물의 특성이나 임상 지표의 특성을 반영하기 위하여 다양한 기준값으로 변경될 수 있다. 개별 환자에 대해 노출되지 않은 시점과 노출된 시점의 비교에 사용되는 최대 간격은 별도의 임계값 범위 내에서 결정되며, 여기서, 임계값은 1년 내의 기간으로 설정하였다. 이 임계값은 이에 한정되지 않으며 다양한 기준으로 변경될 수 있다.
도 3에 도시된 바와 같이, 연구 평가에 사용된 노출 그룹(G1)과 비교 평가에 사용된 비노출 그룹(G2)을 페어링할 수 있다. 도 3에서는 일예로, 2개의 페어링 그룹을 보여주고 있으며, 좌측의 그룹을 제1 페어링 그룹(P1)이라 칭할 수 있으며, 우측의 그룹을 제2 페어링 그룹(P2)이라 칭할 수 있다. 제1 페어링 그룹(P1)은 노출 그룹(G1)과 비노출 그룹(G2)을 페어링 한 상태를 도시하고 있다.
도 1로 돌아가서, 복수의 환자 별 상기 소정 약물을 포함하여 노출된 약물의 총 개수를 산정하는 단계(S120)를 수행할 수 있다.
어떤 환자에 대한 약물 처방은 시점별로 여러 약물을 포함하기 때문에 해당 검사 시점별 검사 결과에 대한 약물의 효과의 원인은 모호할 수 있다. 즉, 특정 약물에 대해 노출된 환자는 시점별로 다른 종류의 다양한 약물에 동시에 노출될 수 있다. 이로 인해 약물에 대한 효과의 원인이 모호해질 수 있다.
이러한 모호성을 조정하기 위해 노출된 약물의 총 개수를 산정하는 단계(S130)를 수행할 수 있다. 이는 서버(200)로부터 획득된 데이터를 이용하여 해당 시점별로 노출된 약물의 총 개수를 산정할 수 있다.
이어서, 산정된 약물의 총 개수를 이용하여 나누거나 동시에 노출된 약물들의 개별 특성 정보(가중치)를 반영하여 상기 복수의 환자 별 상기 산정된 변화량을 보정하는 단계(S140)를 수행할 수 있다.
도 3에 도시된 바와 같이, 제2 페어링 그룹(P2)을 보면, 산정된 약물의 개수가 2개라고 가정하면, 이를 그룹화시키고 2개의 약물의 개수로 나누어 산정된 변화량을 보정할 수 있다. 물론, 처방된 약물의 개수가 n개 일 경우, 약물의 변화량에 대해 n으로 나누어 모호성을 반영하도록 조정할 수 있다.
이어서, 페어링된 그룹에 대해 약물의 효과를 추정하는 단계(S150)를 수행할 수 있다.
도 4에 도시된 바와 같이, 약물의 효과는 통계적인 분석법을 통해 약물의 효과 및 유의성을 추정할 수 있다. 예컨대, 대응표본 T-검정법(대응표본의 보정된 차이값에 대한 일표본 T-검정법), 윌콕슨 부호순위 검정법(대응표본의 보정된 차이값에 대한 윌콕슨 순위합 검정))을 이용하여 약물의 효과를 추정할 수 있다.
대응표본 T-검정법은 대응되는 두 값을 그대로 이용하는 방식이며, 일표본 T-검정법은 대응 표본의 차이값을 구해서 하나의 값을 이용하는 방식일 수 있다. 실시예에서는 일표본 T-검정법을 사용할 수 있다.
통계 분석법은 이에 한정되지 않으며, 예로서, 측정치가 숫자가 아닌 경우 다른 통계 분석법이 사용될 수 있다. 대응표본 T-검정법, 윌콕슨의 부호순위 검정법은 치료 전과 후의 측정치의 크기를 비교하여 치료 효과의 유의성을 평가하는데 널리 사용되는 통계 분석법 중 하나일 수 있다.
대응표본 T-검정법, 윌콕슨의 부호순위 검정법에 의해 유의 수준 5%(P<0.05)의 오류를 허용할 수 있도록 설정하였다. 이는 통계 검정에서 통상적으로 적용되는 기준으로, 우연히 위양성(false positive)으로 추정될 가능성을 제한하기 위한 다소 엄격한 기준이지만, 검정을 동시에 여러번 반복해서 시행(다중 비교, 다중 검정)하는 경우, 즉 만번의 검정을 진행하였을 때, 이 중 500번은 의미가 없음에도 위양성으로 나올 수 있음을 의미할 수 있다.
마찬가지로, 분석에는 다수의 약물이 존재하기 때문에 다수의 후보들 중 의미있는 약물을 선택하는 것에 대한 다중 비교 문제가 발생될 수 있다.
이러한 위양성의 오류를 줄이기 위해 Bonferroni 및 FDR(False Discovery Rate) 계산법을 적용하여 오류를 조정하였다.
도 5에 도시된 바와 같이, 당화혈색소(HbA1c)의 중요한 약물의 수는 265이었으며, 조정 후에는 Bonferroni 및 FDR 계산법에 의해 59와 163으로 감소시킬 수 있었다.
이를 통해 소정 약물의 유의한(significant) 효과 여부를 판단할 수 있다.
이어서, 특정 임상 지표에 대해 유의한 효과를 가진 약물들에 대해 보정된 변화량을 기초로 소정 약물의 기지정된 효과 이외의 효과, 즉 신약재창출 후보군을선정하는 단계(S150)를 수행할 수 있다.
기지정된 효과 이외의 효과를 판단하는 단계(S150)는 특정 임상 지표에 대해 유의한 효과를 가진 약물들 중에서 해당 임상 지표를 개선시키는 효과가 있는 약물을 선정한 다음, 이 중에서 해당 임상 지표를 개선시키는 용도가 기지정된 약물들을 제외하는 방법으로 수행할 수 있다.
특정 임상지표를 개선시키는 효과를 판단하는 것은 각 약물에 대해 보정된 변화량, 즉 추정된 효과를 이상(Ideal) 변화량과 비교하여 효과의 방향이 일치하는지를 통해 판단할 수 있다.
* 특정 임상 지표에 대한 효과(즉, 용도)가 기지정된 약물은 의약품 분류 체계(예: Anatomical Therapeutic Chemical Classification) 또는 국가별 의약품 승인 정보(예: U.S. Food and Drug Administration) 등을 통해 확인할 수 있다.
이어서, 기지정된 효과 이외의 유의한 효과를 가진 것으로 선정된 신약재창출 후보군 중에서 중요한 약물의 우선 순위를 매기는 단계(S160)를 수행할 수 있다.
중요한 약물의 우선 순위를 매기는 단계(S160)는 개별 임상지표에 대해 순위를 매기는 방법과 복수의 임상지표에 대해 복합적으로 유리한 순위를 매기는 두 가지 방법으로 수행할 수 있다. 또한, 중요한 약물의 우선 순위를 매기는 단계(S160)는 각 약물들이 가지는 효과들을 단독 또는 조합하여 수행할 수 있다.
개별 임상지표에 대해 약물의 우선 순위를 매기기 위해 각 약물의 보정된 변화량의 효과 크기 및 방향(양성 또는 음성)을 기준으로 특정 임상지표에 대한 각 약물의 이상적인 효과 순위를 정할 수 있다.
예로서, 저밀도 지단백(LDL) 콜레스테롤은 음의 방향(<0)을 가져야 효과가 있다고 볼 수 있으며, 고밀도 지단백(HDL) 콜레스테롤은 양의 방향(>0)을 가져야 효과가 있다고 볼 수 있으며, 중성 지방(TG) 는 음의 방향<0)을 가져야 효과가 있다고 볼 수 있으며, 당화혈색소(HbA1c)는 음의 방향(<0)을 가져야 효과가 있다고 볼 수 있다. 이러한 기준을 토대로 이상적인 효과의 방향(양성 또는 음성)과 함께 효과의 크기가 클수록 우선 순위를 부여함으로써, 복수의 신약재창출 후보군 중에서 특정 임상지표에 대해 신약재창출의 가능성이 좀 더 높은 약물을 우선적으로 선택하는데 도움을 줄 수 있다.
복수의 임상지표에 대해 복합적으로 유리한 순위를 매기기 위해 각각의 임상지표에 대해 이상적인 약물의 효과와 개별 약물의 효과까지의 거리를 계산하여 수행할 수 있다.
한 예로서, 각 임상 지표에는 가중치를 부여할 수 있다. 예컨대, 계산된 거리 방향이 이상 변화량과 동일하면 제1 가중치를 부여하고, 상기 계산된 거리의 방향이 이상 변화량과 다르면 제1 가중치보다 큰 제2 가중치를 부여하고, 상기 계산된 거리의 방향이 알 수 없을 경우, 상기 제1 가중치와 제2 가중치 사이의 제3 가중치를 부여할 수 있다.
도 6에 도시된 바와 같이, 약물 A는 저밀도 지단백(LDL) 콜레스테롤에 대해 음의 효과 방향을 가지고, 고밀도 지단백(HDL) 콜레스테롤에 대해 양의 방향을 가지고, 중성지방(TG)에 대해 음의 방향을 가지고, 당화혈색소(HbA1c)에 대해 음의 방향을 가지게 된다.
이에 따라 계산해 보면, 약물 A은 (0,0,0,0)으로 총 0의 값을 가질 수 있다. 약물 B는 (0,1,0,1)으로 총 2의 값을 가질 수 있다. 약물 C는 (0,0,0,2)으로 총 2의 값을 가질 수 있다. 이로부터 약물의 효과는 제1 가중치 내지 제3 가중치를 적용한 값이 가장 낮은 값을 높은 순위로 책정할 수 있게 된다.
즉, 약물 A는 1순위로 측정될 수 있으며, 약물 B와 약물 C는 동일한 값을 가지므로 2순위로 측정될 수 있다. 이는 약물 A가 약물 B 또는 C에 비해 복수의 임상 지표에 대해 동시에 더 많은 이상(ideal) 효과를 가지는 것을 의미하므로, 실제 임상적으로 활용되기에 더 유리할 수 있으며 따라서 그만큼 신약재창출의 가능성이 더 높다고 평가할 수 있다.
도 7은 실시예에 따른 신약 재창출 후보 선정 장치를 나타낸 블럭도이다.
도 7을 참조하면, 실시예에 따른 신약 재창출 후보 선정 장치(100)는 복수의 환자 별 소정 약물에 대한 노출 전후의 임상 지표 값을 획득하는 획득부(110)와, 상기 추출된 임상 지표 별 상기 소정 약물에 대한 노출 전후의 상기 임상 지표의 값의 변화량을 산정하는 변화량 산정부(120)와, 상기 복수의 환자 별 상기 소정 약물을 포함하여 노출된 약물의 총 개수를 산정하는 약물 산정부(130)와, 상기 선정된 약물의 총 개수를 이용하여 상기 복수의 환자 별 상기 산정된 변화량을 보정하는 보정부(140)와, 상기 보정된 변화량을 기초로 상기 소정 약물의 기지정된 효과 이외의 효과를 판단하는 효과 판단부(150)와, 각 약물들이 가진 다양한 임상적 효과들을 조합하여 임상적 유용성 및 신약재창출 가능성이 높은 순위를 구하는 순위 판단부(160) 및 메모리(170)를 포함할 수 있다.
획득부(110)는 서버(200)에 존재하는 자료를 이용하여 환자, 질병 및 실험실 검사 결과 정보를 수집할 수 있다. 여기서, 서버(200)는 일반적으로 전자의무기록(electronic medical record, EMR) 데이터를 담고 있는 별도의 데이터베이스로서, 예컨대 임상 데이터 웨어하우스(clinical data warehouse, CDW) 또는 공통 데이터 모델(common data mode, CDM) 서버를 포함할 수 있다. 임상 지표 값은 콜레스테롤 수치 및 당화혈색소(HbAlc) 수치, 폐활량 등과 같은 검사결과를 비롯하여 진단명, 시술, 처방과 같은 다양한 임상 데이터 항목, 또는 이들의 조합을 통한 조작적 정의를 포함할 수 있다. 여기서, 획득부(110)에 의해 수집된 정보는 메모리(170)에 저장될 수 있다. 획득부(110)는 서버(20)로부터 임상 지표 값을 획득하여 저장할 수 있으며, 통신용 인터페이스(190)를 포함할 수 있다.
변화량 산정부(120)는 추출된 임상 지표 별 소정 약물에 대한 노출 전후의 상기 임상 지표의 값의 변화량을 산정할 수 있다.
실시예에서는 동일한 환자에서 투약 후 선택된 실험실 결과에 중요한 영향을 미치는 후보 약물을 확인하는 것이다. 이를 위해 노출 그룹 및 비노출 그룹을 페어링하고, 노출 그룹 중 복수의 약물에 대해서는 그룹핑을 수행할 수 있다.
약물 산정부(130)는 환자 별 노출된 복수의 약물의 총 개수를 산정할 수 있다. 약물 산정부(130)는 서버(200)로부터 제공된 데이터를 이용하여 약물의 총 개수를 산정할 수 있다.
보정부(140)는 약물의 총 개수를 이용하여 나누거나(즉, 동일한 가중치 부여) 동시에 노출된 약물들의 개별 특성 정보(가중치)를 반영하여 상기 복수의 환자 별 산정된 변화량을 보정할 수 있다.
효과 판단부(150)는 통계적인 분석법을 통해 약물의 효과 및 유의성을 추정할 수 있다. 특정 임상지표를 개선시키는 효과를 판단하는 것은 각 약물에 대해 보정된 변화량, 즉 추정된 효과를 이상(Ideal) 변화량과 비교하여 효과의 방향이 일치하는지를 통해 판단할 수 있다.
계산된 거리 방향이 이상 변화량과 동일하면 제1 가중치를 부여하고, 상기 계산된 거리의 방향이 이상 변화량과 다르면 제1 가중치보다 큰 제2 가중치를 부여하고, 상기 계산된 거리의 방향이 알 수 없을 경우, 상기 제1 가중치와 제2 가중치 사이의 제3 가중치를 부여하고, 제1 가중치 내지 제3 가중치를 적용한 값이 가장 낮은 값을 높은 순위로 책정하였다.
순위 판단부(160)는 각 약물들이 가진 다양한 임상적 효과들을 조합하여 신약재창출 후보군 중에서 중요한 약물의 우선 순위를 매기는 단계를 수행할 수 있다. 중요한 약물의 우선 순위를 매기는 방법으로는, 개별 임상지표에 대해 순위를 매기는 방법과 복수의 임상지표에 대해 복합적으로 유리한 순위를 매기는 두 가지 방법으로 수행할 수 있다.
개별 임상지표에 대해 약물의 우선 순위를 매기기 위해 각 약물의 보정된 변화량의 효과 크기 및 방향(양성 또는 음성)을 기준으로 특정 임상지표에 대한 각 약물의 이상적인 효과 순위를 정할 수 있다. 복수의 임상지표에 대해 복합적으로 유리한 순위를 매기기 위해 각각의 임상지표에 대해 이상적인 약물의 효과와 개별 약물의 효과까지의 거리를 계산하여 수행할 수 있다.
획득부(110), 변화량 산정부(120), 약물 산정부(130), 보정부(140), 효과 판단부(150) 및 순위 판단부(160)는 적어도 하나의 프로세서에 의해 실행되는 프로그램에 의해 구현될 수 있으며, 프로그램은 메모리(170)에 저장될 수 있다.
도 8은 실시예에 따른 신약 재창출 후보 선정 장치에 의해 선정된 약물의 순서를 나타낸 도면이다.
실시예에서는 동일한 환자에서 투약 후 선택된 실험실 결과에 유의한 영향을 미치는 후보 약물을 확인하기 위해 새로운 임상적 빅데이터를 기반으로 후보 약물 검색 알고리즘을 제안하였다.
이 연구 방법론을 통해 다양한 질병에 대한 다양한 임상적 빅데이터를 통해 신속하고 효율적인 접근법을 활용하여 빠른 가설을 세우고 사전 실험 단계의 초기 개념을 테스트할 수 있게 되었다. 이에, 내분비대사 질환, 심혈관 질환 등의 각종 만성 질환에 대한 새로운 후보 약물 표적 검색을 수행하는 것이 가능하게 되었다.
이상지질혈증 환자는 총 콜레스테롤, 저밀도지단백(LDL) 콜레스테롤, 고밀도지단백(HDL) 콜레스테롤 및 중성지방(TG)의 검사 결과로 판단하고, 당뇨병은 당화혈색소(HbA1c)의 검사 결과로 판단한다.
실시예는 임상 지표 값으로써, 저밀도지단백(LDL) 콜레스테롤, 고밀도지단백(HDL)콜레스테롤, 중성지방(TG) 및 당화혈색소(HbA1c)를 선정하였다. 이러한 임상 지표 값의 검사 결과에 유의한 영향을 미치는 신약재창출 후보군을 발굴하였다.
실시예에 따른 신약 재창출 후보 선정 방법 및 장치는 다양한 임상 지표의 선정에 따라 신약의 재창출을 이룰 수 있는 효과가 있다.
상기에서는 도면 및 실시예를 참조하여 설명하였지만, 해당 기술 분야의 숙련된 당업자는 하기의 특허청구범위에 기재된 실시예의 기술적 사상으로부터 벗어나지 않는 범위 내에서 실시예는 다양하게 수정 및 변경시킬 수 있음은 이해할 수 있을 것이다.

Claims (18)

  1. 신약 재창출 후보 선정 장치에서 수행되는 신약 재창출 후보 선정 방법에 있어서,
    복수의 환자 별 소정 약물에 대한 노출 전후의 임상 지표 값을 일정 기간 범위 내에서 획득하는 단계;
    상기 획득된 임상 지표 별 상기 소정 약물에 대한 노출 전후의 상기 임상 지표 값의 변화량을 산정하는 단계;
    상기 복수의 환자 별 상기 소정 약물을 포함하여 노출된 약물의 총 개수를 산정하는 단계;
    상기 산정된 약물의 총 개수나 약물 별 가중치를 이용하여 상기 복수의 환자 별 상기 산정된 변화량을 보정하는 단계;
    상기 보정된 변화량을 기초로 상기 소정 약물의 기지정된 효과 이외의 효과를 판단하는 단계; 및
    상기 각 약물들이 가진 효과들을 단독 또는 조합하여 신약재창출 가능성이 높은 순위를 구하는 단계를 포함하는 신약 재창출 후보 선정 방법.
  2. 제1항에 있어서,
    상기 방법은,
    상기 복수의 환자 별 상기 소정 약물의 투여 전에 획득된 임상 데이터와 상기 소정 약물의 투여 후 획득된 임상 데이터를 기초로 상기 노출 전후의 임상 지표 값이 획득되는 신약 재창출 후보 선정 방법.
  3. 제1항에 있어서,
    상기 임상 지표는 콜레스테롤 수치, 당화혈색소 수치, 폐활량을 포함하는 검사 정보 또는 진단명, 시술, 처방을 포함하는 진단 정보, 또는 이들의 조합을 포함하는 신약 재창출 후보 선정 방법.
  4. 제1항에 있어서,
    상기 변화량을 보정하는 단계는 상기 복수의 환자 별 상기 산정된 변화량을 상기 산정된 약물의 총 개수로 나누거나 약물 별 가중치를 부여하여 보정하는 단계를 포함하는 신약 재창출 후보 선정 방법.
  5. 제1항에 있어서,
    상기 기지정된 효과 이외의 효과를 판단하는 단계는 보정된 변화량의 평균을 산출하여 각 약물 별 평균 변화량을 산출하는 단계; 및
    상기 임상 지표 별 기지정된 이상(ideal) 변화량과 상기 평균 변화량의 차이를 기초로, 상기 임상 지표 별 상기 소정 약물의 효과를 판단하는 단계를 더 포함하는 신약 재창출 후보 선정 방법.
  6. 제5항에 있어서,
    상기 소정 약물의 효과를 판단하는 단계는 상기 이상(ideal) 변화량과 상기 평균 변화량의 차이로 거리를 계산하고, 상기 계산된 거리의 방향을 고려하여 판단하는 신약 재창출 후보 선정 방법.
  7. 제6항에 있어서,
    상기 계산된 거리의 방향이 상기 약물의 이상(ideal) 변화량과 동일하면 제1 가중치를 부여하고,
    상기 계산된 거리의 방향이 상기 약물의 이상(ideal) 변화량과 다르면 상기 제1 가중치보다 큰 제2 가중치를 부여하고,
    상기 계산된 거리의 방향을 알 수 없을 경우, 상기 제1 가중치와 상기 제2 가중치 사이의 제3 가중치를 부여하는 신약 재창출 후보 선정 방법.
  8. 제7항에 있어서,
    상기 소정 약물의 효과는 상기 제1 가중치 내지 상기 제3 가중치를 적용한 값이 가장 낮은 값을 가장 높은 순위로 책정하는 신약 재창출 후보 선정 방법.
  9. 제1항에 있어서,
    상기 획득된 임상 지표 별 상기 소정 약물에 대한 노출 전후의 상기 임상 지표 값의 변화량을 산정하는 단계는, 상기 약물의 사용 시점과 종료 시점으로부터 각각 일정 기간 내의 기간을 임계값으로 설정하고, 상기 임계값 범위 내의 검사 결과를 이용하여 상기 임상 지표값의 변화량을 산정하는 신약 재창출 후보 선정 방법.
  10. 제1항에 있어서,
    상기 보정된 변화량을 기초로 상기 소정 약물의 기지정된 효과 이외의 효과를 판단하는 단계에서,
    상기 소정 약물의 기지정된 효과는 유의 수준이 설정된 일표본 T-검정법 또는 윌콕슨 순위합 검정법을 이용하여 분석하고, Bonferroni 및 FDR(False Discovery Rate) 을 이용하여 상기 분석의 오류를 조정하는 신약 재창출 후보 선정 방법.
  11. 복수의 환자 별 소정 약물에 대한 노출 전후의 임상 지표 값이 저장되는 메모리와 프로세서를 포함하되, 상기 프로세서는,
    상기 획득된 임상 지표 별 상기 소정 약물에 대한 노출 전후의 상기 임상 지표의 값의 변화량을 산정하고,
    상기 복수의 환자 별 상기 소정 약물을 포함하여 노출된 약물의 총 개수를 산정하고,
    상기 선정된 약물의 총 개수나 약물별 가중치를 이용하여 상기 복수의 환자 별 상기 산정된 변화량을 보정하고,
    상기 보정된 변화량을 기초로 상기 소정 약물의 기지정된 효과 이외의 효과를 판단하고,
    상기 각 약물들이 가진 효과들을 단독 또는 조합하여 신약재창출 가능성이 높은 순위를 구하는 신약 재창출 후보 선정 장치.
  12. 제11항에 있어서,
    상기 장치는,
    상기 복수의 환자 별 상기 소정 약물의 투여 전에 획득된 임상 데이터와 상기 소정 약물의 투여 후 획득된 임상 데이터를 이용하여 노출 전후의 검사 지표 값을 획득하는 통신용 인터페이스를 더 포함하는 신약 재창출 후보 선정 장치.
  13. 제11항에 있어서,
    상기 임상 지표는 콜레스테롤 수치, 당화혈색소 수치, 폐활량을 포함하는 검사 정보 또는 진단명, 시술, 처방을 포함하는 진단 정보, 또는 이들의 조합을 포함하는 신약 재창출 후보 선정 장치.
  14. 제11항에 있어서,
    상기 프로세서는,
    상기 복수의 환자 별 상기 산정된 변화량을 상기 산정된 약물의 총 개수로 나누어 상기 복수의 환자 별 상기 산정된 변화량을 보정하는 신약 재창출 후보 선정 장치.
  15. 제11항에 있어서,
    상기 프로세서는,
    상기 복수의 환자 별 상기 보정된 변화량의 평균을 산출하여, 상기 임상 지표에 대한 각 약물 별 평균 변화량을 산출하고,
    상기 임상 지표 별 기지정된 이상(ideal) 변화량과 상기 평균 변화량의 차이를 기초로, 상기 임상 지표 별 상기 소정 약물의 효과를 판단하는 신약 재창출 후보 선정 장치.
  16. 제15항에 있어서,
    상기 프로세서는,
    상기 이상(ideal) 변화량과 상기 평균 변화량의 차이로 거리를 계산하고, 상기 계산된 거리의 방향을 고려하여 상기 소정 약물의 효과를 판단하는 신약 재창출 후보 선정 장치.
  17. 제16항에 있어서,
    상기 프로세서는,
    상기 계산된 거리의 방향이 상기 약물의 이상(ideal) 변화량과 동일하면 제1 가중치를 부여하고,
    상기 계산된 거리의 방향이 상기 약물의 이상(ideal) 변화량과 다르면 상기 제1 가중치보다 큰 제2 가중치를 부여하고,
    상기 계산된 거리의 방향을 알 수 없을 경우, 상기 제1 가중치와 상기 제2 가중치 사이의 제3 가중치를 부여하는 신약 재창출 후보 선정 장치.
  18. 제17항에 있어서,
    상기 프로세서는,
    상기 제1 가중치 내지 상기 제3 가중치를 적용한 값 중 가장 낮은 값을 가장 높은 순위로 책정하는 신약 재창출 후보 선정 장치.
PCT/KR2020/015634 2019-11-07 2020-11-09 신약 재창출 후보 선정 방법 및 장치 WO2021091348A1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR10-2019-0141614 2019-11-07
KR1020190141614A KR102439625B1 (ko) 2019-11-07 2019-11-07 신약 재창출 후보 선정 방법 및 시스템

Publications (1)

Publication Number Publication Date
WO2021091348A1 true WO2021091348A1 (ko) 2021-05-14

Family

ID=75848097

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/KR2020/015634 WO2021091348A1 (ko) 2019-11-07 2020-11-09 신약 재창출 후보 선정 방법 및 장치

Country Status (2)

Country Link
KR (1) KR102439625B1 (ko)
WO (1) WO2021091348A1 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116072305A (zh) * 2023-02-17 2023-05-05 北京中兴正远科技有限公司 一种临床试验数据采集系统

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102671060B1 (ko) 2021-08-06 2024-06-03 가천대학교 산학협력단 서브 패스웨이를 기반으로 한 약물재창출 대상 다제약제 선정방법
KR102548478B1 (ko) * 2022-10-25 2023-06-29 주식회사 아이메디신 약물 반응성 분류 및 예측을 위한 디지털 피노타이핑 방법, 장치 및 컴퓨터프로그램

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120296090A1 (en) * 2011-04-04 2012-11-22 The Methodist Hospital Research Institute Drug Repositioning Methods For Targeting Breast Tumor Initiating Cells
KR101450784B1 (ko) * 2013-07-02 2014-10-23 아주대학교산학협력단 전자의무기록과 약물/질환 네트워크 정보 기반의 신약 재창출 후보 예측 방법
KR101783689B1 (ko) * 2015-06-18 2017-10-10 재단법인 전통천연물기반 유전자동의보감 사업단 질병 및 약물 특이적 임상 변수의 상보성을 활용한 신약 재창출 기법 및 장치
KR101878924B1 (ko) * 2016-06-14 2018-07-17 재단법인 전통천연물기반 유전자동의보감 사업단 생물학적 네트워크를 이용한 신약 재창출 후보군 예측 방법 및 장치
KR102035658B1 (ko) * 2019-04-01 2019-10-23 한국과학기술정보연구원 신약 재창출 후보 추천 시스템 및 이 시스템의 각 기능을 실행시키기 위해 매체에 저장된 컴퓨터 프로그램

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20190063244A (ko) * 2017-11-29 2019-06-07 주식회사 디투에스 비쥬얼 모니터링 시스템

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120296090A1 (en) * 2011-04-04 2012-11-22 The Methodist Hospital Research Institute Drug Repositioning Methods For Targeting Breast Tumor Initiating Cells
KR101450784B1 (ko) * 2013-07-02 2014-10-23 아주대학교산학협력단 전자의무기록과 약물/질환 네트워크 정보 기반의 신약 재창출 후보 예측 방법
KR101783689B1 (ko) * 2015-06-18 2017-10-10 재단법인 전통천연물기반 유전자동의보감 사업단 질병 및 약물 특이적 임상 변수의 상보성을 활용한 신약 재창출 기법 및 장치
KR101878924B1 (ko) * 2016-06-14 2018-07-17 재단법인 전통천연물기반 유전자동의보감 사업단 생물학적 네트워크를 이용한 신약 재창출 후보군 예측 방법 및 장치
KR102035658B1 (ko) * 2019-04-01 2019-10-23 한국과학기술정보연구원 신약 재창출 후보 추천 시스템 및 이 시스템의 각 기능을 실행시키기 위해 매체에 저장된 컴퓨터 프로그램

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116072305A (zh) * 2023-02-17 2023-05-05 北京中兴正远科技有限公司 一种临床试验数据采集系统
CN116072305B (zh) * 2023-02-17 2023-09-29 北京中兴正远科技有限公司 一种临床试验数据采集系统

Also Published As

Publication number Publication date
KR102439625B1 (ko) 2022-09-05
KR20210055314A (ko) 2021-05-17

Similar Documents

Publication Publication Date Title
WO2021091348A1 (ko) 신약 재창출 후보 선정 방법 및 장치
Gamazon et al. Using an atlas of gene regulation across 44 human tissues to inform complex disease-and trait-associated variation
US6099469A (en) Reflex algorithm for early and cost effective diagnosis of myocardial infractions suitable for automated diagnostic platforms
Masino et al. Clinical phenotype-based gene prioritization: an initial study using semantic similarity and the human phenotype ontology
US20040133358A1 (en) Clinical and diagnostic database and related methods
Bhargava et al. Metabolomics in multiple sclerosis disease course and progression
Jurgens et al. Assessment of incidental findings in 232 whole-exome sequences from the Baylor–Hopkins Center for Mendelian Genomics
WO2020111378A1 (ko) 질환 진단 보조를 위한 데이터 분석 방법 및 시스템
WO2021149913A1 (ko) Ngs 분석에서의 질병 관련 유전자 선별 방법 및 장치
WO2020107899A1 (zh) 医疗费用预测方法、装置、设备及计算机可读存储介质
WO2022245062A1 (ko) 인공 지능 기반의 유전체 분석 및 의약 물질 개발 방법 및 시스템
Schubert et al. Clinically relevant variants identified in thoracic aortic aneurysm patients by research exome sequencing
Zhang et al. Performance status of health care facilities changes with risk adjustment of HbA1c.
WO2021025218A1 (ko) 연관 표현형의 유전적 위험도를 결합한 질병의 위험도 예측 장치 및 방법
US11848075B2 (en) Biomarker detection method, disease assessment method, biomarker detection device, and computer readable medium
Ma et al. Epigenomic features related to microglia are associated with attenuated effect of APOE ε4 on Alzheimer's disease risk in humans
Liu et al. Rare variants in inborn errors of immunity genes associated with covid-19 severity
WO2024053925A1 (ko) 아밀로이드 혈관병증 의심 환자에 대한 아밀로이드 펫 양성 예측 방법 및 장치
Prapinjumrune et al. Serum antinuclear antibody in adult Thais
WO2023200073A1 (ko) 기계학습을 이용한 고위험 임신 질환 예측을 위한 질량 스펙트럼 분석 방법
WO2022245063A1 (ko) 인공 지능 기반의 유전체와 의료 정보 분석 및 의약 물질 개발 방법 및 시스템
Chandonia et al. Lessons from the CAGI‐4 Hopkins clinical panel challenge
Pan et al. Exploring the genetic pathogenicity of aortic dissection from 72 Han Chinese individuals using next‐generation sequencing
DeBarry et al. MaHPIC malaria systems biology data from Plasmodium cynomolgi sporozoite longitudinal infections in macaques
EP0962186B1 (en) Automated diagnostic system implementing immunoassays and clinical chemistry assays according to a reflex algorithm

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 20886066

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 20886066

Country of ref document: EP

Kind code of ref document: A1