KR102174764B1 - Method, Device and Computer-Readable Medium for Drug Repositioning Using Drug-Disease Vectors Based On an Integrated Network - Google Patents

Method, Device and Computer-Readable Medium for Drug Repositioning Using Drug-Disease Vectors Based On an Integrated Network Download PDF

Info

Publication number
KR102174764B1
KR102174764B1 KR1020190013221A KR20190013221A KR102174764B1 KR 102174764 B1 KR102174764 B1 KR 102174764B1 KR 1020190013221 A KR1020190013221 A KR 1020190013221A KR 20190013221 A KR20190013221 A KR 20190013221A KR 102174764 B1 KR102174764 B1 KR 102174764B1
Authority
KR
South Korea
Prior art keywords
drug
disease
drugs
irradiated
vector
Prior art date
Application number
KR1020190013221A
Other languages
Korean (ko)
Other versions
KR20200095653A (en
Inventor
윤영미
이태건
Original Assignee
가천대학교 산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 가천대학교 산학협력단 filed Critical 가천대학교 산학협력단
Priority to KR1020190013221A priority Critical patent/KR102174764B1/en
Publication of KR20200095653A publication Critical patent/KR20200095653A/en
Application granted granted Critical
Publication of KR102174764B1 publication Critical patent/KR102174764B1/en

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H70/00ICT specially adapted for the handling or processing of medical references
    • G16H70/40ICT specially adapted for the handling or processing of medical references relating to drugs, e.g. their side effects or intended usage
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/50Molecular design, e.g. of drugs
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H20/00ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance
    • G16H20/10ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance relating to drugs or medications, e.g. for ensuring correct administration to patients

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Medicinal Chemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Epidemiology (AREA)
  • Public Health (AREA)
  • Primary Health Care (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computing Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Physics & Mathematics (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Toxicology (AREA)
  • Medical Treatment And Welfare Office Work (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

본 발명은 통합 네트워크 기반의 약물-질병벡터를 이용한 신약 재창출 방법, 장치 및 컴퓨터-판독가능매체에 관한 것으로서, 더욱 상세하게는 신약으로 재창출 될 수 있는 조사약물의 약물벡터를 도출하고, 도출된 약물벡터를 기반으로 해당 질병에 대해 처방되는 기존의 약물과 유사한 효능을 발휘할 수 있는 약물을 도출하는, 통합 네트워크 기반의 약물-질병벡터를 이용한 신약 재창출 방법, 장치 및 컴퓨터-판독가능매체에 관한 것이다.The present invention relates to a method, an apparatus, and a computer-readable medium for recreating a new drug using an integrated network-based drug-disease vector, and more specifically, to derive and derive a drug vector of an investigational drug that can be recreated as a new drug. A new drug re-creation method, device and computer-readable medium using an integrated network-based drug-disease vector that derives drugs that can exert similar efficacy to existing drugs prescribed for the disease based on the drug vector. About.

Description

통합 네트워크 기반의 약물-질병벡터를 이용한 신약 재창출 방법, 장치 및 컴퓨터-판독가능매체 {Method, Device and Computer-Readable Medium for Drug Repositioning Using Drug-Disease Vectors Based On an Integrated Network}[Method, Device and Computer-Readable Medium for Drug Repositioning Using Drug-Disease Vectors Based On an Integrated Network}

본 발명은 통합 네트워크 기반의 약물-질병벡터를 이용한 신약 재창출 방법, 장치 및 컴퓨터-판독가능매체에 관한 것으로서, `더욱 상세하게는 신약으로 재창출 될 수 있는 조사약물의 약물벡터를 도출하고, 도출된 약물벡터를 기반으로 해당 질병에 대해 처방되는 기존의 약물과 유사한 효능을 발휘할 수 있는 약물을 도출하는, 통합 네트워크 기반의 약물-질병벡터를 이용한 신약 재창출 방법, 장치 및 컴퓨터-판독가능매체에 관한 것이다.The present invention relates to a method, an apparatus, and a computer-readable medium for recreating a new drug using an integrated network-based drug-disease vector, and'more specifically, derive a drug vector of an investigational drug that can be recreated as a new drug, Based on the derived drug vector, a new drug re-creation method, device, and computer-readable medium using an integrated network-based drug-disease vector that derives drugs that can exhibit similar efficacy to existing drugs prescribed for the disease. It is about.

질병에 대한 새로운 약물을 개발하는 일은 그 기간이 매우 길고, 개발에 필요한 비용 또한 많이 필요한 과정이며, 새로운 약물을 개발하였다고 하더라도 해당 국가의 식품의약품안전처와 같은 기관에서 해당 약물의 승인을 받는 일 또한 매우 까다롭다. 일 예로 미국의 경우 FDA에 의해 승인된 신약의 수는 1990년대 이후 감소하고 있다. 이와 같이, 개발 시간 및 비용 등 새로운 약물을 도출하는데 필요한 자원을 효과적으로 사용하기 위한 방법으로 전산생물학(Computational Biology)에 대한 연구가 활발하게 진행되고 있다.Developing a new drug for a disease is a process that takes a very long time and requires a lot of cost for the development, and even if a new drug is developed, it is also necessary to obtain approval for the drug by an agency such as the Food and Drug Administration in the country. Very tricky. In the US, for example, the number of new drugs approved by the FDA has been declining since the 1990s. As described above, research on Computational Biology has been actively conducted as a method for effectively using resources necessary to derive new drugs such as development time and cost.

전산생물학은 컴퓨터를 이용하여 생물학적인 문제를 해결하는 분야이며, 방대한 정보를 빠르게 처리할 수 있는 컴퓨터를 사용하여 생물학적인 연구를 수행하는 학문이며, 전산생물학에서는 특히 기존에 존재하는 약물에 대해서 새로운 용법을 찾아내는 신약재창출(Drug Repositioning)에 대한 연구가 이루어지고 있다.Computational biology is a field that solves biological problems by using computers, and it is a science that conducts biological research using computers that can process vast amounts of information quickly.In computational biology, in particular, new uses for existing drugs. Research on drug repositioning is being conducted to find out.

신약재창출에 관련된 연구에 있어서 현재 전산생물학에서는 다양한 방법을 사용하고 있으며, 이 가운데 네트워크를 기반의 분석 방식은 가장 널리 사용되고 있는 방법 중 하나이다. 이와 같은 방법에서 네트워크를 구축하기 위하여 약물 및 질병의 다양한 속성을 네트워크에 적용하려는 시도가 있어왔다.In the research related to the creation of new drugs, various methods are currently used in computational biology, and among them, network-based analysis is one of the most widely used methods. In order to build a network in this way, there have been attempts to apply various properties of drugs and diseases to the network.

이전의 연구에서는 약물 네트워크 또는 질병 네트워크를 구축하기 위하여 부작용(Side Effect), 표현형(Phenotypes) 및 경로(Pathway)에 대한 정보를 활용하였으나, 이와 같은 정보를 통해 구축된 네트워크는 임상적 화합물(Clinical Compound) 및 임상실험에서 실패한 약물을 포함할 수 없는 단점이 존재한다.In previous studies, information on side effects, phenotypes, and pathways were used to build a drug network or disease network, but the network built through such information was clinical compound (Clinical Compound). ) And the inability to include drugs that have failed in clinical trials.

한편, 생체분자 네트워크(Biomolecular Network)를 사용하여 네트워크를 구축하는 연구 또한 등장하였으며, 해당 연구는 생체분자 네트워크에서 약물과 질병 간의 관계를 사용하지만, 해당 방법을 사용하는 대부분의 네트워크의 경우 유전자 혹은 단백질 간의 상호작용 종류를 고려하지 않는 단점이 존재한다.On the other hand, a study of constructing a network using a biomolecular network has also appeared, and this study uses the relationship between drugs and diseases in a biomolecular network, but most networks using the method use genes or proteins. There is a drawback of not considering the kind of interaction between them.

생체분자 네트워크를 활용하는 네트워크에 대한 연구는, 약물에서 네트워크를 거쳐 질병까지의 최단경로를 도출하여 약물간의 유사성을 도출하고, 유사성을 바탕으로 Guilt by Association 등을 포함한 다양한 방법을 사용하여 해당 질병에 대한 약물을 도출하였다. 이와 같은 방법을 통해 특정 질병에 다양한 약물을 적용하는 과정이 제시되었으나, 약물과 질병간의 치료 측면에서의 관계를 발견하기 위해서는 유전자간의 상호작용 특성을 고려하는 것이 매우 중요하다. Research on networks using biomolecule networks is to derive similarities between drugs by deriving the shortest route from drugs to diseases through networks, and based on the similarity, various methods including Guilt by Association are used to treat the disease. Drug was derived. Although the process of applying various drugs to a specific disease through such a method has been suggested, it is very important to consider the interaction characteristics between genes in order to discover the relationship between drugs and diseases in terms of treatment.

한편, 상기와 같은 종래의 기술 가운데, 한국공개특허 제10-2017-0141317호("생물학적 네트워크를 이용한 신약 재창출 방법 및 장치")에서는 약물과 질병 유전자 사이의 최단경로를 도출하는 데 있어서, 경로에 포함된 유전자의 개수 즉, 노드의 개수에만 기초하여 최단경로를 도출하고, 최단경로의 유전자 간의 활성/억제 여부만을 고려하여 스코어를 산출하는 구성에 대해 개시하고 있으나, 유전자 사이의 중립여부를 고려하지 않아 정확한 최단경로를 도출하기 어려운 문제를 갖고 있으며, 추가적으로 해당 기술의 경우 산출된 스코어를 바탕으로 이를 검증할 수 있는 요소를 포함하지 않고 있어, 해당 약물의 검증을 수행하기 어려운 한계를 지니고 있다.
이와 같이 다양한 유전자간의 상호작용의 특성을 반영하는 네트워크의 구축은 신약재창출 분야에서 중요한 선결과제에 해당한다.
On the other hand, among the conventional technologies as described above, in Korean Patent Publication No. 10-2017-0141317 ("Method and apparatus for recreating new drugs using biological networks"), in deriving the shortest path between a drug and a disease gene, the path The shortest path is derived based only on the number of genes included in, that is, the number of nodes, and a configuration is disclosed in which the score is calculated by considering only whether the genes of the shortest path are active/inhibited, but considering whether or not the genes are neutral. It has a problem that it is difficult to derive an accurate shortest route because it is not done, and additionally, the technology does not include an element that can verify it based on the calculated score, so it is difficult to verify the drug.
In this way, the establishment of a network that reflects the characteristics of interactions between various genes is an important prerequisite in the field of new drug creation.

한국공개특허 제10-2017-0141317호 (생물학적 네트워크를 이용한 신약 재창출 방법 및 장치, 2017년 12월 26일 공개)Korean Patent Publication No. 10-2017-0141317 (Method and device for re-creation of new drugs using biological networks, published on December 26, 2017)

본 발명은 통합 네트워크 기반의 약물-질병벡터를 이용한 신약 재창출 방법, 장치 및 컴퓨터-판독가능매체에 관한 것으로서, 더욱 상세하게는 신약으로 재창출 될 수 있는 조사약물의 약물벡터를 도출하고, 도출된 약물벡터를 기반으로 해당 질병에 대해 처방되는 기존의 약물과 유사한 효능을 발휘할 수 있는 약물을 도출하는, 통합 네트워크 기반의 약물-질병벡터를 이용한 신약 재창출 방법, 장치 및 컴퓨터-판독가능매체를 제공하는 것이다.The present invention relates to a method, an apparatus, and a computer-readable medium for recreating a new drug using an integrated network-based drug-disease vector, and more specifically, to derive and derive a drug vector of an investigational drug that can be recreated as a new drug. Based on the drug vector, a new drug re-creation method, device, and computer-readable medium using an integrated network-based drug-disease vector that derives drugs that can exert similar efficacy to existing drugs prescribed for the disease. To provide.

상기와 같은 과제를 해결하기 위하여 본 발명은, 컴퓨팅 장치로 구현되는, 약물-질병벡터를 이용하여 특정 질병에 대한 신약을 재창출 하는 방법으로서, 특정 질병에 대한 신약으로 재창출될 수 있는 2 이상의 조사약물에 대한 조사약물정보를 수신하는 약물정보수신단계; 유전자, 단백질 및 약물 중 2 이상에 대한 상호작용관계를 포함하는 상호작용데이터 및 상기 조사약물정보에 기초하여, 해당 조사약물 및 특정 질병에 대한 1 이상의 질병유전자 사이의 약물, 유전자, 및 단백질 중 1 이상을 노드로 포함하는 경로에서의 각각의 조사약물에 대한 약물-질병벡터를 도출하는 약물-질병벡터도출단계; 및 상기 조사약물의 상기 약물-질병벡터에 대한 정보에 기초하여 평가모델을 도출하고, 상기 평가모델에 기초하여 상기 조사약물에서 중에서 상기 특정 질병에 대한 신약을 도출하는 신약도출단계;를 포함하는, 약물-질병벡터를 이용하여 특정 질병에 대한 신약을 재창출 하는 방법을 제공한다.In order to solve the above problems, the present invention is a method of recreating a new drug for a specific disease using a drug-disease vector implemented as a computing device, and two or more drugs that can be recreated as a new drug for a specific disease A drug information receiving step of receiving irradiated drug information on the irradiated drug; One of drugs, genes, and proteins between the irradiated drug and one or more disease genes for a specific disease, based on the interaction data including the interaction relationship with two or more of genes, proteins, and drugs and the irradiated drug information. Drug-disease vector derivation step of deriving a drug-disease vector for each irradiated drug in the path including the above as a node; And a new drug derivation step of deriving an evaluation model based on the information on the drug-disease vector of the investigational drug, and deriving a new drug for the specific disease from among the investigational drugs based on the evaluation model. Provides a method of re-creating a new drug for a specific disease using a drug-disease vector.

본 발명에서는, 상기 약물-질병벡터를 이용하여 특정 질병에 대한 신약을 재창출 하는 방법은, 유전자, 단백질 및 약물 중 2 이상에 대한 상호작용관계를 포함하는 데이터를 상기 컴퓨팅 장치 또는 참조데이터베이스에서 로드하여 기설정된 관계기준에 기초하여 변환하는 상호작용데이터변환단계;를 더 포함할 수 있다.In the present invention, the method of recreating a new drug for a specific disease using the drug-disease vector is to load data including an interaction relationship with two or more of genes, proteins, and drugs from the computing device or reference database. It may further include an interaction data conversion step of converting based on a preset relationship criterion.

본 발명에서는 상기 상호작용데이터변환단계는 로드된 유전자, 단백질 및 약물 중 2 이상에 대한 상호작용관계를 포함하는 데이터에서, 상기 관계기준에 기초하여 유전자, 단백질 및 약물 중 2 개의 관계를 양성타입, 음성타입 및 중립타입 중 하나로 변환하여 변환상호작용데이터로 도출하고, 상기 약물-질병벡터도출단계는 상기 변환상호작용데이터를 이용할 수 있다.In the present invention, in the interaction data conversion step, in the data including the interaction relationship with two or more of the loaded genes, proteins, and drugs, based on the relationship criteria, two relationships among genes, proteins, and drugs are positive type, Converted into one of a voice type and a neutral type to derive transformed interaction data, and the drug-disease vector deriving step may use the transformed interaction data.

본 발명에서는, 상기 약물-질병벡터도출단계는, 상기 조사약물정보 및 상기 상호작용데이터에 기초하여 상기 조사약물 및 상기 질병유전자 사이의 기초경로를 도출하는 기초경로도출단계; 상기 기초경로에 기초하여 상기 조사약물 및 상기 질병유전자 사이의 최단경로를 도출하고, 상기 최단경로에 기초하여 상기 약물-질병벡터를 도출하는 최단경로계산단계;를 포함할 수 있다.In the present invention, the drug-disease vector derivation step includes: a basic path deriving step of deriving a basic path between the irradiated drug and the disease gene based on the irradiated drug information and the interaction data; It may include; a shortest path calculation step of deriving the shortest path between the irradiated drug and the disease gene based on the basic path, and deriving the drug-disease vector based on the shortest path.

본 발명에서는, 상기 최단경로는, 상기 최단경로에 노드로 포함된 1 이상의 약물, 유전자, 및 단백질의 상호관계가 적어도 하나의 양성타입 또는 음성타입을 포함하고, 상기 상호작용데이터는 약물, 유전자, 및 단백질 중 2 이상의 상호관계로, 상기 양성타입, 상기 음성타입 및 중립타입을 포함하고, 상기 중립타입은 약물, 유전자, 및 단백질 중 2 이상이 결합관계인 경우를 포함할 수 있다.In the present invention, the shortest path includes at least one positive or negative type of interaction between one or more drugs, genes, and proteins included as nodes in the shortest path, and the interaction data includes drugs, genes, And the positive type, the negative type, and the neutral type as a correlation of two or more of the proteins, and the neutral type may include a case in which two or more of a drug, a gene, and a protein have a binding relationship.

본 발명에서는, 상기 최단경로는 1 이상의 노드를 포함하고, 상기 최단경로계산단계는 상기 최단경로에 포함된 각각의 노드에 연결된 노드의 개수 및 각각의 노드에 인접한 노드와의 상호관계 타입에 기초하여 상기 약물-질병벡터를 도출할 수 있다.In the present invention, the shortest path includes one or more nodes, and the step of calculating the shortest path is based on the number of nodes connected to each node included in the shortest path and a correlation type with nodes adjacent to each node. The drug-disease vector can be derived.

본 발명에서는, 상기 신약도출단계는 상기 조사약물 중 상기 특정 질병에 대해 효능이 있다고 알려진 기준약물의 상기 약물-질병벡터에 대한 정보 및 상기 조사약물 중 상기 특정 질병에 대해 효능이 있다고 알려지지 않은 약물의 상기 약물-질병벡터에 기초하여 평가모델을 도출할 수 있다.In the present invention, the step of deriving a new drug includes information on the drug-disease vector of the reference drug known to be effective against the specific disease among the irradiated drugs, and the drug not known to be effective against the specific disease among the irradiated drugs. An evaluation model can be derived based on the drug-disease vector.

본 발명에서는, 상기 약물-질병벡터도출단계는 각각의 조사약물에 대하여, 상기 특정 질병에 대한 1 이상의 질병유전자 각각에 대한 값을 포함하는 약물-질병벡터를 도출하고, 상기 신약도출단계는 상기 조사약물 중 1 이상을 제1집합으로 분류하고, 상기 조사약물 중 1 이상을 제2집합으로 분류하는 집합분류단계; 및 상기 제1집합에 속하는 조사약물의 약물-질병벡터 및 상기 제2집합에 속하는 조사약물의 약물-질병벡터에 기초하여 평가모델을 도출하는 평가모델도출단계;를 포함할 수 있다.In the present invention, in the drug-disease vector extraction step, for each investigational drug, a drug-disease vector including a value for each of one or more disease genes for the specific disease is derived, and the new drug extraction step is the investigation A group classification step of classifying at least one of the drugs into a first set and classifying at least one of the irradiated drugs into a second set; And an evaluation model deriving step of deriving an evaluation model based on the drug-disease vector of the irradiated drug belonging to the first set and the drug-disease vector of the irradiated drug belonging to the second set.

본 발명에서는, 상기 제1집합은 상기 조사약물 중 상기 특정 질병에 대해 효능이 있다고 알려진 기준약물 중 1 이상을 포함하고, 상기 제2집합은 상기 조사약물 중 상기 특정 질병에 대해 효능이 있다고 알려지지 않은 약물 중 1 이상을 포함할 수 있다.In the present invention, the first set includes one or more of the reference drugs known to be effective against the specific disease among the irradiated drugs, and the second set is not known to be effective against the specific disease among the irradiated drugs. It may contain one or more of the drugs.

본 발명에서는, 상기 평가모델도출단계는, 복수의 상기 제2집합을 이용하여 2 이상의 예비평가모델을 도출하고, 상기 예비평가모델의 평가값에 기초하여 상기 평가모델을 도출할 수 있다.In the present invention, in the step of deriving an evaluation model, two or more preliminary evaluation models may be derived using the plurality of second sets, and the evaluation model may be derived based on an evaluation value of the preliminary evaluation model.

상기와 같은 과제를 해결하기 위하여 본 발명은, 1 이상의 메모리 및 1 이상의 프로세서를 포함하는 약물-질병벡터를 이용하여 특정 질병에 대한 신약을 재창출 하는 장치로서, 특정 질병에 대한 신약으로 재창출될 수 있는 2 이상의 조사약물에 대한 조사약물정보를 수신하는 약물정보수신부; 유전자, 단백질 및 약물 중 2 이상에 대한 상호작용관계를 포함하는 상호작용데이터 및 상기 조사약물정보에 기초하여, 해당 조사약물 및 특정 질병에 대한 1 이상의 질병유전자 사이의 약물, 유전자, 및 단백질 중 1 이상을 노드로 포함하는 경로에서의 각각의 조사약물에 대한 약물-질병벡터를 도출하는 약물-질병벡터도출부; 및 상기 조사약물의 상기 약물-질병벡터에 대한 정보에 기초하여 평가모델을 도출하고, 상기 평가모델에 기초하여 상기 조사약물에서 중에서 상기 특정 질병에 대한 신약을 도출하는 신약도출부;를 포함하는, 약물-질병벡터를 이용하여 특정 질병에 대한 신약을 재창출 하는 장치를 제공한다.In order to solve the above problems, the present invention is an apparatus for re-creating a new drug for a specific disease using a drug-disease vector including at least one memory and at least one processor, which will be recreated as a new drug for a specific disease. A drug information receiving unit for receiving irradiated drug information for two or more irradiated drugs; One of drugs, genes, and proteins between the irradiated drug and one or more disease genes for a specific disease, based on the interaction data including the interaction relationship with two or more of genes, proteins, and drugs and the irradiated drug information. A drug-disease vector extraction unit for deriving a drug-disease vector for each irradiated drug in the path including the above as a node; And a new drug extraction unit for deriving an evaluation model based on the information on the drug-disease vector of the investigational drug, and for deriving a new drug for the specific disease from among the investigational drugs based on the evaluation model. Provides a device for re-creating a new drug for a specific disease using a drug-disease vector.

상기와 같은 과제를 해결하기 위하여 본 발명은, 컴퓨터-판독가능 기록매체로서, 상기 컴퓨터-판독가능 기록매체는, 컴퓨팅 장치로 하여금 이하의 단계들을 수행하도록 하는 명령들을 저장하며, 상기 단계들은; 특정 질병에 대한 신약으로 재창출될 수 있는 2 이상의 조사약물에 대한 조사약물정보를 수신하는 약물정보수신단계; 유전자, 단백질 및 약물 중 2 이상에 대한 상호작용관계를 포함하는 상호작용데이터 및 상기 조사약물정보에 기초하여, 해당 조사약물 및 특정 질병에 대한 1 이상의 질병유전자 사이의 약물, 유전자, 및 단백질 중 1 이상을 노드로 포함하는 경로에서의 각각의 조사약물에 대한 약물-질병벡터를 도출하는 약물-질병벡터도출단계; 및 상기 조사약물의 상기 약물-질병벡터에 대한 정보에 기초하여 평가모델을 도출하고, 상기 평가모델에 기초하여 상기 조사약물에서 중에서 상기 특정 질병에 대한 신약을 도출하는 신약도출단계;를 포함하는, 컴퓨터-판독가능 기록매체를 제공한다.In order to solve the above problems, the present invention provides a computer-readable recording medium, wherein the computer-readable recording medium stores instructions for causing a computing device to perform the following steps, the steps; A drug information receiving step of receiving irradiated drug information for two or more irradiated drugs that can be recreated as new drugs for a specific disease; One of drugs, genes, and proteins between the irradiated drug and one or more disease genes for a specific disease, based on the interaction data including the interaction relationship with two or more of genes, proteins, and drugs and the irradiated drug information. A drug-disease vector derivation step of deriving a drug-disease vector for each irradiated drug in the path including the above as a node; And a new drug derivation step of deriving an evaluation model based on the information on the drug-disease vector of the investigational drug, and deriving a new drug for the specific disease from among the investigational drugs based on the evaluation model. Computer-readable recording media are provided.

본 발명의 일 실시예에 따르면, 결합관계에 있는 유전자들을 네트워크에 적용하여 더욱 정확한 신약재창출 모델을 도출할 수 있는 효과를 발휘할 수 있다.According to an embodiment of the present invention, it is possible to exert an effect of deriving a more accurate new drug re-creation model by applying genes in a binding relationship to a network.

본 발명의 일 실시예에 따르면, 네트워크의 최단경로를 도출하고 최단경로를 기초로 벡터값을 도출하고, 기준약물과 비교하여 약물을 도출하는 모델을 생성하여, 더욱 정확한 약물을 도출할 수 있는 효과를 발휘할 수 있다.According to an embodiment of the present invention, by deriving the shortest route of the network, deriving a vector value based on the shortest route, and creating a model for deriving a drug by comparing it with a reference drug, it is possible to derive more accurate drugs. Can exert.

본 발명의 일 실시예에 따르면, 약물과 질병유전자에 이르는 네트워크를 생성하여 경로를 도출하므로 해당 약물이 질병유전자에 도달하는 메커니즘을 파악할 수 있는 효과를 발휘할 수 있다.According to an embodiment of the present invention, a network leading to a drug and a disease gene is generated to derive a pathway, so that the mechanism by which the drug reaches the disease gene may be identified.

본 발명의 일 실시예에 따르면, 도출된 약물을 도출할 수 있는 복수의 모델을 생성하고 복수의 모델을 비교하여 최종모델을 도출하고, 최종모델을 통해 도출된 약물에 대하여 검증하는 과정을 통해, 최종모델의 정확성을 향상시킬 수 있는 효과를 발휘할 수 있다.According to an embodiment of the present invention, through the process of generating a plurality of models capable of deriving the derived drug, comparing the plurality of models to derive a final model, and verifying the drug derived through the final model, It can exert an effect that can improve the accuracy of the final model.

도 1은 본 발명의 일 실시예에 따른 상호작용데이터 및 약물정보에 기반하여 기준약물과 유사한 효능의 신약을 도출하는 과정을 개략적으로 도시하는 도면이다.
도 2는 본 발명의 일 실시예에 따른 통합 네트워크 기반의 약물-질병벡터를 이용한 신약 재창출 장치를 개략적으로 도시하는 도면이다.
도 3은 본 발명의 일 실시예에 따른 통합 네트워크 기반의 약물-질병벡터를 이용한 신약 재창출 장치의 내부구성요소를 개략적으로 도시하는 도면이다.
도 4는 본 발명의 일 실시예에 따른 상호작용데이터변환부에 의해 변환된 상호작용데이터를 개략적으로 도시하는 도면이다.
도 5는 본 발명의 일 실시예에 따른 약물-질병벡터도출부의 수행단계들을 개략적으로 도시하는 도면이다.
도 6은 본 발명의 일 실시예에 따른 약물-질병벡터도출부에 의해 도출된 최단경로를 개략적으로 도시한 도면이다.
도 7은 본 발명의 일 실시예에 따른 최단경로에서 약물-질병벡터도출부에 의해 약물-질병벡터의 도출 과정을 개략적으로 도시한 도면이다.
도 8은 본 발명의 일 실시예에 따른 신약도출부의 수행단계를 개략적으로 도시하는 도면이다.
도 9는 본 발명의 일 실시예에 따른 조사약물군에서 도출되는 제1집합 및 제2집합을 개략적으로 도시한 도면이다.
도 10은 본 발명의 일 실시예에 있어서, 통합 네트워크 기반의 약물-질병벡터를 이용한 신약 재창출 장치의 내부 구성의 일례를 설명하기 위한 블록도이다.
1 is a diagram schematically showing a process of deriving a new drug having similar efficacy to a reference drug based on interaction data and drug information according to an embodiment of the present invention.
2 is a diagram schematically showing an apparatus for recreating a new drug using a drug-disease vector based on an integrated network according to an embodiment of the present invention.
3 is a diagram schematically showing the internal components of an apparatus for recreating a new drug using a drug-disease vector based on an integrated network according to an embodiment of the present invention.
4 is a diagram schematically showing interaction data converted by an interaction data conversion unit according to an embodiment of the present invention.
5 is a diagram schematically showing steps performed by a drug-disease vector extraction unit according to an embodiment of the present invention.
6 is a diagram schematically showing the shortest path derived by the drug-disease vector extraction unit according to an embodiment of the present invention.
7 is a diagram schematically illustrating a process of deriving a drug-disease vector by a drug-disease vector deriving unit in the shortest path according to an embodiment of the present invention.
8 is a diagram schematically showing a step of performing a drug delivery unit according to an embodiment of the present invention.
9 is a diagram schematically showing a first set and a second set derived from a group of irradiated drugs according to an embodiment of the present invention.
10 is a block diagram illustrating an example of an internal configuration of a new drug re-creation device using an integrated network-based drug-disease vector according to an embodiment of the present invention.

이하에서는, 다양한 실시예들 및/또는 양상들이 이제 도면들을 참조하여 개시된다. 하기 설명에서는 설명을 목적으로, 하나이상의 양상들의 전반적 이해를 돕기 위해 다수의 구체적인 세부사항들이 개시된다. 그러나, 이러한 양상(들)은 이러한 구체적인 세부사항들 없이도 실행될 수 있다는 점 또한 본 발명의 기술 분야에서 통상의 지식을 가진 자에게 인식될 수 있을 것이다. 이후의 기재 및 첨부된 도면들은 하나 이상의 양상들의 특정한 예시적인 양상들을 상세하게 기술한다. 하지만, 이러한 양상들은 예시적인 것이고 다양한 양상들의 원리들에서의 다양한 방법들 중 일부가 이용될 수 있으며, 기술되는 설명들은 그러한 양상들 및 그들의 균등물들을 모두 포함하고자 하는 의도이다.In the following, various embodiments and/or aspects are now disclosed with reference to the drawings. In the following description, for purposes of explanation, a number of specific details are disclosed to aid in an overall understanding of one or more aspects. However, it will also be appreciated by those of ordinary skill in the art that this aspect(s) may be practiced without these specific details. The following description and the annexed drawings set forth in detail certain illustrative aspects of one or more aspects. However, these aspects are exemplary and some of the various methods in the principles of the various aspects may be used, and the descriptions described are intended to include all such aspects and their equivalents.

또한, 다양한 양상들 및 특징들이 다수의 디바이스들, 컴포넌트들 및/또는 모듈들 등을 포함할 수 있는 시스템에 의하여 제시될 것이다. 다양한 시스템들이, 추가적인 장치들, 컴포넌트들 및/또는 모듈들 등을 포함할 수 있다는 점 그리고/또는 도면들과 관련하여 논의된 장치들, 컴포넌트들, 모듈들 등 전부를 포함하지 않을 수도 있다는 점 또한 이해되고 인식되어야 한다.Further, various aspects and features will be presented by a system that may include multiple devices, components and/or modules, and the like. It is also noted that various systems may include additional devices, components and/or modules, and/or may not include all of the devices, components, modules, etc. discussed in connection with the figures. It must be understood and recognized.

본 명세서에서 사용되는 "실시예", "예", "양상", "예시" 등은 기술되는 임의의 양상 또는 설계가 다른 양상 또는 설계들보다 양호하다거나, 이점이 있는 것으로 해석되지 않을 수도 있다. 아래에서 사용되는 용어들 '~부', '컴포넌트', '모듈', '시스템', '인터페이스' 등은 일반적으로 컴퓨터 관련 엔티티(computer-related entity)를 의미하며, 예를 들어, 하드웨어, 하드웨어와 소프트웨어의 조합, 소프트웨어를 의미할 수 있다.As used herein, “an embodiment,” “example,” “aspect,” “example,” and the like may not be construed as having any aspect or design described as being better or advantageous than other aspects or designs. . The terms'~part','component','module','system', and'interface' used below generally mean a computer-related entity, for example, hardware, hardware It can mean a combination of software and software, or software.

또한, "포함한다" 및/또는 "포함하는"이라는 용어는, 해당 특징 및/또는 구성요소가 존재함을 의미하지만, 하나이상의 다른 특징, 구성요소 및/또는 이들의 그룹의 존재 또는 추가를 배제하지 않는 것으로 이해되어야 한다.In addition, the terms "comprising" and/or "comprising" mean that the corresponding feature and/or element is present, but excludes the presence or addition of one or more other features, elements, and/or groups thereof. It should be understood as not.

또한, 제1, 제2 등과 같이 서수를 포함하는 용어는 다양한 구성요소들을 설명하는데 사용될 수 있지만, 상기 구성요소들은 상기 용어들에 의해 한정되지는 않는다. 상기 용어들은 하나의 구성요소를 다른 구성요소로부터 구별하는 목적으로만 사용된다. 예를 들어, 본 발명의 권리 범위를 벗어나지 않으면서 제1 구성요소는 제2 구성요소로 명명될 수 있고, 유사하게 제2 구성요소도 제1 구성요소로 명명될 수 있다. 및/또는 이라는 용어는 복수의 관련된 기재된 항목들의 조합 또는 복수의 관련된 기재된 항목들 중의 어느 항목을 포함한다.In addition, terms including ordinal numbers such as first and second may be used to describe various elements, but the elements are not limited by the terms. These terms are used only for the purpose of distinguishing one component from another component. For example, without departing from the scope of the present invention, a first element may be referred to as a second element, and similarly, a second element may be referred to as a first element. The term and/or includes a combination of a plurality of related listed items or any of a plurality of related listed items.

또한, 본 발명의 실시예들에서, 별도로 다르게 정의되지 않는 한, 기술적이거나 과학적인 용어를 포함해서 여기서 사용되는 모든 용어들은 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에 의해 일반적으로 이해되는 것과 동일한 의미를 가지고 있다. 일반적으로 사용되는 사전에 정의되어 있는 것과 같은 용어들은 관련 기술의 문맥 상 가지는 의미와 일치하는 의미를 가지는 것으로 해석되어야 하며, 본 발명의 실시예에서 명백하게 정의하지 않는 한, 이상적이거나 과도하게 형식적인 의미로 해석되지 않는다.In addition, in the embodiments of the present invention, unless otherwise defined, all terms used herein including technical or scientific terms are commonly understood by those of ordinary skill in the art to which the present invention belongs. It has the same meaning as. Terms as defined in a commonly used dictionary should be interpreted as having a meaning consistent with the meaning in the context of the related technology, and unless explicitly defined in the embodiments of the present invention, an ideal or excessively formal meaning Is not interpreted as.

도 1은 본 발명의 일 실시예에 따른 상호작용데이터 및 약물정보에 기반하여 기준약물과 유사한 효능의 신약을 도출하는 과정을 개략적으로 도시하는 도면이다.1 is a diagram schematically showing a process of deriving a new drug having similar efficacy to a reference drug based on interaction data and drug information according to an embodiment of the present invention.

도 1을 참조하면 상호작용데이터는 약물-질병벡터데이터를 도출하기 위한 제1 요소에 해당하며, 구체적으로 상기 제1 요소에는 상기 상호작용데이터에 포함된 상호작용관계들을 관계기준에 기초하여 변환된 상기 상호작용데이터가 포함된다. 한편, 약물정보는 약물-질병벡터데이터를 도출하기 위한 제2 요소에 해당하고, 상기 약물정보는 사용자의 직접적 혹은 간접적인 입력에 의해 수신되는 정보로써, 신약을 도출하기 위한 후보군에 해당하는 2 이상의 조사약물에 대한 약물이름 및 화학식, 신약에 의해 개선되는 질병에 관한 정보, 상기 질병에 대해 효능을 발휘하는 기준약물에 대한 정보를 포함한다.Referring to FIG. 1, the interaction data corresponds to a first element for deriving drug-disease vector data, and specifically, the first element includes the interaction relations included in the interaction data converted based on a relationship criterion. The interaction data is included. On the other hand, drug information corresponds to a second element for deriving drug-disease vector data, and the drug information is information received by a user's direct or indirect input, and two or more corresponding to a candidate group for deriving a new drug. It includes the drug name and chemical formula for the investigational drug, information on the disease improved by the new drug, and information on the reference drug that exerts efficacy against the disease.

상기 상호작용데이터 및 상기 약물정보는 후술하는 약물-질병벡터 데이터를 도출하기 위한 기초데이터에 해당 상호작용데이터 및 해당 약물정보는 사용자에 의해 입력되거나 혹은 KEGG, BioCarta, PID, Reactome 및 DrugBank와 같이 해당 정보들을 포함하는 데이터베이스에서 불러올 수도 있다.The interaction data and the drug information are basic data for deriving drug-disease vector data to be described later, and the interaction data and the drug information are inputted by the user, or, such as KEGG, BioCarta, PID, Reactome, and DrugBank. It can also be retrieved from a database containing information.

상기 상호작용데이터 및 상기 약물정보에 기초하여 본 발명의 약물-질병벡터를 이용한 신약 재창출 장치는 약물-질병벡터를 도출하며, 상기 약물-질병벡터는 1차적으로 기초경로를 생성하고, 생성된 상기 기초경로에서 최단경로를 도출하여 상기 최단경로를 이루는 노드 및 상기 상호작용관계에 기초하여 상기 약물-질병벡터를 도출한다.Based on the interaction data and the drug information, the device for recreating a new drug using a drug-disease vector of the present invention derives a drug-disease vector, and the drug-disease vector first generates a basic path, and the generated The shortest path is derived from the basic path, and the drug-disease vector is derived based on the node forming the shortest path and the interaction relationship.

한편, 상기 기초경로 및 상기 최단경로에서 경로의 의미는 특정 약물에서부터 상기 특정 약물이 처음으로 영향을 미치는 1 이상의 타겟유전자를 경유하여 최종적으로 해당 약물의 효능이 미치는 1 이상의 질병유전자까지의 네트워크를 의미하며, 상기 특정 약물에서부터 상기 질병유전자까지의 경로는 1 이상의 노드를 포함한다. 상기 노드는 유전자, 단백질 및 생체분자(Biomolecule)가 해당되며, 따라서 상기 경로는 특정 약물에서부터 타겟유전자, 타겟유전자에서부터 노드 및 노드에서부터 질병유전자까지의 네트워크에 해당한다.On the other hand, the meaning of the pathway in the basic route and the shortest route means a network from a specific drug to one or more disease genes that finally affect the efficacy of the drug through one or more target genes that the specific drug first affects. And, the path from the specific drug to the disease gene includes one or more nodes. The node corresponds to genes, proteins, and biomolecules, and thus the pathway corresponds to a network from a specific drug to a target gene and a target gene to a node and a disease gene from the node.

마지막으로, 상기 약물-질병벡터 데이터에 기초하여 해당 질병에 대해 처방되는 기준약물과 유사한 효능을 발휘할 수 있는 신약을 도출한다. 상기 약물-질병벡터에 기초하여 상기 조사약물을 복수의 집합으로 분류하고, 상기 집합에 기초하여 평가모델을 생성하여 상기 평가모델을 통해 상기 조사약물에서 신약을 도출할 수 있다.Finally, based on the drug-disease vector data, a new drug that can exhibit similar efficacy to the reference drug prescribed for the disease is derived. Based on the drug-disease vector, the irradiated drug is classified into a plurality of sets, and an evaluation model is generated based on the set, and a new drug can be derived from the irradiated drug through the evaluation model.

이하에서는, 본 발명의 약물-질병벡터를 이용한 신약 재창출 장치에 대하여 상세하게 설명하도록 한다.Hereinafter, a device for recreating a new drug using the drug-disease vector of the present invention will be described in detail.

도 2는 본 발명의 일 실시예에 따른 통합 네트워크 기반의 약물-질병벡터를 이용한 신약 재창출 장치를 개략적으로 도시하는 도면이다.2 is a diagram schematically showing an apparatus for recreating a new drug using a drug-disease vector based on an integrated network according to an embodiment of the present invention.

도 2를 참조하면, 본 발명의 일 실시예에 따른 통합 네트워크 기반의 약물-질병벡터를 이용한 신약 재창출 장치로 기능할 수 있는 컴퓨팅장치(1000)는 외부의 참조데이터베이스(2000)와 연결된다.Referring to FIG. 2, a computing device 1000 capable of functioning as a device for recreating a new drug using a drug-disease vector based on an integrated network according to an embodiment of the present invention is connected to an external reference database 2000.

상기 참조데이터베이스(2000)는 복수의 데이터베이스로 구성될 수 있으며, 상기 참조데이터베이스(2000)는 제1참조데이터베이스(2100), 제2참조데이터베이스(2200) 및 제N참조데이터베이스(2300) 등을 포함할 수 있다.The reference database 2000 may be composed of a plurality of databases, and the reference database 2000 includes a first reference database 2100, a second reference database 2200, and an Nth reference database 2300. I can.

각각의 참조데이터베이스는 약물 작용 경로로 사용될 수 있는 각종 상호작용 데이터 및 약물에 대한 정보를 포함하고 있다. 본 발명의 일 실시예에 따르면 약물과 유전자 사이의 상호작용데이터, 유전자와 노드 사이의 상호작용데이터에 대한 데이터베이스를 갖추고 있는 BioCarta, Reactome, PID, KEGG, DrugBank, DisGeNet 및 CTD 등을 각각의 참조데이터베이스로 구성하여 동작할 수 있다.Each reference database contains information on drugs and various interaction data that can be used as drug action pathways. According to an embodiment of the present invention, each reference database including BioCarta, Reactome, PID, KEGG, DrugBank, DisGeNet, and CTD, etc., which have databases for drug-gene interaction data and gene-node interaction data. It can be configured and operated.

이와 같은 상기 참조데이터베이스(2000)는 통합 네트워크 기반의 약물-질병벡터를 이용한 신약 재창출 장치로 기능할 수 있는 컴퓨팅장치(1000)와 네트워크로 연결되어 상기 컴퓨팅장치(1000)에서 상기 참조데이터베이스(2000)의 데이터에 접근할 수 있다.The reference database 2000 is connected via a network to a computing device 1000 that can function as a device for recreating a new drug using a drug-disease vector based on an integrated network, and the reference database 2000 ) Data can be accessed.

도 3은 본 발명의 일 실시예에 따른 통합 네트워크 기반의 약물-질병벡터를 이용한 신약 재창출 장치의 내부구성요소를 개략적으로 도시하는 도면이다.3 is a diagram schematically showing the internal components of an apparatus for recreating a new drug using a drug-disease vector based on an integrated network according to an embodiment of the present invention.

도 3을 참조하면, 본 발명의 일 실시예에 따른 통합 네트워크 기반의 약물-질병벡터를 이용한 신약 재창출 장치로 기능할 수 있는 컴퓨팅장치(1000)는 프로세서(100), 버스(미도시), 네트워크인터페이스(300) 및 메모리(400)를 포함할 수 있다. 상기 메모리(400)는 운영체제(410), 서비스제공루틴(420), 참조데이터베이스(430), 변환상호작용데이터베이스(440) 및 판별기준설정부(450)가 저장될 수 있다.Referring to FIG. 3, a computing device 1000 capable of functioning as a new drug re-creation device using an integrated network-based drug-disease vector according to an embodiment of the present invention includes a processor 100, a bus (not shown), A network interface 300 and a memory 400 may be included. The memory 400 may store an operating system 410, a service providing routine 420, a reference database 430, a conversion interaction database 440, and a criterion setting unit 450.

프로세서(100)는 상호작용데이터변환부(110), 약물정보수신부(120), 약물-질병벡터도출부(130), 신약도출부(140) 및 신약검증부(150)를 포함할 수 있다. 다른 실시예들에서 통합 네트워크 기반의 약물-질병벡터를 이용한 신약 재창출 장치는 도 3의 구성요소들보다 더 많은 구성요소들을 포함할 수도 있다.The processor 100 may include an interaction data conversion unit 110, a drug information receiving unit 120, a drug-disease vector deriving unit 130, a new drug deriving unit 140, and a new drug verification unit 150. In other embodiments, the device for recreating a new drug using an integrated network-based drug-disease vector may include more components than those of FIG. 3.

메모리(400)는 컴퓨터에서 판독 가능한 기록 매체로서, RAM(random access memory), ROM(read only memory) 및 디스크 드라이브와 같은 비 소멸성 대용량 기록장치(permanent mass storage device)를 포함할 수 있다. 또한, 메모리에는 운영체제(410), 서비스제공루틴(420), 참조데이터베이스(430), 변환상호작용데이터베이스(440) 및 판별기준설정부(450)를 위한 프로그램 코드 혹은 데이터가 저장될 수 있다. 이러한 소프트웨어 구성요소들은 드라이브 메커니즘(drive mechanism, 미도시)을 이용하여 메모리(400)와는 별도의 컴퓨터에서 판독 가능한 기록 매체로부터 로딩될 수 있다. 이러한 별도의 컴퓨터에서 판독 가능한 기록 매체는 플로피 드라이브, 디스크, 테이프, DVD/CD-ROM 드라이브, 메모리 카드 등의 컴퓨터에서 판독 가능한 기록 매체(미도시)를 포함할 수 있다. 다른 실시예에서 소프트웨어 구성요소들은 컴퓨터에서 판독 가능한 기록 매체가 아닌 네트워크인터페이스(300)를 통해 메모리(400)에 로딩될 수도 있다.The memory 400 is a computer-readable recording medium, and may include a permanent mass storage device such as a random access memory (RAM), read only memory (ROM), and a disk drive. In addition, program codes or data for the operating system 410, the service providing routine 420, the reference database 430, the conversion interaction database 440, and the determination criterion setting unit 450 may be stored in the memory. These software components may be loaded from a computer-readable recording medium separate from the memory 400 using a drive mechanism (not shown). Such a separate computer-readable recording medium may include a computer-readable recording medium (not shown) such as a floppy drive, a disk, a tape, a DVD/CD-ROM drive, or a memory card. In another embodiment, software components may be loaded into the memory 400 through the network interface 300 rather than a computer-readable recording medium.

버스(미도시)는 컴퓨팅장치(1000)를 제어하는 장치 구성요소들간의 통신 및 데이터 전송을 가능하게 할 수 있다. 버스(미도시)는 고속 시리얼 버스(high-speed serial bus), 병렬 버스(parallel bus), SAN(Storage Area Network) 및/또는 다른 적절한 통신 기술을 이용하여 구성될 수 있다.The bus (not shown) may enable communication and data transmission between device components that control the computing device 1000. The bus (not shown) may be configured using a high-speed serial bus, a parallel bus, a storage area network (SAN), and/or other suitable communication technology.

네트워크인터페이스(300)는 통합 네트워크 기반의 약물-질병벡터를 이용한 신약 재창출 장치로 기능하는 컴퓨팅장치(1000)를 컴퓨터 네트워크에 연결하기 위한 컴퓨터 하드웨어 구성 요소일 수 있다. 네트워크인터페이스(300)는 통합 네트워크 기반의 약물-질병벡터를 이용한 신약 재창출 장치로 기능하는 컴퓨팅장치(1000)를 무선 또는 유선 커넥션을 통해 컴퓨터 네트워크에 연결시킬 수 있다. 이와 같은 네트워크인터페이스(300)를 통하여 통합 네트워크 기반의 약물-질병벡터를 이용한 신약 재창출 장치로 기능하는 컴퓨팅장치(1000)가 참조데이터베이스(2000)에 무선적 혹은 유선적으로 접속될 수 있다.The network interface 300 may be a computer hardware component for connecting the computing device 1000 functioning as a new drug re-creation device using an integrated network-based drug-disease vector to a computer network. The network interface 300 may connect the computing device 1000 functioning as a new drug re-creation device using an integrated network-based drug-disease vector to a computer network through a wireless or wired connection. Through the network interface 300, the computing device 1000 functioning as a new drug re-creation device using an integrated network-based drug-disease vector may be wirelessly or wiredly connected to the reference database 2000.

프로세서(100)는 기본적인 산술, 로직 및 약물의 유사도 판단장치로 기능하는 컴퓨팅장치(1000)의 입출력 연산을 수행함으로써, 컴퓨터 프로그램의 명령을 처리하도록 구성될 수 있다. 명령은 메모리(400) 또는 네트워크인터페이스(300)에 의해, 그리고 버스(미도시)를 통해 프로세서(100)로 제공될 수 있다. 프로세서(100)는 운영체제(410), 서비스제공루틴(420), 참조데이터베이스(430), 변환상호작용데이터베이스(440) 및 판별기준설정부(450)를 위한 프로그램 코드를 실행하도록 구성될 수 있다. 이러한 프로그램 코드는 메모리와 같은 기록 장치에 저장될 수 있다.The processor 100 may be configured to process instructions of a computer program by performing input/output operations of the computing device 1000, which functions as a device for determining basic arithmetic, logic, and similarity of drugs. Instructions may be provided to the processor 100 by the memory 400 or the network interface 300 and via a bus (not shown). The processor 100 may be configured to execute program codes for the operating system 410, the service providing routine 420, the reference database 430, the conversion interaction database 440, and the determination criterion setting unit 450. Such program codes may be stored in a recording device such as a memory.

상기 운영체제(410), 서비스제공루틴(420), 참조데이터베이스(430), 변환상호작용데이터베이스(440) 및 판별기준설정부(450)는 이하에서 설명하게 될 컴퓨팅장치(1000)의 작동을 수행하기 위해 구성될 수 있다. 상기 프로세서(100)는 컴퓨팅장치(1000)를 제어하는 방법에 따라 일부 컴포넌트가 생략되거나, 도시되지 않은 추가의 컴포넌트가 더 포함되거나, 2개 이상의 컴포넌트가 결합될 수 있다.The operating system 410, the service providing routine 420, the reference database 430, the conversion interaction database 440, and the determination criterion setting unit 450 perform the operation of the computing device 1000, which will be described below. Can be configured for In the processor 100, some components may be omitted, additional components not shown may be further included, or two or more components may be combined according to a method of controlling the computing device 1000.

한편, 이와 같은 상기 컴퓨팅 장치는 바람직하게는 개인용 컴퓨터 혹은 서버에 해당하고, 경우에 따라서는 스마트 폰(smart phone)과, 태블릿(tablet)과, 이동 전화기와, 화상 전화기와, 전자책 리더(e-book reader)와, 데스크 탑(desktop) PC와, 랩탑(laptop) PC와, 넷북(netbook) PC와, 개인용 복합 단말기(personal digital assistant: PDA, 이하 'PDA'라 칭하기로 한다)와, 휴대용 멀티미디어 플레이어(portable multimedia player: PMP, 이하 'PMP'라 칭하기로 한다)와, 엠피3 플레이어(mp3 player)와, 이동 의료 디바이스와, 카메라와, 웨어러블 디바이스(wearable device)(일 예로, 헤드-마운티드 디바이스(head-mounted device: HMD, 일 예로 'HMD'라 칭하기로 한다)와, 전자 의류와, 전자 팔찌와, 전자 목걸이와, 전자 앱세서리(appcessory)와, 전자 문신, 혹은 스마트 워치(smart watch) 등에 해당할 수 있다.Meanwhile, such a computing device preferably corresponds to a personal computer or a server, and in some cases, a smart phone, a tablet, a mobile phone, a video phone, and an e-book reader (e -book reader), desktop PC, laptop PC, netbook PC, personal digital assistant (PDA, hereinafter referred to as'PDA'), portable Multimedia player (portable multimedia player: PMP, hereinafter referred to as'PMP'), mp3 player, mobile medical device, camera, wearable device (for example, head-mounted Device (head-mounted device: HMD, for example, to be referred to as'HMD'), electronic clothing, electronic bracelet, electronic necklace, electronic appcessory, electronic tattoo, or smart watch ), etc.

본 발명의 일 실시예에 따른 컴퓨팅 장치로 구현되는, 약물-질병벡터를 이용하여 특정 질병에 대한 신약을 재창출 하는 방법으로서, 특정 질병에 대한 신약으로 재창출될 수 있는 2 이상의 조사약물에 대한 조사약물정보를 수신하는 약물정보수신단계; 유전자, 단백질 및 약물 중 2 이상에 대한 상호작용관계를 포함하는 상호작용데이터 및 상기 조사약물정보에 기초하여, 해당 조사약물 및 특정 질병에 대한 1 이상의 질병유전자 사이의 약물, 유전자, 및 단백질 중 1 이상을 노드로 포함하는 경로에서의 각각의 조사약물에 대한 약물-질병벡터를 도출하는 약물-질병벡터도출단계; 및 상기 조사약물의 상기 약물-질병벡터에 대한 정보에 기초하여 평가모델을 도출하고, 상기 평가모델에 기초하여 상기 조사약물에서 중에서 상기 특정 질병에 대한 신약을 도출하는 신약도출단계;를 포함한다.A method for recreating a new drug for a specific disease using a drug-disease vector, implemented as a computing device according to an embodiment of the present invention, for two or more irradiated drugs that can be recreated as new drugs for a specific disease. A drug information receiving step of receiving irradiated drug information; One of drugs, genes, and proteins between the irradiated drug and one or more disease genes for a specific disease, based on the interaction data including the interaction relationship with two or more of genes, proteins, and drugs and the irradiated drug information. A drug-disease vector derivation step of deriving a drug-disease vector for each irradiated drug in the path including the above as a node; And deriving an evaluation model based on information on the drug-disease vector of the investigational drug, and deriving a new drug for the specific disease from among the investigational drugs based on the evaluation model.

상기 상호작용데이터변환부(110)는 상기 참조데이터베이스에 저장된 상호작용데이터를 기설정된 기준에 따라 변환하는 단계를 수행한다. 상기 기설정된 기준은 상기 상호작용데이터의 상호작용관계에 따라 변환하는 기준에 해당하며, 해당 단계를 통해 변환된 상기 상호작용데이터는 상기 메모리부에 포함된 변환상호작용데이터베이스(440)에 별도로 저장되거나, 상기 컴퓨팅장치(1000)와 별도로 구성된 상기 참조데이터베이스(2000) 혹은 상기 메모리(400)에 포함되는 참조데이터베이스(430)에 포함될 수 있다. 구체적인 상기 상호작용데이터변환부(110)의 동작에 대해서는 후술하도록 한다.The interaction data conversion unit 110 performs a step of converting the interaction data stored in the reference database according to a preset criterion. The predetermined criterion corresponds to a criterion for converting according to an interaction relationship of the interaction data, and the interaction data converted through the corresponding step is separately stored in the conversion interaction database 440 included in the memory unit, or , It may be included in the reference database 2000 configured separately from the computing device 1000 or the reference database 430 included in the memory 400. A detailed operation of the interaction data conversion unit 110 will be described later.

상기 약물정보수신단계는 상기 약물정보수신부(120)에서 수행되며, 신약으로 도출될 수 있는 조사약물에 대한 정보, 신약을 도출하고자 하는 특정 질병에 대한 정보 및 해당 질병에 대해 기존에 처방하고 있는 1 이상의 기준약물에 대한 정보를 수신하며, 이와 같은 과정은 사용자에 의해 입력된 정보를 수신하거나 혹은 상기 참조데이터베이스에 포함된 해당 정보들을 호출하는 방법으로 수행될 수 있다.The drug information receiving step is performed by the drug information receiving unit 120, and information on the investigational drug that can be derived as a new drug, information on a specific disease for which a new drug is to be derived, and 1 that is previously prescribed for the disease. Information on the reference drug is received, and such a process may be performed by receiving information input by a user or calling corresponding information included in the reference database.

한편, 상기 약물-질병벡터도출단계는 상기 약물-질병벡터도출부(130)에서 수행되며, 상기 상호작용데이터변환부(110)에 의해 변환된 상기 상호작용데이터 및 상기 약물정보수신부(120)에서 수신한 조사약물에 대한 정보, 특정 질병에 대한 정보 및 기준약물에 대한 정보에 기초하여 약물-질병벡터를 도출한다. 상기 약물-질병벡터도출단계에 대한 구체적인 동작에 대해서는 후술하도록 한다.On the other hand, the drug-disease vector derivation step is performed in the drug-disease vector derivation unit 130, and the interaction data converted by the interaction data conversion unit 110 and the drug information receiving unit 120 A drug-disease vector is derived based on the received information on the investigational drug, information on a specific disease, and information on the reference drug. A detailed operation for the drug-disease vector derivation step will be described later.

상기 신약도출단계는, 상기 신약도출부(140)에서 수행되며 상기 약물-질병벡터도출단계에서 도출된 상기 약물-질병벡터에 기초하여 상기 1 이상의 조사약물에 포함된 특정 질병에 효능이 있다고 알려지지 않은 약물 가운데 해당 질병에 대해 효능을 발휘할 수 있는 신약을 도출하는 과정을 수행한다. 상기 신약도출단계에 대한 구체적인 동작에 대해서는 후술하도록 한다.The new drug extraction step is performed by the new drug delivery unit 140 and is not known to be effective against a specific disease contained in the at least one investigational drug based on the drug-disease vector derived in the drug-disease vector extraction step. It carries out the process of deriving a new drug that can be effective against the disease. A detailed operation for the new drug extraction step will be described later.

마지막으로, 상기 신약검증부(150)는 상기 신약도출단계에서 도출된 신약이 상기 신약으로 도출되지 않은 조사약물에 비해 해당 질병에 효능이 있는지를 검증하는 신약검증단계를 수행한다. 상기 신약검증단계는 상기 신약 및 상기 기준약물의 효능에 대한 제1유사도를 도출하고, 상기 신약으로 도출되지 않은 조사약물 및 상기 기준약물의 효능에 대한 제2유사도를 도출하여, 상기 제1유사도 및 상기 제2유사도에 기초하여 상기 신약을 검증한다.Finally, the new drug verification unit 150 performs a new drug verification step of verifying whether the new drug derived in the new drug extraction step is effective in the corresponding disease compared to the irradiated drug not derived as the new drug. The new drug verification step derives a first degree of similarity for the efficacy of the new drug and the reference drug, and derives a second degree of similarity for the efficacy of the investigational drug and the reference drug not derived as the new drug, and the first similarity and The new drug is verified based on the second similarity.

도 4는 본 발명의 일 실시예에 따른 상호작용데이터변환부(110)에 의해 변환된 상호작용데이터를 개략적으로 도시하는 도면이다.4 is a diagram schematically showing interaction data converted by the interaction data conversion unit 110 according to an embodiment of the present invention.

상기 약물-질병벡터를 이용하여 특정 질병에 대한 신약을 재창출 하는 방법은, 유전자, 단백질 및 약물 중 2 이상에 대한 상호작용관계를 포함하는 데이터를 상기 컴퓨팅 장치 또는 참조데이터베이스에서 로드하여 기설정된 관계기준에 기초하여 변환하는 상호작용데이터변환단계;를 더 포함한다.The method of recreating a new drug for a specific disease using the drug-disease vector is a preset relationship by loading data including interaction relationships for two or more of genes, proteins, and drugs from the computing device or a reference database. It further includes an interaction data conversion step of converting based on the criterion.

구체적으로, 상기 상호작용데이터변환단계는 상기 상호작용데이터변환부(110)에서 수행되고, 상기 상호작용데이터변환단계는 상기 상호작용데이터에 포함된 약물, 유전자, 단백질 및 더 구체적으로는 생체분자를 포함하여 2 이상에 대한 상호작용관계를 기설정된 관계기준에 기초하여 상기 상호작용데이터를 변환할 수 있다. 상기 관계기준은 사용자에 의해 직접적 혹은 간접적으로 입력될 수 있으며, 상기 메모리부(400)에 포함된 상기 판별기준설정부(450)에 별도로 저장될 수 있다.Specifically, the interaction data conversion step is performed by the interaction data conversion unit 110, and the interaction data conversion step includes drugs, genes, proteins, and more specifically, biomolecules included in the interaction data. Including, the interaction data for two or more may be converted based on a preset relationship criterion. The relationship criterion may be directly or indirectly input by the user, and may be separately stored in the determination criterion setting unit 450 included in the memory unit 400.

한편, 상기 상호작용데이터변환단계는 로드된 유전자, 단백질 및 약물 중 2 이상에 대한 상호작용관계를 포함하는 데이터에서, 상기 관계기준에 기초하여 유전자, 단백질 및 약물 중 2 개의 관계를 양성타입, 음성타입 및 중립타입 중 하나로 변환하여 변환상호작용데이터로 도출한다.On the other hand, in the interaction data conversion step, in the data including the interaction relationship with two or more of the loaded genes, proteins, and drugs, based on the relationship criteria, two relationships among genes, proteins and drugs are positive type and negative. Converted to one of type and neutral type and derived as transformed interaction data.

구체적으로, 도 4에 도시된 interaction name은 상기 상호작용데이터에 포함된 약물, 유전자, 단백질 및 더 구체적으로는 생체분자를 포함한 2 이상에 대한 상호작용관계를 의미하며, 상기 interaction name 이하에 도시된 activation(활성관계), expression(발현관계), repression(억제관계), inhibition(비활성관계), binding(결합관계) 등은 상기 상호작용관계의 유형에 해당한다.Specifically, the interaction name shown in FIG. 4 refers to an interaction relationship between two or more drugs, genes, proteins, and more specifically, biomolecules included in the interaction data, and is shown below the interaction name. Activation (active relationship), expression (expression relationship), repression (inhibition relationship), inhibition (inactive relationship), binding (binding relationship), etc. correspond to the types of the interaction relationship.

또한, interaction type in our network는 상기 상호작용데이터변환단계에서 상기 상호작용관계를 상기 관계기준에 기초하여 변환된 상기 변환상호작용데이터에 해당하며, 상기 interaction type in our network 이하에 도시된 positive(양성타입), negative(음성타입), neutral(중립타입)은 상기 변환상호작용데이터의 유형에 해당한다.In addition, interaction type in our network corresponds to the transformation interaction data converted based on the relation criteria in the interaction data transformation step, and the positive (positive) shown below the interaction type in our network Type), negative (speech type), and neutral (neutral type) correspond to the types of the transformed interaction data.

구체적으로, 상기 관계기준은 상기 상호작용데이터의 상호작용관계가 상기 활성관계 및 상기 발현관계인 경우 상기 상호작용관계를 상기 양성타입으로 변환하고, 상기 상호작용관계가 상기 억제관계 및 비활성관계인 경우 상기 음성타입으로 변환하며, 상기 상호작용관계가 결합관계인 경우 상기 중립타입으로 변환하도록 한다.Specifically, the relationship criterion is to convert the interaction relationship into the positive type when the interaction relationship of the interaction data is the active relationship and the expression relationship, and the negative when the interaction relationship is the inhibition relationship and the inactive relationship. It is converted into a type, and when the interaction relationship is a binding relationship, it is converted into the neutral type.

상기 활성관계 및 상기 발현관계는 후술하는 상기 약물-질병벡터를 도출하기 위한 상기 최단경로를 도출하는 과정에서 동일한 요소에 해당하므로 상기 양성타입으로 변환하고, 상기 억제관계 및 상기 비활성관계는 상기 최단경로를 도출하는 과정에서 동일한 요소에 해당하므로 상기 음성타입으로 변환한다. 한편, 도 4에 도시된 상기 interaction name 이하의 phosphorylation, indirect effect, dissociation, dephosphorylation, ubiquitination, missing interaction, methylation, glycosylation 및 state change는 상기 약물-질병벡터를 도출하는 데 있어 큰 영향을 미치지 않으므로 고려하지 않는다.The activity relationship and the expression relationship correspond to the same factor in the process of deriving the shortest path for deriving the drug-disease vector, which will be described later, so that the positive type is converted, and the inhibition relationship and the inactive relationship are the shortest path. It corresponds to the same element in the process of deriving a so that it is converted into the speech type. On the other hand, phosphorylation, indirect effect, dissociation, dephosphorylation, ubiquitination, missing interaction, methylation, glycosylation, and state change below the interaction name shown in FIG. 4 do not have a significant effect on deriving the drug-disease vector, so they are not considered. Does not.

한편, 상기 양성타입 및 상기 음성타입만을 고려하여 경로를 도출하는 경우, 상기 양성타입 및 상기 음성타입에 포함되는 유전자, 단백질 및 생체분자의 수는 전체 유전자, 단백질 및 생체분자수에 비해 상당히 적으므로 특정약물에서 질병유전자까지의 다양한 기초경로를 도출하는데 한계가 있다. 반면, 본 발명에서와 같이 상기 중립타입을 더 고려하여 특정약물에서 질병유전자까지의 기초경로를 도출하는 경우에는 상기 기술한 경우에 비해 더 다양한 기초경로를 도출할 수 있는 효과를 발휘할 수 있다.On the other hand, when the path is derived by considering only the positive type and the negative type, the number of genes, proteins and biomolecules included in the positive type and the negative type is considerably smaller than the total number of genes, proteins and biomolecules. There are limitations in deriving various basic pathways from drugs to disease genes. On the other hand, in the case of deriving the basic route from the specific drug to the disease gene in consideration of the neutral type as in the present invention, the effect of deriving a more diverse basic route than the case described above can be exhibited.

도 5는 본 발명의 일 실시 예에 따른 약물-질병벡터도출부의 수행단계들을 개략적으로 도시하는 도면이다.5 is a diagram schematically showing steps performed by a drug-disease vector extraction unit according to an embodiment of the present invention.

상기 약물-질병벡터도출단계는 상기 변환상호작용데이터를 이용하고, 상기 약물-질병벡터도출단계는, 상기 조사약물정보 및 상기 상호작용데이터에 기초하여 상기 조사약물 및 상기 질병유전자 사이의 기초경로를 도출하는 기초경로도출단계(S10); 상기 기초경로에 기초하여 상기 조사약물 및 상기 질병유전자 사이의 최단경로를 도출하고, 상기 최단경로에 기초하여 상기 약물-질병벡터를 도출하는 최단경로계산단계(S20);를 포함한다.The drug-disease vector derivation step uses the transformed interaction data, and the drug-disease vector derivation step includes a basic path between the irradiated drug and the disease gene based on the irradiated drug information and the interaction data. A step of deriving a basic path (S10); And a shortest path calculation step (S20) of deriving the shortest path between the irradiated drug and the disease gene based on the basic path, and deriving the drug-disease vector based on the shortest path.

구체적으로, 상기 약물-질병벡터도출단계는 상기 약물-질병벡터도출부(130)에서 수행되며, 상기 약물-질병벡터도출단계는 상기 조사약물에서부터 상기 질병유전자 사이의 작용기전을 포함하는 상기 기초경로를 도출하는 기초경로도출단계(S10);를 수행한다. 상기 기초경로는 상기 약물에서부터 상기 질병유전자까지 연결될 수 있는 모든 경로를 포함한다. 또한 상기 약물에서부터 상기 질병유전자까지의 경로에는 상기 약물에 의해 1차적으로 영향을 받는 타겟유전자 및 노드를 포함하며, 상기 노드는 유전자, 단백질 및 생체분자가 해당될 수 있다. 상기 기초경로에서 상기 조사약물, 상기 타겟유전자, 상기 노드 및 상기 질병유전자와 같은 구성요소 가운데 2 이상의 연결은 상기 변환상호작용데이터에 기초하여 형성된다. 상기 변환상호작용데이터의 종류에 해당하는 양성타입, 음성타입 및 중립타입에 기초하여 상기 구성요소의 연결을 표시한다. 상기 기초경로는 후술하는 최단경로 및 약물-질병벡터를 도출하기 위한 기본적인 경로에 해당하며, 상기 기초경로를 통해 상기 최단경로를 도출하여 상기 약물-질병벡터를 도출할 수 있게 된다.Specifically, the drug-disease vector extraction step is performed in the drug-disease vector extraction unit 130, and the drug-disease vector extraction step is the basic path including a mechanism of action between the irradiated drug and the disease gene. The basic path deriving step (S10) to derive; is performed. The basic pathway includes all pathways that can be linked from the drug to the disease gene. In addition, the path from the drug to the disease gene includes a target gene and a node that are primarily affected by the drug, and the node may correspond to a gene, a protein, and a biomolecule. In the basic pathway, two or more connections among components such as the irradiation drug, the target gene, the node, and the disease gene are formed based on the transformation interaction data. The connection of the components is displayed based on a positive type, a negative type, and a neutral type corresponding to the type of the transformation interaction data. The basic path corresponds to a basic path for deriving the shortest path and drug-disease vector to be described later, and the shortest path can be derived through the basic path to derive the drug-disease vector.

한편, 상기 최단경로계산단계(S20)는 상기 기초경로도출단계에서 도출된 상기 기초경로에 기초하여 상기 최단경로를 도출하고, 상기 최단경로에 기초하여 상기 약물-질병벡터를 도출한다. 상기 최단경로는 상기 기초경로에 포함된 복수의 경로에서 각 경로에 포함된 변환상호작용데이터 중 적어도 하나의 양성타입 또는 음성타입을 포함하고, 가장 적은 노드로 구성되는 경로에 해당한다. 상기 최단경로를 도출하는 과정에 대한 일 실시예는 도 6에서 후술하도록 한다.On the other hand, the shortest path calculation step (S20) derives the shortest path based on the basic path derived in the basic path extraction step, and derives the drug-disease vector based on the shortest path. The shortest path includes at least one positive type or negative type of transformation interaction data included in each path among a plurality of paths included in the basic path, and corresponds to a path composed of the fewest nodes. An embodiment of the process of deriving the shortest path will be described later in FIG. 6.

이후 상기 최단경로단계는 도출된 상기 최단경로에서 상기 약물-질병벡터를 도출한다. 상기 약물-질병벡터는 상기 최단경로에 포함되는 변환상호작용데이터 및 상기 최단경로에 포함되는 노드와 인접한 노드와의 연결개수에 기초하여 도출된다. 상기 약물-질병벡터를 도출하는 과정에 대한 일 실시예는 도 7에서 후술하도록 한다.Thereafter, in the shortest path step, the drug-disease vector is derived from the derived shortest path. The drug-disease vector is derived based on the transformation interaction data included in the shortest path and the number of connections between nodes included in the shortest path and adjacent nodes. An embodiment of the process of deriving the drug-disease vector will be described later in FIG. 7.

도 6은 본 발명의 일 실시예에 따른 약물-질병벡터도출부에 의해 도출된 최단경로를 개략적으로 도시한 도면이다.6 is a diagram schematically showing the shortest path derived by the drug-disease vector extraction unit according to an embodiment of the present invention.

상기 최단경로는, 상기 최단경로에 노드로 포함된 1 이상의 약물, 유전자, 및 단백질의 상호관계가 적어도 하나의 양성타입 또는 음성타입을 포함하고, 상기 상호작용데이터는 약물, 유전자, 및 단백질 중 2 이상의 상호관계로, 상기 양성타입, 상기 음성타입 및 중립타입을 포함하고, 상기 중립타입은 약물, 유전자, 및 단백질 중 2 이상이 결합관계인 경우를 포함한다.In the shortest path, the correlation between one or more drugs, genes, and proteins included as nodes in the shortest path includes at least one positive type or negative type, and the interaction data is 2 of drugs, genes, and proteins. As described above, the positive type, the negative type, and the neutral type are included, and the neutral type includes a case in which two or more of a drug, a gene, and a protein are in a binding relationship.

구체적으로 도 6을 참조하면, 도 6은 타겟유전자에서부터 복수의 노드를 거쳐 질병유전자까지의 최단경로의 일부를 도시한 도면이고, 도 6의 (a)는 조사약물과 상기 타겟유전자간의 상기 변환상호작용데이터가 중립타입인 경우의 최단경로의 일부를 도시한 도면이고, 도 6의 (b)는 조사약물과 상기 타겟유전자간의 상기 변환상호작용데이터가 중립타입이 아닌 경우의 최단경로의 일부를 도시한 도면에 해당한다.Specifically, referring to FIG. 6, FIG. 6 is a diagram showing a part of the shortest path from the target gene to the disease gene through a plurality of nodes, and FIG. 6 (a) is the conversion between the irradiated drug and the target gene. A diagram showing a part of the shortest path when the action data is of a neutral type, and FIG. 6B shows a part of the shortest path when the conversion interaction data between the irradiated drug and the target gene is not a neutral type. It corresponds to one drawing.

변환상호작용데이터가 중립타입인 경우는 상호작용관계가 결합관계인 경우로써, 상기 중립타입은 신체에서 일반적인 작용들을 유지하고, 약물에 의해 특정 질병에 영향을 주는 것은 양성타입 또는 음성타입에 해당하는 변환상호작용데이터이다. 따라서, 상기 최단경로가 될 수 있는 경우는 상기 조사약물에서부터 상기 질병유전자까지의 경로 중 적어도 하나의 변환상호작용데이터가 상기 양성타입 또는 상기 음성타입을 포함해야 한다.When the transformation interaction data is a neutral type, the interaction relationship is a binding relationship, and the neutral type maintains normal actions in the body, and the transformation corresponding to a positive type or a negative type that affects a specific disease by a drug This is interaction data. Therefore, in the case where the shortest route can be, at least one of the pathways from the irradiated drug to the disease gene should include the positive type or the negative type.

도 6의 (a) 및 (b)는 타겟유전자 1에서부터 질병유전자까지 노드 3, 노드 2 및 노드 1을 거치는 경로와 노드 3 및 최하단에 있는 노드를 거치는 2개의 경로를 포함하고 있다. 한편, 도 6의 (a)의 경우는 조사약물 및 상기 타겟유전자 1 사이의 변환상호작용데이터가 중립타입인 경우로 가정하였기 때문에, 도 6의 (a)에 도시된 2개의 경로 가운데 노드 3 및 노드 2가 양성타입, 노드 2 및 노드 1이 음성타입, 노드 1 및 질병유전자가 음성타입인 변환상호작용데이터를 포함하는 경로가 최단경로로 도출될 수 있다.6A and 6B include a path from target gene 1 to disease gene through node 3, node 2, and node 1, and two paths through node 3 and a node at the bottom. On the other hand, in the case of (a) of FIG. 6, since it is assumed that the conversion interaction data between the irradiated drug and the target gene 1 is of a neutral type, node 3 and node 3 of the two paths shown in FIG. 6 (a) A path including transformed interaction data in which node 2 is a positive type, node 2 and node 1 is a negative type, and node 1 and a disease gene is a negative type may be derived as the shortest path.

반면, 도 6의 (b)의 경우는 조사약물 및 상기 타겟유전자 1 사이의 변환상호작용데이터가 중립타입이 아닌 경우로 가정하였으며, 따라서 상기 2개의 경로에서 해당 경로에 포함된 변환상호작용데이터가 모두 중립타입이지만 포함된 노드의 개수가 가장 적은 타겟유전자 1에서 노드 3 및 최하단에 있는 노드를 거쳐 질병유전자까지 이르는 경로가 최단경로로 도출될 수 있다. 한편, 상기 타겟유전자 1에서 노드 3, 노드 2 및 노드 1을 거쳐 질병유전자까지 이르는 경로의 경우 약물이 유전자에 영향을 줄 수 있는 경로에 해당하지만, 도출된 최단경로에 비해 경유하는 노드의 개수가 많기 때문에 최단경로로 도출되지 않는다.On the other hand, in the case of (b) of FIG. 6, it is assumed that the transformation interaction data between the irradiated drug and the target gene 1 is not a neutral type, and thus transformation interaction data included in the corresponding path in the two paths is Although all are neutral types, the path from target gene 1 with the smallest number of nodes included to node 3 and the node at the bottom to the disease gene can be derived as the shortest path. On the other hand, in the case of the path from target gene 1 to node 3, node 2, and node 1 to the disease gene, the drug corresponds to a path that can affect the gene, but the number of nodes passing through is compared to the derived shortest path. Because there are many, it is not derived as the shortest path.

도 6에서 도시된 바와 같이 상기 조사약물 및 상기 타겟유전자와의 변환상호작용데이터에 따라 중립타입인 경우와 그렇지 않은 경우로 구분하여 최단경로를 도출하는 방법은 일 실시예일 뿐 상기 조사약물에서부터 상기 질병유전자까지 이르는 기초경로에 대하여 적어도 1 이상의 변환상호작용데이터가 양성타입 또는 음성타입을 포함하는 경로 가운데 최소 노드를 포함하는 경로를 최단경로로 도출하는 방법과 같이 다양한 방법을 사용할 수도 있으며, 도 6에서와 같이 최단경로는 하나의 경로만 도출되지 않고 2 이상의 경로가 도출될 수도 있다.As shown in Fig. 6, the method of deriving the shortest path by dividing the case of the neutral type and the case of the non-neutral type according to the conversion interaction data with the irradiation drug and the target gene is only one embodiment. Various methods may be used, such as a method of deriving a path including the least node among paths including a positive type or a negative type as the shortest path in which at least one transformation interaction data for the basic path leading to the gene is determined. As shown, the shortest path is not only one path, but two or more paths may be derived.

도 7은 본 발명의 일 실시예에 따른 최단경로에서 약물-질병벡터도출부에 의해 약물-질병벡터의 도출 과정을 개략적으로 도시한 도면이다.7 is a diagram schematically illustrating a process of deriving a drug-disease vector by a drug-disease vector deriving unit in the shortest path according to an embodiment of the present invention.

상기 최단경로는 1 이상의 노드를 포함하고, 상기 최단경로계산단계는 상기 최단경로에 포함된 각각의 노드에 연결된 노드의 개수 및 각각의 노드에 인접한 노드와의 상호관계 타입에 기초하여 상기 약물-질병벡터를 도출한다.The shortest path includes one or more nodes, and in the shortest path calculation step, the drug-disease is based on the number of nodes connected to each node included in the shortest path and a correlation type with nodes adjacent to each node. Derive a vector.

구체적으로, 도 7을 참조하면 도 7의 (a)는 복수의 조사약물에 대하여 해당 조사약물과 1 이상의 타겟유전자 사이의 변환상호작용데이터와 상기 타겟유전자와 복수의 질병유전자사이의 벡터값을 도시한 도면이다. 상기 조사약물과 상호작용관계를 형성하는 타겟유전자의 개수는 1 이상이 될 수 있고, 마찬가지로 상기 타겟유전자에 의해 영향을 받는 질병유전자의 개수 또한 1 이상이 될 수 있다.Specifically, referring to FIG. 7, (a) of FIG. 7 shows transformational interaction data between the irradiated drug and one or more target genes for a plurality of irradiated drugs, and vector values between the target gene and the plurality of disease genes. It is a drawing. The number of target genes forming an interaction relationship with the irradiated drug may be 1 or more, and likewise, the number of disease genes affected by the target gene may also be 1 or more.

한편, 도 7의 (a)에서 첫번째 조사약물의 경우 타겟유전자 1과 음성타입을 형성하고 있고, 타겟유전자 2와는 중립타입을 형성하고 있다. 한편, 상기 타겟유전자 1과 상기 질병유전자 a 또는 상기 질병유전자 b 사이의 값들은 약물-질병벡터를 도출하기 위한 기초벡터에 해당한다.On the other hand, in the case of the first irradiated drug in Fig. 7A, it forms a negative type with the target gene 1, and forms a neutral type with the target gene 2. Meanwhile, values between the target gene 1 and the disease gene a or the disease gene b correspond to a basic vector for deriving a drug-disease vector.

도 6을 참조하여 상기 기초벡터를 도출하는 과정을 기술하는 것은 하기와 같다. 도 6에 도시된 경로에서 기초벡터를 도출하기 위한 인수(factor)에는 경로타입값(T) 및 경로가중값(W)이 있으며, 우선 경로타입값(T)를 도출하기 위한 수식은 다음과 같다.The process of deriving the basic vector will be described with reference to FIG. 6 as follows. Factors for deriving the basic vector from the path shown in FIG. 6 include a path type value (T) and a path weight value (W). First, an equation for deriving a path type value (T) is as follows.

Figure 112019011873622-pat00001
Figure 112019011873622-pat00001

E는 해당 경로에서 양성타입 또는 음성타입의 변환상호작용데이터의 집합이며, ei는 i번째에 해당하는 노드와 i+1번째에 해당하는 노드와의 변환상호작용데이터에 해당된다. 상기 변환상호작용데이터가 상기 양성타입인 경우에는 +1을 할당하고, 상기 음성타입인 경우에는 -1을 할당한다. 만약 해당 경로에 중립타입이 있는 경우 해당 중립타입은 무시한다. 따라서 도 6의 (a)에서 타겟유전자 1에서부터 질병유전자까지의 경로타입값(T)은 1개의 양성타입과 2개의 음성타입에 의해 +1을 갖게 된다.E is a set of transformation interaction data of positive type or negative type in the corresponding path, and e i corresponds to the transformation interaction data between the i-th node and the i+1-th node. If the transformed interaction data is the positive type, +1 is assigned, and if the negative type is the negative type, -1 is assigned. If there is a neutral type in the path, the neutral type is ignored. Therefore, the path type value (T) from the target gene 1 to the disease gene in FIG. 6A has +1 by one positive type and two negative types.

한편, 경로가중값(W)를 도출하기 위한 수식은 다음과 같다.Meanwhile, the equation for deriving the path weight value W is as follows.

Figure 112019011873622-pat00002
Figure 112019011873622-pat00002

di는 해당 경로에 포함된 i번째 노드와 인접한 노드와의 연결개수에 해당한다. 따라서 도 6의 (a)에서 타겟유전자 1에서부터 질병유전자까지의 경로가중값(W)은 타겟유전자 1과 인접한 1개의 노드와 연결되어 있고, 노드 3은 인접한 3개의 노드와 연결되어 있고, 노드 2는 인접한 2개의 노드와 연결되어 있으며, 노드 1은 1개의 질병유전자와 연결되어 있으므로

Figure 112019011873622-pat00003
을 갖게 된다.d i corresponds to the number of connections between the i-th node included in the path and the adjacent node. Therefore, in Figure 6 (a), the path weight value (W) from target gene 1 to disease gene is connected to one node adjacent to target gene 1, node 3 is connected to three nodes, and node 2 is It is connected to two adjacent nodes, and node 1 is connected to one disease gene.
Figure 112019011873622-pat00003
Will have.

위에서 도출한 상기 경로타입값(T) 및 상기 경로가중값(W)에 기초하여 기초벡터(V)를 도출하는 수식은 다음과 같다.An equation for deriving the basic vector V based on the path type value T and the path weight W derived above is as follows.

Figure 112019011873622-pat00004
Figure 112019011873622-pat00004

m은 질병유전자와 최단경로를 이루는 타겟유전자의 최대개수를 의미하며, 기초벡터(V)는 경로타입값(T)와 경로가중값(W)의 곱으로 이루어진다. 예를 들어, 도 6의 (a)에서는 질병유전자는 단일 타겟유전자 1과 최단경로를 이루고 있으므로, 기초벡터(V)는

Figure 112019011873622-pat00005
을 갖게 된다.m means the maximum number of target genes that form the shortest path with the disease gene, and the basic vector (V) is formed by the product of the path type value (T) and the path weight value (W). For example, in Fig. 6(a), the disease gene forms the shortest path with a single target gene 1, so the basic vector V is
Figure 112019011873622-pat00005
Will have.

마지막으로 상기 기초벡터(V)에 기초하여 약물-질병벡터(DV)를 도출하는 수식은 다음과 같다.Finally, the formula for deriving the drug-disease vector (DV) based on the basic vector (V) is as follows.

Figure 112019011873622-pat00006
Figure 112019011873622-pat00006

sign(Ti)는 조사약물과 i번째 타겟유전자 사이의 변환상호작용데이터 에 해당된다. 상기 양성타입의 경우에는 +1을 할당하고, 상기 음성타입의 경우에는 -1을 할당한다. 만약 해당 경로에 중립타입이 있는 경우 해당 중립타입은 무시한다. 따라서 도 6의 (a)에서 약물-질병벡터(DV)는 조사약물과 타겟유전자 1이 중립타입인 경우로 가정하였으므로,

Figure 112019011873622-pat00007
을 갖게 된다.sign(T i ) corresponds to the transduction interaction data between the irradiated drug and the i-th target gene. In the case of the positive type, +1 is assigned, and in the case of the negative type, -1 is assigned. If there is a neutral type in the path, the neutral type is ignored. Therefore, in Figure 6 (a), the drug-disease vector (DV) is assumed to be a case where the irradiated drug and the target gene 1 are of a neutral type,
Figure 112019011873622-pat00007
Will have.

상기와 같은 방법을 통해 도 7을 참조하면 도 7의 (a)의 첫번째 조사약물의 경우 타겟유전자 1과 질병유전자 a 사이의 기초벡터(V)는

Figure 112019011873622-pat00008
, 상기 타겟유전자 1과 질병유전자 b 사이의 기초벡터(V)는
Figure 112019011873622-pat00009
, 타겟유전자 2와 상기 질병유전자 b 사이의 기초벡터(V)는
Figure 112019011873622-pat00010
, 상기 타겟유전자 2와 질병유전자 c 사이의 기초벡터(V)는
Figure 112019011873622-pat00011
에 해당한다.Referring to Figure 7 through the above method, in the case of the first irradiated drug of Figure 7 (a), the basic vector (V) between the target gene 1 and the disease gene a is
Figure 112019011873622-pat00008
, The basic vector (V) between the target gene 1 and the disease gene b is
Figure 112019011873622-pat00009
, The basic vector (V) between the target gene 2 and the disease gene b is
Figure 112019011873622-pat00010
, The basic vector (V) between the target gene 2 and the disease gene c is
Figure 112019011873622-pat00011
Corresponds to.

한편, 도 7의 (b)는 도 7의 (a)에서 구한 기초벡터(V)와 약물-질병벡터(DV)를 도출하는 과정을 정리한 표이다. 해당 표에서 타겟유전자(TG) 1의 경우 해당 조사약물과의 관계가 음성관계이므로, 구별될 수 있도록 볼드체로 표기하였다. 또한 해당 표에서 질병유전자(DG) b의 경우 해당 질병유전자와 경로를 이루고 있는 타겟유전자(TG)는 타겟유전자 1 및 타겟유전자 2가 있음을 확인할 수 있다.On the other hand, Figure 7 (b) is a table summarizing the process of deriving the basic vector (V) and drug-disease vector (DV) obtained in Figure 7 (a). In the case of the target gene (TG) 1 in the table, since the relationship with the irradiated drug is negative, it is indicated in bold so that it can be distinguished. In addition, in the case of the disease gene (DG) b from the table, it can be seen that target gene 1 and target gene 2 are included in the target gene (TG) forming the path with the disease gene.

도 7의 (b)의 하단의 표는 도 7의 (b)의 상단의 표에 기초하여 약물-질병벡터(DV)를 도출하는 표에 해당한다. 상기 약물-질병벡터(DV)는 상기 질병유전자마다 각각 도출되고, 따라서 해당 질병유전자에 해당하는 기초벡터(V)와 상기 조사약물과 해당 타겟유전자와의 변환상호작용데이터에 기초하여 상기 약물-질병벡터(DV)를 도출한다. 예를 들어 질병유전자 b의 경우 상기 타겟유전자 1과 상기 타겟유전자 2에 의해 영향을 받고, 상기 타겟유전자 1은 상기 조사약물과 음성관계이므로 해당 기초벡터(V) 값인

Figure 112019011873622-pat00012
에 -1을 곱한 값을 상기 타겟유전자 2와 상기 질병유전자 b 사이의 기초벡터(V) 값인
Figure 112019011873622-pat00013
에 더한 값에 해당하는
Figure 112019011873622-pat00014
가 최종적으로 해당 조사약물과 상기 약물유전자 b 사이의 약물-질병벡터(DV)에 해당한다. 도 7에 도시된 각 조사약물 및 각 질병유전자에 대한 약물-질병벡터들을 도 7의 (c)에 표로 도시하였다.The table at the bottom of Fig. 7(b) corresponds to a table for deriving a drug-disease vector (DV) based on the table at the top of Fig. 7(b). The drug-disease vector (DV) is derived for each disease gene, and thus the drug-disease based on the basic vector (V) corresponding to the disease gene and the conversion interaction data between the irradiated drug and the target gene. Derive a vector (DV). For example, in the case of disease gene b, it is affected by the target gene 1 and the target gene 2, and the target gene 1 has a negative relationship with the irradiated drug, so the corresponding basic vector (V) value is
Figure 112019011873622-pat00012
Multiplied by -1 is the basic vector (V) value between the target gene 2 and the disease gene b
Figure 112019011873622-pat00013
Corresponding to the value added to
Figure 112019011873622-pat00014
Finally corresponds to a drug-disease vector (DV) between the irradiated drug and the drug gene b. Drug-disease vectors for each irradiated drug and each disease gene shown in FIG. 7 are shown in a table in FIG. 7 (c).

도 7의 (c)에 도시된 표를 참조하면 복수의 조사약물에 대해 각각 질병유전자 a, 질병유전자 b 및 질병유전자 c에 상응하는 각각의 약물-질병벡터를 포함한다. 상기 표에 도시된 것 외에도 각 조사약물마다 해당되는 1 이상의 질병유전자의 종류는 상이할 수 있으며, 따라서 어떤 조사약물은 특정 질병유전자와의 약물-질병벡터를 포함하지 않을 수도 있다.Referring to the table shown in (c) of FIG. 7, each drug-disease vector corresponding to the disease gene a, the disease gene b, and the disease gene c for a plurality of irradiated drugs is included. In addition to those shown in the table above, the types of one or more disease genes corresponding to each investigational drug may be different, and thus some investigational drugs may not contain a drug-disease vector with a specific disease gene.

도 7에서 도시한 약물-질병벡터를 도출하는 과정은 일 실시예일 뿐이며, 상기와 같은 단계를 거치지 않고, 조사약물에서부터 1 이상의 질병유전자까지의 1 이상의 최단경로를 전체적으로 고려하여 해당 조사약물과 1 이상의 질병유전자 사이의 각각의 약물-질병벡터를 한번에 도출하는 방법과 같이 다양한 도출 방법을 사용할 수도 있다.The process of deriving the drug-disease vector shown in FIG. 7 is only an example, and without going through the above steps, one or more shortest routes from the irradiated drug to the one or more disease genes are considered as a whole, and the irradiated drug and one or more Various derivation methods can be used, such as deriving each drug-disease vector between disease genes at once.

도 8은 본 발명의 일 실시예에 따른 신약도출부의 수행단계를 개략적으로 도시하는 도면이다.8 is a diagram schematically showing a step of performing a drug delivery unit according to an embodiment of the present invention.

상기 신약도출단계는 상기 조사약물 중 상기 특정 질병에 대해 효능이 있다고 알려진 기준약물의 상기 약물-질병벡터에 대한 정보 및 상기 조사약물 중 상기 특정 질병에 대해 효능이 있다고 알려지지 않은 약물의 상기 약물-질병벡터에 기초하여 평가모델을 도출한다.The new drug extraction step includes information on the drug-disease vector of a reference drug known to be effective against the specific disease among the irradiated drugs, and the drug-disease of a drug that is not known to be effective against the specific disease among the irradiated drugs. An evaluation model is derived based on the vector.

구체적으로 신약도출부(140)는 상기 신약도출단계를 수행하며, 상기 약물-질병벡터도출부(130)에서 도출한 복수의 조사약물군의 약물-질병벡터에서 해당 조사약물군에서 신약을 도출하고자 하는 특정 질병에 대하여 기존에 효능이 있다고 알려진 1 이상의 조사약물의 약물-질병벡터 및 해당 조사약물군에서 신약을 도출하고자 하는 특정 질병에 대하여 기존에 효능이 있다고 알려지지 않은 1 이상의 조사약물의 약물-질병벡터에 기초하여 신약을 도출할 수 있는 평가모델을 도출할 수 있다.Specifically, the new drug extraction unit 140 performs the new drug extraction step, and a specific drug to derive a new drug from the drug-disease vector of a plurality of irradiated drug groups derived from the drug-disease vector extraction unit 130 Based on the drug-disease vector of one or more investigational drugs known to be effective against diseases and the drug-disease vector of one or more investigational drugs that are not known to have previously been known to be effective for a specific disease to derive a new drug from the investigational drug group Thus, an evaluation model that can derive a new drug can be derived.

한편, 상기 약물-질병벡터도출단계는 각각의 조사약물에 대하여, 상기 특정 질병에 대한 1 이상의 질병유전자 각각에 대한 값을 포함하는 약물-질병벡터를 도출하고, 상기 신약도출단계는 상기 조사약물 중 1 이상을 제1집합으로 분류하고, 상기 조사약물 중 1 이상을 제2집합으로 분류하는 집합분류단계(S30); 및 상기 제1집합에 속하는 조사약물의 약물-질병벡터 및 상기 제2집합에 속하는 조사약물의 약물-질병벡터에 기초하여 평가모델을 도출하는 평가모델도출단계(S50);를 포함한다.Meanwhile, in the drug-disease vector derivation step, for each irradiated drug, a drug-disease vector including a value for each of one or more disease genes for the specific disease is derived, and the new drug derivation step is performed in the investigational drug. A group classification step (S30) of classifying one or more into a first set and classifying one or more of the irradiated drugs into a second set; And an evaluation model deriving step (S50) of deriving an evaluation model based on the drug-disease vector of the irradiated drug belonging to the first set and the drug-disease vector of the irradiated drug belonging to the second set.

구체적으로, 상기 집합분류단계(S30)는 1 이상의 조사약물에 대하여 도출한 약물-질병벡터에 기초하여 상기 조사약물을 기설정된 기준에 따라 분류한다. 상기 조사약물 각각의 약물-질병벡터 및 상기 조사약물에 포함된 특정 질병에 대하여 기존에 처방이 이루어지고 있는 기준약물의 약물-질병벡터에 기초하여 상기 제1집합 및 1 이상의 상기 제2집합으로 상기 1 이상의 조사약물을 분류한다.Specifically, the collective classification step (S30) classifies the irradiated drug according to a preset criterion based on the drug-disease vector derived for one or more irradiated drugs. Based on the drug-disease vector of each of the irradiated drugs and the drug-disease vector of the reference drug that has been prescribed for a specific disease contained in the irradiated drug, the first set and the second set of at least one are selected. Classify more than one investigational drug.

한편, 상기 집합분류단계(S30)에서 분류된 상기 제1집합 및 상기 제2집합에 기초하여 예비평가모델도출단계(S40)는 상기 평가모델로 도출될 수 있는 2 이상의 예비평가모델을 도출한다. 상기 예비평가모델은 상기 제1집합 및 1 이상의 상기 제2집합을 포함하며, 상기 제2집합은 복수로 분류되어 각각의 상기 제2집합 및 상기 제1집합을 포함하는 복수의 상기 예비평가모델을 도출한다.On the other hand, based on the first set and the second set classified in the set classification step S30, the preliminary evaluation model derivation step S40 derives two or more preliminary evaluation models that can be derived as the evaluation models. The preliminary evaluation model includes the first set and at least one second set, and the second set is classified into a plurality of the plurality of preliminary evaluation models including each of the second set and the first set. To derive.

상기 예비평가모델은 머신러닝(Machine Learning)을 통해 도출되며, 더 구체적으로는 랜덤포레스트(Random Forest) 또는 인공신경망(Neural Network) 알고리즘을 사용하여 도출된다.The preliminary evaluation model is derived through machine learning, and more specifically, derived using a random forest or artificial neural network algorithm.

마지막으로, 상기 평가모듈도출단계(S50)는 상기 예비평가모델도출단계에서 도출된 복수의 상기 예비평가모델을 비교하여 성능이 가장 우수한 1 개의 평가모델을 도출한다. 각각의 상기 예비평가모델은 K-폴드 교차검증(K-Fold Cross Validation)을 수행하며 이를 통해 상기 예비평가모델의 정확도를 향상시킬 수 있다. Finally, the evaluation module derivation step (S50) compares the plurality of preliminary evaluation models derived in the preliminary evaluation model derivation step to derive one evaluation model with the best performance. Each of the preliminary evaluation models performs K-Fold Cross Validation, and through this, the accuracy of the preliminary evaluation model can be improved.

한편, 상기 평가모델도출단계(S50)는, 복수의 상기 제2집합을 이용하여 2 이상의 예비평가모델을 도출하고, 상기 예비평가모델의 평가값에 기초하여 상기 평가모델을 도출한다.Meanwhile, in the evaluation model derivation step (S50), two or more preliminary evaluation models are derived using the plurality of second sets, and the evaluation model is derived based on the evaluation values of the preliminary evaluation models.

더 구체적으로는 상기 평가값은 해당 예비평가모델의 수신자 조작 특성(Receiver Operating Characteristic, ROC) 그래프의 아래부분의 면적(The Area Under the ROC Curve, AUC)값을 포함할 수 있다. 따라서 각각의 예비평가모델의 AUC 값을 비교하여 가장 높은 AUC값을 포함하는 예비평가모델을 최종적인 평가모델로 도출할 수 있게 된다.More specifically, the evaluation value may include the area under the ROC curve (AUC) value of the receiver operating characteristic (ROC) graph of the preliminary evaluation model. Therefore, by comparing the AUC values of each preliminary evaluation model, the preliminary evaluation model including the highest AUC value can be derived as the final evaluation model.

도 9는 본 발명의 일 실시예에 따른 조사약물군에서 도출되는 제1집합 및 제2집합을 개략적으로 도시한 도면이다.9 is a diagram schematically showing a first set and a second set derived from a group of irradiated drugs according to an embodiment of the present invention.

도 9에 도시된 상기 제1집합(a)은 상기 조사약물 중 상기 특정 질병에 대해 효능이 있다고 알려진 기준약물 중 1 이상을 포함하고, 상기 제2집합은 상기 조사약물 중 상기 특정 질병에 대해 효능이 있다고 알려지지 않은 약물 중 1 이상을 포함한다.The first set (a) shown in FIG. 9 includes one or more of the reference drugs known to be effective against the specific disease among the irradiated drugs, and the second set is effective against the specific disease among the irradiated drugs. Contains one or more of the drugs not known to have.

구체적으로, 상기 제1집합(a)은 상기 약물정보수신부(120)에서 수신한 신약을 도출하고자 하는 특정 질병에 대해 기존에 처방되고 있는 1 이상의 기준약물의 약물-질병벡터를 포함한다. 상기 기준약물은 조사약물군에 포함될 수 있으며, 복수의 상기 제2집합은 특정 질병에 대해 기존에 처방되고 있지 않는 1 이상의 조사약물을 포함한다.Specifically, the first set (a) includes a drug-disease vector of one or more reference drugs that are previously prescribed for a specific disease to derive a new drug received by the drug information receiving unit 120. The reference drug may be included in the irradiation drug group, and the plurality of second sets include one or more irradiation drugs that are not previously prescribed for a specific disease.

상기 제1집합 및 상기 제2집합으로 분류하는 과정에 있어서, 사용자에 의해 기준약물의 정보를 별도로 수신하여 상기 기준약물에 대한 약물-질병벡터를 분류하거나, 혹은 사용자가 기준약물을 별도로 구분하지 않고, 1 이상의 조사약물에 대한 정보를 수신하는 경우에는 상기 메모리부(400)에 포함된 상기 판별기준설정부(450)에 의해 특정 질병에 대해 처방되고 있는 조사약물을 별도로 기준약물로 판단하여 상기 제1집합으로 분류할 수도 있다.In the process of classifying into the first set and the second set, the user separately receives information on the reference drug and classifies the drug-disease vector for the reference drug, or the user does not separately classify the reference drug. , In the case of receiving information on one or more irradiated drugs, the irradiation drug prescribed for a specific disease by the determination criterion setting unit 450 included in the memory unit 400 is separately determined as a reference drug and the It can also be classified as a set.

한편, 상기 제1집합(a) 및 각각의 상기 제2집합을 포함하여 1 이상의 예비평가모델이 도출된다. 예를 들어, 상기 제1집합(a) 및 제2집합(b)를 포함하는 제1예비평가모델, 상기 제1집합(a) 및 제2집합(c)를 포함하는 제2예비평가모델, 상기 제1집합(a) 및 제2집합(d)를 포함하는 제3예비평가모델 및 상기 제1집합(a) 및 제2집합(e)를 포함하는 제4예비평가모델이 도출될 수 있으며, 각각의 예비평가모델은 도 8에서 전술한 머신러닝을 통해 도출될 수 있다.On the other hand, one or more preliminary evaluation models including the first set (a) and each of the second sets are derived. For example, a first preliminary evaluation model including the first set (a) and the second set (b), a second preliminary evaluation model including the first set (a) and the second set (c), A third preliminary evaluation model including the first set (a) and the second set (d) and a fourth preliminary evaluation model including the first set (a) and the second set (e) can be derived, and , Each preliminary evaluation model may be derived through the machine learning described above in FIG. 8.

또한, 각각의 상기 제2집합에 포함되는 조사약물의 개수는 상기 제1집합에 포함되는 기준약물의 개수보다 크도록 설정될 수 있다. 기본적으로 단일 제2집합에 포함되는 조사약물의 개수는 상기 제1집합에 포함되는 기준약물의 개수보다 3배 많도록 분류되며, 상기 판별기준설정부(450)에 의해 상기 제1집합 및 상기 제2집합에 포함되는 약물의 규모가 결정될 수도 있다.In addition, the number of irradiation drugs included in each of the second set may be set to be greater than the number of reference drugs included in the first set. Basically, the number of irradiated drugs included in a single second set is classified to be three times greater than the number of reference drugs included in the first set, and the first set and the first set by the determination criterion setting unit 450 The size of the drugs included in the two sets may be determined.

도 10은 본 발명의 일 실시예에 있어서, 통합 네트워크 기반의 약물-질병벡터를 이용한 신약 재창출 장치의 내부 구성의 일례를 설명하기 위한 블록도이다.10 is a block diagram illustrating an example of an internal configuration of a new drug re-creation device using an integrated network-based drug-disease vector according to an embodiment of the present invention.

도 10에 도시한 바와 같이, 컴퓨팅 장치(11000)은 적어도 하나의 프로세서(processor)(11100), 메모리(memory)(11200), 주변장치 인터페이스(peripheral interface)(11300), 입/출력 서브시스템(I/Osubsystem)(11400), 전력 회로(11500) 및 통신 회로(11600)를 적어도 포함할 수 있다. 이때, 컴퓨팅 장치(11000)은 사용자단말기 혹은 환전서비스제공시스템에 해당될 수 있다.As shown in FIG. 10, the computing device 11000 includes at least one processor 11100, a memory 11200, a peripheral interface 11300, and an input/output subsystem ( I/Osubsystem) 11400, a power circuit 11500, and a communication circuit 11600 may be included at least. In this case, the computing device 11000 may correspond to a user terminal or a system for providing a currency exchange service.

메모리(11200)는, 일례로 고속 랜덤 액세스 메모리(high-speed random access memory), 자기 디스크, 에스램(SRAM), 디램(DRAM), 롬(ROM), 플래시 메모리 또는 비휘발성 메모리를 포함할 수 있다. 메모리(11200)는 컴퓨팅 장치(11000)의 동작에 필요한 소프트웨어 모듈, 명령어 집합 또는 그밖에 다양한 데이터를 포함할 수 있다.The memory 11200 may include, for example, high-speed random access memory, magnetic disk, SRAM, DRAM, ROM, flash memory, or nonvolatile memory. have. The memory 11200 may include a software module, an instruction set, or other various data necessary for the operation of the computing device 11000.

이때, 프로세서(11100)나 주변장치 인터페이스(11300) 등의 다른 컴포넌트에서 메모리(11200)에 액세스하는 것은 프로세서(11100)에 의해 제어될 수 있다.In this case, accessing the memory 11200 from another component such as the processor 11100 or the peripheral device interface 11300 may be controlled by the processor 11100.

주변장치 인터페이스(11300)는 컴퓨팅 장치(11000)의 입력 및/또는 출력 주변장치를 프로세서(11100) 및 메모리 (11200)에 결합시킬 수 있다. 프로세서(11100)는 메모리(11200)에 저장된 소프트웨어 모듈 또는 명령어 집합을 실행하여 컴퓨팅 장치(11000)을 위한 다양한 기능을 수행하고 데이터를 처리할 수 있다.The peripheral device interface 11300 may couple input and/or output peripheral devices of the computing device 11000 to the processor 11100 and the memory 11200. The processor 11100 may execute various functions for the computing device 11000 and process data by executing a software module or instruction set stored in the memory 11200.

입/출력 서브시스템(11400)은 다양한 입/출력 주변장치들을 주변장치 인터페이스(11300)에 결합시킬 수 있다. 예를 들어, 입/출력 서브시스템(11400)은 모니터나 키보드, 마우스, 프린터 또는 필요에 따라 터치스크린이나 센서 등의 주변장치를 주변장치 인터페이스(11300)에 결합시키기 위한 컨트롤러를 포함할 수 있다. 다른 측면에 따르면, 입/출력 주변장치들은 입/출력 서브시스템(11400)을 거치지 않고 주변장치 인터페이스(11300)에 결합될 수도 있다.The input/output subsystem 11400 may couple various input/output peripherals to the peripherals interface 11300. For example, the input/output subsystem 11400 may include a monitor, a keyboard, a mouse, a printer, or a controller for coupling a peripheral device such as a touch screen or a sensor to the peripheral device interface 11300 as needed. According to another aspect, the input/output peripheral devices may be coupled to the peripheral device interface 11300 without going through the input/output subsystem 11400.

전력 회로(11500)는 단말기의 컴포넌트의 전부 또는 일부로 전력을 공급할 수 있다. 예를 들어 전력 회로(11500)는 전력 관리 시스템, 배터리나 교류(AC) 등과 같은 하나 이상의 전원, 충전 시스템, 전력 실패 감지 회로(power failure detection circuit), 전력 변환기나 인버터, 전력 상태 표시자 또는 전력 생성, 관리, 분배를 위한 임의의 다른 컴포넌트들을 포함할 수 있다.The power circuit 11500 may supply power to all or part of the components of the terminal. For example, the power circuit 11500 may include a power management system, one or more power sources such as batteries or alternating current (AC), a charging system, a power failure detection circuit, a power converter or inverter, a power status indicator or power. It may contain any other components for creation, management, and distribution.

통신 회로(11600)는 적어도 하나의 외부 포트를 이용하여 다른 컴퓨팅 장치와 통신을 가능하게 할 수 있다.The communication circuit 11600 may enable communication with another computing device using at least one external port.

또는 상술한 바와 같이 필요에 따라 통신 회로(11600)는 RF 회로를 포함하여 전자기 신호(electromagnetic signal)라고도 알려진 RF 신호를 송수신함으로써, 다른 컴퓨팅 장치와 통신을 가능하게 할 수도 있다.Alternatively, as described above, the communication circuit 11600 may enable communication with other computing devices by transmitting and receiving an RF signal, also known as an electromagnetic signal, including an RF circuit, if necessary.

이러한 도 10의 실시예는, 컴퓨팅 장치(11000)의 일례일 뿐이고, 컴퓨팅 장치(11000)은 도 10에 도시된 일부 컴포넌트가 생략되거나, 도 10에 도시되지 않은 추가의 컴포넌트를 더 구비하거나, 2개 이상의 컴포넌트를 결합시키는 구성 또는 배치를 가질 수 있다. 예를 들어, 모바일 환경의 통신 단말을 위한 컴퓨팅 장치는 도 10에 도시된 컴포넌트들 외에도, 터치스크린이나 센서 등을 더 포함할 수도 있으며, 통신 회로(1160)에 다양한 통신방식(WiFi, 3G, LTE, Bluetooth, NFC, Zigbee 등)의 RF 통신을 위한 회로가 포함될 수도 있다. 컴퓨팅 장치(11000)에 포함 가능한 컴포넌트들은 하나 이상의 신호 처리 또는 어플리케이션에 특화된 집적 회로를 포함하는 하드웨어, 소프트웨어, 또는 하드웨어 및 소프트웨어 양자의 조합으로 구현될 수 있다.The embodiment of FIG. 10 is only an example of the computing device 11000, and the computing device 11000 omits some of the components shown in FIG. 10, further includes additional components not shown in FIG. 10, or 2 It can have a configuration or arrangement that combines two or more components. For example, a computing device for a communication terminal in a mobile environment may further include a touch screen or a sensor, in addition to the components shown in FIG. 10, and various communication methods (WiFi, 3G, LTE) in the communication circuit 1160 , Bluetooth, NFC, Zigbee, etc.) may include a circuit for RF communication. Components that can be included in the computing device 11000 may be implemented as hardware, software, or a combination of hardware and software including one or more signal processing or application-specific integrated circuits.

본 발명의 실시예에 따른 방법들은 다양한 컴퓨팅 장치를 통하여 수행될 수 있는 프로그램 명령(instruction) 형태로 구현되어 컴퓨터 판독 가능 매체에 기록될 수 있다. 특히, 본 실시예에 따른 프로그램은 PC 기반의 프로그램 또는 모바일 단말 전용의 어플리케이션으로 구성될 수 있다. 본 발명이 적용되는 애플리케이션은 파일 배포 시스템이 제공하는 파일을 통해 이용자 단말에 설치될 수 있다. 일 예로, 파일 배포 시스템은 이용자 단말이기의 요청에 따라 상기 파일을 전송하는 파일 전송부(미도시)를 포함할 수 있다.Methods according to an embodiment of the present invention may be implemented in the form of program instructions that can be executed through various computing devices and recorded in a computer-readable medium. In particular, the program according to the present embodiment may be composed of a PC-based program or an application dedicated to a mobile terminal. An application to which the present invention is applied may be installed on a user terminal through a file provided by the file distribution system. For example, the file distribution system may include a file transmission unit (not shown) that transmits the file according to the request of the user terminal.

이상에서 설명된 장치는 하드웨어 구성요소, 소프트웨어 구성요소, 및/또는 하드웨어 구성요소 및 소프트웨어구성요소의 조합으로 구현될 수 있다. 예를 들어, 실시예들에서 설명된 장치 및 구성요소는, 예를 들어, 프로세서, 컨트롤러, ALU(arithmetic logic unit), 디지털 신호 프로세서(digital signal processor), 마이크로컴퓨터, FPGA(field programmable gate array), PLU(programmable logic unit), 마이크로프로세서, 또는 명령(instruction)을 실행하고 응답할 수 있는 다른 어떠한 장치와 같이, 하나 이상의 범용 컴퓨터 또는 특수 목적컴퓨터를 이용하여 구현될 수 있다. 처리 장치는 운영 체제(OS) 및 상기 운영 체제 상에서 수행되는 하나 이상의 소프트웨어 애플리케이션을 수행할 수 있다. 또한, 처리 장치는 소프트웨어의 실행에 응답하여, 데이터를 접근, 저장, 조작, 처리 및 생성할 수도 있다. 이해의 편의를 위하여, 처리 장치는 하나가 사용되는 것으로 설명된 경우도 있지만, 해당 기술분야에서 통상의 지식을 가진 자는, 처리 장치가 복수 개의 처리 요소(processing element) 및/또는 복수 유형의 처리 요소를 포함할 수 있음을 알 수 있다. 예를 들어, 처리 장치는 복수 개의 프로세서 또는 하나의 프로세서 및 하나의 컨트롤러를 포함할 수 있다. 또한, 병렬 프로세서(parallel processor)와 같은, 다른 처리 구성(processing configuration)도 가능하다.The apparatus described above may be implemented as a hardware component, a software component, and/or a combination of a hardware component and a software component. For example, the devices and components described in the embodiments are, for example, a processor, a controller, an arithmetic logic unit (ALU), a digital signal processor, a microcomputer, a field programmable gate array (FPGA). , A programmable logic unit (PLU), a microprocessor, or any other device capable of executing and responding to instructions, such as one or more general purpose computers or special purpose computers. The processing device may execute an operating system (OS) and one or more software applications executed on the operating system. In addition, the processing device may access, store, manipulate, process, and generate data in response to the execution of software. For the convenience of understanding, although it is sometimes described that one processing device is used, one of ordinary skill in the art, the processing device is a plurality of processing elements and/or a plurality of types of processing elements. It can be seen that it may include. For example, the processing device may include a plurality of processors or one processor and one controller. In addition, other processing configurations are possible, such as a parallel processor.

소프트웨어는 컴퓨터 프로그램(computer program), 코드(code), 명령(instruction), 또는 이들 중 하나 이상의 조합을 포함할 수 있으며, 원하는 대로 동작하도록 처리 장치를 구성하거나 독립적으로 또는 결합적으로 (collectively) 처리 장치를 명령할 수 있다. 소프트웨어 및/또는 데이터는, 처리 장치에 의하여 해석되거나 처리 장치에 명령 또는 데이터를 제공하기 위하여, 어떤 유형의 기계, 구성요소(component), 물리적 장치, 가상장치(virtual equipment), 컴퓨터 저장 매체 또는 장치, 또는 전송되는 신호 파(signal wave)에 영구적으로, 또는 일시적으로 구체화(embody)될 수 있다. 소프트웨어는 네트워크로 연결된 컴퓨팅 장치 상에 분산되어서, 분산된 방법으로 저장되거나 실행될 수도 있다. 소프트웨어 및 데이터는 하나 이상의 컴퓨터 판독 가능 기록 매체에 저장될 수 있다.The software may include a computer program, code, instructions, or a combination of one or more of these, configuring the processing unit to operate as desired or processed independently or collectively. You can command the device. Software and/or data may be interpreted by a processing device or to provide instructions or data to a processing device, of any type of machine, component, physical device, virtual equipment, computer storage medium or device. , Or may be permanently or temporarily embodyed in a transmitted signal wave. The software may be distributed over networked computing devices and stored or executed in a distributed manner. Software and data may be stored on one or more computer-readable recording media.

실시예에 따른 방법은 다양한 컴퓨터 수단을 통하여 수행될 수 있는 프로그램 명령 형태로 구현되어 컴퓨터 판독 가능 매체에 기록될 수 있다. 상기 컴퓨터 판독 가능 매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 상기 매체에 기록되는 프로그램 명령은 실시예를 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다. 컴퓨터 판독 가능 기록 매체의 예에는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(magnetic media), CD-ROM, DVD와 같은 광기록 매체(optical media), 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media), 및 롬(ROM), 램(RAM), 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다. 프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함한다. 상기된 하드웨어 장치는 실시예의 동작을 수행하기 위해 하나 이상의 소프트웨어 모듈로서 작동하도록 구성될 수 있으며, 그 역도 마찬가지이다.The method according to the embodiment may be implemented in the form of program instructions that can be executed through various computer means and recorded in a computer-readable medium. The computer-readable medium may include program instructions, data files, data structures, and the like alone or in combination. The program instructions recorded on the medium may be specially designed and configured for the embodiment, or may be known and usable to those skilled in computer software. Examples of computer-readable recording media include magnetic media such as hard disks, floppy disks, and magnetic tapes, optical media such as CD-ROMs and DVDs, and magnetic media such as floptical disks. -A hardware device specially configured to store and execute program instructions such as magneto-optical media, and ROM, RAM, flash memory, and the like. Examples of the program instructions include not only machine language codes such as those produced by a compiler, but also high-level language codes that can be executed by a computer using an interpreter or the like. The hardware device described above may be configured to operate as one or more software modules to perform the operation of the embodiment, and vice versa.

본 발명의 일 실시예에 따르면, 결합관계에 있는 유전자들을 네트워크에 적용하여 더욱 정확한 신약재창출 모델을 도출할 수 있는 효과를 발휘할 수 있다.According to an embodiment of the present invention, it is possible to exert an effect of deriving a more accurate new drug re-creation model by applying genes in a binding relationship to a network.

본 발명의 일 실시예에 따르면, 네트워크의 최단경로를 도출하고 최단경로를 기초로 벡터값을 도출하고, 기준약물과 비교하여 약물을 도출하는 모델을 생성하여, 더욱 정확한 약물을 도출할 수 있는 효과를 발휘할 수 있다.According to an embodiment of the present invention, by deriving the shortest route of the network, deriving a vector value based on the shortest route, and creating a model for deriving a drug by comparing it with a reference drug, it is possible to derive more accurate drugs. Can exert.

본 발명의 일 실시예에 따르면, 약물과 질병유전자에 이르는 네트워크를 생성하여 경로를 도출하므로 해당 약물이 질병유전자에 도달하는 메커니즘을 파악할 수 있는 효과를 발휘할 수 있다.According to an embodiment of the present invention, a network leading to a drug and a disease gene is generated to derive a pathway, so that the mechanism by which the drug reaches the disease gene may be identified.

본 발명의 일 실시예에 따르면, 도출된 약물을 도출하는 복수의 모델을 생성하고 복수의 모델을 비교하여 최종모델을 도출하고, 최종모델을 통해 도출된 약물에 대하여 검증하는 과정을 통해, 최종모델의 정확성을 향상시킬 수 있는 효과를 발휘할 수 있다.According to an embodiment of the present invention, a final model is generated through the process of generating a plurality of models for deriving the derived drug, comparing the plurality of models to derive a final model, and verifying the drug derived through the final model. It can exert an effect that can improve the accuracy of.

이상과 같이 실시예들이 비록 한정된 실시예와 도면에 의해 설명되었으나, 해당 기술분야에서 통상의 지식을 가진 자라면 상기의 기재로부터 다양한 수정 및 변형이 가능하다. 예를 들어, 설명된 기술들이 설명된 방법과 다른 순서로 수행되거나, 및/또는 설명된 시스템, 구조, 장치, 회로 등의 구성요소들이 설명된 방법과 다른 형태로 결합 또는 조합되거나, 다른 구성요소 또는 균등물에 의하여 대치되거나 치환되더라도 적절한 결과가 달성될 수 있다.As described above, although the embodiments have been described by the limited embodiments and drawings, various modifications and variations are possible from the above description by those of ordinary skill in the art. For example, the described techniques are performed in a different order from the described method, and/or components such as a system, structure, device, circuit, etc. described are combined or combined in a form different from the described method, or other components Alternatively, even if substituted or substituted by an equivalent, an appropriate result can be achieved.

그러므로, 다른 구현들, 다른 실시예들 및 특허청구범위와 균등한 것들도 후술하는 특허청구범위의 범위에 속한다.Therefore, other implementations, other embodiments, and claims and equivalents fall within the scope of the claims to be described later.

Claims (12)

컴퓨팅 장치로 구현되는, 약물-질병벡터를 이용하여 특정 질병에 대한 신약을 재창출 하는 방법으로서,
특정 질병에 대한 신약으로 재창출될 수 있는 2 이상의 조사약물에 대한 조사약물정보를 수신하는 약물정보수신단계;
유전자, 단백질 및 약물 중 2 이상에 대한 상호작용관계를 포함하는 상호작용데이터 및 상기 조사약물정보에 기초하여, 해당 조사약물 및 특정 질병에 대한 1 이상의 질병유전자 사이의 약물, 유전자, 및 단백질 중 1 이상을 노드로 포함하는 경로에서의 각각의 조사약물에 대한 약물-질병벡터를 도출하는 약물-질병벡터도출단계; 및
상기 조사약물의 상기 약물-질병벡터에 대한 정보에 기초하여 평가모델을 도출하고, 상기 평가모델에 기초하여 상기 조사약물 중에서 상기 특정 질병에 대한 신약을 도출하는 신약도출단계;를 포함하고,
상기 약물-질병벡터도출단계는 각각의 조사약물에 대하여, 상기 특정 질병에 대한 1 이상의 질병유전자 각각에 대한 값을 포함하는 약물-질병벡터를 도출하고,
상기 신약도출단계는 상기 조사약물 중 1 이상을 제1집합으로 분류하고, 상기 조사약물 중 1 이상을 제2집합으로 분류하는 집합분류단계; 및
상기 제1집합에 속하는 조사약물의 약물-질병벡터 및 상기 제2집합에 속하는 조사약물의 약물-질병벡터에 기초하여 평가모델을 도출하는 평가모델도출단계;를 포함하고,
상기 평가모델도출단계는,
복수의 상기 제2집합을 이용하여 2 이상의 예비평가모델을 도출하고, 상기 예비평가모델의 평가값에 기초하여 상기 평가모델을 도출하는, 약물-질병벡터를 이용하여 특정 질병에 대한 신약을 재창출 하는 방법.
A method of recreating a new drug for a specific disease using a drug-disease vector implemented as a computing device,
A drug information receiving step of receiving irradiated drug information for two or more irradiated drugs that can be recreated as new drugs for a specific disease;
One of drugs, genes, and proteins between the irradiated drug and one or more disease genes for a specific disease, based on the interaction data including the interaction relationship with two or more of genes, proteins, and drugs and the irradiated drug information. A drug-disease vector derivation step of deriving a drug-disease vector for each irradiated drug in the path including the above as a node; And
Including; a new drug extraction step of deriving an evaluation model based on the information on the drug-disease vector of the investigational drug, and deriving a new drug for the specific disease from the investigational drug based on the evaluation model, and
In the step of deriving the drug-disease vector, for each investigational drug, a drug-disease vector including a value for each of one or more disease genes for the specific disease is derived,
The new drug extraction step includes a group classification step of classifying at least one of the irradiated drugs into a first set and classifying at least one of the irradiated drugs into a second set; And
Including; an evaluation model derivation step of deriving an evaluation model based on the drug-disease vector of the irradiated drug belonging to the first set and the drug-disease vector of the irradiated drug belonging to the second set; and
The step of deriving the evaluation model,
Re-creating a new drug for a specific disease using a drug-disease vector, which derives two or more preliminary evaluation models using the plurality of second sets and derives the evaluation model based on the evaluation values of the preliminary evaluation model How to.
청구항 1에 있어서,
상기 약물-질병벡터를 이용하여 특정 질병에 대한 신약을 재창출 하는 방법은,
유전자, 단백질 및 약물 중 2 이상에 대한 상호작용관계를 포함하는 데이터를 상기 컴퓨팅 장치 또는 참조데이터베이스에서 로드하여 기설정된 관계기준에 기초하여 변환하는 상호작용데이터변환단계;를 더 포함하는, 약물-질병벡터를 이용하여 특정 질병에 대한 신약을 재창출 하는 방법.
The method according to claim 1,
The method of recreating a new drug for a specific disease using the drug-disease vector,
An interaction data conversion step of loading data including interaction relationships for two or more of genes, proteins, and drugs from the computing device or a reference database and converting them based on a preset relationship criterion; further comprising, drug-disease A method of recreating new drugs for specific diseases using vectors.
청구항 2에 있어서,
상기 상호작용데이터변환단계는 로드된 유전자, 단백질 및 약물 중 2 이상에 대한 상호작용관계를 포함하는 데이터에서, 상기 관계기준에 기초하여 유전자, 단백질 및 약물 중 2 개의 관계를 양성타입, 음성타입 및 중립타입 중 하나로 변환하여 변환상호작용데이터로 도출하고,
상기 약물-질병벡터도출단계는 상기 변환상호작용데이터를 이용하는, 약물-질병벡터를 이용하여 특정 질병에 대한 신약을 재창출 하는 방법.
The method according to claim 2,
In the interaction data conversion step, in the data including the interaction relationship with two or more of the loaded genes, proteins, and drugs, based on the relationship criteria, two relationships among genes, proteins, and drugs are positive type, negative type and Convert it to one of the neutral types and derive transformed interaction data,
The drug-disease vector derivation step is a method of re-creating a new drug for a specific disease using the drug-disease vector using the transformation interaction data.
청구항 1에 있어서,
상기 약물-질병벡터도출단계는,
상기 조사약물정보 및 상기 상호작용데이터에 기초하여 상기 조사약물 및 상기 질병유전자 사이의 기초경로를 도출하는 기초경로도출단계;
상기 기초경로에 기초하여 상기 조사약물 및 상기 질병유전자 사이의 최단경로를 도출하고, 상기 최단경로에 기초하여 상기 약물-질병벡터를 도출하는 최단경로계산단계;를 포함하는, 약물-질병벡터를 이용하여 특정 질병에 대한 신약을 재창출 하는 방법.
The method according to claim 1,
The drug-disease vector extraction step,
A basic path derivation step of deriving a basic path between the irradiated drug and the disease gene based on the irradiated drug information and the interaction data;
Using a drug-disease vector comprising; a shortest path calculation step of deriving the shortest path between the irradiated drug and the disease gene based on the basic path, and deriving the drug-disease vector based on the shortest path. To reinvent a new drug for a specific disease.
청구항 4에 있어서,
상기 최단경로는,
상기 최단경로에 노드로 포함된 1 이상의 약물, 유전자, 및 단백질의 상호관계가 적어도 하나의 양성타입 또는 음성타입을 포함하고,
상기 상호작용데이터는 약물, 유전자, 및 단백질 중 2 이상의 상호관계로, 상기 양성타입, 상기 음성타입 및 중립타입을 포함하고,
상기 중립타입은 약물, 유전자, 및 단백질 중 2 이상이 결합관계인 경우를 포함하는, 약물-질병벡터를 이용하여 특정 질병에 대한 신약을 재창출 하는 방법.
The method of claim 4,
The shortest path is,
The correlation between one or more drugs, genes, and proteins included as nodes in the shortest path includes at least one positive type or negative type,
The interaction data includes two or more interactions among drugs, genes, and proteins, and includes the positive type, the negative type, and the neutral type,
The neutral type is a method for recreating a new drug for a specific disease using a drug-disease vector, including a case in which two or more of a drug, a gene, and a protein have a binding relationship.
청구항 5에 있어서,
상기 최단경로는 1 이상의 노드를 포함하고,
상기 최단경로계산단계는 상기 최단경로에 포함된 각각의 노드에 연결된 노드의 개수 및 각각의 노드에 인접한 노드와의 상호관계 타입에 기초하여 상기 약물-질병벡터를 도출하는, 약물-질병벡터를 이용하여 특정 질병에 대한 신약을 재창출 하는 방법.
The method of claim 5,
The shortest path includes one or more nodes,
The shortest path calculation step uses a drug-disease vector to derive the drug-disease vector based on the number of nodes connected to each node included in the shortest path and a correlation type with nodes adjacent to each node. To reinvent a new drug for a specific disease.
청구항 1에 있어서,
상기 신약도출단계는 상기 조사약물 중 상기 특정 질병에 대해 효능이 있다고 알려진 기준약물의 상기 약물-질병벡터에 대한 정보 및 상기 조사약물 중 상기 특정 질병에 대해 효능이 있다고 알려지지 않은 약물의 상기 약물-질병벡터에 기초하여 평가모델을 도출하는, 약물-질병벡터를 이용하여 특정 질병에 대한 신약을 재창출 하는 방법.
The method according to claim 1,
The new drug extraction step includes information on the drug-disease vector of a reference drug known to be effective against the specific disease among the irradiated drugs, and the drug-disease of a drug that is not known to be effective against the specific disease among the irradiated drugs. A method of re-creating a new drug for a specific disease using a drug-disease vector that derives an evaluation model based on a vector.
삭제delete 청구항 1에 있어서,
상기 제1집합은 상기 조사약물 중 상기 특정 질병에 대해 효능이 있다고 알려진 기준약물 중 1 이상을 포함하고,
상기 제2집합은 상기 조사약물 중 상기 특정 질병에 대해 효능이 있다고 알려지지 않은 약물 중 1 이상을 포함하는, 약물-질병벡터를 이용하여 특정 질병에 대한 신약을 재창출 하는 방법.
The method according to claim 1,
The first set includes one or more of the reference drugs known to be effective against the specific disease among the investigational drugs,
The second set includes one or more of the drugs that are not known to be effective against the specific disease among the investigational drugs, a drug-disease vector to recreate a new drug for a specific disease.
삭제delete 1 이상의 메모리 및 1 이상의 프로세서를 포함하는 약물-질병벡터를 이용하여 특정 질병에 대한 신약을 재창출 하는 장치로서,
특정 질병에 대한 신약으로 재창출될 수 있는 2 이상의 조사약물에 대한 조사약물정보를 수신하는 약물정보수신부;
유전자, 단백질 및 약물 중 2 이상에 대한 상호작용관계를 포함하는 상호작용데이터 및 상기 조사약물정보에 기초하여, 해당 조사약물 및 특정 질병에 대한 1 이상의 질병유전자 사이의 약물, 유전자, 및 단백질 중 1 이상을 노드로 포함하는 경로에서의 각각의 조사약물에 대한 약물-질병벡터를 도출하는 약물-질병벡터도출부; 및
상기 조사약물의 상기 약물-질병벡터에 대한 정보에 기초하여 평가모델을 도출하고, 상기 평가모델에 기초하여 상기 조사약물 중에서 상기 특정 질병에 대한 신약을 도출하는 신약도출부;를 포함하고,
상기 약물-질병벡터도출부는 각각의 조사약물에 대하여, 상기 특정 질병에 대한 1 이상의 질병유전자 각각에 대한 값을 포함하는 약물-질병벡터를 도출하고,
상기 신약도출부는 상기 조사약물 중 1 이상을 제1집합으로 분류하고, 상기 조사약물 중 1 이상을 제2집합으로 분류하는 집합분류부; 및
상기 제1집합에 속하는 조사약물의 약물-질병벡터 및 상기 제2집합에 속하는 조사약물의 약물-질병벡터에 기초하여 평가모델을 도출하는 평가모델도출부;를 포함하고,
상기 평가모델도출부는,
복수의 상기 제2집합을 이용하여 2 이상의 예비평가모델을 도출하고, 상기 예비평가모델의 평가값에 기초하여 상기 평가모델을 도출하는, 약물-질병벡터를 이용하여 특정 질병에 대한 신약을 재창출 하는 장치.
A device for re-creating a new drug for a specific disease using a drug-disease vector including at least one memory and at least one processor,
A drug information receiver for receiving information on irradiated drugs for two or more irradiated drugs that can be recreated as new drugs for a specific disease;
One of drugs, genes, and proteins between the irradiated drug and one or more disease genes for a specific disease, based on the interaction data including the interaction relationship with two or more of genes, proteins, and drugs and the irradiated drug information. A drug-disease vector extraction unit for deriving a drug-disease vector for each irradiated drug in the path including the above as a node; And
Including; a new drug extraction unit for deriving an evaluation model based on the information on the drug-disease vector of the investigational drug and for deriving a new drug for the specific disease from the investigational drug based on the evaluation model, and
The drug-disease vector derivation unit derives a drug-disease vector including a value for each of one or more disease genes for the specific disease, for each investigational drug,
The new drug extraction unit classifying unit for classifying at least one of the irradiated drugs into a first set, and classifying at least one of the irradiated drugs into a second set; And
Including; an evaluation model derivation unit for deriving an evaluation model based on the drug-disease vector of the irradiated drug belonging to the first set and the drug-disease vector of the irradiated drug belonging to the second set; and
The evaluation model extraction unit,
Re-creating a new drug for a specific disease using a drug-disease vector, which derives two or more preliminary evaluation models using the plurality of second sets and derives the evaluation model based on the evaluation values of the preliminary evaluation model Device.
컴퓨터-판독가능 기록매체로서,
상기 컴퓨터-판독가능 기록매체는, 컴퓨팅 장치로 하여금 이하의 단계들을 수행하도록 하는 명령들을 저장하며, 상기 단계들은;
특정 질병에 대한 신약으로 재창출될 수 있는 2 이상의 조사약물에 대한 조사약물정보를 수신하는 약물정보수신단계;
유전자, 단백질 및 약물 중 2 이상에 대한 상호작용관계를 포함하는 상호작용데이터 및 상기 조사약물정보에 기초하여, 해당 조사약물 및 특정 질병에 대한 1 이상의 질병유전자 사이의 약물, 유전자, 및 단백질 중 1 이상을 노드로 포함하는 경로에서의 각각의 조사약물에 대한 약물-질병벡터를 도출하는 약물-질병벡터도출단계; 및
상기 조사약물의 상기 약물-질병벡터에 대한 정보에 기초하여 평가모델을 도출하고, 상기 평가모델에 기초하여 상기 조사약물 중에서 상기 특정 질병에 대한 신약을 도출하는 신약도출단계;를 포함하고
상기 약물-질병벡터도출단계는 각각의 조사약물에 대하여, 상기 특정 질병에 대한 1 이상의 질병유전자 각각에 대한 값을 포함하는 약물-질병벡터를 도출하고,
상기 신약도출단계는 상기 조사약물 중 1 이상을 제1집합으로 분류하고, 상기 조사약물 중 1 이상을 제2집합으로 분류하는 집합분류단계; 및
상기 제1집합에 속하는 조사약물의 약물-질병벡터 및 상기 제2집합에 속하는 조사약물의 약물-질병벡터에 기초하여 평가모델을 도출하는 평가모델도출단계;를 포함하고,
상기 평가모델도출단계는,
복수의 상기 제2집합을 이용하여 2 이상의 예비평가모델을 도출하고, 상기 예비평가모델의 평가값에 기초하여 상기 평가모델을 도출하는, 컴퓨터-판독가능 기록매체.
As a computer-readable recording medium,
The computer-readable recording medium stores instructions for causing a computing device to perform the following steps, the steps comprising;
A drug information receiving step of receiving irradiated drug information for two or more irradiated drugs that can be recreated as new drugs for a specific disease;
One of drugs, genes, and proteins between the irradiated drug and one or more disease genes for a specific disease, based on the interaction data including the interaction relationship with two or more of genes, proteins, and drugs and the irradiated drug information. A drug-disease vector derivation step of deriving a drug-disease vector for each irradiated drug in the path including the above as a node; And
And a new drug extraction step of deriving an evaluation model based on the information on the drug-disease vector of the investigational drug, and deriving a new drug for the specific disease from the investigational drugs based on the evaluation model.
In the step of deriving the drug-disease vector, for each investigational drug, a drug-disease vector including a value for each of one or more disease genes for the specific disease is derived,
The new drug extraction step includes a group classification step of classifying at least one of the irradiated drugs into a first set and classifying at least one of the irradiated drugs into a second set; And
Including; an evaluation model derivation step of deriving an evaluation model based on the drug-disease vector of the irradiated drug belonging to the first set and the drug-disease vector of the irradiated drug belonging to the second set; and
The step of deriving the evaluation model,
A computer-readable recording medium for deriving two or more preliminary evaluation models using the plurality of second sets, and deriving the evaluation models based on evaluation values of the preliminary evaluation models.
KR1020190013221A 2019-02-01 2019-02-01 Method, Device and Computer-Readable Medium for Drug Repositioning Using Drug-Disease Vectors Based On an Integrated Network KR102174764B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020190013221A KR102174764B1 (en) 2019-02-01 2019-02-01 Method, Device and Computer-Readable Medium for Drug Repositioning Using Drug-Disease Vectors Based On an Integrated Network

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020190013221A KR102174764B1 (en) 2019-02-01 2019-02-01 Method, Device and Computer-Readable Medium for Drug Repositioning Using Drug-Disease Vectors Based On an Integrated Network

Publications (2)

Publication Number Publication Date
KR20200095653A KR20200095653A (en) 2020-08-11
KR102174764B1 true KR102174764B1 (en) 2020-11-05

Family

ID=72048376

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020190013221A KR102174764B1 (en) 2019-02-01 2019-02-01 Method, Device and Computer-Readable Medium for Drug Repositioning Using Drug-Disease Vectors Based On an Integrated Network

Country Status (1)

Country Link
KR (1) KR102174764B1 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112927765B (en) * 2021-03-29 2022-02-22 天士力国际基因网络药物创新中心有限公司 Method for repositioning medicine

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100692319B1 (en) * 2006-02-20 2007-03-12 한국생명공학연구원 The finding method of new disease-associated genes through analysis of protein-protein interaction network
US20160140327A1 (en) * 2014-11-14 2016-05-19 International Business Machines Corporation Generating drug repositioning hypotheses based on integrating multiple aspects of drug similarity and disease similarity

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101776094B1 (en) * 2015-02-10 2017-09-07 가천대학교 산학협력단 Apparatus and method for assessing effects of drugs based on networks
KR101878924B1 (en) 2016-06-14 2018-07-17 재단법인 전통천연물기반 유전자동의보감 사업단 Method for predicting drugs having opposite effects on disease genes in a directed network and apparatus thereof

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100692319B1 (en) * 2006-02-20 2007-03-12 한국생명공학연구원 The finding method of new disease-associated genes through analysis of protein-protein interaction network
US20160140327A1 (en) * 2014-11-14 2016-05-19 International Business Machines Corporation Generating drug repositioning hypotheses based on integrating multiple aspects of drug similarity and disease similarity

Also Published As

Publication number Publication date
KR20200095653A (en) 2020-08-11

Similar Documents

Publication Publication Date Title
AU2017202808B2 (en) Paradigm drug response networks
JP6356359B2 (en) Ensemble-based research and recommendation system and method
US20200027539A1 (en) Systems and Methods for Predicting Medications to Prescribe to a Patient Based on Machine Learning
KR101964694B1 (en) Device, Method, and Computer-Readable Medium for Judging Drug Similarity
US10943701B2 (en) Three-dimensional modeling of patient-specific tumors using a lattice of elastic-material points to simulate metabolism, biochemical reactions, mechanical forces, and drug interactions in a patient
Benatia et al. Sparse matrix partitioning for optimizing SpMV on CPU-GPU heterogeneous platforms
Teijeiro et al. Towards cloud-based parallel metaheuristics: a case study in computational biology with differential evolution and spark
Kaur et al. An efficient resource prediction–based scheduling technique for scientific applications in cloud environment
Zhang et al. Splitting large medical data sets based on normal distribution in cloud environment
Deng et al. An effective co-evolutionary quantum genetic algorithm for the no-wait flow shop scheduling problem
US20160259887A1 (en) Knowledge Based Factorized High Order Sparse Learning Models
KR102174764B1 (en) Method, Device and Computer-Readable Medium for Drug Repositioning Using Drug-Disease Vectors Based On an Integrated Network
Allehaibi et al. iTAGPred: A Two‐Level Prediction Model for Identification of Angiogenesis and Tumor Angiogenesis Biomarkers
Su et al. Detection of pulmonary embolism severity using clinical characteristics, hematological indices, and machine learning techniques
KR102321732B1 (en) Device, Method, and Computer-Readable Medium for Predicting Change in Efficacy of a Drug Considering SNP
KR102530114B1 (en) Method, System, and Computer-Readable Medium for Predicting Side Effects of Drugs based on Similarity Measurement
Tahmassebi et al. The driving regulators of the connectivity protein network of brain malignancies
Kulkarni et al. Gene regulatory network modeling using literature curated and high throughput data
Brace et al. Stream-ai-md: Streaming ai-driven adaptive molecular simulations for heterogeneous computing platforms
Bahra et al. Parameterizing neural networks for disease classification
Tian et al. Accurate admet prediction with xgboost
Motai et al. Cloud colonography: distributed medical testbed over cloud
Ouzounoglou et al. A study on the predictability of acute lymphoblastic leukaemia response to treatment using a hybrid oncosimulator
KR20210021768A (en) Device, method and computer program
US20240020523A1 (en) Ordering infrastructure using application terms

Legal Events

Date Code Title Description
E701 Decision to grant or registration of patent right