KR102482818B1 - Method for personalized prevention of adverse drug reaction of osteoporosis medication based on information of individual deleterious protein sequence variation - Google Patents

Method for personalized prevention of adverse drug reaction of osteoporosis medication based on information of individual deleterious protein sequence variation Download PDF

Info

Publication number
KR102482818B1
KR102482818B1 KR1020160018786A KR20160018786A KR102482818B1 KR 102482818 B1 KR102482818 B1 KR 102482818B1 KR 1020160018786 A KR1020160018786 A KR 1020160018786A KR 20160018786 A KR20160018786 A KR 20160018786A KR 102482818 B1 KR102482818 B1 KR 102482818B1
Authority
KR
South Korea
Prior art keywords
drug
score
individual
protein
mean
Prior art date
Application number
KR1020160018786A
Other languages
Korean (ko)
Other versions
KR20160101707A (en
Inventor
김주한
Original Assignee
싸이퍼롬, 인코퍼레이티드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 싸이퍼롬, 인코퍼레이티드 filed Critical 싸이퍼롬, 인코퍼레이티드
Publication of KR20160101707A publication Critical patent/KR20160101707A/en
Application granted granted Critical
Publication of KR102482818B1 publication Critical patent/KR102482818B1/en

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/20Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K31/00Medicinal preparations containing organic active ingredients
    • A61K31/66Phosphorus compounds
    • A61K31/662Phosphorus acids or esters thereof having P—C bonds, e.g. foscarnet, trichlorfon
    • A61K31/663Compounds having two or more phosphorus acid groups or esters thereof, e.g. clodronic acid, pamidronic acid
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K39/395Antibodies; Immunoglobulins; Immune serum, e.g. antilymphocytic serum
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B50/00ICT programming tools or database systems specially adapted for bioinformatics
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Evolutionary Biology (AREA)
  • Biotechnology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Biophysics (AREA)
  • Chemical & Material Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Bioethics (AREA)
  • Genetics & Genomics (AREA)
  • Databases & Information Systems (AREA)
  • Molecular Biology (AREA)
  • Medicinal Chemistry (AREA)
  • Animal Behavior & Ethology (AREA)
  • Public Health (AREA)
  • Epidemiology (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Veterinary Medicine (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Mycology (AREA)
  • Immunology (AREA)
  • Microbiology (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
  • Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)

Abstract

본 발명은 개인 유전체 염기서열 분석을 이용한, 개인별 단백질 손상 정보 기반의 골다공증 치료제 선택 방법 및 시스템에 관한 것으로, 본 발명에 따른 방법 및 시스템은 골다공증 치료제의 약력학 또는 약동학에 관여하는 다양한 단백질을 코딩하는 유전자 엑손 영역의 서열 분석을 통하여 개인별로 특정 약물, 즉 골다공증 치료제에 대한 부작용 또는 위험성을 예측할 수 있는 기술로서 신뢰도가 높을 뿐 아니라, 적용범위 또한 넓은 범용적 기술이다. The present invention relates to a method and system for selecting a therapeutic agent for osteoporosis based on individual protein damage information using personal genome sequencing. As a technology that can predict the side effects or risks of a specific drug, that is, osteoporosis treatment, for each individual through sequence analysis of the exon region, it is highly reliable and is also a general-purpose technology with a wide range of applications.

Description

골다공증 치료제 부작용 방지를 위한 개인별 단백질 손상 정보 기반의 골다공증 치료제 선택 방법 {Method for personalized prevention of adverse drug reaction of osteoporosis medication based on information of individual deleterious protein sequence variation}Method for personalized prevention of adverse drug reaction of osteoporosis medication based on information of individual deleterious protein sequence variation}

본 발명은 골다공증 치료제 부작용 방지를 위한 개인 유전체 염기서열 분석을 이용한, 개인별 단백질 손상 정보 기반의 골다공증 치료제 선택 방법에 관한 것이다. The present invention relates to a method for selecting an osteoporosis drug based on individual protein damage information using personal genome sequencing to prevent side effects of the osteoporosis drug.

생명공학 기술의 발전으로 인해 현재는 인간의 전 유전체 염기서열(whole genome sequence)을 분석하여 개개인의 질병을 예측하고 맞춤형 질병 예방 및 치료를 제공하는 단계까지 도달하였다.Due to the development of bioengineering technology, we have now reached the stage of predicting individual diseases by analyzing the whole genome sequence of humans and providing customized disease prevention and treatment.

최근에는 개인 유전체 염기서열을 비교한 결과, 염색체의 동일한 위치에 서로 다른 염기가 존재한다는 사실이 밝혀짐에 따라 이러한 염기서열의 차이를 의약품에 대한 개인 간 반응차이를 예측하는 데 이용하게 되었다. 예를 들어, 한 개인이 갖는 특정 유전체 염기서열 정보에 따라 약물대사가 느리거나 빠르기 때문에 약물에 대한 효과 및 부작용이 개인마다 다를 수 있다.Recently, as a result of comparing individual genome sequences, it has been found that different bases exist at the same location on the chromosome, and these differences in base sequences have been used to predict differences in individual responses to drugs. For example, since drug metabolism is slow or fast depending on specific genome sequence information possessed by an individual, effects and side effects of drugs may vary from person to person.

따라서 개인별 유전체 염기서열 차이를 이용하여 환자에 알맞은 약물과 용량을 선택할 수 있는 개인별 맞춤형 약물 선택에 대한 사회적 요구가 증가하고 있으며, 단일염기다형성(Single Nucleotide Polymorphism, SNP) 등의 유전체 정보를 마커로 활용하고, 해당 마커와 약물 반응성/약물 부작용 등의 상관관계에 대한 연구결과를 활용한 약물유전학 혹은 약물유전체학이 부상하고 있다. Therefore, there is an increasing social demand for personalized drug selection that can select drugs and doses suitable for patients using individual genome nucleotide sequence differences, and genomic information such as Single Nucleotide Polymorphism (SNP) is used as a marker. And pharmacogenomics or pharmacogenomics using the research results on the correlation between the marker and drug responsiveness/drug side effects are emerging.

약물유전학(pharmacogenetics)에서는 일반 인구집단이나 개인에서 약물이나 화학물질의 대사와 반응 차이를 유전학적으로 분석하여 예측한다. 일부 개인에서 약물에 대해 예상했던 약물반응 이외의 반응이 나타나기도 하는데 이러한 약물 부작용은 치료하는 질환의 중증도, 약물상호작용, 환자의 나이, 영양상태, 간 및 신장 기능, 기후나 음식물과 같은 환경적 요인에 기인하기도 하지만, 약물대사에 관련된 유전적 차이, 예를 들면, 약물 효소 유전자의 다형성(polymorphism)이 영향을 미치기도 하기 때문에 이와 관련된 연구가 진행되고 있다. In pharmacogenetics, the metabolism and response of drugs or chemicals in the general population or individuals is genetically analyzed and predicted. Some individuals may experience reactions other than the expected drug reactions to the drug. These drug side effects may be related to the severity of the disease being treated, drug interactions, patient's age, nutritional status, liver and kidney function, and environmental factors such as climate or food. Although it is caused by factors, genetic differences related to drug metabolism, for example, polymorphism of drug enzyme genes also have an effect, so related studies are being conducted.

한편, 골다공증 치료제의 일종인 항골흡수제는 골 대사에 영향을 미치는 약물로, 파골세포를 억제함으로써 골밀도를 유지시켜주는 약물이다. 항 골흡수제 중 하나인 비스포스포네이트(bisphosphonate)는 골밀도 감소 억제와 골절 예방 효과가 입증되어 현재 골다공증 치료의 일차 치료제로 사용되고 있고 고령화와 함께 증가하는 골다공증 유병율에 따라 그 사용이 광범위하게 증가하고 있다. 선행연구에 의하면, 2008년 우리나라에서 사용된 골다공증 관련 약제 중 비스포스포네이트가 68%로 가장 많이 사용되었다. On the other hand, an anti-osteoporosis drug, which is a kind of therapeutic agent for osteoporosis, is a drug that affects bone metabolism and maintains bone density by inhibiting osteoclasts. Bisphosphonate, one of the anti-bone resorbing agents, has been proven to inhibit bone density loss and prevent fractures, and is currently used as a first-line treatment for osteoporosis, and its use is widely increasing due to the increasing prevalence of osteoporosis with aging. According to previous studies, among the osteoporosis-related drugs used in Korea in 2008, bisphosphonates were the most used at 68%.

그러나 최근 비스포스포네이트를 장기간 사용함에 따라 악골 괴사(OsteoNecrosis of the jaw, ONJ) 등 부작용 사례가 잇따라 보고되면서 비스포스포네이트의 장기 복용의 안전성에 대한 문제제기가 되고 있다. 악골 괴사의 경우는 임상적으로 드물게(1/1000~1/100,000) 발생하나 한번 발생하면 치료에 어려움이 있어 예방책이 절실한 상황이다. 이는 비스포스포네이트 관련 악골 괴사 (Bisphosphonate-Related OsteoNecrosis of the Jaw, BRONJ)로 명명되어 이의 예방 및 치료에 관한 다양한 연구가 이루어지고 있다. However, as side effects such as osteonecrosis of the jaw (ONJ) have recently been reported one after another due to long-term use of bisphosphonates, the safety of long-term administration of bisphosphonates has been raised. The case of jaw bone necrosis occurs clinically rarely (1/1000 to 1/100,000), but once it occurs, it is difficult to treat, so preventive measures are urgently needed. This is named Bisphosphonate-Related OsteoNecrosis of the Jaw (BRONJ), and various studies on its prevention and treatment have been conducted.

뿐만 아니라, 2014년 미국 구강악안면외과 학회(American Association of Oral and Maxillofacial Surgeon)에서는 의견서를 통해 비스포스포네이트관련 악골 괴사를 약물관련 악골 괴사(Medication-Related OsteoNecrosis of the Jaw, MRONJ)로 확대하여 정의하였는데, 이는 비스포스포네이트 뿐만아니라 데노수맙 (denosumab)과 같은 다른 항 골흡수제나 항 혈관형성제의 사용시에도 기존 비스포스포네이트 사용 환자에서 나타나는 악골 괴사가 보고되었기 때문이다. 이처럼 약물 사용과 관련된 악골 괴사는 지속적으로 늘고 있는바, 이를 예방 및 치료하기 위한 포괄적인 접근이 시도되고 있다.In addition, in 2014, the American Association of Oral and Maxillofacial Surgeon expanded the definition of bisphosphonate-related osteonecrosis to drug-related osteonecrosis of the jaw (MRONJ) through a written opinion, which This is because jaw necrosis in patients using existing bisphosphonates has been reported even when other anti-bone resorbing agents or anti-angiogenic agents such as denosumab are used as well as bisphosphonates. As such, jaw necrosis associated with drug use is continuously increasing, and a comprehensive approach to prevent and treat it is being attempted.

이에 약물 투여 전에 약물의 부작용을 예측하기 위한 방법으로 위에서 언급된 약물유전체학이 사용될 수 있다. 기존 연구를 통해 비스포스포네이트 관련 악골 괴사와 같은 부작용의 위험성이 유전자형과 관련되어 있음이 밝혀졌다. 선행연구에서 전장유전체 분석 결과 상기 BRONJ 환자군에서 RBMS3 유전자의 인트론 영역에 존재하는 SNP인 rs17024608의 비율이 통계적으로 유의하게 높았다(p-value<7x10-8;odds ratio, 5.8; 95% confidence interval, 3.1-11.1)(Paola N. et al., 2012).Accordingly, the above-mentioned pharmacogenomics can be used as a method for predicting side effects of a drug before drug administration. Previous studies have revealed that the risk of side effects such as bisphosphonate-related bone necrosis is related to genotype. As a result of whole genome analysis in previous studies, the ratio of rs17024608, a SNP present in the intron region of the RBMS3 gene, was statistically significantly high in the BRONJ patient group (p-value <7x10-8; odds ratio, 5.8; 95% confidence interval, 3.1 -11.1) (Paola N. et al., 2012).

현재 약물의 체내 대사에 있어 수십에서 수백 개의 약물 대사 관련 유전자들의 유전 변이가 해당 단백질의 기능에 영향을 주어 약물 대사를 증가 또는 감소시킨다는 것이 알려져있고, 새로운 유전변이를 규명하는 것 역시 필요하지만 기존의 소수 유전자의 분석만으로는 다양한 약물 대사 관련 유전자들 전체를 파악하기에는 한계가 있다. 따라서 소수 유전자나 단일염기 다형성과 같은 마커를 이용한 인구 집단 관찰 연구 결과에 근거한 방법을 넘어서서, 개인 유전체 염기서열 변이 정보를 직접 활용하여 이에 수반되는 단백질 변이와 그 생물학적 영향에 대한 이론적 추론을 수행함으로써 보다 유용하고 신뢰할 수 있는 개인별 골다공증 치료제 선택을 위한 정보를 제공하는 방법론 도입의 필요성이 강하게 제기된다. It is currently known that genetic mutations in dozens to hundreds of drug metabolism-related genes increase or decrease drug metabolism by affecting the function of the corresponding protein in the metabolism of drugs in the body, and it is also necessary to identify new genetic mutations. Analysis of a small number of genes has limitations in identifying all of the various drug metabolism-related genes. Therefore, it goes beyond the method based on the results of population observation studies using markers such as minority genes or single nucleotide polymorphisms, and makes theoretical inferences about protein variations and their biological effects by directly utilizing individual genome sequence variation information. The necessity of introducing a methodology that provides useful and reliable information for individual osteoporosis treatment selection is strongly raised.

본 발명은 상기와 같은 점을 감안하여 안출된 것으로, 개인 유전체 염기서열 변이 정보를 분석하고, 골다공증 치료제의 약력학 또는 약동학에 관여하는 유전자 염기서열 변이 정보로부터 개인별 단백질 손상 점수를 산출한 후, 이를 약물과 단백질 사이의 상호 관계와 연관지어 개인별 약물 점수를 산출함으로써, 골다공증 치료제 부작용 가능성을 예측하고, 골다공증 치료제를 선택하기 위한 정보를 제공하는 방법을 제공하고자 한다.The present invention has been devised in view of the above, and analyzes individual genome sequence variation information, calculates individual protein damage scores from gene sequence variation information involved in the pharmacodynamics or pharmacokinetics of an osteoporosis treatment, and then calculates the individual protein damage score. By calculating individual drug scores in association with the correlation between protein and protein, we intend to provide a method for predicting the possibility of side effects of osteoporosis drugs and providing information for selecting osteoporosis drugs.

한 양태에서 본 발명은 개인 유전체 염기서열 정보로부터 골다공증 치료제의 약력학(pharmaco-dynamics) 또는 약동학(pharmaco-kinetics)에 관여하는 하나 이상의 유전자 염기서열 변이 정보를 결정하는 단계; 상기 유전자 염기서열 변이 정보를 이용하여 개인별 단백질 손상 점수를 산출하는 단계; 및 상기 개인별 단백질 손상 점수를 약물과 단백질 사이의 상호 관계와 연관지어, 개인별 약물 점수를 산출하는 단계를 포함하는, 개인 유전체 염기서열 변이를 이용한 골다공증 치료제 선택을 위한 정보를 제공하는 방법을 제공한다. In one aspect, the present invention provides the steps of determining at least one gene sequence mutation information involved in the pharmaco-dynamics or pharmaco-kinetics of a therapeutic agent for osteoporosis from personal genome sequence information; Calculating individual protein damage scores using the gene sequence mutation information; and calculating an individual drug score by associating the individual protein damage score with a mutual relationship between a drug and a protein.

다른 양태에서 본 발명은 개인에 대해 적용할 수 있는 골다공증 치료제에 대하여, 상기 골다공증 치료제와 관련된 유전자 또는 단백질과 관련된 정보 검색 또는 추출이 가능한 데이터베이스; 상기 데이터베이스에 접근 가능한 통신부; 상기 정보에 기초하여 상기 골다공증 치료제의 약력학 또는 약동학에 관여하는 하나 이상의 유전자 염기서열 변이 정보를 산출하는 제1 산출모듈; 상기 유전자 염기서열 변이 정보를 이용하여 개인별 단백질 손상 점수를 산출하는 제2 산출모듈; 상기 개인별 단백질 손상 점수를 약물과 단백질 사이의 상호 관계와 연관지어, 개인별 약물 점수를 산출하는 제3 산출모듈; 및 상기 산출모듈에서 산출된 산출값을 표시하는 표시부를 포함하는, 개인 유전체 염기서열 변이를 이용한 골다공증 치료제 선택 시스템을 제공한다. In another aspect, the present invention relates to a therapeutic agent for osteoporosis applicable to individuals, a database capable of searching or extracting information related to a gene or protein related to the therapeutic agent for osteoporosis; a communication unit capable of accessing the database; A first calculation module for calculating information on one or more gene sequence mutations involved in pharmacodynamics or pharmacokinetics of the osteoporosis treatment based on the information; a second calculation module for calculating individual protein damage scores using the gene sequence mutation information; a third calculation module for calculating an individual drug score by associating the individual protein damage score with a relationship between a drug and a protein; and a display unit for displaying the calculated value calculated by the calculation module, providing a system for selecting a treatment for osteoporosis using individual genome sequence mutation.

또 다른 양태에서 본 발명은 개인 유전체 염기서열 정보로부터 골다공증 치료제의 약력학 또는 약동학에 관여하는 유전자 염기서열 변이 정보를 입수하는 단계; 상기 유전자 염기서열 변이 정보를 이용하여 개인별 단백질 손상 점수를 산출하는 단계; 및 상기 개인별 단백질 손상 점수를 약물과 단백질 사이의 상호 관계와 연관지어, 개인별 약물 점수를 산출하는 단계;를 포함하는 동작을 수행하는 프로세서를 실행시키는 실행모듈을 포함하는, 컴퓨터 판독 가능한 매체를 제공한다. In another aspect, the present invention provides the steps of obtaining gene sequence mutation information involved in the pharmacodynamics or pharmacokinetics of a therapeutic agent for osteoporosis from personal genome sequence information; Calculating individual protein damage scores using the gene sequence mutation information; And calculating the individual drug score by associating the individual protein damage score with the correlation between the drug and the protein; providing a computer readable medium including an execution module that executes a processor that performs operations including; .

본 발명의 개인별 유전체 염기서열 변이 정보에 기반을 둔 개인별 골다공증 치료제 선택 방법 및 시스템은 골다공증 치료제의 약력학 또는 약동학에 관여하는 다양한 단백질을 코딩하는 유전자의 엑손 영역의 서열 분석을 통하여 개인별로 특정 약물, 즉 골다공증 치료제에 대한 반응성을 예측할 수 있는 기술로서 신뢰도가 높다. The method and system for selecting an individual osteoporosis treatment based on individual genome sequence variation information of the present invention is a specific drug for each individual, that is, through sequence analysis of the exon region of a gene encoding various proteins involved in the pharmacodynamics or pharmacokinetics of an osteoporosis treatment. It is highly reliable as a technology that can predict the response to osteoporosis treatment.

또한, 실험방법의 발전으로 유전형을 알아내기 위한 기술(PCR, SNP chip, capillary sequencing, NGS 등)을 임상적으로 사용하는 것이 용이해져 약물 유전체학에 기반을 둔 본 발명이 임상 현장에서 널리 사용될 것을 기대할 수 있다. 특히 차세대염기서열해독법(Next Generation Sequencing, NGS)의 가격이 급속하게 떨어져 환자당 수만원~수십만원 대의 가격에서 유전체 관점에서의 접근이 가능하다.In addition, it is expected that the present invention based on pharmacogenomics will be widely used in the clinical field as it becomes easier to clinically use technologies (PCR, SNP chip, capillary sequencing, NGS, etc.) for finding out genotypes with the development of experimental methods. can In particular, the price of next-generation sequencing (NGS) is rapidly dropping, and it is possible to access it from the perspective of genome at a price ranging from tens of thousands of won to hundreds of thousands of won per patient.

기존 약물유전체학의 인구집단간 비교를 통해 얻어진 소수 변이 또는 소수 유전자를 마커로 이용하는 방법은 연구 대상군 선정과 인구 집단 간의 차이에 따른 통계적 오류도 큰 반면, 본 발명의 방법은 수십 개에서 수백 개에 이르는 약물과 관련된 약동학, 약력학에 관계하는 단백질에 대하여 분자 수준의 연구 및 분석 결과를 직접 골다공증 치료제 선택에 적용하므로 인구 집단 간의 차이에 큰 영향을 받지 않고 적용할 수 있고, 소수 마커를 이용하는 것에 비해 신뢰도가 높다는 장점이 있다. While the method of using a small number of mutations or a small number of genes obtained through comparison between populations in existing pharmacogenomics as a marker has a large statistical error due to the selection of study subjects and differences between populations, the method of the present invention is Since molecular-level research and analysis results of proteins related to pharmacokinetics and pharmacodynamics related to drugs are directly applied to the selection of osteoporosis drugs, it can be applied without being significantly affected by differences between population groups, and it is more reliable than using a small number of markers. has the advantage of being high.

특히, 본 발명에 따른 방법 및 시스템을 이용할 경우, 골다공증 치료제, 예를 들어, 비스포스포네이트에 대한 부작용 또는 위험성을 사전에 예측함으로써 개인에 적용되는 골다공증 치료제의 사용 여부 및 사용 방법을 결정하는데 유용하게 사용될 수 있으며, 골다공증 환자에서 적정 용량 투여를 통한 부작용 예방으로 이어질 수 있다. In particular, when using the method and system according to the present invention, the osteoporosis treatment, for example, by predicting the side effects or risks of bisphosphonate in advance, it can be usefully used to determine whether and how to use the osteoporosis treatment applied to an individual. It can lead to the prevention of side effects through proper dose administration in patients with osteoporosis.

나아가 골다공증 치료제, 예를 들어, 비스포스포네이트의 약물-단백질 상호관계에 대한 새로운 지식이 발견되거나 제공되는 경우, 이는 본 발명의 방법에 용이하게 추가되고 적용될 수 있으므로, 향후 연구 결과 정보의 축적에 따라 보다 향상된 맞춤형 치료방법이 제공될 수 있는 장점이 있다. Furthermore, if new knowledge about the drug-protein interaction of a therapeutic agent for osteoporosis, for example, a bisphosphonate, is discovered or provided, it can be easily added and applied to the method of the present invention, so that further improvement is made according to the accumulation of information as a result of future research. There is an advantage that a customized treatment method can be provided.

도 1은 본 발명의 일 구현예에 따른 개인 유전체 염기서열 변이를 이용한 골다공증 치료제 선택을 위한 정보를 제공하는 방법의 각 단계를 보여주는 흐름도이다.
도 2는 본 발명의 일 구현예에 따른 개인 유전체 염기서열 변이를 이용한 골다공증 치료제 선택 시스템의 개략적 구성도이다(DB: 데이터베이스).
도 3a와 도3b는 본 발명의 일 실시예에 따른 유전체 염기서열 변이를 이용한 골다공증 치료제 선택 방법의 검증을 위한 ROC (Receiver Operating Curve) 커브를 보여주는 흐름도이다.
1 is a flowchart showing each step of a method for providing information for selecting an osteoporosis treatment using personal genome sequence variation according to an embodiment of the present invention.
2 is a schematic configuration diagram of an osteoporosis drug selection system using individual genome sequence variation according to an embodiment of the present invention (DB: database).
3A and 3B are flow charts showing ROC (Receiver Operating Curve) curves for verification of a method for selecting an osteoporosis treatment using genetic nucleotide sequence variation according to an embodiment of the present invention.

본 발명은 개인 유전체 염기서열 변이 정보의 분석을 통해 개인별로 골다공증 치료제를 이용한 약물치료에서 개인 맞춤형으로 안전성이 높은 약물과 용량/용법을 선택할 수 있다는 발견에 근거한 것이다. The present invention is based on the discovery that highly safe drugs and dosage/usage can be selected in a personalized manner in drug treatment using osteoporosis drugs for each individual through analysis of individual genome sequence mutation information.

한 양태에서 본 발명은 개인 유전체 염기서열 정보로부터 골다공증 치료제의 약력학(pharmaco-dynamics) 또는 약동학(pharmaco-kinetics)에 관여하는 하나 이상의 유전자 염기서열 변이 정보를 결정하는 단계; 상기 유전자 염기서열 변이 정보를 이용하여 개인별 단백질 손상 점수를 산출하는 단계; 및 상기 개인별 단백질 손상 점수를 약물과 단백질 사이의 상호 관계와 연관지어, 개인별 약물 점수를 산출하는 단계를 포함하는, 개인 유전체 염기서열 변이를 이용한 골다공증 치료제 선택을 위한 정보를 제공하는 방법에 관한 것이다. In one aspect, the present invention provides the steps of determining at least one gene sequence mutation information involved in the pharmaco-dynamics or pharmaco-kinetics of a therapeutic agent for osteoporosis from personal genome sequence information; Calculating individual protein damage scores using the gene sequence mutation information; and calculating an individual drug score by associating the individual protein damage score with a mutual relationship between a drug and a protein.

본 발명에서 골다공증 치료제는 하기 표 1에 개시된 약물 계열에 속하는 약물, 이의 유도체, 및 이의 약학적으로 허용가능한 염 등 동일, 유사한 약리 활성을 나타내는 물질을 모두 포함하며, 이로 제한되는 것은 아니다.In the present invention, the osteoporosis treatment includes all substances exhibiting the same or similar pharmacological activity, such as drugs belonging to the drug class shown in Table 1 below, derivatives thereof, and pharmaceutically acceptable salts thereof, but are not limited thereto.

약물 계열drug class 약물drug 비스포스포네이트(bisphosphonate)bisphosphonates Alendronate, Clodronate, Ibandronate, Pamidronate, Risendronate, Zoledronate, Etidroniate, Medronate, Tiludronate, Olpadronate, CimadronateAlendronate, Clodronate, Ibandronate, Pamidronate, Risendronate, Zoledronate, Etidronate, Medronate, Tiludronate, Olpadronate, Cimadronate 항-RANKL 단일클론항체(anti-RANKL monoclonal Ab)Anti-RANKL monoclonal antibody (anti-RANKL monoclonal Ab) DenosumabDenosumab 콜레칼시페롤(Cholecalciferol)Cholecalciferol Ergocalciferol, Doxecalciferol, AlfacalcidolErgocalciferol, Doxecalciferol, Alfacalcidol 비타민D 아날로그(VitD analogue)Vitamin D analogue DihydrotachysterolDihydrotachysterol 선택적 에스트로겐 수용체 조절제(SERMs, Selective Estrogen Receptor Modulators)Selective Estrogen Receptor Modulators (SERMs) Raloxifen, Bazedoxifene, Femarelle, lasofoxifeneRaloxifen, Bazedoxifene, Femarelle, lasofoxifene 호르몬 대체 요법(HRT, Hormone Replacement Therapy)Hormone Replacement Therapy (HRT) Estroogen, ProgesteroneEstrogen, Progesterone 칼시트리올(Calcitriol)Calcitriol 칼시페디올(calcifediol)Calcipediol 부갑상선 호르몬(PTH)parathyroid hormone (PTH) TeriparatideTeriparatide 칼시토닌(Calcitonin)Calcitonin Elcalcitonin, SalcatoninElcalcitonin, Salcatonin 비타민K 화합물 (VitK compound)Vitamin K compound Menatetrenone, MenaquinoneMenatetrenone, Menaquinone

본 발명에서 골다공증 치료제의 약력학 또는 약동학에 관여하는 유전자 정보는 DrugBank (http://www.drugbank.ca/) 또는 KEGG Drug (http://www.genome.jp/kegg/drug/) 또는 PharmGKB (https://www.pharmgkb.org/) 등과 같은 데이터베이스에서 수득할 수 있으며, 바람직하게는 FGFR4, IGHMBP2, ARHGEF26, HBXIP, CD1A, ZNF57, LAMA4, SIPA1, GPC4, PSMD9, AKNA, ANKRD50, DUSP13, PIK3R1, C4orf14, GPR174, CHDH, AC018682.6, SLC12A4, ADARB2, CD3G, ZFYVE20, ASZ1, ARHGEF4, FAT4, OR2M5, HPS1, ZNF235, P4HB, ATP11C, SYNE1, ADCY3, PGLYRP3, MAGEA12, TMEM187, OR4S1, KRTAP5-4, SERPINI2, BTNL2, CXorf1, PRG4, VAMP8, CSAG1, C1orf27, C1orf229, LRRTM3, SPDEF, GZMA, LTBP1, OBP2A 등을 포함하나, 이로 제한되는 것은 아니다. 보다 구체적으로, 본 발명에서 골다공증 치료제의 약력학 또는 약동학에 관여하는 유전자는 FGFR4, IGHMBP2, ARHGEF26, HBXIP, CD1A, ZNF57, LAMA4, SIPA1, GPC4, PSMD9, AKNA, ANKRD50, DUSP13, PIK3R1, C4orf14, GPR174, CHDH, AC018682.6, SLC12A4, ADARB2, CD3G, ZFYVE20, ASZ1, ARHGEF4, FAT4, OR2M5, HPS1, ZNF235, P4HB, ATP11C, SYNE1 및 ADCY3으로 이루어진 군에서 선택된 1종을 포함하며, 바람직하게는 상기 유전자에 PGLYRP3, MAGEA12, TMEM187, OR4S1, KRTAP5-4, SERPINI2, BTNL2, CXorf1, PRG4, VAMP8, CSAG1, C1orf27, C1orf229, LRRTM3, SPDEF, GZMA, LTBP1 및 OBP2A로 이루어진 군에서 선택된 1종 이상을 더 포함할 수 있다. Gene information involved in the pharmacodynamics or pharmacokinetics of the osteoporosis therapeutic agent in the present invention is DrugBank (http://www.drugbank.ca/) or KEGG Drug (http://www.genome.jp/kegg/drug/) or PharmGKB ( https://www.pharmgkb.org/) and the like, preferably FGFR4, IGHMBP2, ARHGEF26, HBXIP, CD1A, ZNF57, LAMA4, SIPA1, GPC4, PSMD9, AKNA, ANKRD50, DUSP13, PIK3R1 ; , SERPINI2, BTNL2, CXorf1, PRG4, VAMP8, CSAG1, C1orf27, C1orf229, LRRTM3, SPDEF, GZMA, LTBP1, OBP2A, etc., but are not limited thereto. More specifically, the genes involved in the pharmacodynamics or pharmacokinetics of the osteoporosis therapeutic agent in the present invention are FGFR4, IGHMBP2, ARHGEF26, HBXIP, CD1A, ZNF57, LAMA4, SIPA1, GPC4, PSMD9, AKNA, ANKRD50, DUSP13, PIK3R1, C4orf14, GPR174, It includes one selected from the group consisting of CHDH, AC018682.6, SLC12A4, ADARB2, CD3G, ZFYVE20, ASZ1, ARHGEF4, FAT4, OR2M5, HPS1, ZNF235, P4HB, ATP11C, SYNE1 and ADCY3, preferably in the gene It may further include one or more selected from the group consisting of PGLYRP3, MAGEA12, TMEM187, OR4S1, KRTAP5-4, SERPINI2, BTNL2, CXorf1, PRG4, VAMP8, CSAG1, C1orf27, C1orf229, LRRTM3, SPDEF, GZMA, LTBP1 and OBP2A there is.

본 발명에서 유전자/단백질은 HGNC(HUGO Gene Nomenclature Committee)의 명명법에 따라 표시하였다(Gray KA, Daugherty LC, Gordon SM, Seal RL, Wright MW, Bruford EA. genenames.org: the HGNC resources in 2013. Nucleic Acids Res. 2013 Jan;41(Database issue):D545-52. doi: 10.1093/nar/gks1066. Epub 2012 Nov 17 PMID:23161694). Genes/proteins in the present invention are indicated according to the nomenclature of the HGNC (HUGO Gene Nomenclature Committee) (Gray KA, Daugherty LC, Gordon SM, Seal RL, Wright MW, Bruford EA. genenames.org: the HGNC resources in 2013. Nucleic Acids Res.

본 발명에서 일 정보로 사용되는 유전자 염기서열 변이는 개인의 유전자 염기서열의 변이 또는 다형성을 일컫는 것이다. 본 발명에서 유전자 염기서열 변이 또는 다형성은 골다공증 치료제의 약력학 또는 약동학과 관련된 단백질을 코딩하는 유전자 부위, 특히 엑손(exon) 부위에서 발생하는 것이나 이로 제한되는 것은 아니다. Gene nucleotide sequence variation used as work information in the present invention refers to a variation or polymorphism of an individual's gene sequence. In the present invention, gene sequence mutation or polymorphism occurs in a gene region encoding a protein related to pharmacodynamics or pharmacokinetics of a therapeutic agent for osteoporosis, particularly in an exon region, but is not limited thereto.

본 발명에서 사용된 용어 “염기서열 변이 정보”는 유전자의 엑손을 구성하는 염기의 치환, 부가 또는 결실에 관한 정보를 의미한다. 이러한 염기의 치환, 부가, 또는 결실은 여러 가지 원인에 의해 발생할 수 있으며, 예를 들면 염색체의 돌연변이, 절단, 결실, 중복, 역위 및/또는 전좌를 포함하는 구조적 차이에 의할 수 있다. The term “base sequence variation information” used in the present invention refers to information on substitution, addition, or deletion of bases constituting exons of a gene. Substitutions, additions, or deletions of these bases may occur for a variety of reasons, for example, due to structural differences including chromosomal mutations, truncations, deletions, duplications, inversions, and/or translocations.

다른 측면에서 염기서열의 다형성이란 유전체 상에 존재하는 염기서열의 개인 간 차이를 말하는 것으로, 염기서열 다형성에서 그 수가 가장 많은 것은 단일염기다형성(Single Nucleotide Polymorphism, SNP)이며, A, T, C, G로 이루어진 염기서열 중 하나의 염기에 개인 간 차이가 있는 것이다. 염기서열 다형성은 SNP를 포함하여 SNV(Single Nucleotide Variation), STRP(short tandem repeat polymorphism), 또는 VNTR(various number of tandem repeat) 및 CNV(Copy number variation)를 포함하는 다수체(polyalleic) 변이의 형태로 나타날 수 있다. On the other hand, nucleotide sequence polymorphism refers to individual differences in nucleotide sequences present in the genome, and the largest number of nucleotide sequence polymorphisms is Single Nucleotide Polymorphism (SNP), A, T, C, There is an individual difference in one base of the base sequence consisting of G. Sequence polymorphism is a form of polyalleic variation including Single Nucleotide Variation (SNV) including SNP, short tandem repeat polymorphism (STRP), or various number of tandem repeat (VNTR) and Copy number variation (CNV). can appear as

본 발명의 방법에서 개인의 유전체에서 발견되는 염기서열 변이 또는 다형성 정보는 골다공증 치료제의 약력학 또는 약동학과 관련된 단백질과 관련되어 수집된다. 즉, 본 발명의 방법에 사용되는 염기서열 변이 정보는 수득한 개인의 유전체 염기서열 정보 중 골다공증 치료제의 약력학 또는 약동학에 관여하는 하나 이상의 유전자, 예를 들면, 약물과 관련된 표적(target) 단백질, 약물 대사에 관여하는 효소(enzyme) 단백질, 수송체 단백질(transporter) 또는 운반체(carrier) 단백질을 코딩하는 유전자의 특히 엑손 영역에서 발견되는 변이 정보이나 이로 제한되는 것은 아니다. In the method of the present invention, nucleotide sequence variation or polymorphism information found in an individual's genome is collected in relation to proteins related to the pharmacodynamics or pharmacokinetics of an osteoporosis treatment. That is, the nucleotide sequence variation information used in the method of the present invention is one or more genes involved in the pharmacodynamics or pharmacokinetics of a therapeutic agent for osteoporosis among the individual genomic sequence information obtained, for example, a drug-related target protein, drug Mutation information found in the exon region of a gene encoding an enzyme protein involved in metabolism, a transporter protein, or a carrier protein, but is not limited thereto.

본 발명에서 사용되는 개인의 유전체 염기서열 정보는 공지된 염기서열해독법을 이용하여 결정될 수 있으며, 또한 상용화된 서비스를 제공하는 Complete Genomics, BGI (Beijing Genome Institute), Knome, Macrogen, DNALink 등의 서비스를 이용할 수 있으며, 이에 제한되지 않는다. Individual genome sequence information used in the present invention can be determined using a known sequencing method, and commercialized services such as Complete Genomics, BGI (Beijing Genome Institute), Knome, Macrogen, DNALink, etc. may be used, but is not limited thereto.

본 발명에서 개인의 유전체 염기서열에 존재하는 유전자 염기서열 변이 정보는 다양한 방법을 이용하여 추출될 수 있으며, 참조군, 예를 들면 HG19의 유전체 염기서열과의 서열 비교 프로그램, 예를 들어, ANNOVAR(Wang et al., Nucleic Acids Research, 2010; 38(16): e164), SVA(Sequence Variant Analyzer) (Ge et al., Bioinformatics. 2011; 27(14): 19982000), BreakDancer(Chen et al., Nat Methods. 2009 Sep; 6(9):677-81) 등을 이용한 염기서열 비교 분석을 통해 수득될 수 있다. In the present invention, gene sequence variation information present in an individual's genome sequence can be extracted using various methods, and a sequence comparison program with a reference group, for example, the genome sequence of HG19, for example, ANNOVAR ( Wang et al., Nucleic Acids Research, 2010; 38(16): e164), SVA (Sequence Variant Analyzer) (Ge et al., Bioinformatics. 2011; 27(14): 19982000), BreakDancer (Chen et al., Nat Methods. 2009 Sep;

상기 유전자 염기서열 변이 정보는 컴퓨터 시스템을 통하여 접수/수득될 수 있으며, 이런 측면에서 본 발명의 방법은 유전자 변이 정보를 컴퓨터 시스템으로 접수하는 단계를 추가로 포함할 수 있다. 본 발명에서 사용되는 컴퓨터 시스템은 상기 골다공증 치료제의 약력학 또는 약동학에 관여하는 유전자, 예를 들면 약물과 관련된 표적 단백질, 약물 대사에 관여하는 효소 단백질, 수송체 단백질 또는 운반체 단백질 등을 코딩하는 유전자에 관한 정보를 포함하는 하나 이상의 데이터베이스를 포함하거나 데이터베이스에 접근 가능하다. 이러한 데이터베이스는 예를 들면 DrugBank (http://www.drugbank.ca/), KEGG Drug (http://www.genome.jp/kegg/drug/), PharmGKB (http://www.pharmgkb.org/) 등을 포함하는 유전자/단백질/약물-단백질 상호작용 등에 관한 정보를 제공하는 공개 또는 비공개 데이터베이스 또는 지식베이스를 포함할 수 있으나, 이에 제한되지 않는다. The gene sequence mutation information may be received/obtained through a computer system, and in this respect, the method of the present invention may further include receiving genetic mutation information into a computer system. The computer system used in the present invention relates to genes involved in pharmacodynamics or pharmacokinetics of the osteoporosis treatment, for example, genes encoding drug-related target proteins, drug metabolism enzyme proteins, transporter proteins, or transporter proteins. It may contain or be accessible to one or more databases containing information. Such databases include, for example, DrugBank (http://www.drugbank.ca/), KEGG Drug (http://www.genome.jp/kegg/drug/), PharmGKB (http://www.pharmgkb.org /) may include open or closed databases or knowledge bases that provide information on gene/protein/drug-protein interactions, etc., but are not limited thereto.

본 발명에서 골다공증 치료제는 사용자가 입력한 정보, 처방(전)으로부터 입력된 정보, 또는 골다공증 치료제에 대한 정보를 포함하는 데이터베이스로부터 입력된 정보일 수 있다. 상기 처방전은 전자처방전을 포함하며, 이에 제한되지 않는다. In the present invention, the osteoporosis therapeutic agent may be information input by a user, information input from a prescription (previous), or information input from a database including information on an osteoporosis therapeutic agent. The prescription includes, but is not limited to, an electronic prescription.

본 발명에서 사용된 용어 “약동학(pharmaco-kinetics, pk) 또는 약동학적 파라미터”는 일정 시간동안 약물의 체내에서의 흡수, 이동, 분포, 전환, 배출과 관련된 약물의 특성을 일컫는 것으로, 약물의 분포용적(Vd), 청소율(CL), 생체이용율(F), 흡수속도계수(ka), 최대 혈중 약물 농도(maximum plasma concentration, Cmax), 최대 혈중 약물 농도의 도달시간(time point of maximum plasma concentration, Tmax), 일정 시간 동안의 혈중 약물 농도 변화에 대한 그래프 아래의 면적(AUC, Area Under the Curve) 측정 등을 포함하는 것이다. The term “pharmaco-kinetics (pk) or pharmacokinetic parameters” used in the present invention refers to the characteristics of a drug related to absorption, movement, distribution, conversion, and excretion of a drug in the body for a certain period of time, and the distribution of the drug Volume (Vd), clearance rate (CL), bioavailability (F), absorption rate coefficient (ka), maximum plasma concentration (Cmax), time point of maximum plasma concentration (time point of maximum plasma concentration, Tmax), measurement of the area under the curve (AUC) of the change in blood drug concentration over a certain period of time, and the like.

본 발명에서 사용된 용어 “약력학(pharmacodynamics) 또는 약력학적 파라미터”는 약물의 생체에 대한 생리학적 및 생화학적 작용과 그 작용기전, 즉 약물이 일으키는 생체의 반응 또는 효과와 관련된 특징을 일컫는 것이다. The term "pharmacodynamics or pharmacodynamic parameters" used in the present invention refers to the physiological and biochemical action of a drug on the body and its action mechanism, that is, the characteristics related to the reaction or effect of the drug on the body.

본 발명에서 사용된 용어 “유전자 염기서열 변이 점수”란 유전체 염기서열 변이가 단백질을 코딩하는 유전자의 엑손 부위에서 발견되었을 때, 이러한 개별 변이가 해당 유전자가 코딩하는 단백질의 아미노산 서열 변이(치환, 부가 또는 결실) 또는 전사 조절 변이를 초래하여, 해당 단백질의 구조 및/또는 기능에 유의한 변화 혹은 손상을 유발하는 정도를 수치화한 점수를 말하며, 상기 유전자 염기서열 변이 점수는 유전체 염기서열 상에서 아미노산의 진화론적 보존 정도, 변형된 아미노산의 물리적 특성에 따른 해당 단백질의 구조나 기능의 변화에 미치는 정도 등을 고려하여 산출할 수 있다. As used in the present invention, the term "gene sequence variation score" means that when a genome sequence variation is found in the exon region of a gene encoding a protein, these individual variations are considered as amino acid sequence variation (substitution, addition) of the protein encoded by the gene. or deletion) or transcriptional regulatory mutation, which quantifies the degree of significant change or damage to the structure and/or function of the protein. The gene sequence mutation score is the evolutionary theory of amino acids on the genome sequence. It can be calculated by considering the degree of natural conservation and the degree of change in the structure or function of the protein according to the physical properties of the modified amino acid.

본 발명에서 개인별 단백질 손상 점수 또는 개인별 약물 점수 산출에 적용하기 위해, 유전자 염기서열 변이 점수를 산출하는 방법은 당업계에 공지된 방법을 이용하여 수행될 수 있다. 예를 들면, SIFT (Sorting Intolerant From Tolerant, Pauline C et al., Genome Res. 2001 May; 11(5): 863874; Pauline C et al., Genome Res. 2002 March; 12(3): 436446; Jing Hul et al., Genome Biol. 2012; 13(2): R9), PolyPhen, PolyPhen-2 (Polymorphism Phenotyping, Ramensky V et al., Nucleic Acids Res. 2002 September 1; 30(17): 38943900; Adzhubei IA et al., Nat Methods 7(4):248-249 (2010)), MAPP (Eric A. et al., Multivariate Analysis of Protein Polymorphism, Genome Research 2005;15:978986), Logre (Log R Pfam E-value, Clifford R.J et al., Bioinformatics 2004;20:1006-1014), Mutation Assessor (Reva B et al., Genome Biol. 2007;8:R232, http://mutationassessor.org/), Condel (Gonzalez-Perez A et al.,The American Journal of Human Genetics 2011;88:440449, http://bg.upf.edu/fannsdb/), GERP (Cooper et al., Genomic Evolutionary Rate Profiling, Genome Res. 2005;15:901-913, http://mendel.stanford.edu/SidowLab/downloads/gerp/), CADD (Combined Annotation-Dependent Depletion, http://cadd.gs.washington.edu/), MutationTaster, MutationTaster2 (Schwarz et al., MutationTaster2: mutation prediction for the deep-sequencing age. Nature Methods 2014;11:361362, http://www.mutationtaster.org/), PROVEAN (Choi et al., PLoS One. 2012;7(10):e46688), PMut (Ferrer-Costa et al., Proteins 2004;57(4):811-819, http://mmb.pcb.ub.es/PMut/), CEO (Combinatorial Entropy Optimization, Reva et al., Genome Biol 2007;8(11):R232), SNPeffect (Reumers et al., Bioinformatics. 2006;22(17):2183-2185, http://snpeffect.vib.be), fathmm (Shihab et al., Functional Analysis through Hidden Markov Models, Hum Mutat 2013;34:57-65, http://fathmm.biocompute.org.uk/) 등과 같은 알고리즘을 이용하여 유전자 염기서열 변이 정보로부터 유전자 염기서열 변이 점수를 산출할 수 있으며, 이에 제한되지 않는다. In the present invention, in order to be applied to calculating individual protein damage scores or individual drug scores, a method for calculating a gene sequence variation score may be performed using a method known in the art. For example, SIFT (Sorting Intolerant From Tolerant, Pauline C et al., Genome Res. 2001 May; 11(5): 863874; Pauline C et al., Genome Res. 2002 March; 12(3): 436446; Jing Hul et al., Genome Biol. 2012; 13(2): R9), PolyPhen, PolyPhen-2 (Polymorphism Phenotyping, Ramensky V et al., Nucleic Acids Res. 2002 September 1; 30(17): 38943900; Adzhubei IA et al., Nat Methods 7(4):248-249 (2010)), MAPP (Eric A. et al., Multivariate Analysis of Protein Polymorphism, Genome Research 2005;15:978986), Logre (Log R Pfam E- value, Clifford R.J et al., Bioinformatics 2004;20:1006-1014), Mutation Assessor (Reva B et al., Genome Biol. 2007;8:R232, http://mutationassessor.org/), Condel (Gonzalez- Perez A et al., The American Journal of Human Genetics 2011;88:440449, http://bg.upf.edu/fannsdb/), GERP (Cooper et al., Genomic Evolutionary Rate Profiling, Genome Res. 2005;15 :901-913, http://mendel.stanford.edu/SidowLab/downloads/gerp/), CADD (Combined Annotation-Dependent Depletion, http://cadd.gs.washington.edu/), Muta tionTaster, MutationTaster2 (Schwarz et al., MutationTaster2: mutation prediction for the deep-sequencing age. Nature Methods 2014;11:361362, http://www.mutationtaster.org/), PROVEAN (Choi et al., PLoS One. 2012;7(10):e46688), PMut (Ferrer-Costa et al., Proteins 2004;57(4):811-819, http://mmb.pcb.ub.es/PMut/), CEO (Combinatorial Entropy Optimization, Reva et al., Genome Biol 2007;8(11):R232), SNPeffect (Reumers et al., Bioinformatics. 2006;22(17):2183-2185, http://snpeffect.vib.be), fathmm (Shihab et al., Functional Analysis through Hidden Markov Models, Hum Mutat 2013;34 :57-65, http://fathmm.biocompute.org.uk/), and the like, can be used to calculate gene sequence variation scores from gene sequence variation information, but is not limited thereto.

상술된 알고리즘들의 목적은 각각의 유전자 염기서열 변이가 단백질 기능에 얼마나 영향을 미치고, 이 영향이 단백질에 얼마나 손상을 주게 되는지, 혹은 별다른 영향이 없는지 가려내기 위함이다. 이들은 기본적으로 개별 유전자 염기서열 변이가 해당 유전자가 코딩하는 단백질의 아미노산 서열에 초래할 변화를 고려하여 해당 단백질의 구조 및/또는 기능에 미칠 영향을 판단한다는 점에서 공통점이 있다.The purpose of the above-described algorithms is to determine how much each gene sequence variation affects protein function, and how much this effect causes damage to the protein, or whether there is no significant effect. They have something in common in that they basically determine the effect on the structure and / or function of the protein in consideration of the change that individual gene sequence mutations will cause in the amino acid sequence of the protein encoded by the gene.

본 발명에 따른 일 구현예에서는 개별 유전자 염기서열 변이 점수를 산출하기 위하여, SIFT (Sorting Intolerant From Tolerant) 알고리즘을 이용하였다. SIFT 알고리즘의 경우, 예를 들면, VCF (Variant Call Format) 형식 파일로 유전자 염기서열 변이 정보를 입력받아, 각각의 유전자 염기서열 변이가 해당 유전자를 손상시키는 정도를 점수화 한다. SIFT 알고리즘의 경우 산출 점수가 0에 가까울수록 해당 유전자가 코딩하는 단백질의 손상이 심해서 해당 기능이 손상됐을 것으로 판단하고, 1에 가까울수록 해당 유전자가 코딩하는 단백질이 정상 기능을 유지하고 있을 것으로 판단한다. In one embodiment according to the present invention, the SIFT (Sorting Intolerant From Tolerant) algorithm was used to calculate individual gene sequence variation scores. In the case of the SIFT algorithm, gene sequence variation information is input in a VCF (Variant Call Format) format file, and the degree to which each gene sequence variation damages a corresponding gene is scored. In the case of the SIFT algorithm, the closer the calculated score is to 0, the more severe the damage to the protein encoded by the gene is, so it is judged that the corresponding function is damaged. .

또 다른 알고리즘인 PolyPhen-2의 경우, 산출 점수가 높을수록 해당 유전자가 코딩하는 단백질의 기능적 손상 정도가 큰 것으로 판단한다. In the case of another algorithm, PolyPhen-2, the higher the calculated score, the greater the degree of functional damage to the protein encoded by the corresponding gene.

최근에는 SIFT, Polyphen2, MAPP, Logre, Mutation Assessor를 서로 비교하고 종합하여 Condel 알고리즘을 제시한 연구(Gonzalez-Perez, A. & Lopez-Bigas, N. Improving the assessment of the outcome of nonsynonymous SNVs with a consensus deleteriousness score, Condel. The American Journal of Human Genetics, 2011;88(4):440-449.)가 발표되었으며, 상기 연구에서는 단백질에 손상을 주는 유전자 염기서열 변이 및 영향이 적은 유전자 염기서열 변이와 관련하여 공지된 데이터의 집합인 HumVar와 HumDiv(Adzhubei, IAet al., A method and server for predicting damaging missense mutations. Nature methods, 2010;7(4):248-249)를 사용하여 상기 다섯 개의 알고리즘을 비교하였다. 그 결과, HumVar의 97.9%의 단백질 손상을 일으키는 유전자 염기서열 변이와 97.3%의 영향이 적은 유전자 염기서열 변이가 상기 다섯 개의 알고리즘 중 최소 세 개의 알고리즘에서 동일하게 감지되었으며, HumDiv의 99.7%의 단백질 손상을 일으키는 유전자 염기서열 변이와 98.8%의 영향이 적은 유전자 염기서열 변이가 상기 다섯 개의 알고리즘 중 최소 세 개의 알고리즘에서 동일하게 감지되었다. 또한, 상기 HumDiv와 HumVar에 대하여 상기 다섯 개의 알고리즘과 각 알고리즘을 통합하여 계산한 결과들의 정확도를 나타내는 ROC (Receiver Operating Curve) 곡선을 그려본 결과, 상당히 높은 수준(69%~88.2%)에서 AUC(Area Under the Receiver Operating Curve)의 일치도를 보이는 것을 확인하였다. 즉 상술한 다양한 알고리즘들은 그 산출 방법은 달라도 산출된 유전자 염기서열 변이 점수들은 서로 유의하게 상관된 것이다. 따라서 상술한 알고리즘들 또는 알고리즘들을 응용한 방법을 적용하여 산출된 유전자 염기서열 변이 점수를 본원 발명에 의한 개인별 단백질 손상 점수 및 개인별 약물 점수 산출 단계에 적용하는 것은 각 유전자 염기서열 변이 점수를 산출하는 서로 다른 알고리즘의 종류에 상관없이 본 발명의 범위에 속하는 것이다. Recently, a study comparing and synthesizing SIFT, Polyphen2, MAPP, Logre, and Mutation Assessor and presenting the Condel algorithm (Gonzalez-Perez, A. & Lopez-Bigas, N. Improving the assessment of the outcome of nonsynonymous SNVs with a consensus deleteriousness score, Condel. The American Journal of Human Genetics, 2011;88(4):440-449.) was published, and in this study, gene sequence mutations that damage proteins and gene sequence mutations with little effect Comparing the above five algorithms using HumVar and HumDiv (Adzhubei, IA et al., A method and server for predicting damaging missense mutations. Nature methods, 2010;7(4):248-249), a set of known data did As a result, 97.9% of HumVar's gene sequence mutations causing protein damage and 97.3% of gene sequence mutations with little effect were detected in at least three algorithms out of the five algorithms, and 99.7% of HumDiv's protein damage was detected. Gene sequence mutations that cause sequencing and gene sequence mutations with a small effect of 98.8% were equally detected in at least three of the five algorithms. In addition, as a result of drawing ROC (Receiver Operating Curve) curves showing the accuracy of the results calculated by integrating the five algorithms and each algorithm for HumDiv and HumVar, AUC ( Area Under the Receiver Operating Curve) was confirmed. That is, although the above-described various algorithms have different calculation methods, the calculated gene sequence mutation scores are significantly correlated with each other. Therefore, applying the gene sequence variation score calculated by applying the above-described algorithms or a method applying the algorithms to the individual protein damage score and individual drug score calculation step according to the present invention is mutually exclusive in calculating each gene sequence variation score. Regardless of the type of other algorithm, it is within the scope of the present invention.

유전자 염기서열 변이가 단백질을 코딩하는 유전자의 엑손 부위에 발생할 경우, 이는 단백질의 구조 및/또는 기능에 직접적인 영향을 미칠 수 있다. 따라서 상기 유전자 염기서열 변이 정보를 단백질 기능 손상 정도와 관련시킬 수 있다. 이런 측면에서 본 발명의 방법은 다음의 단계에서, 상술한 유전자 염기서열 변이 점수를 기반으로 개인별 단백질 손상 점수를 산출한다. When a gene sequence mutation occurs in an exon region of a gene encoding a protein, it can directly affect the structure and/or function of the protein. Therefore, the gene sequence mutation information can be related to the degree of protein function damage. In this aspect, in the next step, the method of the present invention calculates individual protein damage scores based on the gene sequence variation scores described above.

본 발명에서 사용된 용어 “단백질 손상 점수”란 하나의 단백질을 코딩하는 유전자 부위에 두 개 이상의 유의한 염기서열 변이가 발견되어, 하나의 단백질이 두 개 이상의 유전자 염기서열 변이 점수를 갖게 되는 경우, 상기 유전자 염기서열 변이 점수를 종합하여 계산된 점수를 말하며, 만약 단백질을 코딩하는 유전자 부위에 유의한 염기서열 변이가 한 개인 경우에는 유전자 염기서열 변이 점수와 단백질 손상 점수가 동일하다. 이때, 단백질을 코딩하는 유전자 염기서열 변이가 두 개 이상인 경우, 단백질 손상 점수는 각 변이별로 계산된 유전자 염기서열 변이 점수들의 평균값으로 계산되며, 이러한 평균값은 예를 들면 기하평균, 산술평균, 조화평균, 산술기하평균, 산술조화평균, 기하조화평균, 피타고라스 평균, 사분평균, 이차평균, 절삭평균, 윈저화 평균, 가중평균, 가중기하평균, 가중산술평균, 가중조화평균, 함수의 평균, 멱평균, 일반화된 f-평균, 백분위수, 최대값, 최소값, 최빈값, 중앙값, 중앙범위, 중심경향도(measures of central tendency), 단순 곱 또는 가중곱, 또는 상기 산출값들의 함수 연산으로 계산될 수 있으나, 이에 제한되지 않는다. As used herein, the term "protein damage score" means that two or more significant nucleotide sequence mutations are found in a gene region encoding one protein, so that one protein has two or more gene sequence mutation scores, It refers to a score calculated by integrating the gene sequence variation scores, and if there is only one significant sequence variation in a gene region encoding a protein, the gene sequence variation score and the protein damage score are the same. At this time, when there are two or more gene sequence mutations encoding a protein, the protein damage score is calculated as the average value of the gene sequence mutation scores calculated for each mutation, and this average value is, for example, geometric mean, arithmetic mean, harmonic mean , arithmetic geometric mean, arithmetic harmonic mean, geometric harmonic mean, Pythagorean mean, quartile mean, quadratic mean, cut mean, Winsorized mean, weighted mean, weighted geometric mean, weighted arithmetic mean, weighted harmonic mean, function mean, power mean , generalized f-means, percentiles, maximums, minimums, modes, medians, median ranges, measures of central tendency, simple products or weighted products, or functional operations of the above calculations. , but not limited thereto.

본 발명에 따른 일 구현예에서는 하기 수학식 1에 의해 단백질 손상 점수를 산출하였으며, 하기 수학식 1은 다양한 변형이 가능하고 이에 제한되지 않는다. In one embodiment according to the present invention, the protein damage score was calculated by Equation 1 below, and Equation 1 below can be modified in various ways and is not limited thereto.

Figure 112016015957222-pat00001
Figure 112016015957222-pat00001

상기 수학식 1에서 S g 는 유전자 g가 코딩하는 단백질의 단백질 손상 점수, n은 상기 유전자 g의 염기서열 변이 중 분석대상인 염기서열 변이의 수, v i i 번째 유전자 염기서열 변이의 유전자 염기서열 변이 점수이고, p는 0이 아닌 실수이다. 상기 수학식 1에서 상기 p의 값이 1일 때는 산술평균, 상기 p의 값이 -1일 때는 조화평균이 되며, 상기 p의 값이 0에 가까워지는 극한의 경우에는 기하평균이 된다.In Equation 1, S g is the protein damage score of the protein encoded by gene g , n is the number of nucleotide sequence variations to be analyzed among the nucleotide sequence variations of gene g , v i is the gene sequence of the ith gene sequence variation is the variance score, and p is a non-zero real number. In Equation 1, when the value of p is 1, it becomes an arithmetic average, when the value of p is -1, it becomes a harmonic average, and when the value of p approaches 0, it becomes a geometric average.

본 발명에 따른 또 다른 일 구현예에서는 하기 수학식 2에 의해 단백질 손상 점수를 산출하였으며, 하기 수학식 2는 다양한 변형이 가능하고 이에 제한되지 않는다. In another embodiment according to the present invention, the protein damage score was calculated by Equation 2 below, and Equation 2 below can be modified in various ways and is not limited thereto.

Figure 112016015957222-pat00002
Figure 112016015957222-pat00002

상기 수학식 2에서 S g 는 유전자 g가 코딩하는 단백질의 단백질 손상 점수, n은 상기 유전자 g의 염기서열 변이 중 분석대상인 염기서열 변이의 수, v i i 번째 유전자 염기서열 변이의 유전자 염기서열 변이 점수, w i 는 상기 v i 에 부여되는 가중치이다. 모든 가중치 w i 가 같은 값을 갖는 경우 상기 단백질 손상 점수 S g 는 상기 유전자 염기서열 변이 점수 v i 의 기하평균값이 된다. 상기 가중치는 해당 단백질의 종류, 해당 단백질의 약동학적 또는 약력학적 분류, 해당 약물 효소 단백질의 약동학적 파라미터, 인구 집단 또는 인종별 분포를 고려하여 부여될 수 있다. In Equation 2, S g is the protein damage score of the protein encoded by gene g , n is the number of nucleotide sequence variations to be analyzed among the nucleotide sequence variations of gene g , v i is the gene sequence of the i th gene sequence variation A variance score, w i , is a weight given to v i . When all weights w i have the same value, the protein damage score S g becomes the geometric mean value of the gene sequence variation scores vi . The weight may be given in consideration of the type of the corresponding protein, the pharmacokinetic or pharmacodynamic classification of the corresponding protein, the pharmacokinetic parameter of the corresponding drug enzyme protein, and the population or racial distribution.

본 발명에서 사용된 용어 “약물 효소 단백질의 약동학적 파라미터”는 Vmax, Km, Kcat/Km 등을 포함하는 것이다. Vmax는 기질 농도가 매우 높을 때의 최대 효소 반응 속도이고, Km은 해당 반응이 1/2 Vmax에 도달하게 하는 기질의 농도이다. Km은 해당 효소와 해당 기질 간의 친화도로 볼 수 있으며, Km이 작을수록 해당 효소와 해당 기질 간의 결합이 강하다. 효소의 대사회전수라고도 불리는 Kcat은 해당 효소가 최대 속도로 활동하고 있을 때 각 효소 활성 부위 당 1초의 시간에 대사되는 기질 분자의 개수를 의미하며, 해당 효소 반응이 실제 얼마나 빠르게 일어나는지를 의미한다.The term “pharmacokinetic parameters of drug enzyme proteins” used in the present invention includes Vmax, Km, Kcat/Km and the like. Vmax is the maximum enzyme reaction rate at very high substrate concentrations, and Km is the substrate concentration that allows the reaction to reach 1/2 Vmax. Km can be viewed as an affinity between the enzyme and the substrate, and the smaller the Km, the stronger the bond between the enzyme and the substrate. Kcat, also called the metabolic turnover rate of an enzyme, means the number of substrate molecules metabolized in 1 second per each enzyme active site when the enzyme is active at its maximum rate, and it means how fast the corresponding enzyme reaction actually occurs.

본 발명의 방법은 다음 단계에서 상술한 단백질 손상 점수를 약물과 단백질 사이의 상호 관계와 연관지어 개인별 약물 점수를 산출한다. In the next step, in the method of the present invention, individual drug scores are calculated by associating the above-described protein damage scores with the mutual relationship between drugs and proteins.

본 발명에서 사용된 용어 “약물 점수”란 소정의 약물, 예를 들어 골다공증 치료제가 주어졌을 때, 해당 약물의 약력학 또는 약동학에 관여하는 표적 단백질, 약물 대사에 관여하는 효소 단백질, 수송체 단백질 또는 운반체 단백질들을 찾아내어, 해당 단백질들의 단백질 손상 점수를 계산한 후, 이를 다시 종합하여 하나의 약물에 대하여 산출된 값을 말한다. As used herein, the term “drug score” refers to a target protein involved in the pharmacodynamics or pharmacokinetics of a given drug, for example, a therapeutic agent for osteoporosis, an enzyme protein involved in drug metabolism, a transporter protein, or a transporter. After finding the proteins, calculating the protein damage score of the proteins, and putting them together again, it refers to the value calculated for one drug.

본 발명에서 약물 점수는 골다공증 치료제의 약력학 또는 약동학에 관여하는 단백질의 손상이 두 개 이상인 경우, 상기 단백질 손상 점수들의 평균값으로 계산되며, 이러한 평균값은 예를 들면 기하평균, 산술평균, 조화평균, 산술기하평균, 산술조화평균, 기하조화평균, 피타고라스 평균, 사분평균, 이차평균, 절삭평균, 윈저화 평균, 가중평균, 가중기하평균, 가중산술평균, 가중조화평균, 함수의 평균, 멱평균, 일반화된 f-평균, 백분위수, 최대값, 최소값, 최빈값, 중앙값, 중앙범위, 중심경향도(measures of central tendency), 단순 곱 또는 가중곱, 또는 상기 산출값들의 함수 연산으로 계산될 수 있으나, 이에 제한되지 않는다. In the present invention, the drug score is calculated as the average value of the protein damage scores when there are two or more protein damages involved in the pharmacodynamics or pharmacokinetics of the osteoporosis treatment, and this average value is, for example, geometric mean, arithmetic mean, harmonic mean, arithmetic mean Geometric mean, arithmetic harmonic mean, geometric harmonic mean, Pythagorean mean, quartile mean, quadratic mean, cut mean, Winsorized mean, weighted mean, weighted geometric mean, weighted arithmetic mean, weighted harmonic mean, function mean, power mean, generalization It can be calculated by the calculated f-mean, percentile, maximum value, minimum value, mode value, median value, median range, measures of central tendency, simple product or weighted product, or function operation of the above calculated values, but accordingly Not limited.

상기 약물 점수는 약물학적 특성을 고려하여 해당 약물, 즉 골다공증 치료제의 약력학 또는 약동학에 관여하는 표적 단백질, 약물 대사에 관여하는 효소 단백질, 수송체 단백질 및 운반체 단백질의 가중치를 조율하여 산출될 수 있으며, 상기 가중치는 해당 약물 효소 단백질의 약동학적 파라미터, 인구 집단 또는 인종별 분포 등을 고려하여 부여될 수 있다. 또한, 해당 약물과 직접 상호작용하지는 않지만, 해당 약물의 전구체 또는 해당 약물의 대사산물들과 상호작용하는 단백질, 예를 들면, 약물학적 패스웨이에 참여하는 단백질들의 단백질 손상 점수도 함께 고려하여 종합된 약물 점수를 산출할 수 있다. 또한, 해당 약물의 약력학 또는 약동학에 관여하는 단백질들과 유의하게 상호작용하는 단백질들의 단백질 손상 점수를 함께 고려하여 종합된 약물 점수를 산출할 수 있다. 상기 해당 약물의 약물학적 패스웨이에 참여하거나, 해당 단백질들과 유의하게 상호작용하거나 그 신호전달경로에 참여하는 단백질에 관한 정보는 PharmGKB (Whirl-Carrillo et al., Clinical Pharmacology & Therapeutics 2012;92(4):414-4171), The MIPS Mammalian Protein-Protein Interaction Database (Pagel etl al., Bioinformatics 2005;21(6):832-834), BIND (Bader et al., Biomolecular Interaction Network Database, Nucleic Acids Res. 2003 Jan 1;31(1):248-50), Reactome (Joshi-Tope et al., Nucleic Acids Res. 2005 Jan 1;33(Database issue):D428-32) 등의 공지된 생물학적 데이터베이스에서 검색할 수 있다. The drug score may be calculated by adjusting the weights of target proteins involved in pharmacodynamics or pharmacokinetics of the drug, that is, osteoporosis treatment, enzyme protein involved in drug metabolism, transporter protein, and transporter protein, in consideration of pharmacological properties, The weight may be assigned considering pharmacokinetic parameters of the drug enzyme protein, distribution by population or race, and the like. In addition, the protein damage scores of proteins that do not directly interact with the drug, but interact with the precursor or metabolites of the drug, for example, proteins participating in the pharmacological pathway, are also considered. A drug score can be calculated. In addition, a comprehensive drug score may be calculated by considering protein damage scores of proteins involved in pharmacodynamics or pharmacokinetics of the drug and proteins significantly interacting with each other. Information on proteins participating in the pharmacological pathway of the corresponding drug, interacting significantly with the corresponding proteins, or participating in the signaling pathway is found in PharmGKB (Whirl-Carrillo et al., Clinical Pharmacology & Therapeutics 2012;92( 4):414-4171), The MIPS Mammalian Protein-Protein Interaction Database (Pagel etl al., Bioinformatics 2005;21(6):832-834), BIND (Bader et al., Biomolecular Interaction Network Database, Nucleic Acids Res 2003 Jan 1;31(1):248-50), Reactome (Joshi-Tope et al., Nucleic Acids Res. 2005 Jan 1;33(Database issue):D428-32). can do.

본 발명에 따른 일 구현예에서는 하기 수학식 3에 의해 약물 점수를 산출하였으며, 하기 수학식 3은 다양한 변형이 가능하므로, 이에 제한되지 않는다. In one embodiment according to the present invention, the drug score was calculated by Equation 3 below, and since Equation 3 below can be modified in various ways, it is not limited thereto.

Figure 112016015957222-pat00003
Figure 112016015957222-pat00003

상기 수학식 3에서 S d 는 약물 d의 약물 점수, n은 상기 약물 d의 약력학 또는 약동학에 직접 관여하거나 해당 약물의 전구체 또는 해당 약물의 대사산물들과 상호작용하는 단백질, 예를 들면, 약물학적 패스웨이에 참여하는 유전자 군에서 선정된 하나 이상의 유전자가 코딩하는 단백질의 수, g i 는 상기 약물 d의 약력학 또는 약동학에 직접 관여하거나 해당 약물의 전구체 또는 해당 약물의 대사산물들과 상호작용하는 단백질, 예를 들면, 약물학적 패스웨이에 참여하는 유전자 군에서 선정된 하나 이상의 유전자가 코딩하는 단백질의 단백질 손상 점수이며, p는 0이 아닌 실수이다. 상기 수학식 3에서 상기 p의 값이 1일 때는 산술평균, 상기 p의 값이 -1일 때는 조화평균이 되며, 상기 p의 값이 0에 가까워지는 극한의 경우에는 기하평균이 된다.In Equation 3, S d is the drug score of drug d , n is a protein directly involved in the pharmacodynamics or pharmacokinetics of the drug d or interacting with the precursor or metabolites of the drug, for example, pharmacological The number of proteins encoded by one or more genes selected from the gene group participating in the pathway, g i is a protein directly involved in the pharmacodynamics or pharmacokinetics of the drug d or interacting with the precursor or metabolites of the drug , For example, a protein damage score of a protein encoded by one or more genes selected from a gene group participating in a pharmacological pathway, and p is a non-zero real number. In Equation 3, when the value of p is 1, it becomes an arithmetic average, when the value of p is -1, it becomes a harmonic average, and when the value of p approaches 0, it becomes a geometric average.

본 발명에 따른 또 다른 일 구현예에서는 하기 수학식 4에 의해 약물 점수를 산출하였으며, 하기 수학식 4는 다양한 변형이 가능하므로, 이에 제한되지 않는다. In another embodiment according to the present invention, the drug score was calculated by Equation 4 below, and since Equation 4 below can be modified in various ways, it is not limited thereto.

Figure 112016015957222-pat00004
Figure 112016015957222-pat00004

상기 수학식 4에서 S d 는 약물 d의 약물 점수, n은 상기 약물 d의 약력학 또는 약동학에 직접 관여하거나 해당 약물의 전구체 또는 해당 약물의 대사산물들과 상호작용하는 단백질, 예를 들면, 약물학적 패스웨이에 참여하는 유전자 군에서 선정된 하나 이상의 유전자가 코딩하는 단백질의 수, g i 는 상기 약물 d의 약력학 또는 약동학에 직접 관여하거나 해당 약물의 전구체 또는 해당 약물의 대사산물들과 상호작용하는 단백질, 예를 들면, 약물학적 패스웨이에 참여하는 유전자 군에서 선정된 하나 이상의 유전자가 코딩하는 단백질의 단백질 손상 점수이며, w i 는 상기 g i 에 부여되는 가중치이다. 모든 가중치 w i 가 같은 값을 갖는 경우 상기 약물 점수 S d 는 상기 단백질 손상 점수 g i 의 기하평균값이 된다. 상기 가중치는 해당 단백질의 종류, 해당 단백질의 약동학적 또는 약력학적 분류, 해당 약물 효소 단백질의 약동학적 파라미터, 인구 집단 또는 인종별 분포를 고려하여 부여될 수 있다. In Equation 4, S d is the drug score of drug d , n is a protein directly involved in the pharmacodynamics or pharmacokinetics of the drug d or interacting with the precursor or metabolites of the drug, for example, pharmacological The number of proteins encoded by one or more genes selected from the gene group participating in the pathway, g i is a protein directly involved in the pharmacodynamics or pharmacokinetics of the drug d or interacting with the precursor or metabolites of the drug , For example, a protein damage score of a protein encoded by one or more genes selected from a gene group participating in a pharmacological pathway, and w i is a weight given to the g i . When all weights w i have the same value, the drug score S d becomes the geometric mean value of the protein damage score g i . The weight may be given in consideration of the type of the corresponding protein, the pharmacokinetic or pharmacodynamic classification of the corresponding protein, the pharmacokinetic parameter of the corresponding drug enzyme protein, and the population or racial distribution.

본 발명에 따른 일 구현예의 방법에 사용되는 기하평균 계산법의 경우 약물과 단백질의 연관성이 갖는 특징과 상관없이 가중치를 모두 동일하게 부여하였지만, 본 발명에 따른 또 다른 구현예에서처럼 약물과 단백질의 연관성이 갖는 각 특징을 고려한 가중치를 부여하여 약물 점수를 산출하는 것이 가능하다. 예를 들어 약물의 표적 단백질과 약물과 관련된 수송체 단백질에는 다른 점수가 부여될 수 있다. 또한, 예를 들어 해당 약물 효소 단백질에는 그 약동학적 파라미터인 Km, Vmax, Kcat/Km를 가중치로 부여하여 약물 점수를 산출하는 것이 가능하다. 또한, 예를 들어 표적 단백질은 수송체 단백질과 비교하여 약리작용상 더 중요하다고 판단되므로 높은 가중치를 부여할 수 있고, 수송체 단백질이나 운반체 단백질은 농도에 민감한 약물에 대해서 높은 가중치가 부여될 수 있으며, 이에 제한되지 않는다. 가중치는 약물과 약물 관련 단백질 간의 상관관계, 약물과 단백질 상호작용의 특성에 따라 면밀히 조정될 수 있다. 예를 들면 표적 단백질에는 2점을, 수송체 단백질에는 1점을 부여하는 것과 같이 약물과 단백질의 상호작용의 특성에 대한 가중치를 부여한 정교한 알고리즘을 사용할 수 있다. In the case of the geometric mean calculation method used in the method of one embodiment according to the present invention, all weights were given the same regardless of the characteristics of the relationship between the drug and the protein, but as in another embodiment according to the present invention, the relationship between the drug and the protein It is possible to calculate the drug score by assigning a weight considering each characteristic. For example, different scores may be assigned to a drug's target protein and a drug-related transporter protein. In addition, for example, it is possible to calculate a drug score by assigning weights to the pharmacokinetic parameters Km, Vmax, and Kcat/Km of the corresponding drug enzyme protein. In addition, for example, since the target protein is judged to be more important in pharmacological action than the transporter protein, a high weight can be assigned, and the transporter protein or carrier protein can be given a high weight for a drug that is sensitive to concentration, , but not limited thereto. Weights can be carefully adjusted according to the relationship between the drug and the drug-related protein, and the nature of the drug-protein interaction. Sophisticated algorithms can be used that assign weights to the properties of drug-protein interactions, such as assigning 2 points to a target protein and 1 point to a transporter protein.

상기의 서술에서는 약물과 직접 상호작용하는 단백질만을 예로 들었지만, 본 발명에 따른 일 구현예에서와 같이 해당 약물의 전구체 또는 해당 약물의 대사산물들과 상호작용하는 단백질, 해당 약물의 약력학 또는 약동학에 관여하는 단백질들과 유의하게 상호작용하는 단백질, 그 신호전달경로에 참여하는 관련 단백질 정보를 활용하여 상기 수식의 예측능력을 향상시킬 수 있다. 즉 단백질-단백질 상호작용 네트워크 혹은 약물학적 패스웨이 정보를 활용하여 이에 관여하는 다양한 단백질의 정보를 사용할 수 있다. 즉 해당 약물과 직접 상호작용하는 단백질에 유의한 변이가 발견되지 않아 해당 단백질 손상 점수 계산값이 없거나 손상 없음(예를 들면, SIFT 알고리즘을 적용한 경우 1.0점)인 경우에도, 해당 단백질과 상호작용하거나 같은 신호전달경로에 참여하는 관련 단백질들의 단백질 손상 점수의 평균값(예를 들면, 기하평균치) 등을 해당 단백질의 단백질 손상 점수로 대신 사용하여, 약물 점수 산출에 사용할 수 있다.In the above description, only proteins directly interacting with drugs were taken as examples, but as in one embodiment according to the present invention, proteins interacting with precursors of the drug or metabolites of the drug, involved in the pharmacodynamics or pharmacokinetics of the drug. It is possible to improve the predictive ability of the formula by utilizing information on proteins that significantly interact with proteins that interact with each other and related proteins participating in the signal transduction pathway. That is, information on various proteins involved in protein-protein interaction networks or pharmacological pathway information can be used. In other words, no significant mutation was found in the protein that directly interacts with the drug, so there is no calculated value for the protein damage score or no damage (for example, 1.0 points when the SIFT algorithm is applied), but it does not interact with or interact with the protein. The average value (eg, geometric average) of protein damage scores of related proteins participating in the same signal transduction pathway may be used instead as the protein damage score of the corresponding protein to calculate the drug score.

상기의 개인별 약물 점수는 하나 이상의 연관 단백질에 대한 정보가 획득 가능한 모든 약물 또는 그 중 선별된 일부 약물에 대해서 산출할 수 있다. 또한, 이러한 개인별 약물 점수는 순위점수(rank)로 환산 가능하다. The individual drug score may be calculated for all drugs for which information on one or more associated proteins can be obtained or for selected drugs among them. In addition, these individual drug scores can be converted into a rank score.

본 발명의 방법은 상술한 개인별 약물 점수를 이용하여 상기 개인에 적용되는 약물, 즉 골다공증 치료제의 사용 여부를 결정하는 단계를 추가로 포함할 수 있다.The method of the present invention may further include determining whether to use a drug applied to the individual, that is, a therapeutic agent for osteoporosis, using the above-described individual drug score.

본 발명의 개인별 약물 점수는 모든 약물에 개별적으로 적용할 수 있지만, 질환별, 임상적 특징, 또는 작용방식 등의 분류별 또는 의학적 비교대상 약물 간에 적용하면 더 유용하다. 본 발명에서 사용 가능한 약물 분류체계는, 예를 들면 ATC (Anatomical Therapeutic Chemical Classification System) 코드, 미국에서 자주 처방되는 15가지 약물 목록 (top 15 frequently prescribed drug classes during 2005~2008 in the United States (Health, United States, 2011, Centers for Disease Control and Prevention)), 약물유전체학적 마커가 알려져 있어서 약물의 표시에 기재되는 약물 작용 정보에 영향을 줄 수 있는 약물, 또는 부작용 등으로 시장에서 퇴출된 약물 목록 등을 포함할 수 있다.The individual drug score of the present invention can be individually applied to all drugs, but it is more useful if it is applied to each category of disease, clinical characteristics, or mode of action, or among drugs subject to medical comparison. The drug classification system usable in the present invention, for example, ATC (Anatomical Therapeutic Chemical Classification System) code, list of 15 frequently prescribed drugs in the United States (top 15 frequently prescribed drug classes during 2005 ~ 2008 in the United States (Health, United States, 2011, Centers for Disease Control and Prevention)), a list of drugs with known pharmacogenomic markers that may affect drug action information listed on drug labels, or drugs withdrawn from the market due to side effects, etc. can include

본 발명의 방법은 처방 점수를 계산하는 단계를 추가로 포함할 수 있다. The method of the present invention may further include calculating a prescription score.

본 발명에서 사용된 용어 “처방 점수”란 두 개 이상 복수의 약물이 동시에 혹은 서로의 약리작용에 유의한 영향을 미칠 만큼 짧은 시간 간격을 두고 투약되는 경우, 상기 각 약물에 대하여 결정된 상기 약물 점수를 종합하여 계산되는 점수를 말한다. 본 발명에서 처방점수는 상기 약물 간의 우선순위에 의해 결정된 약물이 두 개 이상이고 동시 투약이 필요한 경우, 상기 각 약물에 대하여 결정된 약물 점수를 종합하여 산출될 수 있다. 처방 점수의 계산은, 예를 들어, 해당 복수 약물과 공통으로 상호작용하는 단백질이 존재하지 않는 경우에는, 단순히 해당 복수 약물의 약물 점수들을 평균 내거나 합산 혹은 곱함으로써 산출할 수 있다. 해당 복수 약물과 공통으로 상호작용하는 단백질이 존재하는 경우에는, 해당 공통 상호작용 단백질의 단백질 손상 점수에, 예를 들면 2배의 가중치를 부여하여 각각의 약물 점수를 산출한 후, 해당 약물 점수들을 합산함으로써 처방 점수를 산출할 수 있다. The term "prescription score" as used in the present invention refers to the drug score determined for each drug when two or more drugs are administered simultaneously or with a short time interval sufficient to significantly affect each other's pharmacological actions. It is a score that is calculated as a sum of points. In the present invention, the prescription score may be calculated by summarizing the drug scores determined for each drug when two or more drugs determined by the order of priority among the drugs are required and simultaneous administration is required. The calculation of the prescription score may be calculated by simply averaging, summing, or multiplying drug scores of the plurality of drugs, for example, when there is no protein that interacts with the plurality of drugs in common. If there is a protein that interacts with multiple drugs in common, each drug score is calculated by assigning, for example, a 2-fold weight to the protein damage score of the common interacting protein, and then the corresponding drug scores are calculated. By summing, the prescription score can be calculated.

처방 점수는 개별 약물의 효과를 넘어서서, 개인에 대해 적용되는 처방(전) 안에 포함된 복수 약물 처방의 적정성 혹은 위험성을 판단하기 위한 것이다. 이러한 측면에서 본 발명의 방법은 개인에 대해 적용되는 처방(전)의 적정성 혹은 위험성을 판단하는 단계를 추가로 포함할 수 있다. The prescription score is intended to go beyond the effects of individual drugs and determine the appropriateness or risk of multiple drug prescriptions included in the prescription (previous) applied to the individual. In this respect, the method of the present invention may further include a step of determining the appropriateness or risk of the prescription (previous) applied to the individual.

본 발명의 방법은 골다공증 치료제 부작용 방지를 목적으로 수행되는 것을 포함하며, 이에 제한되지 않는다. The method of the present invention includes, but is not limited to, performed for the purpose of preventing side effects of an osteoporosis treatment agent.

도 1은 본 발명의 일 구현예에 따른 개인 유전체 염기서열 변이를 이용한 골다공증 치료제 선택을 위한 정보를 제공하는 방법의 각 단계를 보여주는 흐름도이다. 본 발명에 따른 일 구현예에서는 (1) 개인 사용자의 유전체 염기서열 정보 입력 또는 수신 (S100), (2) 골다공증 치료제 관련 정보 입력 또는 수신 (S110), (3) 개인 사용자의 유전자 염기서열 변이 정보 결정 (S120), (4) 골다공증 치료제에 대한 개인별 단백질 손상 점수 계산 (S130), (5) 골다공증 치료제에 대한 개인별 약물 점수 계산 (S140), (6) 약물 점수 표기, 약물 점수 순위별 정렬 또는 우선순위 결정 (S150), 및 (7) 약물 점수와 우선순위를 고려한 골다공증 치료제 선택 및 처방점수 계산 (S160)의 순서로 골다공증 치료제 선택을 위한 정보를 제공하는 방법이 진행된다.1 is a flowchart showing each step of a method for providing information for selecting an osteoporosis treatment using personal genome sequence variation according to an embodiment of the present invention. In one embodiment according to the present invention, (1) input or receive genome sequence information of an individual user (S100), (2) input or receive osteoporosis treatment-related information (S110), (3) gene sequence mutation information of an individual user Determination (S120), (4) Calculation of individual protein damage score for osteoporosis treatment (S130), (5) Calculation of individual drug score for osteoporosis treatment (S140), (6) Display of drug score, sorting or prioritizing drug score A method for providing information for selecting an osteoporosis treatment proceeds in order of determining the ranking (S150) and (7) selecting an osteoporosis treatment considering drug scores and priorities and calculating a prescription score (S160).

본 발명에 따른 방법은 상기 순위별로 정렬된 약물 점수를 선택하면, 해당 약물 점수가 산출된 약물유전체학적 계산과정과 근거를 그림, 도표 및 설명 등의 정보로 제공하여 처방의사의 판단을 돕는 단계를 추가로 포함할 수 있다. 즉, 본 발명에 따른 방법은 본 발명의 약물 순위 결정의 근거가 된, 유전자 염기서열 변이 정보, 유전자 염기서열 변이 점수, 단백질 손상 점수, 약물 점수 및 그 산출에 사용된 정보 중 하나 이상의 정보를 제공하는 단계를 추가로 포함할 수 있다.The method according to the present invention provides the pharmacogenomic calculation process and basis for calculating the drug score as information such as pictures, diagrams, and explanations to help the prescribing doctor's judgment when selecting the drug scores sorted by rank. can be further included. That is, the method according to the present invention provides one or more of gene sequence variation information, gene sequence variation score, protein damage score, drug score, and information used for the calculation, which are the basis for drug ranking of the present invention. An additional step may be included.

다른 양태에서 본 발명은 개인에 대해 적용할 수 있는는 골다공증 치료제에 대하여, 상기 골다공증 치료제와 관련된 유전자 또는 단백질과 관련된 정보 검색 또는 추출이 가능한 데이터베이스; 상기 데이터베이스에 접근 가능한 통신부; 상기 정보에 기초하여 상기 골다공증 치료제의 약력학 또는 약동학에 관여하는 하나 이상의 유전자 염기서열 변이 정보를 산출하는 제1 산출모듈; 상기 유전자 염기서열 변이 정보를 이용하여 개인별 단백질 손상 점수를 산출하는 제2 산출모듈; 상기 개인별 단백질 손상 점수를 약물과 단백질 사이의 상호 관계와 연관지어, 개인별 약물 점수를 산출하는 제3 산출모듈; 및 상기 산출모듈에서 산출된 산출값을 표시하는 표시부를 포함하는, 개인 유전체 염기서열 변이를 이용한 골다공증 치료제 선택 시스템에 관한 것이다. In another aspect, the present invention relates to a therapeutic agent for osteoporosis that can be applied to an individual, a database capable of searching or extracting information related to a gene or protein related to the therapeutic agent for osteoporosis; a communication unit capable of accessing the database; A first calculation module for calculating information on one or more gene sequence mutations involved in pharmacodynamics or pharmacokinetics of the osteoporosis treatment based on the information; a second calculation module for calculating individual protein damage scores using the gene sequence mutation information; a third calculation module for calculating an individual drug score by associating the individual protein damage score with a relationship between a drug and a protein; and a display unit for displaying the calculated value calculated by the calculation module.

본 발명에서 모듈이라 함은, 본 발명에 따른 기술적 사상을 수행하기 위한 하드웨어 및 상기 하드웨어를 구동하기 위한 소프트웨어의 기능적, 구조적 결합을 의미할 수 있다. 예컨대, 상기 모듈은 소정의 코드와 상기 소정의 코드가 수행되기 위한 하드웨어 리소스(resource)의 논리적인 단위를 의미할 수 있으며, 반드시 물리적으로 연결된 코드를 의미하거나, 한 종류의 하드웨어를 의미하는 것은 아님은 본 발명 기술분야의 당업자에게 자명한 것이다. In the present invention, a module may mean a functional and structural combination of hardware for implementing the technical idea according to the present invention and software for driving the hardware. For example, the module may mean a logical unit of a predetermined code and a hardware resource for executing the predetermined code, and does not necessarily mean a physically connected code or one type of hardware. is apparent to those skilled in the art.

본 발명에서 사용된 용어 “산출모듈”은 본 발명의 방법에 따라 분석대상이 되는 골다공증 치료제 및 유전자에 대하여, 상기 유전자 염기서열 변이 점수, 단백질 손상 점수, 약물 점수 및 그 산출의 근거가 되는 정보 및 상기 정보를 근거로 각 점수를 계산하는 소정의 코드와 상기 소정의 코드가 수행되기 위한 하드웨어 리소스(resource)의 논리적인 단위를 의미할 수 있으며, 반드시 물리적으로 연결된 코드를 의미하거나, 한 종류의 하드웨어를 의미하는 것은 아니다. The term “calculation module” used in the present invention refers to the gene sequence mutation score, protein damage score, drug score and information that is the basis for calculating the gene sequence mutation score, protein damage score, and drug score for the osteoporosis therapeutic agent and gene to be analyzed according to the method of the present invention. It may mean a predetermined code that calculates each score based on the information and a logical unit of hardware resources for executing the predetermined code, and necessarily means a code that is physically connected, or a type of hardware. does not mean

본 발명에 따른 시스템은 또한 상기 제3 산출모듈에서 산출된 상기 개인별 약물 점수를 이용하여 상기 개인에 적용되는 골다공증 치료제의 사용 여부를 결정하는 제4 산출모듈을 추가로 포함할 수 있다. The system according to the present invention may further include a fourth calculation module for determining whether to use the osteoporosis treatment applied to the individual by using the individual drug score calculated in the third calculation module.

본 발명에 따른 시스템은 또한 약물 간의 우선순위에 의해 결정된 약물이 두 개 이상이고 동시 투약이 필요한 경우, 상기 각 약물에 대하여 결정된 상기 약물 점수를 종합하여 처방 점수로 산출하는 제5 산출모듈을 추가로 포함할 수 있다.The system according to the present invention also adds a fifth calculation module for calculating the prescription score by integrating the drug scores determined for each drug when two or more drugs determined by the priority between drugs are required and simultaneous administration is required can include

본 발명에 따른 시스템은 상기 사용자에 의해 골다공증 치료제 목록을 입력하거나, 또는 골다공증 치료제에 대한 정보를 포함하는 데이터베이스에 접근하여 관련 정보를 추출하고, 이에 따라 상기 약물의 약물 점수를 산출하여 제공하는 사용자 인터페이스를 추가로 포함할 수 있다. The system according to the present invention is a user interface in which the user inputs a list of treatments for osteoporosis, or accesses a database including information on an osteoporosis treatment, extracts related information, and calculates and provides a drug score of the drug accordingly. may additionally include.

본 발명에 따른 시스템은 또한 각 산출모듈에서 산출된 값 또는 약물 간의 우선순위가 결정된 계산과정 및 상기 산출 또는 계산의 기초가 된 정보를 추가로 표시하는 표시부를 추가로 포함할 수 있다. The system according to the present invention may further include a display unit for additionally displaying a calculation process in which the value calculated by each calculation module or the priority between drugs is determined and information based on the calculation or calculation.

본 발명에 따른 시스템에서, 상기 데이터베이스 또는 그 접근 정보를 포함하는 서버, 산출된 정보 및 이와 연결된 사용자 인터페이스 장치는 서로 연계되어 사용될 수 있다. In the system according to the present invention, the server including the database or its access information, the calculated information, and the user interface device connected thereto may be used in conjunction with each other.

본 발명에 따른 시스템은 약물-단백질 상호관계에 대한 약물학/생화학적 새로운 정보가 산출되는 경우 즉시 업데이트되어 더 향상된 골다공증 치료제 선택에 사용될 수 있다. 본 발명에 따른 일 구현예에서는 데이터베이스 또는 지식베이스의 갱신에 따라, 상기 각 산출모듈에 저장된 상기 유전자 염기서열 변이 정보, 유전자 염기서열 변이 점수, 단백질 손상 점수, 약물 점수 및 그 산출의 근거가 되는 정보가 갱신된다. The system according to the present invention is immediately updated when new pharmacological/biochemical information on the drug-protein interaction is generated, so that it can be used to select a more improved osteoporosis treatment. In one embodiment according to the present invention, the gene sequence mutation information, gene sequence mutation score, protein damage score, drug score, and information based on the calculation are stored in each of the calculation modules according to the update of the database or knowledge base. is updated

도 2는 본 발명의 일 구현예에 따른 개인 유전체 염기서열 변이를 이용한 골다공증 치료제 선택 시스템의 개략적 구성도이다. 본 발명의 시스템(10)은 골다공증 치료제와 관련된 유전자 또는 단백질과 관련된 정보 검색 또는 추출이 가능한 데이터베이스(DB)(100), 통신부(200), 사용자 인터페이스 또는 단말(300), 산출부(400) 및 표시부(500)를 포함하여 구성될 수 있다. 2 is a schematic configuration diagram of an osteoporosis drug selection system using individual genome sequence mutations according to an embodiment of the present invention. The system 10 of the present invention includes a database (DB) 100 capable of searching or extracting information related to a gene or protein related to a therapeutic agent for osteoporosis, a communication unit 200, a user interface or terminal 300, a calculation unit 400, and It may be configured to include the display unit 500 .

본 발명에 따른 시스템에서 사용자 인터페이스 또는 단말(300)은 서버로부터 개인 유전체 염기서열 변이를 이용한 골다공증 치료제 선택 처리를 요청, 결과 수신 및/또는 저장할 수 있으며, 스마트 폰, PC(Personal Computer), 태블릿 PC, 개인 휴대 정보 단말기(Personal Digital Assistant, PDA), 웹 패드 등과 같이 메모리 수단을 구비하고 마이크로프로세서를 탑재하여 연산 능력을 갖춘 이동 통신 기능을 구비한 단말기로 구성될 수 있다.In the system according to the present invention, the user interface or terminal 300 may request osteoporosis treatment selection process using personal genome sequence mutation from the server, receive and/or store the result, and may be a smart phone, a PC (Personal Computer), or a tablet PC. , a personal digital assistant (PDA), a terminal equipped with a memory means such as a web pad and equipped with a microprocessor and equipped with a mobile communication function equipped with an arithmetic capability.

본 발명에 따른 시스템에서 서버는 골다공증 치료제, 유전자 변이 또는 약물-단백질 상호관계에 대한 데이터베이스(100)에 대한 접근을 제공하는 수단으로, 통신부(200)을 통해 사용자 인터페이스 또는 단말(300)과 연결되어 각종 정보를 교환할 수 있도록 구성된다. 여기서, 통신부(200)는 동일한 하드웨어에서의 통신은 물론, 구내 정보 통신망(local area network, LAN), 도시권 통신망(metropolitan area network, MAN), 광역 통신망(wide area network, WAN), 인터넷, 2G, 3G, 4G 이동 통신망, 와이파이(Wi-Fi), 와이브로(Wibro) 등을 포함할 수 있으며, 통신 방식도 유선, 무선을 가리지 않으며 어떠한 통신 방식이라도 상관없다. 데이터베이스(100) 또한 서버에 직접 설치된 것뿐 아니라 목적에 따라 인터넷 등을 통해 접근 가능한 다양한 생명과학 데이터베이스에 연결될 수 있다. In the system according to the present invention, the server is a means for providing access to the database 100 for osteoporosis drugs, gene mutations, or drug-protein interactions, and is connected to the user interface or terminal 300 through the communication unit 200. It is configured to exchange various types of information. Here, the communication unit 200 is not only communication in the same hardware, but also a local area network (LAN), a metropolitan area network (MAN), a wide area network (WAN), the Internet, 2G, It may include 3G, 4G mobile communication networks, Wi-Fi, Wibro, etc., and the communication method does not cover wired or wireless, and any communication method may be used. The database 100 may also be directly installed on the server and may be connected to various life science databases accessible through the Internet or the like depending on the purpose.

본 발명에 따른 시스템에서 산출부(400)는 상술한 바와 같이 수집/입력된 정보를 이용하여 골다공증 치료제의 약력학 또는 약동학에 관여하는 하나 이상의 유전자 변이 정보를 산출하는 제1 산출모듈(410), 개인별 단백질 손상 점수를 산출하는 제2 산출모듈(420), 개인별 약물 점수를 산출하는 제3 산출모듈(430)을 포함하여 구성될 수 있다. In the system according to the present invention, the calculation unit 400 is a first calculation module 410 for calculating one or more gene mutation information involved in the pharmacodynamics or pharmacokinetics of the osteoporosis treatment using the collected/input information as described above, It may include a second calculation module 420 that calculates a protein damage score and a third calculation module 430 that calculates an individual drug score.

본 발명에 따른 방법은 하드웨어, 펌웨어, 또는 소프트웨어 또는 이들의 조합으로 구현될 수 있다. 소프트웨어로 구현되는 경우 저장매체는 컴퓨터와 같은 장치에 의해 판독 가능한 형태의 저장 또는 전달하는 임의의 매체를 포함한다. 예를 들면 컴퓨터 판독 가능한 매체는 ROM(read only memory); RAM(random access memory); 자기디스크 저장 매체; 광저장 매체; 플래쉬 메모리 장치 및 기타 전기적, 광학적 또는 음향적 신호 전달 매체 등을 포함한다. The method according to the present invention may be implemented in hardware, firmware, or software or a combination thereof. When implemented as software, the storage medium includes any medium that stores or transmits data in a form readable by a device such as a computer. For example, a computer readable medium may include read only memory (ROM); random access memory (RAM); magnetic disk storage media; optical storage media; It includes flash memory devices and other electrical, optical or acoustic signal transmission media.

이러한 측면에서 본 발명은 개인 유전체 염기서열 정보로부터 골다공증 치료제의 약력학 또는 약동학에 관여하는 유전자 염기서열 변이 정보를 입수하는 단계; 상기 유전자 염기서열 변이 정보를 이용하여 개인별 단백질 손상 점수를 산출하는 단계; 및 상기 개인별 단백질 손상 점수를 약물과 단백질 사이의 상호 관계와 연관지어, 개인별 약물 점수를 산출하는 단계를 포함하는 동작을 수행하는 프로세서를 실행시키는 실행모듈을 포함하는 컴퓨터 판독 가능한 매체를 제공한다. In this aspect, the present invention comprises the steps of obtaining gene sequence mutation information involved in the pharmacodynamics or pharmacokinetics of a therapeutic agent for osteoporosis from personal genome sequence information; Calculating individual protein damage scores using the gene sequence mutation information; and an execution module that executes a processor that performs an operation including calculating the individual drug score by associating the individual protein damage score with a mutual relationship between a drug and a protein.

상기 프로세서는 상기 개인별 약물 점수를 이용하여 상기 개인에 적용되는 골다공증 치료제의 사용 여부를 결정하는 단계를 추가로 포함할 수 있다.The processor may further include determining whether to use the osteoporosis treatment applied to the individual by using the individual drug score.

또 다른 양태에서 본 발명은 골다공증 치료제 부작용 예측용 바이오 마커 조성물을 제공한다. In another aspect, the present invention provides a biomarker composition for predicting side effects of a therapeutic agent for osteoporosis.

본 발명에 따른 바이오 마커 조성물에 포함될 수 있는 유전자에는, FGFR4, IGHMBP2, ARHGEF26, HBXIP, CD1A, ZNF57, LAMA4, SIPA1, GPC4, PSMD9, AKNA, ANKRD50, DUSP13, PIK3R1, C4orf14, GPR174, CHDH, AC018682.6, SLC12A4, ADARB2, CD3G, ZFYVE20, ASZ1, ARHGEF4, FAT4, OR2M5, HPS1, ZNF235, P4HB, ATP11C, SYNE1, ADCY3, PGLYRP3, MAGEA12, TMEM187, OR4S1, KRTAP5-4, SERPINI2, BTNL2, CXorf1, PRG4, VAMP8, CSAG1, C1orf27, C1orf229, LRRTM3, SPDEF, GZMA, LTBP1, OBP2A 등이 포함되며, 이로 제한되는 것은 아니다. 상기 유전자 또는 이의 단백질의 변이를 분석함으로써 골다공증 치료제 부작용 발생을 예측할 수 있는바, 이를 검출할 수 있는 제제를 이용하여 마커로 활용할 수 있다. Genes that may be included in the biomarker composition according to the present invention include FGFR4, IGHMBP2, ARHGEF26, HBXIP, CD1A, ZNF57, LAMA4, SIPA1, GPC4, PSMD9, AKNA, ANKRD50, DUSP13, PIK3R1, C4orf14, GPR174, CHDH, AC018682. 6, SLC12A4, ADARB2, CD3G, ZFYVE20, ASZ1, ARHGEF4, FAT4, OR2M5, HPS1, ZNF235, P4HB, ATP11C, SYNE1, ADCY3, PGLYRP3, MAGEA12, TMEM187, OR4S1, KRTAP5-4, SERPINI2, BTNL2, CXorf1, PRG4, VAMP8, CSAG1, C1orf27, C1orf229, LRRTM3, SPDEF, GZMA, LTBP1, OBP2A, and the like, but are not limited thereto. By analyzing mutations of the gene or its protein, it is possible to predict the occurrence of side effects of the osteoporosis treatment, and it can be used as a marker using an agent capable of detecting it.

이하, 하기 실시예를 통하여 본 발명을 보다 상세히 설명한다. 이들 실시예는 본 발명을 상세히 설명하기 위한 것으로 본 발명의 범위가 이들 실시예에 의해 제한되는 것은 아니다.Hereinafter, the present invention will be described in more detail through the following examples. These examples are intended to explain the present invention in detail, and the scope of the present invention is not limited by these examples.

실시예 1. 골다공증치료제인 비스포스포네이트 처치에서 심각한 부작용 경고 사인을 보인 골다공증 환자의 개인 유전체 염기서열 변이 정보 분석 및 적용Example 1. Analysis and application of individual genomic sequence mutation information of osteoporosis patients who showed warning signs of serious side effects in treatment with bisphosphonates, an osteoporosis treatment drug

골다공증은 골밀도가 낮아지고 골 조직 내 미세구조의 변화가 일어남으로 인해 전반적인 뼈가 쉽게 파괴될 수 있는 상태를 말한다. 환자들은 골절과 함께 골다공증을 진단받는 경우가 흔한데, 골다공증 환자의 경우 주로 척추 압박 골절 혹은 엉덩뼈 골절이 나타난다. 가장 흔히 나타나는 폐경 후 여성에서의 골다공증은 에스트로겐 감소로 인하여 파골세포의 기능이 항진되고 조골세포의 기능이 감소되면서 나타난다. 이외에 노화로 인하여 조골세포의 기능이 감소되고 체내 칼슘이 부족하여 골다공증이 나타나기도 하며, 기타 신성과칼슘뇨증, 쿠싱 증후군, 안드로겐 불감 증후군, 염증성 장질환, 악성 종양의 골전이 등 이차적인 원인에 의해 나타나기도 한다. Osteoporosis refers to a condition in which overall bone can be easily destroyed due to a decrease in bone density and a change in microstructure in bone tissue. It is common for patients to be diagnosed with osteoporosis along with a fracture, and in the case of osteoporosis patients, vertebral compression fractures or hip fractures are common. Osteoporosis in postmenopausal women, which is most common, occurs when the function of osteoclasts is enhanced and the function of osteoblasts is reduced due to a decrease in estrogen. In addition, osteoblast function is reduced due to aging and osteoporosis may occur due to lack of calcium in the body, and other secondary causes such as renal hypercalciuria, Cushing's syndrome, androgen insensitivity syndrome, inflammatory bowel disease, and bone metastasis of malignant tumors may occur. may also appear

한편, 골다공증 치료제의 일종인 비스포스포네이트(bisphosphonate)는 골 대사에 영향을 미치는 약물로, 파골세포를 억제함으로써 골밀도를 유지시켜주는 약물이다. 비스포스포네이트는 골밀도 감소 억제와 골절 예방 효과가 입증되어 현재 골다공증 치료의 일차 치료제로 사용되고 있고 고령화와 함께 증가하는 골다공증 유병율에 따라 그 사용이 광범위하게 증가하고 있다. 선행연구에 의하면, 2008년 우리나라에서 사용된 골다공증 관련 약제 중 비스포스포네이트가 68%로 가장 많이 사용되었다. On the other hand, bisphosphonate, a kind of osteoporosis treatment, is a drug that affects bone metabolism and maintains bone density by inhibiting osteoclasts. Bisphosphonates have been proven to inhibit bone density loss and prevent fractures, and are currently used as the primary treatment for osteoporosis, and their use is widely increasing due to the increasing prevalence of osteoporosis with aging. According to previous studies, among the osteoporosis-related drugs used in Korea in 2008, bisphosphonates were the most used at 68%.

그러나 최근 비스포스포네이트를 장기간 사용함에 따라 악골 괴사(OsteoNecrosis of the jaw, ONJ) 등 부작용 사례가 잇따라 보고되면서 비스포네이트 장기 복용의 안전성에 대한 문제제기가 된 상황이다. 악골 괴사의 경우는 임상적으로 드물게(1/1000~1/100,000) 발생하나 한번 발생하면 치료에 어려움이 있어 예방책이 절실한 상황이다. However, with the recent long-term use of bisphosphonates, side effects such as osteonecrosis of the jaw (ONJ) have been reported one after another, raising questions about the safety of long-term use of bisphosphonates. The case of jaw bone necrosis occurs clinically rarely (1/1000 to 1/100,000), but once it occurs, it is difficult to treat, so preventive measures are urgently needed.

이에 약물 투여 전에 약물의 부작용을 예측하기 위한 방법으로 위에서 언급된 약물유전체학이 사용될 수 있다. 기존 연구를 통해 비스포스포네이트와 관련된 악골 괴사(Bisphosphonate-Relate OsteoNecrosis of the Jaw, BRONJ)와 같은 부작용의 위험성이 유전자형과 관련되어 있음이 밝혀졌다. 선행연구에서 전장유전체 분석 결과 상기 BRONJ 환자군에서 RBMS3 gene의 intron영역에 존재하는 SNP인 rs17024608의 비율이 통계적으로 유의하게 높았다(p-value<7x10-8;odds ratio, 5.8; 95% confidence interval, 3.1-11.1)(Paola N. et al., 2012).Accordingly, the above-mentioned pharmacogenomics can be used as a method for predicting side effects of a drug before drug administration. Previous studies have shown that the risk of side effects such as Bisphosphonate-Relate OsteoNecrosis of the Jaw (BRONJ) is related to genotype. As a result of whole genome analysis in previous studies, the ratio of rs17024608, a SNP present in the intron region of the RBMS3 gene, was statistically significantly high in the BRONJ patient group (p-value <7x10-8; odds ratio, 5.8; 95% confidence interval, 3.1 -11.1) (Paola N. et al., 2012).

본 발명의 개인 유전체 염기서열 변이를 이용한 골다공증 치료제 선택 제공 방법을 이용하여, 골다공증 치료제의 일종인 비스포스포네이트 치료 반응 위험군을 구분할 수 있는지를 확인하기 위하여, 하기와 같은 실험을 수행하였다. In order to confirm whether a group at risk of responding to bisphosphonate treatment, which is a type of osteoporosis treatment, can be distinguished using the method for providing selection and provision of an osteoporosis treatment using individual genome sequence mutations of the present invention, the following experiment was performed.

골다공증 환자 중 비스포스포네이트 투약 치료 중 부작용(MRONJ, Medication-Related OsteoNecrosis of Jaw)이 나타난 군(n=38)과 부작용이 나타나지 않은 군(n=30)을 나누어 유전자 염기서열 비교 분석을 수행하였다. Among osteoporosis patients, a genetic sequence comparison analysis was performed by dividing a group (n = 38) with side effects (MRONJ, Medication-Related OsteoNecrosis of Jaw) and a group without side effects (n = 30) during bisphosphonate treatment.

상기 68례의 개인 유전체 염기서열 변이 정보 수득을 위하여 Life Technology사의 Ion AmpliSeq Exome Kit을 이용하여 80배수 전장 엑솜 염기서열 해독법 (Whole Exome Sequencing)을 수행하였다. 이 때 상기 방법 외에 엑솜 외에 개인의 유전체 전체의 정보를 얻어내는 전장 유전체 염기서열 해독법 (Whole Genome Sequencing) 또는 500-1000개의 골다공증 관련 주요 유전자에 대한 표적 엑솜 염기서열 해독법 (Targeted Exome Sequencing) 을 대안적으로 수행할 수 있다.In order to obtain information on individual genome sequence mutations of the 68 cases, 80-fold whole exome sequencing was performed using Life Technology's Ion AmpliSeq Exome Kit. At this time, in addition to the above methods, Whole Genome Sequencing, which obtains information on the entire genome of an individual in addition to the exome, or Targeted Exome Sequencing for 500-1000 osteoporosis-related major genes, is an alternative can be done with

분석된 염기서열 절편은 데이터 정비(Data Cleaning)와 품질확인(Quality Check)의 과정을 거쳐 인간 참조군 서열(예, HG19)에 맞추어 정렬된 SAM (Sequence Alignment Map) 및 BAM (Binary Alignment Map) 파일 형식으로 출력되었다. 상기 클린 배열 결과(cleaned alignment result)는 SAMTools:pileup, SAMTools:mpileup, GATK:recalibration, GATK:realignment 등의 소프트웨어 도구를 활용하여 단일염기변이(SNVs, Single Nucleotide Variants), InDels 등의 변이를 검출하여 VCF(Variant Calling Format) 형식의 파일로 출력되었다.The analyzed nucleotide sequence fragments are SAM (Sequence Alignment Map) and BAM (Binary Alignment Map) files aligned to the human reference sequence (eg, HG19) through the process of data cleaning and quality check. output in the form The clean alignment result is detected by software tools such as SAMTools:pileup, SAMTools:mpileup, GATK:recalibration, and GATK:realignment to detect mutations such as SNVs (Single Nucleotide Variants) and InDels. It was output as a file in VCF (Variant Calling Format) format.

상기 유전자 염기서열 변이 정보를 담은 VCF 파일을 입력받아 전술한 유전자 염기서열 변이 점수 vi값을 SIFT 알고리즘을 활용하여 각 변이별로 계산한 후, 수학식 2를 이용하여 개인별 단백질 손상 점수 Sg를 산출하였다. 이어 상기 부작용이 나타난 38례와 건강 대조군 30례에서 각 유전자에 대하여 상기 개인별 단백질 손상점수를 비교하였다. 상기 부작용 군과 대조군에서 통계적으로 유의한 차이를 보인 50개의 유전자를 하기와 같이 선별하였으며, p-값(value)을 기준으로 통계적 유의성이 더 높은 유전자 32개를 제1군으로 선별하였다. 하기 유전자들은 비스포스포네이트 및 그 대사산물의 약력학 또는 약동학에 높은 관련성이 있는 유전자에 해당한다. After receiving the VCF file containing the gene sequence mutation information, the gene sequence mutation score vi value described above was calculated for each mutation using the SIFT algorithm, and then the individual protein damage score Sg was calculated using Equation 2. Subsequently, the individual protein damage scores were compared for each gene in 38 cases with side effects and 30 cases in the healthy control group. Fifty genes showing a statistically significant difference between the side effect group and the control group were selected as follows, and 32 genes with higher statistical significance based on p-value were selected as the first group. The following genes correspond to genes highly related to the pharmacodynamics or pharmacokinetics of bisphosphonates and their metabolites.

(제1군)(first group)

FGFR4, IGHMBP2, ARHGEF26, HBXIP, CD1A, ZNF57, LAMA4, SIPA1, GPC4, PSMD9, AKNA, ANKRD50, DUSP13, PIK3R1, C4orf14, GPR174, CHDH, AC018682.6, SLC12A4, ADARB2, CD3G, ZFYVE20, ASZ1, ARHGEF4, FAT4, OR2M5, HPS1, ZNF235, P4HB, ATP11C, SYNE1, ADCY3FGFR4, IGHMBP2, ARHGEF26, HBXIP, CD1A, ZNF57, LAMA4, SIPA1, GPC4, PSMD9, AKNA, ANKRD50, DUSP13, PIK3R1, C4orf14, GPR174, CHDH, AC018682.6, SLC12A4, ADARB2, CD3G, ZFYVE20, ASZ1, ARHGEF FAT4, OR2M5, HPS1, ZNF235, P4HB, ATP11C, SYNE1, ADCY3

(제2군)(2nd group)

PGLYRP3, MAGEA12, TMEM187, OR4S1, KRTAP5-4, SERPINI2, BTNL2, CXorf1, PRG4, VAMP8, CSAG1, C1orf27, C1orf229, LRRTM3, SPDEF, GZMA, LTBP1, OBP2APGLYRP3, MAGEA12, TMEM187, OR4S1, KRTAP5-4, SERPINI2, BTNL2, CXorf1, PRG4, VAMP8, CSAG1, C1orf27, C1orf229, LRRTM3, SPDEF, GZMA, LTBP1, OBP2A

이와 같이 선별된 유전자군에 대하여 본 발명의 방법을 이용하여 개인별 약물점수를 산출하였다. 보다 구체적으로, 각 개인별 유전자 염기서열 변이 정보로부터 SIFT 알고리즘을 이용하여 유전자 염기서열 변이 점수를 산출한 후, 수학식 2를 사용하여 상기 50개 유전자에 대한 개인별 단백질 손상 점수를 산출하였고, 수학식 4를 사용하여 비스포스포네이트에 대한 개인별 약물 점수를 산출한 후, 각 군별로 통계 분석하였다. 그 결과를 표 2에 나타내었다. For the gene group selected as described above, individual drug scores were calculated using the method of the present invention. More specifically, after calculating the gene sequence variation score using the SIFT algorithm from the individual gene sequence variation information, individual protein damage scores for the 50 genes were calculated using Equation 2, and Equation 4 After calculating individual drug scores for bisphosphonates using , statistical analysis was performed for each group. The results are shown in Table 2.

골다공증 치료제 부작용 군 (n=38)Osteoporosis drug side effects group (n=38) 정상 대조군
(n=30)
normal control
(n=30)
p-valuep-value
약물점수 평균 (1군 약물)Mean drug score (group 1 drug) 00 0.3440.344 <0.001<0.001 약물점수 평균 (1,2군 약물)Mean drug score (group 1 and 2 drugs) 0.0310.031 0.4720.472 <0.001<0.001 ENSEMBL ENSEMBL HUGO HUGO 단백질 손상점수 (1군)Protein damage score (group 1) ENSG00000160867ENSG00000160867 FGFR4FGFR4 0.320.32 0.520.52 <0.001<0.001 ENSG00000132740ENSG00000132740 IGHMBP2IGHMBP2 0.480.48 0.780.78 <0.001<0.001 ENSG00000114790ENSG00000114790 ARHGEF26ARHGEF26 0.460.46 0.650.65 <0.001<0.001 ENSG00000134248ENSG00000134248 HBXIPHBXIP 0.370.37 0.800.80 <0.001<0.001 ENSG00000158477ENSG00000158477 CD1ACD1A 0.650.65 0.920.92 <0.001<0.001 ENSG00000171970ENSG00000171970 ZNF57ZNF57 0.290.29 0.510.51 <0.001<0.001 ENSG00000112769ENSG00000112769 LAMA4LAMA4 0.270.27 0.570.57 <0.001<0.001 ENSG00000213445ENSG00000213445 SIPA1SIPA1 0.240.24 0.670.67 <0.001<0.001 ENSG00000076716ENSG00000076716 GPC4GPC4 0.360.36 0.820.82 <0.001<0.001 ENSG00000110801ENSG00000110801 PSMD9PSMD9 0.640.64 0.930.93 <0.001<0.001 ENSG00000106948ENSG00000106948 AKNAAKNA 0.500.50 0.710.71 0.0010.001 ENSG00000151458ENSG00000151458 ANKRD50ANKRD50 0.690.69 0.890.89 0.0010.001 ENSG00000079393ENSG00000079393 DUSP13DUSP13 0.500.50 0.650.65 0.0010.001 ENSG00000145675ENSG00000145675 PIK3R1PIK3R1 0.790.79 0.950.95 0.0010.001 ENSG00000084092ENSG00000084092 C4orf14C4orf14 0.660.66 0.890.89 0.0010.001 ENSG00000147138ENSG00000147138 GPR174GPR174 0.450.45 0.750.75 0.0010.001 ENSG00000016391ENSG00000016391 CHDHCHDH 0.230.23 0.440.44 0.0010.001 ENSG00000187600ENSG00000187600 AC018682.6AC018682.6 0.390.39 0.720.72 0.0010.001 ENSG00000124067ENSG00000124067 SLC12A4SLC12A4 0.450.45 0.820.82 0.0010.001 ENSG00000185736ENSG00000185736 ADARB2ADARB2 0.290.29 0.550.55 0.0020.002 ENSG00000160654ENSG00000160654 CD3GCD3G 0.440.44 0.730.73 0.0020.002 ENSG00000131381ENSG00000131381 ZFYVE20ZFYVE20 0.840.84 0.980.98 0.0020.002 ENSG00000154438ENSG00000154438 ASZ1ASZ1 0.360.36 0.680.68 0.0020.002 ENSG00000136002ENSG00000136002 ARHGEF4ARHGEF4 0.870.87 1.001.00 0.0020.002 ENSG00000196159ENSG00000196159 FAT4FAT4 0.460.46 0.600.60 0.0020.002 ENSG00000162727ENSG00000162727 OR2M5OR2M5 0.630.63 0.930.93 0.0020.002 ENSG00000107521ENSG00000107521 HPS1HPS1 0.680.68 0.920.92 0.0030.003 ENSG00000159917ENSG00000159917 ZNF235ZNF235 0.480.48 0.790.79 0.0030.003 ENSG00000185624ENSG00000185624 P4HBP4HB 0.840.84 0.970.97 0.0030.003 ENSG00000101974ENSG00000101974 ATP11CATP11C 0.800.80 0.980.98 0.0030.003 ENSG00000131018ENSG00000131018 SYNE1SYNE1 0.440.44 0.560.56 0.0040.004 ENSG00000138031ENSG00000138031 ADCY3ADCY3 0.800.80 0.900.90 0.0040.004 단백질 손상점수 (2군)Protein damage score (group 2) ENSG00000159527ENSG00000159527 PGLYRP3PGLYRP3 0.760.76 0.970.97 0.0050.005 ENSG00000213401ENSG00000213401 MAGEA12MAGEA12 0.320.32 0.590.59 0.0050.005 ENSG00000177854ENSG00000177854 TMEM187TMEM187 0.530.53 0.690.69 0.0050.005 ENSG00000176555ENSG00000176555 OR4S1OR4S1 0.300.30 0.620.62 0.0050.005 ENSG00000241598ENSG00000241598 KRTAP5-4KRTAP5-4 0.420.42 0.720.72 0.0050.005 ENSG00000114204ENSG00000114204 SERPINI2SERPINI2 0.430.43 0.680.68 0.0050.005 ENSG00000204290ENSG00000204290 BTNL2BTNL2 0.760.76 0.890.89 0.0050.005 ENSG00000221870ENSG00000221870 CXorf1CXorf1 0.450.45 0.770.77 0.0060.006 ENSG00000116690ENSG00000116690 PRG4PRG4 0.720.72 0.940.94 0.0060.006 ENSG00000118640ENSG00000118640 VAMP8VAMP8 0.670.67 0.850.85 0.0060.006 ENSG00000198930ENSG00000198930 CSAG1CSAG1 0.470.47 0.720.72 0.0060.006 ENSG00000157181ENSG00000157181 C1orf27C1orf27 0.790.79 0.970.97 0.0060.006 ENSG00000221953ENSG00000221953 C1orf229C1orf229 0.740.74 0.970.97 0.0060.006 ENSG00000198739ENSG00000198739 LRRTM3LRRTM3 0.680.68 0.930.93 0.0070.007 ENSG00000124664ENSG00000124664 SPDEFSPDEF 0.610.61 0.880.88 0.0070.007 ENSG00000145649ENSG00000145649 GZMAGZMA 0.430.43 0.580.58 0.0080.008 ENSG00000049323ENSG00000049323 LTBP1LTBP1 0.640.64 0.860.86 0.0090.009 ENSG00000122136ENSG00000122136 OBP2AOBP2A 0.550.55 0.680.68 0.0090.009

상기 표 2에 나타낸 바와 같이, 선별된 32개의 제1군 유전자들의 유전자 염기서열 변이정보로부터 단백질 손상점수 및 개인별 약물 점수를 산출한 결과, 정상 대조군과 비스포스포네이트 부작용 군 사이에 통계적으로 유의하게 차이가 나타남을 확인하였다. As shown in Table 2, as a result of calculating the protein damage score and individual drug score from the gene sequence mutation information of the selected 32 group 1 genes, there was a statistically significant difference between the normal control group and the bisphosphonate side effect group. confirmed.

또한, 제2군 유전자들의 유전자 염기서열 변이정보를 추가로 포함하여 총 50개의 유전자 염기서열 변이정보로부터 개인별 약물 점수를 산출한 결과에서도, 두 군 사이의 개인별 약물점수가 통계적으로 유의하게 차이를 보였다(p-value <0.05). In addition, as a result of calculating individual drug scores from a total of 50 gene sequence mutation information including gene sequence mutation information of group 2 genes, there was a statistically significant difference in individual drug scores between the two groups. (p-value < 0.05).

상기 결과를 통하여, 본 발명에 따른 개인 유전체 염기서열 변이 정보 분석을 통한 개인별 약물 점수 산출을 이용하여 비스포스포네이트 치료 시 약물 부작용이 발생한 군과 그렇지 않은 군을 유의하게 구분할 수 있으며, 이를 통해 원치 않는 부작용을 사전에 예방할 수 있음을 확인하였다.Through the above results, it is possible to significantly distinguish the group in which drug side effects occur during bisphosphonate treatment and the group in which it does not, by using the individual drug score calculation through the analysis of individual genome sequence variation information according to the present invention, thereby preventing unwanted side effects. It was confirmed that it can be prevented in advance.

따라서 본 발명의 방법을 이용하여 향후 골다공증 환자 중에서 비스포스포네이트 투여시 부작용 발생 가능성이 높은 군을 예측할 수 있으며, 고 위험군에 대해서는 약물의 농도를 조절하거나 대체 가능한 다른 치료법 혹은 중재요법을 사용하도록 유도할 수 있을 것이다.Therefore, by using the method of the present invention, it is possible to predict a group with a high possibility of side effects when bisphosphonate is administered among patients with osteoporosis in the future, and for a high-risk group, the concentration of the drug can be adjusted or alternative treatments or interventions can be induced to be used. will be.

실시예 2. 개인 유전체 염기서열 변이 정보를 기반으로 하는 맞춤형 약물 선택 방법의 타당성 검증Example 2. Verification of validity of personalized drug selection method based on individual genome sequence variation information

아직까지 개인 유전체 염기서열 변이 정보와 약물학적 반응의 개인차에 관한 신뢰할만한 연구결과는 매우 제한적이다. 현재까지의 연구는 특정 변이가 양성인 또는 음성인 군을 약물별로 비교하여 반응성의 개인차를 연구하는 증례-대조군 관찰연구의 패러다임을 따라왔다. 이러한 연구 패러다임에서는 수많은 염기서열 변이와 수많은 약물쌍으로 이루어지는 모든 조합에 대해 각각 고비용의 증례-대조군 연구를 수행해야하지만 현실적으로는 불가능하다. 반면 본 발명에 따른 개인별 맞춤형 약물 선택 방법은 모든 유전자 염기서열 변이를 대상으로 할 뿐만 아니라, 고비용의 증례-대조군 설계의 관찰 연구를 필요로 하지 않고, 유전체 염기서열 변이에 대한 순수 계산만으로 개인별 단백질 손상 점수와 개인별 약물 점수를 산출하고 이를 적용하는 방법을 제안하므로, 모든 유전체 염기서열 변이와 모든 약물 사이의 조합에 대하여 개인별 맞춤형 약물 선택을 위한 추론이 가능하다는 큰 장점을 갖는다. Until now, reliable research results on individual differences in individual genome sequence variation information and pharmacological responses are very limited. Studies to date have followed the paradigm of case-control observational studies in which individual differences in responsiveness are studied by comparing groups positive or negative for specific mutations by drug. In this research paradigm, costly case-control studies must be performed for all combinations consisting of numerous nucleotide sequence variations and numerous drug pairs, but it is practically impossible. On the other hand, the personalized drug selection method according to the present invention not only targets all gene sequence variations, but also does not require expensive case-control design observational studies, and individual protein damage by pure calculation of genome sequence variations. Since it proposes a method of calculating and applying scores and individual drug scores, it has a great advantage that it is possible to make inferences for personalized drug selection for combinations between all genome sequence variations and all drugs.

본 발명의 방법에 따른 개인별 맞춤형 약물 선택 산출 결과의 타당성 평가를 위해 다음과 같은 기준으로 497개의 다빈도 처방 약물을 선택하였다; (1) 미국에서 가장 흔히 처방되는 15가지 약물(top 15 frequently prescribed drug classes during 2005~2008 in the United State (Health, United States, 2011, Centers for Disease Control and Prevention)의 ATC 코드에 포함되는 약물 중 적어도 한 개 이상의 약력학 또는 약동학 관련 유전자가 알려진 약물, (2) 확립된 약물유전체학적 유전체 염기서열 변이 마커의 작용이 미국 식약처의 의약품 라벨 표시에 적용된 약물, (3) 약물 부작용 등으로 시장에서 퇴출된 것으로 DrugBank 데이터베이스에 공지된 약물. In order to evaluate the validity of the calculation result of personalized drug selection according to the method of the present invention, 497 frequently prescribed drugs were selected based on the following criteria; (1) Among the drugs included in the ATC code of the top 15 frequently prescribed drug classes during 2005~2008 in the United State (Health, United States, 2011, Centers for Disease Control and Prevention) Drugs for which at least one gene related to pharmacodynamics or pharmacokinetics is known, (2) Drugs for which the action of an established pharmacogenomic genome sequence mutation marker has been applied to the drug labeling of the US Food and Drug Administration, (3) Withdrawal from the market due to drug side effects, etc. Drugs known to the DrugBank database to be

타당성 평가 기준 자료로는 PharmGKB가 제공하는 987개의 유전자 염기서열 변이-약물 상호작용 쌍에 대한 확립된 지식 중 상기 497개의 약물과 적어도 하나 이상의 연결을 갖는 650개(65.9%)를 추출했다. 본 발명이 엑손 영역의 염기서열 변이를 대상으로 한 점을 고려하여, 공정한 평가를 위해서 검증 대상 자료와 평가 기준 자료 사이에 겹치는 부분은 제거하였다. 좀 더 구체적으로는 상기 650쌍 중에서 엑손 영역에 위치한 염기서열 변이 36개를 모두 제거하고 비코딩 영역의 염기서열 변이만을 선택하여 좀 더 공정한 평가를 수행하였다. 결론적으로, 평가를 위한 최종 황금표준으로 614쌍을 선택하였다. As the validity evaluation criterion data, 650 (65.9%) of the 987 gene sequence mutation-drug interaction pairs that have at least one connection with the 497 drugs were extracted from the established knowledge of 987 gene sequence mutation-drug interaction pairs provided by PharmGKB. Considering that the present invention targets nucleotide sequence variation in the exon region, overlapping parts between the data to be verified and the evaluation standard data were removed for fair evaluation. More specifically, a fairer evaluation was performed by removing all 36 nucleotide sequence mutations located in the exon region among the 650 pairs and selecting only the nucleotide sequence mutations in the non-coding region. In conclusion, 614 pairs were selected as the final gold standard for evaluation.

다음으로 The 1000 Genomes Project가 제공하는 1092명의 전장 유전체 염기서열을 분석하여 1092명 각각에 대해 본 발명에 따른 방법을 적용하여, 개인별 약물유전체학적 위험성과 PharmGKB에 등록된 유전자 염기서열 변이별 약물유전체학적 위험성을 각각 계산하였다. Next, by analyzing the genome sequences of 1092 people provided by The 1000 Genomes Project and applying the method according to the present invention to each of the 1092 people, pharmacogenomic risk of each individual and pharmacogenomics by gene sequence mutation registered in PharmGKB Each risk was calculated.

타당도 평가에는 민감도, 특이도 및 ROC 곡선하면적(Area Under the Receiver Operating Curve)를 사용했다. 개인별 약물 점수를 바탕으로 497개의 약물에 순위를 매기고 각 순위 사이의 496개의 분할 위치에 순위별로 역치를 설정한 후, (1) 해당 약물의 약물 점수 순위가 역치보다 상위에 있고 PharmGKB 변이가 개인 유전체 변이에 있을 때는 참양성, (2) 해당 약물의 약물 점수 순위가 역치보다 하위에 있고 PharmGKB 변이가 개인 유전체 변이에 없을 때는 참음성, (3) 해당 약물의 약물 점수 순위가 역치보다 상위에 있으나 PharmGKB 변이가 개인 유전체 변이에는 없을 때는 위양성, (4) 해당 약물의 약물 점수 순위가 역치보다 하위에 있으나 PharmGKB 변이가 개인 유전체 변이에 있을 때는 위음성으로 정했다, 각 개인에서 각 순위역치 L에 대해 참양성, 참음성, 위양성, 위음성의 개수를 산출하여 하기 식과 같이 민감도와 특이도를 계산하였다. Sensitivity, specificity, and area under the receiver operating curve were used for validity evaluation. After ranking 497 drugs based on individual drug scores and setting thresholds by rank at 496 split positions between each rank, (1) if the drug score rank of the drug is higher than the threshold and the PharmGKB variant is found in the individual genome true positive when present in the variant, (2) true negative when the drug's drug score ranks below the threshold and the PharmGKB variant is not in the individual genomic variant, (3) the drug's drug score ranks above the threshold but PharmGKB False positive when the mutation was not in the individual genome variant, (4) false negative when the drug score rank of the drug was lower than the threshold but the PharmGKB variant was in the individual genome variant, true positive for each rank threshold L in each individual, The number of true negatives, false positives, and false negatives was calculated, and sensitivity and specificity were calculated as in the following formula.

Figure 112016015957222-pat00005
Figure 112016015957222-pat00005

Figure 112016015957222-pat00006
Figure 112016015957222-pat00006

상기 D는 497개의 전체 약물의 집합, GS는 개인별로 개인 유전자 염기서열 변이가 PharmGKB의 위험 대립유전형과 일치하여 개인별 황금표준으로 사용되는 개인화된 PharmGKB 약물의 집합, DL은 순위역치 상위 약물의 집합이며, 수직 막대 괄호는 해당 집합의 원소 개수를 의미한다. D is a set of 497 total drugs, GS is a set of personalized PharmGKB drugs that are used as gold standards for each individual because individual genetic sequence variations match the risk alleles of PharmGKB, D L is a set of drugs with high ranking thresholds , and vertical bar brackets indicate the number of elements in the set.

계산 결과, 18명의 경우 PharmGKB의 변이와 일치하는 변이를 한 개도 가지고 있지 않아서 황금표준으로 사용되는 개인화된 PharmGKB 약물의 집합을 정의할 수 없었기에, 이들은 본 타당성 분석에서 제외하였으며, 모든 역치에 대한 민감도와 특이도를 계산하여 ROC 곡선을 그리고, AUC를 계산하였다. 보다 구체적으로, 먼저 1092명의 전체 인구집단을 대상으로 SIFT 알고리즘을 이용하여 유전자 염기서열 변이 점수를 산출한 후, 이에 수학식 2와 수학식 4를 적용하여 단백질 손상 점수 및 약물 점수를 각각 산출하였다. 또한, 인종별 분포에 따른 가중치 적용의 유용성을 판단하기 위해서 인종 특이적 민감도, 특이도 및 이에 기반을 둔 AUC 값 산출을 The 1000 Genomes Project에 명시된 4개의 인종(African (AFR, n=246), American (AMR, n=181), Asian (ASN, n=286), European (EUR, n=379))별로 각각 동일하게 수행한 후, 인종 특이적 민감도, 특이도 및 AUC를 각각 구하였다. 그 결과를 표 3, 표 4 및 도 3에 나타내었다. As a result of the calculation, 18 patients did not have any mutation that matched that of PharmGKB, so it was not possible to define a set of personalized PharmGKB drugs used as the gold standard, so they were excluded from this feasibility analysis. A ROC curve was drawn by calculating , and specificity, and AUC was calculated. More specifically, first, gene sequence variation scores were calculated using the SIFT algorithm for the entire population of 1092 people, and then Equations 2 and 4 were applied to calculate protein damage scores and drug scores, respectively. In addition, in order to determine the usefulness of weight application according to racial distribution, racial-specific sensitivity, specificity, and AUC value calculation based on this were calculated for the four races specified in The 1000 Genomes Project (African (AFR, n=246), American (AMR, n = 181), Asian (ASN, n = 286), and European (EUR, n = 379) were performed in the same manner, and then race-specific sensitivity, specificity, and AUC were obtained. The results are shown in Table 3, Table 4 and Figure 3.

단백질 군별 분포 및 평균 단백질 손상 점수 산출Distribution by protein class and calculation of average protein damage score 단백질 군protein family 단백질 수number of proteins 관련 약물 수number of drugs involved 단백질-약물 쌍의 수Number of protein-drug pairs 평균 단백질 손상 점수Average protein damage score 표적 단백질target protein 440440 486486 23572357 0.7980.798 운반체 단백질carrier protein 1010 5050 6565 0.7280.728 대사효소 단백질metabolic enzyme protein 7474 330330 13471347 0.7330.733 수송체 단백질transporter protein 5454 176176 457457 0.7330.733 total 545545 497497 42014201 0.7830.783

The 1000 Genomes Project 데이터를 이용한 단백질 군별 및 인종별 약물 점수 산출 타당도(AUC) 산출Calculation of drug scoring validity (AUC) by protein group and race using The 1000 Genomes Project data TotalTotal AFRAFR AMRAMR ASNASN EUREUR 약물 점수 산출 타당도(Validity of drug scoring ( AUCAUC )) 표적 단백질target protein 0.6170.617 0.6340.634 0.6080.608 0.6140.614 0.6140.614 운반체 단백질carrier protein 0.5540.554 0.5110.511 0.5990.599 0.4850.485 0.5940.594 대사효소 단백질metabolic enzyme protein 0.5870.587 0.6420.642 0.5800.580 0.5580.558 0.5790.579 수송체 단백질transporter protein 0.4970.497 0.4920.492 0.4880.488 0.4890.489 0.5120.512 단백질 군별 가중치를 비적용 또는 적용한 약물 점수 산출 타당도(Validity of drug score calculation with or without weighting for each protein group ( AUCAUC )) 단순기하평균simple geometric mean 0.6660.666 0.7440.744 0.6500.650 0.6340.634 0.6530.653 가중기하평균weighted geometric mean 0.6670.667 0.7420.742 0.6520.652 0.6330.633 0.6540.654

상기 표 3은 본 실시예에서 사용한 약물 497개에 대한 단백질 군별 분포를 나타낸 것으로, 각 군별로 단백질-약물 쌍의 수와 평균 단백질 손상 점수를 함께 표시하였다.Table 3 shows the distribution of each protein group for the 497 drugs used in this example, and the number of protein-drug pairs and average protein damage score for each group are shown together.

상기 표 4는 수학식 4를 이용하여 약물 점수를 산출할 때, 단백질 군별 가중치를 적용하지 않은 경우(단순기하평균)와 적용한 경우(가중기하평균)에 각각 산출된 개인별 약물 점수 산출 타당도(AUC)를 각 단백질 군별, 각 인종별로 구분하여 나타낸 것이다. Table 4 shows the individual drug score calculation validity (AUC) calculated when the drug score was calculated using Equation 4, when weights for each protein group were not applied (simple geometric mean) and when applied (weighted geometric mean). are shown separately for each protein group and each race.

보다 구체적으로, 전체 인구 집단을 예로 들면, 약물 점수 산출을 위하여 수학식 4에서 가중치 wi를 부여하지 않고(가중치 wi=1) 표적 단백질, 운반체 단백질, 대사효소 단백질, 수송체 단백질 등 각 단백질 군별로 산출한 AUC 값은 각각 0.617, 0.554, 0.587, 0.497이었으며, 이를 단백질 군별 가중치로 사용하여(수학식 4의 가중치 wi에 각 값을 대입) 산출한 개인별 가중기하평균 약물 점수 산출 타당도(AUC=0.667)를 구하였다(도 3b 참조). 그 결과, 상기 단백질 군별 가중치를 적용한 개인별 가중기하평균 약물 점수 산출 타당도는 가중치를 부여하지 않고(가중치 wi=1) 단순기하평균 산출식에 적용하여 산출한 개인별 단순기하평균 약물 점수 산출 타당도(AUC=0.666)보다 0.001점 향상됨을 확인하였다(도 3a 참조).More specifically, taking the entire population as an example, weight wi is not assigned in Equation 4 to calculate the drug score (weight wi = 1), and each protein group, such as target protein, carrier protein, metabolic enzyme protein, transporter protein, etc. The calculated AUC values were 0.617, 0.554, 0.587, and 0.497 , respectively, and the individual weighted geometric mean drug score calculation validity (AUC=0.667 ) was obtained (see FIG. 3b). As a result, the validity of calculating the weighted geometric mean drug score for each individual to which the weight for each protein group was applied was applied to the simple geometric mean calculation formula without weighting (weight wi = 1), and the validity of calculating the simple geometric mean drug score for each individual (AUC = 0.666) was confirmed to be improved by 0.001 points (see FIG. 3a).

또한, 도 3a에 나타낸 바와 같이, 가중치 적용의 또 다른 예로 각 인종별 인원수에 따른 가중치를 적용하여 개인별 약물 점수 산출 타당도(AUC) 분석을 수행한 결과, 인종 특이성을 고려한 경우(굵은선), 전체 인구 집단(Total)의 AUC 값은 0.666(아프리카인(African) 0.744, 아메리카인(American) 0.650, 아시아인(Asian) 0.631, 유럽인(European) 0.653)이었으며, 인종 특이성을 고려하지 않은 경우(점선), 전체 인구집단 AUC 값은 0.633(아프리카인 0.623, 아메리카인 0.629, 아시아인 0.64, 유럽인 0.636)으로 나타나, 인종 특이성을 고려한 약물 점수 산출 타당도가 그렇지 않은 경우에 비해 더 향상되는 것을 확인하였다. In addition, as shown in FIG. 3A, as another example of weight application, as a result of performing an individual drug score calculation validity (AUC) analysis by applying weights according to the number of people for each race, when racial specificity was considered (thick line), the total The AUC value of the population group (Total) was 0.666 (African 0.744, American 0.650, Asian 0.631, European 0.653), when racial specificity was not considered (dotted line) , the AUC value of the entire population was 0.633 (Africans 0.623, Americans 0.629, Asians 0.64, Europeans 0.636), confirming that the validity of drug score calculation considering racial specificity was further improved compared to the case where it was not.

또한, 도 3b에 나타낸 바와 같이, 인종 특이성을 고려하지 않고 단백질 군별 가중치만을 적용한 경우(점선), 본 발명의 개인별 약물 점수 산출 타당도 AUC는 0.634이고, 인종 특이성과 함께 단백질 군별 가중치도 함께 적용한 경우(굵은선), 본 발명의 개인별 약물 점수 산출 타당도 AUC는 0.667로 나타나, 서로다른 가중치의 유용성이 있음을 알 수 있다.In addition, as shown in FIG. 3B, when only weights for each protein group are applied without considering racial specificity (dotted line), the validity AUC of calculating individual drug scores of the present invention is 0.634, and when weights for each protein group are applied together with racial specificity ( thick line), the AUC of the validity of the individual drug score calculation of the present invention is 0.667, indicating the usefulness of different weights.

이상에서 본원의 예시적인 구현예에 대하여 상세하게 설명하였지만 본원의 권리범위는 이에 한정되는 것은 아니고 다음의 청구범위에서 정의하고 있는 본원의 기본 개념을 이용한 당업자의 여러 변형 및 개량 형태 또한 본원의 권리범위에 속하는 것이다.Although the exemplary embodiments of the present application have been described in detail above, the scope of the present application is not limited thereto, and various modifications and improvements made by those skilled in the art using the basic concepts of the present application as defined in the following claims are also within the scope of the present application. that belongs to

본 발명에서 사용되는 모든 기술용어는, 달리 정의되지 않는 이상, 본 발명의 관련 분야에서 통상의 당업자가 일반적으로 이해하는 바와 같은 의미로 사용된다. 본 명세서에 참고문헌으로 기재되는 모든 간행물의 내용은 본 발명에 도입된다. All technical terms used in the present invention, unless defined otherwise, are used with the same meaning as commonly understood by one of ordinary skill in the art related to the present invention. The contents of all publications incorporated herein by reference are incorporated herein by reference.

Claims (32)

개인 유전체 염기서열 정보로부터 골다공증 치료제의 약력학(pharmaco-dynamics) 또는 약동학(pharmaco-kinetics)에 관여하는 하나 이상의 유전자 염기서열 변이 정보를 결정하는 단계;
상기 유전자 염기서열 변이 정보를 이용하여 개인별 단백질 손상 점수를 산출하는 단계; 및
상기 개인별 단백질 손상 점수를 골다공증 치료제와 단백질 사이의 상호 관계와 연관지어 개인별 약물 점수를 산출하는 단계를 포함하고,
상기 개인별 단백질 손상 점수는 하기 수학식 2에 의해 산출되고,
[수학식 2]
Figure 112022056405671-pat00015

상기 수학식 2에서 Sg 는 유전자 g가 코딩하는 단백질의 단백질 손상 점수, n은 상기 유전자 g의 염기서열 변이 중 분석대상인 염기서열 변이의 수, vi i 번째 분석대상 염기서열 변이의 상기 유전자 염기서열 변이 점수이며, wi 는 상기 i 번째 분석대상 염기서열 변이의 상기 유전자 염기서열 변이 점수 vi 에 부여되는 가중치이고, i 는 1부터 n의 정수이고,
상기 개인별 약물 점수는 하기 수학식 4에 의해 산출되고,
[수학식 4]
Figure 112022056405671-pat00016

상기 수학식 4에서 Sd 는 약물 d의 산출된 약물 점수, n은 상기 약물 d의 약력학 또는 약동학에 관여하는 하나 이상의 유전자가 코딩하는 단백질의 수, gi 는 상기 약물 d의 약력학 또는 약동학에 관여하는 하나 이상의 유전자가 코딩하는 단백질의 상기 단백질 손상 점수이며, wi i 번째 유전자가 코딩하는 단백질의 상기 단백질 손상 점수 gi 에 부여되는 가중치이고, i 는 1부터 n의 정수인, 개인 유전체 염기서열 변이를 이용한 골다공증 치료제 선택을 위한 정보를 제공하는 방법.
Determining at least one gene sequence mutation information involved in pharmaco-dynamics or pharmaco-kinetics of a therapeutic agent for osteoporosis from personal genome sequence information;
Calculating individual protein damage scores using the gene sequence mutation information; and
Calculating an individual drug score by associating the individual protein damage score with a correlation between an osteoporosis treatment and a protein,
The above individual protein damage The score is calculated by Equation 2 below,
[Equation 2]
Figure 112022056405671-pat00015

In Equation 2, S g is the protein damage score of the protein encoded by gene g , n is the number of nucleotide sequence variants to be analyzed among the nucleotide sequence variants of the gene g , and v i is the gene of the ith nucleotide sequence variant to be analyzed. A base sequence variation score, w i is a weight given to the gene sequence variation score v i of the ith base sequence variation to be analyzed, i is an integer from 1 to n ,
The individual drug score is calculated by Equation 4 below,
[Equation 4]
Figure 112022056405671-pat00016

In Equation 4, S d is the calculated drug score of drug d , n is the number of proteins encoded by one or more genes involved in the pharmacodynamics or pharmacokinetics of drug d , g i is involved in the pharmacodynamics or pharmacokinetics of drug d is the protein damage score of a protein encoded by one or more genes, w i is a weight given to the protein damage score g i of a protein encoded by the ith gene, and i is an integer from 1 to n , a personal genome sequence Method for providing information for selection of osteoporosis treatment using mutation.
제 1 항에 있어서,
상기 골다공증치료제는 비스포스포네이트(bisphosphonate), 항-RANKL 단일클론항체, 골레칼시페롤, 비타민 D 아날로그, 선택적 에스트로겐 수용체 조절제, 칼시트리올, 칼시페디올, 칼시토닌, 비타민K 화합물, 에스트로겐, 프로게스테론 및 부갑상선 호르몬으로 이루어진 군으로부터 선택된 1종 이상의 계열에 속하는 약물인, 개인 유전체 염기서열 변이를 이용한 골다공증치료제 선택을 위한 정보를 제공하는 방법.
According to claim 1,
The osteoporosis treatment agent consists of bisphosphonate, anti-RANKL monoclonal antibody, golecalciferol, vitamin D analog, selective estrogen receptor modulator, calcitriol, calcipediol, calcitonin, vitamin K compound, estrogen, progesterone and parathyroid hormone A method for providing information for selecting an osteoporosis treatment using individual genome sequence variation, which is a drug belonging to at least one class selected from the group.
제 1 항에 있어서,
상기 약력학 또는 약동학에 관여하는 유전자는 FGFR4, IGHMBP2, ARHGEF26, HBXIP, CD1A, ZNF57, LAMA4, SIPA1, GPC4, PSMD9, AKNA, ANKRD50, DUSP13, PIK3R1, C4orf14, GPR174, CHDH, AC018682.6, SLC12A4, ADARB2, CD3G, ZFYVE20, ASZ1, ARHGEF4, FAT4, OR2M5, HPS1, ZNF235, P4HB, ATP11C, SYNE1 및 ADCY3로 이루어진 군에서 선택된 1종 이상인, 개인 유전체 염기서열 변이를 이용한 골다공증치료제 선택을 위한 정보를 제공하는 방법.
According to claim 1,
Genes involved in the pharmacodynamics or pharmacokinetics are FGFR4, IGHMBP2, ARHGEF26, HBXIP, CD1A, ZNF57, LAMA4, SIPA1, GPC4, PSMD9, AKNA, ANKRD50, DUSP13, PIK3R1, C4orf14, GPR174, CHDH, AC018682.6, SLC12A4, ADARB2 , CD3G, ZFYVE20, ASZ1, ARHGEF4, FAT4, OR2M5, HPS1, ZNF235, P4HB, ATP11C, SYNE1, and ADCY3, a method for providing information for selecting an osteoporosis treatment using genetic sequence mutation of one or more individuals selected from the group consisting of .
제 3 항에 있어서,
상기 유전자는 PGLYRP3, MAGEA12, TMEM187, OR4S1, KRTAP5-4, SERPINI2, BTNL2, CXorf1, PRG4, VAMP8, CSAG1, C1orf27, C1orf229, LRRTM3, SPDEF, GZMA, LTBP1 및 OBP2A로 이루어진 군으로부터 선택된 1종 이상을 더 포함하는, 개인 유전체 염기서열 변이를 이용한 골다공증치료제 선택을 위한 정보를 제공하는 방법.
According to claim 3,
The gene further comprises at least one selected from the group consisting of PGLYRP3, MAGEA12, TMEM187, OR4S1, KRTAP5-4, SERPINI2, BTNL2, CXorf1, PRG4, VAMP8, CSAG1, C1orf27, C1orf229, LRRTM3, SPDEF, GZMA, LTBP1 and OBP2A A method for providing information for selecting an osteoporosis treatment using personal genome sequence variation, comprising:
제 1 항에 있어서,
상기 약력학 또는 약동학에 관여하는 유전자는 FGFR4, IGHMBP2, ARHGEF26, HBXIP, CD1A, ZNF57, LAMA4, SIPA1, GPC4, PSMD9, AKNA, ANKRD50, DUSP13, PIK3R1, C4orf14, GPR174, CHDH, AC018682.6, SLC12A4, ADARB2, CD3G, ZFYVE20, ASZ1, ARHGEF4, FAT4, OR2M5, HPS1, ZNF235, P4HB, ATP11C, SYNE1, ADCY3, PGLYRP3, MAGEA12, TMEM187, OR4S1, KRTAP5-4, SERPINI2, BTNL2, CXorf1, PRG4, VAMP8, CSAG1, C1orf27, C1orf229, LRRTM3, SPDEF, GZMA, LTBP1 및 OBP2A로 이루어진 군으로부터 선택된 1종 이상인, 개인 유전체 염기서열 변이를 이용한 골다공증치료제 선택을 위한 정보를 제공하는 방법.
According to claim 1,
Genes involved in the pharmacodynamics or pharmacokinetics are FGFR4, IGHMBP2, ARHGEF26, HBXIP, CD1A, ZNF57, LAMA4, SIPA1, GPC4, PSMD9, AKNA, ANKRD50, DUSP13, PIK3R1, C4orf14, GPR174, CHDH, AC018682.6, SLC12A4, ADARB2 , CD3G, ZFYVE20, ASZ1, ARHGEF4, FAT4, OR2M5, HPS1, ZNF235, P4HB, ATP11C, SYNE1, ADCY3, PGLYRP3, MAGEA12, TMEM187, OR4S1, KRTAP5-4, SERPINI2, BTNL2, CXorf1, PRG4, VAMP8, CSAG1, C1orf27 , C1orf229, LRRTM3, SPDEF, GZMA, at least one selected from the group consisting of LTBP1 and OBP2A, a method for providing information for the selection of osteoporosis treatment using individual genome sequence mutation.
제 1 항에 있어서,
상기 유전자 염기서열 변이 정보는 유전자의 엑손(exon)을 구성하는 염기의 치환, 부가 또는 결실인, 개인 유전체 염기서열 변이를 이용한 골다공증치료제 선택을 위한 정보를 제공하는 방법.
According to claim 1,
The gene sequence mutation information is a method for providing information for selecting an osteoporosis treatment using individual genome sequence mutation, which is a substitution, addition or deletion of a base constituting an exon of a gene.
제 1 항에 있어서,
상기 유전자 염기서열 변이 정보는 참조군의 유전체 염기서열과의 비교 분석을 통해 수득되는 것인, 개인 유전체 염기서열 변이를 이용한 골다공증치료제 선택을 위한 정보를 제공하는 방법
According to claim 1,
Method for providing information for selecting an osteoporosis treatment using individual genome sequence variation, wherein the genetic sequence variation information is obtained through comparative analysis with the genome sequence of the reference group
제 1 항에 있어서,
상기 단백질 손상 점수 또는 상기 약물 점수는 SIFT (Sorting Intolerant From Tolerant), PolyPhen (Polymorphism Phenotyping), PolyPhen-2, MAPP (Multivariate Analysis of Protein Polymorphism), Logre (Log R Pfam E-value), MutationAssessor, MutationTaster, MutationTaster2, PROVEAN (Protein Variation Effect Analyzer), PMut, Condel, GERP (Genomic Evolutionary Rate Profiling), GERP++, CEO (Combinatorial Entropy Optimization), SNPeffect, fathmm, 및 CADD (Combined Annotation-Dependent Depletion)로 이루어진 군에서 선택된 하나 이상의 알고리즘을 이용하여 산출된 하나 이상의 유전자 염기서열 변이 점수로부터 산출되는 것인, 개인 유전체 염기서열 변이를 이용한 골다공증치료제 선택을 위한 정보를 제공하는 방법.
According to claim 1,
The protein damage score or the drug score is SIFT (Sorting Intolerant From Tolerant), PolyPhen (Polymorphism Phenotyping), PolyPhen-2, MAPP (Multivariate Analysis of Protein Polymorphism), Logre (Log R Pfam E-value), MutationAssessor, MutationTaster, One selected from the group consisting of MutationTaster2, PROVEAN (Protein Variation Effect Analyzer), PMut, Condel, GERP (Genomic Evolutionary Rate Profiling), GERP++, CEO (Combinatorial Entropy Optimization), SNPeffect, fathmm, and CADD (Combined Annotation-Dependent Depletion) A method for providing information for selecting an osteoporosis treatment using individual genome sequence variation, which is calculated from one or more gene sequence variation scores calculated using the above algorithm.
제 1 항에 있어서,
상기 단백질 손상 점수 또는 약물 점수는, 유전자 염기서열 변이 점수로부터 산출되는 것인, 개인 유전체 염기서열 변이를 이용한 골다공증치료제 선택을 위한 정보를 제공하는 방법.
According to claim 1,
The protein damage score or drug score is calculated from the genetic sequence variation score, a method for providing information for selecting an osteoporosis treatment using individual genome sequence variation.
제 9 항에 있어서,
상기 유전자 염기서열 변이 점수는 SIFT (Sorting Intolerant From Tolerant), PolyPhen (Polymorphism Phenotyping), PolyPhen-2, MAPP (Multivariate Analysis of Protein Polymorphism), Logre (Log R Pfam E-value), MutationAssessor, MutationTaster, MutationTaster2, PROVEAN (Protein Variation Effect Analyzer), PMut, Condel, GERP (Genomic Evolutionary Rate Profiling), GERP++, CEO (Combinatorial Entropy Optimization), SNPeffect, fathmm, 및 CADD (Combined Annotation-Dependent Depletion)로 이루어진 군에서 선택된 하나 이상의 알고리즘을 유전자 염기서열 변이에 적용하여 산출되는 것인, 개인 유전체 염기서열 변이를 이용한 골다공증치료제 선택을 위한 정보를 제공하는 방법.
According to claim 9,
The gene sequence variation score is SIFT (Sorting Intolerant From Tolerant), PolyPhen (Polymorphism Phenotyping), PolyPhen-2, MAPP (Multivariate Analysis of Protein Polymorphism), Logre (Log R Pfam E-value), MutationAssessor, MutationTaster, MutationTaster2, One or more algorithms selected from the group consisting of PROVEAN (Protein Variation Effect Analyzer), PMut, Condel, GERP (Genomic Evolutionary Rate Profiling), GERP++, CEO (Combinatorial Entropy Optimization), SNPeffect, fathmm, and CADD (Combined Annotation-Dependent Depletion) A method for providing information for selecting an osteoporosis treatment using individual genome sequence variation, which is calculated by applying to gene sequence variation.
제 1 항에 있어서,
상기 단백질 손상 점수는, 단백질을 코딩하는 유전자에서 발견되는 분석대상 염기서열 변이가 두 개 이상인 경우, 상기 유전자 염기서열 변이 점수들의 평균값으로 산출되는 것인, 개인 유전체 염기서열 변이를 이용한 골다공증치료제 선택을 위한 정보를 제공하는 방법.
According to claim 1,
The protein damage score, when there are two or more target sequence mutations found in the gene encoding the protein, is calculated as the average value of the gene sequence mutation scores. How to provide information for.
제 11 항에 있어서,
상기 평균값은 기하평균, 산술평균, 조화평균, 산술기하평균, 산술조화평균, 기하조화평균, 피타고라스 평균, 헤론 평균, 역조화평균, 평균제곱근편차, 센트로이드 평균, 사분평균, 이차평균, 절삭평균, 윈저화 평균, 가중평균, 가중기하평균, 가중산술평균, 가중조화평균, 함수의 평균, 멱평균, 일반화된 f-평균, 백분위수, 최대값, 최소값, 최빈값, 중앙값, 중앙범위, 중심경향도(measures of central tendency), 단순 곱 및 가중 곱으로 이루어진 군으로부터 선택된 하나 이상에 의해 계산되는 것인, 개인 유전체 염기서열 변이를 이용한 골다공증치료제 선택을 위한 정보를 제공하는 방법.
According to claim 11,
The average value is geometric mean, arithmetic mean, harmonic mean, arithmetic geometric mean, arithmetic harmonic mean, geometric harmonic mean, Pythagorean mean, Heron mean, inverse harmonic mean, root mean square deviation, centroid mean, quartile mean, quadratic mean, cut mean , Winsorized mean, weighted mean, weighted geometric mean, weighted arithmetic mean, weighted harmonic mean, mean of a function, power mean, generalized f-mean, percentile, maximum, minimum, mode, median, median range, central tendency A method for providing information for selecting an osteoporosis treatment using individual genome sequence variation, which is calculated by at least one selected from the group consisting of measures of central tendency, simple products and weighted products.
삭제delete 삭제delete 제 1 항에 있어서,
상기 약물 점수는, 골다공증치료제의 약력학 또는 약동학에 관여하는 단백질의 손상이 두 개 이상인 경우, 단백질 손상 점수들의 평균값으로 산출되는 것인, 개인 유전체 염기서열 변이를 이용한 골다공증치료제 선택을 위한 정보를 제공하는 방법.
According to claim 1,
The drug score, when there are two or more protein damages involved in the pharmacodynamics or pharmacokinetics of the osteoporosis treatment, is calculated as the average value of the protein damage scores, providing information for selecting an osteoporosis treatment using individual genome sequence mutation method.
제 15 항에 있어서,
상기 평균값은 기하평균, 산술평균, 조화평균, 산술기하평균, 산술조화평균, 기하조화평균, 피타고라스 평균, 헤론 평균, 역조화평균, 평균제곱근편차, 센트로이드 평균, 사분평균, 이차평균, 절삭평균, 윈저화 평균, 가중평균, 가중기하평균, 가중산술평균, 가중조화평균, 함수의 평균, 멱평균, 일반화된 f-평균, 백분위수, 최대값, 최소값, 최빈값, 중앙값, 중앙범위, 중심경향도(measures of central tendency), 단순 곱 및 가중 곱으로 이루어진 군으로부터 선택된 하나 이상에 의해 계산되는 것인, 개인 유전체 염기서열 변이를 이용한 골다공증치료제 선택을 위한 정보를 제공하는 방법.
According to claim 15,
The average value is geometric mean, arithmetic mean, harmonic mean, arithmetic geometric mean, arithmetic harmonic mean, geometric harmonic mean, Pythagorean mean, Heron mean, inverse harmonic mean, root mean square deviation, centroid mean, quartile mean, quadratic mean, cut mean , Winsorized mean, weighted mean, weighted geometric mean, weighted arithmetic mean, weighted harmonic mean, mean of a function, power mean, generalized f-mean, percentile, maximum, minimum, mode, median, median range, central tendency A method for providing information for selecting an osteoporosis treatment using individual genome sequence variation, which is calculated by at least one selected from the group consisting of measures of central tendency, simple products and weighted products.
삭제delete 삭제delete 제 1 항에 있어서,
상기 단백질 손상 점수 또는 약물 점수는 해당 단백질의 종류, 해당 단백질의 약력학 또는 약동학적 분류, 해당 약물 대사효소의 약동학 파라미터, 또는 인구 집단 또는 인종별 분포를 고려하여 결정된 값으로 가중치를 부여하여 산출되는 것인, 개인 유전체 염기서열 변이를 이용한 골다공증치료제 선택을 위한 정보를 제공하는 방법.
According to claim 1,
The protein damage score or drug score is calculated by weighting a value determined by considering the type of the protein, pharmacodynamics or pharmacokinetic classification of the protein, pharmacokinetic parameters of the drug-metabolizing enzyme, or distribution by population or race Method for providing information for selection of osteoporosis treatment using human and individual genome sequence mutation.
제 1 항에 있어서,
상기 방법은 상기 개인별 약물 점수를 이용하여 상기 개인에 적용되는 골다공증치료제의 사용 여부 또는 사용 방법을 결정하는 후행 단계를 추가로 포함하는, 개인 유전체 염기서열 변이를 이용한 골다공증치료제 선택을 위한 정보를 제공하는 방법.
According to claim 1,
The method further includes a subsequent step of determining whether to use or how to use the osteoporosis treatment applied to the individual using the individual drug score, providing information for selecting an osteoporosis treatment using individual genome sequence mutation method.
제 1 항에 있어서,
상기 방법은 상기 골다공증치료제의 약력학 또는 약동학에 관여하는 유전자의 염기서열 변이 정보를 컴퓨터 시스템으로 접수하는 선행 단계를 추가로 포함하며,
상기 컴퓨터 시스템은 상기 골다공증치료제의 약력학 또는 약동학에 관여하는 유전자 정보를 포함하는 데이터베이스를 포함하거나 또는 상기 데이터베이스에 접근 가능한 것인, 개인 유전체 염기서열 변이를 이용한 골다공증치료제 선택을 위한 정보를 제공하는 방법.
According to claim 1,
The method further includes a preceding step of receiving nucleotide sequence mutation information of a gene involved in the pharmacodynamics or pharmacokinetics of the osteoporosis treatment into a computer system,
The computer system includes a database containing genetic information involved in the pharmacodynamics or pharmacokinetics of the osteoporosis treatment, or provides information for selecting an osteoporosis treatment using individual genome sequence variation that is accessible to the database.
제 1 항 내지 제12항, 제15항, 제16항 및 제19항 내지 제 21 항 중 어느 한 항에 있어서,
상기 방법은 골다공증치료제 부작용 방지를 목적으로 수행되는 것을 특징으로 하는, 개인 유전체 염기서열 변이를 이용한 골다공증치료제 선택을 위한 정보를 제공하는 방법.
The method of any one of claims 1 to 12, 15, 16 and 19 to 21,
The method for providing information for selecting an osteoporosis therapeutic agent using individual genome sequence mutation, characterized in that performed for the purpose of preventing side effects of the osteoporosis therapeutic agent.
개인에 대해 적용할 수 있는 골다공증치료제에 대하여, 상기 골다공증치료제와 관련된 유전자 또는 단백질과 관련된 정보 검색 또는 추출이 가능한 데이터베이스;
상기 데이터베이스에 접근 가능한 통신부;
상기 정보에 기초하여 상기 골다공증치료제의 약력학 또는 약동학에 관여하는 하나 이상의 유전자 염기서열 변이 정보를 산출하는 제1 산출모듈;
상기 유전자 염기서열 변이 정보를 이용하여 개인별 단백질 손상 점수를 산출하는 제2 산출모듈;
상기 개인별 단백질 손상 점수를 약물과 단백질 사이의 상호 관계와 연관지어, 개인별 약물 점수를 산출하는 제3 산출모듈; 및
상기 산출모듈에서 산출된 산출값을 표시하는 표시부를 포함하고,
상기 개인별 단백질 손상 점수는 하기 수학식 2에 의해 산출되고,
[수학식 2]
Figure 112022056405671-pat00017

상기 수학식 2에서 Sg 는 유전자 g가 코딩하는 단백질의 단백질 손상 점수, n은 상기 유전자 g의 염기서열 변이 중 분석대상인 염기서열 변이의 수, vi i 번째 분석대상 염기서열 변이의 상기 유전자 염기서열 변이 점수이며, wi 는 상기 i 번째 분석대상 염기서열 변이의 상기 유전자 염기서열 변이 점수 vi 에 부여되는 가중치이고, i 는 1부터 n의 정수이고,
상기 개인별 약물 점수는 하기 수학식 4에 의해 산출되고,
[수학식 4]
Figure 112022056405671-pat00018

상기 수학식 4에서 Sd 는 약물 d의 산출된 약물 점수, n은 상기 약물 d의 약력학 또는 약동학에 관여하는 하나 이상의 유전자가 코딩하는 단백질의 수, gi 는 상기 약물 d의 약력학 또는 약동학에 관여하는 하나 이상의 유전자가 코딩하는 단백질의 상기 단백질 손상 점수이며, wi i 번째 유전자가 코딩하는 단백질의 상기 단백질 손상 점수 gi 에 부여되는 가중치이고, i 는 1부터 n의 정수인, 개인 유전체 염기서열 변이를 이용한 골다공증치료제 선택 시스템.
Regarding the osteoporosis treatment applicable to individuals, a database capable of searching or extracting information related to genes or proteins related to the osteoporosis treatment;
a communication unit capable of accessing the database;
A first calculation module for calculating one or more gene sequence mutation information involved in the pharmacodynamics or pharmacokinetics of the osteoporosis treatment based on the information;
a second calculation module for calculating individual protein damage scores using the gene sequence mutation information;
a third calculation module for calculating an individual drug score by associating the individual protein damage score with a relationship between a drug and a protein; and
And a display unit for displaying the calculated value calculated by the calculation module,
The above individual protein damage The score is calculated by Equation 2 below,
[Equation 2]
Figure 112022056405671-pat00017

In Equation 2, S g is the protein damage score of the protein encoded by gene g , n is the number of nucleotide sequence variants to be analyzed among the nucleotide sequence variants of the gene g , and v i is the gene of the ith nucleotide sequence variant to be analyzed. A base sequence variation score, w i is a weight given to the gene sequence variation score v i of the ith base sequence variation to be analyzed, i is an integer from 1 to n ,
The individual drug score is calculated by Equation 4 below,
[Equation 4]
Figure 112022056405671-pat00018

In Equation 4, S d is the calculated drug score of drug d , n is the number of proteins encoded by one or more genes involved in the pharmacodynamics or pharmacokinetics of drug d , g i is involved in the pharmacodynamics or pharmacokinetics of drug d is the protein damage score of a protein encoded by one or more genes, w i is a weight given to the protein damage score g i of a protein encoded by the ith gene, and i is an integer from 1 to n , a personal genome sequence Osteoporosis treatment selection system using mutation.
제 23 항에 있어서,
상기 시스템은 상기 제3 산출모듈에서 산출된 상기 개인별 약물 점수를 이용하여 상기 개인에 적용되는 골다공증치료제의 사용 여부를 결정하는 제4 산출모듈을 추가로 포함하는, 개인 유전체 염기서열 변이를 이용한 골다공증치료제 선택 시스템.
24. The method of claim 23,
The system further comprises a fourth calculation module for determining whether to use the osteoporosis treatment applied to the individual using the individual drug score calculated in the third calculation module, osteoporosis treatment using individual genome sequence mutation. selection system.
제 23 항에 있어서,
상기 시스템은 사용자에 의한 골다공증치료제의 입력에 따라 상기 골다공증치료제에 대한 개인별 약물 점수를 산출하여 제공하는 사용자 인터페이스를 추가로 포함하는, 개인 유전체 염기서열 변이를 이용한 골다공증치료제 선택 시스템.
24. The method of claim 23,
The system further comprises a user interface for calculating and providing individual drug scores for the osteoporosis treatment according to the input of the osteoporosis treatment by the user.
제 23 항에 있어서,
상기 표시부는 상기 각 산출모듈에서 산출된 값, 계산 과정, 또는 상기 계산의 기초가 된 정보를 추가로 표시하는 표시부를 추가로 포함하는, 개인 유전체 염기서열 변이를 이용한 골다공증치료제 선택 시스템.
24. The method of claim 23,
The display unit further comprises a display unit for additionally displaying the value calculated in each of the calculation modules, the calculation process, or information based on the calculation, the osteoporosis treatment selection system using the individual genome sequence mutation.
제 23 항 내지 제 26 항 중 어느 한 항에 있어서,
상기 각 산출모듈은 상기 유전자 염기서열 변이 정보, 단백질 손상 점수, 약물 점수 및 그 산출의 근거가 되는 정보가 저장되며,
상기 데이터베이스의 갱신에 따라 상기 각 산출모듈의 정보가 갱신되는, 개인 유전체 염기서열 변이를 이용한 골다공증치료제 선택 시스템.
27. The method of any one of claims 23 to 26,
Each of the calculation modules stores the gene sequence mutation information, protein damage score, drug score, and information that is the basis for the calculation,
An osteoporosis treatment selection system using individual genome sequence mutation, in which information of each calculation module is updated according to the update of the database.
하기 프로세서의 기능을 실행시키는 실행모듈을 포함하는 컴퓨터 판독 가능한 저장 매체로서, 상기 기능은:
개인 유전체 염기서열 정보로부터 골다공증치료제의 약력학 또는 약동학에 관여하는 하나 이상의 유전자 염기서열 변이 정보를 입수하는 단계;
상기 유전자 염기서열 변이 정보를 이용하여 개인별 단백질 손상 점수를 산출하는 단계; 및
상기 개인별 단백질 손상 점수를 약물과 단백질 사이의 상호 관계와 연관지어, 개인별 약물 점수를 산출하는 단계;를 포함하는 동작을 수행하고,
상기 개인별 단백질 손상 점수는 하기 수학식 2에 의해 산출되고,
[수학식 2]
Figure 112022056405671-pat00019

상기 수학식 2에서 Sg 는 유전자 g가 코딩하는 단백질의 단백질 손상 점수, n은 상기 유전자 g의 염기서열 변이 중 분석대상인 염기서열 변이의 수, vi i 번째 분석대상 염기서열 변이의 상기 유전자 염기서열 변이 점수이며, wi 는 상기 i 번째 분석대상 염기서열 변이의 상기 유전자 염기서열 변이 점수 vi 에 부여되는 가중치이고, i 는 1부터 n의 정수이고,
상기 개인별 약물 점수는 하기 수학식 4에 의해 산출되고,
[수학식 4]
Figure 112022056405671-pat00020

상기 수학식 4에서 Sd 는 약물 d의 산출된 약물 점수, n은 상기 약물 d의 약력학 또는 약동학에 관여하는 하나 이상의 유전자가 코딩하는 단백질의 수, gi 는 상기 약물 d의 약력학 또는 약동학에 관여하는 하나 이상의 유전자가 코딩하는 단백질의 상기 단백질 손상 점수이며, wi i 번째 유전자가 코딩하는 단백질의 상기 단백질 손상 점수 gi 에 부여되는 가중치이고, i 는 1부터 n의 정수인, 컴퓨터 판독 가능한 저장 매체.
A computer-readable storage medium comprising an execution module that executes the functions of the processor, wherein the functions are:
Obtaining at least one gene sequence mutation information involved in the pharmacodynamics or pharmacokinetics of an osteoporosis treatment from personal genome sequence information;
Calculating individual protein damage scores using the gene sequence mutation information; and
Calculating an individual drug score by associating the individual protein damage score with a mutual relationship between a drug and a protein;
The above individual protein damage The score is calculated by Equation 2 below,
[Equation 2]
Figure 112022056405671-pat00019

In Equation 2, S g is the protein damage score of the protein encoded by gene g , n is the number of nucleotide sequence variants to be analyzed among the nucleotide sequence variants of the gene g , and v i is the gene of the ith nucleotide sequence variant to be analyzed. A base sequence variation score, w i is a weight given to the gene sequence variation score v i of the ith base sequence variation to be analyzed, i is an integer from 1 to n ,
The individual drug score is calculated by Equation 4 below,
[Equation 4]
Figure 112022056405671-pat00020

In Equation 4, S d is the calculated drug score of drug d , n is the number of proteins encoded by one or more genes involved in the pharmacodynamics or pharmacokinetics of drug d , g i is involved in the pharmacodynamics or pharmacokinetics of drug d is the protein damage score of a protein encoded by one or more genes, w i is a weight given to the protein damage score g i of a protein encoded by the ith gene, and i is an integer from 1 to n , computer readable storage media.
제 28 항에 있어서,
상기 프로세서는 상기 개인별 약물 점수를 이용하여 상기 개인에 적용되는 골다공증치료제의 사용 여부를 결정하는 단계;를 추가로 포함하는 기능을 수행하는, 컴퓨터 판독 가능한 저장 매체.
29. The method of claim 28,
Wherein the processor determines whether or not to use the osteoporosis treatment applied to the individual using the individual drug score; performing a function that further includes, a computer readable storage medium.
개인 유전체 염기서열 정보로부터 골다공증 치료제의 약력학(pharmaco-dynamics) 또는 약동학(pharmaco-kinetics)에 관여하는 하나 이상의 유전자 염기서열 변이 정보를 결정하는 단계;
상기 유전자 염기서열 변이 정보를 이용하여 개인별 단백질 손상 점수를 산출하는 단계; 및
상기 개인별 단백질 손상 점수를 골다공증 치료제와 단백질 사이의 상호 관계와 연관지어 개인별 약물 점수를 산출하는 단계를 포함하고,
상기 약력학 또는 약동학에 관여하는 유전자는 FGFR4, IGHMBP2, ARHGEF26, HBXIP, CD1A, ZNF57, LAMA4, SIPA1, GPC4, PSMD9, AKNA, ANKRD50, DUSP13, PIK3R1, C4orf14, GPR174, CHDH, AC018682.6, SLC12A4, ADARB2, CD3G, ZFYVE20, ASZ1, ARHGEF4, FAT4, OR2M5, HPS1, ZNF235, P4HB, ATP11C, SYNE1, ADCY3, PGLYRP3, MAGEA12, TMEM187, OR4S1, KRTAP5-4, SERPINI2, BTNL2, CXorf1, PRG4, VAMP8, CSAG1, C1orf27, C1orf229, LRRTM3, SPDEF, GZMA, LTBP1 및 OBP2A로 이루어진 군에서 선택된 1종 이상인, 개인 유전체 염기서열 변이를 이용한 골다공증치료제 선택을 위한 정보를 제공하는 방법.
Determining at least one gene sequence mutation information involved in pharmaco-dynamics or pharmaco-kinetics of a therapeutic agent for osteoporosis from personal genome sequence information;
Calculating individual protein damage scores using the gene sequence mutation information; and
Calculating an individual drug score by associating the individual protein damage score with a correlation between an osteoporosis treatment and a protein,
Genes involved in the pharmacodynamics or pharmacokinetics are FGFR4, IGHMBP2, ARHGEF26, HBXIP, CD1A, ZNF57, LAMA4, SIPA1, GPC4, PSMD9, AKNA, ANKRD50, DUSP13, PIK3R1, C4orf14, GPR174, CHDH, AC018682.6, SLC12A4, ADARB2 , CD3G, ZFYVE20, ASZ1, ARHGEF4, FAT4, OR2M5, HPS1, ZNF235, P4HB, ATP11C, SYNE1, ADCY3, PGLYRP3, MAGEA12, TMEM187, OR4S1, KRTAP5-4, SERPINI2, BTNL2, CXorf1, PRG4, VAMP8, CSAG1, C1orf27 , C1orf229, LRRTM3, SPDEF, GZMA, at least one selected from the group consisting of LTBP1 and OBP2A, a method for providing information for the selection of osteoporosis treatment using individual genome sequence mutation.
제 30항에 있어서,
상기 유전자는 PGLYRP3, MAGEA12, TMEM187, OR4S1, KRTAP5-4, SERPINI2, BTNL2, CXorf1, PRG4, VAMP8, CSAG1, C1orf27, C1orf229, LRRTM3, SPDEF, GZMA, LTBP1 및 OBP2A로 이루어진 군으로부터 선택된 1종 이상을 더 포함하는, 개인 유전체 염기서열 변이를 이용한 골다공증치료제 선택을 위한 정보를 제공하는 방법.
31. The method of claim 30,
The gene further comprises at least one selected from the group consisting of PGLYRP3, MAGEA12, TMEM187, OR4S1, KRTAP5-4, SERPINI2, BTNL2, CXorf1, PRG4, VAMP8, CSAG1, C1orf27, C1orf229, LRRTM3, SPDEF, GZMA, LTBP1 and OBP2A A method for providing information for selecting an osteoporosis treatment using personal genome sequence variation, comprising:
제 30항에 있어서,
상기 유전자는 FGFR4, IGHMBP2, ARHGEF26, HBXIP, CD1A, ZNF57, LAMA4, SIPA1, GPC4, PSMD9, AKNA, ANKRD50, DUSP13, PIK3R1, C4orf14, GPR174, CHDH, AC018682.6, SLC12A4, ADARB2, CD3G, ZFYVE20, ASZ1, ARHGEF4, FAT4, OR2M5, HPS1, ZNF235, P4HB, ATP11C, SYNE1 및 ADCY3로 이루어진 군으로부터 선택된 1종 이상을 더 포함하는, 개인 유전체 염기서열 변이를 이용한 골다공증치료제 선택을 위한 정보를 제공하는 방법.
31. The method of claim 30,
The gene is FGFR4, IGHMBP2, ARHGEF26, HBXIP, CD1A, ZNF57, LAMA4, SIPA1, GPC4, PSMD9, AKNA, ANKRD50, DUSP13, PIK3R1, C4orf14, GPR174, CHDH, AC018682.6, SLC12A4, ADARB2, CD3G, ZFYVE20, ASZ1 , ARHGEF4, FAT4, OR2M5, HPS1, ZNF235, P4HB, ATP11C, SYNE1, and ADCY3 further comprising one or more selected from the group consisting of, a method for providing information for selecting a therapeutic agent for osteoporosis using individual genome sequence mutations.
KR1020160018786A 2015-02-17 2016-02-17 Method for personalized prevention of adverse drug reaction of osteoporosis medication based on information of individual deleterious protein sequence variation KR102482818B1 (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR20150024456 2015-02-17
KR1020150024456 2015-02-17

Publications (2)

Publication Number Publication Date
KR20160101707A KR20160101707A (en) 2016-08-25
KR102482818B1 true KR102482818B1 (en) 2022-12-29

Family

ID=56689077

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020160018786A KR102482818B1 (en) 2015-02-17 2016-02-17 Method for personalized prevention of adverse drug reaction of osteoporosis medication based on information of individual deleterious protein sequence variation

Country Status (2)

Country Link
KR (1) KR102482818B1 (en)
WO (1) WO2016133375A1 (en)

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101298303B1 (en) * 2010-04-27 2013-08-20 울산대학교 산학협력단 COMBINATION ANALYSIS SYSTEM FOR Pharmacokinetic AND Pharmacodynamic MODELING OF DRUG
US20120016594A1 (en) * 2010-07-02 2012-01-19 Coriell Institute For Medical Research, Inc. Method for translating genetic information for use in pharmacogenomic molecular diagnostics and personalized medicine research
JP5959634B2 (en) * 2011-06-23 2016-08-02 チャン グン メディカル ファンデーション チャン グン メモリアル ホスピタル アット キールン Risk assessment of drug side effects induced by phenytoin
KR101301872B1 (en) * 2012-02-15 2013-08-30 대한민국 Methods of analyzing cyp2c19 genotype for predicting pharmacokinetics of lansoprazole
KR101419753B1 (en) * 2012-10-16 2014-07-17 안형준 Medicine retrieval system minimized individual side-effects based on private single nucleotide polymorphism and the method thereof

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
F. Marini & M. L. Brandi, "Pharmacogenetics of Osteoporosis: What is the Evidence?", Current Osteoporosis Reports, 10:221-227. (2012.07.04.)
J. Hakenberg 외, "A SNPshot of PubMed to associate genetic variants with drugs, diseases, and adverse reactions", Journal of Biomedical Informatics, 45(5):842-850. (2012.10.)
K. M. Giacomini 외, "The Pharmacogenetics Research Network: From SNP DIscovery to Clinical Drug Response", Clinical Pharmacology & Therapeutics, 82(3):328-345. (2007.03.)
T. A. Peterson 외, "Towards Precision Medicine: Advances in Computational Approaches for the Analysis of Human Variants", Journal of Molecular Biology, 425(21):4047-4063. (2013.11.)

Also Published As

Publication number Publication date
WO2016133375A1 (en) 2016-08-25
KR20160101707A (en) 2016-08-25

Similar Documents

Publication Publication Date Title
JP6266110B2 (en) Drug selection method and system based on individual protein damage information for prevention of drug side effects
Wang et al. Variant association tools for quality control and analysis of large-scale sequence and genotyping array data
US20200027557A1 (en) Multimodal modeling systems and methods for predicting and managing dementia risk for individuals
Dewey et al. Phased whole-genome genetic risk in a family quartet using a major allele reference sequence
Baye et al. Mapping genes that predict treatment outcome in admixed populations
US20220367063A1 (en) Polygenic risk score for in vitro fertilization
Somineni et al. Whole-genome sequencing of African Americans implicates differential genetic architecture in inflammatory bowel disease
Jack et al. Lymphoblastoid cell lines models of drug response: successes and lessons from this pharmacogenomic model
KR20180124840A (en) Assessment of drug safety for computer-implemented populations
Patel et al. Advances and applications of polygenic scores for coronary artery disease
Fiorica et al. Multi-ethnic transcriptome-wide association study of prostate cancer
KR102482819B1 (en) Method for personalized prevention of adverse drug reaction of anticancer drug based on information of individual deleterious protein sequence variation
KR20160101706A (en) Method for personalized prevention of adverse drug reaction of tocolytics based on information of individual deleterious protein sequence variation
Yan et al. Associating multivariate quantitative phenotypes with genetic variants in family samples with a novel kernel machine regression method
KR102482818B1 (en) Method for personalized prevention of adverse drug reaction of osteoporosis medication based on information of individual deleterious protein sequence variation
CN113053460A (en) Systems and methods for genomic and genetic analysis
Wendt et al. Global genetic variation of select opiate metabolism genes in self-reported healthy individuals
Chen et al. Gamete simulation improves polygenic transmission disequilibrium analysis
Gonzalez-Covarrubias et al. Pharmacogenetic variation in over 100 genes in patients receiving acenocumarol
Verhoef et al. Shared polygenetic variation between ASD and ADHD exerts opposite association patterns with educational attainment
Zaghlool et al. Elucidating the genetic risk of obesity through the human blood plasma proteome
Tang et al. Advances and challenges in quantitative delineation of the genetic architecture of complex traits
Bai et al. Pharmacogenomic and Statistical Analysis
Dewey et al. Phased Whole-Genome Genetic Risk in a Family Quartet Using a Major Allele
Karczewski et al. Phased Whole-Genome Genetic Risk in a Family Quartet Using a Major Allele Reference Sequence

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant