WO2015026135A1 - 약물 부작용 방지를 위한 개인별 단백질 손상 정보 기반의 약물 선택 방법 및 시스템 - Google Patents

약물 부작용 방지를 위한 개인별 단백질 손상 정보 기반의 약물 선택 방법 및 시스템 Download PDF

Info

Publication number
WO2015026135A1
WO2015026135A1 PCT/KR2014/007685 KR2014007685W WO2015026135A1 WO 2015026135 A1 WO2015026135 A1 WO 2015026135A1 KR 2014007685 W KR2014007685 W KR 2014007685W WO 2015026135 A1 WO2015026135 A1 WO 2015026135A1
Authority
WO
WIPO (PCT)
Prior art keywords
drug
score
individual
protein
sequence variation
Prior art date
Application number
PCT/KR2014/007685
Other languages
English (en)
French (fr)
Inventor
김주한
백수연
이수연
Original Assignee
서울대학교 산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 서울대학교 산학협력단 filed Critical 서울대학교 산학협력단
Priority to EP14838351.6A priority Critical patent/EP3037548B1/en
Priority to CN201480046187.7A priority patent/CN105940114B/zh
Priority to EP19153339.7A priority patent/EP3495504B1/en
Priority to US14/912,397 priority patent/US10950326B2/en
Priority to JP2016536029A priority patent/JP6266110B2/ja
Priority to ES14838351T priority patent/ES2720999T3/es
Publication of WO2015026135A1 publication Critical patent/WO2015026135A1/ko
Priority to US15/707,818 priority patent/US20180068056A1/en
Priority to US17/200,447 priority patent/US20210241849A1/en

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/20Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/30Prediction of properties of chemical compounds, compositions or mixtures
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/106Pharmacogenomics, i.e. genetic variability in individual responses to drugs and drug metabolism
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/40Population genetics; Linkage disequilibrium
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Definitions

  • the present invention relates to a personalized drug selection method and system based on individual protein damage information using individual genome sequencing.
  • Pharmacogenetics predicts genetic differences in metabolism and reactions of drugs or chemicals in the general population or in individuals. In some individuals, reactions other than the expected drug response to the drug may be present. These drug side effects may be related to the severity of the disease being treated, drug interactions, the patient's age, nutritional status, liver and kidney function, climate, or food. Although it may be due to factors, research is being conducted on genetic differences related to drug metabolism, for example, polymorphism of drug enzyme genes.
  • Korean Patent Laid-Open Publication No. 2007-0111475 discloses a technique related to a biomarker for confirming the efficacy of tegaserod in patients with chronic constipation, and it uses tegaserod (Zelmac®) using pharmacogenetics. / Zelnorm®) was used to evaluate the effect of polymorphism in selecting candidate genes that can predict the response of patients with chronic constipation.
  • the present invention was devised in view of the above, and after analyzing individual genome sequence variation information and calculating individual protein damage scores from gene sequence variation information related to pharmacodynamics or pharmacokinetics of a given drug or drug group, It is to provide a method and system that provides information for personalized drug selection by calculating the individual drug scores by correlating the correlation between drugs and proteins.
  • the present invention comprises the steps of determining from the individual genome sequence information one or more gene sequence variation information involved in the pharmaco-dynamics or pharmaco-kinetics of a given drug or group of drugs; Calculating an individual protein damage score using the gene sequence variation information; And calculating the individual drug score by associating the individual protein damage score with the correlation between the drug and the protein, thereby providing information for personalized drug selection using the personal genomic sequence variation.
  • the present invention provides a database for retrieving or extracting information related to a gene or protein related to the drug or drug group, for a drug or drug group to be applied to an individual;
  • a communication unit accessible to the database;
  • a first calculation module configured to calculate one or more gene sequence variation information related to pharmacodynamics or pharmacokinetics of the drug or drug group based on the information;
  • a second calculation module for calculating an individual protein damage score using the gene sequence variation information;
  • a third calculation module that calculates an individual drug score by associating the individual protein damage score with a correlation between a drug and a protein;
  • a display unit for displaying the calculated value calculated by the calculating module.
  • the present invention comprises the steps of obtaining genetic sequence variation information involved in the pharmacokinetics or pharmacokinetics of a given drug or group of drugs from the individual genome sequence information; Calculating an individual protein damage score using the gene sequence variation information; And an execution module that executes a processor to perform an operation that associates the individual protein damage score with a correlation between a drug and a protein to calculate an individual drug score.
  • a method and system for selecting a personalized drug based on personal genomic sequence variation information is provided to a specific drug for each individual by sequencing an exon region of a gene encoding various proteins involved in pharmacodynamics or pharmacokinetics of a given drug or drug group.
  • the scope of application is a universal technology that can be extended to a full range of drugs. That is, the method and system of the present invention is a universal technique applicable to all drugs capable of obtaining protein information related to pharmacodynamics or pharmacokinetics in relation to the metabolism, action or side effects of the drug.
  • the existing pharmacogenetic research methods should be conducted for each drug-gene relationship pair, and the number of pairs increases in proportion to the product of the number of drugs and gene markers, so it is practical to study all the drug-gene relationship pairs. While it is almost impossible to generate sufficient evidence, the statistical error according to the difference between the study group selection and the population group is large, whereas the method of the present invention applies the results of the molecular level research and analysis directly to the customized drug treatment. There is an advantage in that the evidence for almost all drug-gene relationship pairs can be secured, and there is an advantage in that it can be applied without being greatly influenced by the differences between the population groups.
  • FIG. 1 is a flowchart showing each step of a method for providing information for personalized drug selection using an individual genome sequence variation according to an embodiment of the present invention.
  • Figure 2 is a schematic diagram of a customized drug selection system using a personal genomic sequence variation according to an embodiment of the present invention (DB: database).
  • DB database
  • Figure 3 shows the number of gene mutations, protein damage scores and drug scores for each individual protein calculated for one drug Terbutaline using the method according to the present invention based on the genome sequence variation information of an individual. The figure shown.
  • Figure 4 is a genetic variation of each individual protein calculated for a plurality of drugs (Aspirylsalicylic acid and Tylenol (Acetaminophen)) to be compared using the method according to the invention based on the genome sequence variation information of one individual Figures showing the number, protein damage score, and drug score.
  • drugs Aspirylsalicylic acid and Tylenol (Acetaminophen)
  • FIG. 5 shows 14 individual drug score profiles calculated for 22 drugs belonging to the Anatomical Therapeutic Chemical Classification System (ATC) Code C07 beta blocker using the method according to the present invention based on individual genome sequence variation information. It is also.
  • ATC Anatomical Therapeutic Chemical Classification System
  • Figure 6 shows the number of gene mutations for each protein calculated for a non-beta beta blocker propranool and a specific beta blocker betaxolol using the method according to the present invention based on the genome sequence variation information of an individual , Protein damage score and drug score.
  • Figure 7 is calculated using the method according to the present invention, the drug score calculated based on the comparative analysis of 1092 individual genome sequence variation information provided by The 1000 Genomes Project and the gene-drug relationship pair provided by the PharmGKB knowledge base
  • Figure 7a AUC (Area Under Curve)
  • Fig. 7a Individual drug score calculation validity (AUC) by a simple geometric mean calculation formula not applied to the weight of the protein group
  • Figure 7b Weighted geometry to which the weight of the protein group
  • FIG. 8 shows the present invention based on individual genome sequence variation information in 12 children with leukemia (FIG. 8A) and 14 normal controls (FIG. 8B) showing serious side effect warning signs for the treatment of busulfan, an anticancer and myelosuppressive agent.
  • Figure showing the distribution of the mean and standard deviation of the protein damage score and drug score of the individual calculated using the method according to. The size of each figure represents the number of gene sequence variants found.
  • FIG. 9 shows the relative frequency of market exit drugs (FIG. 9A) obtained from DrugBank and Wikipedia and market exit and use restriction drugs obtained from UN data (FIG. 9B), according to The 1000 Genomes Project using the method according to the present invention.
  • Figure shows the relative frequency histogram displayed against the population drug scores calculated based on 1092 individual genome sequence variation information.
  • the present invention is based on the discovery that individual drugs can be selected for high-safety drugs and doses / uses for the treatment of specific diseases by analyzing individual genome sequence variation information.
  • the present invention comprises the steps of determining from the individual genome sequence information one or more gene sequence variation information involved in the pharmaco-dynamics or pharmaco-kinetics of a given drug or group of drugs; Calculating an individual protein damage score using the gene sequence variation information; And calculating the individual drug scores by associating the individual protein damage scores with the correlation between the drug and the protein, and providing the information for the personalized drug selection using the personal genome sequence variation.
  • Gene sequence variation used as one information in the method of the present invention refers to a variation or polymorphism of the gene sequence of the individual.
  • the gene sequence mutation or polymorphism occurs in, but is not limited to, a particular drug or a group of drugs that occur at the exon region of a gene encoding a protein associated with pharmacodynamics or pharmacokinetics.
  • base sequence variation information used in the present invention means information about the substitution, addition or deletion of the base constituting the exon of the gene. Substitution, addition, or deletion of such bases can occur for a variety of reasons, for example, by structural differences including mutations, truncation, deletions, duplications, inversions and / or translocations of chromosomes.
  • nucleotide polymorphism refers to differences between individuals of nucleotide sequences present in the genome, and the largest number of nucleotide polymorphisms is Single Nucleotide Polymorphism (SNP), which is A, T, and C. There is a difference between individuals in one of the base sequences consisting of G and. Sequence polymorphism is a form of polyalleic variation including single nucleotide variation (SNV), short tandem repeat polymorphism (STRP), or variable number of tandem repeat (VNTR) and copy number variation (CNV), including SNPs. May appear.
  • SNV single nucleotide variation
  • STRP short tandem repeat polymorphism
  • VNTR variable number of tandem repeat
  • CNV copy number variation
  • Sequence variation or polymorphism information found in the individual genome in the method of the present invention is collected in association with proteins associated with the pharmacokinetics or pharmacokinetics of a given drug or group of drugs. That is, the nucleotide sequence information used in the method of the present invention is one or more genes involved in the pharmacokinetics or pharmacokinetics of the drug or group of drugs that are effective in the treatment of a specific disease among the obtained genome sequence information of the individual, for example, a drug. Mutation information found in particular exon regions of genes encoding target proteins, enzymes involved in drug metabolism, transporter and carrier proteins, but not limited to .
  • pharmaco-kinetics or pharmacokinetic parameters refers to the properties of a drug that is associated with absorption, migration, distribution, conversion, and excretion of the drug in the body over a period of time.
  • pharmacodynamics or pharmacodynamic parameters refers to the characteristics related to the physiological and biochemical action of the drug on the living body and its mechanism of action, ie the reaction or effect of the living body of the drug.
  • Tables 1-15 A list of genes involved in the pharmacodynamics or pharmacokinetics of a given drug or group of drugs is shown in Tables 1-15 below. More specifically, the top most commonly prescribed in the United States between 2005 and 2008, as provided by the Health Report, published by the US Centers for Disease Control and Prevention (CDC) (Health, United States, 2011, Centers for Disease Control and Prevention (CDC)). For the 920 drugs extracted by mapping the 15th drug group to the standard drug classification code, the ATC code, the composition of 395 drugs and their corresponding drug-gene pairs in the DrugBank ver 3.0 and KEGG Drug databases are known. Are shown in Tables 1 to 15 below.
  • HGNC HUGO Gene Nomenclature Committee
  • gene / protein information involved in the pharmacokinetics or pharmacokinetics of a given drug or group of drugs can be found in DrugBank (http://www.drugbank.ca/) or KEGG Drug (http://www.genome.jp/kegg/drug/). Or from a database such as PharmGKB (https://www.pharmgkb.org/) and the like, and Tables 1 to 15 below are merely illustrative, but not limited thereto.
  • ACE inhibitors [C09A] ⁇ / b> Drug name Target protein Enzyme protein Transporter protein Carrier Protein Benazepril ACE MTHFR SLC15A1, SLC15A2 Captopril ACE, MMP2 CYP2D6 ABCB1, SLC15A1, SLC15A2, SLC22A6 ALB Cilazapril ACE ABCB1, SLC15A1, SLC15A2 Enalapril ACE CYP3A4 ABCB1, SLC15A1, SLC15A2, SLC22A6, SLC22A7, SLC22A8, SLCO1A2 Fosinopril ACE SLC15A1, SLC15A2 Lisinopril ACE, ACE2 ABCB1, SLC15A1 Moexipril ACE, ACE2 SLC15A1, SLC15A2 Perindopril ACE ABCB1, SLC15A1, SLC15A2 Quinapril ACE SLC15A1, SLC15A2 Ram
  • Beta blocking agents [C07] ⁇ / b> Drug name Target protein Enzyme protein Transporter protein Carrier Protein Acebutolol ADRB1, ADRB2 CYP2D6 ABCB1, SLC22A1 Alprenolol ADRB1, ADRB2, ADRB3, HTR1A CYP2D6 Atenolol ADRB1, LTF, PLA2G2E ABCB1 Betaxolol ADRB1, ADRB2 CYP1A2, CYP2D6 Bevantolol ADRA1A, ADRA1B, ADRA1D, ADRB1, ADRB2 Bisoprolol ADRB1, ADRB2 CYP2D6, CYP3A4 Bopindolol ADRB1, ADRB2, ADRB3, HTR1A, HTR1B Bupranolol ADRB1, ADRB2, ADRB3 Carteolol ADRB1, ADRB2, ADRB3 CYP2D6 Carvedilol ADRA1A, ADRA
  • Lipid modifying agents [C10] ⁇ / b> Drug name Target protein Enzyme protein Transporter protein Carrier Protein Attorvastatin AHR, DPP4, HMGCR CYP2B6, CYP2C19, CYP2C8, CYP2C9, CYP2D6, CYP3A4, CYP3A5, CYP3A7 ABCB1, ABCC1, ABCC4, ABCC5, SLCO1A2, SLCO1B1 Bezafibrate PPARA, PPARD, PPARG CYP1A1, CYP2C8, CYP3A4 SLCO1B1 Cerivastatin HMGCR CYP2B6, CYP2C19, CYP2C8, CYP2C9, CYP2D6, CYP3A4, CYP3A5, CYP3A7 ABCB1, ABCC2, ABCG2, SLCO1B1 Clofibrate PPARA CYP1A1, CYP2
  • Genomic sequencing information of the individual used in the present invention can be determined using known sequencing methods1, and services such as Complete Genomics, BGI (Beijing Genome Institute), Knome, Macrogen, DNALink, etc., which provide commercially available services. May be used, but is not limited thereto.
  • Gene sequence variation information present in the genome sequence of an individual in the present invention can be extracted using a variety of methods, a sequence comparison program with a genomic sequence of a reference group, for example HG19, for example, ANNOVAR ( Wang et al., Nucleic Acids Research, 2010; 38 (16): e164), Sequence Variant Analyzer (SVA) (Ge et al., Bioinformatics. 2011; 27 (14): 1998-2000), Break Dancer (Chen et al. , Nat Methods. 2009 Sep; 6 (9): 677-81) and the like.
  • the gene sequence variation information may be received / obtained through a computer system, and in this aspect, the method of the present invention may further include receiving the genetic variation information into a computer system.
  • the computer system used in the present invention is a gene that is involved in the pharmacokinetics or pharmacokinetics of the specific drug or group of drugs, for example, a gene encoding a target protein associated with the drug, an enzyme protein involved in drug metabolism, a transporter protein or a carrier protein, and the like. It may contain or be accessible to one or more databases containing information about.
  • Such databases include, for example, DrugBank (http://www.drugbank.ca/), KEGG Drug (http://www.genome.jp/kegg/drug/), PharmGKB (http://www.pharmgkb.org /) May include, but is not limited to, public or private databases or knowledge bases that provide information about genes / proteins / drug-protein interactions, and the like.
  • the predetermined drug or drug group may be information input from a database including information input by a user, information input from a prescription (previous), or information on drugs effective for treating a specific disease.
  • the prescription includes, but is not limited to, electronic prescription.
  • the term “gene sequence variation score” refers to an amino acid sequence variation (substitution or addition) of a protein encoded by the gene when the genome sequence variation is found in the exon region of the gene encoding the protein. Or deletion) or a score that quantifies the extent to which transcriptional control mutations result, thereby causing significant changes or damage to the structure and / or function of the protein, wherein the gene sequence variation score is the evolution of amino acids on the genome sequence It can be calculated in consideration of the degree of preservation and the degree of change in the structure or function of the protein according to the physical properties of the modified amino acid.
  • Gene sequence variation scores used for calculating individual protein damage scores and individual drug scores according to the present invention can be calculated using methods known in the art. For example, SIFT (Sorting Intolerant From Tolerant, Pauline C et al., Genome Res. 2001 May; 11 (5): 863-874; Pauline C et al., Genome Res. 2002 March; 12 (3): 436 -446; Jing Hul et al., Genome Biol. 2012; 13 (2): R9), PolyPhen, PolyPhen-2 (Polymorphism Phenotyping, Ramensky V et al., Nucleic Acids Res.
  • gene sequence variation scores may be calculated from gene sequence variation information, but are not limited thereto.
  • the purpose of the algorithms described above is to determine how each gene sequence mutation affects protein function, how this damage damages the protein, or whether there is little effect. They have a common point in that they determine the impact on the structure and / or function of the protein by determining the amino acid sequence and related changes of the protein encoded by the gene, which will be caused by individual gene sequence variations.
  • a Sorting Intolerant From Tolerant (SIFT) algorithm was used to calculate an individual gene sequence variation score.
  • SIFT Sorting Intolerant From Tolerant
  • gene sequence variation information is input to a VCF (Variant Call Format) format file, and each gene sequence variation is scored for damaging the gene.
  • VCF Variant Call Format
  • the method of the present invention calculates individual protein damage scores based on the gene sequence mutation scores described above in the next step.
  • protein damage score means that two or more significant sequence mutations are found in a gene region encoding one protein, so that one protein has two or more gene sequence mutation scores. Refers to a score calculated by combining the gene sequence variation score. If there is a significant sequence variation in a gene region encoding a protein, the gene sequence variation score and the protein damage score are the same. In this case, when there are two or more gene sequence mutations encoding a protein, the protein damage score is calculated as an average value of the gene sequence variation scores calculated for each variation, and the average value is, for example, a geometric mean, an arithmetic mean, or a harmonic mean.
  • Arithmetic geometric mean, arithmetic harmonic mean, geometric harmonic mean, Pythagorean mean, quadrant mean, quadratic mean, cutting mean, windsorized mean, weighted mean, weighted geometric mean, weighted arithmetic mean, weighted harmonic mean, function mean, ⁇ average Can be computed as a generalized f-means, percentiles, maximums, minimums, modes, medians, median ranges, measures of central tendency, simple products or weighted products, or as a function of these calculations. This is not restrictive.
  • the protein damage score was calculated by the following Equation 1, and the following Equation 1 may be variously modified, but is not limited thereto.
  • Equation 1 Sg is the protein damage score of the protein encoded by the gene g, n is the number of the nucleotide sequence analysis of the nucleotide variation of the gene g, vi is the gene sequence variation score of the i-th gene sequence variation And p is a nonzero real number.
  • p when the value of p is 1, it is an arithmetic mean, and when the value of p is -1, it is a harmonic mean, and in the extreme case where the value of p is close to 0, it is a geometric mean.
  • the protein damage score was calculated by the following equation (2).
  • Equation 2 Sg is the protein damage score of the protein encoded by the gene g, n is the number of the nucleotide sequence analysis of the nucleotide sequence variation of the gene g, vi is the gene sequence variation score of the i-th gene sequence variation , wi is a weight given to vi. When all weights wi have the same value, the protein damage score Sg becomes the geometric mean value of the gene sequence variation score vi.
  • the weight may be given in consideration of the type of the protein, the pharmacokinetic or pharmacodynamic classification of the protein, the pharmacokinetic parameters of the drug enzyme protein, and the population or race distribution.
  • the term “pharmacokinetic parameters of drug enzyme protein” includes Vmax, Km, Kcat / Km and the like.
  • Vmax is the maximum enzyme reaction rate when the substrate concentration is very high
  • Km is the concentration of the substrate that causes the reaction to reach 1/2 Vmax.
  • Km can be seen as an affinity between the enzyme and the substrate. The smaller the Km, the stronger the bond between the enzyme and the substrate.
  • Kcat also called the enzyme's metabolic rate, refers to the number of substrate molecules that are metabolized at one second per enzyme active site when the enzyme is active at its maximum rate, and how fast the enzyme reaction actually occurs.
  • the method of the present invention calculates the individual drug score by correlating the protein damage score described above in the next step with the correlation between the drug and the protein.
  • drug score refers to a target protein involved in pharmacodynamics or pharmacokinetics of a given drug, an enzyme protein involved in drug metabolism, a transporter protein or a carrier protein, and After calculating the protein damage score of the proteins, it is summed again to refer to the value calculated for one drug.
  • the drug score is calculated as an average value of the protein damage scores when the damage of the protein involved in the pharmacodynamics or pharmacokinetics of a given drug or drug group is two or more, and the average value is, for example, geometric mean, arithmetic mean, harmonic mean , Arithmetic geometric mean, arithmetic harmonic mean, geometric harmonic mean, Pythagorean mean, quadrant mean, quadratic mean, cutting mean, windsorized mean, weighted mean, weighted geometric mean, weighted arithmetic mean, weighted harmonic mean, function mean, ⁇ average Can be computed as a generalized f-means, percentiles, maximums, minimums, modes, medians, median ranges, measures of central tendency, simple products or weighted products, or as a function of these calculations. This is not restrictive.
  • the drug score may be calculated by adjusting the weights of target proteins involved in pharmacodynamics or pharmacokinetics of the drug, enzyme proteins involved in drug metabolism, transporter proteins and carrier proteins in consideration of pharmacological properties, and the weights are Pharmacokinetic parameters of the drug enzyme protein, population or race distribution, and the like.
  • the protein damage scores of proteins that do not interact directly with the drug but interact with precursors of the drug or metabolites of the drug, such as proteins that participate in pharmacological pathways are also synthesized. Drug scores can be calculated.
  • the combined drug scores may be calculated by considering the protein damage scores of the proteins that significantly interact with the proteins involved in the pharmacodynamics or pharmacokinetics of the drug.
  • the drug score was calculated by the following Equation 3, and the following Equation 3 may be variously modified, but is not limited thereto.
  • Equation 3 Sd is a drug score of drug d, n is a protein directly involved in the pharmacodynamics or pharmacokinetics of drug d or interacts with a precursor of the drug or metabolites of the drug, for example, a pharmacological pass.
  • the number of proteins encoded by one or more genes selected from the group of genes participating in the way, gi is a protein that directly participates in the pharmacodynamics or pharmacokinetics of drug d or interacts with precursors or metabolites of the drug, eg
  • p when the value of p is 1, it is an arithmetic mean, and when the value of p is -1, it is a harmonic mean, and in the extreme case where the value of p is close to 0, it is a geometric mean.
  • the drug score was calculated by the following equation (4).
  • Equation 4 Sd is a drug score of drug d, n is a protein directly involved in the pharmacodynamics or pharmacokinetics of drug d or interacts with a precursor of the drug or metabolites of the drug, eg, a pharmacological pass.
  • the number of proteins encoded by one or more genes selected from the group of genes participating in the way, gi is a protein that directly participates in the pharmacodynamics or pharmacokinetics of drug d or interacts with precursors or metabolites of the drug, eg
  • the protein damage score of a protein encoded by one or more genes selected from the group of genes participating in the pharmacological pathway, wi is the weight assigned to the gi.
  • the drug score Sd becomes the geometric mean value of the protein damage score gi when all weights wi have the same value.
  • the weight may be given in consideration of the type of the protein, the pharmacokinetic or pharmacodynamic classification of the protein, the pharmacokinetic parameters of the drug enzyme protein, and the population or race distribution.
  • the weights are equally given regardless of the characteristics of the drug-protein association, but as in the other embodiment of the present invention, It is possible to calculate the drug score by assigning weights in consideration of each feature to have. For example, different scores may be assigned to the drug's target protein and the drug's transporter protein.
  • the drug enzyme protein may be weighted with its pharmacokinetic parameters Km, Vmax, and Kcat / Km to calculate the drug score.
  • the target protein may be given a higher weight because it is considered more important in pharmacological action than the transporter protein, and the transporter protein or the carrier protein may be given a high weight for the concentration-sensitive drug.
  • Weights can be closely adjusted according to the correlation between drug and drug-related proteins, and the nature of drug-protein interactions. For example, a sophisticated algorithm can be used that assigns a weight to the nature of the drug-protein interaction, such as giving the target protein two points and the transporter protein one point.
  • the protein interacts with the precursor of the drug or metabolites of the drug, and is involved in the pharmacodynamics or pharmacokinetics of the drug. It is possible to improve the predictive power of the formula by utilizing the protein that interacts significantly with the protein, and the related protein information participating in the signaling pathway. In other words, the protein-protein interaction network or pharmacological pathway information can be utilized to use the information of various proteins involved in it.
  • the mean value (eg, geometric mean) of the protein damage scores of related proteins participating in the same signaling pathway may be used as a drug score calculation instead of the protein damage score of the protein.
  • the individual drug score may be calculated for all drugs for which information on one or more related proteins can be obtained or for some selected drugs.
  • individual drug scores can be converted into rank (rank).
  • the method of the present invention comprises the steps of determining priorities between drugs applied for the individual using the individual drug scores described above; Alternatively, the method may further include determining whether to use a drug applied to the individual by using the individual drug score.
  • the individual drug scores may be individually applied to all drugs, but may be more useful when applied between drugs, such as disease, clinical characteristics, or mode of action.
  • Drug classification systems that can be used in the present invention are, for example, the ATC (Anatomical Therapeutic Chemical Classification System) code, the top 15 frequently prescribed drug classes during 2005-2008 in the United States (Health, United States, 2011, Centers for Disease Control and Prevention), a list of drugs that have been released from the market due to known pharmacogenomic markers that may affect drug action information on the drug label, or side effects. It may include.
  • the method of the invention may further comprise calculating a prescription score.
  • the term “prescription score” refers to the drug score determined for each drug when two or more drugs are administered at the same time or at intervals short enough to significantly affect each other's pharmacological action. Refers to the score calculated in aggregate.
  • the prescription score may be calculated by combining the drug scores determined for each drug when two or more drugs determined by the priority between the drugs and simultaneous administration are required. The calculation of the prescription score can be calculated by simply averaging, summing or multiplying the drug scores of the plurality of drugs, for example, when no protein interacts in common with the plurality of drugs. If there are proteins that interact in common with the plurality of drugs, the drug damage scores of the common interacting protein are weighted twice, for example, to calculate each drug score and then the corresponding drug scores are calculated. By summing up, the prescription score can be calculated.
  • Prescription scores are intended to determine the adequacy or risk of a multi-drug prescription that is included in the prescription applied to an individual, beyond the effects of individual drugs.
  • the method of the present invention may further comprise determining the appropriateness or risk of the prescription (pre) applied to the individual.
  • the method of the present invention includes, but is not limited to being carried out for the purpose of preventing drug side effects.
  • 1 is a flowchart showing each step of a method for providing information for personalized drug selection using an individual genome sequence variation according to an embodiment of the present invention.
  • the step of providing a pharmacogenomic calculation process and the basis for calculating the drug scores by providing information such as pictures, charts and explanations to help the prescriber's judgment It may further comprise. That is, the method according to the present invention provides one or more information of the gene sequence variation information, the gene sequence variation score, the protein damage score, the drug score, and the information used for the calculation on which the drug ranking of the present invention is based. It may further comprise the step. For example, as shown in FIG. 3, a graphic, diagram, description, etc. of the pharmacogenomic basis of the drug score calculation that may be provided when the user selects a specific drug, buttalin, may be provided.
  • the present invention provides a database for retrieving or extracting information related to a gene or protein related to the drug or drug group, for a drug or drug group to be applied to an individual;
  • a communication unit accessible to the database;
  • a first calculation module configured to calculate one or more gene sequence variation information related to pharmacodynamics or pharmacokinetics of the drug or drug group based on the information;
  • a second calculation module for calculating an individual protein damage score using the gene sequence variation information;
  • a third calculation module that calculates an individual drug score by associating the individual protein damage score with a correlation between a drug and a protein; And it relates to a personalized drug selection system using a personal genome sequence variation comprising a display unit for displaying the calculated value calculated by the calculation module.
  • the module may mean a functional and structural combination of hardware for performing the technical idea according to the present invention and software for driving the hardware.
  • the module may mean a logical unit of a predetermined code and a hardware resource for performing the predetermined code, and does not necessarily mean a physically connected code or a kind of hardware. Will be apparent to those skilled in the art.
  • output module refers to the gene sequence variation score, protein damage score, drug score, and information on which the calculation is based on the drug and gene to be analyzed according to the method of the present invention. It may mean a predetermined code for calculating each score based on information and a logical unit of hardware resource for performing the predetermined code, and means a physically connected code or a kind of hardware. It does not mean.
  • the system according to the present invention also calculates priorities among drugs applied to the individual using the individual drug scores calculated in the third calculating module; Alternatively, the method may further include a fourth calculation module configured to determine whether to use a drug applied to the individual by using the individual drug score.
  • the system according to the present invention further includes a fifth calculation module for calculating the prescription score by combining the drug scores determined for each drug when two or more drugs determined by the priority between drugs are required. It may include.
  • the system inputs a list of drugs or drug groups by the user, or accesses a database containing information on drugs or drug groups that are therapeutically effective for a particular disease, and extracts relevant information, thereby It may further include a user interface for calculating and providing a drug score.
  • the system according to the present invention may further include a display unit for further displaying a calculation process in which a value calculated in each calculation module or a priority between drugs is determined, and information on which the calculation or calculation is based.
  • the server including the database or its access information, the calculated information, and the user interface device connected thereto may be used in connection with each other.
  • the system according to the invention can be immediately updated when pharmacological / biochemical new information on drug-protein interactions is produced and can be used for further customized drug selection.
  • the gene sequence variation information, gene sequence variation score, protein damage score, drug score and information on which the basis of the calculation stored in each calculation module Is updated according to the update of the database or knowledge base, the gene sequence variation information, gene sequence variation score, protein damage score, drug score and information on which the basis of the calculation stored in each calculation module Is updated.
  • FIG. 2 is a schematic diagram of a customized drug selection system using a personal genomic sequence variation according to an embodiment of the present invention.
  • the system 10 of the present invention is a database (DB) 100, a communication unit 200, a user interface or a terminal 300, a calculation unit 400 capable of searching or extracting information related to genes or proteins related to drugs or drug groups. And a display unit 500.
  • DB database
  • the user interface or the terminal 300 may request, receive and / or store a customized drug selection process using a personal genome sequence variation from a server, and may be a smart phone, a personal computer (PC), or a tablet PC. It may be configured as a terminal having a mobile communication function having a computing capability by mounting a microprocessor, such as a personal digital assistant (PDA), a web pad, or the like.
  • a microprocessor such as a personal digital assistant (PDA), a web pad, or the like.
  • the server is a means for providing access to the database 100 for drug, genetic variation, or drug-protein interaction.
  • the server is connected to the user interface or the terminal 300 through the communication unit 200 to It is configured to exchange information.
  • the communication unit 200 may communicate in the same hardware, as well as a local area network (LAN), a metropolitan area network (MAN), a wide area network (WAN), the Internet, 2G, 3G, 4G mobile communication network, Wi-Fi (Wi-Fi), Wibro (Wibro) and the like can be included, and the communication method is wired, wireless, any communication method.
  • the database 100 may also be connected to various life science databases accessible through the Internet as well as being installed directly on the server.
  • the calculation unit 400 may include the first calculation module 410 for calculating one or more gene mutation information related to pharmacodynamics or pharmacokinetics of drugs or drug groups using the collected / input information as described above, A second calculation module 420 for calculating an individual protein damage score and a third calculation module 430 for calculating an individual drug score may be included.
  • a storage medium includes any medium for storage or delivery in a form readable by a device such as a computer.
  • a computer readable medium may include read only memory (ROM); Random access memory (RAM); Magnetic disk storage media; Optical storage media; Flash memory devices and other electrical, optical or acoustic signaling media, and the like.
  • the present invention comprises the steps of obtaining from the individual genome sequence information gene sequence variation information involved in the pharmacodynamics or pharmacokinetics of a given drug or drug group; Calculating an individual protein damage score using the gene sequence variation information; And an execution module that executes a processor to perform an operation comprising: calculating a personal drug score by associating the individual protein damage score with a correlation between a drug and a protein.
  • Group 1 Examples for presenting practical applications of the present invention belonging to one drug selected (Example 1), two drugs in need of selection (Example 2) or belonging to the same drug group available under certain medical conditions Example illustrating a process of providing a personalized drug selection method of the present invention for a plurality of comparative drugs (Example 3).
  • Group 2 As an example for verifying the validity of the present invention, data-based validity verification based on published large-scale personal genome sequence variation information (Example 4), and treatment process of busulfan, which is an anticancer agent and myeloid inhibitor Personal genome sequencing of 12 pediatric leukemia patients with serious side effects warning signs and actual clinical validity test (Example 5) based on them, and individual drug scores calculated in accordance with the present invention and market withdrawal and restriction of drug use An example of demographic feasibility (Example 6) demonstrating a high correlation between suggesting that the customized drug selection method of the present invention can be used to prevent personalized drug side effects.
  • Group 3 As an example for presenting various application examples of the present invention, personalized customization of the present invention is performed by examining the clinical significance of individual genome sequence variation found in a target protein of a specific drug for which a risk is predicted in an individual. Example showing the utility of the drug selection method (Example 7).
  • Example 1 Provide a personalized drug selection method for one selected drug (terbutalin)
  • terbutaline is one of the drugs used for the treatment of asthma.
  • Drug Ingredient Name Gene / protein Protein damage score Protein family Variation score Mutation information Chromosome location Reference genotype Mutant Genotype Terbutaline (0.22) Adrenoceptor beta 2, surface (ADRB2) 0.68 Target (PD) 0.46 chr5: 148206440 G A 0.45 chr5: 148206473 G C 1.00 chr5: 148207447 G C 1.00 chr5: 148207633 G A Butyrylcholinesterase (BCHE) 0.07 Enzyme (PK) 0.07 chr3: 165491280 C T
  • the gene sequence analysis score of one mutation (chr3: 165491280) found in BCHE was 0.07, and the four mutations found in ADRB2 (chr5: 148206440). , chr5: 148206473, chr5: 148207447, and chr5: 148207633) were found to have 0.46, 0.45, 1 and 1, respectively.
  • Aspirin Acetylsalicylic acid
  • Tylenol Acetaminophen
  • Aspirin Acetylsalicylic acid
  • Tylenol Acetaminophen
  • Individual drug scores were obtained using the variation information.
  • gene sequence variation information of genes involved in pharmacokinetics or pharmacokinetics of aspirin was determined. Gene sequence variation scores were calculated using SIFT algorithm.
  • PTGS1 aspirin's target protein, and SLC22A8, a transporter protein, had one mutation (chr9: 125133479, chr11: 62766431, respectively), indicating that the gene sequence variation score (0.38, 0.32, respectively) was defined as the protein damage score. .
  • the gene sequence variation information of sg09 related to a total of twelve pharmacokinetic or pharmacodynamics including two target proteins of Tylenol (Acetaminophen), eight enzyme proteins, and two transporter proteins were used. Individual drug scores were obtained.
  • gene sequence variation information of a gene involved in pharmacodynamics or pharmacokinetics of Tylenol was determined, and a gene sequence variation score was calculated using a SIFT algorithm.
  • PTGS1 a target protein of Tylenol, had one mutation (chr9: 125133479), and the gene sequence mutation score was defined as a protein damage score.
  • the drug score was calculated using a geometric mean (using Equation 4).
  • the individual sg09 of the individual sg09 is collectively calculated to have a personal drug score of 0.76, which is higher than the Tylenol's individual drug score of 0.31.
  • Tylenol it would be a good idea to choose aspirin to reduce the discomfort associated with the drug.
  • NGS Next Generation Sequencing
  • SAM sequence alignment map
  • BAM binary alignment map
  • the clean alignment result is detected using a software tool such as SAMTools: pileup, SAMTools: mpileup, GATK: recalibration, GATK: realignment, and the like to detect mutations such as single nucleotide variations (SNVs, Single Nucleotide Variants) and InDels.
  • SAMTools pileup
  • SAMTools mpileup
  • GATK recalibration
  • GATK realignment
  • the individual drug scores for propranolol (Propranolol) among non-specific beta blockers [C07AA] and betaxolol (Betaxolol) among specific beta blockers [C07AB] It was confirmed that it was remarkably low. More specifically, in the case of individual Sg04, the individual drug score was calculated as low as 0.005 for betaxolol and 0.05 for propranool. Therefore, if the above medicament is given to individual sg04 without considering this low drug score, both drugs are likely to cause significant side effects.
  • individual sg04 was found to have an individual drug score of more than 0.9 for Atenolol, Sotalol, Bupranolol, Nadolol, Penbutolol, Bopindolol, Practolol, Esmolol, etc. It can be seen that it does not have a related protein damage and can be considered a relatively safe drug and recommend a selection. In addition, this analysis has the advantage of displaying at a glance which drug will be vulnerable to a particular individual in a particular drug group.
  • the individual sg04 is one (chr15: 75047221) and two (chr22: 42525756, chr22: 42526694) gene sequences for the two major enzyme proteins CYP1A2 and CYP2D6 that degrade betaxolol And had low nucleotide sequence mutation scores (1e-08, 0.39, 0.02, respectively).
  • the individual protein damage scores calculated using Equation 2 for the enzyme proteins CYP1A2 and CYP2D6 were low as 1.0e-8 and 0.088, respectively, and the individual drug scores for betaxolol calculated using Equation 4 It was severely lowered to 0.005.
  • the individual sg04 had no gene sequence mutation in the target protein ADRB1 of betaxolol, and five gene sequence mutations in the ADRB2 (chr5: 148206917, chr5: 148206473, chr5: 148206646, chr5: 148207447, chr5: 148207633). Although the score was not low, the individual protein damage score for ADRB2 calculated using Equation 2 was 0.85.
  • the individual sg04 had one or more severe gene sequence mutations in each of five, including CYP1A1, CYP1A2, CYP2D6, CYP3A5, and CYP3A7, among seven degrading enzymes that degrade propranolol.
  • CYP1A1 (0.08 (chr15: 75015305)
  • CY1A2 (1e-08 (chr15: 75047221)
  • CYP2D6 (0.39 (chr22: 42525756); 0.02 (chr22: 42526694)
  • CYP3A5 (1e-08 (chr7: 99245974)
  • CYP3A7 (0.16 (chr7: 99306685)
  • the individual protein damage scores calculated for CYP1A1, CYP1A2, CYP2D6, CYP3A5, and CYP3A7 using Equation 2 were 0.08, 1.0e-8, 0.088, 1.0e-8, and 0.16, respectively.
  • the individual drug scores for propranolol calculated using this test were also significantly lower, 0.05.
  • beta blockers for the individual sg04, among the drugs with high drug scores calculated according to the method of the present invention, namely non-specific beta blockers, Bopindolol (0.97), Bupranolol (0.95), Nadolol (0.96), Among specific beta blockers such as Penbutolol (0.96) and Sotalol (0.95), Atenolol (0.9), Bevantolol (0.74), Esmolol (1.0), Practolol (1.0), etc. were used, and among the alpha and beta blockers, scores were relatively high. Labetalol (0.57) is used, and betaxolol and propranool are recommended to reduce the risk of drug side effects in subject sg04 by providing information to the clinician in the direction of no prescription.
  • the personalized drug selection method according to the present invention not only targets all gene sequence mutations, but also does not require expensive case-control design observation studies, and damages individual proteins by pure calculation of genome sequence mutations. Since we propose a method of calculating the score and the individual drug score and applying it, it has the great advantage that it is possible to infer a personalized drug selection for the combination of all genome sequence variations and all drugs.
  • Validity criteria data were extracted from the established knowledge of 987 gene sequence mutation-drug interaction pairs provided by PharmGKB with 650 (65.9%) having at least one link with the 497 drugs.
  • the present invention targets the nucleotide sequence variation of the exon region, overlapping portions between the verification target data and the evaluation reference data are removed for fair evaluation. More specifically, all 36 nucleotide sequence mutations located in the exon region were removed from the 650 pairs, and only a nucleotide sequence variation of the non-coding region was selected to perform a more fair evaluation. In conclusion, we selected 614 pairs as the final gold standard for evaluation.
  • the sensitivity, specificity and area under the receiver operating curve were used. After ranking 497 drugs based on individual drug scores and setting thresholds by rank at 496 splits between each rank, (1) the drug score rank of the drug is above the threshold and the PharmGKB mutation is in the personal genome.
  • D is a set of 497 total drugs
  • GS is a set of personalized PharmGKB drugs that are used as individual gold standards by matching individual genetic sequence variants with the risk allele of PharmGKB
  • DL is a set of top-ranking drugs.
  • Vertical bar brackets represent the number of elements in the set.
  • ROC curve was calculated by calculating the specificity and and the AUC was calculated. More specifically, first, gene sequence variation scores were calculated using a SIFT algorithm for a total population of 1092 people, and then protein damage scores and drug scores were calculated by applying Equations 2 and 4, respectively.
  • Table 23 Calculate validity (AUC) of drug scores by protein group and race using The 1000 Genomes Project data Total AFR AMR ASN EUR Drug Score Calculation Validity (AUC) Target protein 0.617 0.634 0.608 0.614 0.614 Carrier Protein 0.554 0.511 0.599 0.485 0.594 Metabolic protein 0.587 0.642 0.580 0.558 0.579 Transporter protein 0.497 0.492 0.488 0.489 0.512 Drug Score Calculation Validity (AUC) with or without protein weights Simple geometric mean 0.666 0.744 0.650 0.634 0.653 Weighted geometric mean 0.667 0.742 0.652 0.633 0.654
  • Table 22 shows the distribution of protein groups for 497 drugs used in the present example, and the number of protein-drug pairs and the average protein damage score were displayed together in each group.
  • Table 23 shows the adequacy of the individual drug scores calculated when the drug score is calculated using Equation 4, respectively, when the protein group weight is not applied (simple geometric mean) and when applied (weighted geometric mean). It is represented by each protein group, each race.
  • the AUC values calculated for each protein group were 0.617, 0.554, 0.587, and 0.497, respectively.
  • a result of performing an AUC analysis of individual drug scores by applying weights according to the number of races is considered, considering race specificity (bold line).
  • the total AUC of the population was 0.666 (African 0.744, American 0.650, Asian 0.631, European 0.653), without considering race specificity (dotted line).
  • the overall population AUC was 0.633 (African 0.623, American 0.629, Asian 0.64, European 0.636), indicating that the validity of drug score calculation considering race specificity was improved compared to that of the other population.
  • the individual drug score calculation validity AUC of the individual of the present invention is 0.634, and also applied to the weight of each protein group with race specificity ( Thick line), the individual drug score calculation validity AUC of the present invention is 0.667, indicating that the different weights are useful.
  • Bone Marrow Transplantation is one of the most important treatments for treating blood tumors such as leukemia.
  • blood tumors such as leukemia.
  • the patient's own bone marrow must be removed first.
  • There are two methods of pharmacological treatment using drugs such as Total Body Irradiation (TBI) and Busulfan.
  • Busulfan is a typical alkylating agent that can replace systemic radiation, but has a relatively narrow therapeutic range, and if the drug concentration is higher than the therapeutic range, it can be combined with drugs such as hepatic veno-occlusive disease (VOD) and central nervous system toxicity. Severe toxicity associated with it is present, and drug concentrations below the therapeutic range increase the risk of engraftment failure or recurrence.
  • VOD hepatic veno-occlusive disease
  • central nervous system toxicity Severe toxicity associated with it is present, and drug concentrations below the therapeutic range increase the risk of engraftment failure or recurrence.
  • TDM therapeutic drug monitoring
  • Toxicity of busulfan includes interstitial lung fibrosis, commonly called “Busulfan Lung,” hyperpigmentation, epilepsy, veno-occlusive disease (VOD), vomiting, and thrombocytopenia.
  • the International Agency for Research on Cancer (IARC) classifies busulfan as a group 1 carcinogen.
  • a gene sequence comparison analysis was performed with 286 Asians provided by org / .. The following 12 genes were selected by investigating genes involved in the pharmacokinetics or pharmacokinetics of busulfan and its metabolites; CTH, GGT1, GGT5, GGT6, GGT7, GSTA1, GSTA2, GSTM1, GSTP1, MGMT, MGST2, MSH2.
  • Vaules are mean or mean ⁇ S.D.
  • the protein damage scores of the genes GGT1, GSTA1, GSTP1, and MGST1 did not show a significant difference in both groups, but the protein damage scores of the genes CTH, GGT5, GGT6, GGT7, GSTA2, MGMT, and MSH2 were somewhat different.
  • the protein damage score of the gene GSTM1 was slightly higher in the pediatric leukemia group (0.665) than in the normal control group (0.637).
  • both groups are statistically significant through the calculation of a comprehensive drug score. It can be seen that they can be distinguished (see Table 24).
  • the personalized drug selection method according to the present invention provides a method of excluding the use of high-risk drugs in consideration of individual differences, the personalized drug selection method according to the present invention causes significant medical and economic damages If the market exit of the drug can be predicted, the validity of the present invention is once again verified.
  • the p-value was 0.001 in the comparison between the restricted drug and other drugs.
  • No significant difference was found between the groups (p-value 0.971). That is, the lower the mean value of the drug score suggested by the customized drug selection method according to the present invention in the population, the higher the probability of drug exit and restriction of use of the drug, and the higher the risk of the drug.
  • FIG. 9a is a relative frequency histogram according to the population drug scores of market exit drugs obtained in DrugBank and Wikipedia
  • Figure 9b is a relative frequency histogram according to the population drug scores of market exit and use restriction drugs obtained from the UN data.
  • each drug is assigned to 10 score intervals consisting of 0.1 intervals between 0.0 and 1.0 according to the population drug scores of the corresponding drugs, and the exit rate of the drugs corresponding to each 0.1 interval is displayed as a histogram.
  • the following drugs were found to have a high probability of significantly leaving the market or limiting their use.
  • the individual drug score according to the present invention can use the characteristics of individual gene sequence mutations to suggest a mechanism for personally avoiding drugs having a high risk of leaving the market or limiting use. You can check it.
  • Rivaroxaban calculated according to the present invention. More specifically, in the individual genome sequence of the individual sg01, two gene sequence mutations (Coagulation Factor 10, F10), which are the target proteins among the five genes involved in the pharmacodynamics and pharmacokinetics of Rivaroxaban, are two gene sequence variants (chromosome 13).
  • Degradation of blood clotting factors is a very important mechanism that causes hemophilia. Hemophilia is mainly caused by a functional deficiency of coagulation factors 8, 9 and 11, and few cases of coagulation factor 10 (F10) are known. F10 is a very important enzyme for converting prothrombin to thrombin. If homozygous for both pairs of F10 genes is severely damaged, the sg01 would not be able to survive or survive in extreme cases such as highly hemorrhagic. . However, as a result of sequencing of the individual sg01, it was confirmed that only one of the pair of F10 genes had a heterologous sequence (nucleotide heterozygote) without damage to the other function.
  • the individual sg01 having normal blood coagulation ability was not recognized, but when calculating the drug score according to the present invention, the individual sg01 was found to have a high possibility of side effects of the drug against Rivaroxaban, which has clinical significance. Therefore, detailed analysis of the blood coagulation ability of the subject sg01 was performed for further analysis, and the results are shown in Table 25.
  • the activities of blood coagulation factors 2, 5, 7, 8, 9, 11, and 12 of the individual sg01 were all in the normal range, but the activity of the blood coagulation factor 10 was 67% in the normal range. Low activity was not seen in 74 ⁇ 146%.
  • the blood coagulation capacity of individual sg01 was lower than normal from the viewpoint of blood coagulation factor 10, and there was a risk of increased bleeding.
  • PT, aPTT, fibrinogen test to directly measure the hemorrhagic results, it was confirmed that the individual sg01 is somewhat hemorrhagic, but the value is maintained at the top of the normal range.
  • individual sg01 appears to maintain a generally normal range of blood coagulation by a comprehensive adaptive response of the remaining intact F10 activity and other blood coagulation mechanisms among a pair of heterozygotes.
  • the individual sg01 maintains a steady state difficult and is likely to lack sufficient buffering capacity. Therefore, if the individual sg01 is prescribed the blood coagulation inhibitor Rivaroxaban in the future due to medical needs, it is very likely that he or she will suffer serious side effects such as high hemorrhagic, and the coagulation factor 10 is the only direct target protein of Rivaroxaban. It is considered clinically reasonable.

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Physics & Mathematics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Organic Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • Analytical Chemistry (AREA)
  • Biophysics (AREA)
  • Biotechnology (AREA)
  • General Health & Medical Sciences (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Molecular Biology (AREA)
  • Theoretical Computer Science (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Medical Informatics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Evolutionary Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Immunology (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • Pathology (AREA)
  • Computing Systems (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • Bioethics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Databases & Information Systems (AREA)
  • Epidemiology (AREA)
  • Evolutionary Computation (AREA)
  • Public Health (AREA)
  • Software Systems (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Complex Calculations (AREA)

Abstract

본 발명은 개인 유전체 염기서열 분석을 이용한, 개인별 단백질 손상 정보 기반의 맞춤형 약물 선택 방법 및 시스템에 관한 것으로, 본 발명에 따른 방법 및 시스템은 소정 약물 또는 약물군의 약력학 또는 약동학에 관여하는 다양한 단백질을 코딩하는 유전자 엑손 영역의 서열 분석을 통하여 개인별로 특정 약물에 대한 부작용 또는 위험성을 예측할 수 있는 기술로서 신뢰도가 높을 뿐 아니라, 적용범위 또한 넓은 범용적 기술이다.

Description

약물 부작용 방지를 위한 개인별 단백질 손상 정보 기반의 약물 선택 방법 및 시스템
본 발명은 개인 유전체 염기서열 분석을 이용한, 개인별 단백질 손상 정보 기반의 맞춤형 약물 선택 방법 및 시스템에 관한 것이다.
생명공학 기술의 발전으로 인해 현재는 인간의 전 유전체 염기서열(whole genome sequence)을 분석하여 개개인의 질병을 예측하고 맞춤형 질병 예방 및 치료를 제공하는 단계까지 도달하였다.
최근에는 개인 유전체 염기서열을 비교한 결과, 염색체의 동일한 위치에 서로 다른 염기가 존재한다는 사실이 밝혀짐에 따라 이러한 염기서열의 차이를 의약품에 대한 개인 간 반응차이를 예측하는 데 이용하게 되었다. 예를 들어, 한 개인이 갖는 특정 유전체 염기서열 정보에 따라 약물 대사가 느리거나 빠르기 때문에 약물에 대한 효과 및 부작용이 개인마다 다를 수 있다.
따라서 개인별 유전체 염기서열 차이를 이용하여 환자에 알맞은 약물과 용량을 선택할 수 있는 개인별 맞춤형 약물 선택에 대한 사회적 요구가 증가하고 있으며, 단일염기다형성(Single Nucleotide Polymorphism, SNP) 등의 유전체 정보를 마커로 활용하고, 해당 마커와 약물 반응성/약물 부작용 등의 상관관계에 대한 연구결과를 활용한 약물유전학 혹은 약물유전체학이 부상하고 있다.
약물유전학(pharmacogenetics)에서는 일반 인구집단이나 개인에서 약물이나 화학물질의 대사와 반응 차이를 유전학적으로 분석하여 예측한다. 일부 개인에서 약물에 대해 예상했던 약물반응 이외의 반응이 나타나기도 하는데 이러한 약물 부작용은 치료하는 질환의 중증도, 약물상호작용, 환자의 나이, 영양상태, 간 및 신장 기능, 기후나 음식물과 같은 환경적 요인에 기인하기도 하지만, 약물 대사에 관련된 유전적 차이, 예를 들면, 약물 효소 유전자의 다형성(polymorphism)이 영향을 미치기 때문에 이에 대한 연구가 진행되고 있다.
예를 들어, 대한민국 공개특허 제2007-0111475호에서는 만성 변비 환자에서 테가세로드의 효능을 확인하기 위한 바이오 마커에 관한 기술을 개시하고 있으며, 약물유전학을 이용하여 테가세로드(Zelmac(등록상표)/Zelnorm(등록상표))에 대한 만성 변비 환자의 반응을 예측할 수 있는 후보 유전자를 선택하는 데 있어서 다형성의 영향을 평가하였다.
한편, 개인별 유전체 염기서열 변이와 질병과의 연관성 조사에서 통계를 이용하여 질병 예측 마커를 찾아내는 것은 용이하지 않다. 통계적 유의성을 보인 대부분의 단일염기다형성들이 질병 발생에 미약한 영향(odds ratio 1.1~1.5)을 미치는 것으로 나타났을 뿐 아니라 인트론 및 유전자 간 영역 등에 위치하고 있어 그 기능적 연관성을 추론하기 어렵기 때문이다(Hindorff et al., Proc. Natl. Acad. Sci. 2009;106(23):9362-9367).
따라서 단일염기다형성과 같은 마커를 이용한 인구 집단 관찰 연구 결과에 근거한 방법을 넘어서서, 개인 유전체 염기서열 변이 정보를 직접 활용하여 이에 수반되는 단백질 손상과 그 생물학적 영향에 대한 이론적 추론을 수행함으로써 보다 유용하고 신뢰할 수 있는 개인별 맞춤형 약물 선택 정보를 제공하는 방법론 도입의 필요성이 강하게 제기된다.
본 발명은 상기와 같은 점을 감안하여 안출된 것으로, 개인 유전체 염기서열 변이 정보를 분석하고, 소정 약물 또는 약물군의 약력학 또는 약동학에 관여하는 유전자 염기서열 변이 정보로부터 개인별 단백질 손상 점수를 산출한 후, 이를 약물과 단백질 사이의 상호 관계와 연관지어 개인별 약물 점수를 산출함으로써, 맞춤형 약물 선택을 위한 정보를 제공하는 방법 및 시스템을 제공하고자 한다.
한 양태에서 본 발명은 개인 유전체 염기서열 정보로부터 소정 약물 또는 약물군의 약력학(pharmaco-dynamics) 또는 약동학(pharmaco-kinetics)에 관여하는 하나 이상의 유전자 염기서열 변이 정보를 결정하는 단계; 상기 유전자 염기서열 변이 정보를 이용하여 개인별 단백질 손상 점수를 산출하는 단계; 및 상기 개인별 단백질 손상 점수를 약물과 단백질 사이의 상호 관계와 연관지어 개인별 약물 점수를 산출하는 단계를 포함하는, 개인 유전체 염기서열 변이를 이용한 맞춤형 약물 선택을 위한 정보를 제공하는 방법을 제공한다.
다른 양태에서 본 발명은 개인에 대해 적용대상이 되는 약물 또는 약물군에 대하여, 상기 약물 또는 약물군과 관련된 유전자 또는 단백질과 관련된 정보 검색 또는 추출이 가능한 데이터베이스; 상기 데이터베이스에 접근 가능한 통신부; 상기 정보에 기초하여 상기 약물 또는 약물군의 약력학 또는 약동학에 관여하는 하나 이상의 유전자 염기서열 변이 정보를 산출하는 제1 산출모듈; 상기 유전자 염기서열 변이 정보를 이용하여 개인별 단백질 손상 점수를 산출하는 제2 산출모듈; 상기 개인별 단백질 손상 점수를 약물과 단백질 사이의 상호 관계와 연관지어 개인별 약물 점수를 산출하는 제3 산출모듈; 및 상기 산출모듈에서 산출된 산출값을 표시하는 표시부를 포함하는, 개인 유전체 염기서열 변이를 이용한 맞춤형 약물 선택 시스템을 제공한다.
다른 양태에서 본 발명은 개인 유전체 염기서열 정보로부터 소정 약물 또는 약물군의 약력학 또는 약동학에 관여하는 유전자 염기서열 변이 정보를 입수하는 단계; 상기 유전자 염기서열 변이 정보를 이용하여 개인별 단백질 손상 점수를 산출하는 단계; 및 상기 개인별 단백질 손상 점수를 약물과 단백질 사이의 상호 관계와 연관지어 개인별 약물 점수를 산출하는 단계를 포함하는 동작을 수행하는 프로세서를 실행시키는 실행모듈을 포함하는, 컴퓨터 판독 가능한 매체를 제공한다.
본 발명의 개인 유전체 염기서열 변이 정보에 기반을 둔 개인별 맞춤형 약물 선택 방법 및 시스템은 소정 약물 또는 약물군의 약력학 또는 약동학에 관여하는 다양한 단백질을 코딩하는 유전자의 엑손 영역의 서열 분석을 통하여 개인별로 특정 약물에 대한 반응성을 예측할 수 있는 기술로서 신뢰도가 높을 뿐 아니라, 적용범위 또한 전 범위의 약물로 확장 가능한 범용적 기술이다. 즉 본 발명의 방법 및 시스템은 약물의 대사, 작용 또는 부작용 등과 관련되어 약력학 또는 약동학에 관여하는 단백질 정보를 획득할 수 있는 모든 약물에 대하여 적용 가능한 범용적 기술이다.
또한 기존의 약물유전체 연구 방법은 약물-유전자 관계쌍별로 연구를 수행하여야 하는데, 쌍의 개수는 약물 수와 유전자 마커 수의 곱에 비례하여 증가하므로, 수많은 약물-유전자 관계쌍을 모두 연구하는 것은 현실적으로 불가능에 가까워 충분한 근거자료가 생성되지 못하는 실정이고, 연구 대상군 선정과 인구 집단 간의 차이에 따른 통계적 오류도 큰 반면, 본 발명의 방법은 분자 수준의 연구 및 분석 결과를 직접 맞춤약물치료에 적용하므로 거의 모든 약물-유전자 관계쌍에 대한 근거를 확보할 수 있는 장점이 있으며, 인구 집단 간의 차이에 큰 영향을 받지 않고 적용할 수 있다는 장점이 있다.
본 발명에 따른 방법 및 시스템을 이용할 경우, 선택된 하나의 약물, 선택이 필요한 두 개 이상의 약물, 또는 특정 의학적 상태에서 사용 가능한 동일한 약물군에 속하는 여러 개의 비교대상 약물 중에서 효과적으로 개인별 맞춤형 약물 선택을 수행할 수 있으며, 약물의 부작용 또는 위험성을 사전에 예측함으로써 개인에 적용되는 약물 간의 우선순위 또는 약물의 사용여부를 결정하는데 사용될 수 있다.
나아가 약물-단백질 상호관계에 대한 새로운 지식이 발견되거나 제공되는 경우, 이는 본 발명의 방법에 용이하게 추가되고 적용될 수 있으므로, 향후 연구 결과 정보의 축적에 따라 보다 향상된 맞춤형 약물 치료 방법이 제공될 수 있는 장점이 있다.
도 1은 본 발명의 일 구현예에 따른 개인 유전체 염기서열 변이를 이용한 맞춤형 약물 선택을 위한 정보를 제공하는 방법의 각 단계를 보여주는 흐름도이다.
도 2는 본 발명의 일 구현예에 따른 개인 유전체 염기서열 변이를 이용한 맞춤형 약물 선택 시스템의 개략적 구성도이다(DB: 데이터베이스).
도 3은 한 개인의 유전체 염기서열 변이 정보에 근거한 본 발명에 따른 방법을 이용하여, 일 약물인 터뷰탈린(Terbutaline)에 대해 산출된 해당 개인의 단백질별 유전자 변이 개수, 단백질 손상 점수 및 약물 점수를 나타낸 도이다.
도 4는 한 개인의 유전체 염기서열 변이 정보에 근거한 본 발명에 따른 방법을 이용하여, 비교 대상인 복수의 약물(아스피린(Acetylsalicylic acid) 및 타이레놀(Acetaminophen))에 대해 산출된 해당 개인의 단백질별 유전자 변이 개수, 단백질 손상 점수 및 약물 점수를 나타낸 도이다.
도 5는 개인 유전체 염기서열 변이 정보에 근거한 본 발명에 따른 방법을 이용하여, ATC(Anatomical Therapeutic Chemical Classification System) 코드 기준 C07 베타 차단제에 속하는 22개의 약물에 대하여 산출된 14명의 개인별 약물 점수 프로필을 나타낸 도이다.
도 6은 한 개인의 유전체 염기서열 변이 정보에 근거한 본 발명에 따른 방법을 이용하여, 비특이적 베타 차단제인 프로프라놀올과 특이적 베타 차단제인 베탁솔올에 대해 산출된 한 개인의 단백질별 유전자 변이 개수, 단백질 손상 점수 및 약물 점수를 나타낸 도이다.
도 7은 본 발명에 따른 방법을 이용하여, The 1000 Genomes Project에서 제공하는 1092명의 개인 유전체 염기서열 변이 정보와 PharmGKB 지식베이스가 제공하는 유전자-약물 관계쌍의 비교분석에 근거하여 산출된 약물 점수 산출 타당도(AUC(Area Under Curve))를 나타낸 도이다 (도 7a: 단백질 군별 가중치를 적용하지 않은 단순기하평균 산출식에 의한 개인별 약물 점수 산출 타당도(AUC), 도 7b: 단백질 군별 가중치를 적용한 가중기하평균 산출식에 의한 개인별 약물 점수 산출 타당도(AUC)).
도 8은 항암제·골수억제제인 부설판(busulfan) 치료에 심각한 부작용 경고 사인을 보인 소아 백혈병 환아 12례(도 8a) 및 정상 대조군 14례(도 8b)에서 개인 유전체 염기서열 변이 정보에 근거한 본 발명에 따른 방법을 이용하여 산출된 해당 개인의 단백질 손상 점수 및 약물 점수의 평균과 표준편차의 분포를 나타낸 도이다. 각 도형의 크기는 발견된 유전자 염기서열 변이의 개수를 의미한다.
도 9는 DrugBank와 위키피디아에서 획득한 시장 퇴출 약물(도 9a) 및 유엔 자료에서 획득한 시장 퇴출 및 사용 제한 약물(도 9b)의 상대빈도를, 본 발명에 따른 방법을 이용하여 The 1000 Genomes Project가 제공하는 1092명의 개인 유전체 염기서열 변이 정보에 근거하여 산출한 인구집단 약물 점수와 대비하여 표시한 상대빈도 히스토그램을 나타낸 도이다.
본 발명은 개인 유전체 염기서열 변이 정보의 분석을 통해 개인별로 특정 질환의 치료를 위한 약물치료에서 개인 맞춤형으로 안전성이 높은 약물과 용량/용법을 선택할 수 있다는 발견에 근거한 것이다.
한 양태에서 본 발명은 개인 유전체 염기서열 정보로부터 소정 약물 또는 약물군의 약력학(pharmaco-dynamics) 또는 약동학(pharmaco-kinetics)에 관여하는 하나 이상의 유전자 염기서열 변이 정보를 결정하는 단계; 상기 유전자 염기서열 변이 정보를 이용하여 개인별 단백질 손상 점수를 산출하는 단계; 및 상기 개인별 단백질 손상 점수를 약물과 단백질 사이의 상호 관계와 연관지어 개인별 약물 점수를 산출하는 단계를 포함하는, 개인 유전체 염기서열 변이를 이용한 맞춤형 약물 선택을 위한 정보를 제공하는 방법에 관한 것이다.
본 발명의 방법에서 일 정보로 사용되는 유전자 염기서열 변이는 개인의 유전자 염기서열의 변이 또는 다형성을 일컫는 것이다. 본 발명에서 유전자 염기서열 변이 또는 다형성은 소정 약물 또는 약물군의 약력학 또는 약동학과 관련된 단백질을 코딩하는 유전자의 특히 엑손(exon) 부위에서 발생하는 것이나 이로 제한되는 것은 아니다.
본 발명에서 사용된 용어 “염기서열 변이 정보”는 유전자의 엑손을 구성하는 염기의 치환, 부가 또는 결실에 관한 정보를 의미한다. 이러한 염기의 치환, 부가, 또는 결실은 여러 가지 원인에 의해 발생할 수 있으며, 예를 들면 염색체의 돌연변이, 절단, 결실, 중복, 역위 및/또는 전좌를 포함하는 구조적 차이에 의할 수 있다.
다른 측면에서 염기서열의 다형성이란 유전체 상에 존재하는 염기서열의 개인 간 차이를 말하는 것으로, 염기서열 다형성에서 그 수가 가장 많은 것은 단일염기다형성(Single Nucleotide Polymorphism, SNP)이며, 이는 A, T, C, G로 이루어진 염기서열 중 하나의 염기에 개인 간 차이가 있는 것이다. 염기서열 다형성은 SNP를 포함하여 SNV(Single Nucleotide Variation), STRP(short tandem repeat polymorphism), 또는 VNTR(various number of tandem repeat) 및 CNV(Copy number variation)를 포함하는 다수체(polyalleic) 변이의 형태로 나타날 수 있다.
본 발명의 방법에서 개인 유전체에서 발견되는 염기서열 변이 또는 다형성 정보는 소정 약물 또는 약물군의 약력학 또는 약동학과 관련된 단백질과 관련되어 수집된다. 즉, 본 발명의 방법에 사용되는 염기서열 변이 정보는 수득한 개인의 유전체 염기서열 정보 중 특정 질환의 치료에 효과가 있는 약물 또는 약물군의 약력학 또는 약동학에 관여하는 하나 이상의 유전자, 예를 들면, 약물과 관련된 표적(target) 단백질, 약물 대사에 관여하는 효소(enzyme) 단백질, 수송체 단백질(transporter) 및 운반체(carrier) 단백질을 코딩하는 유전자의 특히 엑손 영역에서 발견되는 변이 정보이나 이로 제한되는 것은 아니다.
본 발명에서 사용된 용어 “약동학(pharmaco-kinetics, pk) 또는 약동학적 파라미터”는 일정 시간동안 약물의 체내에서의 흡수, 이동, 분포, 전환, 배출과 관련된 약물의 특성을 일컫는 것으로, 약물의 분포용적(Vd), 청소율(CL), 생체이용율(F), 흡수속도계수(ka), 또는 최대 혈중 약물 농도(maximum plasma concentration, Cmax), 최대 혈중 약물 농도의 도달시간(time point of maximum plasma concentration, Tmax), 일정 시간 동안의 혈중 약물 농도 변화에 대한 그래프 아래의 면적(AUC, Area Under the Curve) 측정 등을 포함하는 것이다.
본 발명에서 사용된 용어 “약력학(pharmacodynamics) 또는 약력학적 파라미터”는 약물의 생체에 대한 생리학적 및 생화학적 작용과 그 작용기전, 즉 약물이 일으키는 생체의 반응 또는 효과와 관련된 특징을 일컫는 것이다.
소정 약물 또는 약물군의 약력학 또는 약동학에 관여하는 유전자 목록을 하기 표 1 내지 표 15에 나타내었다. 보다 구체적으로, 미국 질병통제예방국(CDC)에서 발행한 일 보고서(Health, United States, 2011, Centers for Disease Control and Prevention (CDC))에서 제공하는 2005~2008년 사이 미국에서 가장 흔하게 처방되는 상위 15위 약물군을 표준 약물 분류 코드인 ATC 코드로 매핑하여 추출한 920개의 약물에 대해서 DrugBank ver 3.0 및 KEGG Drug 데이터베이스에서 적어도 한 개 이상의 약력학 또는 약동학 관련 유전자가 알려진 395개의 약물과 해당 약물-유전자 쌍의 구성을 하기 표 1 내지 표 15에 나타내었다. 하기 표 1 내지 표 15의 유전자/단백질은 HGNC(HUGO Gene Nomenclature Committee)의 명명법에 따라 표시하였다(Gray KA, Daugherty LC, Gordon SM, Seal RL, Wright MW, Bruford EA. genenames.org: the HGNC resources in 2013. Nucleic Acids Res. 2013 Jan;41(Database issue):D545-52. doi: 10.1093/nar/gks1066. Epub 2012 Nov 17 PMID:23161694).
또한, 소정 약물 또는 약물군의 약력학 또는 약동학에 관여하는 유전자/단백질 정보는 DrugBank (http://www.drugbank.ca/) 또는 KEGG Drug (http://www.genome.jp/kegg/drug/) 또는 PharmGKB (https://www.pharmgkb.org/)등과 같은 데이터베이스에서 수득할 수 있으며, 하기 표 1 내지 표 15는 예시일 뿐, 이에 제한되지 않는다.
표 1 ACE inhibitors [C09A]
약물명 표적 단백질 효소 단백질 수송체 단백질 운반체 단백질
Benazepril ACE MTHFR SLC15A1, SLC15A2
Captopril ACE, MMP2 CYP2D6 ABCB1, SLC15A1, SLC15A2, SLC22A6 ALB
Cilazapril ACE ABCB1, SLC15A1, SLC15A2
Enalapril ACE CYP3A4 ABCB1, SLC15A1, SLC15A2, SLC22A6, SLC22A7, SLC22A8, SLCO1A2
Fosinopril ACE SLC15A1, SLC15A2
Lisinopril ACE, ACE2 ABCB1, SLC15A1
Moexipril ACE, ACE2 SLC15A1, SLC15A2
Perindopril ACE ABCB1, SLC15A1, SLC15A2
Quinapril ACE SLC15A1, SLC15A2
Ramipril ACE SLC15A1, SLC15A2
Spirapril ACE SLC15A1, SLC15A2
Trandolapril ACE SLC15A1, SLC15A2
Bupropion CHRNA3, SLC6A2, SLC6A3 CYP1A2, CYP2A6, CYP2B6, CYP2C8, CYP2C9, CYP2D6, CYP2E1, CYP3A4 ORM1
표 2 Analgesics [N02]
약물명 표적 단백질 효소 단백질 수송체 단백질 운반체 단백질
Acetaminophen PTGS1, PTGS2 CYP1A1, CYP1A2, CYP2A6, CYP2C8, CYP2C9, CYP2D6, CYP2E1, CYP3A4 ABCB1, SLC22A6
Acetylsalicylic acid AKR1C1, PTGS1, PTGS2 CYP2C19, CYP2C8, CYP2C9 ABCB1, SLC16A1, SLC22A10, SLC22A11, SLC22A6, SLC22A7, SLC22A8, SLCO2B1 ALB
Almotriptan HTR1B, HTR1D CYP1A2, CYP2C19, CYP2C8, CYP2D6, CYP2E1, CYP3A4, FMO3, MAOA
Aminophenazone CYP17A1, CYP1A2, CYP2C18, CYP2C19, CYP2C8, CYP2C9, CYP2D6, CYP3A4, CYP3A7 SLC22A6
Antipyrine PTGS1, PTGS2 CYP1A2, CYP2A6, CYP2B6, CYP2C18, CYP2C19, CYP2C8, CYP2C9, CYP2D6, CYP2E1, CYP3A4 SLC22A6
Buprenorphine OPRD1, OPRK1, OPRM1 CYP1A2, CYP2A6, CYP2C18, CYP2C19, CYP2C8, CYP2C9, CYP2D6, CYP3A4, CYP3A5, CYP3A7, UGT1A9 ABCB1, ABCG2
Butorphanol OPRD1, OPRK1, OPRM1
Dezocine OPRK1, OPRM1
Diflunisal PTGS1, PTGS2 SLC22A6 ALB, TTR
Dihydroergotamine ADRA1A, ADRA1B, ADRA1D, ADRA2A, DRD1, DRD2, GABRA1, HTR1A, HTR1B, HTR1D, HTR2A, HTR2B CYP3A4 ABCB1
Dipyrone PTGS1 CYP2B6, CYP3A4
Eletriptan HTR1A, HTR1B, HTR1D, HTR1E, HTR1F, HTR2B, HTR7 CYP2A6, CYP2C19, CYP2C9, CYP2D6, CYP3A4, PTGS1 ABCB1
Ergotamine ADRA1A, ADRA1B, ADRA1D, ADRA2A, ADRA2B, DRD2, HTR1A, HTR1B, HTR1D, HTR2A, SLC6A2 CYP1A2, CYP3A4 ABCB1
Fentanyl OPRD1, OPRK1, OPRM1 CYP3A4, CYP3A5, CYP3A7 ABCB1
Frovatriptan HTR1B, HTR1D CYP1A2
Heroin OPRD1, OPRK1, OPRM1 CYP2C8, CYP2D6, CYP3A4, UGT1A1, UGT1A3, UGT1A8, UGT2B4, UGT2B7 ABCB1
Hydromorphone OPRD1, OPRK1, OPRM1 CYP2C9, CYP2D6, CYP3A4, PTGS1, UGT1A9
Lisuride ADRA2A, ADRA2B, ADRA2C, DRD1, DRD2, DRD3, DRD4, DRD5, HTR1A, HTR1B, HTR1D, HTR2A, HTR2B, HTR2C CYP2D6, CYP3A4
Meperidine GRIN1, GRIN2A, GRIN2B, GRIN2C, GRIN2D, OPRK1, OPRM1 CYP2B6, CYP2C19, CYP2D6, CYP3A4 ALB, ORM1
Methoxyflurane ATP2C1, ATP5D, GABRA1, GLRA1, GRIA1, KCNA1 CYP1A2, CYP2A6, CYP2B6, CYP2C9, CYP2D6, CYP2E1, CYP3A4
Methysergide HTR1A, HTR1B, HTR1D, HTR2A, HTR2B, HTR2C, HTR7
Nalbuphine OPRD1, OPRK1, OPRM1
Naratriptan HTR1A, HTR1B, HTR1D, HTR1F
Oxycodone OPRD1, OPRK1, OPRM1 CYP2D6, CYP3A4, CYP3A5, CYP3A7
Pentazocine OPRK1, OPRM1, SIGMAR1
Phenacetin PTGS1 CYP1A1, CYP1A2, CYP2A13, CYP2A6, CYP2C19, CYP2C9, CYP2D6, CYP2E1, CYP3A4 SLC22A6
Propoxyphene OPRD1, OPRK1, OPRM1 CYP2C8, CYP2C9, CYP2D6, CYP3A4, CYP3A7
Rizatriptan HTR1B, HTR1D, HTR1F CYP1A2, MAOA
Salicylamide PTGS1, PTGS2
Salsalate PTGS1, PTGS2
Sumatriptan HTR1A, HTR1B, HTR1D, HTR1F MAOA ABCB1, ABCG2, SLCO1A2, SLCO1B1
Tramadol CHRFAM7A, CHRM3, GRIN3A, HTR2C, OPRD1, OPRK1, OPRM1, SLC6A2, SLC6A4 CYP2B6, CYP2D6, CYP3A4
Ziconotide CACNA1B
Zolmitriptan HTR1A, HTR1B, HTR1D, HTR1F CYP1A2, MAOA
Clonidine ADRA2A, ADRA2B, ADRA2C CYP1A1, CYP1A2, CYP2D6, CYP3A4, CYP3A5 ABCB1, SLC22A1, SLC22A3, SLC22A4, SLC22A5
표 3 Anti-diabetes[A10]
약물명 표적 단백질 효소 단백질 수송체 단백질 운반체 단백질
Acarbose AMY2A, AMY2B, GAA, GANC, MGAM, SI
Acetohexamide ABCC8, ABCC9, KCNJ1 CBR1
Buformin PRKAA1, PRKAA2 SLC22A1
Chlorpropamide ABCC8, ABCC9 CYP2C19, CYP2C9, PTGS1 ABCB1, SLC15A1, SLC15A2, SLC22A6
Exenatide GLP1R
Gliclazide ABCC8, ABCC9, VEGFA CYP2C19, CYP2C9 ALB
Glimepiride ABCC8, ABCC9, KCNJ1, KCNJ11 CYP2C9
Glipizide ABCC8, ABCC9, PPARG CYP2C9, CYP3A4
Gliquidone ABCC8, ABCC9, KCNJ8
Glisoxepide ABCC8, ABCC9, KCNJ8
Glyburide ABCA1, ABCB11, ABCC8, ABCC9, CFTR, KCNJ1, KCNJ11, KCNJ5 CYP2C19, CYP2C9, CYP3A4 ABCB1, ABCB11, ABCC1, ABCC2, ABCC3, ABCG2, SLC15A1, SLC15A2, SLC22A6, SLC22A7, SLCO1A2, SLCO2B1 ALB
Glycodiazine ABCC8, ABCC9, KCNJ1
Insulin Aspart INSR CYP1A2
Insulin Detemir INSR CYP1A2 ALB
Insulin Glargine IGF1R, INSR CYP1A2
Insulin Glulisine INSR CYP1A2
Insulin Lispro IGF1R, INSR CYP1A2
Insulin aspart (genetical recombination) INSR
Insulin detemir (genetical recombination) INSR
Insulin glargine (genetical recombination) INSR
Insulin lispro (genetical recombination) INSR
Liraglutide GLP1R
Liraglutide (genetical recombination) GLP1R
Metformin PRKAA1, PRKAA2, PRKAB1 SLC22A1, SLC22A2, SLC47A1, SLC47A2
Miglitol GAA, GANC, MGAM AMY2A
Mitiglinide ABCC8, ABCC9, PPARG UGT1A3, UGT1A9, UGT2B7
Nateglinide ABCC8, ABCC9, PPARG CYP2C9, CYP2D6, CYP3A4, CYP3A5, CYP3A7, PTGS1, UGT1A9 ABCC4, SLC15A1, SLC15A2, SLC16A1, SLC22A6 ALB, ORM1
Phenformin KCNJ8, PRKAA1 CYP2D6 SLC22A1, SLC22A2
Pioglitazone PPARG CYP2C19, CYP2C8, CYP2C9, CYP2D6, CYP3A4, PTGS1 SLCO1B1, SLCO1B3
Pramlintide CALCR, RAMP1, RAMP2, RAMP3
Repaglinide ABCC8, ABCC9, PPARG CYP2C8, CYP3A4 SLCO1B1 ALB
Rosiglitazone ACSL4, PPARG CYP1A2, CYP2A6, CYP2C19, CYP2C8, CYP2C9, CYP2D6, PTGS1 SLCO1B1
Saxagliptin DPP4 CYP3A4, CYP3A5
Sitagliptin DPP4 CYP2C8, CYP3A4 ABCB1
Tolazamide ABCC8, ABCC9, KCNJ1
Tolbutamide ABCC8, KCNJ1 CYP2C18, CYP2C19, CYP2C8, CYP2C9 SLC15A1, SLC15A2, SLC22A6, SLCO1A2, SLCO2B1
Troglitazone ACSL4, CYP2C8, ESRRA, ESRRG, PPARG, SERPINE1, SLC29A1 CYP19A1, CYP1A1, CYP2B6, CYP2C19, CYP2C8, CYP2C9, CYP3A4, CYP3A5, CYP3A7, UGT1A1, UGT1A10, UGT1A3, UGT1A4, UGT1A8, UGT1A9, UGT2B7 ABCB11, SLCO1B1 FABP4
Vildagliptin DPP4
Voglibose GAA, GANC, MGAM
표 4 Antidepressants [N06A]
약물명 표적 단백질 효소 단백질 수송체 단백질 운반체 단백질
Amineptine SLC6A2, SLC6A4
Amitriptyline ADRA1A, ADRA1D, ADRA2A, CHRM1, CHRM2, CHRM3, CHRM4, CHRM5, HRH1, HTR1A, HTR2A, KCNA1, KCND2, KCND3, KCNQ2, NTRK1, NTRK2, OPRD1, OPRK1, SLC6A2, SLC6A4 CYP1A2, CYP2B6, CYP2C19, CYP2C8, CYP2C9, CYP2D6, CYP2E1, CYP3A4, CYP3A5 ABCB1 ALB, ORM1
Amoxapine ADRA1A, ADRA2A, CHRM1, DRD1, DRD2, GABRA1, SLC6A2, SLC6A4 CYP2D6 ORM1
Citalopram ADRA1A, CHRM1, HRH1, SLC6A2, SLC6A3, SLC6A4 CYP1A2, CYP2B6, CYP2C19, CYP2D6, CYP2E1, CYP3A4 ABCB1
Clomipramine GSTP1, HTR2A, HTR2B, HTR2C, SLC6A2, SLC6A4 CYP1A2, CYP2C19, CYP2D6, CYP3A4 ABCB1
Desipramine ADRA1A, ADRB1, ADRB2, CHRM1, CHRM2, CHRM3, CHRM4, CHRM5, HRH1, HTR2A, SLC6A2, SLC6A4, SMPD1 CYP1A2, CYP2A6, CYP2B6, CYP2C18, CYP2C19, CYP2D6, CYP2E1, CYP3A4 ABCB1, SLC22A1, SLC22A2, SLC22A3, SLC22A4, SLC22A5 ORM1
Desvenlafaxine SLC6A2, SLC6A4 CYP3A4
Doxepin ADRA1A, ADRA1B, ADRA1D, ADRA2A, ADRA2B, ADRA2C, CHRM1, CHRM2, CHRM3, CHRM4, CHRM5, DRD2, HRH1, HRH2, HTR1A, HTR2A, HTR2B, HTR2C, SLC6A2, SLC6A4 CYP1A2, CYP2C19, CYP2C9, CYP2D6 ABCB1 ORM1
Duloxetine SLC6A2, SLC6A3, SLC6A4 CYP1A2, CYP2D6
Fluoxetine HTR2A, SLC6A4 CYP1A2, CYP2B6, CYP2C19, CYP2C9, CYP2D6, CYP2E1, CYP3A4 ABCB1
Fluvoxamine SLC6A4 CYP1A1, CYP1A2, CYP2B6, CYP2C19, CYP2C9, CYP2D6, CYP2E1, CYP3A4, CYP3A5, CYP3A7 ABCB1
Imipramine ADRA1A, ADRA1D, CHRM1, CHRM2, CHRM3, CHRM4, CHRM5, HRH1, HTR2A, KCND2, KCND3, SLC6A2, SLC6A4 CYP1A2, CYP2B6, CYP2C18, CYP2C19, CYP2D6, CYP2E1, CYP3A4, CYP3A7 ABCB1, SLC22A1, SLC22A2, SLC22A3, SLC22A4 ORM1
Iproniazid MAOA, MAOB MAOB
Isocarboxazid MAOA, MAOB
L-Citrulline ASS1, DDAH1, DDAH2, NOS1, NOS2, NOS3, OTC, PADI1, PADI2, PADI3, PADI4, PADI6
L-Tryptophan WARS, WARS2 DDC, IDO1, TDO2, TPH1, TPH2, WARS, WARS2 SLC16A10, SLC16A2
Maprotiline ADRA1A, CHRM1, CHRM2, CHRM3, CHRM4, CHRM5, HRH1, SLC6A2 CYP1A2, CYP2D6 ABCB1 ORM1
Mianserin ADRA1A, ADRA1B, ADRA1D, ADRA2A, ADRA2B, ADRA2C, HRH1, HTR1A, HTR1B, HTR1D, HTR1E, HTR1F, HTR2A, HTR2B, HTR2C, SLC6A2, SLC6A4 CYP1A2, CYP2B6, CYP2C19, CYP2D6, CYP3A4
Milnacipran SLC6A2, SLC6A4
Minaprine ACHE, CHRM1, DRD1, DRD2, HTR2A, HTR2B, HTR2C, MAOA, SLC6A4 CYP2D6
Mirtazapine ADRA2A, ADRA2B, ADRA2C, HRH1, HTR2A, HTR2B, HTR2C, HTR3A, HTR3B, HTR3C, HTR3D, HTR3E, OPRK1 CYP1A2, CYP2C8, CYP2C9, CYP2D6, CYP3A4
Moclobemide MAOA CYP1A2, CYP2C19, CYP2C9, CYP2D6, MAOA, MAOB
Nefazodone ADRA1A, ADRA1B, ADRA2A, HTR1A, HTR2A, HTR2C, SLC6A2, SLC6A3, SLC6A4 CYP2B6, CYP2D6, CYP3A4, CYP3A5, CYP3A7 ABCB1
Nialamide MAOA, MAOB
Nomifensine SLC6A2, SLC6A3 ORM1
Nortriptyline ADRA1A, ADRA1D, CHRM1, CHRM2, CHRM3, CHRM4, CHRM5, HRH1, HTR1A, HTR2A, SLC6A2, SLC6A4 CYP1A2, CYP2C19, CYP2C9, CYP2D6, CYP2E1, CYP3A4, CYP3A5, PTGS1 ALB, ORM1
Paroxetine CHRM1, CHRM2, CHRM3, CHRM4, CHRM5, HTR2A, SLC6A2, SLC6A4 CYP2B6, CYP2C8, CYP2C9, CYP2D6 ABCB1
Phenelzine ABAT, AOC3, GAD2, GPT, GPT2, MAOA, MAOB CYP2C19, CYP2C8, CYP2E1, CYP3A4, CYP3A43, CYP3A5, CYP3A7, MAOA, MAOB
Protriptyline SLC6A2, SLC6A4 CYP2D6 ABCB1
Reboxetine SLC6A2 CYP2D6, CYP3A4 ABCB1
Sertraline SLC6A3, SLC6A4 CYP1A2, CYP2B6, CYP2C19, CYP2C9, CYP2D6, CYP3A4, MAOA, MAOB ABCB1
Tranylcypromine MAOA, MAOB CYP1A2, CYP2A6, CYP2C19, CYP2C9, CYP2D6, CYP2E1, CYP3A4
Trazodone ADRA1A, ADRA2A, HRH1, HTR1A, HTR2A, HTR2C, SLC6A4 CYP2D6, CYP3A4, CYP3A5, CYP3A7 ABCB1 ORM1
Trimipramine ADRA1A, ADRA1B, ADRA2B, DRD1, DRD2, HRH1, HTR1A, HTR2A, SLC6A2, SLC6A3, SLC6A4 CYP2C19, CYP2C9, CYP2D6, CYP3A4 ABCB1
Venlafaxine SLC6A2, SLC6A3, SLC6A4 CYP2B6, CYP2C19, CYP2C9, CYP2D6, CYP3A4 ABCB1
Vilazodone HTR1A, SLC6A4 CYP2C18, CYP2D6, CYP3A4
Zimelidine SLC6A4 ABCB1
표 5 Antihistamines for systemic use [R06]
약물명 표적 단백질 효소 단백질 수송체 단백질 운반체 단백질
Antazoline HRH1
Astemizole HRH1, KCNH2 CYP2D6, CYP2J2, CYP3A4, CYP3A5, CYP3A7 ABCB1
Azatadine HRH1 CYP3A4
Azelastine HRH1 CYP1A1, CYP1A2, CYP2A6, CYP2B6, CYP2C19, CYP2C8, CYP2C9, CYP2D6, CYP2E1, CYP3A4, CYP3A5 ABCB1
Bromodiphenhydramine HRH1 SLC22A6, SLC47A1
Brompheniramine CHRM1, CHRM2, CHRM3, CHRM4, CHRM5, HRH1 CYP2B6, CYP2C19, CYP2C8, CYP2C9, CYP2D6, CYP2E1, CYP3A4
Buclizine CHRM1, HRH1
Carbinoxamine HRH1 CYP2B6, CYP2C19, CYP2C8, CYP2C9, CYP2D6, CYP2E1, CYP3A4
Cetirizine HRH1
Chloropyramine HRH1
Chlorpheniramine HRH1, SLC6A2, SLC6A3, SLC6A4 CYP2D6, CYP3A4, CYP3A5, CYP3A7 SLC22A1, SLC22A2
Clemastine HRH1 CYP2D6, CYP3A4
Cyclizine HRH1, SULT1E1 CYP2C9
Cyproheptadine CHRM1, CHRM2, CHRM3, HRH1, HTR2A, HTR2C
Desloratadine HRH1 CYP1A2, CYP2C19, CYP2C9, CYP2D6 ABCB1
Dimethindene CHRM2, HRH1
Diphenhydramine HRH1, SLC6A3 CYP1A2, CYP2B6, CYP2C18, CYP2C19, CYP2C9, CYP2D6, PTGS1 SLC22A1, SLC22A2, SLC22A5
Doxylamine CHRM1, HRH1
Epinastine ADRA1A, ADRA2A, HRH1, HRH2, HTR2A, HTR7 CYP2B6, CYP2D6, CYP3A4 ABCB1
Fexofenadine HRH1 CYP2D6 ABCB1, ABCC3, SLCO1A2, SLCO1B3, SLCO2B1
Isothipendyl HRH1
Ketotifen HRH1, PDE4A, PDE4B, PDE4C, PDE4D, PDE7A, PDE7B, PDE8A, PDE8B, PGD
Loratadine HRH1 CYP2C19, CYP2C8, CYP2C9, CYP2D6, CYP3A4 ABCB1
Meclizine HRH1 CYP1A2
Mepyramine HRH1 CYP2D6
Mequitazine HRH1 CYP2D6, CYP3A4
Methdilazine HRH1
Phenindamine HRH1
Pheniramine HRH1
Promethazine ADRA1A, CALM1, CHRM1, CHRM2, CHRM3, CHRM4, CHRM5, DRD2, HRH1, HTR2A CYP2B6, CYP2C9, CYP2D6 ABCB1
Terfenadine CHRM3, HRH1, KCNH2 CYP2C8, CYP2C9, CYP2D6, CYP2J2, CYP3A4, CYP3A5, CYP3A7 ABCB1
Thiethylperazine DRD1, DRD2, DRD4
Trimeprazine HRH1 CYP3A4
Tripelennamine HRH1 CYP2D6
Triprolidine HRH1 CYP2D6
표 6 Antihypertensives [C02]
약물명 표적 단백질 효소 단백질 수송체 단백질 운반체 단백질
Ambrisentan EDNRA
Bethanidine ADRA2A, ADRA2B, ADRA2C, KCNJ1
Bosentan EDNRA, EDNRB CYP2C19, CYP2C9, CYP3A4 ABCB11
Debrisoquin SLC6A2 CYP1A1, CYP2D6 ABCB1
Deserpidine SLC18A2
Diazoxide ABCC8, ATP1A1, CA1, CA2, KCNJ11, KCNMA1, SLC12A3
Doxazosin ADRA1A, ADRA1B, ADRA1D, KCNH2, KCNH6, KCNH7 CYP2C19, CYP2D6 ABCB1 ORM1
Guanethidine SLC6A2 CYP3A4
Guanfacine ADRA2A, ADRA2B, ADRA2C CYP2C19, CYP2C9, CYP3A4
Hydralazine AOC3, P4HA1 CYP3A4
Mecamylamine CHRNA1, CHRNA10, CHRNA2, CHRNA3, CHRNA4, CHRNA5, CHRNA6, CHRNA7, CHRNA9, CHRNB1, CHRNB2, CHRNB3, CHRNB4, CHRND, CHRNE, CHRNG
Methyldopa ADRA2A, ADRA2B, ADRA2C, DDC COMT SLC15A1
Metyrosine TH
Minoxidil ABCC8, KCNJ1, PTGS1
Nitroprusside NPR1 CYP1A1, CYP1A2
Pargyline MAOA, MAOB
Prazosin ADRA1A, ADRA1B, ADRA1D, KCNH2, KCNH6, KCNH7 CYP1A1 ABCB1, ABCG2, SLC22A1, SLC22A2, SLC22A3 ORM1
Rescinnamine ACE
Reserpine SLC18A1, SLC18A2 CYP3A5 ABCB1, ABCB11, ABCC2, SLC22A1, SLC22A2
Sitaxentan EDNRA, EDNRB CYP2C19, CYP2C9, CYP3A4
Trimethaphan CHRNA10 BCHE
표 7 Anxiolytics and Hypnotics/sedatives [N05B|N05C]
약물명 표적 단백질 효소 단백질 수송체 단백질 운반체 단백질
Adinazolam GABRA1, GABRA2, GABRA3, GABRA5, GABRB1, GABRB2, GABRB3, GABRD, GABRE, GABRG1, GABRG2, GABRG3, GABRP, GABRR1, GABRR2, GABRR3 CYP2C19, CYP3A4
Alprazolam GABRA1, GABRA2, GABRA3, GABRA4, GABRA5, GABRA6, GABRB1, GABRB2, GABRB3, GABRD, GABRE, GABRG1, GABRG2, GABRG3, GABRP, GABRQ, GABRR1, GABRR2, GABRR3, TSPO CYP2C9, CYP3A4, CYP3A5, CYP3A7
Amobarbital CHRNA4, CHRNA7, GABRA1, GABRA2, GABRA3, GABRA4, GABRA5, GABRA6, GABRB1, GABRB2, GABRB3, GABRD, GABRE, GABRG1, GABRG2, GABRG3, GABRP, GABRQ, GRIA2, GRIK2 CYP2A6
Aprobarbital CHRNA4, CHRNA7, GABRA1, GABRA2, GABRA3, GABRA4, GABRA5, GABRA6, GRIA2, GRIK2
Bromazepam GABRA1, GABRA2, GABRA3, GABRA4, GABRA5, GABRA6, GABRB1, GABRB2, GABRB3, GABRD, GABRE, GABRG1, GABRG2, GABRG3, GABRP, GABRQ, GABRR1, GABRR2, GABRR3 CYP1A2, CYP2C19, CYP2E1, CYP3A4
Buspirone DRD2, HTR1A CYP2D6, CYP3A4, CYP3A5, CYP3A7 ABCB1
Butethal CHRNA4, CHRNA7, GABRA1, GABRA2, GABRA3, GABRA4, GABRA5, GABRA6, GRIA2, GRIK2
Chlordiazepoxide GABRA1, GABRA2, GABRA3, GABRA4, GABRA5, GABRA6, GABRB1, GABRB2, GABRB3, GABRD, GABRE, GABRG1, GABRG2, GABRG3, GABRP, GABRQ, GABRR1, GABRR2, GABRR3 CYP2D6, CYP3A4
Cinolazepam GABRA1, GABRA2, GABRA3, GABRA5, GABRB1, GABRB2, GABRB3, GABRD, GABRE, GABRG1, GABRG2, GABRG3, GABRP, GABRR1, GABRR2, GABRR3
Clobazam GABRA1, GABRA2, GABRA3, GABRA4, GABRA5, GABRA6, GABRB1, GABRB2, GABRB3, GABRD, GABRE, GABRG1, GABRG2, GABRG3, GABRP, GABRQ, GABRR1, GABRR2, GABRR3 CYP2B6, CYP2C18, CYP2C19, CYP3A4
Clorazepate GABRA1, GABRA2, GABRA3, GABRA4, GABRA5, GABRA6, GABRB1, GABRB2, GABRB3, GABRD, GABRE, GABRG1, GABRG2, GABRG3, GABRP, GABRQ, GABRR1, GABRR2, GABRR3, TSPO CYP3A4
Clotiazepam GABRA1, GABRA2, GABRA3, GABRA4, GABRA5, GABRA6, GABRB1, GABRB2, GABRB3, GABRD, GABRE, GABRG1, GABRG2, GABRG3, GABRP, GABRQ, GABRR1, GABRR2, GABRR3 CYP2B6, CYP2C18, CYP2C19, CYP3A4
Dexmedetomidine ADRA2A, ADRA2B, ADRA2C
Diazepam GABRA1, GABRA2, GABRA3, GABRA4, GABRA5, GABRA6, GABRB1, GABRB2, GABRB3, GABRD, GABRE, GABRG1, GABRG2, GABRG3, GABRP, GABRQ, GABRR1, GABRR2, GABRR3, TSPO CYP1A2, CYP2B6, CYP2C18, CYP2C19, CYP2C8, CYP2C9, CYP3A4, CYP3A5, CYP3A7, PTGS1 ABCB1 ALB
Estazolam GABRA1, GABRA2, GABRA3, GABRA4, GABRA5, GABRA6, GABRB1, GABRB2, GABRB3, GABRD, GABRE, GABRG1, GABRG2, GABRG3, GABRP, GABRQ, GABRR1, GABRR2, GABRR3 CYP3A4
Ethchlorvynol GABRA1, GABRA2, GABRA3, GABRA4, GABRA5, GABRA6, GABRB1, GABRB2, GABRB3
Fludiazepam GABRA1, GABRA2, GABRA3, GABRA4, GABRA5, GABRA6, GABRB1, GABRB2, GABRB3, GABRD, GABRE, GABRG1, GABRG2, GABRG3, GABRP, GABRQ, GABRR1, GABRR2, GABRR3
Flunitrazepam GABRA1, GABRA2, GABRA3, GABRA4, GABRA5, GABRA6, GABRB1, GABRB2, GABRB3, GABRD, GABRE, GABRG1, GABRG2, GABRG3, GABRP, GABRQ, TSPO CYP1A2, CYP2A6, CYP2B6, CYP2C19, CYP2C9, CYP3A4, UGT2B7
Flurazepam GABRA1, GABRA2, GABRA3, GABRA4, GABRA5, GABRA6, GABRB1, GABRB2, GABRB3, GABRD, GABRE, GABRG1, GABRG2, GABRG3, GABRP, GABRQ, GABRR1, GABRR2, GABRR3 CYP2A6, CYP2C19, CYP2E1, CYP3A4 ABCB1
Glutethimide GABRA1, GABRA2, GABRA3, GABRA4, GABRA5, GABRA6, GABRB1, GABRB2, GABRB3, GABRD, GABRE, GABRG1, GABRG2, GABRG3, GABRP, GABRQ CYP11A1, CYP2D6
Halazepam GABRA1, GABRA2, GABRA3, GABRA5, GABRB1, GABRB2, GABRB3, GABRD, GABRE, GABRG1, GABRG2, GABRG3, GABRP, GABRR1, GABRR2, GABRR3
Heptabarbital CHRNA4, CHRNA7, GABRA1, GABRA2, GABRA3, GABRA4, GABRA5, GABRA6, GRIA2, GRIK2
Hexobarbital CHRNA4, CHRNA7, GABRA1, GABRA2, GABRA3, GABRA4, GABRA5, GABRA6, GABRB1, GABRB2, GABRB3, GABRD, GABRE, GABRG1, GABRG2, GABRG3, GABRP, GABRQ, GRIA2, GRIK2 CYP1A2, CYP2C19, CYP2C9, CYP2E1, CYP3A4, PTGS1
Hydroxyzine HRH1 CYP2D6, CYP3A4, CYP3A5
Ketazolam GABRA1, GABRB1, GABRD, GABRE, GABRG1, TSPO CYP3A4 ABCB1 ALB
Lorazepam GABRA1, GABRA2, GABRA3, GABRA4, GABRA5, GABRA6, GABRB1, GABRB2, GABRB3, GABRD, GABRE, GABRG1, GABRG2, GABRG3, GABRP, GABRQ, GABRR1, GABRR2, GABRR3, TSPO
Melatonin ASMT, CALM1, CALR, EPX, ESR1, MPO, MTNR1A, MTNR1B, NQO2, RORB ASMT, CYP19A1, CYP1A1, CYP1A2, CYP1B1, CYP2C19, CYP2C9, IDO1, MPO SLC22A8
Meprobamate GABRA1, GABRA2, GABRA3, GABRA4, GABRA5, GABRA6, GABRB1, GABRB2, GABRB3, GABRD, GABRE, GABRG1, GABRG2, GABRG3, GABRP, GABRQ CYP2C19, CYP2E1 ABCB1
Methaqualone GABRA1, GABRA2, GABRA3, GABRA4, GABRA5, GABRA6, GABRB1, GABRB2, GABRB3, GABRD, GABRE, GABRG1, GABRG2, GABRG3, GABRP, GABRQ CYP3A4
Methohexital GABRA1
Methyprylon GABRA1 CYP2D6
Midazolam GABRA1, GABRA2, GABRA3, GABRA4, GABRA5, GABRA6, GABRB1, GABRB2, GABRB3, GABRD, GABRE, GABRG1, GABRG2, GABRG3, GABRP, GABRQ, GABRR1, GABRR2, GABRR3 CYP2B6, CYP3A4, CYP3A5, CYP3A7, CYP4B1 ABCB1, SLC22A1
Nitrazepam GABRA1, GABRA2, GABRA3, GABRA4, GABRA5, GABRA6, GABRB1, GABRB2, GABRB3, GABRD, GABRE, GABRG1, GABRG2, GABRG3, GABRP, GABRQ, GABRR1, GABRR2, GABRR3, SCN1A CYP3A4 ABCB1
Oxazepam GABRA1, GABRA2, GABRA3, GABRA4, GABRA5, GABRA6, GABRB1, GABRB2, GABRB3, GABRD, GABRE, GABRG1, GABRG2, GABRG3, GABRP, GABRQ, GABRR1, GABRR2, GABRR3 CYP3A4, CYP3A43, CYP3A5, CYP3A7
표 8 Beta blocking agents [C07]
약물명 표적 단백질 효소 단백질 수송체 단백질 운반체 단백질
Acebutolol ADRB1, ADRB2 CYP2D6 ABCB1, SLC22A1
Alprenolol ADRB1, ADRB2, ADRB3, HTR1A CYP2D6
Atenolol ADRB1, LTF, PLA2G2E ABCB1
Betaxolol ADRB1, ADRB2 CYP1A2, CYP2D6
Bevantolol ADRA1A, ADRA1B, ADRA1D, ADRB1, ADRB2
Bisoprolol ADRB1, ADRB2 CYP2D6, CYP3A4
Bopindolol ADRB1, ADRB2, ADRB3, HTR1A, HTR1B
Bupranolol ADRB1, ADRB2, ADRB3
Carteolol ADRB1, ADRB2, ADRB3 CYP2D6
Carvedilol ADRA1A, ADRA1B, ADRA1D, ADRB1, ADRB2, ADRB3, GJA1, KCNH2, NDUFC2, NPPB, VCAM1, VEGFA CYP1A1, CYP1A2, CYP2C9, CYP2D6, CYP2E1, CYP3A4, PTGS1, XDH ABCB1
Esmolol ADRB1
Labetalol ADRA1A, ADRA1B, ADRA1D, ADRB1, ADRB2, ADRB3 CYP2D6
Metoprolol ADRB1, ADRB2 CYP2C19, CYP2D6 ABCB1, SLC22A2
Nadolol ADRB1, ADRB2, ADRB3 ABCB1
Nebivolol ADRB1, ADRB2 CYP2D6
Oxprenolol ADRB1, ADRB2, ADRB3 CYP2D6 SLC22A2
Penbutolol ADRB1, ADRB2, ADRB3 ORM1
Pindolol ADRB1, ADRB2, ADRB3, HTR1A, HTR1B CYP2D6 SLC22A2
Practolol ADRB1
Propranolol ADRB1, ADRB2, ADRB3, HTR1A, HTR1B CYP1A1, CYP1A2, CYP2C19, CYP2D6, CYP3A4, CYP3A5, CYP3A7 ABCB1, SLC22A2 ORM1
Sotalol ADRB1, ADRB2, KCNH2
Timolol ADRB1, ADRB2, ADRB3, LYZ CYP2C19, CYP2D6 ABCB1
표 9 Calcium channel blockers [C08]
약물명 표적 단백질 효소 단백질 수송체 단백질 운반체 단백질
Amlodipine CA1, CACNA1B, CACNA1C, CACNA1D, CACNA1F, CACNA1S, CACNA2D1, CACNA2D3, CACNB1, CACNB2 CYP1A1, CYP1A2, CYP2A6, CYP2B6, CYP2C8, CYP2C9, CYP2D6, CYP3A4, CYP3A5, CYP3A7 ABCB1
Bepridil ATP1A1, CACNA1A, CACNA1C, CACNA1D, CACNA1F, CACNA1G, CACNA1H, CACNA1I, CACNA1S, CACNA2D2, CALM1, KCNA5, KCND3, KCNH2, KCNJ12, KCNJ3, KCNJ5, KCNJ8, KCNQ1, PDE1A, PDE1B, TNNC1 CYP2C9, CYP2D6, CYP3A4 ABCB1
Diltiazem CACNA1C, CACNA1D, CACNA1F, CACNA1S, CACNG1 CYP2C19, CYP2C8, CYP2C9, CYP2D6, CYP3A4, CYP3A5, CYP3A7 ABCB1
Felodipine CACNA1C, CACNA1D, CACNA1F, CACNA1H, CACNA1S, CACNA2D1, CACNA2D2, CACNB2, CALM1, NR3C2, PDE1A, PDE1B, TNNC1, TNNC2 CYP2C8, CYP2C9, CYP2D6, CYP3A4, CYP3A5, CYP3A7 ABCB1
Isradipine CACNA1C, CACNA1D, CACNA1F, CACNA1H, CACNA1S, CACNA2D1, CACNA2D2, CACNB2 CYP3A4
Lercanidipine CACNG1 CYP2D6, CYP3A4, CYP3A5, CYP3A7
Losartan AGTR1 CYP1A2, CYP2C19, CYP2C8, CYP2C9, CYP3A4, CYP3A5, UGT1A1, UGT1A10, UGT1A3, UGT2B17, UGT2B7 ABCB1, SLC22A6
Mibefradil CACNA1C, CACNA1D, CACNA1F, CACNA1G, CACNA1H, CACNA1I, CACNA1S, CACNB1, CACNB2, CACNB3, CACNB4 CYP11B1, CYP11B2, CYP1A1, CYP1A2, CYP2D6, CYP3A4, CYP3A5, CYP3A7 ABCB1
Nicardipine ADRA1A, ADRA1B, ADRA1D, CACNA1C, CACNA1D, CACNA1F, CACNA1S, CACNA2D1, CACNB2, CALM1, CHRM1, CHRM2, CHRM3, CHRM4, CHRM5, PDE1A, PDE1B CYP2B6, CYP2C19, CYP2C8, CYP2C9, CYP2D6, CYP2E1, CYP3A4, CYP3A5 ABCB1
Nifedipine CACNA1C, CACNA1D, CACNA1F, CACNA1H, CACNA1S, CACNA2D1, CACNB2, CALM1, KCNA1 CYP1A1, CYP1A2, CYP2A6, CYP2B6, CYP2C8, CYP2C9, CYP2D6, CYP2E1, CYP3A4, CYP3A5, CYP3A7 ABCB1, ABCC2, ABCC3
Nilvadipine CACNA1C, CACNA1D, CACNA1F, CACNA1S, CACNA2D1, CACNA2D3, CACNB2 CYP1A2, CYP2A6, CYP2C19, CYP2C8, CYP2C9, CYP2E1, CYP3A4
Nimodipine AHR, CACNA1C, CACNA1D, CACNA1F, CACNA1S, CACNB1, CACNB2, CACNB3, CACNB4, NR3C2 CYP3A4, CYP3A5
Nisoldipine CACNA1C, CACNA1D, CACNA1F, CACNA1S, CACNA2D1, CACNB2 CYP1A2, CYP3A4, CYP3A5, CYP3A7 ABCB1
Nitrendipine CACNA1C, CACNA1D, CACNA1F, CACNA1H, CACNA1S, CACNA2D1, CACNA2D2, CACNB2, CACNG1 CYP3A4, CYP3A5, CYP3A7 ABCB1
Perhexiline CPT1A, CPT2 CYP2B6, CYP2D6, CYP3A4
Verapamil CACNA1A, CACNA1B, CACNA1C, CACNA1D, CACNA1F, CACNA1G, CACNA1I, CACNA1S, CACNB1, CACNB2, CACNB3, CACNB4, KCNA10, KCNA3, KCNA7, KCNC2, KCNH2, KCNJ11, KCNJ6, SCN5A, SLC6A4 CYP1A2, CYP2B6, CYP2C18, CYP2C19, CYP2C8, CYP2C9, CYP2D6, CYP3A4, CYP3A5, CYP3A7 ABCB1, ABCB11, ABCC1, ABCC10, ABCC2, ABCC3, ABCC4, ABCG2, SLC22A1, SLC22A4, SLC22A5, SLCO1A2, SLCO1B1
표 10 Diuretics [C03]
약물명 표적 단백질 효소 단백질 수송체 단백질 운반체 단백질
Amiloride ABP1, ASIC1, ASIC2, PLAU, SCNN1A, SCNN1B, SCNN1D, SCNN1G, SLC9A1 ABP1 SLC22A1, SLC22A2, SLC22A4
Bendroflumethiazide CA1, CA2, CA4, KCNMA1, SLC12A3
Bumetanide CFTR, SLC12A1, SLC12A2, SLC12A4, SLC12A5 SLC10A1, SLC22A11, SLC22A6, SLC22A7, SLC22A8, SLCO1A2
Chlorothiazide CA1, CA2, CA4, SLC12A3 SLC22A6
Chlorthalidone CA2, SLC12A1, SLC12A3
Conivaptan AVPR1A, AVPR2 CYP3A4
Cyclothiazide CA1, CA2, CA4, FXYD2 SLC22A6
Eplerenone NR3C2 CYP11B2, CYP3A4, CYP3A5, CYP3A7
Ethacrynic acid ATP1A1, SLC12A1, SLC12A2 GSTA2 SLC22A6 ALB
Furosemide CA2, GABRA1, GABRA2, GABRA3, GABRA4, GABRA5, GABRA6, SLC12A1, SLC12A2 PGD ABCC2, ABCC4, SLC22A11, SLC22A5, SLC22A6, SLC22A8, SLCO2A1 ALB
Hydrochlorothiazide CA1, CA12, CA2, CA4, CA9, KCNMA1, SLC12A3 SLC22A6
Hydroflumethiazide ATP1A1, CA1, CA12, CA2, CA4, CA9, KCNMA1, SLC12A1, SLC12A3
Indapamide CA2, KCNE1, KCNQ1, SLC12A3 CYP3A4
Methyclothiazide CA1, CA2, CA4, SLC12A1, SLC12A3
Metolazone SLC12A3
Polythiazide SLC12A3
Quinethazone CA1, CA2, SLC12A1, SLC12A2, SLC12A3
Spironolactone AR, NR3C2 CYP11B1, CYP2C8 ABCB1, ABCC2, SLCO1A2
Tolvaptan AVPR2
Torasemide SLC12A1, SLC12A2 CYP2C19, CYP2C8, CYP2C9, PTGS1
Triamterene SCNN1A, SCNN1B, SCNN1D, SCNN1G CYP1A2
Trichlormethiazide ATP1A1, CA1, CA2, CA4, SLC12A1, SLC12A3
Theobromine ADORA1, ADORA2A, PDE4B CYP1A2, CYP2E1
표 11 Drugs for obstructive airway diseases [R03]
약물명 표적 단백질 효소 단백질 수송체 단백질 운반체 단백질
Aminophylline ADORA1, ADORA2A, ADORA3, PDE3A, PDE3B CYP1A2, CYP2E1, CYP3A4
Amlexanox FGF1, IL3, S100A12, S100A13
Bambuterol ADRB2 BCHE
Beclomethasone NR3C1 CYP3A5 SERPINA6
Betamethasone ANXA1, NOS2, NR0B1, NR3C1 CYP11A1, CYP17A1, CYP19A1, CYP1A1, CYP1B1, CYP2A6, CYP2B6, CYP2C19, CYP2C8, CYP2C9, CYP2D6, CYP2E1, CYP3A4, CYP3A43, CYP3A5, CYP3A7, CYP4A11 ABCB1, ABCB11, ABCC2, ABCG2, SLCO1A2
Betamethasone valerate NR3C1
Bitolterol ADRB2
Budesonide NR3C1 CYP3A4
Ciclesonide NR3C1 CES1, CYP2D6, CYP3A4 SERPINA6
Clenbuterol ADRB1, ADRB2, ADRB3, NGF, TNF CYP1A1, CYP1A2
Cromoglicate KCNMA1, S100P
Dexamethasone propionate NR3C1
Dyphylline ADORA1, ADORA2A, PDE4A, PDE4B, PDE4C, PDE4D, PDE7A, PDE7B
Ephedrine ACHE, ADRA1A, ADRA1B, ADRA1D, ADRA2A, ADRA2B, ADRA2C, ADRB1, ADRB2, ADRB3, SLC18A2, SLC6A2, SLC6A3, SLC6A4 CYP2D6, MAOA
Epinephrine ADRA1A, ADRA1B, ADRA1D, ADRA2A, ADRA2B, ADRA2C, ADRB1, ADRB2, ADRB3, PAH CYP1A2, CYP2C9, CYP3A4 SLC22A1, SLC22A2, SLC22A5
Fenoterol ADRB1, ADRB2, ADRB3
Flunisolide NR3C1 CYP3A4 SERPINA6
Fluticasone Propionate NR3C1, NR3C2, PGR, PLA2G4A CYP3A4, CYP3A5, CYP3A7 SERPINA6
Fluticasone furoate NR3C1 CYP3A4
Formoterol ADRB2 CYP2A6, CYP2C19, CYP2C9, CYP2D6
Ibudilast CYSLTR1, PDE3A, PDE3B, PDE4A, PDE4B, PDE4C, PDE4D, PTGIR
Indacaterol ADRB2
Ipratropium CHRM1, CHRM2, CHRM3, CHRM4, CHRM5 CYP2D6, CYP3A4 SLC22A4, SLC22A5
Isoetharine ADRB1, ADRB2
Isoproterenol ADRB1, ADRB2, ADRB3, MAPK1, PIK3R1, PIK3R2, PIK3R3 CYP1A1
Mometasone NR3C1 CYP2C8, CYP3A4
Mometasone furoate NR3C1 CYP3A4
Montelukast ALOX5, CYSLTR1 CYP2A6, CYP2C8, CYP2C9, CYP3A4, PTGS1 SLCO2B1
Nedocromil CYSLTR1, CYSLTR2, FPR1, HSP90AA1, PTGDR
Omalizumab FCER1A, MS4A2
Orciprenaline ADRB2
Oxtriphylline ADORA1, ADORA2A, PDE3A, PDE4A CYP1A2 SLC22A7
Pirbuterol ADRB1, ADRB2
Pranlukast CYSLTR1, CYSLTR2, IL5, MUC2, NFKB1, RNASE3, TNF CYP2C9, CYP3A4 ABCC2
Procaterol ADRB2
Roflumilast PDE4A, PDE4B, PDE4C, PDE4D
Salbutamol ADRB1, ADRB2 CYP3A4
Salmeterol ADRB2 CYP2C8, CYP3A4, CYP3A5, CYP3A7
Salmeterol xinafoate ADRB2 CYP3A4
Salmeterol xinafoate - fluticasone propionate mixt CYP3A4
Terbutaline ADRB2 BCHE
Theophylline ADORA1, ADORA2A, ADORA2B, PDE3A, PDE4A, PDE4B, PDE5A ADA, CYP1A1, CYP1A2, CYP1B1, CYP2C8, CYP2C9, CYP2D6, CYP2E1, CYP3A4 SLC22A7
Tiotropium CHRM1, CHRM2, CHRM3 CYP2D6, CYP3A4 SLC22A4, SLC22A5
Triamcinolone NR3C1 SERPINA6
Zafirlukast CYSLTR1 CYP1A2, CYP2C19, CYP2C8, CYP2C9, CYP2D6, CYP2E1, CYP3A4, PTGS1
표 12 Lipid modifying agents [C10]
약물명 표적 단백질 효소 단백질 수송체 단백질 운반체 단백질
Atorvastatin AHR, DPP4, HMGCR CYP2B6, CYP2C19, CYP2C8, CYP2C9, CYP2D6, CYP3A4, CYP3A5, CYP3A7 ABCB1, ABCC1, ABCC4, ABCC5, SLCO1A2, SLCO1B1
Bezafibrate PPARA, PPARD, PPARG CYP1A1, CYP2C8, CYP3A4 SLCO1B1
Cerivastatin HMGCR CYP2B6, CYP2C19, CYP2C8, CYP2C9, CYP2D6, CYP3A4, CYP3A5, CYP3A7 ABCB1, ABCC2, ABCG2, SLCO1B1
Clofibrate PPARA CYP1A1, CYP2A6, CYP2B6, CYP2E1, CYP3A4, CYP4A11, GSTA2
Ezetimibe ANPEP, NPC1L1, SOAT1 CYP3A4, UGT1A1, UGT1A3, UGT2B7 ABCB1, ABCC2, SLCO1B1
Fenofibrate MMP20, PPARA CYP2C8, CYP2C9, CYP3A4
Fluvastatin HMGCR CYP1A1, CYP1A2, CYP2B6, CYP2C19, CYP2C8, CYP2C9, CYP2D6, CYP3A4
Gemfibrozil PPARA CYP1A2, CYP2C19, CYP2C8, CYP2C9, CYP3A4 SLCO1B1
Lovastatin HDAC2, HMGCR, ITGAL CYP2C19, CYP2C8, CYP2C9, CYP2D6, CYP3A4, CYP3A5, CYP3A7, PON3 ABCB1, SLCO1A2, SLCO1B1
Niacin HCAR2, HCAR3, NNMT, QPRT CYP2D6 SLC16A1, SLC22A5, SLCO2B1
Pravastatin HMGCR CYP2C8, CYP2C9, CYP2D6, CYP3A4, CYP3A5 ABCB1, ABCB11, ABCC2, ABCG2, SLC22A11, SLC22A6, SLC22A7, SLC22A8, SLCO1A2, SLCO1B1, SLCO2B1
Probucol ABCA1
Rosuvastatin HMGCR CYP2C19, CYP2C9, CYP3A4, CYP3A5 ABCC1, ABCC4
Simvastatin HMGCR, ITGB2 CYP2B6, CYP2C19, CYP2C8, CYP2C9, CYP2D6, CYP3A4, CYP3A5, CYP3A7 ABCB1, SLCO1A2, SLCO1B1
Levothyroxine THRA, THRB, TPO CYP2C8, CYP3A4 ABCB1, SLC16A2, SLCO1C1 ALB, SERPINA7, TTR
표 13 Proton Pump Inhibitors [A02BC]
약물명 표적 단백질 효소 단백질 수송체 단백질 운반체 단백질
Lansoprazole ATP4A, ATP4B CYP1A1, CYP1A2, CYP1B1, CYP2C18, CYP2C19, CYP2C8, CYP2C9, CYP2D6, CYP3A4, CYP4A11 ABCB1, ABCG2
Omeprazole ATP4A, ATP4B CYP11A1, CYP1A1, CYP1A2, CYP1B1, CYP2C18, CYP2C19, CYP2C8, CYP2C9, CYP2D6, CYP3A4 ABCB1, ABCC3, ABCG2
Pantoprazole ATP4A, ATP4B CYP1A2, CYP2C19, CYP2C9, CYP3A4 ABCB1, ABCG2, SLCO1B1
Rabeprazole ATP4A, ATP4B CYP1A1, CYP1A2, CYP2C19, CYP2C9, CYP2D6, CYP3A4 ABCG2
표 14 Sex hormones and modulators of the genital system [G03]
약물명 표적 단백질 효소 단백질 수송체 단백질 운반체 단백질
Allylestrenol ESR1, PGR CYP3A4
Chlorotrianisene ESR1
Choriogonadotropin alfa FSHR, LHCGR
Clomifene ESR1, ESR2 CYP11A1, CYP19A1, CYP1A1, CYP1A2, CYP2A6, CYP2E1, CYP3A4 ABCB1
Conjugated estrogens ESR1, ESR2
Cyproterone AR CYP19A1
Danazol AR, CCL2, ESR1, GNRHR, GNRHR2, PGR CYP19A1, CYP3A4 SHBG
Desogestrel ESR1, PGR
Dienestrol ESR1, ESR2
Diethylstilbestrol AKR1C1, ESR1, ESR2, ESRRG COMT, CYP19A1, CYP2A6, CYP2C8, CYP2C9, CYP2E1, CYP3A4 ABCB1, ABCG2 TTR
Dydrogesterone PGR
Estradiol ESR1, ESR2, NR1I2 CYP1A1, CYP1A2, CYP1B1, CYP2C19, CYP2C8, CYP2C9, CYP3A4, CYP3A5, CYP3A7, UGT1A1 ABCB1, ABCC10, ABCG2, SLC22A1, SLC22A11, SLC22A2, SLC22A3, SLCO1A2, SLCO1B1, SLCO2B1 ALB, FABP2, SHBG
Estradiol - levonorgestrel mixt CYP3A4
Estriol ESR1, ESR2, NCOA5 ABCB1, SLCO1A2
Estrone ESR1, ESR2 COMT, CYP1A1, CYP1A2, CYP1B1, CYP2B6, CYP2C9, CYP2E1, CYP3A4, CYP3A5, CYP4A11 ABCB1, ABCC1, ABCC11, ABCC2, ABCC3, ABCC4, ABCG2, SLC10A1, SLC22A10, SLC22A11, SLC22A6, SLC22A8, SLCO1A2, SLCO1B1, SLCO1B3, SLCO1C1, SLCO2B1, SLCO3A1, SLCO4A1 ALB
Ethinyl Estradiol ESR1, ESR2, NR1I2 CYP2C8, CYP3A4 ABCB1, ABCB11, ABCC2, SLC10A1
Ethynodiol ESR1, PGR
Etonogestrel ESR1, PGR CYP3A4
Fluoxymesterone AR, ESR1, NR3C1, PRLR SHBG
Follitropin alfa (genetical recombination) FSHR
Follitropin beta FSHR
Follitropin beta (genetical recombination) FSHR
Hydroxyprogesterone caproate PGR
Levonorgestrel AR, ESR1, PGR, SRD5A1 CYP19A1, CYP3A4
Lutropin alfa LHCGR
Medroxyprogesterone ESR1, PGR CYP2C8, CYP2C9, CYP3A4, HSD3B2
Megestrol NR3C1, PGR ABCB1
Methyltestosterone AR CYP19A1, CYP2B6, CYP3A4 SLC22A8, SLCO1A2 ALB, SHBG
Mifepristone NR3C1, PGR CYP2D6, CYP3A4, CYP3A5, CYP3A7 ABCB1, ABCC1
Nandrolone phenpropionate AR CYP19A1
Norethindrone PGR CYP2C19, CYP3A4, CYP3A5, CYP3A7 ABCB1
Progesterone CYP17A1, ESR1, NR3C2, PGR CYP17A1, CYP1A1, CYP1A2, CYP1B1, CYP2A6, CYP2C19, CYP2C8, CYP2C9, CYP2D6, CYP3A4, CYP3A5, CYP3A7 ABCB1, ABCB11, ABCC1, SLC10A1, SLC22A1, SLC22A2, SLC22A3
Raloxifene ESR1, ESR2 AOX1, CYP19A1, CYP2B6, CYP2C8, CYP3A4
Synthetic conjugated estrogens, B ESR1, ESR2
Testosterone AKR1C1, AKR1C2, AR CYP11A1, CYP19A1, CYP1A1, CYP1B1, CYP2A13, CYP2B6, CYP2C19, CYP2C8, CYP2C9, CYP3A4, CYP3A43, CYP3A5, CYP3A7, MAOA ABCB1, ABCG2, SLC10A1, SLC22A1, SLC22A3, SLC22A4, SLC22A7, SLC22A8, SLCO1A2 ALB, SHBG
Testosterone Propionate AR
Urofollitropin FSHR
표 15 Thyroid therapy [H03]
약물명 표적 단백질 효소 단백질 수송체 단백질 운반체 단백질
Carbimazole TPO
Liotrix THRA, THRB CYP2C8 ABCB1, SLC10A1, SLC16A10, SLC16A2, SLC22A8, SLCO1A2, SLCO1B1, SLCO1B3, SLCO1C1, SLCO4A1, SLCO4C1 ALB, SERPINA7, TTR
Methimazole TPO CYP1A2, CYP2A6, CYP2B6, CYP2C19, CYP2C9, CYP2D6, CYP2E1, CYP3A4
Propylthiouracil DIO1, DIO2, TPO
본 발명에서 사용되는 개인의 유전체 염기서열 정보는 공지된 염기서열분석법을 이용하여 결정될 수 있으며1, 또한 상용화된 서비스를 제공하는 Complete Genomics, BGI (Beijing Genome Institute), Knome, Macrogen, DNALink 등의 서비스를 이용할 수 있으며, 이에 제한되지 않는다.
본 발명에서 개인의 유전체 염기서열에 존재하는 유전자 염기서열 변이 정보는 다양한 방법을 이용하여 추출될 수 있으며, 참조군, 예를 들면 HG19의 유전체 염기서열과의 서열 비교 프로그램, 예를 들어, ANNOVAR(Wang et al., Nucleic Acids Research, 2010; 38(16): e164), SVA(Sequence Variant Analyzer) (Ge et al., Bioinformatics. 2011; 27(14): 1998-2000), BreakDancer(Chen et al., Nat Methods. 2009 Sep; 6(9):677-81) 등을 이용한 염기서열 비교 분석을 통해 수득될 수 있다.
상기 유전자 염기서열 변이 정보는 컴퓨터 시스템을 통하여 접수/수득될 수 있으며, 이런 측면에서 본 발명의 방법은 유전자 변이 정보를 컴퓨터 시스템으로 접수하는 단계를 추가로 포함할 수 있다. 본 발명에서 사용되는 컴퓨터 시스템은 상기 특정 약물 또는 약물군의 약력학 또는 약동학에 관여하는 유전자, 예를 들면 약물과 관련된 표적 단백질, 약물 대사에 관여하는 효소 단백질, 수송체 단백질 또는 운반체 단백질 등을 코딩하는 유전자에 관한 정보를 포함하는 하나 이상의 데이터베이스를 포함하거나 데이터베이스에 접근 가능하다. 이러한 데이터베이스는 예를 들면 DrugBank (http://www.drugbank.ca/), KEGG Drug (http://www.genome.jp/kegg/drug/), PharmGKB (http://www.pharmgkb.org/) 등을 포함하는 유전자/단백질/약물-단백질 상호작용 등에 관한 정보를 제공하는 공개 또는 비공개 데이터베이스 또는 지식베이스를 포함할 수 있으나, 이에 제한되지 않는다.
본 발명에서 소정 약물 또는 약물군은 사용자가 입력한 정보, 처방(전)으로부터 입력된 정보, 또는 특정 질환에 치료효과가 있는 약물에 대한 정보를 포함하는 데이터베이스로부터 입력된 정보일 수 있다. 상기 처방전은 전자처방전을 포함하며, 이에 제한되지 않는다.
본 발명에서 사용된 용어 “유전자 염기서열 변이 점수”란 유전체 염기서열 변이가 단백질을 코딩하는 유전자의 엑손 부위에서 발견되었을 때, 이러한 개별 변이가 해당 유전자가 코딩하는 단백질의 아미노산 서열 변이(치환, 부가 또는 결실) 또는 전사 조절 변이를 초래하여, 해당 단백질의 구조 및/또는 기능에 유의한 변화 혹은 손상을 유발하는 정도를 수치화한 점수를 말하며, 상기 유전자 염기서열 변이 점수는 유전체 염기서열 상에서 아미노산의 진화론적 보존 정도, 변형된 아미노산의 물리적 특성에 따른 해당 단백질의 구조나 기능의 변화에 미치는 정도 등을 고려하여 산출할 수 있다.
본 발명에 따른 개인별 단백질 손상 점수 및 개인별 약물 점수 산출에 사용되는 유전자 염기서열 변이 점수는 당업계에 공지된 방법을 이용하여 산출될 수 있다. 예를 들면, SIFT (Sorting Intolerant From Tolerant, Pauline C et al., Genome Res. 2001 May; 11(5): 863-874; Pauline C et al., Genome Res. 2002 March; 12(3): 436-446; Jing Hul et al., Genome Biol. 2012; 13(2): R9), PolyPhen, PolyPhen-2 (Polymorphism Phenotyping, Ramensky V et al., Nucleic Acids Res. 2002 September 1; 30(17): 3894-3900; Adzhubei IA et al., Nat Methods 7(4):248-249 (2010)), MAPP (Eric A. et al., Multivariate Analysis of Protein Polymorphism, Genome Research 2005;15:978-986), Logre (Log R Pfam E-value, Clifford R.J et al., Bioinformatics 2004;20:1006-1014), Mutation Assessor (Reva B et al., Genome Biol. 2007;8:R232, http://mutationassessor.org/), Condel (Gonzalez-Perez A et al.,The American Journal of Human Genetics 2011;88:440-449, http://bg.upf.edu/fannsdb/), GERP (Cooper et al., Genomic Evolutionary Rate Profiling, Genome Res. 2005;15:901-913, http://mendel.stanford.edu/SidowLab/downloads/gerp/), CADD (Combined Annotation-Dependent Depletion, http://cadd.gs.washington.edu/), MutationTaster, MutationTaster2 (Schwarz et al., MutationTaster2: mutation prediction for the deep-sequencing age. Nature Methods 2014;11:361-362, http://www.mutationtaster.org/), PROVEAN (Choi et al., PLoS One. 2012;7(10):e46688), PMut (Ferrer-Costa et al., Proteins 2004;57(4):811-819, http://mmb.pcb.ub.es/PMut/), CEO (Combinatorial Entropy Optimization, Reva et al., Genome Biol 2007;8(11):R232), SNPeffect (Reumers et al., Bioinformatics. 2006;22(17):2183-2185, http://snpeffect.vib.be), fathmm (Shihab et al., Functional Analysis through Hidden Markov Models, Hum Mutat 2013;34:57-65, http://fathmm.biocompute.org.uk/) 등과 같은 알고리즘을 이용하여 유전자 염기서열 변이 정보로부터 유전자 염기서열 변이 점수를 산출할 수 있으며, 이에 제한되지 않는다.
상술된 알고리즘들의 목적은 각각의 유전자 염기서열 변이가 단백질 기능에 얼마나 영향을 미치고, 이 영향이 단백질에 얼마나 손상을 주게 되는지, 혹은 별다른 영향이 없는지 가려내기 위함이다. 이들은 기본적으로 개별 유전자 염기서열 변이가 초래할 해당 유전자가 코딩하는 단백질의 아미노산 서열 및 관련 변화를 판단함으로써 해당 단백질의 구조 및/또는 기능에 미칠 영향을 판단한다는 점에서 공통점이 있다.
본 발명에 따른 일 구현예에서는 개별 유전자 염기서열 변이 점수를 산출하기 위하여, SIFT (Sorting Intolerant From Tolerant) 알고리즘을 이용하였다. SIFT 알고리즘의 경우, 예를 들면, VCF (Variant Call Format) 형식 파일로 유전자 염기서열 변이 정보를 입력받아, 각각의 유전자 염기서열 변이가 해당 유전자를 손상시키는 정도를 점수화 한다. SIFT 알고리즘의 경우 산출 점수가 0에 가까울수록 해당 유전자가 코딩하는 단백질의 손상이 심해서 해당 기능이 손상됐을 것으로 판단하고, 1에 가까울수록 해당 유전자가 코딩하는 단백질이 정상 기능을 유지하고 있을 것으로 판단한다.
또 다른 알고리즘인 PolyPhen-2의 경우, 산출 점수가 높을수록 해당 유전자가 코딩하는 단백질의 기능적 손상 정도가 큰 것으로 판단한다.
최근에는 SIFT, Polyphen2, MAPP, Logre, Mutation Assessor를 서로 비교하고 종합하여 Condel 알고리즘을 제시한 연구(Gonzalez-Perez, A. & Lopez-Bigas, N. Improving the assessment of the outcome of nonsynonymous SNVs with a consensus deleteriousness score, Condel. The American Journal of Human Genetics, 2011;88(4):440-449.)가 발표되었으며, 상기 연구에서는 단백질에 손상을 주는 유전자 염기서열 변이 및 영향이 적은 유전자 염기서열 변이와 관련하여 공지된 데이터의 집합인 HumVar와 HumDiv(Adzhubei, IAet al., A method and server for predicting damaging missense mutations. Nature methods, 2010;7(4):248-249)를 사용하여 상기 다섯 개의 알고리즘을 비교하였다. 그 결과, HumVar의 97.9%의 단백질 손상을 일으키는 유전자 염기서열 변이와 97.3%의 영향이 적은 유전자 염기서열 변이가 상기 다섯 개의 알고리즘 중 최소 세 개의 알고리즘에서 동일하게 감지되었으며, HumDiv의 99.7%의 단백질 손상을 일으키는 유전자 염기서열 변이와 98.8%의 영향이 적은 유전자 염기서열 변이가 상기 다섯 개의 알고리즘 중 최소 세 개의 알고리즘에서 동일하게 감지되었다. 또한, 상기 HumDiv와 HumVar에 대하여 상기 다섯 개의 알고리즘과 각 알고리즘을 통합하여 계산한 결과들의 정확도를 나타내는 ROC(Receiver Operating Curve) 곡선을 그려본 결과, 상당히 높은 수준(69%~88.2%)에서 AUC(Area Under the Receiver Operating Curve) 일치도를 보이는 것을 확인하였다. 즉 상술한 다양한 알고리즘들은 그 산출 방법은 달라도 산출된 유전자 염기서열 변이 점수들은 서로 유의하게 상관된 것이다. 따라서 상술한 알고리즘들 또는 알고리즘들을 응용한 방법을 적용하여 산출된 유전자 염기서열 변이 점수를 본 발명에 의한 개인별 단백질 손상 점수 및 개인별 약물 점수 산출 단계에 적용하는 것은 각 유전자 염기서열 변이 점수를 산출하는 서로 다른 알고리즘의 종류에 상관없이 본 발명의 범위에 속하는 것이다.
유전자 염기서열 변이가 단백질을 코딩하는 유전자의 엑손 부위에 발생할 경우, 단백질의 구조 및/또는 기능에 직접적인 영향을 미칠 수 있다. 따라서 상기 유전자 염기서열 변이 정보를 단백질 기능 손상 정도와 관련시킬 수 있다. 이런 측면에서 본 발명의 방법은 다음의 단계에서 상술한 유전자 염기서열 변이 점수를 기반으로 개인별 단백질 손상 점수를 산출한다.
본 발명에서 사용된 용어“단백질 손상 점수”란 하나의 단백질을 코딩하는 유전자 부위에 두 개 이상의 유의한 염기서열 변이가 발견되어, 하나의 단백질이 두 개 이상의 유전자 염기서열 변이 점수를 갖게 되는 경우, 상기 유전자 염기서열 변이 점수를 종합하여 계산된 점수를 말하며, 만약 단백질을 코딩하는 유전자 부위에 유의한 염기서열 변이가 한 개인 경우에는 유전자 염기서열 변이 점수와 단백질 손상 점수가 동일하다. 이때, 단백질을 코딩하는 유전자 염기서열 변이가 두 개 이상인 경우, 단백질 손상 점수는 각 변이별로 계산된 유전자 염기서열 변이 점수들의 평균값으로 계산되며, 이러한 평균값은 예를 들면 기하평균, 산술평균, 조화평균, 산술기하평균, 산술조화평균, 기하조화평균, 피타고라스 평균, 사분평균, 이차평균, 절삭평균, 윈저화 평균, 가중평균, 가중기하평균, 가중산술평균, 가중조화평균, 함수의 평균, 멱평균, 일반화된 f-평균, 백분위수, 최대값, 최소값, 최빈값, 중앙값, 중앙범위, 중심경향도(measures of central tendency), 단순 곱 또는 가중곱, 또는 상기 산출값들의 함수 연산으로 계산될 수 있으나, 이에 제한되지 않는다.
본 발명에 따른 일 구현예에서는 하기 수학식 1에 의해 단백질 손상 점수를 산출하였으며, 하기 수학식 1은 다양한 변형이 가능하므로, 이에 제한되지 않는다.
수학식 1
Figure PCTKR2014007685-appb-M000001
상기 수학식 1에서 Sg는 유전자 g가 코딩하는 단백질의 단백질 손상 점수, n은 상기 유전자 g의 염기서열 변이 중 분석대상 염기서열 변이의 수, vi는 i 번째 유전자 염기서열 변이의 유전자 염기서열 변이 점수이고, p는 0이 아닌 실수이다. 상기 수학식 1에서 상기 p의 값이 1일 때는 산술평균, 상기 p의 값이 -1일 때는 조화평균이 되며, 상기 p의 값이 0에 가까워지는 극한의 경우에는 기하평균이 된다.
본 발명에 따른 또 다른 일 구현예에서는 하기 수학식 2에 의해 단백질 손상 점수를 산출하였다.
수학식 2
Figure PCTKR2014007685-appb-M000002
상기 수학식 2에서 Sg는 유전자 g가 코딩하는 단백질의 단백질 손상 점수, n은 상기 유전자 g의 염기서열 변이 중 분석대상 염기서열 변이의 수, vi는 i 번째 유전자 염기서열 변이의 유전자 염기서열 변이 점수, wi는 상기 vi에 부여되는 가중치이다. 모든 가중치 wi가 같은 값을 갖는 경우 상기 단백질 손상 점수 Sg는 상기 유전자 염기서열 변이 점수 vi의 기하평균값이 된다. 상기 가중치는 해당 단백질의 종류, 해당 단백질의 약동학적 또는 약력학적 분류, 해당 약물 효소 단백질의 약동학적 파라미터, 인구 집단 또는 인종별 분포를 고려하여 부여될 수 있다.
본 발명에서 사용된 용어 “약물 효소 단백질의 약동학적 파라미터”는 Vmax, Km, Kcat/Km 등을 포함하는 것이다. Vmax는 기질 농도가 매우 높을 때의 최대 효소 반응 속도이고, Km은 해당 반응이 1/2 Vmax에 도달하게 하는 기질의 농도이다. Km은 해당 효소와 해당 기질 간의 친화도로 볼 수 있으며, Km이 작을수록 해당 효소와 해당 기질 간의 결합이 강하다. 효소의 대사회전수라고도 불리는 Kcat은 해당 효소가 최대 속도로 활동하고 있을 때 각 효소 활성 부위 당 1초의 시간에 대사되는 기질 분자의 개수를 의미하며, 해당 효소 반응이 실제 얼마나 빠르게 일어나는지를 의미한다.
본 발명의 방법은 다음 단계에서 상술한 단백질 손상 점수를 약물과 단백질 사이의 상호 관계와 연관지어 개인별 약물 점수를 산출한다.
본 발명에서 사용된 용어“약물 점수”란 소정의 약물이 주어졌을 때, 해당 약물의 약력학 또는 약동학에 관여하는 표적 단백질, 약물 대사에 관여하는 효소 단백질, 수송체 단백질 또는 운반체 단백질들을 찾아내어, 해당 단백질들의 단백질 손상 점수를 계산한 후, 이를 다시 종합하여 하나의 약물에 대하여 산출된 값을 말한다.
본 발명에서 약물 점수는 소정 약물 또는 약물군의 약력학 또는 약동학에 관여하는 단백질의 손상이 두 개 이상인 경우, 상기 단백질 손상 점수들의 평균값으로 계산되며, 이러한 평균값은 예를 들면 기하평균, 산술평균, 조화평균, 산술기하평균, 산술조화평균, 기하조화평균, 피타고라스 평균, 사분평균, 이차평균, 절삭평균, 윈저화 평균, 가중평균, 가중기하평균, 가중산술평균, 가중조화평균, 함수의 평균, 멱평균, 일반화된 f-평균, 백분위수, 최대값, 최소값, 최빈값, 중앙값, 중앙범위, 중심경향도(measures of central tendency), 단순 곱 또는 가중곱, 또는 상기 산출값들의 함수 연산으로 계산될 수 있으나, 이에 제한되지 않는다.
상기 약물 점수는 약물학적 특성을 고려하여 해당 약물의 약력학 또는 약동학에 관여하는 표적 단백질, 약물 대사에 관여하는 효소 단백질, 수송체 단백질 및 운반체 단백질의 가중치를 조율하여 산출될 수 있으며, 상기 가중치는 해당 약물 효소 단백질의 약동학적 파라미터, 인구 집단 또는 인종별 분포 등을 고려하여 부여될 수 있다. 또한, 해당 약물과 직접 상호작용하지는 않지만, 해당 약물의 전구체 또는 해당 약물의 대사산물들과 상호작용하는 단백질, 예를 들면, 약물학적 패스웨이에 참여하는 단백질들의 단백질 손상 점수도 함께 고려하여 종합된 약물 점수를 산출할 수 있다. 또한, 해당 약물의 약력학 또는 약동학에 관여하는 단백질들과 유의하게 상호작용하는 단백질들의 단백질 손상 점수를 함께 고려하여 종합된 약물 점수를 산출할 수 있다. 상기 해당 약물의 약물학적 패스웨이에 참여하거나, 해당 단백질들과 유의하게 상호작용하거나 그 신호전달경로에 참여하는 단백질에 관한 정보는 PharmGKB (Whirl-Carrillo et al., Clinical Pharmacology & Therapeutics 2012;92(4):414-4171), The MIPS Mammalian Protein-Protein Interaction Database (Pagel etl al., Bioinformatics 2005;21(6):832-834), BIND (Bader et al., Biomolecular Interaction Network Database, Nucleic Acids Res. 2003 Jan 1;31(1):248-50), Reactome (Joshi-Tope et al., Nucleic Acids Res. 2005 Jan 1;33(Database issue):D428-32) 등의 공지된 생물학적 데이터베이스에서 검색할 수 있다.
본 발명에 따른 일 구현예에서는 하기 수학식 3에 의해 약물 점수를 산출하였으며, 하기 수학식 3은 다양한 변형이 가능하므로, 이에 제한되지 않는다.
수학식 3
Figure PCTKR2014007685-appb-M000003
상기 수학식 3에서 Sd는 약물 d의 약물 점수, n은 상기 약물 d의 약력학 또는 약동학에 직접 관여하거나 해당 약물의 전구체 또는 해당 약물의 대사산물들과 상호작용하는 단백질, 예를 들면, 약물학적 패스웨이에 참여하는 유전자 군에서 선정된 하나 이상의 유전자가 코딩하는 단백질의 수, gi는 상기 약물 d의 약력학 또는 약동학에 직접 관여하거나 해당 약물의 전구체 또는 해당 약물의 대사산물들과 상호작용하는 단백질, 예를 들면, 약물학적 패스웨이에 참여하는 유전자 군에서 선정된 하나 이상의 유전자가 코딩하는 단백질의 단백질 손상 점수이며, p는 0이 아닌 실수이다. 상기 수학식 3에서 상기 p의 값이 1일 때는 산술평균, 상기 p의 값이 -1일 때는 조화평균이 되며, 상기 p의 값이 0에 가까워지는 극한의 경우에는 기하평균이 된다.
본 발명에 따른 또 다른 일 구현예에서는 하기 수학식 4에 의해 약물 점수를 산출하였다.
수학식 4
Figure PCTKR2014007685-appb-M000004
상기 수학식 4에서 Sd는 약물 d의 약물 점수, n은 상기 약물 d의 약력학 또는 약동학에 직접 관여하거나 해당 약물의 전구체 또는 해당 약물의 대사산물들과 상호작용하는 단백질, 예를 들면, 약물학적 패스웨이에 참여하는 유전자 군에서 선정된 하나 이상의 유전자가 코딩하는 단백질의 수, gi는 상기 약물 d의 약력학 또는 약동학에 직접 관여하거나 해당 약물의 전구체 또는 해당 약물의 대사산물들과 상호작용하는 단백질, 예를 들면, 약물학적 패스웨이에 참여하는 유전자 군에서 선정된 하나 이상의 유전자가 코딩하는 단백질의 단백질 손상 점수이며, wi는 상기 gi에 부여되는 가중치이다. 모든 가중치 wi가 같은 값을 갖는 경우 상기 약물 점수 Sd는 상기 단백질 손상 점수 gi의 기하평균값이 된다. 상기 가중치는 해당 단백질의 종류, 해당 단백질의 약동학적 또는 약력학적 분류, 해당 약물 효소 단백질의 약동학적 파라미터, 인구 집단 또는 인종별 분포를 고려하여 부여될 수 있다.
본 발명에 따른 일 구현예의 방법에 사용되는 기하평균 계산법의 경우 약물과 단백질의 연관성이 갖는 특징과 상관없이 가중치를 모두 동일하게 부여하였지만, 본 발명에 따른 또 다른 구현예에서처럼 약물과 단백질의 연관성이 갖는 각 특징을 고려한 가중치를 부여하여 약물 점수를 산출하는 것이 가능하다. 예를 들어 약물의 표적 단백질과 약물과 관련된 수송체 단백질에는 다른 점수가 부여될 수 있다. 또한, 예를 들어 해당 약물 효소 단백질에는 그 약동학적 파라미터인 Km, Vmax, Kcat/Km를 가중치로 부여하여 약물 점수를 산출하는 것이 가능하다. 또한, 예를 들어 표적 단백질은 수송체 단백질과 비교하여 약리작용상 더 중요하다고 판단되므로 높은 가중치를 부여할 수 있고, 수송체 단백질이나 운반체 단백질은 농도에 민감한 약물에 대해서 높은 가중치가 부여될 수 있으며, 이에 제한되지 않는다. 가중치는 약물과 약물 관련 단백질 간의 상관관계, 약물과 단백질 상호작용의 특성에 따라 면밀히 조정될 수 있다. 예를 들면 표적 단백질에는 2점을, 수송체 단백질에는 1점을 부여하는 것과 같이 약물과 단백질의 상호작용의 특성에 대한 가중치를 부여한 정교한 알고리즘을 사용할 수 있다.
상기의 서술에서는 약물과 직접 상호작용하는 단백질만을 예로 들었지만, 본 발명에 따른 일 구현예에서와 같이 해당 약물의 전구체 또는 해당 약물의 대사산물들과 상호작용하는 단백질, 해당 약물의 약력학 또는 약동학에 관여하는 단백질들과 유의하게 상호작용하는 단백질, 그 신호전달경로에 참여하는 관련 단백질 정보를 활용하여 상기 수식의 예측능력을 향상시킬 수 있다. 즉 단백질-단백질 상호작용 네트워크 혹은 약물학적 패스웨이 정보를 활용하여 이에 관여하는 다양한 단백질의 정보를 사용할 수 있다. 즉 해당 약물과 직접 상호작용하는 단백질에 유의한 변이가 발견되지 않아 해당 단백질 손상 점수 계산값이 없거나 손상 없음(예를 들면, SIFT 알고리즘을 적용한 경우 1.0점)인 경우에도, 해당 단백질과 상호작용하거나 같은 신호전달경로에 참여하는 관련 단백질들의 단백질 손상 점수의 평균값(예를 들면, 기하평균치) 등을 해당 단백질의 단백질 손상 점수로 대신 사용하여, 약물 점수 산출에 사용할 수 있다.
상기의 개인별 약물 점수는 하나 이상의 연관 단백질에 대한 정보가 획득 가능한 모든 약물 또는 그 중 선별된 일부 약물에 대해서 산출할 수 있다. 또한, 이러한 개인별 약물 점수는 순위점수(rank)로 환산 가능하다.
본 발명의 방법은 상술한 개인별 약물 점수를 이용하여 상기 개인에 대해 적용되는 약물 간의 우선순위를 결정하는 단계; 또는 상기 개인별 약물 점수를 이용하여 상기 개인에 적용되는 약물의 사용 여부를 결정하는 단계를 추가로 포함할 수 있다.
상기의 개인별 약물 점수는 모든 약물에 개별적으로 적용할 수 있지만, 질환별, 임상적 특징, 또는 작용방식 등의 분류별 또는 의학적 비교대상 약물 간에 적용하면 더 유용하다. 본 발명에서 사용 가능한 약물 분류체계는, 예를 들면 ATC (Anatomical Therapeutic Chemical Classification System) 코드, 미국에서 자주 처방되는 15가지 약물 목록 (top 15 frequently prescribed drug classes during 2005~2008 in the United States (Health, United States, 2011, Centers for Disease Control and Prevention)), 약물유전체학적 마커가 알려져 있어서 약물의 표시에 기재되는 약물 작용 정보에 영향을 줄 수 있는 약물, 또는 부작용 등으로 시장에서 퇴출된 약물 목록 등을 포함할 수 있다.
본 발명의 방법은 처방 점수를 계산하는 단계를 추가로 포함할 수 있다.
본 발명에서 사용된 용어 “처방 점수”란 두 개 이상 복수의 약물이 동시에 혹은 서로의 약리작용에 유의한 영향을 미칠 만큼 짧은 시간 간격을 두고 투약되는 경우, 상기 각 약물에 대하여 결정된 상기 약물 점수를 종합하여 계산되는 점수를 말한다. 본 발명에서 처방점수는 상기 약물 간의 우선순위에 의해 결정된 약물이 두 개 이상이고 동시 투약이 필요한 경우, 상기 각 약물에 대하여 결정된 약물 점수를 종합하여 산출될 수 있다. 처방 점수의 계산은, 예를 들어, 해당 복수 약물과 공통으로 상호작용하는 단백질이 존재하지 않는 경우에는, 단순히 해당 복수 약물의 약물 점수들을 평균 내거나 합산 혹은 곱함으로써 산출할 수 있다. 해당 복수 약물과 공통으로 상호작용하는 단백질이 존재하는 경우에는, 해당 공통 상호작용 단백질의 단백질 손상 점수에, 예를 들면 2배의 가중치를 부여하여 각각의 약물 점수를 산출한 후, 해당 약물 점수들을 합산함으로써 처방 점수를 산출할 수 있다.
처방 점수는 개별 약물의 효과를 넘어서서, 개인에 대해 적용되는 처방(전) 안에 포함된 복수 약물 처방의 적정성 혹은 위험성을 판단하기 위한 것이다. 이러한 측면에서 본 발명의 방법은 개인에 대해 적용되는 처방(전)의 적정성 혹은 위험성을 판단하는 단계를 추가로 포함할 수 있다.
본 발명의 방법은 약물 부작용 방지를 목적으로 수행되는 것을 포함하며, 이에 제한되지 않는다.
도 1은 본 발명의 일 구현예에 따른 개인 유전체 염기서열 변이를 이용한 맞춤형 약물 선택을 위한 정보를 제공하는 방법의 각 단계를 보여주는 흐름도이다. 본 발명에 따른 일 구현예에서는 (1) 개인 사용자의 유전체 염기서열 정보 입력 또는 수신 (S100), (2) 소정 약물 또는 약물군 관련 정보 입력 또는 수신 (S110), (3) 개인 사용자의 유전자 염기서열 변이 정보 결정 (S120), (4) 소정 약물 또는 약물군에 대한 개인별 단백질 손상 점수 계산 (S130), (5) 소정 약물 또는 약물군에 대한 개인별 약물 점수 계산 (S140), (6) 약물 점수 표기, 약물 점수 순위별 정렬 또는 우선순위 결정 (S150), 및 (7) 약물 점수와 우선순위를 고려한 약물 선택 및 처방점수 계산 (S160)의 순서로 맞춤형 약물 선택을 위한 정보를 제공하는 방법이 진행된다.
본 발명에 따른 방법은 상기 순위별로 정렬된 약물 점수를 선택하면, 해당 약물 점수가 산출된 약물유전체학적 계산과정과 근거를 그림, 도표 및 설명 등의 정보로 제공하여 처방의사의 판단을 돕는 단계를 추가로 포함할 수 있다. 즉, 본 발명에 따른 방법은 본 발명의 약물 순위 결정의 근거가 된, 유전자 염기서열 변이 정보, 유전자 염기서열 변이 점수, 단백질 손상 점수, 약물 점수 및 그 산출에 사용된 정보 중 하나 이상의 정보를 제공하는 단계를 추가로 포함할 수 있다. 예를 들면 도 3에 나타낸 바와 같이, 사용자가 특정 약물인 터뷰탈린을 선택했을 때 제공될 수 있는 해당 약물 점수 산출의 약물유전체학적 근거에 관한 그림, 도표 및 설명 등을 제공할 수 있다.
다른 양태에서 본 발명은 개인에 대해 적용대상이 되는 약물 또는 약물군에 대하여, 상기 약물 또는 약물군과 관련된 유전자 또는 단백질과 관련된 정보 검색 또는 추출이 가능한 데이터베이스; 상기 데이터베이스에 접근 가능한 통신부; 상기 정보에 기초하여 상기 약물 또는 약물군의 약력학 또는 약동학에 관여하는 하나 이상의 유전자 염기서열 변이 정보를 산출하는 제1 산출모듈; 상기 유전자 염기서열 변이 정보를 이용하여 개인별 단백질 손상 점수를 산출하는 제2 산출모듈; 상기 개인별 단백질 손상 점수를 약물과 단백질 사이의 상호 관계와 연관지어 개인별 약물 점수를 산출하는 제3 산출모듈; 및 상기 산출모듈에서 산출된 산출값을 표시하는 표시부를 포함하는, 개인 유전체 염기서열 변이를 이용한 맞춤형 약물 선택 시스템에 관한 것이다.
본 발명에서 모듈이라 함은, 본 발명에 따른 기술적 사상을 수행하기 위한 하드웨어 및 상기 하드웨어를 구동하기 위한 소프트웨어의 기능적, 구조적 결합을 의미할 수 있다. 예컨대, 상기 모듈은 소정의 코드와 상기 소정의 코드가 수행되기 위한 하드웨어 리소스(resource)의 논리적인 단위를 의미할 수 있으며, 반드시 물리적으로 연결된 코드를 의미하거나, 한 종류의 하드웨어를 의미하는 것은 아님은 본 발명 기술분야의 당업자에게 자명한 것이다.
본 발명에서 사용된 용어 “산출모듈”은 본 발명의 방법에 따라 분석대상이 되는 약물 및 유전자에 대하여, 상기 유전자 염기서열 변이 점수, 단백질 손상 점수, 약물 점수 및 그 산출의 근거가 되는 정보 및 상기 정보를 근거로 각 점수를 계산하는 소정의 코드와 상기 소정의 코드가 수행되기 위한 하드웨어 리소스(resource)의 논리적인 단위를 의미할 수 있으며, 반드시 물리적으로 연결된 코드를 의미하거나, 한 종류의 하드웨어를 의미하는 것은 아니다.
본 발명에 따른 시스템은 또한 상기 제3 산출모듈에서 산출된 상기 개인별 약물 점수를 이용하여 상기 개인에 대해 적용되는 약물 간의 우선순위를 산출; 또는 상기 개인별 약물 점수를 이용하여 상기 개인에 적용되는 약물의 사용 여부를 결정하는 제4 산출모듈을 추가로 포함할 수 있다.
본 발명에 따른 시스템은 또한 약물 간의 우선순위에 의해 결정된 약물이 두 개 이상이고 동시 투약이 필요한 경우, 상기 각 약물에 대하여 결정된 상기 약물 점수를 종합하여 처방 점수로 산출하는 제5 산출모듈을 추가로 포함할 수 있다.
본 발명에 따른 시스템은 상기 사용자에 의해 약물 또는 약물군 목록을 입력하거나, 또는 특정 질환에 치료효과가 있는 약물 또는 약물군에 대한 정보를 포함하는 데이터베이스에 접근하여 관련 정보를 추출하고, 이에 따라 상기 약물의 약물 점수를 산출하여 제공하는 사용자 인터페이스를 추가로 포함할 수 있다.
본 발명에 따른 시스템은 또한 각 산출모듈에서 산출된 값 또는 약물 간의 우선순위가 결정된 계산과정 및 상기 산출 또는 계산의 기초가 된 정보를 추가로 표시하는 표시부를 추가로 포함할 수 있다.
본 발명에 따른 시스템에서 상기 데이터베이스 또는 그 접근 정보를 포함하는 서버, 산출된 정보 및 이와 연결된 사용자 인터페이스 장치는 서로 연계되어 사용될 수 있다.
본 발명에 따른 시스템은 약물-단백질 상호관계에 대한 약물학/생화학적 새로운 정보가 산출되는 경우 즉시 업데이트되어 더 향상된 맞춤형 약물 선택에 사용될 수 있다. 본 발명에 따른 일 구현예에서는 데이터베이스 또는 지식베이스의 갱신에 따라, 상기 각 산출모듈에 저장된 상기 유전자 염기서열 변이 정보, 유전자 염기서열 변이 점수, 단백질 손상 점수, 약물 점수 및 그 산출의 근거가 되는 정보가 갱신된다.
도 2는 본 발명의 일 구현예에 따른 개인 유전체 염기서열 변이를 이용한 맞춤형 약물 선택 시스템의 개략적 구성도이다. 본 발명의 시스템(10)은 약물 또는 약물군과 관련된 유전자 또는 단백질과 관련된 정보 검색 또는 추출이 가능한 데이터베이스(DB)(100), 통신부(200), 사용자 인터페이스 또는 단말(300), 산출부(400) 및 표시부(500)를 포함하여 구성될 수 있다.
본 발명에 따른 시스템에서 사용자 인터페이스 또는 단말(300)은 서버로부터 개인 유전체 염기서열 변이를 이용한 맞춤형 약물 선택 처리를 요청, 결과 수신 및/또는 저장할 수 있으며, 스마트 폰, PC(Personal Computer), 태블릿 PC, 개인 휴대 정보 단말기(Personal Digital Assistant, PDA), 웹 패드 등과 같이 메모리 수단을 구비하고 마이크로프로세서를 탑재하여 연산 능력을 갖춘 이동 통신 기능을 구비한 단말기로 구성될 수 있다.
본 발명에 따른 시스템에서 서버는 약물, 유전자 변이 또는 약물-단백질 상호관계에 대한 데이터베이스(100)에 대한 접근을 제공하는 수단으로, 통신부(200)을 통해 사용자 인터페이스 또는 단말(300)과 연결되어 각종 정보를 교환할 수 있도록 구성된다. 여기서, 통신부(200)는 동일한 하드웨어에서의 통신은 물론, 구내 정보 통신망(local area network, LAN), 도시권 통신망(metropolitan area network, MAN), 광역 통신망(wide area network, WAN), 인터넷, 2G, 3G, 4G 이동 통신망, 와이파이(Wi-Fi), 와이브로(Wibro) 등을 포함할 수 있으며, 통신 방식도 유선, 무선을 가리지 않으며 어떠한 통신 방식이라도 상관없다. 데이터베이스(100) 또한 서버에 직접 설치된 것뿐 아니라 목적에 따라 인터넷 등을 통해 접근 가능한 다양한 생명과학 데이터베이스에 연결될 수 있다.
본 발명에 따른 시스템에서 산출부(400)는 상술한 바와 같이 수집/입력된 정보를 이용하여 약물 또는 약물군의 약력학 또는 약동학에 관여하는 하나 이상의 유전자 변이 정보를 산출하는 제1 산출모듈(410), 개인별 단백질 손상 점수를 산출하는 제2 산출모듈(420), 개인별 약물 점수를 산출하는 제3 산출모듈(430)을 포함하여 구성될 수 있다.
본 발명에 따른 방법은 하드웨어, 펌웨어, 또는 소프트웨어 또는 이들의 조합으로 구현될 수 있다. 소프트웨어로 구현되는 경우 저장매체는 컴퓨터와 같은 장치에 의해 판독 가능한 형태의 저장 또는 전달하는 임의의 매체를 포함한다. 예를 들면 컴퓨터 판독 가능한 매체는 ROM(read only memory); RAM(random access memory); 자기디스크 저장 매체; 광저장 매체; 플래쉬 메모리 장치 및 기타 전기적, 광학적 또는 음향적 신호 전달 매체 등을 포함한다.
이러한 측면에서 본 발명은 개인 유전체 염기서열 정보로부터 소정 약물 또는 약물군의 약력학 또는 약동학에 관여하는 유전자 염기서열 변이 정보를 입수하는 단계; 상기 유전자 염기서열 변이 정보를 이용하여 개인별 단백질 손상 점수를 산출하는 단계; 및 상기 개인별 단백질 손상 점수를 약물과 단백질 사이의 상호 관계와 연관지어 개인별 약물 점수를 산출하는 단계를 포함하는 동작을 수행하는 프로세서를 실행시키는 실행모듈을 포함하는 컴퓨터 판독 가능한 매체를 제공한다.
상기 프로세서는 상기 개인별 약물 점수를 이용하여 상기 개인에 대해 적용되는 약물 간의 우선순위를 결정하는 단계; 또는 상기 개인별 약물 점수를 이용하여 상기 개인에 적용되는 약물의 사용 여부를 결정하는 단계를 추가로 포함할 수 있다.
이하, 하기 실시예를 통하여 본 발명을 보다 상세히 설명한다. 이들 실시예는 본 발명을 상세히 설명하기 위한 것으로 본 발명의 범위가 이들 실시예에 의해 제한되는 것은 아니다.
하기 실시예는 다음과 같이 구성되었다.
제 1 군: 본 발명의 실제 적용 사례를 제시하기 위한 실시예로, 선택된 하나의 약물(실시예 1), 선택이 필요한 두 개의 약물(실시예 2) 또는 특정 의학적 상태에서 사용 가능한 동일한 약물군에 속하는 여러 개의 비교대상 약물(실시예 3)을 대상으로 본 발명의 개인별 맞춤형 약물 선택 방법을 제공하는 과정을 예시하는 실시예.
제 2 군: 본 발명의 타당성을 검증하기 위한 실시예로, 공개된 대규모 개인 유전체 염기서열 변이 정보에 근거한 데이터 기반의 타당성 검증(실시예 4), 항암제·골수억제제인 부설판(Busulfan) 처치 과정에서 심각한 부작용 경고 사인을 보인 소아 백혈병 환자 12례의 개인 유전체 염기서열 분석 및 이에 근거한 실제 임상의학적 타당성 검증(실시예 5), 및 본 발명에 따라 산출된 개인별 약물 점수와 약물의 시장 퇴출 및 사용 제한 사이의 높은 상관관계를 제시하여 본 발명의 맞춤형 약물 선택 방법이 개인별 맞춤형 약물 부작용 예방에 사용될 수 있음을 제시하는 집단유전학적 타당성을 검증(실시예 6)한 실시예.
제 3 군: 본 발명의 다양한 응용 사례를 제시하기 위한 실시예로, 일 개인에서 위험성이 예측된 특정 약물의 표적 단백질에서 발견된 개인 유전체 염기서열 변이의 임상의학적 의의를 고찰하여 본 발명의 개인별 맞춤형 약물 선택 방법의 유용성을 제시(실시예 7)한 실시예.
실시예 1. 선택된 하나의 약물(터뷰탈린)에 대한 개인별 맞춤형 약물 선택 방법 제공
본 발명의 방법과 시스템을 이용하여, 천식의 치료에 사용되는 약물의 하나인 터뷰탈린(Terbutaline)에 대한 개인별 맞춤형 약물 선택 방법을 제공하기 위하여, 하기와 같은 분석을 수행하였다.
보다 구체적으로, 본인은 건강하지만 모친은 천식으로 치료를 받고 있어 천식에 걸릴 의학적 위험성이 높다고 판단되는 개체 sg01에 대하여 유전자 염기서열 분석을 수행하였으며, 터뷰탈린의 약동학 또는 약력학에 관여하는 것으로 알려진 유전자인 BCHE(butyrylcholinesterase)와 ADRB2(adrenoceptor beta 2, surface)에 대한 유전자 염기서열 변이 점수를 SIFT 알고리즘을 이용하여 각 변이별로 계산하였으며, 단백질 손상 점수 및 약물 점수를 산출하였다. 그 결과를 표 16 및 도 3에 나타내었다.
표 16
약물 성분명 (약물 점수) 유전자/단백질 단백질 손상 점수 단백질 군 변이 점수 변이 정보
염색체 위치 참조 유전형 변이 유전형
Terbutaline (0.22) Adrenoceptor beta 2, surface (ADRB2) 0.68 Target(PD) 0.46 chr5:148206440 G A
0.45 chr5:148206473 G C
1.00 chr5:148207447 G C
1.00 chr5:148207633 G A
Butyrylcholinesterase (BCHE) 0.07 Enzyme(PK) 0.07 chr3:165491280 C T
상기 표 16에 나타낸 바와 같이, 개체 sg01의 유전자 염기서열 분석 결과, BCHE에서 발견된 한 개의 변이(chr3:165491280)의 유전자 염기서열 변이 점수는 0.07이었으며, ADRB2에서 발견된 네 개의 변이(chr5:148206440, chr5:148206473, chr5:148207447, chr5:148207633)의 유전자 염기서열 변이 점수는 각각 0.46, 0.45, 1, 1이었다. 상기 유전자 염기서열 변이 점수를 근거로 수학식 2를 이용하여 BCHE와 ADRB2에 대한 개인별 단백질 손상 점수를 산출하였으며, 각각 0.07과 0.68(=(0.46 x 0.45 x 1 x 1)1/4)로 확인되었다. 상기 단백질 손상 점수를 근거로 수학식 4를 이용하여 터뷰탈린에 대한 개인별 약물 점수를 산출하였으며, 이는 0.22(=(0.07 x 0.68)1/2)로 확인되었다.
본 발명에 따른 방법을 통하여 개체 sg01은 터뷰탈린의 대표적인 표적 단백질인 ADRB2와 대표적인 효소 단백질인 BCHE에 중등도(단백질 손상 점수: 0.68) 내지 심각(단백질 손상 점수: 0.07)한 손상이 있음을 확인하였으며, 종합적으로 터뷰탈린의 개인별 약물 점수가 심각(0.22)한 수준임을 확인하였다(도 3). 따라서 개체 sg01에게는 0.22의 낮은 약물 점수를 보이는 터뷰탈린의 처방을 가능한 피하고 다른 약으로 대체하는 것을 추천하는 것이 좋을 것으로 판단되었다.
실시예 2. 선택이 필요한 두 개의 약물(아스피린 및 타이레놀)에 대한 개인별 맞춤형 약물 선택 방법 제공
본 발명의 방법과 시스템을 이용하여, 통증의 치료에 많이 사용되는 약물인 아스피린과 타이레놀에 대한 개인별 맞춤형 약물 선택 방법을 제공하기 위하여, 하기와 같은 분석을 수행하였다.
아스피린(Acetylsalicylic acid)과 타이레놀(Acetaminophen)은 모두 좋은 진통제로 매우 광범위하게 사용되고 있지만 개인에 따른 반응성에 차이가 있고, 때로 심각한 부작용을 유발하기도 한다. 특히, 특정 개인에 있어서 둘 중 어느 약물이 더 좋은 약물 작용을 제공하거나 더 심각한 약물 위해 반응을 나타낼지 미리 알아낼 수 없다는 한계가 있는바, 이하에서는 본 발명의 방법과 시스템을 이용하여 상기와 같은 임상에서 흔히 마주치는 어려운 판단에 도움을 줄 수 있음을 개시하였다.
평소 시중에서 처방전 없이 구입할 수 있는 해열진통제 복용에도 불편감을 호소하여 권장 용량의 절반만을 복용하였던 개체 sg09에 대하여 개인 유전자 염기서열 분석을 수행하였으며, 아스피린과 타이레놀의 약동학 또는 약력학과 관련된 유전자 염기서열 변이 점수, 단백질 손상 점수 및 약물 점수를 각각 계산하였다. 그 결과를 표 17, 표 18 및 도 4에 나타내었다.
표 17
Figure PCTKR2014007685-appb-T000001
표 18
Figure PCTKR2014007685-appb-T000002
상기 표 17에 나타낸 바와 같이, 아스피린(Acetylsalicylic acid)의 표적 단백질 3개, 효소 단백질 3개, 수송체 단백질 8개, 운반체 단백질 1개를 포함하여 총 15개의 약동학 또는 약력학에 관련된 sg09의 유전자 염기서열 변이 정보를 이용하여 개인별 약물 점수를 구하였다. 먼저 아스피린의 약력학 또는 약동학에 관여하는 유전자에 나타난 유전자 염기서열 변이 정보를 결정하였으며, SIFT 알고리즘을 이용하여 유전자 염기서열 변이 점수를 산출하였다. 아스피린의 표적 단백질인 PTGS1과 수송체 단백질인 SLC22A8은 변이 개수가 각각 1개(각각 chr9:125133479, chr11:62766431)로 나타나 유전자 염기서열 변이 점수(각각 0.38, 0.32)를 그대로 단백질 손상 점수로 정하였다. 또 다른 수송체 단백질인 SLC22A10은 두 개의 변이(chr11:63066500, chr11: 63072226)를 가지고 있어, 각 변이에 해당하는 유전자 염기서열 변이 점수는 1.0, 0.03으로 산출되었으며, 수학식 2를 이용하여 단백질 손상 점수를 산출하였다(0.17(=(1.0 x 0.03)1/2)). 상기 3개의 단백질 손상 점수를 포함하여 총 15개의 단백질 손상 점수를 종합한 후, 수학식 4를 이용하여 약물 점수를 산출하였다. 그 결과, 개체 sg09의 아스피린에 대한 약물 점수는 0.76(=(1.0 x 0.38 x 1.0 x 1.0 x 1.0 x 1.0 x 1.0 x 1.0 x 0.17 x 1.0 x 1.0 x 0.89 x 0.32 x 0.84 x 1.0)1/15)임을 확인하였다.
또한, 상기 표 18에 나타낸 바와 같이, 타이레놀(Acetaminophen)의 표적 단백질 2개, 효소 단백질 8개, 수송체 단백질 2개를 포함하여 총 12개의 약동학 또는 약력학에 관련된 sg09의 유전자 염기서열 변이 정보를 이용하여 개인별 약물 점수를 구하였다. 먼저 타이레놀의 약력학 또는 약동학에 관여하는 유전자에 나타난 유전자 염기서열 변이 정보를 결정하였으며, SIFT 알고리즘을 이용하여 유전자 염기서열 변이 점수를 산출하였다. 타이레놀의 표적 단백질인 PTGS1은 변이가 1개(chr9:125133479)로 유전자 염기서열 변이 점수를 그대로 단백질 손상 점수로 정하였다. 2개의 변이를 가진 효소 단백질인 CYP1A1(chr15:75015305, chr15:75015215), CYP2A6(chr19:41350664, chr19:41356281)과 3개의 변이를 가진 효소 단백질인 CYP2D6(chr22:42525182, chr22:42525756, chr22:42526694)는 유전자 염기서열 변이 점수들의 기하평균(수학식 2를 이용)을 구하여 단백질 손상 점수를 각각 2.8 x 10-5(=(0.08 x (1x10-8))1/2), 0.52(=(0.55 x 0.49)1/2), 0.2(=(0.98 x 0.39 x 0.02)1/3)로 산출하였다. 상기 4개의 단백질 손상 점수를 포함하여 총 12개의 단백질 손상 점수를 종합한 후, 기하평균(수학식 4를 이용)을 이용하여 약물 점수를 산출하였다. 그 결과, 개체 sg09의 타이레놀에 대한 약물 점수는 0.31(=(0.38 x 1.0 x (2.8 x 10-5) x 1.0 x 0.52 x 1.0 x 1.0 x 0.2 x 0.76 x 1.0 x 1.0 x 1.0)1/12)임을 확인하였다.
또한, 도 4에 나타낸 바와 같이, 개체 sg09는 종합적으로 아스피린의 개인별 약물 점수가 0.76으로 산출되어, 이는 타이레놀의 개인별 약물 점수인 0.31보다 높아, 개체 sg09는 달리 특별한 이유가 없는 한 임상적으로 아스피린과 타이레놀 중에서 하나를 선택하는 경우, 약물로 인한 불편감을 줄이기 위해 아스피린을 선택하는 것을 추천하는 것이 좋을 것으로 판단되었다.
실시예 3. 동일한 약물군(동일한 ATC 코드군)에 속하는 여러 개의 비교대상 약물 중 안전성이 높은 약물 선택을 지원하기 위한 개인별 맞춤형 약물 선택 방법 제공
본 발명의 방법과 시스템을 이용하여, 동일한 약물군(동일한 ATC 코드군)에 속하는 여러 개의 비교대상 약물 중 안전성이 높은 약물 선택을 지원하기 위한 개인별 맞춤형 약물 선택 방법을 제공하기 위하여, 하기와 같은 실험을 수행하였다.
국제공인 ATC 코드로 C07 베타 차단제 속하는 22개의 약물 중 11개는 특이적 베타 차단제[C07AB], 9개는 비특이적 베타 차단제[C07AA], 2개는 알파 및 베타 차단제[C07AG]이다. 먼저 14명(sg01, sg02, sg03, sg04, sg05, sg07, sg09, sg11, sg12, sg13, sg14, sg16, sg17, sg19)의 개인 유전체 염기서열 변이 분석을 위해 일루미나사의 NGS(Next Generation Sequencing) 장비인 HISEQ-2000을 사용하여 30배수 전장유전체서열분석(Whole Genome Sequencing)을 수행하였다. 이때 상기 방법 외에 전장유전체분석의 일부분에 해당하는 전장엑솜서열분석(WES, Whole Exome Sequencing) 또는 500~1000개의 약물관련 주요유전자 500~1000개에 대한 표적엑솜서열분석(Targeted Exome Sequencing)을 대안적으로 수행할 수 있다. 분석된 염기서열 절편은 데이터 정비(Data Cleaning)와 품질확인(Quality Check)의 과정을 거쳐 인간 참조군 서열(예, HG19)에 맞추어 정렬된 SAM(Sequence Alignment Map) 및 BAM(Binary Alignment Map) 파일 형식으로 출력되었다. 상기 클린 배열 결과(cleaned alignment result)는 SAMTools:pileup, SAMTools:mpileup, GATK:recalibration, GATK:realignment 등의 소프트웨어 도구를 활용하여 단일염기변이(SNVs, Single Nucleotide Variants), InDels 등의 변이를 검출하여 VCF (Variant Calling Format) 형식의 파일로 출력되었다.
상기 유전자 염기서열 변이 정보를 담은 VCF 파일을 입력받아 전술한 유전자 염기서열 변이 점수 vi값을 각 변이별로 계산한 후, 수학식 2를 이용하여 개인별 단백질 손상 점수 Sg를 산출하고, 다시 약물별로 수학식 4를 이용하여 개인별 약물 점수 Sd를 산출하여 약물 점수 및 약물 간 우선순위 프로필을 각각 산출하였다. 그 결과를 표 19 및 도 5에 나타내었다.
표 19
약물명 sg01 sg02 sg03 sg04 sg05 sg07 sg09 sg11 sg12 sg13 sg14 sg16 sg17 sg19
Alprenolol 0.53 0.64 0.60 0.60 0.54 0.71 0.51 0.65 1.00 1.00 0.69 0.81 0.82 0.59
Bopindolol 0.87 0.85 0.97 0.97 0.72 0.95 0.71 0.87 1.00 1.00 1.00 0.81 0.82 0.85
Bupranolol 0.88 0.77 0.95 0.95 0.68 0.92 0.57 0.79 1.00 1.00 1.00 0.70 0.72 0.77
Carteolol 0.49 0.57 0.52 0.52 0.52 0.65 0.44 0.59 1.00 1.00 0.63 0.76 0.78 0.52
Nadolol 0.91 0.61 0.96 0.96 0.74 0.94 0.65 0.84 1.00 1.00 1.00 0.76 0.74 0.82
Oxprenolol 0.49 0.55 0.47 0.47 0.47 0.56 0.41 0.56 0.79 1.00 0.55 0.69 0.65 0.47
Penbutolol 0.80 0.82 0.96 0.96 0.74 0.94 0.65 0.84 1.00 1.00 1.00 0.76 0.78 0.82
Pindolol 0.57 0.65 0.59 0.59 0.54 0.66 0.53 0.66 0.85 1.00 0.65 0.77 0.74 0.58
Propranolol 0.49 0.49 0.64 0.05 0.53 0.53 0.33 0.72 0.77 1.00 0.57 0.66 0.51 0.54
Sotalol 0.88 0.77 0.95 0.95 0.68 0.92 0.57 0.79 1.00 1.00 1.00 0.70 0.72 0.77
Timolol 0.67 0.62 0.69 0.69 0.69 0.78 0.62 0.74 1.00 1.00 0.77 0.86 0.84 0.69
Acebutolol 0.54 0.31 0.57 0.57 0.45 0.50 0.49 0.67 0.71 0.40 0.66 0.57 0.74 0.56
Atenolol 1.00 0.72 0.95 0.90 0.77 0.94 0.43 1.00 0.79 0.95 0.87 0.40 0.80 0.95
Betaxolol 0.49 0.57 0.39 0.01 0.52 0.49 0.44 0.49 1.00 1.00 0.63 0.76 0.58 0.52
Bevantolol 0.71 0.85 0.74 0.74 0.78 0.73 0.55 0.73 0.99 1.00 0.99 0.79 0.81 0.84
Bisoprolol 0.49 0.57 0.52 0.52 0.52 0.65 0.44 0.65 1.00 1.00 0.63 0.76 0.78 0.52
Esmolol 1.00 1.00 1.00 1.00 0.40 1.00 0.40 1.00 1.00 1.00 1.00 0.40 0.63 1.00
Metoprolol 0.55 0.50 0.54 0.54 0.53 0.62 0.47 0.66 0.83 1.00 0.61 0.74 0.68 0.53
Nebivolol 0.39 0.48 0.42 0.42 0.42 0.57 0.33 0.57 1.00 1.00 0.54 0.70 0.72 0.42
Practolol 1.00 1.00 1.00 1.00 0.40 1.00 0.40 1.00 1.00 1.00 1.00 0.40 0.63 1.00
Carvedilol 0.54 0.61 0.73 0.22 0.71 0.62 0.45 0.73 0.43 0.90 0.70 0.75 0.65 0.63
Labetalol 0.55 0.72 0.57 0.57 0.68 0.65 0.51 0.61 0.99 1.00 0.76 0.85 0.86 0.68
표 19 및 도 5에 나타낸 바와 같이, 개체 sg04의 경우 비특이적 베타 차단제[C07AA] 중에서는 프로프라놀올(Propranolol), 특이적 베타 차단제[C07AB] 중에서는 베탁솔올(Betaxolol)에 대한 개인별 약물 점수가 현저하게 낮은 것을 확인하였다. 보다 구체적으로, 개체 Sg04의 경우 개인별 약물 점수가 베탁솔올은 0.005, 프로프라놀올은 0.05로 낮게 산출되었다. 따라서 이처럼 낮은 약물 점수를 고려하지 않고 개체 sg04에게 상기의 약물을 처방한다면, 두 약물 모두 상당한 부작용을 유발할 가능성이 높다. 반면 개체 sg04는 같은 계열의 약물 중 Atenolol, Sotalol, Bupranolol, Nadolol, Penbutolol, Bopindolol, Practolol, Esmolol 등에 대한 개인별 약물 점수는 0.9를 상회하는 것으로 나타났으며, 이를 통해 개체 sg04는 현재까지 알려진 상기 약물과 관련된 단백질의 손상을 가지고 있지 않으므로 상대적으로 안전한 약물로 판단하고 선택을 권고할 수 있음을 알 수 있다. 또한, 이러한 분석은 특정 약물군에서 특정 개인이 어떤 약물에 대해서 취약성을 보일 것인지 한눈에 알 수 있도록 표시한다는 장점이 있다.
한편, 도 5에서 극단적으로 점수가 낮은 경향을 보이는 개체 sg04의 베탁솔올과 프로프라놀올에 대한 약물 점수를 제외하면 14명 대부분은 22개의 베타 차단제에 대한 약물 점수가 0.3 이상인 것을 알 수 있다. 이를 감안하였을 때, 특정 개인에서 베타 차단제에 대한 개인별 약물 점수가 0.3 미만으로 나오는 경우, 일반적인 범주와는 다르므로 약물 부작용 가능성을 의심하고 주의를 권고할 수 있을 것이다. 상기와 같이 약물의 사용 여부를 결정하기 위한 정보를 제공할 때 약물 점수의 기준은 해당 약물 자체에 따라 혹은 약물을 사용하는 임상적 상황, 즉 약물을 사용했을 때의 예상되는 이득과 손실에 따라 달라질 수 있을 것이다.
상기와 같이 개체 sg04가 특정 약물에 대해 낮은 개인별 약물 점수를 나타내는 원인을 추가로 분석하기 위하여, 베탁솔올 및 프로프라놀올의 약력학 또는 약동학에 관여하는 표적 단백질, 효소 단백질, 수송체 단백질 및 운반체 단백질 등 총 15개 단백질과 관련된 유전자 염기서열 변이 정보를 이용하여 개인별 단백질 손상 점수 및 개인별 약물 점수를 구하였다. 그 결과를 표 20, 표 21 및 도 6에 나타내었다.
표 20
Figure PCTKR2014007685-appb-T000003
표 21
Figure PCTKR2014007685-appb-T000004
상기 표 20에 나타낸 바와 같이, 개체 sg04는 베탁솔올을 분해하는 두 개의 주요 효소 단백질 CYP1A2와 CYP2D6에 각각 한 개(chr15:75047221)와 두 개(chr22:42525756, chr22:42526694)의 유전자 염기서열 변이를 가지고 있었고 해당 유전자 염기서열 변이 점수도 낮았다(각각 1e-08. 0.39, 0.02). 상기 효소 단백질 CYP1A2와 CYP2D6에 대해 수학식 2를 이용해서 산출한 개인별 단백질 손상 점수는 각각 1.0e-8과 0.088로 낮게 나타났으며, 수학식 4를 이용해서 산출한 베탁솔올에 대한 개인별 약물 점수도 0.005로 심각하게 낮게 나타났다. 한편, 개체 sg04는 베탁솔올의 표적 단백질 ADRB1에는 유전자 염기서열 변이가 없었고, ADRB2에는 5개의 유전자 염기서열 변이(chr5:148206917, chr5:148206473, chr5:148206646, chr5:148207447, chr5:148207633)가 발견되었으나 그 점수는 낮지 않았으며, 수학식 2를 이용해서 산출한 ADRB2에 대한 개인별 단백질 손상 점수는 0.85로 나타났다.
또한, 상기 표 21에 나타낸 바와 같이, 개체 sg04는 프로프라놀올을 분해하는 7개의 분해 효소 중 CYP1A1, CYP1A2, CYP2D6, CYP3A5, CYP3A7 등 다섯 개에 각각 한 개 이상의 심각한 유전자 염기서열 변이를 가지고 있었고. 해당 유전자 염기서열 변이 점수도 낮았다; CYP1A1 (0.08(chr15:75015305)), CY1A2 (1e-08(chr15:75047221)), CYP2D6 (0.39 (chr22:42525756); 0.02 (chr22:42526694)), CYP3A5 (1e-08(chr7:99245974)), CYP3A7 (0.16 (chr7:99306685)). 수학식 2를 이용해서 CYP1A1, CYP1A2, CYP2D6, CYP3A5, CYP3A7에 대해 산출한 개인별 단백질 손상 점수는 각각 0.08, 1.0e-8, 0.088, 1.0e-8, 0.16으로 낮게 나타났으며, 수학식 4를 이용해서 산출한 프로프라놀올에 대한 개인별 약물 점수도 0.05로 심각하게 낮게 나타났다.
또한, 도 6에 나타낸 바와 같이, 개체 sg04는 베탁솔올과 프로프라놀올의 약물 대사 관련 단백질 다수에서 유의한 손상이 나타남을 확인하였으며, 베탁솔올과 프로프라놀올에 대한 개인별 약물 점수가 각각 0.005, 0.05로 심각한 수준임을 확인하였다.
따라서 개체 sg04에게 베타 차단제를 사용할 것이 권장되는 임상적 상황에서는 본 발명의 방법에 따라 산출된 약물 점수가 높은 약물, 즉 비특이적 베타 차단제 중에서는 Bopindolol(0.97), Bupranolol(0.95), Nadolol(0.96), Penbutolol(0.96), Sotalol(0.95) 등, 특이적 베타 차단제 중에서는 Atenolol(0.9), Bevantolol(0.74), Esmolol(1.0), Practolol(1.0) 등을 사용하고, 알파 및 베타 차단제 중에서는 상대적으로 점수가 높은 Labetalol(0.57)을 사용하며, 베탁솔올과 프로프라놀올은 처방을 하지 않는 방향으로 임상의에게 정보를 제공함으로써 개체 sg04에게 약물 부작용이 발생할 위험을 줄이는 것이 바람직하다.
실시예 4. 개인 유전체 염기서열 변이 정보를 기반으로 하는 맞춤형 약물 선택 방법의 타당성 검증
아직까지 개인 유전체 염기서열 변이 정보와 약물학적 반응의 개인차에 관한 신뢰할만한 연구결과는 매우 제한적이다. 현재까지의 연구는 특정 변이가 양성인 또는 음성인 군을 약물별로 비교하여 반응성의 개인차를 연구하는 증례-대조군 관찰연구의 패러다임을 따라왔다. 이러한 연구 패러다임에서는 수많은 염기서열 변이와 수많은 약물의 쌍으로 이루어지는 모든 조합에 대해 각각 고비용의 증례-대조군 연구를 수행해야하지만 현실적으로는 불가능하다. 반면 본 발명에 따른 개인별 맞춤형 약물 선택 방법은 모든 유전자 염기서열 변이를 대상으로 할 뿐만 아니라, 고비용의 증례-대조군 설계의 관찰 연구를 필요로 하지 않고, 유전체 염기서열 변이에 대한 순수 계산만으로 개인별 단백질 손상 점수와 개인별 약물 점수를 산출하고 이를 적용하는 방법을 제안하므로, 모든 유전체 염기서열 변이와 모든 약물 사이의 조합에 대하여 개인별 맞춤형 약물 선택을 위한 추론이 가능하다는 큰 장점을 갖는다.
본 발명의 방법에 따른 개인별 맞춤형 약물 선택 산출 결과의 타당성 평가를 위해 다음과 같은 기준으로 497개의 다빈도 처방 약물을 선택하였다; (1) 미국에서 가장 흔히 처방되는 15가지 약물(top 15 frequently prescribed drug classes during 2005~2008 in the United State (Health, United States, 2011, Centers for Disease Control and Prevention)의 ATC 코드에 포함되는 약물 중 적어도 한 개 이상의 약력학 또는 약동학 관련 유전자가 알려진 약물, (2) 확립된 약물유전체학적 유전체 염기서열 변이 마커의 작용이 미국 식약처의 의약품 라벨 표시에 적용된 약물, (3) 약물 부작용 등으로 시장에서 퇴출된 것으로 DrugBank 데이터베이스에 공지된 약물.
타당성 평가 기준 자료로는 PharmGKB가 제공하는 987개의 유전자 염기서열 변이-약물 상호작용 쌍에 대한 확립된 지식 중 상기 497개의 약물과 적어도 하나 이상의 연결을 갖는 650개(65.9%)를 추출했다. 본 발명이 엑손 영역의 염기서열 변이를 대상으로 한 점을 고려하여, 공정한 평가를 위해서 검증 대상 자료와 평가 기준 자료 사이에 겹치는 부분은 제거하였다. 좀 더 구체적으로는 상기 650쌍 중에서 엑손 영역에 위치한 염기서열 변이 36개를 모두 제거하고 비코딩 영역의 염기서열 변이만을 선택하여 좀 더 공정한 평가를 수행하였다. 결론적으로, 평가를 위한 최종 황금표준으로 614쌍을 선택하였다.
다음으로 The 1000 Genomes Project가 제공하는 1092명의 전장 유전체 염기서열을 분석하여 1092명 각각에 대해 본 발명에 따른 방법을 적용하여, 개인별 약물유전체학적 위험성과 PharmGKB에 등록된 유전자 염기서열 변이별 약물유전체학적 위험성을 각각 계산하였다.
타당도 평가에는 민감도, 특이도 및 ROC 곡선하면적(Area Under the Receiver Operating Curve)를 사용했다. 개인별 약물 점수를 바탕으로 497개의 약물에 순위를 매기고 각 순위 사이의 496개의 분할 위치에 순위별로 역치를 설정한 후, (1) 해당 약물의 약물 점수 순위가 역치보다 상위에 있고 PharmGKB 변이가 개인 유전체 변이에 있을 때는 참양성, (2) 해당 약물의 약물 점수 순위가 역치보다 하위에 있고 PharmGKB 변이가 개인 유전체 변이에 없을 때는 참음성, (3) 해당 약물의 약물 점수 순위가 역치보다 상위에 있으나 PharmGKB 변이가 개인 유전체 변이에는 없을 때는 위양성, (4) 해당 약물의 약물 점수 순위가 역치보다 하위에 있으나 PharmGKB 변이가 개인 유전체 변이에 있을 때는 위음성으로 정했다, 각 개인에서 각 순위역치 L에 대해 참양성, 참음성, 위양성, 위음성의 개수를 산출하여 하기 식과 같이 민감도와 특이도를 계산하였다.
Figure PCTKR2014007685-appb-I000001
Figure PCTKR2014007685-appb-I000002
상기 D는 497개의 전체 약물의 집합, GS는 개인별로 개인 유전자 염기서열 변이가 PharmGKB의 위험 대립유전형과 일치하여 개인별 황금표준으로 사용되는 개인화된 PharmGKB 약물의 집합, DL은 순위역치 상위 약물의 집합이며, 수직 막대 괄호는 해당 집합의 원소 개수를 의미한다.
계산 결과, 18명의 경우 PharmGKB의 변이와 일치하는 변이를 한 개도 가지고 있지 않아서 황금표준으로 사용되는 개인화된 PharmGKB 약물의 집합을 정의할 수 없었기에, 이들은 본 타당성 분석에서 제외하였으며, 모든 역치에 대한 민감도와 특이도를 계산하여 ROC 곡선을 그리고, AUC를 계산하였다. 보다 구체적으로, 먼저 1092명의 전체 인구집단을 대상으로 SIFT 알고리즘을 이용하여 유전자 염기서열 변이 점수를 산출한 후, 이에 수학식 2와 수학식 4를 적용하여 단백질 손상 점수 및 약물 점수를 각각 산출하였다. 또한, 인종별 분포에 따른 가중치 적용의 유용성을 판단하기 위해서 인종 특이적 민감도, 특이도 및 이에 기반을 둔 AUC 값 산출을 The 1000 Genomes Project에 명시된 4개의 인종(African (AFR, n=246), American (AMR, n=181), Asian (ASN, n=286), European (EUR, n=379))별로 각각 동일하게 수행한 후, 인종 특이적 민감도, 특이도 및 AUC를 각각 구하였다. 그 결과를 표 22, 표 23 및 도 7에 나타내었다.
표 22 단백질 군별 분포 및 평균 단백질 손상 점수 산출
단백질 군 단백질 수 관련 약물 수 단백질-약물 쌍의 수 평균 단백질 손상 점수
표적 단백질 440 486 2357 0.798
운반체 단백질 10 50 65 0.728
대사효소 단백질 74 330 1347 0.733
수송체 단백질 54 176 457 0.733
545 497 4201 0.783
표 23 The 1000 Genomes Project 데이터를 이용한 단백질 군별 및 인종별 약물 점수 산출 타당도(AUC) 산출
Total AFR AMR ASN EUR
약물 점수 산출 타당도(AUC)
표적 단백질 0.617 0.634 0.608 0.614 0.614
운반체 단백질 0.554 0.511 0.599 0.485 0.594
대사효소 단백질 0.587 0.642 0.580 0.558 0.579
수송체 단백질 0.497 0.492 0.488 0.489 0.512
단백질 군별 가중치를 비적용 또는 적용한 약물 점수 산출 타당도(AUC)
단순기하평균 0.666 0.744 0.650 0.634 0.653
가중기하평균 0.667 0.742 0.652 0.633 0.654
상기 표 22는 본 실시예에서 사용한 약물 497개에 대한 단백질 군별 분포를 나타낸 것으로, 각 군별로 단백질-약물 쌍의 수와 평균 단백질 손상 점수를 함께 표시하였다.
상기 표 23은 수학식 4를 이용하여 약물 점수를 산출할 때, 단백질 군별 가중치를 적용하지 않은 경우(단순기하평균)와 적용한 경우(가중기하평균)에 각각 산출된 개인별 약물 점수 산출 타당도(AUC)를 각 단백질 군별, 각 인종별로 구분하여 나타낸 것이다.
보다 구체적으로, 전체 인구 집단을 예로 들면, 표적 단백질, 운반체 단백질, 대사효소 단백질, 수송체 단백질 등 각 단백질 군별로 산출한 AUC 값은 각각 0.617, 0.554, 0.587, 0.497이었으며, 이를 단백질 군별 가중치로 사용하여(수학식 4의 가중치 wi에 각 값을 대입) 산출한 개인별 가중기하평균 약물 점수 산출 타당도(AUC=0.667)를 구하였다(도 7b 참조). 그 결과, 상기 단백질 군별 가중치를 적용한 개인별 가중기하평균 약물 점수 산출 타당도는 가중치를 부여하지 않고(가중치 wi=1) 단순기하평균 산출식에 적용하여 산출한 개인별 단순기하평균 약물 점수 산출 타당도(AUC=0.666)보다 0.001점 향상됨을 확인하였다(도 7a 참조).
또한, 도 7a에 나타낸 바와 같이, 가중치 적용의 또 다른 예로 각 인종별 인원수에 따른 가중치를 적용하여 개인별 약물 점수 산출 타당도(AUC) 분석을 수행한 결과, 인종 특이성을 고려한 경우(굵은선), 전체 인구 집단(Total)의 AUC 값은 0.666(아프리카인(African) 0.744, 아메리카인(American) 0.650, 아시아인(Asian) 0.631, 유럽인(European) 0.653)이었으며, 인종 특이성을 고려하지 않은 경우(점선), 전체 인구집단 AUC 값은 0.633(아프리카인 0.623, 아메리카인 0.629, 아시아인 0.64, 유럽인 0.636)으로 나타나, 인종 특이성을 고려한 약물 점수 산출 타당도가 그렇지 않은 경우에 비해 더 향상되는 것을 확인하였다.
또한, 도 7b에 나타낸 바와 같이, 인종 특이성을 고려하지 않고 단백질 군별 가중치만을 적용한 경우(점선), 본 발명의 개인별 약물 점수 산출 타당도 AUC는 0.634이고, 인종 특이성과 함께 단백질 군별 가중치도 함께 적용한 경우(굵은선), 본 발명의 개인별 약물 점수 산출 타당도 AUC는 0.667로 나타나, 서로 다른 가중치의 유용성이 있음을 알 수 있다.
실시예 5. 항암제(Busulfan) 처치에서 심각한 부작용 경고 사인을 보인 소아 백혈병 환아의 개인 유전체 염기서열 변이 정보 분석을 통한 본 발명의 타당성 검증
골수이식(Bone Marrow Transplantation)은 백혈병과 같은 혈액 종양을 치료하기 위한 가장 중요한 치료 방법의 하나이다. 골수이식을 위해서는 먼저 환자 자신의 골수를 제거해야 하는데 전신 방사선 조사 (TBI, Total Body Irradiation) 및 부설판(Busulfan) 등의 약제를 이용한 약물학적 처치의 두 가지 방법이 사용된다. 부설판은 대표적인 알킬화제로 전신 방사선 조사를 대체할 수 있으나, 비교적 좁은 치료범위를 가지고 있어서, 약물 농도가 치료 범위보다 높으면 간정맥폐쇄성질환(hepatic veno-occlusive disease, VOD) 및 중추신경계 독성과 같은 약물과 관련된 중증 독성이 나타나고, 약물 농도가 치료 범위보다 낮으면 생착 실패나 재발 위험성이 증가한다. 특히 소아에서는 부설판의 약동학이 개인마다 차이가 커서 약물농도감시 (TDM, Therapeutic Drug Monitoring) 하에 사용된다. 부설판의 독성은 흔히 “Busulfan Lung”으로 불리는 간질성 폐 섬유화, 색소과침착, 간질, 간성 정맥폐쇄성 질환 (veno-occlusive disease, VOD), 구토, 혈소판 감소증 등이 있다. IARC(International Agency for Research on Cancer)는 부설판을 제1군 발암제로 분류하고 있다.
본 발명의 개인 유전체 염기서열 변이를 이용한 맞춤형 약물 선택 제공 방법을 통하여, 상기 부설판 치료 반응 위험군을 구분할 수 있는지를 확인하기 위하여, 하기와 같은 실험을 수행하였다. 먼저 골수이식 치료를 위한 전처치로 골수 제거를 위해 항암제 부설판(Busulfan, Myleran, GlaxoSmithKline, Busulfex IV, Otsuka America Pharmaceutical, Inc.) 치료를 받던 중 약물농도감시(TDM (therapeutic drug monitoring) 소견상 투약 후 Area Under Curve(AUC 6-hour)가 높아 심각한 부작용 경고 사인을 보인 소아 백혈병 환아 12례를 분석하였다, 객관적인 비교를 위하여 정상 대조군 14례 및 상기 The 1000 Genomes Project(http://www.1000genomes.org/)에서 제공하는 아시아인 286명과의 유전자 염기서열 비교 분석을 수행하였다. 먼저 부설판 및 그 대사산물의 약력학 또는 약동학에 관여하는 유전자를 조사하여 다음 12개의 유전자를 선별하였다; CTH, GGT1, GGT5, GGT6, GGT7, GSTA1, GSTA2, GSTM1, GSTP1, MGMT, MGST2, MSH2.
상기 12개 유전자에 대한 상기 소아 백혈병 환아 12례 및 정상 대조군 14례의 유전자 염기서열 변이 정보로부터 SIFT 알고리즘을 이용하여 유전자 염기서열 변이 점수를 산출한 후, 이로부터 본 발명에 의한 개인별 단백질 손상 점수 및 개인별 약물 점수를 산출하였다. 보다 구체적으로, 각 개인별 유전자 염기서열 변이 정보를 근거로, 수학식 2를 사용하여 상기 12개 단백질에 대한 개인별 단백질 손상 점수를 산출하였고, 수학식 4를 사용하여 개인별 약물 점수를 산출하였으며, 그 결과를 표 24에 나타내었다. 이때 아시아인은 그 하위 인구집단인 CHB(Han Chinese in Bejing, China) (n=97), CHS(Southern Han Chinese) (n=100), JPT(Japanese in Tokyo, Japan) (n=89)로 나누어 동일한 분석을 수행하였으며, 개인별 단백질 손상 점수 및 약물 점수는 기하평균, 조화평균 또는 프로덕트를 이용하여 각각 산출하였다.
표 24
Busulfan(n=12) 정상대조군(n=14) Asian(n=286) CHB(n=97) CHS(n=100) JPT(n=89)
개인별 약물 점수
기하평균 0.507±.065 0.589±.079§ 0.576±.084§ 0.566±.068* 0.588±.082§ 0.575±.101§
조화평균 0.282±.049 0.327±.087 0.331±.076§ 0.326±.065* 0.332±.067§ 0.336±.094§
프로덕트 2.83e-5±5.75e-5 2.00e-3±4.43e-3 2.92e-4±9.75e-4§ 3.94e-4±1.17e-3§ 2.69e-4±1.05e-3* 2.06e-4±5.77e-4§
단백질 손상 점수
기하평균
CTH 0.3429 0.3714 0.6647 0.6645 0.6689 0.6638
GGT1 1.0000 1.0000 0.9264 0.8914 0.9569 0.9201
GGT5 0.3598 0.4800 0.6265 0.6071 0.6600 0.6139
GGT6 0.1826 0.2171 0.2061 0.1953 0.2069 0.2174
GGT7 0.8692 1.0000 0.9741 0.9718 0.9636 0.9889
GSTA1 1.0000 1.0000 0.9968 1.0000 1.0000 0.9897
GSTA2 0.3688 0.5132 0.4916 0.5067 0.4740 0.4955
GSTM1 0.6654 0.6371 0.3513 0.3448 0.3347 0.3752
GSTP1 1.0000 0.9665 1.0000 1.0000 1.0000 1.0000
MGMT 0.8230 0.9621 0.8754 0.8736 0.9078 0.8361
MGST1 1.0000 1.0000 0.9968 0.9939 0.9968 1.0000
MSH2 0.2677 0.7793 0.3615 0.3605 0.3793 0.3412
조화평균
CTH 0.3425 0.3714 0.6647 0.6645 0.6689 0.6638
GGT1 1.0000 1.0000 0.9252 0.8899 0.9557 0.9189
GGT5 0.3042 0.4664 0.6225 0.6015 0.6561 0.6115
GGT6 0.0859 0.1437 0.0942 0.0903 0.0943 0.0985
GGT7 0.8692 1.0000 0.9739 0.9718 0.9630 0.9889
GSTA1 1.0000 1.0000 0.9968 1.0000 1.0000 0.9897
GSTA2 0.3386 0.4934 0.4759 0.4948 0.4540 0.4808
GSTM1 0.6554 0.6371 0.2965 0.3011 0.2702 0.3200
GSTP1 1.0000 0.9533 1.0000 1.0000 1.0000 1.0000
MGMT 0.7869 0.9543 0.8512 0.8516 0.8871 0.8045
MGST1 1.0000 1.0000 0.9968 0.9939 0.9968 1.0000
MSH2 0.2643 0.7793 0.3579 0.3587 0.3737 0.3381
프로덕트
CTH 0.3320 0.3714 0.6643 0.6633 0.6689 0.6638
GGT1 1.0000 1.0000 0.9237 0.8880 0.9537 0.9184
GGT5 0.2190 0.4530 0.5942 0.5642 0.6324 0.5882
GGT6 0.0423 0.1179 0.0372 0.0413 0.0370 0.0326
GGT7 0.8692 1.0000 0.9725 0.9707 0.9600 0.9889
GSTA1 1.0000 1.0000 0.9968 1.0000 1.0000 0.9897
GSTA2 0.2528 0.4039 0.3943 0.4082 0.3728 0.4022
GSTM1 0.6450 0.6371 0.2371 0.2542 0.2101 0.2486
GSTP1 1.0000 0.9393 1.0000 1.0000 1.0000 1.0000
MGMT 0.7400 0.9443 0.8223 0.8247 0.8660 0.7634
MGST1 1.0000 1.0000 0.9968 0.9939 0.9968 1.0000
MSH2 0.2141 0.7793 0.3375 0.3433 0.3473 0.3194
*p-value < 0.05 and §p-value <0.01 by Student T-test. Vaules are mean or mean±S.D.
상기 표 24에 나타낸 바와 같이, 기하평균, 조화평균 또는 프로덕트를 이용하여 개인별 약물 점수를 각각 산출한 결과, 부설판 투약 후 심각한 부작용 경고 사인 발생군인 소아 백혈병 환아(n=12)와 정상 대조군(n=14), 아시아인(n=286) 사이의 일원배치 분산 분석 결과는 기하평균(p=0.016)과 프로덕트(p=0.001)를 이용하여 산출한 경우 통계적으로 유의하였으며, 조화평균을 이용하여 산출한 경우에도 유의한 경향성(p=0.088)을 보였다.
반면, 기하평균, 조화평균 또는 프로덕트를 이용하여 산출된 개인별 약물 점수의 T-test 분석 결과, 정상인 대 아시아인(n=286) (p=0.579, 0.872, 0.173), 정상인 대 CHB(n=97) (p=0.327, 0.942, 0.20), 정상인 대 CHS(n=100) (p=0.967, 0.837, 0.169) 및 정상인 대 JPT(n=89) (p=0.559, 0.735, 0.154) 모두 p-value 기준으로 통계적 유의성을 보이지 않음을 확인하였다. 상기 결과를 통하여, 본 발명에 따른 개인 유전체 염기서열 변이 정보 분석을 통한 개인별 약물 점수 산출을 이용하여 부설판 치료 시 심각한 약물 부작용 경고 사인을 겪은 군(부설판 치료 반응 위험군)과 그렇지 않은 군을 유의하게 구분할 수 있으며, 원치 않는 부작용을 사전에 예방할 수 있음을 확인하였다.
또한, 상기 소아 백혈병 환아 12례 및 정상 대조군 14례의 개인별 유전자 염기서열 분석을 통해 항암제·골수억제제인 부설판의 약력학 또는 약동학 및 약물학적 패스웨이에 관여하는 유전자 염기서열 변이 정보를 결정한 후, 이로부터 산출된 개인별 단백질 손상 점수(수학식 2를 이용하여 산출) 및 개인별 약물 점수(수학식 4를 이용하여 산출)의 평균과 표준편차의 분포를 도 8에 나타내었다.
도 8에 나타낸 바와 같이, 유전자 GGT1, GSTA1, GSTP1, MGST1의 단백질 손상 점수는 양 군에서 현저한 차이를 보이지 않으나, 유전자 CTH, GGT5, GGT6, GGT7, GSTA2, MGMT, MSH2의 단백질 손상 점수는 다소간의 차이를 보였으며, 반면 유전자 GSTM1의 단백질 손상 점수는 소아 백혈병 환아군(0.665)에서 정상 대조군(0.637)보다 약간 높은 소견을 보임을 확인하였다. 상기 결과와 같이, 개별적인 유전자 변이 또는 단백질 손상 점수를 통해서는 양 군을 구분하기 어려운 점이 있으나, 본 발명의 맞춤형 약물 선택 제공 방법을 이용할 경우, 종합적인 약물 점수 산출을 통해 양 군을 통계적으로 유의하게 구분할 수 있음을 알 수 있다(표 24 참조).
또한, 도 8에서 도형의 크기로 표현된 유전자 염기서열의 빈도를 통하여, 소아 백혈병 환아군(도 8a)의 도형들의 크기가 정상 대조군(도 8b)의 도형들의 크기보다 큼을 확인하였으며, 이를 통해 종합된 약물 점수 산출에 사용된 유전자 염기서열 변이의 개수가 소아 백혈병 환아군에서 더 많음을 한눈에 알 수 있다.
상기 결과를 통하여, 본 발명의 방법에 따라 향후 소아 백혈병 환자에서 부설판 투여 시 부작용의 가능성이 높은 군을 예측할 수 있으며, 고 위험군에 대해서는 약물의 농도를 조절하거나 대체 가능한 다른 치료법 혹은 중재요법을 사용하도록 유도할 수 있을 것이다.
실시예 6. 시장에서 퇴출된 약물의 약동학 또는 약력학에 관여하는 유전자에서 발견되는 개인 유전체 염기서열 변이 정보 분석을 통한 본 발명의 타당성 검증
식약처의 허가를 득하여 시장에서 판매를 시작한 약물도 광범위하게 사용되는 과정에서 사후평가 (PMS, Post-market Surveillance) 결과에 따라 시장퇴출 명령을 받을 수 있다. 이러한 약물의 시장 퇴출은 의학적으로 매우 중대한 현상으로, 엄격한 임상시험의 전과정을 거쳐 허가를 득한 의약품의 경우도 실제 적용단계에서 예측하지 못했던 부작용이 발생하여 막대한 인명 손상과 경제적 손실을 일으키고 퇴출될 수 있으며, 대규모 임상시험에서도 찾아낼 수 없었던 개인별 차이가 이러한 약물 시장 퇴출 원인의 하나로 지목되고 있다. 본 발명에 따른 개인별 맞춤형 약물 선택 방법은 개개인의 차이를 고려하여 개인별로 위험성이 높은 약물의 사용을 배제하는 방안을 제공하는 바, 본 발명에 따른 개인별 맞춤형 약물 선택 방법이 막대한 의학적 경제적 손해를 유발하는 약물의 시장퇴출을 예측할 수 있다면 본 발명의 타당성이 한 번 더 검증되는 것이다.
이를 위해 상기 실시예 4와 동일한 인구집단(n=1097)과 약물군(n=497)에 대하여 시장 퇴출 및 사용 제한된 약물을 중심으로 분석을 수행하였다. 시장 퇴출 약물의 포괄적인 목록을 구축하기 위해 이미 포함된 DrugBank 데이터베이스의 퇴출 약물 목록 이외에도, 위키피디아의 ‘List of Withdrawn Drugs’문서와 전세계 시장 퇴출 약물에 대한 가장 포괄적인 자료인 유엔에서 발간하는 제 8, 10, 12, 14판 ‘Consolidated List of Products Whose Consumption and/or Sale Have Been Banned, Withdrawn, Severely Restricted, or Not Approved by Governments: Pharmaceuticals’를 종합적으로 검토하였다. 최종적으로 적어도 한 개 국가 이상에서 퇴출된 약물 392개의 목록을 확립하였고, 이중 상기 497개의 약물에 포함되는 약물은 모두 82개임을 확인하였다. 또한, 시장에서 퇴출된 것은 아니지만 사용이 심각하게 제한된 약물군은 미국 식약처에서 ‘Boxed Warning’을 받은 약물의 목록과 상기 유엔 보고서에 ‘severely restricted’로 표기된 약물의 합집합 중 상기 497개의 약물에 포함되는 것을 추출하였으며, 모두 139개임을 확인하였다. 상기 82개의 시장 퇴출 약물과 상기 139개의 사용 제한 약물, 그리고 나머지 276개의 약물에 대하여 분석을 수행하였다. 각 약물의 시장 안전성 점수 또는 인구집단 약물 점수는 상기 1092명의 유전체 염기서열 변이를 근거로 SIFT 알고리즘을 이용하여 유전자 염기서열 변이 점수를 산출한 후, 이로부터 산출한 개인별 약물 점수 1092개의 산술평균값을 취하여 얻었다. 그 결과, 시장 퇴출, 사용 제한 및 기타 약물군의 인구집단 약물 점수는 각각 0.585±0.21, 0.592±0.19, 0.664±0.19였고, 일원분산분석 결과 그 차이가 유의했다(F=9.282, p < 0.001). 또한, 사후 Tukey 분석에서도 시장 퇴출 약물과 기타 약물 간 비교 시 p-value는 0.004, 사용 제한 약물과 기타 약물 간 비교 시 p-value는 0.001로 모두 통계적 유의성을 보였으며, 시장 퇴출 약물과 사용 제한 약물 간에는 유의한 차이가 발견되지 않았다(p-value=0.971). 즉 인구집단에서 본 발명에 의한 맞춤형 약물 선택 방법이 제안하는 약물 점수의 평균값이 낮을수록 약물의 시장 퇴출 및 사용 제한 확률이 유의하게 높으며, 위험성이 높은 약물임을 알 수 있다.
이와 같은 본 발명에 의한 약물 점수의 유용성을 상대빈도 히스토그램으로 명료하게 시각화하였으며, 이를 도 9에 나타내었다. 도 9a는 DrugBank와 위키피디아에서 획득한 시장 퇴출 약물의 인구집단 약물 점수에 따른 상대빈도 히스토그램이고, 도 9b는 유엔 자료에서 획득한 시장 퇴출 및 사용 제한 약물의 인구집단 약물 점수에 따른 상대빈도 히스토그램이다.
도 9에 나타낸 바와 같이, 각 약물들을 해당 약물의 인구집단 약물 점수에 따라 0.0에서 1.0사이의 0.1 간격으로 구성된 10개의 점수 구간에 할당한 후 각 0.1 구간에 해당하는 약물들의 퇴출율을 히스토그램으로 표시하였으며, 인구집단 약물 점수 또는 상기 1092명의 유전체 염기서열 변이를 근거로 산출한 본 발명에 의한 개인별 약물 점수 1092개의 산술평균값이 낮을수록 시장 퇴출율이 현저히 높음을 확인하였으며, 특히 인구집단 약물 점수 0.3점 이하의 약물이 현저하게 시장 퇴출 또는 사용 제한될 확률이 높음을 확인하였다. 상기 결과를 통하여, 본 발명에 의한 개인별 약물 점수가 개개인의 유전자 염기서열 변이의 특성을 이용해서 시장 퇴출 또는 사용 제한의 잠재적 위험성이 높은 약물을 개인 맞춤형으로 회피할 수 있는 기전을 제안할 수 있음을 확인할 수 있다.
실시예 7. 위험성이 예측된 특정 약물의 표적 단백질과 관련된 유전체 염기서열 변이 분석을 통한 임상의학적 의의 고찰
일 개인에서 위험성이 예측된 특정 약물의 표적 단백질에서 발견된 개인 유전체 염기서열 변이의 임상의학적 의의를 고찰하여 본 발명의 개인별 맞춤형 약물 선택 방법의 유용성을 확인하기 위하여, 하기와 같은 실험을 수행하였다.
혈액 응고 능력이 정상이나, 개인 유전자 염기서열 변이 분석 및 본 발명에 따라 산출한 혈액 응고 억제제인 Rivaroxaban에 대한 개인별 약물 점수가 낮은 개체 sg01에 대한 상세 분석을 수행하였다. 보다 구체적으로, 개체 sg01의 개인 유전체 염기서열에서는 Rivaroxaban의 약력학 및 약동학에 관여하는 유전자 5개 중 표적 단백질인 혈액 응고인자 10번(Coagulation Factor 10, F10)에 두 개의 유전자 염기서열 변이(13번 염색체 113801737 및 113795262)가 나타나며(SIFT 알고리즘을 이용하여 유전자 염기서열 변이 점수를 산출한 후, 수학식 2를 이용하여 산출한 개인별 단백질 손상 점수=0.0001), 효소 단백질인 CYP2J2에 한 개의 유전자 염기서열 변이(1번 염색체 60392236)가 나타났다. 상기 유전자 염기서열 변이 정보를 기반으로 본 발명의 방법에 따라 개체 sg01에 대한 Rivaroxaban의 개인별 약물 점수를 수학식 4를 사용하여 산출한 결과 0.148로 매우 낮게 나타남을 확인하였다.
혈액 응고인자의 기능저하는 혈우병의 원인이 되는 매우 중요한 기전이다. 혈우병은 주로 8번, 9번 11번 응고인자의 기능결손으로 발병하고, 혈액 응고인자 10번(F10)에 의한 사례는 거의 알려져 있지 않다. F10은 프로트롬빈을 트롬빈으로 변환하는데 매우 중요한 효소로, 한 쌍의 F10 유전자 모두가 극심한 손상을 보이는 동형접합(homozygote)이라면 상기 개체 sg01은 고도의 출혈성 경향과 같은 극단적 경향을 보이거나 생존이 불가능했을 것이다. 그러나 상기 개체 sg01의 염기서열 분석 결과, 한 쌍의 F10 유전자 중 한 개에만 염기서열 변이가 있고 다른 한 개의 기능에는 손상이 없는 이형접합(heterozygote)임이 확인되었다.
이와 같이 혈액 응고 능력이 정상인 개체 sg01은 인지하고 있지 못했으나, 본 발명에 따른 약물 점수 산출 시 개체 sg01은 Rivaroxaban에 대한 약물 부작용 가능성이 높은 것으로 나타났으며, 이는 임상의학적으로 중요성을 갖는다. 따라서 추가 분석을 위해 상기 개체 sg01의 혈액 응고 능력에 대한 상세 분석을 수행하였으며, 그 결과를 표 25에 나타내었다.
표 25 개체 sg01의 혈액 응고 능력 분석 결과
혈액응고인자 활성도 정상 범위 참고치
Factor 2 109% 84 - 139
Factor 5 113% 63 - 140
Factor 7 127% 72 - 141
Factor 10 67% 74 - 146
Factor 8 87% 50 - 184
Factor 9 132% 48 - 149
Factor 11 123% 72 - 153
Factor 12 68% 44 - 142
출혈시간 분석 결과 정상 범위 참고치
PT 12.3 sec 9.8 - 12.2
aPTT 34.9 sec 26 - 35.3
Fibrinogen 235 mg/dl 180 - 380
상기 표 25에 나타낸 바와 같이, 개체 sg01의 혈액 응고인자 2, 5, 7, 8, 9, 11, 12번의 활성은 모두 정상범위에 들었으나, 혈액 응고인자 10번의 활성은 67%로 정상범위인 74~146%에 들지 못하는 낮은 활성도를 보였다. 즉 개체 sg01의 혈액 응고능력은 적어도 혈액 응고인자 10번의 관점에서는 정상보다 낮아 출혈성이 높아질 위험이 존재하였다. 또한, 출혈성을 직접 측정하는 PT, aPTT, fibrinogen 검사 결과, 개체 sg01은 다소 출혈성이 높은 편이지만 대략 정상범위 상단에서 그 값이 유지되고 있음을 확인하였다. 즉 개체 sg01은 이형접합인 한 쌍의 F10 중 손상되지 않은 나머지 F10의 활성과 여타의 다른 혈액 응고 기전의 종합적인 적응적 대응으로 대략 정상 범위의 혈액 응고 상태를 유지하고 있는 것으로 보인다. 그러나 개체 sg01은 상기 혈액 응고인자 활성도 검사 결과에서 알 수 있듯이 정상상태를 어렵게 유지하고 있으며 충분한 완충능력은 결여되어 있을 확률이 높다. 그러므로 개체 sg01이 미래에 의학적 필요에 의해 상기 혈액 응고 억제제인 Rivaroxaban을 처방받게 된다면 고도의 출혈성과 같은 심각한 부작용을 겪을 확률은 매우 높으며, 혈액 응고인자 10번은 Rivaroxaban의 유일하고 직접적인 표적 단백질이므로 이러한 추론은 임상의학적으로 매우 타당한 것으로 판단된다. 상기 결과를 통하여, 아직까지 알려져 있지 않은 신규 유전체 염기서열 변이와 약물 사용과의 관련 분석을 통하여, 약물 부작용을 사전적으로 예방할 수 있는 방안을 제시할 수 있으며, 실제 임상의학적 유용성이 존재함을 확인하였다.
이상에서 본 발명의 예시적인 구현예에 대하여 상세하게 설명하였지만 본 발명의 권리범위는 이에 한정되는 것은 아니고 다음의 청구범위에서 정의하고 있는 본 발명의 기본 개념을 이용한 당업자의 여러 변형 및 개량 형태 또한 본 발명의 권리범위에 속하는 것이다.
본 발명에서 사용되는 모든 기술용어는, 달리 정의되지 않는 이상, 본 발명의 관련 분야에서 통상의 당업자가 일반적으로 이해하는 바와 같은 의미로 사용된다. 본 명세서에 참고문헌으로 기재되는 모든 간행물의 내용은 본 발명에 도입된다.

Claims (31)

  1. 개인 유전체 염기서열 정보로부터 소정 약물 또는 약물군의 약력학(pharmaco-dynamics) 또는 약동학(pharmaco-kinetics)에 관여하는 하나 이상의 유전자 염기서열 변이 정보를 결정하는 단계;
    상기 유전자 염기서열 변이 정보를 이용하여 개인별 단백질 손상 점수를 산출하는 단계; 및
    상기 개인별 단백질 손상 점수를 약물과 단백질 사이의 상호 관계와 연관지어 개인별 약물 점수를 산출하는 단계를 포함하는, 개인 유전체 염기서열 변이를 이용한 맞춤형 약물 선택을 위한 정보를 제공하는 방법.
  2. 제 1 항에 있어서,
    상기 유전자 염기서열 변이 정보는 유전자의 엑손(exon)을 구성하는 염기의 치환, 부가 또는 결실인, 개인 유전체 염기서열 변이를 이용한 맞춤형 약물 선택을 위한 정보를 제공하는 방법.
  3. 제 2 항에 있어서,
    상기 염기의 치환, 부가 또는 결실은 염색체의 절단, 결실, 중복, 역위 또는 전좌를 포함하는 구조적 이상에 의한 것인, 개인 유전체 염기서열 변이를 이용한 맞춤형 약물 선택을 위한 정보를 제공하는 방법.
  4. 제 1 항에 있어서,
    상기 단백질 손상 점수 또는 상기 약물 점수는 SIFT (Sorting Intolerant From Tolerant), PolyPhen (Polymorphism Phenotyping), PolyPhen-2, MAPP (Multivariate Analysis of Protein Polymorphism), Logre (Log R Pfam E-value), MutationAssessor, MutationTaster, MutationTaster2, PROVEAN (Protein Variation Effect Analyzer), PMut, Condel, GERP (Genomic Evolutionary Rate Profiling), GERP++, CEO (Combinatorial Entropy Optimization), SNPeffect, fathmm, 및 CADD (Combined Annotation-Dependent Depletion)로 이루어진 군에서 선택된 하나 이상의 알고리즘을 이용하여 산출된 하나 이상의 유전자 염기서열 변이 점수로부터 산출되는 것인, 개인 유전체 염기서열 변이를 이용한 맞춤형 약물 선택을 위한 정보를 제공하는 방법.
  5. 제 1 항에 있어서,
    상기 단백질 손상 점수 또는 약물 점수는, 유전자 염기서열 변이 점수로부터 산출되는 것인, 개인 유전체 염기서열 변이를 이용한 맞춤형 약물 선택을 위한 정보를 제공하는 방법.
  6. 제 5 항에 있어서,
    상기 유전자 염기서열 변이 점수는 SIFT (Sorting Intolerant From Tolerant), PolyPhen (Polymorphism Phenotyping), PolyPhen-2, MAPP (Multivariate Analysis of Protein Polymorphism), Logre (Log R Pfam E-value), MutationAssessor, MutationTaster, MutationTaster2, PROVEAN (Protein Variation Effect Analyzer), PMut, Condel, GERP (Genomic Evolutionary Rate Profiling), GERP++, CEO (Combinatorial Entropy Optimization), SNPeffect, fathmm, 및 CADD (Combined Annotation-Dependent Depletion)로 이루어진 군에서 선택된 하나 이상의 알고리즘을 유전자 염기서열 변이에 적용하여 산출되는 것인, 개인 유전체 염기서열 변이를 이용한 맞춤형 약물 선택을 위한 정보를 제공하는 방법.
  7. 제 1 항에 있어서,
    상기 단백질 손상 점수는, 단백질을 코딩하는 유전자에서 발견되는 분석대상 염기서열 변이가 두 개 이상인 경우, 상기 유전자 염기서열 변이 점수들의 평균값으로 산출되는 것인, 개인 유전체 염기서열 변이를 이용한 맞춤형 약물 선택을 위한 정보를 제공하는 방법.
  8. 제 7 항에 있어서,
    상기 평균값은 기하평균, 산술평균, 조화평균, 산술기하평균, 산술조화평균, 기하조화평균, 피타고라스 평균, 헤론 평균, 역조화평균, 평균제곱근편차, 센트로이드 평균, 사분평균, 이차평균, 절삭평균, 윈저화 평균, 가중평균, 가중기하평균, 가중산술평균, 가중조화평균, 함수의 평균, 멱평균, 일반화된 f-평균, 백분위수, 최대값, 최소값, 최빈값, 중앙값, 중앙범위, 중심경향도(measures of central tendency), 단순 곱 및 가중 곱으로 이루어진 군으로부터 선택된 하나 이상에 의해 계산되는 것인, 개인 유전체 염기서열 변이를 이용한 맞춤형 약물 선택을 위한 정보를 제공하는 방법.
  9. 제 1 항에 있어서,
    상기 단백질 손상 점수는 하기 수학식 1에 의해 산출되는 것인, 개인 유전체 염기서열 변이를 이용한 맞춤형 약물 선택을 위한 정보를 제공하는 방법.
    [수학식 1]
    Figure PCTKR2014007685-appb-I000003
    상기 수학식 1에서 Sg는 유전자 g가 코딩하는 단백질의 단백질 손상 점수, n은 상기 유전자 g의 염기서열 변이 중 분석대상 염기서열 변이의 수, vi는 i 번째 염기서열 변이의 유전자 염기서열 변이 점수이며, p는 0이 아닌 실수임.
  10. 제 1 항에 있어서,
    상기 단백질 손상 점수는 하기 수학식 2에 의해 산출되는 것인, 개인 유전체 염기서열 변이를 이용한 맞춤형 약물 선택을 위한 정보를 제공하는 방법.
    [수학식 2]
    Figure PCTKR2014007685-appb-I000004
    상기 수학식 2에서 Sg는 유전자 g가 코딩하는 단백질의 단백질 손상 점수, n은 상기 유전자 g의 염기서열 변이 중 분석대상 염기서열 변이의 수, vi는 i 번째 염기서열 변이의 유전자 염기서열 변이 점수이며, wi는 상기 i 번째 염기서열 변이의 유전자 염기서열 변이 점수 vi에 부여되는 가중치임.
  11. 제 1 항에 있어서,
    상기 약물 점수는, 소정 약물 또는 약물군의 약력학 또는 약동학에 관여하는 단백질의 손상이 두 개 이상인 경우, 단백질 손상 점수들의 평균값으로 산출되는 것인, 개인 유전체 염기서열 변이를 이용한 맞춤형 약물 선택을 위한 정보를 제공하는 방법.
  12. 제 11 항에 있어서,
    상기 평균값은 기하평균, 산술평균, 조화평균, 산술기하평균, 산술조화평균, 기하조화평균, 피타고라스 평균, 헤론 평균, 역조화평균, 평균제곱근편차, 센트로이드 평균, 사분평균, 이차평균, 절삭평균, 윈저화 평균, 가중평균, 가중기하평균, 가중산술평균, 가중조화평균, 함수의 평균, 멱평균, 일반화된 f-평균, 백분위수, 최대값, 최소값, 최빈값, 중앙값, 중앙범위, 중심경향도(measures of central tendency), 단순 곱 및 가중 곱으로 이루어진 군으로부터 선택된 하나 이상에 의해 계산되는 것인, 개인 유전체 염기서열 변이를 이용한 맞춤형 약물 선택을 위한 정보를 제공하는 방법.
  13. 제 1 항에 있어서,
    상기 약물 점수는 하기 수학식 3에 의해 산출되는 것인, 개인 유전체 염기서열 변이를 이용한 맞춤형 약물 선택을 위한 정보를 제공하는 방법.
    [수학식 3]
    Figure PCTKR2014007685-appb-I000005
    상기 수학식 3에서 Sd는 약물 d의 약물 점수, n은 상기 약물 d의 약력학 또는 약동학에 관여하는 하나 이상의 유전자가 코딩하는 단백질의 수, gi는 상기 약물 d의 약력학 또는 약동학에 관여하는 하나 이상의 유전자가 코딩하는 단백질 손상 점수이며, p는 0이 아닌 실수임.
  14. 제 1 항에 있어서,
    상기 약물 점수는 하기 수학식 4에 의해 산출되는 것인, 개인 유전체 염기서열 변이를 이용한 맞춤형 약물 선택을 위한 정보를 제공하는 방법.
    [수학식 4]
    Figure PCTKR2014007685-appb-I000006
    상기 수학식 4에서 Sd는 약물 d의 산출된 약물 점수, n은 상기 약물 d의 약력학 또는 약동학에 관여하는 하나 이상의 유전자가 코딩하는 단백질의 수, gi는 상기 약물 d의 약력학 또는 약동학에 관여하는 하나 이상의 유전자가 코딩하는 단백질의 단백질 손상 점수이며, wi는 상기 약물 d의 약력학 또는 약동학에 관여하는 하나 이상의 유전자가 코딩하는 단백질의 단백질 손상점수 gi에 부여되는 가중치임.
  15. 제 1 항에 있어서,
    상기 단백질 손상 점수 또는 약물 점수는 해당 단백질의 종류, 해당 단백질의 약동학적 또는 약력학적 분류, 해당 약물 효소 단백질의 약동학 파라미터, 인구 집단, 또는 인종별 분포를 고려하여 결정된 값으로 가중치를 부여하여 산출되는 것인, 개인 유전체 염기서열 변이를 이용한 맞춤형 약물 선택을 위한 정보를 제공하는 방법.
  16. 제 1 항에 있어서,
    상기 방법은 상기 개인별 약물 점수를 이용하여 상기 개인에 대해 적용되는 약물 간의 우선순위를 결정하는 단계; 또는
    상기 개인별 약물 점수를 이용하여 상기 개인에 적용되는 약물의 사용 여부를 결정하는 단계;를 추가로 포함하는, 개인 유전체 염기서열 변이를 이용한 맞춤형 약물 선택을 위한 정보를 제공하는 방법.
  17. 제 1 항에 있어서,
    상기 소정 약물 또는 약물군은 사용자가 입력한 정보, 처방전으로부터 입력된 정보 또는 소정 질환에 치료효과가 있는 약물에 대한 정보를 포함하는 데이터베이스로부터 입력된 정보인, 개인 유전체 염기서열 변이를 이용한 맞춤형 약물 선택을 위한 정보를 제공하는 방법.
  18. 제 1 항에 있어서,
    상기 유전자 염기서열 변이 정보는 참조군의 유전체 염기서열과의 비교 분석을 통해 수득되는 것인, 개인 유전체 염기서열 변이를 이용한 맞춤형 약물 선택을 위한 정보를 제공하는 방법.
  19. 제 1 항에 있어서,
    상기 방법은 상기 소정 약물 또는 약물군의 약력학 또는 약동학에 관여하는 유전자의 염기서열 변이 정보를 컴퓨터 시스템으로 접수하는 단계를 추가로 포함하며,
    상기 컴퓨터 시스템은 상기 소정 약물 또는 약물군의 약력학 또는 약동학에 관여하는 유전자 정보를 포함하는 데이터베이스를 포함하거나 또는 상기 데이터베이스에 접근 가능한 것인, 개인 유전체 염기서열 변이를 이용한 맞춤형 약물 선택을 위한 정보를 제공하는 방법.
  20. 제 1 항에 있어서,
    상기 방법은 처방 점수를 산출하는 단계를 추가로 포함하는, 개인 유전체 염기서열 변이를 이용한 맞춤형 약물 선택을 위한 정보를 제공하는 방법.
  21. 제 20 항에 있어서,
    상기 처방 점수는 상기 약물 간의 우선순위에 의해 결정된 약물이 두 개 이상이고 동시 투약이 필요한 경우, 상기 각 약물에 대하여 결정된 약물 점수를 종합하여 산출되는 것인, 개인 유전체 염기서열 변이를 이용한 맞춤형 약물 선택을 위한 정보를 제공하는 방법.
  22. 제 1 항에 있어서,
    상기 방법은 유전자 염기서열 변이 정보, 단백질 손상 점수, 약물 점수 및 그 산출에 사용된 정보로 이루어진 군으로부터 선택된 하나 이상의 정보를 제공하는 단계를 추가로 포함하는, 개인 유전체 염기서열 변이를 이용한 맞춤형 약물 선택을 위한 정보를 제공하는 방법.
  23. 제 1 항 내지 제 22 항 중 어느 한 항에 있어서,
    상기 방법은 약물 부작용 방지를 목적으로 수행되는 것을 특징으로 하는, 개인 유전체 염기서열 변이를 이용한 맞춤형 약물 선택을 위한 정보를 제공하는 방법.
  24. 개인에 대해 적용대상이 되는 약물 또는 약물군에 대하여, 상기 약물 또는 약물군과 관련된 유전자 또는 단백질과 관련된 정보 검색 또는 추출이 가능한 데이터베이스;
    상기 데이터베이스에 접근 가능한 통신부;
    상기 정보에 기초하여 상기 약물 또는 약물군의 약력학 또는 약동학에 관여하는 하나 이상의 유전자 염기서열 변이 정보를 산출하는 제1 산출모듈;
    상기 유전자 염기서열 변이 정보를 이용하여 개인별 단백질 손상 점수를 산출하는 제2 산출모듈;
    상기 개인별 단백질 손상 점수를 약물과 단백질 사이의 상호 관계와 연관지어 개인별 약물 점수를 산출하는 제3 산출모듈; 및
    상기 산출모듈에서 산출된 산출값을 표시하는 표시부를 포함하는, 개인 유전체 염기서열 변이를 이용한 맞춤형 약물 선택 시스템.
  25. 제 24 항에 있어서,
    상기 시스템은 상기 제3 산출모듈에서 산출된 상기 개인별 약물 점수를 이용하여 상기 개인에 대해 적용되는 약물 간의 우선순위를 산출; 또는 상기 개인별 약물 점수를 이용하여 상기 개인에 적용되는 약물의 사용 여부를 결정;하는 제4 산출모듈을 추가로 포함하는, 개인 유전체 염기서열 변이를 이용한 맞춤형 약물 선택 시스템.
  26. 제 24 항에 있어서,
    상기 시스템은 상기 약물 간의 우선순위에 의해 결정된 약물이 두 개 이상이고 동시 투약이 필요한 경우, 상기 각 약물에 대하여 결정된 상기 약물 점수를 종합하여 처방 점수를 산출하는 제5 산출모듈을 추가로 포함하는, 개인 유전체 염기서열 변이를 이용한 맞춤형 약물 선택 시스템.
  27. 제 24 항에 있어서,
    상기 시스템은 사용자에 의한 약물 또는 약물군 목록의 입력에 따라 상기 약물 또는 약물군의 약물 점수를 산출하여 제공하는 사용자 인터페이스를 추가로 포함하는, 개인 유전체 염기서열 변이를 이용한 맞춤형 약물 선택 시스템.
  28. 제 24 항에 있어서,
    상기 표시부는 상기 각 산출모듈에서 산출된 값, 계산 과정, 또는 상기 계산의 기초가 된 정보를 추가로 표시하는 표시부를 추가로 포함하는, 개인 유전체 염기서열 변이를 이용한 맞춤형 약물 선택 시스템.
  29. 제 24 항 내지 제 28 항 중 어느 한 항에 있어서,
    상기 각 산출모듈은 상기 유전자 염기서열 변이 정보, 단백질 손상 점수, 약물 점수 및 그 산출의 근거가 되는 정보가 저장되며,
    상기 데이터베이스의 갱신에 따라 상기 각 산출모듈의 정보가 갱신되는, 개인 유전체 염기서열 변이를 이용한 맞춤형 약물 선택 시스템.
  30. 하기 프로세서를 실행시키는 실행모듈을 포함하는 컴퓨터 판독 가능한 매체:
    개인 유전체 염기서열 정보로부터 소정 약물 또는 약물군의 약력학 또는 약동학에 관여하는 하나 이상의 유전자 염기서열 변이 정보를 입수하는 단계;
    상기 유전자 염기서열 변이 정보를 이용하여 개인별 단백질 손상 점수를 산출하는 단계; 및
    상기 개인별 단백질 손상 점수를 약물과 단백질 사이의 상호 관계와 연관지어 개인별 약물 점수를 산출하는 단계를 포함하는 동작을 수행하는 프로세서.
  31. 제 30 항에 있어서,
    상기 프로세서는 상기 개인별 약물 점수를 이용하여 상기 개인에 대해 적용되는 약물 간의 우선순위를 결정하는 단계; 또는 상기 개인별 약물 점수를 이용하여 상기 개인에 적용되는 약물의 사용 여부를 결정하는 단계;를 추가로 포함하는, 컴퓨터 판독가능한 매체.
PCT/KR2014/007685 2013-08-19 2014-08-19 약물 부작용 방지를 위한 개인별 단백질 손상 정보 기반의 약물 선택 방법 및 시스템 WO2015026135A1 (ko)

Priority Applications (8)

Application Number Priority Date Filing Date Title
EP14838351.6A EP3037548B1 (en) 2013-08-19 2014-08-19 Method and system for selecting drug on basis of individual protein damage information for preventing side effects of drug
CN201480046187.7A CN105940114B (zh) 2013-08-19 2014-08-19 药物选择的计算机可读介质及系统
EP19153339.7A EP3495504B1 (en) 2013-08-19 2014-08-19 Method and system for selecting drug on basis of individual protein damage information for preventing side effects of drug
US14/912,397 US10950326B2 (en) 2013-08-19 2014-08-19 Method for personalized selection of a drug for a subject
JP2016536029A JP6266110B2 (ja) 2013-08-19 2014-08-19 薬物副作用防止のための個人別たんぱく質損傷情報基盤の薬物選択方法及びシステム
ES14838351T ES2720999T3 (es) 2013-08-19 2014-08-19 Método y sistema para seleccionar un fármaco sobre la base de la información del daño de proteína individual para prevenir los efectos secundarios de un fármaco
US15/707,818 US20180068056A1 (en) 2013-08-19 2017-09-18 Method and system for selecting drug on basis of individual protein damage information for preventing side effects of drug
US17/200,447 US20210241849A1 (en) 2013-08-19 2021-03-12 Method for personalized selection of a drug for a subject

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR20130097651 2013-08-19
KR10-2013-0097651 2013-08-19

Related Child Applications (3)

Application Number Title Priority Date Filing Date
US14/912,397 A-371-Of-International US10950326B2 (en) 2013-08-19 2014-08-19 Method for personalized selection of a drug for a subject
US15/707,818 Continuation US20180068056A1 (en) 2013-08-19 2017-09-18 Method and system for selecting drug on basis of individual protein damage information for preventing side effects of drug
US17/200,447 Continuation US20210241849A1 (en) 2013-08-19 2021-03-12 Method for personalized selection of a drug for a subject

Publications (1)

Publication Number Publication Date
WO2015026135A1 true WO2015026135A1 (ko) 2015-02-26

Family

ID=52483861

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/KR2014/007685 WO2015026135A1 (ko) 2013-08-19 2014-08-19 약물 부작용 방지를 위한 개인별 단백질 손상 정보 기반의 약물 선택 방법 및 시스템

Country Status (7)

Country Link
US (3) US10950326B2 (ko)
EP (2) EP3495504B1 (ko)
JP (1) JP6266110B2 (ko)
KR (1) KR101524562B1 (ko)
CN (2) CN105940114B (ko)
ES (2) ES2720999T3 (ko)
WO (1) WO2015026135A1 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017100794A1 (en) * 2015-12-12 2017-06-15 Cipherome, Inc. Computer-implemented evaluaton of drug safety for a population

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11195594B2 (en) 2015-02-17 2021-12-07 Cipherome, Inc. Method for selecting anticancer agent based on protein damage information of individual to prevent anticancer agent side effects
US10395759B2 (en) 2015-05-18 2019-08-27 Regeneron Pharmaceuticals, Inc. Methods and systems for copy number variant detection
WO2017074036A2 (ko) * 2015-10-26 2017-05-04 주식회사 싸이퍼롬 암 환자의 유전체 염기서열 변이 정보와 생존 정보를 이용한 맞춤형 약물 선택 방법 및 시스템
CN108475300B (zh) * 2015-10-26 2024-01-23 爱富体人 利用癌症患者的基因组碱基序列突变信息和生存信息的定制型药物选择方法及系统
CN115273970A (zh) 2016-02-12 2022-11-01 瑞泽恩制药公司 用于检测异常核型的方法和系统
KR102188376B1 (ko) * 2017-04-25 2020-12-08 주식회사 싸이퍼롬 암 유전체 염기서열 변이, 전사체 발현 및 환자 생존 정보를 이용한 맞춤형 항암 치료 방법 및 시스템
CN107463764A (zh) * 2017-06-16 2017-12-12 康美健康云服务有限公司 一种基于遗传信息的患者用药指导方法及系统
CN107516013B (zh) * 2017-08-25 2020-01-07 上海中医药大学附属岳阳中西医结合医院 一种通过疗效三角形进行药物优选的方法及系统
US11227692B2 (en) * 2017-12-28 2022-01-18 International Business Machines Corporation Neuron model simulation
CN108682458A (zh) * 2018-05-08 2018-10-19 北京岙特杰诺生物科技有限公司 用药管理方法、装置及电子设备
US20210198629A1 (en) * 2018-08-20 2021-07-01 University Of Georgia Research Foundation, Inc. Compositions and methods for increasing beiging of white adipose tissue
JP2021073890A (ja) * 2019-11-07 2021-05-20 公立大学法人名古屋市立大学 薬効予測用バイオマーカー、薬効予測用試薬、薬効予測用キット、薬効予測方法、組織液の回収能推測用バイオマーカー、組織液の回収能推測用試薬、組織液の回収能推測用キット、組織液の回収能推測方法
KR20210083080A (ko) 2019-12-26 2021-07-06 서울대학교병원 상호 협력적 암 치료제 반응 예측 유전자 쌍을 선별하는 방법
KR20230129760A (ko) 2022-03-02 2023-09-11 (주)인트젠 유전체 기반 약물 선택 및 부작용 예측 시스템, 그리고 이를 통한 유전체 기반 약물 선택 및 위험성 예측 정보제공 방법
TWI812056B (zh) * 2022-03-10 2023-08-11 宏碁股份有限公司 檢查藥物相互作用的方法和電子裝置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20040103514A (ko) * 2003-05-29 2004-12-09 주식회사 비즈모델라인 개인 특성 정보를 이용한 서비스 제공 방법 및 시스템
KR20070111475A (ko) 2005-01-04 2007-11-21 노파르티스 아게 만성 변비 환자에서 테가세로드의 효능을 확인하기 위한바이오마커
US20110230360A1 (en) * 2008-09-05 2011-09-22 Aueon ,Inc. a corporation Methods for stratifying and annotating cancer drug treament options
US20120016594A1 (en) * 2010-07-02 2012-01-19 Coriell Institute For Medical Research, Inc. Method for translating genetic information for use in pharmacogenomic molecular diagnostics and personalized medicine research

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070299646A1 (en) * 2001-04-13 2007-12-27 Yvan Chemama Method for constructing, representing or displaying protein interaction maps and data processing tool using this method
US20030096264A1 (en) * 2001-06-18 2003-05-22 Psychiatric Genomics, Inc. Multi-parameter high throughput screening assays (MPHTS)
JP5123936B2 (ja) * 2006-05-30 2013-01-23 メイヨ・ファウンデーション・フォー・メディカル・エデュケーション・アンド・リサーチ 認知症の検出および治療
NZ597655A (en) * 2009-07-08 2013-05-31 Worldwide Innovative Network Method for predicting efficacy of drugs in a patient
US20120310539A1 (en) * 2011-05-12 2012-12-06 University Of Utah Predicting gene variant pathogenicity
EP2723888B1 (en) 2011-06-23 2017-01-11 Chang Gung Medical Foundation Chang Gung Memorial Hospital at Keelung Risk assessment for phenytoin-induced adverse drug reactions
US20130184999A1 (en) * 2012-01-05 2013-07-18 Yan Ding Systems and methods for cancer-specific drug targets and biomarkers discovery

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20040103514A (ko) * 2003-05-29 2004-12-09 주식회사 비즈모델라인 개인 특성 정보를 이용한 서비스 제공 방법 및 시스템
KR20070111475A (ko) 2005-01-04 2007-11-21 노파르티스 아게 만성 변비 환자에서 테가세로드의 효능을 확인하기 위한바이오마커
US20110230360A1 (en) * 2008-09-05 2011-09-22 Aueon ,Inc. a corporation Methods for stratifying and annotating cancer drug treament options
US20120016594A1 (en) * 2010-07-02 2012-01-19 Coriell Institute For Medical Research, Inc. Method for translating genetic information for use in pharmacogenomic molecular diagnostics and personalized medicine research

Non-Patent Citations (30)

* Cited by examiner, † Cited by third party
Title
ADZHUBEI IA ET AL., NAT METHODS, vol. 7, no. 4, 2010, pages 248 - 249
ADZHUBEI, IA ET AL.: "A method and server for predicting damaging missense mutations", NATURE METHODS, vol. 7, no. 4, 2010, pages 248 - 249, XP055054836, DOI: doi:10.1038/nmeth0410-248
BADER ET AL.: "Biomolecular Interaction Network Database", NUCLEIC ACIDS RES., vol. 31, no. 1, 1 January 2003 (2003-01-01), pages 248 - 50
BAEK, SU YEON: "MedCassandra : Personalized drug and ADR ranking forecast system based on personal genome variations", SEOUL NATIONAL UNIVERSITY GRADUATE SCHOOL MASTER'S DEGREE THESIS, February 2013 (2013-02-01), XP008182957 *
CHEN ET AL., NAT METHODS, vol. 6, no. 9, September 2009 (2009-09-01), pages 677 - 81
CHOI ET AL., PLOS ONE., vol. 7, no. 10, 2012, pages E46688
CLIFFORD R.J ET AL., BIOINFORMATICS, vol. 20, 2004, pages 1006 - 1014
COOPER ET AL.: "Genomic Evolutionary Rate Profiling", GENOME RES., vol. 15, 2005, pages 901 - 913, Retrieved from the Internet <URL:http://mendel.stanford.edu/SidowLab/downloads/gerp>
ERIC A. ET AL.: "Multivariate Analysis of Protein Polymorphism", GENOME RESEARCH, vol. 15, 2005, pages 978 - 986
FERRER-COSTA ET AL., PROTEINS, vol. 57, no. 4, 2004, pages 811 - 819, Retrieved from the Internet <URL:http://mmb.pcb.ub.es/PMut>
GE ET AL., BIOINFORMATICS, vol. 27, no. 14, 2011, pages 1998 - 2000
GONZALEZ-PEREZ A ET AL., THE AMERICAN JOURNAL OF HUMAN GENETICS, vol. 88, 2011, pages 440 - 449, Retrieved from the Internet <URL:http://bg.upf.edu/fannsdb>
GONZALEZ-PEREZ, A.; LOPEZ-BIGAS, N.: "Improving the assessment of the outcome ofnonsynonymous SNVs with a consensus deleteriousness score, Condel", THE AMERICAN JOURNAL OF HUMAN GENETICS, vol. 88, no. 4, 2011, pages 440 - 449
GRAY KA; DAUGHERTY LC; GORDON SM; SEAL RL; WRIGHT MW; BRUFORD EA: "genenames.org: the HGNC resources in 2013", NUCLEIC ACIDS RES., 17 November 2012 (2012-11-17)
HINDORFF ET AL., PROC. NATL. ACAD. SCI., vol. 106, no. 23, 2009, pages 9362 - 9367
JING HUL ET AL., GENOME BIOL., vol. 13, no. 2, 2012, pages R9
JOSHI-TOPE ET AL., NUCLEIC ACIDS RES., vol. 33, 1 January 2005 (2005-01-01), pages D428 - 32
KIM, I. K. ET AL.: "Clinical pharmacogenomics of drug metabolizing enzymes and its clinical application", KOR. J. CLIN. PHARM., vol. 16, no. 2, March 2002 (2002-03-01), pages 155 - 164, XP055318957 *
PAGEL, BIO INFORMATICS, vol. 21, no. 6, 2005, pages 832 - 834
PAULINE C ET AL., GENOME RES., vol. 11, no. 5, May 2001 (2001-05-01), pages 863 - 874
PAULINE C ET AL., GENOME RES., vol. 12, no. 3, March 2002 (2002-03-01), pages 436 - 446
RAMENSKY V ET AL., NUCLEIC ACIDS RES., vol. 30, no. 17, 1 September 2002 (2002-09-01), pages 3894 - 3900
REUMERS ET AL., BIOINFORMATICS, vol. 22, no. 17, 2006, pages 2183 - 2185, Retrieved from the Internet <URL:http://snpeffect.vib.be>
REVA B ET AL., GENOME BIOL., vol. 8, 2007, pages R232, Retrieved from the Internet <URL:http://mutationassessor.org>
REVA ET AL., GENOME BIOL, vol. 8, no. 11, 2007, pages R232
SCHWARZ ET AL.: "MutationTaster2: mutation prediction for the deep-sequencing age", NATURE METHODS, vol. 11, 2014, pages 361 - 362, Retrieved from the Internet <URL:http://www.mutationtaster.org>
See also references of EP3037548A4
SHIHAB ET AL.: "Functional Analysis through Hidden Markov Models", HUM MUTAT, vol. 34, 2013, pages 57 - 65, Retrieved from the Internet <URL:http://fathmm.biocompute.org.uk>
WANG ET AL., NUCLEIC ACIDS RESEARCH, vol. 38, no. 16, 2010, pages EL64
WHIRL-CARRILLO ET AL., CLINICAL PHARMACOLOGY & THERAPEUTICS, vol. 92, no. 4, 2012, pages 414 - 4171

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017100794A1 (en) * 2015-12-12 2017-06-15 Cipherome, Inc. Computer-implemented evaluaton of drug safety for a population
CN109074428A (zh) * 2015-12-12 2018-12-21 塞弗欧米公司 计算机实现的针对群体的药物安全性评估

Also Published As

Publication number Publication date
KR101524562B1 (ko) 2015-06-02
CN105940114A (zh) 2016-09-14
JP2016537734A (ja) 2016-12-01
KR20150021476A (ko) 2015-03-02
US20160210401A1 (en) 2016-07-21
US20210241849A1 (en) 2021-08-05
EP3037548A1 (en) 2016-06-29
ES2832886T3 (es) 2021-06-11
ES2720999T3 (es) 2019-07-26
EP3495504A1 (en) 2019-06-12
CN105940114B (zh) 2020-08-28
EP3037548A4 (en) 2017-03-29
JP6266110B2 (ja) 2018-01-24
CN111710434B (zh) 2021-10-26
EP3495504B1 (en) 2020-10-07
US20180068056A1 (en) 2018-03-08
US10950326B2 (en) 2021-03-16
CN111710434A (zh) 2020-09-25
EP3037548B1 (en) 2019-03-13

Similar Documents

Publication Publication Date Title
WO2015026135A1 (ko) 약물 부작용 방지를 위한 개인별 단백질 손상 정보 기반의 약물 선택 방법 및 시스템
Remmers et al. STAT4 and the risk of rheumatoid arthritis and systemic lupus erythematosus
Yang et al. Genome-wide copy-number-variation study identified a susceptibility gene, UGT2B17, for osteoporosis
Sobreira et al. Patients with a Kabuki syndrome phenotype demonstrate DNA methylation abnormalities
Turner et al. Human genetic disease caused by de novo mitochondrial-nuclear DNA transfer
Choudhry et al. GSNO reductase and β2-adrenergic receptor gene–gene interaction: bronchodilator responsiveness to albuterol
US20080131887A1 (en) Genetic Analysis Systems and Methods
US20110098193A1 (en) Methods and Systems for Medical Sequencing Analysis
Baye et al. Mapping genes that predict treatment outcome in admixed populations
McIver et al. Population-scale analysis of human microsatellites reveals novel sources of exonic variation
Kljuic et al. A nonsense mutation in the desmoglein 1 gene underlies striate keratoderma
Cappellano et al. Variations of the perforin gene in patients with multiple sclerosis
Al Qahtani et al. Whole-genome sequencing reveals exonic variation of ASIC5 gene results in recurrent pregnancy loss
Kronfol et al. Histone acetylation at the sulfotransferase 1a1 gene is associated with its hepatic expression in normal aging
Dagogo-Jack Predicting diabetes: our relentless quest for genomic nuggets
Qiu et al. Genetic polymorphisms, messenger RNA expression of p53, p21, and CCND1, and possible links with chromosomal aberrations in Chinese vinyl chloride–exposed workers
WO2016133373A1 (ko) 항암제 부작용 방지를 위한 개인별 단백질 손상 정보 기반의 항암제 선택 방법
WO2016133374A1 (ko) 자궁수축억제제 부작용 방지를 위한 개인별 단백질 손상 정보 기반의 자궁수축억제제 선택 방법
Lehrer et al. BIN1 rs744373 SNP and COVID‑19 mortality
Jiao et al. Tri-allelic patterns of STRs and partially homologous non-sister chromatid crossover observed in a parentage test
Yang et al. Assessment of a novel variation in DHODH gene causing Miller syndrome: The first report in Chinese population
Zainabadi et al. One in four individuals of African-American ancestry harbors a 5.5 ákb deletion at chromosome 11q13. 1
Yang et al. MPDA: microarray pooled DNA analyzer
Wang et al. Host Genetic Characters of Acute Exacerbation of Chronic Hepatitis B (AECHB)
WO2016133375A1 (ko) 골다공증 치료제 부작용 방지를 위한 개인별 단백질 손상 정보 기반의 골다공증 치료제 선택 방법

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 14838351

Country of ref document: EP

Kind code of ref document: A1

WWE Wipo information: entry into national phase

Ref document number: 14912397

Country of ref document: US

ENP Entry into the national phase

Ref document number: 2016536029

Country of ref document: JP

Kind code of ref document: A

NENP Non-entry into the national phase

Ref country code: DE

WWE Wipo information: entry into national phase

Ref document number: 2014838351

Country of ref document: EP