WO2017086675A1 - 대사 이상 질환 진단 장치 및 그 방법 - Google Patents

대사 이상 질환 진단 장치 및 그 방법 Download PDF

Info

Publication number
WO2017086675A1
WO2017086675A1 PCT/KR2016/013131 KR2016013131W WO2017086675A1 WO 2017086675 A1 WO2017086675 A1 WO 2017086675A1 KR 2016013131 W KR2016013131 W KR 2016013131W WO 2017086675 A1 WO2017086675 A1 WO 2017086675A1
Authority
WO
WIPO (PCT)
Prior art keywords
disease
metabolite
gene
genetic
concentration
Prior art date
Application number
PCT/KR2016/013131
Other languages
English (en)
French (fr)
Inventor
이경아
김종원
박인호
Original Assignee
연세대학교 산학협력단
사회복지법인 삼성생명공익재단
에스디지노믹스 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 연세대학교 산학협력단, 사회복지법인 삼성생명공익재단, 에스디지노믹스 주식회사 filed Critical 연세대학교 산학협력단
Publication of WO2017086675A1 publication Critical patent/WO2017086675A1/ko

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N27/00Investigating or analysing materials by the use of electric, electrochemical, or magnetic means
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B50/00ICT programming tools or database systems specially adapted for bioinformatics
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B50/00ICT programming tools or database systems specially adapted for bioinformatics
    • G16B50/10Ontologies; Annotations
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B50/00ICT programming tools or database systems specially adapted for bioinformatics
    • G16B50/20Heterogeneous data integration
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16ZINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS, NOT OTHERWISE PROVIDED FOR
    • G16Z99/00Subject matter not provided for in other main groups of this subclass

Definitions

  • the present invention relates to an apparatus and method for diagnosing metabolic disorders.
  • Congenital metabolic disorders are diseases caused by mutations in specific genes, causing problems in the biochemical metabolic pathways involved in the genes, resulting in accumulation of toxic precursors in the body or insufficient production of essential metabolites. Most of these congenital metabolic disorders cause a fatal problem in the human body when the diagnosis is delayed, so it is necessary to examine the disease so that it can be diagnosed and prevented early.
  • Tandem mass spectrometry first puts samples taken from the blood samples collected from the body into tandem mass spectrometers (MS / MS) to measure the concentration of metabolites in the sample, and the concentration of each metabolite is abnormal. This is how you check.
  • MS / MS tandem mass spectrometers
  • the genome sequencing method is a method of detecting gene mutations present in various genes related to metabolic diseases or genetic diseases, and searching the gene mutation database to determine whether the detected gene mutations are related to a specific metabolic abnormality disease.
  • it is difficult to determine whether or not the large number of detected gene variants actually have clinical significance.
  • no previously reported reference data can be found for the detected genetic variation, resulting in a clinically uncertain Variant of Uncertain Significance.
  • it is difficult to specify as a disease because is detected.
  • the problem to be solved by the present invention is an apparatus and method for testing metabolic disorders for a sample by using the integrated information of the concentration information of metabolites used by mass spectrometry based on the genetic variation information used by the gene sequencing method To provide.
  • the metabolic disorders testing device the metabolite concentration value for each metabolite for a sample is input, and the received metabolite concentration and the standard concentration for each metabolite
  • a metabolite concentration abnormality determining unit for determining an abnormality of the metabolite concentration in comparison, a metabolite-related disease selection unit for selecting a metabolite-related disease corresponding to the metabolite having an abnormality in the metabolite concentration
  • a gene state classification unit for receiving gene mutation data including information on the detected gene mutations for the specimen, and classifying the gene mutations into any one of a plurality of predetermined gene states;
  • a gene associated disease selection unit for selecting a gene associated disease corresponding to the above, and the selection
  • a disease included in the metabolic-associated disease or gene-associated disease is set as a candidate disease, and whether the candidate disease corresponds to a metabolic abnormality disease of the specimen according to the type of the genetic state of the genetic variation corresponding to the candidate disease; It may include
  • the apparatus for detecting metabolic disorders may further include a genetic variation detection unit configured to receive gene sequence information data, detect the genetic variation, classify the type of variation, and generate the genetic variation data.
  • a genetic variation detection unit configured to receive gene sequence information data, detect the genetic variation, classify the type of variation, and generate the genetic variation data.
  • the metabolite concentration abnormality determining unit may be characterized in that the abnormal label of the metabolite concentration according to the increase or decrease of the concentration by comparing the metabolite concentration with the reference concentration.
  • the metabolite-associated disease selection unit may search for and select the metabolite-associated disease corresponding to the abnormal label of the determined metabolite concentration by referring to the metabolite-metabolism association database.
  • the genetic state classification unit may include a filtering unit that performs filtering on the genetic variation to classify the genetic state by removing the genetic variation corresponding to simple polymorphism from the received genetic variation data. can do.
  • the genetic state classification unit may include a selection unit that receives a selection input of a user and accordingly selects the genetic variation to classify the genetic state among the genetic variation data.
  • the genetic state classification unit classifies each of the gene variants included in the gene mutation data into any one of the gene states, and classifies at least one or more of the gene states according to the nucleotide sequence variation or the gene states according to the gene copy number variation. It may include a variant classification unit.
  • variant classifier classifies the gene state according to the nucleotide sequence mutations for the gene mutation, homozygous, heterozygote, bi-allelic variants, complex heterojunction heterozygote) may be characterized as being classified into at least one or more.
  • variant classification unit classifies the gene state according to the gene copy number variation for the gene mutation, but increases the number of copies, no copy number variation, heterozygote deletion, homozygote deletion, and unit price. Characterized by at least one or more of the deletion (hemizygote deletion).
  • the genetic associated disease selection unit may search for and select the genetic associated disease corresponding to the genetic variation classified with the genetic state by referring to a genetic variation database.
  • the gene associated disease selection unit may set the selection accuracy of the selected gene associated diseases according to the type of the genetic state of the genetic mutation corresponding to the selected gene associated diseases.
  • the gene associated disease selection unit may include a homozygous compound, a heterozygote compound, a homozygote deletion, and a unit price of the gene state of the gene mutation corresponding to the selected gene associated disease.
  • the selection accuracy may be set according to whether at least one of the hemizygote deletions is included, or the number of selected genetic diseases.
  • the integrated analysis unit uses the information on the type of the genetic state of the genetic variation corresponding to the candidate disease and information on whether the candidate disease corresponds to the metabolite-associated disease or the gene-associated disease.
  • the information on whether the candidate disease corresponds to the metabolic abnormality disease of the sample may be determined.
  • the integrated analysis unit is configured to determine whether the candidate disease corresponds to all or one of the metabolic-associated diseases or gene-associated diseases, and information on the type of the genetic state of the genetic mutation corresponding to the candidate disease.
  • the information may be calculated to calculate a matching score regarding whether the candidate disease corresponds to a metabolic disorder of the specimen.
  • the integrated analysis unit is configured to determine whether the candidate disease corresponds to all or one of the metabolic-associated diseases or gene-associated diseases, and information on the type of the genetic state of the genetic mutation corresponding to the candidate disease.
  • the information about the metabolic disorder may be set to determine whether the candidate disease corresponds to the metabolic disorder of the specimen.
  • the integrated analysis unit may determine the metabolic abnormality disease for the sample according to the information on whether the candidate disease corresponds to the metabolic abnormality disease of the sample.
  • the metabolic disorders test method the metabolite concentration value for each metabolite for a sample is input, and the received metabolite concentration and the metabolite concentration according to the standard concentration
  • a gene associated disease selection step of selecting a gene associated disease corresponding to A disease included in the selected metabolic-associated disease or gene-associated disease is set as a candidate disease, and the candidate disease is determined by the metabolic disorder of the sample according to the type of the genetic state of the genetic variation corresponding to the candidate disease. It may include an integrated
  • the metabolite concentration may be compared with the reference concentration, and the abnormal label of the metabolite concentration may be determined according to whether the concentration is increased or decreased.
  • the metabolite-associated disease selection step may be performed by searching for the metabolite-associated disease corresponding to the abnormal label of the determined metabolite concentration by referring to a metabolite-metabolism association database.
  • the genetic state classification step is a filtering step of performing filtering on the genetic variation to classify the genetic state by removing the genetic variation corresponding to simple polymorphism from the received genetic variation data, and the gene And classifying each of the gene variants included in the mutation data into any one of the gene states, and classifying at least one or more of the gene states according to the nucleotide sequence variation or the gene state according to the number of gene duplications. have.
  • the integrated analysis step includes information on the type of the genetic state of the genetic variation corresponding to the candidate disease, and whether the candidate disease corresponds to all of the metabolite-associated disease or the gene-associated disease or whether one corresponds to either. Using at least one information, it may be characterized by setting at least one or more of a matching score or whether the candidate disease corresponds to the metabolic disorder of the sample or the screening accuracy of the metabolic disorder.
  • an apparatus for detecting metabolic disorders and a method thereof which can be used to more accurately diagnose metabolic disorders in a sample by using a metabolic concentration abnormality-based analysis method and a genomic variation-based analysis method. There is.
  • FIG. 1 is a block diagram of a metabolic disorder disease testing apparatus according to the present invention.
  • FIG. 2 is a reference diagram showing that metabolic disorders are associated with metabolite concentration abnormality labels and genes.
  • 3A is a reference diagram illustrating an example in which the metabolite-metabolism association database 10 stores metabolite-associated diseases corresponding to labels of metabolite concentration abnormalities in the form of a table.
  • FIG. 3B is a reference diagram illustrating an example in which the gene variation database 10 stores gene-associated diseases corresponding to each gene in the form of a table.
  • FIG. 4 is a reference diagram for explaining operations of the metabolite concentration abnormality determiner 100 and the metabolite-associated disease selection unit 200.
  • 5 is a detailed block diagram of the gene mutation detection unit 50.
  • FIG. 6 is a reference diagram showing gene variation data including information on gene variation in a table form.
  • FIG. 7 is a detailed block diagram of the gene status classification unit 300.
  • FIG. 8 is a reference diagram for explaining the operation of the gene status classification unit 300 and the gene associated disease selection unit 400.
  • 9 is a reference diagram illustrating an example of an analysis result of the integrated analyzer 500.
  • FIG. 10 is a flowchart of a metabolic disorder disease test method according to the present invention.
  • 11 is a detailed flowchart of the gene status classification step S300.
  • FIG. 12 illustrates a table used for selecting a gene-associated disease according to an embodiment of the present invention.
  • FIG. 13 is a table illustrating a method for integrated analysis of metabolite concentration abnormality and variation information according to an embodiment of the present invention.
  • the metabolite concentration value of each metabolite for a sample is input, and the metabolite concentration is compared with the reference concentration for each metabolite to determine whether the metabolite concentration is abnormal.
  • Metabolite concentration abnormality determination unit for determining, metabolite-associated disease selection unit for selecting a metabolite-related disease corresponding to the metabolite, which is determined to have an abnormality in the metabolite concentration, and related to the genetic variation detected for the sample
  • Gene status classification unit for receiving the genetic variation data including information, classifying the genetic variation into any one of a plurality of predetermined genetic state, the gene for selecting a gene-associated disease corresponding to the genetic variation in which the genetic state is classified Associated disease selector and the selected metabolic associated disease or gene
  • a disease included in the vascular disease is set as a candidate disease, and information about whether the candidate disease corresponds to metabolic abnormality of the specimen is determined according to the type of the genetic state of the genetic variation corresponding to the candidate disease. It may include an integrated analysis unit.
  • the metabolite concentration value for each metabolite for a sample is input, and the metabolite concentration is compared with the reference concentration for each metabolite to determine whether the metabolite concentration is abnormal.
  • Genetic status classification step of receiving the genetic variation data including information, classifying the genetic variation into any one of a plurality of predetermined genetic state, gene for selecting a gene-associated disease corresponding to the genetic variation in which the genetic state is classified Associated disease screening step and the selected metabolic disease associated disease or A disease included in the gene-associated disease is set as a candidate disease, and information about whether the candidate disease corresponds to metabolic abnormality disease of the specimen is determined according to the type of the genetic state of the genetic variation corresponding to the candidate disease. It may include an integrated analysis step.
  • Congenital metabolic disorders are diseases caused by mutations in specific genes, causing problems in the biochemical metabolic pathways involved in the genes, resulting in accumulation of toxic precursors in the body or insufficient production of essential metabolites. Most of these congenital metabolic disorders cause a fatal problem in the human body when the diagnosis is delayed, so it is necessary to examine the disease so that it can be diagnosed and prevented early. In particular, it is important to screen correctly for the presence of congenital metabolic disorders in newborns.
  • tandem mass spectrometry analyzes a sample taken from blood samples collected from the body using a tandem mass spectrometer (MS / MS) to determine the concentration of metabolites present in the sample, How to check if the concentration is abnormal.
  • MS / MS tandem mass spectrometer
  • one metabolite determined to be above a concentration may be associated with various kinds of metabolic diseases, which makes it difficult to accurately determine metabolic diseases.
  • the genome sequencing method detects genetic variations present in various genes related to metabolic diseases or genetic diseases, and searches or refers to genetic variation databases such as HGMD to determine whether the detected genetic variations are related to specific metabolic disorders. It is a method to search and confirm the literature.
  • Parabase Genomics' NewbornDx TM provides a service that simultaneously detects gene mutations for about 500 genes associated with neonatal metabolic and genetic diseases.
  • VUS Clinically insignificant
  • the present invention is to provide an apparatus and method for testing metabolic disorders in a specimen by using the concentration information of metabolites used by mass spectrometry based on the genetic variation information used by the gene sequencing method.
  • FIG. 1 is a block diagram of a metabolic disorder disease testing device according to the present invention.
  • Metabolic abnormality disease detection apparatus according to the present invention metabolic concentration abnormality determination unit 100, metabolite-associated disease screening unit 200, gene status classification unit 300, gene-related disease screening unit 400, integrated analysis unit 500 may be included.
  • the metabolic disorder disease testing apparatus may be implemented as a computer program having a program module for performing some or all functions combined in one or a plurality of hardware by selectively combining some or all of the respective components. have.
  • each component may be implemented as one independent hardware or included in each hardware, if necessary.
  • the apparatus for detecting metabolic disorders according to the present invention may be implemented as a software program to operate on a processor or a signal processing module, or may be implemented in hardware to be included in various processors, chips, semiconductors, devices, and the like.
  • the metabolic disorder disease testing apparatus according to the present invention can be included in the form of hardware or software modules and operate on a computer, various embedded systems or devices.
  • the apparatus for testing metabolic disorders according to the present invention may be implemented in a server connected to a network or included in a server, and may operate in conjunction with a metabolite-metabolism linkage database and a genetic variation database to be described below.
  • the metabolic disorder disease testing apparatus according to the present invention may be implemented in or included in an independent computer device, and the computer device may store the metabolite-metabolism linkage database and genetic variation database in an internal storage device.
  • Metabolite concentration abnormality determination unit 100 receives the metabolite concentration value for each metabolite for a sample, and determines the abnormality of the metabolite concentration by comparing the input metabolite concentration with the reference concentration for each metabolite do.
  • the metabolite-associated disease selection unit 200 selects a metabolite-related disease corresponding to the metabolite determined to have an abnormality in the metabolite concentration.
  • the genetic state classification unit 300 receives genetic variation data including information about the genetic variation detected for the specimen, and classifies the genetic variation into any one of a plurality of predetermined genetic states.
  • the gene associated disease selection unit 400 selects a gene associated disease corresponding to the gene mutation in which the genetic state is classified.
  • the integrated analysis unit 500 sets a disease included in the selected metabolic-associated disease or gene-associated disease as a candidate disease, and the candidate disease is determined according to the type of the genetic state of the genetic variation corresponding to the candidate disease. Information about whether the sample corresponds to metabolic disorders is determined.
  • metabolic abnormality disease is associated with both metabolite concentration abnormality label (M) and gene (G).
  • the metabolic abnormality marker (M) an increase in Phenylalanine
  • Phenylkentonuria is a metabolic disorder (D) associated with the PAH gene. There may be.
  • Integrated analysis unit 500 based on the fact that metabolic abnormality disease (D) is associated with both metabolite concentration abnormality label (M) and gene (G) as shown in Figure 2, metabolite concentration abnormality determination unit 100 And metabolite-associated diseases selected for metabolites having abnormal metabolite concentrations according to the operation of the metabolite-associated disease selection unit 200, the genetic status classification unit 300, and the genetic ointment or disease selection unit 400. According to the operation, among metabolic disorders associated with genetic variation, information on metabolic concentration abnormalities and the state of the genetic variation may be used together to determine what the metabolic disorders of the specimen are.
  • Metabolite concentration abnormality determination unit 100 receives the metabolite concentration value for each metabolite for a sample, and determines the abnormality of the metabolite concentration by comparing the input metabolite concentration with the reference concentration for each metabolite do.
  • the metabolite concentration abnormality determination unit 100 when the metabolite concentration abnormality determination unit 100 is input to the metabolite concentration of the metabolite Phenylalanine is 150, and the reference concentration preset for the metabolite Phenylalanine is " ⁇ 120 ⁇ mol / L", the metabolite Since the concentration is greater than the reference concentration, it can be determined that the metabolite concentration corresponds to the above.
  • the metabolite concentration abnormality determining unit 100 may compare the metabolite concentration with the reference concentration, and determine an abnormal label of the metabolite concentration according to whether the concentration is increased or decreased.
  • the abnormal label of the metabolite concentration is a predetermined marker according to the increase or decrease of the concentration, and may be preset as necessary.
  • the abnormal label of the metabolite concentration may be set to 'increase', 'slightly increase', 'decrease', 'slightly decrease', and each label may be classified according to a preset threshold or threshold ratio. For example, an increase of 30% or more can be divided into 'increase', and an increase of less than 30% can be classified into 'slightly increase'.
  • the abnormal label of the metabolite concentration may be determined as 'a slight increase'.
  • Metabolite concentration abnormality determination unit 100 may determine the abnormality of each input metabolite concentration with respect to the plurality of metabolites for the sample, and may determine the abnormality of the metabolite concentration in at least one metabolite. For example, the metabolite concentration abnormality determination unit 100 may determine that there is an abnormality of the metabolite concentration for the metabolite m1 and the metabolite m2, respectively, and accordingly, the abnormality label of the metabolite concentration for the metabolite m1 accordingly. M1 can be determined as an abnormal marker of metabolite concentration to metabolite m2.
  • the metabolite-associated disease selection unit 200 selects a metabolite-related disease corresponding to the metabolite determined to have an abnormality in the metabolite concentration.
  • D1 may be selected as a metabolite-related disease corresponding to the metabolite m1.
  • the metabolite-associated disease selection unit 200 may select a plurality of metabolite-related diseases for one metabolite. In such a case, for example, D1 and D2 may be selected as a metabolite-related disease corresponding to the metabolite m1.
  • the metabolite-associated disease selection unit 200 may select a metabolite-related disease corresponding to the abnormal label of the metabolite concentration.
  • the abnormal label of the metabolite concentration is determined as M1 for the metabolite m1
  • D1 or D1 or D2 may be selected as a metabolite-associated disease corresponding to the M1 label.
  • the metabolite-associated disease selection unit 200 may select all metabolic-associated diseases associated with abnormalities in the concentration of each metabolite when it is determined that the metabolite concentration is abnormal for the plurality of metabolites. For example, when the metabolite concentration abnormality is determined for the metabolites m1 and m2, D1 and D2 may be selected as a metabolite-related disease associated with m1, and D3 may be selected as a metabolite-related disease related to m2.
  • the metabolite-associated disease selection unit 200 may search for and select the metabolite-related disease corresponding to the abnormal label of the determined metabolite concentration with reference to the metabolite-metabolism association database 10.
  • the metabolite-metabolism association database 10 may store metabolic disorders corresponding to the metabolite concentration abnormality label as metabolite-associated diseases.
  • the metabolite-metabolism association database 10 may store metabolite-associated diseases corresponding to markers above each metabolite concentration in the form of a table.
  • FIG. 3A is a reference diagram illustrating an example in which the metabolite-metabolism association database 10 stores metabolite-associated diseases corresponding to markers above the concentration of each metabolite in the form of a table (M2D table).
  • M2D table a table
  • FIG. 4 is a reference diagram for explaining operations of the metabolite concentration abnormality determiner 100 and the metabolite-associated disease selection unit 200.
  • the metabolite concentration abnormality determination unit 100 as shown in FIG. 4 may determine that the abnormal label of the metabolite concentration for the Phenylalanine 'slightly increased'
  • the metabolite-related disease selection unit 200 Metabolite-related diseases corresponding to a 'slight increase' of phenylalanine can be screened by screening in the metabolite-metabolic association database (10).
  • the metabolic abnormality disease testing device may further include a genetic variation detection unit 50 as necessary.
  • Genetic variation detection unit 50 receives the gene sequence information data, detects the genetic variation and classifies the type of variation to generate the genetic variation data.
  • the gene sequence information data may be sequence information data for a plurality of DNA fragments, for example, data for detecting genetic variation.
  • it can be sequence information data for tens or millions of short DNA fragments produced by the next generation sequencing (NGS) technique.
  • NGS next generation sequencing
  • the gene sequence information data may be, for example, data produced by an NGS sequencing apparatus and stored in a fastq form or a bam file form.
  • Genetic variation may be a variation on the nucleotide sequence of the gene, or may be a variation on the number of copies of the gene.
  • 5 is a detailed block diagram of the gene mutation detection unit 50.
  • the gene mutation detection unit 50 may include at least one of a nucleotide sequence mutation detection unit 51 or a gene copy number mutation detection unit 52.
  • the nucleotide sequence variation detecting unit 51 may detect a gene variation in which a mutation has occurred in the nucleotide sequence in the received gene sequence information data.
  • the sequence variation detection unit 51 maps sequencing reads of short DNA fragments to a human reference genome (hg19, etc.), and sequence information and reference genomes mapped to specific regions. The sequence sequence can be detected by finding a mismatch with the reference genome.
  • Gene copy number variation detection unit 52 may detect the gene copy number variation through the following steps.
  • the gene copy number variation detection unit 52 performs a PCR-based target enrichment to selectively amplify only a specific region of interest (eg, regions of genes related to metabolic abnormalities) in the human genome, and then performs a NGS sequence. Gene copy number variation can be detected for the information data.
  • a specific region of interest eg, regions of genes related to metabolic abnormalities
  • the gene copy number variation detector 52 may calculate a reads count value for each amplicon for each sample.
  • the number of sequencing reads mapped to a specific amplicon region may be calculated.
  • a larger portion of the two amplicons can be assigned to the overlapping amplicon and calculated.
  • the gene copy number variation detector 52 may calculate a normalized read count.
  • the normalized reads count value for each amplicon can be calculated by dividing the raw reads count value for the amplicon by each sample by representative statistical values such as the median value or the mean value for the raw reads count value of the entire amplicons of the sample.
  • the gene copy number variation detection unit 52 may perform baseline construction.
  • the sequencing data of three or more standard samples can be used to construct a statistical model for normalized reads count for each amplicon, and the statistical model for each amplicon is called baseline.
  • the statistical model for each amplicon can be considered to be the simplest normal distribution consisting of mean and variance.
  • ⁇ Baseline (ampk) N ( ⁇ k, ⁇ k2) ⁇ where the kth amplicon has mean ⁇ k and standard deviation ⁇ k. Show a statistical model of a normal distribution.
  • the gene copy number variation detection unit 52 may detect the gene copy number variation.
  • the normalized reads count value for each amplicon can be obtained from the sequencing data of a particular sample, and the log-fold change value compared to the average value of the baseline of the corresponding amplicon and the p-value, which is a statistically significant value for the deviation from the mean from the baseline, can be calculated.
  • the log2 fold change value and p-value for the amplicon included in a specific Exon the number of replicas for that exon can be inferred, and at least 50% of the amplicons included in the entire exon for each exon. This log2 fold change value and p-value are below a certain value (e.g.
  • Heterozygote Deletion log2 fold change ⁇ -0.75 & p-value ⁇ 0.05, Homozygote Deletion: log2 fold change ⁇ -1.5 & p-value ⁇ 0.05) It can be determined that there is a mutation in the gene copy in the exon.
  • the gene copy number variation detection unit 52 may infer the copy number status of the corresponding gene by integrating the log2 fold value and the p-value for the amplicon included in the specific gene, and include each gene in the entire gene. If more than 50% of the amplicons have a log2 fold change value and a p-value below a certain value (e.g. Heterozygote Deletion: log2 fold change ⁇ -0.75 & p-value ⁇ 0.05, Homozygote Deletion: log2 fold change ⁇ -1.5 & p-value ⁇ 0.05) It can be determined that there is a variation in gene copy number in the gene.
  • the genetic state classification unit 300 receives genetic variation data including information about the genetic variation detected for the specimen, and classifies the genetic variation into any one of a plurality of predetermined genetic states.
  • the genetic variation may mean that the gene of the sample has different base composition by comparing the gene sequence information with the standard reference sequence, and the reference reference sequence may be, for example, hg19 or hg38.
  • FIG. 6 is a reference diagram showing gene variation data including information on gene variation in a table form.
  • the genetic state classification unit 300 may receive information about the genetic variation detected from the gene sequence information data as described in detail in the genetic variation detection unit 50.
  • FIG. 7 is a detailed block diagram of the gene status classification unit 300.
  • the genetic state classification unit 300 may include a filtering unit 310 as necessary.
  • the filtering unit 310 may filter and remove the genetic variation corresponding to simple polymorphism from the received genetic variation data.
  • the filtering unit 310 removes the one corresponding to the simple polymorphism of the genetic variation.
  • the genetic variation corresponding to the simple polymorphism may mean a genetic variation in which gene variation occurs at a predetermined ratio or more with respect to a specific population.
  • genetic variations whose allele frequency values are above a predetermined threshold value in any population can be defined as equivalent to simple polymorphism.
  • the genetically modified DB may be dbSNP, 1000 genomes, ESP6500, ExAC, or the like.
  • the filtering unit 310 may define gene variants having an allele frequency of 3% or more in advance by simple polymorphism, and filter corresponding gene variants as described above to remove them.
  • the threshold value may be set to various values such as 1% or 5% instead of 3% as necessary.
  • the genetic state classification unit 300 may include a selection unit 320 as needed.
  • the selection unit 320 may receive a user's selection input, and may select the genetic variation to classify the genetic state among the genetic variation data.
  • the selection unit 320 allows the user to select whether or not to include a particular gene mutation in the analysis.
  • the selection input of the user may be information input to the device using various user interface devices such as a keyboard, a mouse, and a touch screen.
  • the selection unit 320 may output information regarding genetic variation, and the output information may be provided to a user through a display device.
  • the information on the genetic variation provided to the user may include information on the frequency of occurrence in the general population, information on whether the disease cause gene variation DB (eg, ClinVar, HGMD, KMD, etc.) is listed, and internal gene variation DB. It may include any one or more of information about whether to determine whether the information, the prediction value in the in-silico tools (SIFT, Polyphen2, MutationTaster, etc.).
  • the internal gene variation DB is pathogenic (Vp), pathogenic (Likely Pathogenic, VLP), positive (Benign, VB), and positive (Likely Benign, VLB), and uncertain (Uncertain Significance, It can be a database saved separately.
  • the genetic state classifier 300 may include at least one or more of the filtering unit 310 and the selecting unit 320, and the filtering result of the filtering unit 310 or the selection result of the selecting unit 320. Genetic status can be classified.
  • the genetic state classification unit 300 includes both the filtering unit 310 and the selection unit 320, the genetic state classification unit 300 performs filtering of the filtering unit 310 and then classifies the gene state according to the selection in the selection unit 320. You can also choose which gene mutations to do.
  • the genetic state classifier 300 may include a variant classifier 330.
  • Variation classifier 330 may classify the gene state for the gene mutations included in the gene mutation data received by the gene state classifier 300.
  • the variation classifier 330 may classify the genetic state with respect to the genetic variation included in the genetic variation data filtered by the filtering unit 310. Can be.
  • the variation classifier 330 may classify the genetic state with respect to the genetic variation selected by the selector 320.
  • the variant classification unit 330 classifies each of the gene variants included in the gene mutation data into any one of the gene states, and at least one or more of the gene states according to the nucleotide sequence variation or the gene state according to the gene copy number variation. Can be classified. That is, the variation classification unit 330 may classify which state of the gene state according to the genetic variation, and / or classify which state of the gene state according to the gene copy number variation. You may.
  • the variant classification unit 330 classifies the gene state according to the nucleotide sequence variation with respect to the gene mutation, homozygous (homozygote), heterozygote (heterozygote), bi-allelic variants, complex heterogeneous It may be classified as at least one or more of the compound (compound heterozygote).
  • the genetic status according to the sequence variation is any one of homozygous (HO), heterozygote (HE), bi-allelic variants (BI), and compound heterozygote (CE).
  • HO homozygous
  • HE heterozygote
  • BI bi-allelic variants
  • CE compound heterozygote
  • At least one genetic variation in a gene is a homozygote variation.
  • Compound Heterozygotes CE
  • the gene has two or more heterozygotes gene mutations, or at least two heterozygotes gene mutations are identified on two different alleles.
  • Bi-Allelic Heterozygotes There are two or more heterozygotes gene mutations in the gene, but it is not known whether they exist on two different alleles of the gene variants, or all gene variants exist only on one and the same chromosome HE (Heterozygote) If there is only one gene mutation in the gene and the gene mutation is heterozygote
  • the variant classification unit 330 classifies the gene state according to the gene copy number variation with respect to the gene mutation, but increases the number of copies (Gain), no copy number variation (Neutral), heterozygote deletion (Hterozygote deletion, HED) ), Homozygous deletion, or hemozygous deletion (HOD).
  • HOD is used as an abbreviation that refers to either a homozygous deletion or a hemizygote deletion.
  • Gene status according to the gene copy number variation can be defined as shown in Table 2.
  • Hemizygote Deletion All or part of a gene has been deleted from two alleles (homozygote deletion) or if there is only one chromosome within a cell, such as a sex chromosome (Hemizygote deletion). Heterozygote Deletion (HED) All or a portion of a gene has been deleted only on the allele of one of the two alleles (heterozygote deletion). Neutral If no copy number variation is found for the gene Gain If the number of copies for all or a specific region of the gene has increased
  • the variant classifier 330 may classify some or all of the gene states of the gene mutations in the gene mutation detection unit 50 and include the corresponding classification information in the gene mutation data.
  • the information may be used as is to determine the genetic status of the genetic variation.
  • the gene associated disease selection unit 400 selects a gene associated disease corresponding to the gene mutation in which the genetic state is classified.
  • the gene-associated disease selection unit 400 may be filtered or selected by the filtering unit 310 or the selection unit 320 among the gene mutations included in the gene mutation data. Gene-related diseases can be screened for.
  • the gene associated disease selection unit 400 may search for and select the gene associated disease corresponding to the genetic variation classified by the gene state by referring to the genetic variation database 20.
  • the gene associated disease selection unit 400 may search for and select D1 from the gene mutation database 20 as a gene associated disease corresponding to the gene mutation G1.
  • a plurality of dogs may be selected as gene-associated diseases (D1, D2).
  • the genetic variation database 10 may store metabolic disorders corresponding to each gene or variation of genes as gene-associated diseases.
  • the genetic variation database 10 may store gene associated diseases corresponding to each gene or genetic variation in the form of a table.
  • FIG. 3B is a reference diagram illustrating an example in which the gene variation database 10 stores gene-associated diseases corresponding to each gene in the form of a table (G2D table).
  • the gene associated disease selection unit 400 may set the selection accuracy of the selected gene associated diseases according to the type of the genetic state of the genetic variation corresponding to the selected gene associated diseases.
  • the selection accuracy may be set to any one of a plurality of predefined values as a value indicating a degree or a matching degree indicating how precisely a gene-associated disease corresponding to the genetic variation is selected.
  • the screening accuracy may have 1 to 4 steps, each step being 'Consistent with', 2 steps 'Most likely' and 3 steps Can be set to 'Rule Out' (R / O), and step 4 to 'Less likely'.
  • each step of the screening accuracy may be a number of steps other than four, and the name of each step may be set to another name as necessary.
  • the gene associated disease selection unit 400 may include a homozygous (HO), a compound heterozygote (CE), and a homozygous type of the genetic state of the genetic variation corresponding to the selected genetic associated disease.
  • the screening accuracy may be set according to whether one corresponds to at least one of a homozygote deletion or a hemozygote deletion (HOD), or the number of selected genetic diseases.
  • the gene associated disease selection unit 400 may have a genetic variation corresponding to the genetic state classified by the genetic state classification unit 300.
  • the gene associated disease selection unit 400 may include criteria such as those described in Table 3 of FIG. 12 and the types of the genetic states and the number of gene associated diseases corresponding to the selected genetic associated diseases. The accuracy of the screening of genetically-associated diseases selected according to conditions can be established.
  • the genetic state classification unit 300 may classify the genetic state according to the type of the genetic variation, and the gene state information classified by the gene associated disease selection unit 400. Genetic associated diseases can be selected using.
  • the integrated analysis unit 500 sets a disease included in the selected metabolic-associated disease or gene-associated disease as a candidate disease, and the candidate disease is determined according to the type of the genetic state of the genetic variation corresponding to the candidate disease. Information about whether the sample corresponds to metabolic disorders is determined.
  • the integrated analysis unit 500 uses information on the type of the genetic state of the genetic variation corresponding to the candidate disease, and information on whether the candidate disease corresponds to the metabolite-associated disease or gene-associated disease. Thus, information about whether the candidate disease corresponds to a metabolic abnormality disease of the sample may be determined.
  • the integrated analysis unit 500 corresponds to information about the type of the genetic state of the genetic variation corresponding to the candidate disease, and whether the candidate disease corresponds to the metabolic disease or the genetic disease. Using the information on whether or not, a matching score regarding whether the candidate disease corresponds to a metabolic disorder of the specimen may be calculated.
  • the information on whether the candidate disease corresponds to a metabolic abnormality disease of the sample may be the matching score.
  • the matching score may be a score having a predetermined range, or may be a ranking score indicating a ranking, and may be expressed in various other ways as necessary.
  • the matching score may be expressed in the form of a score having a range of 0 to M points, or may be a ranking score having a range of 1 rank to N rank.
  • the integrated analysis unit 500 corresponds to information about whether the candidate disease corresponds to all or one of the metabolic-associated diseases or gene-related diseases and corresponding candidate diseases as shown in Table 4 of FIG. 13.
  • the matching score may be determined from 1 to 6 according to the information on the type of the genetic state of the genetic variation.
  • the integrated analysis unit 500 corresponds to information about the type of the genetic state of the genetic variation corresponding to the candidate disease, and whether or not the candidate disease corresponds to both the metabolite-associated disease or the gene-associated disease or any one. By using the information on whether or not, the selection accuracy of the metabolic disorders regarding whether the candidate disease corresponds to the metabolic disorders of the specimen can be set.
  • the screening accuracy of metabolic disorders may be defined similarly to the screening accuracy of gene-associated diseases.
  • the screening accuracy of the metabolic abnormality disease is a value indicating the degree of accuracy or matching with which the metabolic abnormality disease is selected, and may be set to any one of a plurality of predefined values.
  • the screening accuracy may have 1 to 4 steps, each step being 'Consistent with', 2 steps 'Most likely' and 3 steps Can be set to 'Rule Out' (R / O), and step 4 to 'Less likely'.
  • each step of the screening accuracy may be a number of steps other than four, and the name of each step may be set to another name as necessary.
  • the integrated analysis unit 500 may include information on whether the candidate disease corresponds to all or one of the metabolic-associated diseases or gene-associated diseases, and the gene of the gene mutation corresponding to the candidate disease. After determining the matching score according to the information on the type of state, the matching score may be further used to set the screening accuracy of the metabolic disorder.
  • the integrated analysis unit 500 corresponds to information about whether the candidate disease corresponds to all or one of the metabolic-associated diseases or gene-related diseases and corresponding candidate diseases as shown in Table 4 of FIG. 13.
  • the matching score may be determined from 1 to 6 according to the information about the type of the genetic state of the genetic variation, and finally, the screening accuracy for metabolic disorders may be finally set.
  • the integrated analysis unit 500 may determine the metabolic abnormality disease for the sample according to the information on whether the candidate disease corresponds to the metabolic abnormality disease of the sample.
  • Table 4 of FIG. 13 it may be determined that the candidate disease whose matching score is lower than or equal to a predetermined criterion (the highest ranking is higher than or equal to a predetermined criterion) is a metabolic abnormality of the sample, and the screening accuracy for the metabolic abnormality is As a result, it is possible to determine whether the metabolic abnormality has been selected with respect to the sample.
  • the higher rank disease refers to a disease having a higher matching score among candidate diseases when two or more candidate diseases exist.
  • the integrated analysis unit 500 may For disease B having a matching score of 2, a screening accuracy of a metabolic disorder called Less Likely may be set.
  • the screening accuracy of Most Likely may be set for B disease.
  • the matching score is represented in the form of a ranking score, a smaller number may be defined as having a higher matching score. That is, for example, the matching score 1 is higher than the matching score 2.
  • the matching score may be defined and used to have various values or orders as necessary.
  • the screening accuracy may be set as there is no higher rank disease for the candidate diseases.
  • 9 is a reference diagram illustrating an example of an analysis result of the integrated analyzer 500.
  • Metabolic abnormality disease test method may include an integrated analysis step (S500).
  • the metabolic disorder disease test method may be operated in the same manner as the method for operating the metabolic disorder disease test apparatus according to the present invention described in detail with reference to FIGS. 1 to 8.
  • the metabolic disorders test method may be performed as described above by each component of the metabolic disorders test apparatus according to the present invention. The overlapping part will be omitted and briefly described.
  • FIG. 10 is a flow chart of the metabolic abnormality disease test method according to the present invention.
  • Metabolite concentration abnormality determination step (S100) is to receive the metabolite concentration value for each metabolite for the sample, and compare the input metabolite concentration with the reference concentration for each metabolite to determine whether the metabolite concentration is abnormal do.
  • Metabolite-associated disease screening step (S200) selects a metabolite-associated disease corresponding to the metabolite determined to have an abnormality in the metabolite concentration.
  • Gene state classification step (S300) receives the genetic variation data including information on the detected genetic variation for the sample, and classifies the genetic variation into any one of a plurality of predetermined genetic states.
  • Gene-associated disease screening step (S400) selects a gene-associated disease corresponding to the genetic variation in which the genetic state is classified.
  • the disease included in the selected metabolite-associated disease or gene-associated disease is set as a candidate disease, and the candidate disease is determined according to the type of the genetic state of the genetic variation corresponding to the candidate disease. Information about whether the sample corresponds to metabolic disorders is determined.
  • the metabolite concentration abnormality determining step (S100) may compare the metabolite concentration with the reference concentration, and determine the abnormal label of the metabolite concentration according to the increase or decrease of the concentration.
  • the metabolite-associated disease screening step (S200) may search for and select the metabolite-associated disease corresponding to the abnormal label of the determined metabolite concentration with reference to the metabolite-metabolism association database 10.
  • the genetic state classification step S300 may include a filtering step S310 and a mutation classification step S320.
  • 11 is a detailed flowchart of the gene status classification step S300.
  • the filtering step S310 may filter and remove the genetic variation corresponding to simple polymorphism from the received genetic variation data, and perform filtering on the genetic variation to classify the genetic state.
  • Variation classification step (S320) is to classify each of the gene variants included in the genetic mutation data into any one of the genetic state, at least one or more of the genetic state according to the sequence variation or the number of gene replication according to the number of gene copies Classify.
  • Gene-related disease selection step (S400) may set the selection accuracy of the selected gene-associated diseases according to the type of the genetic state of the genetic mutation corresponding to the selected gene-associated diseases.
  • Integrated analysis step (S500) is the information about the type of the genetic state of the genetic mutation corresponding to the candidate disease, and whether the candidate disease corresponds to all or one of the metabolic-associated disease or gene-associated disease The information on whether the candidate disease corresponds to at least one of a matching score or whether the screening accuracy of the metabolic abnormality disease can be set whether the candidate disease corresponds to the metabolic abnormality disease.
  • FIG. 12 illustrates a table used for selecting a gene-associated disease according to an embodiment of the present invention.
  • a gene-associated disease when one gene-associated disease, which is a criterion for the gene-related disease, is selected, and when two or more gene-associated diseases are selected (HO, CE, When there is no genetic status of HOD), two or more genetically-associated diseases are selected (when there is a genetic status of HO, CE, or HOD), the accuracy of genetically-associated disease selection can be distinguished.
  • FIG. 13 is a table illustrating a method for integrated analysis of metabolite concentration abnormality and variation information according to an embodiment of the present invention.
  • each or some of the components of the components are selectively combined to perform some or all of the functions combined in one or a plurality of hardware It may be implemented as a computer program having a.
  • a computer program is stored in a computer readable medium such as a USB memory, a CD disk, a flash memory, and the like, and is read and executed by a computer, thereby implementing embodiments of the present invention.
  • the recording medium of the computer program may include a magnetic recording medium, an optical recording medium, a carrier wave medium, and the like.

Abstract

본 발명은 대사 이상 질환을 진단하는 장치와 그 방법에 관한 것이다. 본 발명에 따른 대사 이상 질환 검사 장치는, 검체에 대한 각 대사물질 별 대사물질농도 값을 입력받고, 상기 입력받은 대사물질농도를 상기 대사물질 별 기준 농도와 비교하여 상기 대사물질농도의 이상 여부를 판단하는 대사물질 농도 이상 판단부, 상기 대사물질농도에 이상이 있는 것으로 판단된 상기 대사물질에 대응하는 대사물질 연관 질환을 선별하는 대사물질 연관 질환 선별부, 상기 검체에 대하여 검출된 유전자 변이에 관한 정보를 포함하는 유전자 변이 자료를 입력받고, 상기 유전자 변이를 미리 정해진 복수개의 유전자 상태 중 어느 하나로 분류하는 유전자 상태 분류부, 상기 분류된 유전자 상태에 대응하는 유전자 연관 질환을 선별하는 유전자 연관 질환 선별부, 및 상기 선별한 대사물질 연관 질환 또는 유전자 연관 질환에 포함된 질환을 후보 질환으로 설정하고, 상기 후보 질환에 대응하는 상기 유전자 상태의 종류에 따라 상기 후보 질환이 상기 검체의 대사 이상 질환에 해당하는지 여부에 관한 정보를 결정하는 통합 분석부를 포함할 수 있다.

Description

대사 이상 질환 진단 장치 및 그 방법
본 발명은 대사 이상 질환을 진단하는 장치와 그 방법에 관한 것이다.
선천성 대사 이상 질환은 특정 유전자의 돌연변이 등으로 인해 해당 유전자가 관여하는 생화학적 대사 경로에 문제가 발생하여, 독성 전구 물질이 체내에 축적되거나 필수 대사 물질을 충분히 생산해내지 못함으로 인해 발생하는 질환이다. 이와 같은 선천성 대사 이상 질환의 대부분은 진단이 늦어지면 인체에 치명적 문제를 일으키므로, 조기에 진단하여 예방할 수 있도록 검사할 필요가 있다.
기존에 이와 같은 선천성 대사 이상 질환을 검사하는 방법으로는 텐덤 질량분석법과 유전체 시퀀싱 방법 등이 존재하고 있다.
먼저 텐덤 질량 분석법은 신체에서 채취한 혈액 여과지 검체(dried blood spots)에서 추출한 샘플을 탠덤 질량분석기(MS/MS)에 넣어 샘플 내의 존재하는 대사 물질들의 농도를 측정하고, 각 대사 물질의 농도가 이상이 있는지를 확인하는 방법이다. 그러나 위 기존 방법에 있어서는, 특정 대사 물질의 농도 이상을 결정하는 기준 값(cut-offs)의 결정이 쉽지 않고, 특정 대사 물질의 농도가 기준 값 근처의 값이 나온 경우에 양성 및 음성을 판단하는데 어려움이 있다. 또한 농도 이상으로 판정된 하나의 대사 물질이 여러 종류의 대사 질환과 관련되어 있는 경우가 있어, 정확한 대사 질환 판단이 어렵다는 문제점이 있다.
한편 유전체 시퀀싱 방법은 대사 질환 또는 유전 질환과 관련된 여러 유전자들에 존재하는 유전자 변이들을 검출하고, 상기 검출된 유전자 변이들이 특정 대사 이상 질환과 관련이 있는지를 유전자 변이 데이터베이스를 검색하여 확인하는 방법이다. 하지만, 위 기존 방법의 경우는 검출된 많은 수의 유전자 변이들에 실제로 임상적 의미가 있는지 여부를 확정하기에 어려움이 있다. 많은 경우, 검출된 유전자 변이에 대하여 기존에 보고된 참고 자료를 찾을 수가 없어 임상적으로 의미가 불확실한 (Variant of Uncertain Significance) 상태로 보고가 될 수 밖에 없고, 하나의 유전자가 아니라 여러 유전자에서 유전자 변이가 검출되기 때문에 하나의 질환으로 특정하기가 어렵다는 문제점이 있다.
본 발명이 해결하고자 하는 과제는 질량분석 기반 검사가 이용하는 대사물질의 농도 정보와, 유전자 시퀀싱 방법이 이용하는 유전자 변이 정보를 통합적으로 이용하여, 검체에 대한 대사 이상 질환을 검사하는 장치 및 그에 관한 방법을 제공하는 것이다.
상기 과제를 해결하기 위해, 본 발명의 일 유형에 따른 대사 이상 질환 검사 장치는, 검체에 대한 각 대사물질 별 대사물질농도 값을 입력받고, 상기 입력받은 대사물질농도를 상기 대사물질 별 기준 농도와 비교하여 상기 대사물질농도의 이상 여부를 판단하는 대사물질 농도 이상 판단부, 상기 대사물질농도에 이상이 있는 것으로 판단된 상기 대사물질에 대응하는 대사물질 연관 질환을 선별하는 대사물질 연관 질환 선별부, 상기 검체에 대하여 검출된 유전자 변이에 관한 정보를 포함하는 유전자 변이 자료를 입력받고, 상기 유전자 변이를 미리 정해진 복수개의 유전자 상태 중 어느 하나로 분류하는 유전자 상태 분류부, 상기 유전자 상태가 분류된 상기 유전자 변이에 대응하는 유전자 연관 질환을 선별하는 유전자 연관 질환 선별부, 및 상기 선별한 대사물질 연관 질환 또는 유전자 연관 질환에 포함된 질환을 후보 질환으로 설정하고, 상기 후보 질환에 대응하는 상기 유전자 변이의 상기 유전자 상태의 종류에 따라 상기 후보 질환이 상기 검체의 대사 이상 질환에 해당하는지 여부에 관한 정보를 결정하는 통합 분석부를 포함할 수 있다.
여기서 상기 대사 이상 질환 검사 장치는 유전자 서열 정보 데이터를 입력받아, 상기 유전자 변이를 검출하고 변이의 종류를 분류하여 상기 유전자 변이 자료를 생성하는 유전자 변이 검출부를 더 포함할 수 있다.
여기서 상기 대사물질 농도 이상 판단부는 상기 대사물질농도를 상기 기준 농도와 비교하여, 농도의 증감 여부 또는 증감의 정도에 따라 상기 대사물질농도의 이상 표지를 결정하는 것을 특징으로 할 수 있다.
여기서 상기 대사물질 연관 질환 선별부는 대사물질-대사질환 연관성 데이터베이스를 참조하여, 상기 결정한 대사물질농도의 이상 표지에 대응하는 상기 대사물질 연관 질환을 검색하여 선별할 수 있다.
여기서 상기 유전자 상태 분류부는 상기 입력받은 유전자 변이 자료에서 단순 다형성(polymorphism)에 해당하는 상기 유전자 변이를 제거하여, 상기 유전자 상태를 분류할 상기 유전자 변이에 대한 필터링을 수행하는 필터링부를 포함하는 것을 특징으로 할 수 있다.
여기서 상기 유전자 상태 분류부는 사용자의 선택 입력을 수신하고, 그에 따라 상기 유전자 변이 자료 중 상기 유전자 상태를 분류할 상기 유전자 변이를 선택하는 선택부를 포함할 수 있다.
여기서 상기 유전자 상태 분류부는 상기 유전자 변이 자료에 포함된 각 상기 유전자 변이를 상기 유전자 상태 중 어느 하나로 분류하되, 염기서열변이에 따른 유전자 상태 또는 유전자 복제 수 변이에 따른 유전자 상태 중 적어도 어느 하나 이상을 분류하는 변이 분류부를 포함할 수 있다.
여기서 상기 변이 분류부는 상기 유전자 변이에 대하여 상기 염기서열변이에 따른 유전자 상태를 분류하되, 동형접합(homozygote), 이형접합(heterozygote), 이중 대립형질 변이(bi-allelic variants), 복합 이형접합(compound heterozygote) 중 적어도 어느 하나 이상으로 분류하는 것을 특징으로 할 수 있다.
여기서 상기 변이 분류부는 상기 유전자 변이에 대하여 상기 유전자 복제 수 변이에 따른 유전자 상태를 분류하되, 복제 수 증가, 복제 수 변이 미발견, 이형접합 삭제(heterozygote deletion), 동형접합 삭제(homozygote deletion), 단가접합 삭제(hemizygote deletion) 중 적어도 어느 하나 이상으로 분류하는 것을 특징으로 할 수 있다.
상기 유전자 연관 질환 선별부는 유전자 변이 데이터베이스를 참조하여, 상기 유전자 상태가 분류된 상기 유전자 변이에 대응하는 상기 유전자 연관 질환을 검색하여 선별하는 것을 특징으로 할 수 있다.
여기서 상기 유전자 연관 질환 선별부는 상기 선별한 유전자 연관 질환에 대응하는 상기 유전자 변이의 상기 유전자 상태의 종류에 따라 상기 선별한 유전자 연관 질환의 선별 정확도를 설정하는 것을 특징으로 할 수 있다.
여기서 상기 유전자 연관 질환 선별부는, 상기 선별한 유전자 연관 질환에 대응하는 상기 유전자 변이의 상기 유전자 상태의 종류가 동형접합(homozygote), 복합 이형접합(compound heterozygote), 동형접합 삭제(homozygote deletion), 단가접합 삭제(hemizygote deletion) 중 적어도 어느 하나에 해당하는지 여부, 또는 상기 선별한 유전자 연관 질환의 개수에 따라, 상기 선별 정확도를 설정하는 것을 특징으로 할 수 있다.
여기서 상기 통합 분석부는 상기 후보 질환에 대응하는 상기 유전자 변이의 상기 유전자 상태의 종류에 관한 정보와, 상기 후보 질환이 상기 대사물질 연관 질환 또는 유전자 연관 질환에 해당하는지 여부에 관한 정보를 이용하여, 상기 후보 질환이 상기 검체의 대사 이상 질환에 해당하는지 여부에 관한 정보를 결정하는 것을 특징으로 할 수 있다.
여기서 상기 통합 분석부는 상기 후보 질환에 대응하는 상기 유전자 변이의 상기 유전자 상태의 종류에 관한 정보와, 상기 후보 질환이 상기 대사물질 연관 질환 또는 유전자 연관 질환에 모두 해당하는지 또는 어느 하나에 해당하는지 여부에 관한 정보를 이용하여, 상기 후보 질환이 상기 검체의 대사 이상 질환에 해당하는지 여부에 관한 매칭 점수를 산출하는 것을 특징으로 할 수 있다.
여기서 상기 통합 분석부는 상기 후보 질환에 대응하는 상기 유전자 변이의 상기 유전자 상태의 종류에 관한 정보와, 상기 후보 질환이 상기 대사물질 연관 질환 또는 유전자 연관 질환에 모두 해당하는지 또는 어느 하나에 해당하는지 여부에 관한 정보를 이용하여, 상기 후보 질환이 상기 검체의 대사 이상 질환에 해당하는지 여부에 관한 상기 대사 이상 질환의 선별 정확도를 설정하는 것을 특징으로 할 수 있다.
여기서 상기 통합 분석부는 상기 후보 질환이 상기 검체의 대사 이상 질환에 해당하는지 여부에 관한 정보에 따라 상기 검체에 대한 상기 대사 이상 질환을 판단하는 것을 특징으로 할 수 있다.
상기 과제를 해결하기 위해, 본 발명의 일 유형에 따른 대사 이상 질환 검사 방법은, 검체에 대한 각 대사물질 별 대사물질농도 값을 입력받고, 상기 입력받은 대사물질농도를 상기 대사물질 별 기준 농도와 비교하여 상기 대사물질농도의 이상 여부를 판단하는 대사물질 농도 이상 판단 단계, 상기 대사물질농도에 이상이 있는 것으로 판단된 상기 대사물질에 대응하는 대사물질 연관 질환을 선별하는 대사물질 연관 질환 선별 단계, 상기 검체에 대하여 검출된 유전자 변이에 관한 정보를 포함하는 유전자 변이 자료를 입력받고, 상기 유전자 변이를 미리 정해진 복수개의 유전자 상태 중 어느 하나로 분류하는 유전자 상태 분류 단계, 상기 유전자 상태가 분류된 상기 유전자 변이에 대응하는 유전자 연관 질환을 선별하는 유전자 연관 질환 선별 단계, 및 상기 선별한 대사물질 연관 질환 또는 유전자 연관 질환에 포함된 질환을 후보 질환으로 설정하고, 상기 후보 질환에 대응하는 상기 유전자 변이의 상기 유전자 상태의 종류에 따라 상기 후보 질환이 상기 검체의 대사 이상 질환에 해당하는지 여부에 관한 정보를 결정하는 통합 분석 단계를 포함할 수 있다.
여기서 상기 대사물질 농도 이상 판단 단계는 상기 대사물질농도를 상기 기준 농도와 비교하여, 농도의 증감 여부 또는 증감의 정도에 따라 상기 대사물질농도의 이상 표지를 결정할 수 있다.
여기서 상기 대사물질 연관 질환 선별 단계는 대사물질-대사질환 연관성 데이터베이스를 참조하여, 상기 결정한 대사물질농도의 이상 표지에 대응하는 상기 대사물질 연관 질환을 검색하여 선별할 수 있다.
여기서 상기 유전자 상태 분류 단계는 상기 입력받은 유전자 변이 자료에서 단순 다형성(polymorphism)에 해당하는 상기 유전자 변이를 제거하여, 상기 유전자 상태를 분류할 상기 유전자 변이에 대한 필터링을 수행하는 필터링 단계, 및 상기 유전자 변이 자료에 포함된 각 상기 유전자 변이를 상기 유전자 상태 중 어느 하나로 분류하되, 염기서열변이에 따른 유전자 상태 또는 유전자 복제 수 변이에 따른 유전자 상태 중 적어도 어느 하나 이상을 분류하는 변이 분류 단계를 포함할 수 있다.
여기서 상기 통합 분석 단계는 상기 후보 질환에 대응하는 상기 유전자 변이의 상기 유전자 상태의 종류에 관한 정보와, 상기 후보 질환이 상기 대사물질 연관 질환 또는 유전자 연관 질환에 모두 해당하는지 또는 어느 하나에 해당하는지 여부에 관한 정보를 이용하여, 상기 후보 질환이 상기 검체의 대사 이상 질환에 해당하는지 여부에 관한 매칭 점수 또는 상기 대사 이상 질환의 선별 정확도 중 적어도 어느 하나 이상을 설정하는 것을 특징으로 할 수 있다.
본 발명에 따른 대사 이상 질환 검사 장치 및 그에 관한 방법에 의하면, 대사 물질 농도 이상 기반 분석 방법과 유전체 변이 기반 분석 방법을 함께 이용하여, 보다 정확하게 검체의 대사 이상 질환 보유 여부를 보다 진단할 수 있는 효과가 있다.
도 1은 본 발명에 따른 대사 이상 질환 검사 장치의 블록도이다.
도 2는 대사 이상 질환이 대사물질 농도 이상 표지 및 유전자와 연관되어 있음을 나타내는 참고도이다.
도 3의 (a)는 대사물질-대사질환 연관성 데이터베이스(10)가 테이블의 형태로 각 대사물질 농도 이상 표지에 대응하는 대사물질 연관 질환을 저장하는 일 예를 나타내는 참고도이다.
도 3의 (b)는 유전자 변이 데이터베이스(10)가 테이블의 형태로 각 유전자에 대응하는 유전자 연관 질환을 저장하는 일 예를 나타내는 참고도이다.
도 4는 대사물질 농도 이상 판단부(100)와 대사물질 연관 질환 선별부(200)의 동작을 설명하기 위한 참고도이다.
도 5는 유전자 변이 검출부(50)의 세부 블록도이다.
도 6은 유전자 변이에 관한 정보를 포함하는 유전자 변이 자료를 테이블 형태로 나타낸 참고도이다.
도 7은 유전자 상태 분류부(300)의 세부 블록도이다.
도 8은 유전자 상태 분류부(300), 유전자 연관 질환 선별부(400)의 동작을 설명하기 위한 참고도이다.
도 9는 통합 분석부(500)의 분석 결과의 일 예를 나타내는 참고도이다.
도 10는 상기 본 발명에 따른 대사 이상 질환 검사 방법의 흐름도이다.
도 11은 유전자 상태 분류 단계(S300)의 세부 흐름도이다.
도 12는 본 발명의 일 실시예에 따른 유전자 연관 질환을 선별하는 데 있어서 사용되는 표를 도시한 도면이다.
도 13은 본 발명의 일 실시예에 따른 대사물질 농도 이상과 변이 정보를 통합 분석하는 방법에 관련된 표를 도시한 도면이다.
본 발명의 대사 이상 질환 검사 장치에 있어서, 검체에 대한 각 대사물질 별 대사물질농도 값을 입력받고, 상기 입력받은 대사물질농도를 상기 대사물질 별 기준 농도와 비교하여 상기 대사물질농도의 이상 여부를 판단하는 대사물질 농도 이상 판단부, 상기 대사물질농도에 이상이 있는 것으로 판단된 상기 대사물질에 대응하는 대사물질 연관 질환을 선별하는 대사물질 연관 질환 선별부, 상기 검체에 대하여 검출된 유전자 변이에 관한 정보를 포함하는 유전자 변이 자료를 입력받고, 상기 유전자 변이를 미리 정해진 복수개의 유전자 상태 중 어느 하나로 분류하는 유전자 상태 분류부, 상기 유전자 상태가 분류된 상기 유전자 변이에 대응하는 유전자 연관 질환을 선별하는 유전자 연관 질환 선별부 및 상기 선별한 대사물질 연관 질환 또는 유전자 연관 질환에 포함된 질환을 후보 질환으로 설정하고, 상기 후보 질환에 대응하는 상기 유전자 변이의 상기 유전자 상태의 종류에 따라 상기 후보 질환이 상기 검체의 대사 이상 질환에 해당하는지 여부에 관한 정보를 결정하는 통합 분석부를 포함할 수 있다.
본 발명의 대사 이상 질환 검사 방법에 있어서, 검체에 대한 각 대사물질 별 대사물질농도 값을 입력받고, 상기 입력받은 대사물질농도를 상기 대사물질 별 기준 농도와 비교하여 상기 대사물질농도의 이상 여부를 판단하는 대사물질 농도 이상 판단 단계, 상기 대사물질농도에 이상이 있는 것으로 판단된 상기 대사물질에 대응하는 대사물질 연관 질환을 선별하는 대사물질 연관 질환 선별 단계, 상기 검체에 대하여 검출된 유전자 변이에 관한 정보를 포함하는 유전자 변이 자료를 입력받고, 상기 유전자 변이를 미리 정해진 복수개의 유전자 상태 중 어느 하나로 분류하는 유전자 상태 분류 단계, 상기 유전자 상태가 분류된 상기 유전자 변이에 대응하는 유전자 연관 질환을 선별하는 유전자 연관 질환 선별 단계 및 상기 선별한 대사물질 연관 질환 또는 유전자 연관 질환에 포함된 질환을 후보 질환으로 설정하고, 상기 후보 질환에 대응하는 상기 유전자 변이의 상기 유전자 상태의 종류에 따라 상기 후보 질환이 상기 검체의 대사 이상 질환에 해당하는지 여부에 관한 정보를 결정하는 통합 분석 단계를 포함할 수 있다.
이하, 본 발명의 바람직한 실시예를 첨부된 도면들을 참조하여 상세히 설명한다. 우선 각 도면의 구성요소들에 참조 부호를 부가함에 있어서, 동일한 구성요소들에 대해서는 비록 다른 도면상에 표시되더라도 가능한 동일한 부호를 가지도록 하고 있음에 유의해야 한다. 또한, 본 발명을 설명함에 있어, 관련된 공지 구성 또는 기능에 대한 구체적인 설명이 본 발명의 요지를 흐릴 수 있다고 판단되는 경우에는 그 상세한 설명은 생략한다. 또한, 이하에서 본 발명의 바람직한 실시예를 설명할 것이나, 본 발명의 기술적 사상은 이에 한정하거나 제한되지 않고 당업자에 의해 변형되어 다양하게 실시될 수 있음은 물론이다.
선천성 대사 이상 질환은 특정 유전자의 돌연변이 등으로 인해 해당 유전자가 관여하는 생화학적 대사 경로에 문제가 발생하여, 독성 전구 물질이 체내에 축적되거나 필수 대사 물질을 충분히 생산해내지 못함으로 인해 발생하는 질환이다. 이와 같은 선천성 대사 이상 질환의 대부분은 진단이 늦어지면 인체에 치명적 문제를 일으키므로, 조기에 진단하여 예방할 수 있도록 검사할 필요가 있다. 특히 신생아에 대한 선천성 대사이상 질환의 보유 유무에 대한 선별 검사가 정확하게 이루어지는 것이 중요하다.
기존에 이와 같은 선천성 대사 이상 질환을 검사하는 방법으로는 텐덤 질량분석법(MS/MS)과 유전체 시퀀싱 방법 등이 존재하고 있다.
먼저 텐덤 질량 분석법은 신체에서 채취한 혈액 여과지 검체(dried blood spots)에서 추출한 샘플을 탠덤 질량분석기(MS/MS)를 이용하여 분석하여, 샘플 내의 존재하는 대사 물질들의 농도를 측정하고, 각 대사 물질의 농도가 이상이 있는지를 확인하는 방법이다. 그러나 텐덤 질량 분석법에 있어서는, 특정 대사 물질의 농도 이상을 결정하는 기준 값(cut-offs)의 결정이 쉽지 않고, 특정 대사 물질의 농도가 기준 값 근처의 값이 나온 경우에 양성 및 음성을 판단하는데 어려움이 있다. 또한 농도 이상으로 판정된 하나의 대사 물질이 여러 종류의 대사 질환과 관련되어 있는 경우가 있어, 정확한 대사 질환 판단이 어렵다는 문제점이 있다.
한편 유전체 시퀀싱 방법은 대사 질환 또는 유전 질환과 관련된 여러 유전자들에 존재하는 유전자 변이들을 검출하고, 상기 검출된 유전자 변이들이 특정 대사 이상 질환과 관련이 있는지를 HGMD 등의 유전자 변이 데이터베이스를 검색하거나 또는 참고 문헌을 검색하여 확인하는 방법이다. 예를 들면, Parabase Genomics 사의 NewbornDxTM는 신생아 대사질환 및 유전질환과 관련되어 있는 약 500 여 개의 유전자들에 대한 유전자 변이들을 동시에 검출하는 서비스를 제공한다. 하지만, 유전체 시퀀싱 방법의 경우는 검출된 많은 수의 유전자 변이들에 실제로 임상적 의미가 있는지 여부를 확정하기에 어려움이 있다. 또한 검출된 유전자 변이 중 일반 인구에서 발견하기 어려운 희귀 변이(rare variants)에 대하여는 기존의 유전자 변이 데이터베이스 또는 참고 자료에서 관련 정보를 찾을 수가 없어 임상적으로 의미가 불확실한 (Variant of Uncertain Significance, VUS) 상태로 보고가 될 수 밖에 없다. 또한 하나의 유전자가 아니라 여러 유전자에서 유전자 변이가 검출되기 때문에 하나의 질환으로 특정하기가 어렵다는 문제점이 있고, 특히 여러 유전자에서 VUS 유전자 변이가 검출될 가능성이 높기 때문에 임상적 해석을 내리기가 더 어렵다는 문제점이 있다.
이에 본 발명은 질량분석 기반 검사가 이용하는 대사물질의 농도 정보와, 유전자 시퀀싱 방법이 이용하는 유전자 변이 정보를 통합적으로 이용하여, 검체에 대한 대사 이상 질환을 검사하는 장치 및 그에 관한 방법을 제공하고자 한다.
이하에서는 본 발명의 일 실시예에 따른 대사 이상 질환 검사 장치의 세부 구성에 대하여 보다 상세하게 설명한다.
도 1은 상기 본 발명에 따른 대사 이상 질환 검사 장치의 블록도이다.
본 발명에 따른 대사 이상 질환 검사 장치는 대사물질 농도 이상 판단부(100), 대사물질 연관 질환 선별부(200), 유전자 상태 분류부(300), 유전자 연관 질환 선별부(400), 통합 분석부(500)를 포함할 수 있다.
여기서 본 발명에 따른 대사 이상 질환 검사 장치는 각 구성요소들의 그 일부 또는 전부가 선택적으로 조합되어 하나 또는 복수개의 하드웨어에서 조합된 일부 또는 전부의 기능을 수행하는 프로그램 모듈을 갖는 컴퓨터 프로그램으로서 구현될 수도 있다. 또한 필요에 따라 각 구성요소들은 각각 하나의 독립적인 하드웨어로 구현되거나 각 하드웨어에 포함될 수도 있다. 또한 본 발명에 따른 대사 이상 질환 검사 장치는 소프트웨어 프로그램으로 구현되어 프로세서 또는 신호 처리 모듈 위에서 동작할 수 있고, 또는 하드웨어의 형태로 구현되어 각종 프로세서, 칩(Chip), 반도체, 소자 등에 포함될 수도 있다. 또한 본 발명에 따른 대사 이상 질환 검사 장치는 컴퓨터, 각종 임베디드 시스템 또는 디바이스 상에서 하드웨어 또는 소프트웨어 모듈의 형태로 포함되어 동작할 수 있다. 바람직하게는 본 발명에 따른 대사 이상 질환 검사 장치는 네트워크와 연결된 서버에서 구현되거나 서버에 포함될 수 있고, 이하 설명할 대사물질-대사질환 연관선 데이터베이스 및 유전자 변이 데이터베이스와 연동하여 동작할 수 있다. 또는 본 발명에 따른 대사 이상 질환 검사 장치는 독립적인 컴퓨터 장치에서 구현되거나 이에 포함될 수 있고, 상기 컴퓨터 장치가 대사물질-대사질환 연관선 데이터베이스 및 유전자 변이 데이터베이스를 내부 저장 장치에 저장할 수도 있다.
대사물질 농도 이상 판단부(100)는 검체에 대한 각 대사물질 별 대사물질농도 값을 입력받고, 상기 입력받은 대사물질농도를 상기 대사물질 별 기준 농도와 비교하여 상기 대사물질농도의 이상 여부를 판단한다.
대사물질 연관 질환 선별부(200)는 상기 대사물질농도에 이상이 있는 것으로 판단된 상기 대사물질에 대응하는 대사물질 연관 질환을 선별한다.
유전자 상태 분류부(300)는 상기 검체에 대하여 검출된 유전자 변이에 관한 정보를 포함하는 유전자 변이 자료를 입력받고, 상기 유전자 변이를 미리 정해진 복수개의 유전자 상태 중 어느 하나로 분류한다.
유전자 연관 질환 선별부(400)는 상기 유전자 상태가 분류된 상기 유전자 변이에 대응하는 유전자 연관 질환을 선별한다.
통합 분석부(500)는 상기 선별한 대사물질 연관 질환 또는 유전자 연관 질환에 포함된 질환을 후보 질환으로 설정하고, 상기 후보 질환에 대응하는 상기 유전자 변이의 상기 유전자 상태의 종류에 따라 상기 후보 질환이 상기 검체의 대사 이상 질환에 해당하는지 여부에 관한 정보를 결정한다.
도 2는 대사 이상 질환(D)이 대사물질 농도 이상 표지(M) 및 유전자(G)와 모두 연관되어 있음을 나타내는 참고도이다. 예를 들면 Phenylalanine의 증가라는 대사물질 농도 이상 표지(M)는 Phenylkentonuria, GTP cyclohydrolase deficiency 등의 대사 이상 질환(D)과 연관될 수 있고, PAH 유전자와 관련성이 있는 대사 이상 질환(D)으로 Phenylkentonuria가 있을 수 있다.
통합 분석부(500)는 도 2와 같이 대사 이상 질환(D)이 대사물질 농도 이상 표지(M) 및 유전자(G)와 모두 연관되어 있다는 사실에 기초하여, 대사물질 농도 이상 판단부(100) 및 대사물질 연관 질환 선별부(200)의 동작에 따라 대사물질농도 이상이 발생한 대사물질에 관하여 선별된 대사물질 연관 질환과, 유전자 상태 분류부(300) 및 유전자 연고나 질환 선별부(400)의 동작에 따라 유전자 변이와 연관된 유전자 연관 질환 중에서, 대사물질 농도 이상과 유전자 변이의 상태에 관한 정보를 함께 이용하여 검체의 대사 이상 질환이 무엇인지를 판단할 수 있다.
이하에서는 대사물질 농도 이상 판단부(100)의 동작에 대하여 보다 상세히 설명한다.
대사물질 농도 이상 판단부(100)는 검체에 대한 각 대사물질 별 대사물질농도 값을 입력받고, 상기 입력받은 대사물질농도를 상기 대사물질 별 기준 농도와 비교하여 상기 대사물질농도의 이상 여부를 판단한다.
예를 들면 대사물질 농도 이상 판단부(100)는 대사물질 Phenylalanine에 대한 대사물질농도가 150으로 입력되었고, 대사물질 Phenylalanine에 대하여 미리 설정된 기준 농도가 "≤ 120 μmol/L"인 경우, 상기 대사물질농도가 기준 농도보다 크기 때문에 상기 대사물질농도가 이상에 해당한다고 판단할 수 있다.
여기서 대사물질 농도 이상 판단부(100)는 상기 대사물질농도를 상기 기준 농도와 비교하여, 농도의 증감 여부 또는 증감의 정도에 따라 상기 대사물질농도의 이상 표지를 결정할 수 있다.
여기서 대사물질농도의 이상 표지는 농도의 증가 또는 감소에 따라 미리 정해진 표지(marker)로써, 필요에 따라 미리 설정될 수 있다. 예를 들면 상기 대사물질농도의 이상 표지는 '증가', '약간 증가', '감소', '약간 감소'로 설정될 수 있고, 각 표지는 미리 설정된 임계치 또는 임계 비율에 따라 구분될 수 있다. 예를 들어 30% 이상 증가하는 경우를 '증가', 30% 이하로 증가하는 경우를 '약간 증가'로 구분할 수 있다.
위 예에서 대사물질 Phenylalanine의 대사물질농도가 150으로 기준 농도보다 30만큼 증가하였으므로, 이와 같은 경우 대사물질농도의 이상 표지는 '약간 증가'로 결정할 수 있다.
대사물질 농도 이상 판단부(100)는 검체에 대한 복수개의 대사물질에 대하여 각 입력받은 대사물질농도의 이상 여부를 판단하여, 적어도 하나 이상의 대사물질에 있어서 대사물질농도의 이상을 판단할 수 있다. 예를 들면 대사물질 농도 이상 판단부(100)는 대사물질 m1과 대사물질 m2에 대하여 각각 대사물질농도의 이상이 있음을 판단할 수 있고, 또한 그에 따라 대사물질 m1에 대한 대사물질농도의 이상 표지로 M1을, 대사물질 m2에 대한 대사물질농도의 이상 표지로 M2를 결정할 수 있다.
다음으로는 대사물질 연관 질환 선별부(200)의 동작에 대하여 보다 상세히 설명한다.
대사물질 연관 질환 선별부(200)는 상기 대사물질농도에 이상이 있는 것으로 판단된 상기 대사물질에 대응하는 대사물질 연관 질환을 선별한다.
예를 들면 대사물질 m1에 대하여 대사물질농도에 이상이 있는 것으로 판단된 경우, 대사물질 m1에 대응하는 대사물질 연관 질환으로 D1을 선별할 수 있다. 또한 여기서 대사물질 연관 질환 선별부(200)는 하나의 대사물질에 대하여 복수개의 대사 물질 연관 질환을 선별할 수도 있다. 이와 같은 경우 예를 들면 대사물질 m1에 대응하는 대사물질 연관 질환으로 D1, D2를 선별할 수도 있다.
여기서 대사물질 연관 질환 선별부(200)는 대사물질농도의 이상 표지에 대응하는 대사물질 연관 질환을 선별할 수 있다. 위의 예에서 대사물질 m1에 대하여 대사물질농도의 이상 표지가 M1으로 결정된 경우, M1 표지에 대응하는 대사물질 연관 질환으로 D1이나 또는 D1, D2를 선별할 수 있다.
또한 여기서 대사물질 연관 질환 선별부(200)는 복수개의 대사물질에 대하여 대사물질농도에 이상이 있는 것으로 판단된 경우, 각 대사물질농도의 이상과 관련된 대사물질 연관 질환을 모두 선별할 수도 있다. 예를 들면 대사물질 m1, m2에 대하여 대사물질농도의 이상이 판단된 경우, m1과 관련된 대사물질 연관 질환으로 D1, D2를 선별하고, m2와 관련된 대사물질 연관 질환으로 D3을 선별할 수 있다.
여기서 대사물질 연관 질환 선별부(200)는 대사물질-대사질환 연관성 데이터베이스(10)를 참조하여, 상기 결정한 대사물질농도의 이상 표지에 대응하는 상기 대사물질 연관 질환을 검색하여 선별할 수 있다.
여기서 대사물질-대사질환 연관성 데이터베이스(10)는 각 대사물질 농도 이상 표지에 대응하는 대사 이상 질환을 대사물질 연관 질환으로 하여 저장할 수 있다. 예를 들면 대사물질-대사질환 연관성 데이터베이스(10)는 테이블의 형태로 각 대사물질 농도 이상 표지에 대응하는 대사물질 연관 질환을 저장할 수 있다.
도 3의 (a)는 대사물질-대사질환 연관성 데이터베이스(10)가 테이블(M2D 테이블)의 형태로 각 대사물질 농도 이상 표지에 대응하는 대사물질 연관 질환을 저장하는 일 예를 나타내는 참고도이다.
도 4는 대사물질 농도 이상 판단부(100)와 대사물질 연관 질환 선별부(200)의 동작을 설명하기 위한 참고도이다. 도 4와 같이 대사물질농도가 주어진 경우 대사물질 농도 이상 판단부(100)는 Phenylalanine에 대하여 대사물질농도의 이상 표지가 '약간 증가'임을 판단할 수 있고, 대사물질 연관 질환 선별부(200)는 Phenylalanine의 '약간 증가'에 해당하는 대사물질 연관 질환을 대사물질-대사질환 연관성 데이터베이스(10)에서 검색하여 선별할 수 있다.
여기서 본 발명에 다른 대사 이상 질환 검사 장치는 필요에 따라 유전자 변이 검출부(50)를 더 포함할 수도 있다.
유전자 변이 검출부(50)는 유전자 서열 정보 데이터를 입력받아, 상기 유전자 변이를 검출하고 변이의 종류를 분류하여 상기 유전자 변이 자료를 생성한다.
여기서 유전자 서열 정보 데이터는 예를 들어 유전자 변이를 검출하기 위한 데이터로 복수개의 DNA 단편에 대한 서열 정보 데이터가 될 수 있다. 예를 들면 NGS(next generation sequencing) 기법으로 생산된 수만 내지 수백만 개의 짧은 DNA 단편에 대한 서열 정보 데이터가 될 수 있다. 여기서 유전자 서열 정보 데이터는 예를 들면 NGS 시퀀싱 장치에서 생산되어 fastq 형태 또는 bam 파일 형태로 저장된 데이터가 될 수 있다.
유전자 변이로는 유전자의 염기서열에 대한 변이가 있을 수 있고, 또는 유전자의 복제 수에 대한 변이가 있을 수 있다.
도 5는 유전자 변이 검출부(50)의 세부 블록도이다.
유전자 변이 검출부(50)는 염기서열 변이 검출부(51) 또는 유전자 복제수 변이 검출부(52) 중 적어도 어느 하나 이상을 포함할 수 있다.
염기서열 변이 검출부(51)는 상기 입력받은 유전자 서열 정보 데이터에서 염기서열에 변이가 발생한 유전자 변이를 검출할 수 있다. 여기서 염기서열 변이 검출부(51)는 짧은 DNA 단편에 대한 서열 정보(sequencing reads)를 인간 참조 게놈(reference genome) (hg19 등)에 맵핑하고, 특정 영역에 맵핑된 서열 정보(sequencing reads)와 참조 게놈(reference genome)과의 불일치 부분을 찾아 염기서열의 변이를 검출할 수 있다.
유전자 복제수 변이 검출부(52)는 다음과 같은 단계를 거쳐 유전자 복제수 변이를 검출할 수 있다.
여기서 유전자 복제수 변이 검출부(52)는 PCR 기반의 target enrichment를 수행하여 인간 게놈에서 특정 관심 영역 (예, 대사 이상과 관련되어 있는 유전자들의 영역) 만을 선택적으로 증폭시킨 후 NGS를 수행하여 얻은 유전자 서열 정보 데이터에 대하여 유전자 복제수 변이를 검출할 수 있다.
먼저 유전자 복제수 변이 검출부(52)는 각 샘플에 대한 amplicon 별 reads count 값 계산할 수 있다. 여기서 NGS 원시 데이터(fastq)를 bwa 또는 torrent suite 등의 S/W 활용하는 등의 통상의 방법으로 reference genome에 맵핑한 후, 특정 amplicon 영역에 mapping되는 sequencing reads의 개수를 계산할 수 있다. 이때 두 개 이상의 amplicons과 겹치는 read의 경우에는 두 amplicon 중 더 많은 부분이 겹치는 amplicon 에만 assign하여 계산할 수 있다.
다음으로 유전자 복제수 변이 검출부(52)는 Normalized Reads Count 계산할 수 있다. 여기서 각 샘플 별로 amplicon에 대한 raw reads count 값을 해당 샘플의 전체 amplicons의 raw reads count 값에 대한 median 값 또는 mean 값 등의 대표 통계 값으로 나누어 각 amplicon에 대한 normalized reads count 값을 계산할 수 있다.
다음으로 유전자 복제수 변이 검출부(52)는 Baseline construction을 수행할 수 있다. 여기서 3개 이상의 표준샘플들에 대한 시퀀싱 데이터를 활용하여 각 amplicon별로 normalized reads count에 대한 통계 모델을 구축할 수 있고, 이때 각 amplicon별로 구축한 통계 모델을 baseline 이라고 한다. 여기서 각 amplicon에 대한 통계 모델은 가장 간단하게는 평균과 분산으로 이루어진 정규분포를 생각할 수 있다.{Baseline(ampk) = N(μk,σk2)} 여기서 k 번째 amplicon은 평균 μk, 표준편차 σk 를 갖는 정규분포의 통계 모델을 보인다.
다음으로 유전자 복제수 변이 검출부(52)는 유전자 복제수 변이 검출할 수 있다. 여기서 특정 검체의 시퀀싱 데이터로부터 각 amplicon 별로 normalized reads count 값을 구하고, 해당 amplicon의 baseline의 평균값과 대비한 log2 fold change 값과 baseline으로부터 평균에서 벗어난 정도에 대한 통계적 유의 값인 p-value 계산할 수 있다. 다음으로 특정 Exon에 포함된 amplicon에 대한 log2 fold change 값과 p-value를 통합하여 해당 exon에 대한 복제 수 상태를 추론할 수 있고, 이때 각 exon 에 대하여 전체 exon에 포함된 amplicons의 50% 이상의 amplicon이 log2 fold change 값과 p-value 값이 특정 값 이하인 경우(예, Heterozygote Deletion: log2 fold change < -0.75 & p-value < 0.05, Homozygote Deletion: log2 fold change < - 1.5 & p-value < 0.05) 해당 엑손에 유전자 복제수 변이가 있다고 판단할 수 있다.
여기서 유전자 복제수 변이 검출부(52)는 특정 Gene에 포함된 amplicon에 대한 log2 fold 값과 p-value를 통합하여 해당 gene에 대한 복제 수 상태를 추론할 수 있고, 이때 각 gene 에 대하여 전체 gene에 포함된 amplicons의 50% 이상의 amplicon이 log2 fold change 값과 p-value 값이 특정 값 이하인 경우(예, Heterozygote Deletion: log2 fold change < -0.75 & p-value < 0.05, Homozygote Deletion: log2 fold change < - 1.5 & p-value < 0.05) 해당 유전자에 유전자 복제수 변이가 있다고 판단할 수 있다.
다음으로는 유전자 상태 분류부(300)의 동작에 대하여 보다 상세히 설명한다.
유전자 상태 분류부(300)는 상기 검체에 대하여 검출된 유전자 변이에 관한 정보를 포함하는 유전자 변이 자료를 입력받고, 상기 유전자 변이를 미리 정해진 복수개의 유전자 상태 중 어느 하나로 분류한다.
여기서 유전자 변이는 유전자 서열 정보를 표준 참조 서열과 비교하여 검체의 유전자가 다른 염기조성을 갖는 것을 의미할 수 있고, 여기서 포준 참조 서열은 예를 들면 hg19 또는 hg38 등이 될 수 있다.
도 6은 유전자 변이에 관한 정보를 포함하는 유전자 변이 자료를 테이블 형태로 나타낸 참고도이다.
여기서 유전자 상태 분류부(300)는 유전자 변이 검출부(50)에서 상세히 설명한 바와 같이 유전자 서열 정보 데이터로부터 검출된 유전자 변이에 관한 정보를 입력받을 수 있다.
도 7은 유전자 상태 분류부(300)의 세부 블록도이다.
여기서 유전자 상태 분류부(300)는 필요에 따라 필터링부(310)를 포함할 수 있다.
필터링부(310)는 상기 입력받은 유전자 변이 자료에서 단순 다형성(polymorphism)에 해당하는 상기 유전자 변이를 필터링하여 제거할 수 있다.
검체에 대한 유전자 서열 정보를 표준 참조 서열과 비교하여 유전자 변이를 검출하였다고 하더라도, 특정 유전자 변이가 질환의 원인이 되는 유전자 변이인지 아니면 단순한 다형성(polymorphism) 인지를 구분하여야, 검체의 질환 여부를 판단할 수 있다. 따라서 필터링부(310)는 유전자 변이 중 단순 다형성에 해당하는 것을 제거한다.
여기서 단순 다형성에 해당하는 유전자 변이는 특정 인구 집단에 대하여 유전자 변이가 소정의 비율 이상으로 발생하는 유전자 변이를 의미할 수 있다. 이와 같이 특정 인구 집단에 대하여 일반적으로 발생할 수 있는 다형성이고 질환과는 관계성이 없다고 볼 수 있기 때문에, 단순 다형성으로 분류하여 필터링하는 것이 바람직하다.
예를 들면 검체의 유전자 변이 데이터를 각 인종 별로 대립 형질 빈도수(allele frequency) 값이 계산되거나 계산할 수 있는 있는 유전자 변이 DB에서 어느 한 인구에서라도 대립 형질 빈도수 값이 소정의 임계 값 이상이 되는 유전자 변이들을 단순 다형성에 해당하는 것으로 정의할 수 있다. 여기서 유전자 변이 DB는 예를 들어 dbSNP, 1000 genomes, ESP6500, ExAC 등이 될 수 있다. 예를 들면 필터링부(310)는 대립 형질 빈도수가 3% 이상이 되는 유전자 변이들을 단순 다형성으로 사전에 정의하고, 이에 해당하는 유전자 변이들을 상술한 바와 같이 필터링하여 제거할 수 있다. 또한 여기서 상기 임계 값은 필요에 따라 3%가 아닌 1% 또는 5%등 다양한 값으로 설정될 수 있음은 물론이다.
여기서 유전자 상태 분류부(300)는 필요에 따라 선택부(320)를 포함할 수 있다.
선택부(320)는 사용자의 선택 입력을 수신하고, 그에 따라 상기 유전자 변이 자료 중 상기 유전자 상태를 분류할 상기 유전자 변이를 선택할 수 있다. 선택부(320)를 통하여 사용자는 이후 분석에 특정 유전자 변이를 포함시킬지 여부를 선택할 수 있다. 여기서 사용자의 선택 입력은 키보드, 마우스, 터치 스크린 등의 다양한 사용자 인터페이스 장치를 이용하여 장치에 입력된 정보가 될 수 있다. 그리고 선택부(320)는 유전자 변이에 관한 정보를 출력할 수 있고, 상기 출력된 정보는 디스플레이 장치 등을 통하여 사용자에게 제공될 수 있다.
여기서 사용자에게 제공되는 유전자 변이에 관한 정보는 일반 인구군에서의 발생 빈도에 관한 정보, 질환 원인 유전자 변이 DB (예, ClinVar, HGMD, KMD 등) 에서의 등재 여부에 관한 정보, 내부 유전자 변이 DB 에서의 판단 여부에 관한 정보, in-silico tools (SIFT, Polyphen2, MutationTaster 등) 에서의 예측 값에 관한 정보 중 어느 하나 이상을 포함할 수 있다. 여기서 내부 유전자 변이 DB는 각 유전자의 염기서열 변이 별로 병원성(Pathogenic, VP), 병원성 가능(Likely Pathogenic, VLP), 양성(Benign, VB), 양성 가능(Likely Benign, VLB), 불확실(Uncertain Significance, VUS)으로 구분하여 저장해놓은 데이터베이스가 될 수 있다.
여기서 유전자 상태 분류부(300)는 필터링부(310)와 선택부(320) 중 적어도 어느 하나 이상을 포함할 수 있고, 필터링부(310)의 필터링 결과 또는 선택부(320)의 선택 결과에 대하여 유전자 상태를 분류할 수 있다. 유전자 상태 분류부(300)는 필터링부(310)와 선택부(320) 모두를 포함하는 경우, 필터링부(310)의 필터링을 수행한 다음 선택부(320)에서의 선택에 따라 유전자 상태를 분류할 유전자 변이를 선택할 수도 있다.
여기서 유전자 상태 분류부(300)는 변이 분류부(330)를 포함할 수 있다.
변이 분류부(330)는 유전자 상태 분류부(300)가 입력받은 유전자 변이 자료에 포함된 유전자 변이에 대하여 유전자 상태를 분류할 수 있다. 여기서 유전자 상태 분류부(300)가 필터링부(310)를 포함하는 경우, 변이 분류부(330)는 필터링부(310)에서 필터링된 후의 유전자 변이 자료에 포함된 유전자 변이에 대하여 유전자 상태를 분류할 수 있다. 또한 여기서 유전자 상태 분류부(300)가 선택부(320)를 포함하는 경우, 변이 분류부(330)는 선택부(320)에 의하여 선택된 유전자 변이에 대하여 유전자 상태를 분류할 수 있다.
변이 분류부(330)는 상기 유전자 변이 자료에 포함된 각 상기 유전자 변이를 상기 유전자 상태 중 어느 하나로 분류하되, 염기서열변이에 따른 유전자 상태 또는 유전자 복제 수 변이에 따른 유전자 상태 중 적어도 어느 하나 이상을 분류할 수 있다. 즉 변이 분류부(330)는 유전자 변이가 염기서열 변이에 따른 유전자 상태 중 어느 상태에 해당하는지를 분류할 수 있고, 또는/또한 유전자 변이가 유전자 복제 수 변이에 따른 유전자 상태 중 어느 상태에 해당하는지를 분류할 수도 있다.
여기서 변이 분류부(330)는 상기 유전자 변이에 대하여 상기 염기서열변이에 따른 유전자 상태를 분류하되, 동형접합(homozygote), 이형접합(heterozygote), 이중 대립형질 변이(bi-allelic variants), 복합 이형접합(compound heterozygote) 중 적어도 어느 하나 이상으로 분류할 수 있다.
여기서 염기서열 변이에 따른 유전자 상태는 동형접합(homozygote, HO), 이형접합(heterozygote, HE), 이중 대립형질 변이(bi-allelic variants, BI), 복합 이형접합(compound heterozygote, CE) 중 어느 하나가 될 수 있다.
상기 염기서열 변이에 따른 유전자 상태는 하기 표 1과 같이 정의될 수 있다.
유전자 상태 정 의
HO(Homozygote) 유전자에 포함된 최소 하나의 유전자 변이가 homozygote 변이인 경우.
CE(Compound Heterozygotes) 유전자에 두 개 이상의 heterozygotes 유전자 변이가 있는 경우, 또는 최소 두 개의 heterozygotes 유전자 변이가 서로 다른 두 대립 염색체 상에 존재하는지가 확인된 경우
BI(Bi-Allelic Heterozygotes) 유전자에 두 개 이상의 heterozygotes 유전자 변이가 있지만, 유전자 변이들의 서로 다른 두 대립 염색체 상에 존재하는지 여부가 확인되지 않았거나, 모든 유전자 변이들이 하나의 동일한 염색체 상에서만 존재하는 경우
HE (Heterozygote) 유전자에 단 하나의 유전자 변이만 있으며, 해당 유전자 변이가 heterozygote인 경우
여기서 변이 분류부(330)는 상기 유전자 변이에 대하여 상기 유전자 복제 수 변이에 따른 유전자 상태를 분류하되, 복제 수 증가(Gain), 복제수 변이 미발견(Neutral), 이형접합 삭제(heterozygote deletion, HED), 동형접합 삭제(homozygote deletion) 또는 단가접합 삭제(hemizygote deletion)(HOD) 중 적어도 어느 하나 이상으로 분류할 수 있다. 여기서 HOD는 동형접합 삭제(homozygote deletion) 또는 단가접합 삭제(hemizygote deletion) 중 어느 하나의 상태를 모두 지칭하는 약어로 사용한다.
상기 유전자 복제 수 변이에 따른 유전자 상태는 하기 표 2와 같이 정의될 수 있다.
유전자 상태 정의
HOD(Homozygote Deletion or Hemizygote Deletion) 유전자 전부 또는 유전자의 특정 부분이 두 개의 대립 염색체에서 모두 deletion 된 경우 (homozygote deletion) 또는 성 염색체처럼 하나의 세포 내에 하나의 염색체만 있는 경우에는 해당 염색체에서 유전자 전부 또는 유전자의 특정 부분이 deletion 된 경우(Hemizygote deletion)를 포함.
HED(Heterozygote Deletion) 유전자 전부 또는 유전자의 특정 부분이 두 개의 대립 염색체 중 하나의 대립 염색체상에서만 deletion 된 경우(heterozygote deletion).
Neutral 유전자에 대한 복제수 변이가 발견되지 않은 경우
Gain 유전자 전부 또는 유전자의 특정 부위에 대한 복제수가 증가한 경우
여기서 변이 분류부(330)는 유전자 변이 검출부(50)에서 유전자 변이의 유전자 상태 중 일부 또는 전부가 분류되어 유전자 변이 자료에 해당 분류 정보가 포함된 경우, 해당 유전자 변이에 대하여 기 분류된 유전자 상태에 관한 정보를 그대로 이용하여, 유전자 변이에 대한 유전자 상태를 결정할 수도 있다.
다음으로는 유전자 연관 질환 선별부(400)에 대하여 보다 상세히 설명한다.
유전자 연관 질환 선별부(400)는 상기 유전자 상태가 분류된 상기 유전자 변이에 대응하는 유전자 연관 질환을 선별한다. 여기서 유전자 연관 질환 선별부(400)는 유전자 변이 자료에 포함된 유전자 변이 중에서 필터링부(310) 또는 선택부(320)에 의하여 필터링되거나 선택된 결과, 남은 유전자 변이 즉 남아서 유전자 상태가 분류된 유전자 변이에 대하여 유전자 연관 질환을 선별할 수 있다.
여기서 유전자 연관 질환 선별부(400)는 유전자 변이 데이터베이스(20)를 참조하여, 상기 유전자 상태가 분류된 유전자 변이에 대응하는 상기 유전자 연관 질환을 검색하여 선별할 수 있다.
예를 들어 유전자 연관 질환 선별부(400)는 유전자 변이 G1에 대응하는 유전자 연관 질환으로 D1을 유전자 변이 데이터베이스(20)에서 검색하여 선별할 수 있다. 또는 경우에 따라 유전자 연관 질환으로 복수 개를 선별할 수도 있다(D1, D2).
여기서 유전자 변이 데이터베이스(10)는 각 유전자 또는 유전자의 변이에 대응하는 대사 이상 질환을 유전자 연관 질환으로 하여 저장할 수 있다. 예를 들면 유전자 변이 데이터베이스(10)는 테이블의 형태로 각 유전자 또는 유전자 변이에 대응하는 유전자 연관 질환을 저장할 수 있다.
도 3의 (b)는 유전자 변이 데이터베이스(10)가 테이블(G2D 테이블)의 형태로 각 유전자에 대응하는 유전자 연관 질환을 저장하는 일 예를 나타내는 참고도이다.
여기서 유전자 연관 질환 선별부(400)는 상기 선별한 유전자 연관 질환에 대응하는 상기 유전자 변이의 상기 유전자 상태의 종류에 따라 상기 선별한 유전자 연관 질환의 선별 정확도를 설정할 수 있다. 여기서 선별 정확도는 상기 유전자 변이에 대응하는 유전자 연관 질환이 어느 정도의 정확도를 가지고 선별된 것인지를 나타내는 정도 또는 매칭된 정도를 나타내는 값으로, 미리 정의된 복수개의 값 중 어느 하나로 설정될 수 있다. 예를 들면 상기 선별 정확도는 1 내지 4단계를 가질 수 있고, 각 단계는 선별 정확도가 높은 순서대로 1 단계는 '일치'(Consistent with), 2 단계는 '가능성 상'(Most likely), 3 단계는 '의심'(Rule Out, R/O), 4 단계는 '가능성 하'(Less likely)로 설정될 수 있다. 여기서 상기 선별 정확도의 각 단계가 4단계가 아닌 다른 수의 단계가 될 수 있고, 각 단계의 이름이 필요에 따라 다른 이름으로 설정될 수 있음은 물론이다.
여기서 유전자 연관 질환 선별부(400)는, 상기 선별한 유전자 연관 질환에 대응하는 상기 유전자 변이의 상기 유전자 상태의 종류가 동형접합(homozygote, HO), 복합 이형접합(compound heterozygote, CE), 동형접합 삭제(homozygote deletion) 또는 단가접합 삭제(hemizygote deletion)(HOD) 중 적어도 어느 하나에 해당하는지 여부, 또는 상기 선별한 유전자 연관 질환의 개수에 따라, 상기 선별 정확도를 설정할 수 있다.
여기서 유전자 연관 질환 선별부(400)는 유전자 상태 분류부(300)에 의하여 분류된 유전자 상태에 대응하는 유전자 변이
바람직하게는 유전자 연관 질환 선별부(400)는 상기 선별한 유전자 연관 질환에 대응하는 상기 유전자 변이의 상기 유전자 상태의 종류와 유전자 연관 질환의 개수에 관하여, 도 12의 표 3에 기재된 것과 같은 기준 및 조건에 따라 선별된 유전자 연관 질환의 선별 정확도를 설정할 수 있다.
도 8은 유전자 상태 분류부(300), 유전자 연관 질환 선별부(400)의 동작을 설명하기 위한 참고도이다. 도 8과 같이 검체의 유전자 변이에 관한 정보가 입력되면 유전자 상태 분류부(300)가 유전자 변이의 종류에 따라 유전자 상태를 분류할 수 있고, 유전자 연관 질환 선별부(400)가 분류한 유전자 상태 정보를 이용하여 유전자 연관 질환을 선별할 수 있다.
다음으로는 통합 분석부(500)의 동작에 대하여 보다 상세히 설명한다.
통합 분석부(500)는 상기 선별한 대사물질 연관 질환 또는 유전자 연관 질환에 포함된 질환을 후보 질환으로 설정하고, 상기 후보 질환에 대응하는 상기 유전자 변이의 상기 유전자 상태의 종류에 따라 상기 후보 질환이 상기 검체의 대사 이상 질환에 해당하는지 여부에 관한 정보를 결정한다.
여기서 통합 분석부(500)는 상기 후보 질환에 대응하는 상기 유전자 변이의 상기 유전자 상태의 종류에 관한 정보와, 상기 후보 질환이 상기 대사물질 연관 질환 또는 유전자 연관 질환에 해당하는지 여부에 관한 정보를 이용하여, 상기 후보 질환이 상기 검체의 대사 이상 질환에 해당하는지 여부에 관한 정보를 결정할 수 있다.
여기서 통합 분석부(500)는 상기 후보 질환에 대응하는 상기 유전자 변이의 상기 유전자 상태의 종류에 관한 정보와, 상기 후보 질환이 상기 대사물질 연관 질환 또는 유전자 연관 질환에 모두 해당하는지 또는 어느 하나에 해당하는지 여부에 관한 정보를 이용하여, 상기 후보 질환이 상기 검체의 대사 이상 질환에 해당하는지 여부에 관한 매칭 점수를 산출할 수 있다. 여기서 상기 후보 질환이 상기 검체의 대사 이상 질환에 해당하는지 여부에 관한 정보는 상기 매칭 점수가 될 수 있다. 여기서 상기 매칭 점수는 소정의 범위를 가지는 점수가 될 수 있고, 또는 순위를 나타내는 순위 점수가 될 수 있고, 필요에 따라 기타 다양한 방식으로 표현될 수 있다. 예를 들면 상기 매칭 점수는 0 점 내지 M 점의 범위를 가지는 점수의 형태로 표현될 수 있고, 또는 1 순위 내지 N 순위의 범위를 가지는 순위 점수가 될 수도 있다.
예를 들면 통합 분석부(500)는 도 13의 표 4와 같이 상기 후보 질환이 상기 대사물질 연관 질환 또는 유전자 연관 질환에 모두 해당하는지 또는 어느 하나에 해당하는지 여부에 관한 정보와 상기 후보 질환에 대응하는 상기 유전자 변이의 상기 유전자 상태의 종류에 관한 정보에 따라 상기 매칭 점수를 1 내지 6 중에서 결정할 수 있다.
또한 통합 분석부(500)는 상기 후보 질환에 대응하는 상기 유전자 변이의 상기 유전자 상태의 종류에 관한 정보와, 상기 후보 질환이 상기 대사물질 연관 질환 또는 유전자 연관 질환에 모두 해당하는지 또는 어느 하나에 해당하는지 여부에 관한 정보를 이용하여, 상기 후보 질환이 상기 검체의 대사 이상 질환에 해당하는지 여부에 관한 상기 대사 이상 질환의 선별 정확도를 설정할 수 있다.
여기서 대사 이상 질환의 선별 정확도는 상술한 바 유전자 연관 질환의 선별 정확도와 유사하게 정의될 수 있다. 즉 대사 이상 질환의 선별 정확도는 대사 이상 질환이 어느 정도의 정확도를 가지고 선별된 것인지를 나타내는 정도 또는 매칭된 정도를 나타내는 값으로, 미리 정의된 복수개의 값 중 어느 하나로 설정될 수 있다. 예를 들면 상기 선별 정확도는 1 내지 4단계를 가질 수 있고, 각 단계는 선별 정확도가 높은 순서대로 1 단계는 '일치'(Consistent with), 2 단계는 '가능성 상'(Most likely), 3 단계는 '의심'(Rule Out, R/O), 4 단계는 '가능성 하'(Less likely)로 설정될 수 있다. 여기서 상기 선별 정확도의 각 단계가 4단계가 아닌 다른 수의 단계가 될 수 있고, 각 단계의 이름이 필요에 따라 다른 이름으로 설정될 수 있음은 물론이다.
바람직하게는 통합 분석부(500)는 상기 후보 질환이 상기 대사물질 연관 질환 또는 유전자 연관 질환에 모두 해당하는지 또는 어느 하나에 해당하는지 여부에 관한 정보와 상기 후보 질환에 대응하는 상기 유전자 변이의 상기 유전자 상태의 종류에 관한 정보에 따라 상기 매칭 점수를 결정한 다음, 상기 매칭 점수를 더 이용하여 상기 대사 이상 질환의 선별 정확도를 설정할 수 있다.
예를 들면 통합 분석부(500)는 도 13의 표 4와 같이 상기 후보 질환이 상기 대사물질 연관 질환 또는 유전자 연관 질환에 모두 해당하는지 또는 어느 하나에 해당하는지 여부에 관한 정보와 상기 후보 질환에 대응하는 상기 유전자 변이의 상기 유전자 상태의 종류에 관한 정보에 따라 상기 매칭 점수를 1 내지 6 중에서 결정한 다음, 대사 이상 질환에 대한 선별 정확도를 최종적으로 설정할 수 있다.
여기서 통합 분석부(500)는 상기 후보 질환이 상기 검체의 대사 이상 질환에 해당하는지 여부에 관한 정보에 따라 상기 검체에 대한 상기 대사 이상 질환을 판단할 수 있다. 여기서 도 13의 표 4에서 매칭 점수가 소정의 기준 이하로 낮은(순위가 소정의 기준 이상으로 가장 높은) 후보 질환이 해당 검체의 대사 이상 질환이라고 판단할 수 있고, 또한 대사 이상 질환에 대한 선별 정확도에 따라 해당 검체에 대하여 대사 이상 질환이 어느 정도의 정확도를 가지고 선별되었는지 여부를 판단할 수 있다.
상기 표 4에서 상위순위 질환이라 함은, 후보 질환이 2개 이상 존재할 경우, 후보 질환 중 더 높은 매칭 점수를 갖는 질환을 상위순위 질환이라 지칭한다.
예를 들어 A라는 후보 질환이 매칭 점수 1을 갖고, B라는 후보 질환이 매칭 점수 2를 가질 경우, 매칭 점수 1을 갖는 후보 질환이 우선적으로 고려될 수 있는 질환이므로, 통합 분석부(500)는 매칭 점수 2를 갖는 B 질환에 대하여는 Less Likely 라는 대사 이상 질환의 선별 정확도를 설정할 수 있다. 여기서 만일 매칭 점수가 B보다 높은 질환이 없는 경우는 B 질환에 대하여 Most Likely라는 선별 정확도를 설정할 수 있다.
여기서 매칭 점수는 순위 점수의 형태로 나타나므로 더 작은 숫자가 더 높은 매칭 점수를 가지는 것으로 정의할 수 있다. 즉 예를 들면 매칭 점수 1이 매칭 점수 2 보다 상위 순위가 된다. 여기서 매칭 점수는 필요에 따라 다양한 값이나 순서를 가지도록 정의되어 사용될 수 있음은 물론이다.
여기서 만일 동률의 최고 높은 매칭 점수를 갖는 후보 질환이 2개 이상인 경우는 해당 후보 질환들에 대해서는 상위순위 질환이 없는 것으로 하여 선별 정확도를 설정할 수도 있다.
도 9는 통합 분석부(500)의 분석 결과의 일 예를 나타내는 참고도이다.
본 발명의 또 다른 실시예에 따른 대사 이상 질환 검사 방법은 대사물질 농도 이상 판단 단계(S100), 대사물질 연관 질환 선별 단계(S200), 유전자 상태 분류 단계(S300), 유전자 연관 질환 선별 단계(S400), 통합 분석 단계(S500)를 포함할 수 있다. 여기서 상기 대사 이상 질환 검사 방법은 도 1 내지 도 8을 참조하면서 상세히 설명한 본 발명에 따른 대사 이상 질환 검사 장치가 동작하는 방법과 동일한 방식으로 동작할 수 있다. 또한 상기 대사 이상 질환 검사 방법은 본 발명에 따른 대사 이상 질환 검사 장치의 각 구성 부분에 의하여 상술한 바와 같이 수행될 수 있다. 이에 중복되는 부분은 생략하고 간략하게 설명한다.
도 10은 상기 본 발명에 따른 대사 이상 질환 검사 방법의 흐름도이다.
대사물질 농도 이상 판단 단계(S100)는 검체에 대한 각 대사물질 별 대사물질농도 값을 입력받고, 상기 입력받은 대사물질농도를 상기 대사물질 별 기준 농도와 비교하여 상기 대사물질농도의 이상 여부를 판단한다.
대사물질 연관 질환 선별 단계(S200)는 상기 대사물질농도에 이상이 있는 것으로 판단된 상기 대사물질에 대응하는 대사물질 연관 질환을 선별한다.
유전자 상태 분류 단계(S300)는 상기 검체에 대하여 검출된 유전자 변이에 관한 정보를 포함하는 유전자 변이 자료를 입력받고, 상기 유전자 변이를 미리 정해진 복수개의 유전자 상태 중 어느 하나로 분류한다.
유전자 연관 질환 선별 단계(S400)는 상기 유전자 상태가 분류된 상기 유전자 변이에 대응하는 유전자 연관 질환을 선별한다.
통합 분석 단계(S500)는 상기 선별한 대사물질 연관 질환 또는 유전자 연관 질환에 포함된 질환을 후보 질환으로 설정하고, 상기 후보 질환에 대응하는 상기 유전자 변이의 상기 유전자 상태의 종류에 따라 상기 후보 질환이 상기 검체의 대사 이상 질환에 해당하는지 여부에 관한 정보를 결정한다.
여기서 대사물질 농도 이상 판단 단계(S100)는 상기 대사물질농도를 상기 기준 농도와 비교하여, 농도의 증감 여부 또는 증감의 정도에 따라 상기 대사물질농도의 이상 표지를 결정할 수 있다.
다음으로 대사물질 연관 질환 선별 단계(S200)는 대사물질-대사질환 연관성 데이터베이스(10)를 참조하여, 상기 결정한 대사물질농도의 이상 표지에 대응하는 상기 대사물질 연관 질환을 검색하여 선별할 수 있다.
여기서 유전자 상태 분류 단계(S300)는 필터링 단계(S310), 변이 분류 단계(S320)를 포함할 수 있다.
도 11은 유전자 상태 분류 단계(S300)의 세부 흐름도이다.
필터링 단계(S310)는 입력받은 유전자 변이 자료에서 단순 다형성(polymorphism)에 해당하는 상기 유전자 변이를 필터링하여 제거하여, 상기 유전자 상태를 분류할 상기 유전자 변이에 대한 필터링을 수행할 수 있다.
변이 분류 단계(S320)는 상기 유전자 변이 자료에 포함된 각 상기 유전자 변이를 상기 유전자 상태 중 어느 하나로 분류하되, 염기서열변이에 따른 유전자 상태 또는 유전자 복제 수 변이에 따른 유전자 상태 중 적어도 어느 하나 이상을 분류한다.
유전자 연관 질환 선별 단계(S400)는 상기 선별한 유전자 연관 질환에 대응하는 상기 유전자 변이의 상기 유전자 상태의 종류에 따라 상기 선별한 유전자 연관 질환의 선별 정확도를 설정할 수 있다.
통합 분석 단계(S500)는 상기 후보 질환에 대응하는 상기 유전자 변이의 상기 유전자 상태의 종류에 관한 정보와, 상기 후보 질환이 상기 대사물질 연관 질환 또는 유전자 연관 질환에 모두 해당하는지 또는 어느 하나에 해당하는지 여부에 관한 정보를 이용하여, 상기 후보 질환이 상기 검체의 대사 이상 질환에 해당하는지 여부에 관한 매칭 점수 또는 상기 대사 이상 질환의 선별 정확도 중 적어도 어느 하나 이상을 설정할 수 있다.
도 12는 본 발명의 일 실시예에 따른 유전자 연관 질환을 선별하는 데 있어서 사용되는 표를 도시한 도면이다.
도 12에 도시된 바와 같이, 유전자 연관 질환을 선별하는 경우, 유전자와 관련된 유전자 질환에 대한 기준들인 유전자 연관 질환이 1개 선별된 경우, 유전자 연관 질환이 2개 이상 선별된 경우(HO, CE, HOD의 유전자 상태가 없는 경우), 유전자 연관 질환이 2개 이상 선별된 경우(HO, CE, HOD의 유전자 상태가 있는 경우)에 의하여 유전자 연관 질환 선별 정확도를 구분할 수 있다.
도 13은 본 발명의 일 실시예에 따른 대사물질 농도 이상과 변이 정보를 통합 분석하는 방법에 관련된 표를 도시한 도면이다.
보다 상세하게는 특정 대사물질 농도이상 표지와 연결된 유전자 연관 질환 집합과 특정 유전자와 연결된 유전자 연관 질환 집합을 통해, 추출한 유전자 연관 질환들 사이에서 도 13과 같은 방법으로 접수화를 시킬 수 있다.
이상에서 설명한 본 발명의 실시예를 구성하는 모든 구성요소들이 하나로 결합하거나 결합하여 동작하는 것으로 기재되어 있다고 해서, 본 발명이 반드시 이러한 실시예에 한정되는 것은 아니다. 즉, 본 발명의 목적 범위 안에서라면, 그 모든 구성요소들이 하나 이상으로 선택적으로 결합하여 동작할 수도 있다.
또한, 그 모든 구성요소들이 각각 하나의 독립적인 하드웨어로 구현될 수 있지만, 각 구성요소들의 그 일부 또는 전부가 선택적으로 조합되어 하나 또는 복수개의 하드웨어에서 조합된 일부 또는 전부의 기능을 수행하는 프로그램 모듈을 갖는 컴퓨터 프로그램으로서 구현될 수도 있다. 또한, 이와 같은 컴퓨터 프로그램은 USB 메모리, CD 디스크, 플래쉬 메모리 등과 같은 컴퓨터가 읽을 수 있는 기록매체(Computer Readable Media)에 저장되어 컴퓨터에 의하여 읽혀지고 실행됨으로써, 본 발명의 실시예를 구현할 수 있다. 컴퓨터 프로그램의 기록매체로서는 자기 기록매체, 광 기록매체, 캐리어 웨이브 매체 등이 포함될 수 있다.
또한, 기술적이거나 과학적인 용어를 포함한 모든 용어들은, 상세한 설명에서 다르게 정의되지 않는 한, 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에 의해 일반적으로 이해되는 것과 동일한 의미를 갖는다. 사전에 정의된 용어와 같이 일반적으로 사용되는 용어들은 관련 기술의 문맥상의 의미와 일치하는 것으로 해석되어야 하며, 본 발명에서 명백하게 정의하지 않는 한, 이상적이거나 과도하게 형식적인 의미로 해석되지 않는다.
이상의 설명은 본 발명의 기술 사상을 예시적으로 설명한 것에 불과한 것으로서, 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자라면 본 발명의 본질적인 특성에서 벗어나지 않는 범위 내에서 다양한 수정, 변경 및 치환이 가능할 것이다. 따라서, 본 발명에 개시된 실시예 및 첨부된 도면들은 본 발명의 기술 사상을 한정하기 위한 것이 아니라 설명하기 위한 것이고, 이러한 실시예 및 첨부된 도면에 의하여 본 발명의 기술 사상의 범위가 한정되는 것은 아니다. 본 발명의 보호 범위는 아래의 청구 범위에 의하여 해석되어야 하며, 그와 동등한 범위 내에 있는 모든 기술 사상은 본 발명의 권리 범위에 포함되는 것으로 해석되어야 할 것이다.

Claims (20)

  1. 대사 이상 질환 검사 장치에 있어서,
    검체에 대한 각 대사물질 별 대사물질농도 값을 입력받고, 상기 입력받은 대사물질농도를 상기 대사물질 별 기준 농도와 비교하여 상기 대사물질농도의 이상 여부를 판단하는 대사물질 농도 이상 판단부;
    상기 대사물질농도에 이상이 있는 것으로 판단된 상기 대사물질에 대응하는 대사물질 연관 질환을 선별하는 대사물질 연관 질환 선별부;
    상기 검체에 대하여 검출된 유전자 변이에 관한 정보를 포함하는 유전자 변이 자료를 입력받고, 상기 유전자 변이를 미리 정해진 복수개의 유전자 상태 중 어느 하나로 분류하는 유전자 상태 분류부;
    상기 유전자 상태가 분류된 상기 유전자 변이에 대응하는 유전자 연관 질환을 선별하는 유전자 연관 질환 선별부; 및
    상기 선별한 대사물질 연관 질환 또는 유전자 연관 질환에 포함된 질환을 후보 질환으로 설정하고, 상기 후보 질환에 대응하는 상기 유전자 변이의 상기 유전자 상태의 종류에 따라 상기 후보 질환이 상기 검체의 대사 이상 질환에 해당하는지 여부에 관한 정보를 결정하는 통합 분석부를 포함하는 것을 특징으로 하는 대사 이상 질환 검사 장치.
  2. 제1항에 있어서,
    유전자 서열 정보 데이터를 입력받아, 상기 유전자 변이를 검출하고 변이의 종류를 분류하여 상기 유전자 변이 자료를 생성하는 유전자 변이 검출부를 더 포함하는 것을 특징으로 하는 대사 이상 질환 검사 장치.
  3. 제1항에 있어서,
    상기 대사물질 농도 이상 판단부는 상기 대사물질농도를 상기 기준 농도와 비교하여, 농도의 증감 여부 또는 증감의 정도에 따라 상기 대사물질농도의 이상 표지를 결정하는 것을 특징으로 하는 대사 이상 질환 검사 장치.
  4. 제3항에 있어서,
    상기 대사물질 연관 질환 선별부는 대사물질-대사질환 연관성 데이터베이스를 참조하여, 상기 결정한 대사물질농도의 이상 표지에 대응하는 상기 대사물질 연관 질환을 검색하여 선별하는 것을 특징으로 하는 대사 이상 질환 검사 장치.
  5. 제1항에 있어서,
    상기 유전자 상태 분류부는 상기 입력받은 유전자 변이 자료에서 단순 다형성(polymorphism)에 해당하는 상기 유전자 변이를 제거하여, 상기 유전자 상태를 분류할 상기 유전자 변이에 대한 필터링을 수행하는 필터링부를 포함하는 것을 특징으로 하는 대사 이상 질환 검사 장치.
  6. 제1항에 있어서,
    상기 유전자 상태 분류부는 사용자의 선택 입력을 수신하고, 그에 따라 상기 유전자 변이 자료 중 상기 유전자 상태를 분류할 상기 유전자 변이를 선택하는 선택부를 포함하는 것을 특징으로 하는 대상 이상 질환 검사 장치.
  7. 제1항에 있어서,
    상기 유전자 상태 분류부는 상기 유전자 변이 자료에 포함된 각 상기 유전자 변이를 상기 유전자 상태 중 어느 하나로 분류하되, 염기서열변이에 따른 유전자 상태 또는 유전자 복제 수 변이에 따른 유전자 상태 중 적어도 어느 하나 이상을 분류하는 변이 분류부를 포함하는 것을 특징으로 하는 대상 이상 질환 검사 장치.
  8. 제7항에 있어서,
    상기 변이 분류부는 상기 유전자 변이에 대하여 상기 염기서열변이에 따른 유전자 상태를 분류하되, 동형접합(homozygote), 이형접합(heterozygote), 이중 대립형질 변이(bi-allelic variants), 복합 이형접합(compound heterozygote) 중 적어도 어느 하나 이상으로 분류하는 것을 특징으로 하는 대사 이상 질환 검사 장치.
  9. 제7항에 있어서,
    상기 변이 분류부는 상기 유전자 변이에 대하여 상기 유전자 복제 수 변이에 따른 유전자 상태를 분류하되, 복제 수 증가, 복제 수 변이 미발견, 이형접합 삭제(heterozygote deletion), 동형접합 삭제(homozygote deletion), 단가접합 삭제(hemizygote deletion) 중 적어도 어느 하나 이상으로 분류하는 것을 특징으로 하는 대사 이상 질환 검사 장치.
  10. 제1항에 있어서,
    상기 유전자 연관 질환 선별부는 유전자 변이 데이터베이스를 참조하여, 상기 유전자 상태가 분류된 상기 유전자 변이에 대응하는 상기 유전자 연관 질환을 검색하여 선별하는 것을 특징으로 하는 대사 이상 질환 검사 장치.
  11. 제1항에 있어서,
    상기 유전자 연관 질환 선별부는 상기 선별한 유전자 연관 질환에 대응하는 상기 유전자 변이의 상기 유전자 상태의 종류에 따라 상기 선별한 유전자 연관 질환의 선별 정확도를 설정하는 것을 특징으로 하는 대사 이상 질환 검사 장치.
  12. 제11항에 있어서,
    상기 유전자 연관 질환 선별부는, 상기 선별한 유전자 연관 질환에 대응하는 상기 유전자 변이의 상기 유전자 상태의 종류가 동형접합(homozygote), 복합 이형접합(compound heterozygote), 동형접합 삭제(homozygote deletion), 단가접합 삭제(hemizygote deletion) 중 적어도 어느 하나에 해당하는지 여부, 또는 상기 선별한 유전자 연관 질환의 개수에 따라, 상기 선별 정확도를 설정하는 것을 특징으로 하는 대사 이상 질환 검사 장치.
  13. 제1항에 있어서,
    상기 통합 분석부는 상기 후보 질환에 대응하는 상기 유전자 변이의 상기 유전자 상태의 종류에 관한 정보와, 상기 후보 질환이 상기 대사물질 연관 질환 또는 유전자 연관 질환에 해당하는지 여부에 관한 정보를 이용하여, 상기 후보 질환이 상기 검체의 대사 이상 질환에 해당하는지 여부에 관한 정보를 결정하는 것을 특징으로 하는 대사 이상 질환 검사 장치.
  14. 제13항에 있어서,
    상기 통합 분석부는 상기 후보 질환에 대응하는 상기 유전자 변이의 상기 유전자 상태의 종류에 관한 정보와, 상기 후보 질환이 상기 대사물질 연관 질환 또는 유전자 연관 질환에 모두 해당하는지 또는 어느 하나에 해당하는지 여부에 관한 정보를 이용하여, 상기 후보 질환이 상기 검체의 대사 이상 질환에 해당하는지 여부에 관한 매칭 점수를 산출하는 것을 특징으로 하는 대사 이상 질환 검사 장치.
  15. 제13항에 있어서,
    상기 통합 분석부는 상기 후보 질환에 대응하는 상기 유전자 변이의 상기 유전자 상태의 종류에 관한 정보와, 상기 후보 질환이 상기 대사물질 연관 질환 또는 유전자 연관 질환에 모두 해당하는지 또는 어느 하나에 해당하는지 여부에 관한 정보를 이용하여, 상기 후보 질환이 상기 검체의 대사 이상 질환에 해당하는지 여부에 관한 상기 대사 이상 질환의 선별 정확도를 설정하는 것을 특징으로 하는 대사 이상 질환 검사 장치.
  16. 제1항에 있어서,
    상기 통합 분석부는 상기 후보 질환이 상기 검체의 대사 이상 질환에 해당하는지 여부에 관한 정보에 따라 상기 검체에 대한 상기 대사 이상 질환을 판단하는 것을 특징으로 하는 대사 이상 질환 검사 장치.
  17. 대사 이상 질환 검사 방법에 있어서,
    검체에 대한 각 대사물질 별 대사물질농도 값을 입력받고, 상기 입력받은 대사물질농도를 상기 대사물질 별 기준 농도와 비교하여 상기 대사물질농도의 이상 여부를 판단하는 대사물질 농도 이상 판단 단계;
    상기 대사물질농도에 이상이 있는 것으로 판단된 상기 대사물질에 대응하는 대사물질 연관 질환을 선별하는 대사물질 연관 질환 선별 단계;
    상기 검체에 대하여 검출된 유전자 변이에 관한 정보를 포함하는 유전자 변이 자료를 입력받고, 상기 유전자 변이를 미리 정해진 복수개의 유전자 상태 중 어느 하나로 분류하는 유전자 상태 분류 단계;
    상기 유전자 상태가 분류된 상기 유전자 변이에 대응하는 유전자 연관 질환을 선별하는 유전자 연관 질환 선별 단계; 및
    상기 선별한 대사물질 연관 질환 또는 유전자 연관 질환에 포함된 질환을 후보 질환으로 설정하고, 상기 후보 질환에 대응하는 상기 유전자 변이의 상기 유전자 상태의 종류에 따라 상기 후보 질환이 상기 검체의 대사 이상 질환에 해당하는지 여부에 관한 정보를 결정하는 통합 분석 단계를 포함하는 것을 특징으로 하는 대사 이상 질환 검사 방법.
  18. 제17항에 있어서,
    상기 대사물질 농도 이상 판단 단계는 상기 대사물질농도를 상기 기준 농도와 비교하여, 농도의 증감 여부 또는 증감의 정도에 따라 상기 대사물질농도의 이상 표지를 결정하고,
    상기 대사물질 연관 질환 선별 단계는 대사물질-대사질환 연관성 데이터베이스를 참조하여, 상기 결정한 대사물질농도의 이상 표지에 대응하는 상기 대사물질 연관 질환을 검색하여 선별하는 것을 특징으로 하는 대사 이상 질환 검사 방법.
  19. 제17항에 있어서, 상기 유전자 상태 분류 단계는
    상기 입력받은 유전자 변이 자료에서 단순 다형성(polymorphism)에 해당하는 상기 유전자 변이를 제거하여, 상기 유전자 상태를 분류할 상기 유전자 변이에 대한 필터링을 수행하는 필터링 단계; 및
    상기 유전자 변이 자료에 포함된 각 상기 유전자 변이를 상기 유전자 상태 중 어느 하나로 분류하되, 염기서열변이에 따른 유전자 상태 또는 유전자 복제 수 변이에 따른 유전자 상태 중 적어도 어느 하나 이상을 분류하는 변이 분류 단계;를 포함하는 것을 특징으로 하는 대상 이상 질환 검사 방법.
  20. 제17항에 있어서,
    상기 통합 분석 단계는 상기 후보 질환에 대응하는 상기 유전자 변이의 상기 유전자 상태의 종류에 관한 정보와, 상기 후보 질환이 상기 대사물질 연관 질환 또는 유전자 연관 질환에 모두 해당하는지 또는 어느 하나에 해당하는지 여부에 관한 정보를 이용하여, 상기 후보 질환이 상기 검체의 대사 이상 질환에 해당하는지 여부에 관한 매칭 점수 또는 상기 대사 이상 질환의 선별 정확도 중 적어도 어느 하나 이상을 설정하는 것을 특징으로 하는 대사 이상 질환 검사 방법.
PCT/KR2016/013131 2015-11-19 2016-11-15 대사 이상 질환 진단 장치 및 그 방법 WO2017086675A1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR10-2015-0162860 2015-11-19
KR1020150162860A KR101795662B1 (ko) 2015-11-19 2015-11-19 대사 이상 질환 진단 장치 및 그 방법

Publications (1)

Publication Number Publication Date
WO2017086675A1 true WO2017086675A1 (ko) 2017-05-26

Family

ID=58717580

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/KR2016/013131 WO2017086675A1 (ko) 2015-11-19 2016-11-15 대사 이상 질환 진단 장치 및 그 방법

Country Status (2)

Country Link
KR (1) KR101795662B1 (ko)
WO (1) WO2017086675A1 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110322963A (zh) * 2019-07-04 2019-10-11 成都新基因格生物科技有限公司 一种新生儿遗传代谢病检测分析方法、装置及系统

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102147847B1 (ko) 2018-11-29 2020-08-25 가천대학교 산학협력단 질환 진단 보조를 위한 데이터 분석 방법 및 시스템
CN111540407B (zh) * 2020-04-13 2023-06-27 中南大学湘雅医院 一种整合多种神经发育性疾病筛选候选基因的方法
KR102574100B1 (ko) 2022-06-07 2023-09-01 (재)씨젠의료재단 신생아의 선천성 대사 이상 검사에 대한 소견 생성 자료 제공 시스템
KR102574098B1 (ko) 2022-06-07 2023-09-01 (재)씨젠의료재단 신생아의 선천성 대사 이상 검사에 대한 소견 생성 자료 제공 방법 및 장치

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20020075265A (ko) * 2001-03-20 2002-10-04 오르토-클리니칼 다이아그노스틱스, 인코포레이티드 임상 진단 서비스를 제공하는 방법
KR20040064275A (ko) * 2001-11-09 2004-07-16 소스 프리시전 메디슨, 인코포레이티드 유전자 발현 프로파일을 이용한 질병의 동정, 모니터링,치료 및 생물학적 상태의 확인
KR20090105921A (ko) * 2006-11-30 2009-10-07 네이비제닉스 인크. 유전자 분석 시스템 및 방법
KR20140134534A (ko) * 2013-05-14 2014-11-24 솔젠트 (주) 유전자 검사에 기초하여 소아에게 권장 식이 정보를 제공하는 방법 및 이 방법에 사용되는 시스템

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20020075265A (ko) * 2001-03-20 2002-10-04 오르토-클리니칼 다이아그노스틱스, 인코포레이티드 임상 진단 서비스를 제공하는 방법
KR20040064275A (ko) * 2001-11-09 2004-07-16 소스 프리시전 메디슨, 인코포레이티드 유전자 발현 프로파일을 이용한 질병의 동정, 모니터링,치료 및 생물학적 상태의 확인
KR20090105921A (ko) * 2006-11-30 2009-10-07 네이비제닉스 인크. 유전자 분석 시스템 및 방법
KR20140134534A (ko) * 2013-05-14 2014-11-24 솔젠트 (주) 유전자 검사에 기초하여 소아에게 권장 식이 정보를 제공하는 방법 및 이 방법에 사용되는 시스템

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
TEKLAB GEBREGIWORGIS ET AL.: "Application of NMR Metabolomics to Search for Human Disease Biomarkers", COMBINATORIAL CHEMISTRY & HIGH THROUGHPUT SCREENING, vol. 15, no. 8, September 2012 (2012-09-01), pages 595 - 610, XP055596232 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110322963A (zh) * 2019-07-04 2019-10-11 成都新基因格生物科技有限公司 一种新生儿遗传代谢病检测分析方法、装置及系统
CN110322963B (zh) * 2019-07-04 2024-01-30 成都新基因格生物科技有限公司 一种新生儿遗传代谢病检测分析方法、装置及系统

Also Published As

Publication number Publication date
KR20170059069A (ko) 2017-05-30
KR101795662B1 (ko) 2017-11-13

Similar Documents

Publication Publication Date Title
WO2017086675A1 (ko) 대사 이상 질환 진단 장치 및 그 방법
Zook et al. A robust benchmark for germline structural variant detection
Cretu Stancu et al. Mapping and phasing of structural variation in patient genomes using nanopore sequencing
Martin et al. Comprehensive carrier genetic test using next-generation deoxyribonucleic acid sequencing in infertile couples wishing to conceive through assisted reproductive technology
Weale Quality control for genome-wide association studies
WO2017023148A1 (ko) 다양한 플랫폼에서 태아의 성별과 성염색체 이상을 구분할 수 있는 새로운 방법
WO2017116123A1 (ko) 개인 유전체의 유전변이정보를 이용한 질병원인 발굴 시스템
WO2020022733A1 (ko) 전장유전체 시퀀싱 기반의 염색체 이상 검출 방법 및 그 용도
WO2014183270A1 (zh) 一种检测染色体结构异常的方法及装置
WO2017014469A1 (ko) 질병 위험도 예측 방법 및 이를 수행하는 장치
WO2017116135A1 (ko) 개인 유전체의 유전변이정보를 이용한 유전형 분석 시스템 및 방법
WO2017135768A1 (ko) 추정 자손의 유전질환 발병 위험성을 예측하는 방법 및 시스템
WO2019139363A1 (ko) 무세포 dna를 포함하는 샘플에서 순환 종양 dna를 검출하는 방법 및 그 용도
WO2019031785A9 (ko) 유전자 패널에 기초한 염기서열의 변이 검출방법 및 이를 이용한 염기서열의 변이 검출 디바이스
WO2017131359A1 (ko) 태아의 염색체이수성을 검출하는 방법
WO2017126943A1 (ko) 염색체 이상 판단 방법
WO2017116139A1 (ko) 개인 유전체의 유전변이정보를 이용한 생리활성변이 분석 시스템
WO2022097844A1 (ko) 유전자 복제수 변이 정보를 이용하여 췌장암 환자의 생존 예후를 예측하는 방법
WO2021132920A1 (ko) 유전자 검사를 위한 맞춤형 유전자칩 및 이의 제작 방법
WO2017191871A1 (ko) 변이 검출 표지의 신뢰도를 결정하는 방법 및 장치
WO2020231081A1 (ko) Top3b 유전자 변이 기반 치매 진단방법
KR20170098648A (ko) 실험실 내 벡터 오염으로 인해 발생하는 위양 체성변이의 검출 및 제거방법
WO2021172780A1 (ko) 유전자 선별 방법 및 장치
Zu et al. Molecular diagnostics for congenital heart disease: a narrative review of the current technologies and applications
Jiang et al. Long-read based novel sequence insertion detection with rCANID

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 16866627

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 16866627

Country of ref document: EP

Kind code of ref document: A1