WO2021132920A1 - 유전자 검사를 위한 맞춤형 유전자칩 및 이의 제작 방법 - Google Patents

유전자 검사를 위한 맞춤형 유전자칩 및 이의 제작 방법 Download PDF

Info

Publication number
WO2021132920A1
WO2021132920A1 PCT/KR2020/017383 KR2020017383W WO2021132920A1 WO 2021132920 A1 WO2021132920 A1 WO 2021132920A1 KR 2020017383 W KR2020017383 W KR 2020017383W WO 2021132920 A1 WO2021132920 A1 WO 2021132920A1
Authority
WO
WIPO (PCT)
Prior art keywords
marker
condition
nucleotide polymorphism
markers
single nucleotide
Prior art date
Application number
PCT/KR2020/017383
Other languages
English (en)
French (fr)
Inventor
조윤성
전재훈
박종화
김병철
Original Assignee
주식회사 클리노믹스
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 클리노믹스 filed Critical 주식회사 클리노믹스
Priority to US17/788,391 priority Critical patent/US20230129183A1/en
Priority to EP20905893.2A priority patent/EP4083226A4/en
Publication of WO2021132920A1 publication Critical patent/WO2021132920A1/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6834Enzymatic or biochemical coupling of nucleic acids to a solid phase
    • C12Q1/6837Enzymatic or biochemical coupling of nucleic acids to a solid phase using probe arrays or probe chips
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6827Hybridisation assays for detection of mutation or polymorphism
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers

Definitions

  • the present invention relates to a customized gene chip for genetic testing, and more particularly, to a customized gene chip designed to improve the accuracy of genetic testing.
  • Gene mutation markers related to diseases and phenotypes have been revealed by recent genome sequence decoding and disease research. If there is a mutation in the gene revealed in this way, the possibility of disease disease increases, so it is used as a marker for genetic testing and is used for disease prediction.
  • Genetic testing refers to a test method for diagnosing genetic diseases or some tumors, mutations, and chromosomal abnormalities by examining genes contained in chromosomes.
  • PCR polymerase chain reaction
  • gene chips are easy to use and there are many commercially available types, and they have the advantage that they do not consume much time and money even if analysis is performed using many people.
  • the present inventors completed the present invention by deriving conditions for selecting nearby markers to increase the prediction accuracy of the target marker while researching a method for increasing the accuracy of genetic testing using a gene chip.
  • an object of the present invention is a target marker; and a related marker having a linkage disequilibrium relationship with the target marker; to provide a customized gene chip with improved accuracy of genetic testing, including.
  • Another object of the present invention is to provide a method for selecting a nearby marker for improving the accuracy of a genetic test, comprising the step of selecting a related marker having a linkage disequilibrium relationship with a target marker.
  • Another object of the present invention is to provide a computer-readable recording medium in which a program for executing the method for selecting a nearby marker is recorded on a computer.
  • Another object of the present invention is to select a target marker; selecting a neighboring marker having a relational non-equilibrium relationship with the target marker; and performing single-nucleotide polymorphism prediction using the target marker and the nearby marker; to provide a single-nucleotide polymorphism prediction analysis method comprising a.
  • Another object of the present invention is to provide a computer-readable recording medium in which a program for executing the single nucleotide polymorphism prediction analysis method is recorded on a computer.
  • the present invention provides a target marker; and a related marker having a linkage disequilibrium relationship with the target marker; it provides a customized gene chip with improved genetic test accuracy.
  • the present invention provides a method for selecting a nearby marker for improving accuracy of a genetic test, comprising the step of selecting a related marker having a linkage disequilibrium relationship with a target marker.
  • the present invention also provides a computer-readable recording medium in which a program for executing the method for selecting a nearby marker is recorded on a computer.
  • the present invention comprises the steps of selecting a target marker; selecting a neighboring marker having a relational non-equilibrium relationship with the target marker; and performing single-nucleotide polymorphism prediction using the target marker and the nearby marker; provides a single-nucleotide polymorphism prediction analysis method comprising a.
  • the present invention also provides a computer-readable recording medium in which a program for executing the single-nucleotide polymorphism prediction analysis method on a computer is recorded.
  • the customized gene chip according to the present invention can acquire data with higher accuracy than when using a commercialized gene chip, which is advantageous for genetic testing.
  • the marker selection method used to construct the customized gene chip considers the target ethnic group, it is possible to select a marker with higher accuracy even with a small number of markers.
  • FIG. 1 is a diagram showing the results of measuring single-nucleotide polymorphism prediction accuracy using an Axiom APMRA chip including a disease marker and a marker for single-nucleotide polymorphism prediction in consideration of Asian mutation characteristics.
  • FIG. 2 is a diagram illustrating a result of comparing single nucleotide polymorphism prediction accuracy according to a distance from a target marker.
  • 3 and 4 are diagrams showing results of comparison of single nucleotide polymorphism prediction accuracy according to allele frequency.
  • 5 is a diagram showing the results of comparing the prediction accuracy of single nucleotide polymorphisms according to the number of alleles of the marker.
  • 6 is a diagram illustrating a result of comparing single nucleotide polymorphism prediction accuracy according to genotype production rates.
  • Axiom APMRA chip is a commercially available Axiom APMRA chip; and a gene chip including a related marker selected according to the present invention; is a diagram showing a result of comparing the prediction accuracy of single nucleotide polymorphisms using the.
  • the present invention provides a target marker; and a related marker having a linkage disequilibrium relationship with the target marker; it provides a customized gene chip with improved genetic test accuracy.
  • target marker means a marker to be identified through genetic testing, and examples thereof include disease-related genetic markers and phenotype-related genetic markers.
  • target marker is (i) a disease-related marker, diagnosis or prognosis of a disease can be predicted through identification thereof, and (ii) when the target marker is a phenotype-related marker, the phenotype can be predicted through identification of a genetic marker.
  • linkage disequilibrium is a non-random association of two alleles in different chromosomal regions. It is a measure of genetic association. Linkage disequilibrium can be caused by random drift, non-random mating, population structure, etc. in addition to the association of two loci.
  • a “relative marker” refers to a marker that is genetically related to the target marker, and may be collected from a mutation database such as a Single Nucleotide Polymorphism Database (dbSNP).
  • dbSNP Single Nucleotide Polymorphism Database
  • gene test refers to a test method for diagnosing genetic diseases or some tumors, mutations, chromosomal abnormalities, etc. by testing for genes contained in chromosomes.
  • examples of the genetic test include a polymerase chain reaction, a gene sequencing test, and a gene chip.
  • DNA chip refers to a biochemical semiconductor made to search tens of thousands to hundreds of thousands of genes at once using hydrogen bonding of bases in the adenine-thymine (AT), guanine-cytosine (GC) manner. It means.
  • the gene chip is a new level of analysis system that can be widely applied to basic research of genes, genetic diagnosis of various diseases, rapid detection of pathogens such as bacteria and viruses, and selection of optimal drugs according to an individual's genetic form.
  • a "customized gene chip” is a gene chip specialized for a target marker or a group to be analyzed (eg, race, species, etc.), and has the advantage of higher analysis accuracy than a commercially available chip.
  • customized gene chips must be manufactured according to the purpose of analysis.
  • the gene chip may be a genetic testing system, a genetic testing device, or a testing device including a gene chip.
  • the target marker is preferably included in the gene chip twice or more.
  • the accuracy of the genetic test can be improved by repeatedly producing genotype information for the same target marker. If the target marker is included in the gene chip less than twice, it is not preferable because data collection is difficult if no results are obtained from the target marker position.
  • the nearby marker preferably satisfies one or more conditions selected from the group consisting of the following conditions (a) to (d).
  • genotype production rate (calling rate) is 50 to 99.99%
  • the customized gene chip according to the present invention (i) includes the target marker repeatedly two or more times, and (ii) includes a related marker satisfying the above conditions. High-accuracy data can be obtained even with a nearby marker of
  • a method for selecting a nearby marker for improving accuracy of a genetic test comprising the step of selecting a related marker having a linkage disequilibrium relationship with a target marker.
  • the proximal marker is in a close relationship with the target marker, and more specifically, it is preferably in a linkage disequilibrium relationship.
  • the nearby marker preferably satisfies one or more conditions selected from the group consisting of the following conditions (a) to (d).
  • genotype production rate (calling rate) is 50 to 99.99%
  • the proximity marker has a distance from the target marker of preferably 1b to 500 Kb, more preferably 1b to 300 Kb, and still more preferably 1b to 250 Kb.
  • the allele frequency in the population to be analyzed is preferably 0.01 to 0.5, and more preferably 0.1 to 0.3, the related marker.
  • the related marker preferably has two alleles.
  • the genotype production rate of the related marker is preferably 50 to 99.99%, more preferably 60 to 99.99%.
  • the method for selecting a related marker according to the present invention can quickly select a suitable related marker according to a target marker or a target ethnic group, and the selected related marker can significantly increase the accuracy of a genetic test.
  • a computer-readable recording medium in which a program for executing the method for selecting a nearby marker is recorded on a computer.
  • the “recording medium” refers to the computer-readable recording medium as the computer-readable medium.
  • the computer-readable recording medium includes all types of recording devices in which data readable by a computer system is stored. Examples of the computer-readable recording medium include a storage medium such as a magnetic storage medium (eg, a floppy disk, a hard disk, etc.) and an optically readable medium (eg, a CD, DVD, USB, etc.). It also includes being implemented in the form of a carrier wave (eg, transmission over the Internet).
  • the computer-readable recording medium is distributed in a network-connected computer system so that the computer-readable code can be stored and executed in a distributed manner.
  • the present invention comprises the steps of selecting a target marker and a neighboring marker having a non-equilibrium relationship with the target; and performing single-nucleotide polymorphism prediction using the target marker and the nearby marker; provides a single-nucleotide polymorphism prediction analysis method comprising a.
  • single nucleotide polymorphism Imputation is a genetic test, and the genotype result of another marker (ie, a related marker) in a linkage disequilibrium relationship with high relevance to the target marker is used to evaluate other subjects. This is a method of inferring the target marker genotype.
  • the target marker two or more times for single nucleotide polymorphism prediction.
  • the nearby marker preferably satisfies one or more conditions selected from the group consisting of the following conditions (a) to (d).
  • condition (c) two alleles (Di-allele).
  • condition (d) a genotype calling rate of 50 to 99.99%
  • the single nucleotide polymorphism prediction analysis method according to the present invention can obtain data with high accuracy with a smaller number of nearby markers than the analysis using related markers irrelevant to the selection criteria.
  • a computer-readable recording medium in which a program for executing the single nucleotide polymorphism prediction analysis method is recorded on a computer.
  • Axiom APMRA chip used for gene chip data production contains more than 750,000 markers, and it is a disease marker and single nucleotide polymorphism Imputation for precision medicine research that considers Asian mutation characteristics. It is composed of about 540,000 markers for
  • Korean genotype data on the location of the marker planted on the Axiome APMRA chip were collected from dbSNP (Single Nucleotide Polymorphism Database) and used.
  • the gene chip data produced in Experimental Example 1 was used as input data for single nucleotide polymorphism prediction.
  • the single nucleotide polymorphism prediction result was compared with the genotyping result derived from the whole genome sequence (WGS) of the sample to calculate the accuracy.
  • single nucleotide polymorphism prediction analysis software IMPUTE2 (ver2.3.2) was used.
  • single nucleotide polymorphism prediction analysis was performed even if there was a genotype result at the corresponding position by using the -pgs option of the software IMPUTE2, and by using the -buffer option, it was analyzed to utilize distant marker information.
  • the default options were used for other options.
  • Example 1 Predictive analysis of single nucleotide polymorphism using Axiom APMRA chip
  • the accuracy of single nucleotide polymorphism prediction for 464 disease-related SNP target markers was measured using the Axiom APMRA chip, which includes a disease marker considering Asian mutation characteristics and a marker for single nucleotide polymorphism prediction.
  • the single nucleotide polymorphism prediction accuracy was analyzed by increasing the neighboring markers one by one in the order close to the target marker, and the minimum number of neighboring markers showing an accuracy of 98% or more was confirmed.
  • the results of measuring single nucleotide polymorphism prediction accuracy are shown in FIG. 1 .
  • SNP markers including markers rs7524102 and rs17401966 among all 464 SNP markers showed an accuracy of 99.6% or more when an average of 19.9 nearby markers were used.
  • 35 SNP markers (including marker rs1229984) had a low accuracy of 93.2% on average, even though 150 nearby markers were used.
  • Table 1 shows the SNP markers with low accuracy even when using a large number of nearby markers.
  • CHROM POS RS-ID 10 related markers Accuracy in use 50 related markers Accuracy in use 150 related markers Accuracy in use chr1 11856378 rs1801133 0.786 0.778 0.944 chr1 103379918 rs3753841 0.833 0.976 0.944 chr1 161479745 rs1801274 0.921 0.937 0.976 chr1 196679455 rs10737680 0.817 0.96 0.968 chr1 200007432 rs3790844 0.778 0.913 0.968 chr11 2781519 rs179785 0.905 0.944 0.929 chr11 118477367 rs498872 0.786 0.929 0.929 chr12 4368352 rs10774214 0.937 0.929 0.857 chr12 57527283 rs11172113 0.913 0.921 0.913 chr13 42754522 rs
  • SNPs ie, closely related markers
  • proximal markers were classified in three groups based on distance from the target marker: (a) less than 250 Kb; (b) a distance greater than 250 Kb and less than 500 Kb; and (c) a distance of 500 Kb or more and less than 750 Kb; The neighboring markers were analyzed in increasing order, one by one, in the order close to the target marker.
  • a comparison result of single nucleotide polymorphism prediction accuracy is shown in FIG. 2 .
  • the group using only adjacent markers having a distance of less than 250 Kb from the target marker had the highest single nucleotide polymorphism prediction accuracy.
  • the single nucleotide polymorphism prediction accuracy was low when a nearby marker having a distance of 250 Kb or more from the target marker was used.
  • the prediction accuracy of single nucleotide polymorphisms according to allele frequency was compared.
  • the closely related markers were identified in six groups based on the allele frequency of the population to be tested, i.e., (a) 0 or more, (b) 0.05 or more, (c) 0.10 or more, (d) 0.20 or more, (e) 0.30 or more. and (f) 0.40 or greater.
  • the neighboring markers were analyzed in increasing order, one by one, in the order close to the target marker.
  • the results of comparison of single nucleotide polymorphism prediction accuracy are shown in FIGS. 3 and 4 .
  • the single nucleotide polymorphism prediction accuracy was highest when using a closely related marker with an allele frequency of (c) 0.10 or more.
  • the prediction accuracy of single nucleotide polymorphisms of closely related markers with allele frequencies of (b) 0.05 or more and (d) 0.20 or more was high.
  • the single nucleotide polymorphism prediction accuracy according to the number of alleles was determined using a closely related marker with three alleles (Tri-allele SNP) and a closely related marker with two alleles (Di-allele SNP). The accuracy was analyzed by increasing the neighboring markers one by one, in the order closest to the target marker. A comparison result of single nucleotide polymorphism prediction accuracy is shown in FIG. 5 .
  • a closely related marker having two alleles had significantly higher single nucleotide polymorphism prediction accuracy than a closely related marker having three alleles.
  • the number of markers corresponding to the conditions for selecting nearby markers of Example 2 was confirmed.
  • the average number of markers satisfying the selection condition of the nearby markers of Example 2 was 31 for low-accuracy markers and 49 for high-accuracy markers in single nucleotide polymorphism prediction.
  • markers related to the marker rs6885224 are shown in Table 2.
  • the accuracy of single nucleotide polymorphism prediction was confirmed by using a customized gene chip including the target marker in two repetitions or more along with the selected nearby marker, and the results are shown in FIG. 7 .
  • the accuracy of single nucleotide polymorphism prediction using the gene chip of this example was 99.9% when an average of 17.3 selected nearby markers were used.
  • the single nucleotide polymorphism prediction accuracy of the Axiom APMRA chip in which markers irrelevant to the selection criteria were arranged did not increase even if the number of markers was increased, and when 150 markers were used, it was 93.2%.
  • the above result means that the closely related marker selected according to the conditions of Example 2 can significantly improve the single nucleotide polymorphism prediction accuracy.
  • the present inventors developed a customized gene chip including (i) a target marker repeatedly included two or more times, and (ii) a related marker satisfying the following conditions in order to increase the accuracy of single nucleotide polymorphism prediction.
  • the customized gene chip according to the present invention has significantly increased single nucleotide polymorphism prediction accuracy, and high-accuracy data can be obtained even with a small number of related markers.

Landscapes

  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Microbiology (AREA)
  • Immunology (AREA)
  • Physics & Mathematics (AREA)
  • Molecular Biology (AREA)
  • Biotechnology (AREA)
  • Biophysics (AREA)
  • Analytical Chemistry (AREA)
  • Biochemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

본 발명은 유전자 검사를 위한 맞춤형 유전자칩 제작 방법에 관한 것으로, 보다 상세하게는 유전자 검사에 정확도 향상을 위해 맞춤형 칩을 디자인하는 방법, 즉, 맞춤형 유전자칩을 제작할 때 어떤 마커들을 포함시켜야 하는지에 관한 것이다. 본 발명에 따른 맞춤형 유전자칩은 상용화된 유전자칩을 사용할 때 보다 정확도가 높은 데이터를 획득할 수 있어, 유전자 검사를 하는데 유리하다. 또한 상기 맞춤형 유전자칩을 구성하는데 사용되는 마커 선정 방법은 대상 인종 집단을 고려하기 때문에 적은 수의 마커로도 더 정확도가 높은 마커를 선정할 수 있다.

Description

유전자 검사를 위한 맞춤형 유전자칩 및 이의 제작 방법
본 발명은 유전자 검사를 위한 맞춤형 유전자칩에 관한 것으로, 보다 상세하게는 유전자 검사의 정확도를 향상시키기 위해 디자인된 맞춤형 유전자칩에 관한 것이다.
최근 유전체(Genome) 서열 해독 및 질병 연구에 의해, 질병 및 표현형 관련 유전자 돌연변이 마커가 밝혀지고 있다. 이렇게 밝혀진 유전자의 돌연변이가 존재할 경우 질환에서의 발병가능성이 높아지므로 유전자 검사를 위한 마커로 활용되어 질병예측에 이용되고 있다.
유전자 검사는 염색체에 포함된 유전자에 대한 검사로 유전질환이나 일부 종양의 진단 및 돌연변이, 염색체 이상 등을 진단하는 검사법을 지칭한다. DNA를 분자 수준에서 분석하는 방법으로는 중합효소연쇄반응(PCR), 유전자 염기서열 검사, 유전자칩 등 많은 방법이 있다. 이 중 유전자칩은 사용이 간단하고 상용화된 종류가 많으며, 많은 사람을 이용하여 분석을 진행하더라도 시간적, 비용적 소모가 크지 않다는 장점을 가지고 있다.
하지만, 상용화된 유전자칩은 해당 칩으로 다양한 인종에서 다양한 질병 및 표현형에 사용될 수 있도록 구성되어 있다. 때문에, 상기 상용화된 특정 인종 집단 및 특정 질병/표현형에서 효율적으로 사용하기에 한계가 있으며, 목표로 하는 유전자 마커가 포함되어 있지 않거나 혹은 마커가 존재하더라도 실험 시의 문제나 샘플들의 편향성의 이유로 해당마커의 결과를 볼 수가 없는 경우가 많아 다수의 DNA 마커를 확인하는 유전자 검사에는 적합하지 않다. 따라서, 유전자칩을 효율적으로 활용하기 위해서는 사용하고자 하는 유전자 및 돌연변이 위치가 심어져있는 새로운 유전자칩의 제작이 필수적이며, 실험 시의 문제 등으로 인해 해당 마커의 결과를 확인할 수 없는 경우에도 이를 보정해 줄 수 있는 방법이 필요한 실정이다.
이에 본 발명자들은 유전자칩을 이용하여 유전자 검사 시 정확도를 높이기 위한 방법에 대해 연구하던 중, 목표 마커의 예측 정확도를 높이기 위한 근연 마커 선정 조건을 도출함으로써 본 발명을 완성하게 되었다.
따라서 본 발명의 목적은, 목표 마커; 및 상기 목표 마커와 연관비평형 관계인 근연 마커;를 포함하는, 유전자 검사의 정확도가 향상된 맞춤형 유전자칩을 제공하는 것이다.
본 발명의 또 다른 목적은, 목표 마커와 연관비평형 관계인 근연 마커를 선정하는 단계;를 포함하는 유전자 검사의 정확도 향상을 위한 근연 마커 선정 방법을 제공하는 것이다.
본 발명의 또 다른 목적은 상기 근연 마커 선정 방법을 컴퓨터에서 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체를 제공하는 것이다.
본 발명의 또 다른 목적은 목표 마커를 선정하는 단계; 상기 목표 마커와 연관비평형 관계인 근연 마커를 선정하는 단계; 및 상기 목표 마커 및 근연 마커를 이용하여 단일염기 다형성 예측을 수행하는 단계;를 포함하는 단일염기 다형성 예측 분석 방법을 제공하는 것이다.
본 발명의 또 다른 목적은 상기 단일염기 다형성 예측 분석 방법을 컴퓨터에서 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체를 제공하는 것이다.
상기 목적을 달성하기 위하여, 본 발명은 목표 마커; 및 상기 목표 마커와 연관비평형 관계인 근연 마커;를 포함하는, 유전자 검사의 정확도가 향상된 맞춤형 유전자칩을 제공한다.
또한 본 발명은 목표 마커와 연관비평형 관계인 근연 마커를 선정하는 단계;를 포함하는 유전자 검사의 정확도 향상을 위한 근연 마커 선정 방법을 제공한다.
또한 본 발명은 상기 근연 마커 선정 방법을 컴퓨터에서 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체를 제공한다.
또한 본 발명은 목표 마커를 선정하는 단계; 상기 목표 마커와 연관비평형 관계인 근연 마커를 선정하는 단계; 및 상기 목표 마커 및 근연 마커를 이용하여 단일염기 다형성 예측을 수행하는 단계;를 포함하는 단일염기 다형성 예측 분석 방법을 제공한다.
또한 본 발명은 상기 단일염기 다형성 예측 분석 방법을 컴퓨터에서 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체를 제공한다.
본 발명에 따른 맞춤형 유전자칩은 상용화된 유전자칩을 사용할 때 보다 정확도가 높은 데이터를 획득할 수 있어, 유전자 검사를 하는데 유리하다. 또한 상기 맞춤형 유전자칩을 구성하는데 사용되는 마커 선정 방법은 대상 인종 집단을 고려하기 때문에 적은 수의 마커로도 더 정확도가 높은 마커를 선정할 수 있다.
도 1은 아시아인의 변이 특성을 고려한 질병 마커 및 단일염기 다형성 예측을 위한 마커가 포함된 Axiom APMRA 칩을 이용하여 단일염기 다형성 예측 정확도를 측정한 결과를 나타낸 도이다.
도 2는 목표 마커로부터 거리에 따른 단일염기 다형성 예측 정확도를 비교한 결과를 나타낸 도이다.
도 3 및 4는 대립유전자형 빈도에 따른 단일염기 다형성 예측 정확도를 비교한 결과를 나타낸 도이다.
도 5는 마커의 대립 유전자 수에 따른 단일염기 다형성 예측 정확도를 비교한 결과를 나타낸 도이다.
도 6은 유전형 생산율에 따른 단일염기 다형성 예측 정확도를 비교한 결과를 나타낸 도이다.
도 7은 시판중인 Axiom APMRA 칩; 및 본 발명에 따라 선정된 근연 마커를 포함하는 유전자칩;의 이용하여 단일염기 다형성 예측 정확도를 비교한 결과를 나타낸 도이다.
이하, 본 발명을 상세히 설명한다.
본 발명의 양태에 따르면, 본 발명은 목표 마커; 및 상기 목표 마커와 연관비평형 관계인 근연 마커;를 포함하는, 유전자 검사의 정확도가 향상된 맞춤형 유전자칩을 제공한다.
본 발명에 있어서, “목표 마커”는 유전자 검사를 통해 확인하고자 하는 마커를 의미하며, 그 예로는 질병 관련 유전자 마커 및 표현형 관련 유전자 마커 등이 있다. 목표 마커가 (i) 질병 관련 마커인 경우 이의 확인을 통해 질병의 진단, 또는 예후를 예측할 수 있으며, (ii) 표현형 관련 마커인 경우 유전자 마커의 확인을 통해 표현형을 예측할 수 있다.
본 발명에 있어서, “연관비평형(linkage disequilibrium, LD)”은 다른 염색체 부위의 두 대립유전자의 비무작위적인 연관으로 두 개의 다른 대립유전자가 기대치(즉, 이론 값) 이상으로 같이 연관되어 나타나는 것을 의미하며, 유전적 연관성을 나타내는 척도이다. 연관 비평형은 두 유전자 자리의 연관 외에도 무작위 드리프트(random drift), 비-무작위 교잡(non-random mating), 집단 구조(population structure) 등에 의해 유발될 수 있다.
본 발명에 있어서, “근연 마커”는 상기 목표 마커와 유전적으로 근연(近然) 관계인 마커를 의미하며, dbSNP(Single Nucleotide Polymorphism Database) 등 변이 데이터베이스 등으로부터 수집될 수 있다.
본 발명에 있어서, “유전자 검사”는 염색체에 들어 있는 유전자에 대한 검사로 유전질환이나 일부 종양의 진단 및 돌연변이, 염색체 이상 등을 진단하는 검사법을 의미한다. 유전자 검사의 예로는, 중합효소 연쇄 반응(polymerase chain reaction), 유전자 염기서열 검사 및 유전자칩 등이 있다.
본 발명에 있어서, “유전자칩(DNA chip)”은 염기가 아데닌-티민(A-T), 구아닌-시토신(G-C)식으로 수소결합하는 것을 이용해 수만개에서 수십만개의 유전자를 한꺼번에 검색하기 위해 만든 생화학 반도체를 의미한다. 상기 유전자칩은 유전자의 기초연구는 물론 각종 질환의 유전자 진단, 세균·바이러스 등 병원체의 신속한 검출, 개인의 유전적 형태에 따른 최적 약제의 선택 등에 널리 응용될 수 있는 새로운 차원의 분석 시스템이다.
본 발명에 있어서, “맞춤형 유전자칩”은 목표 마커 또는 분석하고자 하는 집단(예를 들어, 인종, 종 등)에 특화된 유전자칩으로, 상용화된 칩보다 분석 정확도가 높다는 장점이 있다. 다만, 맞춤형 유전자칩은 분석 목적에 따라 유전자칩을 제작해야 한다.
본 발명의 구체예에서, 상기 유전자칩은 유전자 검사 시스템, 유전자 검사 장치 또는 유전자칩을 포함하는 검사 장치일 수 있다.
본 발명의 구체예에서, 목표 마커는 유전자칩 내에 2 회 이상 포함되는 것이 바람직하다. 상기 구체예와 같이, 목표 마커를 유전자칩 내에 2 회 이상 포함될 경우 동일한 목표 마커에 대해 유전형 정보를 반복 생산함으로써 유전자 검사의 정확도를 향상시킬 수 있다. 목표 마커가 유전자칩 내에 2회 미만으로 포함될 경우 목표 마커 위치에서 결과가 나오지 않을 경우 데이터 수집이 어려워 바람직하지 않다.
본 발명의 구체예에서, 상기 근연 마커는 다음의 조건 (a) 내지 (d)로 이루어진 군에서 선택된 1 이상의 조건을 만족하는 것이 바람직하다.
-조건 (a) : 목표 마커로부터의 거리가 1b 내지 500 Kb
-조건 (b) : 분석하고자하는 집단 내 대립유전자형 빈도가 0.01 내지 0.5
-조건 (c) : 대립유전자 수가 2개(Di-allele)
-조건 (d) : 유전형 생산율(calling rate)이 50 내지 99.99%
본 발명의 실시예에서, 본 발명에 따른 맞춤형 유전자칩을 이용하여 마커 rs6885224의 단일염기 다형성 예측을 수행한 결과, 평균 17.3개의 선정된 근연 마커를 사용했을 때 정확도가 99.9%임을 확인하였다(도 7). 반면에, 근연 마커 선정 기준과 무관한 마커가 배열된 유전자칩을 이용하여 단일염기 다형성 예측을 수행한 결과, 마커 150개를 사용하여 수행하였을 때 93.2%였으며, 마커의 수를 증가시켜도 정확도가 높아지지 않았다.
본 발명에 따른 맞춤형 유전자칩은, (i) 목표 마커를 2회 이상 반복하여 포함하고, (ii) 상기 조건을 만족하는 근연 마커를 포함하는바, 유전자 검사의 정확도가 현저히 증가된 것으로, 적은 수의 근연 마커로도 정확도가 높은 데이터를 획득할 수 있다.
본 발명의 다른 양태에 따르면, 본 발명은 목표 마커와 연관비평형 관계인 근연 마커를 선정하는 단계;를 포함하는 유전자 검사의 정확도 향상을 위한 근연 마커 선정 방법을 제공한다.
본 발명의 바람직한 구체예예서, 상기 근연 마커는 목표 마커와 근연 관계이며, 보다 구체적으로는 연관비평형 관계인 것이 바람직하다.
본 발명의 구체예에서, 상기 근연 마커는 다음의 조건 (a) 내지 (d)로 이루어진 군에서 선택된 1 이상의 조건을 만족하는 것이 바람직하다.
-조건 (a) : 목표 마커로부터의 거리가 1b 내지 500 Kb
-조건 (b) : 분석하고자하는 집단 내 대립유전자형 빈도가 0.01 내지 0.5
-조건 (c) : 대립유전자 수가 2개(Di-allele)
-조건 (d) : 유전형 생산율(calling rate)이 50 내지 99.99%
본 발명의 바람직한 구체예에서, 상기 근연 마커는 목표 마커로부터의 거리가 1b 내지 500 Kb인 것이 바람직하며, 1b 내지 300 Kb인 것이 더 바람직하며, 1b 내지 250 Kb인 것이 더욱 바람직하다.
본 발명의 바람직한 구체예에서, 상기 근연 마커는 분석하고자하는 집단 내 대립유전자형 빈도가 0.01 내지 0.5인 것이 바람직하며, 0.1 내지 0.3인 것이 더 바람직하다.
본 발명의 바람직한 구체예에서, 상기 근연 마커는 대립유전자의 수가 2개인 것이 바람직하다.
본 발명의 바람직한 구체예에서, 상기 근연 마커는 유전형 생산율이 50 내지 99.99%인 것인 바람직하며, 60 내지 99.99%인 것이 더 바람직하다.
본 발명에 따른 근연 마커 선정 방법은 목표 마커 또는 대상 인종 집단에 따라 적합한 근연 마커를 신속하게 선정할 수 있으며, 선정된 근연 마커는 유전자 검사의 정확도를 현저히 증가시킬 수 있다.
본 발명의 또 다른 양태에 따르면, 본 발명은 상기 근연 마커 선정 방법을 컴퓨터에서 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체를 제공한다.
본 발명에 있어서, “기록매체”는 상기 컴퓨터가 읽을 수 있는 기록매체는 컴퓨터가 읽을 수 있는 매체를 의미한다. 컴퓨터가 읽을 수 있는 기록매체는 컴퓨터 시스템에 의하여 읽혀질 수 있는 데이터가 저장되는 모든 종류의 기록장치를 포함한다. 컴퓨터가 가독 가능한 기록매체의 예로는 마그네틱 저장매체(예를 들면, 플로피 디스크, 하드 디스크 등), 광학적 판독 매체(예를 들면, CD, DVD, USB, 등)와 같은 저장매체를 포함한다. 또한 캐리어 웨이브(예를 들어 인터넷을 통한 전송)의 형태로 구현되는 것도 포함한다. 또한 컴퓨터가 읽을 수 있는 기록매체는 네트워크로 연결된 컴퓨터 시스템에 분산되어 분산방식으로 컴퓨터가 읽을 수 있는 코드가 저장되고 실행될 수 있다.
본 발명의 또 다른 양태에 따르면, 본 발명은 목표 마커와 연관비평형 관계인 근연 마커를 선정하는 단계; 및 상기 목표 마커 및 근연 마커를 이용하여 단일염기 다형성 예측을 수행하는 단계;를 포함하는 단일염기 다형성 예측 분석 방법을 제공한다.
본 발명에 있어서, “단일염기 다형성 예측(single nucleotide polymorphism Imputation)”은 유전자 검사로, 목표 마커와 연관성이 높은 연관비평형 관계의 다른 마커(즉, 근연 마커)의 유전자형 결과를 이용하여 다른 대상체의 목표 마커 유전자형을 유추하는 방법이다.
본 발명의 구체예에서, 단일염기 다형성 예측은 목표 마커를 2 회 이상 분석하는 것이 바람직하다.
본 발명의 구체예에서, 상기 근연 마커는 다음의 조건 (a) 내지 (d)로 이루어진 군에서 선택된 1 이상의 조건을 만족하는 것이 바람직하다.
조건 (a) 목표 마커로부터의 거리가 1b 내지 500 Kb;
조건 (b) 분석하고자하는 집단 내 대립유전자형 빈도가 0.01 내지 0.5;
조건 (c) 대립유전자 수가 2개(Di-allele); 및
조건 (d) 유전형 생산율(calling rate)이 50 내지 99.99%;
본 발명에 따른 단일염기 다형성 예측 분석 방법은 선정기준과 무관한 근연 마커를 이용한 분석보다 적은 수의 근연 마커로 정확도가 높은 데이터를 획득할 수 있다.
본 발명의 또 다른 양태에 따르면, 본 발명은 상기 단일염기 다형성 예측 분석 방법을 컴퓨터에서 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체를 제공한다.
이하, 실시예를 통하여 본 발명을 더욱 상세히 설명하고자 한다. 이들 실시예는 오로지 본 발명을 예시하기 위한 것으로서, 본 발명의 범위가 이들 실시예에 의해 제한되는 것으로 해석되지는 않는 것은 당업계에서 통상의 지식을 가진 자에게 있어서 자명할 것이다.
실험예 1. 유전자칩 데이터 생산
유전자칩 데이터를 생산하기 위하여, WGS(whole genome sequence) 데이터로부터 생산된 한국인 7명의 타액, 가글 및 구강상피세포를 채취하였다. GeneAll 미니 키트를 이용하여 상기 채취된 시료의 DNA를 추출하였다. Axiom APMRA 키트(Asia Precision Medicine Research Array Kit) 및 GeneTitan 장비를 이용하여, 상기 추출된 DNA의 유전자칩 데이터를 생산하였다. 채취한 시료는 각각 3반복 데이터를 생산하였다. 유전자칩 데이터 생산을 위해 사용한 Axiom APMRA 칩은 75만개 이상의 마커를 포함하며, 이는 아시아인의 변이 특성을 고려한 정밀의료(Precision medicine) 연구를 위한 질병 마커 및 단일염기 다형성 예측(single nucleotide polymorphism Imputation)을 위한 마커 약 54만개로 구성된 것이다.
실험예 2. 단일염기 다형성 예측(single nucleotide polymorphism Imputation)
목표로 하는 유전자 마커의 단일염기 다형성 예측을 위한 근연 마커로, Axiome APMRA 칩에 심어져 있는 마커의 위치에 대한 한국인 유전형 데이터를 dbSNP(Single Nucleotide Polymorphism Database)에서 수집하여 사용하였다.
상기 실험예 1에서 생산된 유전자칩 데이터는 단일염기 다형성 예측의 입력 데이터로 활용하였다. 또한 상기 단일염기 다형성 예측 결과는 해당 시료의 전체 유전체 서열(whole genome sequence, WGS)에서 도출되는 유전형 결과와 비교하여 정확도를 계산하였다.
단일염기 다형성 예측 분석을 위하여, 소프트웨어 IMPUTE2(ver2.3.2)를 사용하였다. 보다 상세하게는 소프트웨어 IMPUTE2의 -pgs 옵션을 활용하여 해당 위치에 유전자형(Genotype) 결과가 있더라도 단일염기 다형성 예측 분석을 수행하였으며, -buffer 옵션을 이용하여 거리가 먼 마커 정보도 활용할 수 있도록 분석하였다. 또한 소프트웨어 IMPUTE2에서 이 외의 옵션은 기본옵션을 사용하였다.
실시예 1. Axiom APMRA 칩을 이용한 단일염기 다형성 예측 분석
아시아인의 변이 특성을 고려한 질병 마커 및 단일염기 다형성 예측을 위한 마커가 포함된 Axiom APMRA 칩을 이용하여, 질병과 관련된 464개의 SNP 목표 마커에 대한 단일염기 다형성 예측 정확도를 측정하였다. 상기 단일염기 다형성 예측 정확도는 근연 마커를 목표 마커에서 가까운 순서대로, 하나씩 늘리면서 분석하였으며, 98% 이상의 정확도를 보이는 최소 근연 마커 개수를 확인하였다. 단일염기 다형성 예측 정확도를 측정한 결과는 도 1에 나타내었다.
도 1에 나타낸 바와 같이, 전체 464개의 SNP마커 중 마커 rs7524102 및 rs17401966를 포함하는 SNP 마커 429개는 평균 19.9개의 근연 마커를 사용했을 때 99.6% 이상의 정확도를 보였다. 반면에, SNP 마커 35개(마커 rs1229984를 포함)는 150개의 근연 마커를 사용하였음에도, 정확도가 평균 93.2%로 낮았다. 이와 같이, 다수의 근연 마커를 사용해도 정확도가 낮은 SNP 마커는 표 1에 나타내었다.
CHROM POS RS-ID 근연마커 10개
사용시 정확도
근연마커 50개
사용시 정확도
근연마커 150개
사용시 정확도
chr1 11856378 rs1801133 0.786 0.778 0.944
chr1 103379918 rs3753841 0.833 0.976 0.944
chr1 161479745 rs1801274 0.921 0.937 0.976
chr1 196679455 rs10737680 0.817 0.96 0.968
chr1 200007432 rs3790844 0.778 0.913 0.968
chr11 2781519 rs179785 0.905 0.944 0.929
chr11 118477367 rs498872 0.786 0.929 0.929
chr12 4368352 rs10774214 0.937 0.929 0.857
chr12 57527283 rs11172113 0.913 0.921 0.913
chr13 42754522 rs4142110 0.698 0.905 0.857
chr14 100133942 rs2895811 0.722 0.929 0.968
chr15 28197037 rs1800414 0.786 0.929 0.976
chr15 78915245 rs6495309 0.913 0.968 0.944
chr15 91512067 rs2290203 0.929 0.929 0.929
chr16 1532463 rs13336428 0.754 0.921 0.929
chr17 800593 rs12603526 0.802 0.921 0.976
chr17 59447369 rs11653176 0.937 0.929 0.976
chr19 7166109 rs2059807 0.857 0.881 0.929
chr19 19379549 rs58542926 0.849 0.929 0.929
chr2 145223620 rs13382811 0.849 0.849 0.929
chr2 198631714 rs700651 0.841 0.929 0.913
chr21 44588757 rs7278468 0.921 0.921 0.857
chr22 37635055 rs2284038 0.952 0.857 0.929
chr22 43500212 rs5759167 0.786 0.937 0.921
chr5 11169945 rs6885224 0.69 0.921 0.897
chr5 59502520 rs966221 0.786 0.929 0.976
chr5 158764177 rs7709212 0.722 0.929 0.929
chr5 168195356 rs11134527 0.857 0.921 0.944
chr6 38365841 rs9296249 0.96 0.929 0.857
chr6 101964914 rs9390754 0.921 0.929 0.929
chr7 19049388 rs2107595 0.968 0.96 0.976
chr7 37746569 rs2392510 0.817 0.905 0.857
chr7 74126034 rs117026326 0.929 0.929 0.929
chr8 11480457 rs2243407 0.857 0.929 0.976
chr9 9261737 rs4626664 0.81 0.929 0.968
상기 결과는 일부 마커는 정확도가 낮으므로, 유전자 검사에 Axiom APMRA 칩을 이용하는 것이 부적절함을 의미한다.
실시예 2. 단일염기 다형성 예측의 정확도를 높이기 위한 근연 마커 선정 조건 최적화
상기 실시예 1에서 확인된 정확도가 낮은 마커 35개를 보정하기 위하여 dbSNP로부터 각각 다른 조건을 상정하여 SNP(즉, 근연 마커)를 선정하고 단일염기 다형성 예측의 정확도를 비교하였다.
2-1. 목표 마커로부터 거리에 따른 단일염기 다형성 예측 정확도 비교
목표 마커와 거리에 따른 근연 마커의 단일염기 다형성 예측 정확도를 비교하였다. 먼저, 근연 마커는 목표 마커로부터 거리를 기준으로 세 그룹, 즉, (a) 250 Kb 미만; (b) 250 Kb 이상이며 500 Kb 미만의 거리; 및 (c) 500 Kb이상 750 Kb 미만의 거리;로 나누었다. 상기 근연 마커를 목표 마커에 가까운 순서대로, 하나씩 늘리면서 분석하였다. 단일염기 다형성 예측 정확도 비교 결과는 도 2에 나타내었다.
도 2에 나타낸 바와 같이, 목표 마커와의 거리가 250 Kb 미만인 근연 마커만을 사용한 그룹은 단일염기 다형성 예측 정확도가 가장 높았다. 반면에, 목표 마커와의 거리가 250 Kb 이상인 근연 마커를 이용한 경우 단일염기 다형성 예측 정확도가 낮은 것을 확인하였다.
2-2. 대립유전자형 빈도에 따른 단일염기 다형성 예측 정확도 비교
대립유전자형 빈도에 따른 단일염기 다형성 예측 정확도를 비교하였다. 먼저, 근연 마커는 검사하고자하는 집단의 대립유전자형 빈도를 기준으로 여섯 그룹, 즉, (a) 0 이상, (b) 0.05 이상, (c) 0.10 이상, (d) 0.20 이상, (e) 0.30 이상 및 (f) 0.40 이상으로 나누었다. 상기 근연 마커를 목표 마커에 가까운 순서대로, 하나씩 늘리면서 분석하였다. 단일염기 다형성 예측 정확도 비교 결과는 도 3 및 4에 나타내었다.
도 3에 나타낸 바와 같이, 대립유전자형 빈도가 (c) 0.10 이상인 근연 마커를 사용했을 때 단일염기 다형성 예측 정확도가 가장 높았다. 다음으로, 대립유전자형 빈도가 (b) 0.05 이상, (d) 0.20 이상인 근연 마커의 단일염기 다형성 예측 정확도가 높았다.
또한 도 4에 나타낸 바와 같이, 대립유전자형 빈도가 높아질수록 근연 마커와 목표 마거의 거리가 멀어지는 것을 확인하였다.
2-3. 마커의 대립 유전자 수에 따른 단일염기 다형성 예측 정확도 비교
대립 유전자 수에 따른 단일염기 다형성 예측 정확도는 대립 유전자 수가 3개인 근연 마커(Tri-allele SNP) 및 대립유전자 수가 2개인 근연 마커(Di-allele SNP)를 이용하여 하였다. 상기 정확도는 근연 마커를 목표 마커에 가까운 순서대로, 하나씩 늘리면서 분석하였다. 단일염기 다형성 예측 정확도 비교 결과는 도 5에 나타내었다.
도 5에 나타낸 바와 같이, 대립유전자 수가 2개인 근연 마커는 대립유전자가 3개인 근연 마커보다 단일염기 다형성 예측 정확도가 현저히 높았다.
2-4. 유전형 생산율(Call rate)에 따른 단일염기 다형성 예측 정확도 비교
분석하고자 하는 인구 집단 및 게놈 데이터 생산 방법에 따라 유전형 생산율이 낮은 영역이 존재한다. 이에, 같은 위치의 근연 마커를 사용하되, dbSNP의 유전형 생산율을 달리하여 단일염기 다형성 예측 정확도를 분석하였다. 단일염기 다형성 예측 정확도 비교 결과는 도 6에 나타내었다.
도 6에 나타낸 바와 같이, 근연 마커의 유전형 생산율이 높을수록 단일염기 다형성 예측 정확도가 높아지는 것을 확인하였다.
상기 결과를 토대로 단일염기 다형성 예측의 정확도를 높이기 위한 근연 마커 선정 조건은 다음과 같다.
- 목표 마커로부터의 거리 : 250 Kb 미만
- 대립유전자형 빈도 : 0.1 이상
- 마커의 대립 유전자 수 : 2개(Di-allele)
- 유전형 생산율 : 90% 이상
실시예 3. 최적 조건으로 선정된 근연 마커를 이용한 단일염기 다형성 예측 정확도 분석
Axiom APMRA 칩에 포함된 마커 중 상기 실시예 2의 근연 마커 선정 조건에 해당되는 마커의 수를 확인하였다.
그 결과, Axiom APMRA 칩에서 상기 실시예 2의 근연 마커 선정 조건을 만족하는 평균 개수는 단일염기 다형성 예측에서 정확도가 낮은 마커의 경우 31개, 정확도가 높은 마커의 경우 49개임을 확인하였다.
따라서 단일염기 다형성 예측의 정확도를 보다 높이기 위하여 근연 마커를 선정하였다. 구체적으로, dbSNP에 등록된 위치 중 상기 실시예 2의 근연 마커 선정 조건을 만족하는 근연 마커를 확인하였으며, 이를 통해 목표 마커 대치를 위한 근연 마커 150개 이상을 선정하였다. 그 중에서 마커 rs6885224에 대한 근연 마커는 표 2에 나타내었다. 선정된 근연 마커와 함께 목표 마커를 2회 반복 또는 그 이상으로 포함하는 맞춤형 유전자칩을 이용하여 단일염기 다형성 예측 정확도를 확인하였으며, 그 결과는 도 7에 나타내었다.
목표마커의
RS-ID
근연마커의
RS-ID
목표마커와의 거리(Kb) 대립유전자형 빈도 대립유전자 종류 유전형 생산률
rs6885224 rs917012 84 0.88 C,T 1.00
rs6885224 rs16901339 344 0.28 T,C 1.00
rs6885224 rs13182209 561 0.31 C,T 1.00
rs6885224 rs6860246 1203 0.76 T,C 1.00
rs6885224 rs6879413 1332 0.28 G,C 1.00
rs6885224 rs10078958 1707 0.41 T,A 1.00
rs6885224 rs10071197 1729 0.76 G,T 1.00
rs6885224 rs61751836 2171 0.26 C,T 1.00
rs6885224 rs10513079 2352 0.26 T,C 1.00
rs6885224 rs7702295 2445 0.53 C,T 1.00
rs6885224 rs72646806 2481 0.28 A,C 1.00
rs6885224 rs6861205 2580 0.31 A,G 1.00
rs6885224 rs7713461 2668 0.41 G,A 1.00
rs6885224 rs6883143 2791 0.49 T,C 1.00
rs6885224 rs16901347 2828 0.24 T,C 1.00
rs6885224 rs13155944 2993 0.43 G,A 1.00
rs6885224 rs12716080 2997 0.72 G,T 0.99
rs6885224 rs13362481 3046 0.41 C,T 0.99
rs6885224 rs61751837 3058 0.41 G,T 1.00
rs6885224 rs59700924 3363 0.26 C,T 1.00
rs6885224 rs2057793 3727 0.54 C,A 1.00
rs6885224 rs6892933 3966 0.41 C,G 0.99
rs6885224 rs4702790 4102 0.79 C,T 1.00
rs6885224 rs16901333 4179 0.26 C,T 1.00
rs6885224 rs12655907 5432 0.74 T,A 0.99
rs6885224 rs721768 5584 0.54 C,T 1.00
rs6885224 rs61751852 5773 0.26 T,C 1.00
rs6885224 rs7703504 5961 0.41 T,C 1.00
rs6885224 rs7721243 6075 0.41 G,A 1.00
rs6885224 rs1012092 6442 0.74 C,T 1.00
rs6885224 rs7715991 6816 0.88 C,G 1.00
rs6885224 rs79140420 6923 0.39 C,T 0.95
rs6885224 rs7715051 7441 0.41 C,G 1.00
rs6885224 rs61751855 7728 0.25 A,G 1.00
rs6885224 rs1978156 8320 0.89 T,C 1.00
rs6885224 rs10052776 8703 0.23 C,T 1.00
rs6885224 rs2023916 8708 0.88 C,T 1.00
rs6885224 rs7705503 8907 0.63 G,C 1.00
rs6885224 rs12716081 9142 0.23 T,C 1.00
rs6885224 rs16901329 9242 0.25 C,G 1.00
rs6885224 rs13179953 9248 0.17 T,C 1.00
rs6885224 rs7704256 9514 0.41 C,G 1.00
rs6885224 rs10062829 9549 0.12 T,C 1.00
rs6885224 rs2277054 9902 0.42 A,G 1.00
rs6885224 rs1990003 10288 0.56 T,C 1.00
rs6885224 rs1978155 10784 0.57 C,T 1.00
rs6885224 rs61753306 10853 0.25 T,G 1.00
rs6885224 rs6892303 11492 0.62 C,A 1.00
rs6885224 rs1990004 13673 0.56 C,T 1.00
rs6885224 rs1990005 14140 0.58 C,G 1.00
rs6885224 rs1990006 14151 0.56 C,G 1.00
rs6885224 rs4702791 14283 0.25 G,C 1.00
rs6885224 rs2057795 15348 0.71 T,C 1.00
rs6885224 rs13358276 15498 0.39 C,T 1.00
rs6885224 rs11953748 16018 0.24 G,A 1.00
rs6885224 rs72730911 16556 0.39 A,T 1.00
rs6885224 rs32280 16707 0.22 G,A 1.00
rs6885224 rs72730910 17574 0.12 A,G 1.00
rs6885224 rs73051687 17590 0.2 T,C 1.00
rs6885224 rs32277 17864 0.16 G,A 1.00
rs6885224 rs10059397 18026 0.39 C,G 1.00
rs6885224 rs66554550 18681 0.25 T,A 1.00
rs6885224 rs6877976 19045 0.39 G,A 0.99
rs6885224 rs62339099 19576 0.39 T,C 1.00
rs6885224 rs10055024 20137 0.39 C,T 1.00
rs6885224 rs32275 20394 0.22 T,C 1.00
rs6885224 rs2023534 20710 0.16 C,G 1.00
rs6885224 rs10036188 20742 0.39 G,A 1.00
rs6885224 rs32274 21053 0.46 C,A 1.00
rs6885224 rs757458 21108 0.39 A,C 1.00
rs6885224 rs757459 21252 0.39 T,C 1.00
rs6885224 rs12514212 21408 0.39 C,T 1.00
rs6885224 rs2400030 21527 0.39 C,T 1.00
rs6885224 rs2400029 21688 0.39 C,T 1.00
rs6885224 rs886525 21834 0.39 C,A 1.00
rs6885224 rs886526 21918 0.46 A,C 1.00
rs6885224 rs886527 22131 0.46 G,A 1.00
rs6885224 rs79989660 22161 0.4 A,G 0.99
rs6885224 rs35081177 22185 0.11 A,G 1.00
rs6885224 rs1859382 22273 0.46 G,C 1.00
rs6885224 rs12516262 22370 0.39 T,G 1.00
rs6885224 rs6881290 22451 0.46 T,C 1.00
rs6885224 rs6859601 22531 0.46 C,T 1.00
rs6885224 rs6880938 22643 0.71 T,C 1.00
rs6885224 rs62339097 22673 0.25 A,G 1.00
rs6885224 rs62339096 22753 0.24 C,T 1.00
rs6885224 rs6885587 22831 0.71 G,C 1.00
rs6885224 rs10041627 22863 0.71 T,G 1.00
rs6885224 rs10059890 23247 0.46 C,T 1.00
rs6885224 rs10067858 23307 0.71 T,C 1.00
rs6885224 rs10067783 23404 0.71 T,C 1.00
rs6885224 rs10074637 23465 0.71 A,C 1.00
rs6885224 rs10059740 23466 0.71 C,T 1.00
rs6885224 rs10059698 23494 0.71 C,T 1.00
rs6885224 rs10073056 23692 0.71 A,C 1.00
rs6885224 rs10066098 23744 0.71 T,C 1.00
rs6885224 rs12516033 24079 0.71 G,T 1.00
rs6885224 rs57133851 24150 0.25 T,C 1.00
rs6885224 rs2158445 24869 0.72 T,A 0.95
rs6885224 rs7713340 25332 0.42 A,G 1.00
rs6885224 rs34061113 25466 0.3 G,A 1.00
rs6885224 rs7709436 25707 0.49 G,A 1.00
rs6885224 rs40291 25777 0.21 T,C 1.00
rs6885224 rs10053794 25933 0.9 G,C 1.00
rs6885224 rs62339093 26460 0.26 G,T 1.00
rs6885224 rs32271 26767 0.21 T,C 1.00
rs6885224 rs32270 27080 0.21 G,T 1.00
rs6885224 rs32267 27550 0.21 G,T 1.00
rs6885224 rs32266 28484 0.21 A,G 1.00
rs6885224 rs32265 29029 0.21 A,G 1.00
rs6885224 rs16901308 29034 0.17 A,G 1.00
rs6885224 rs32264 29356 0.21 A,T 1.00
rs6885224 rs10044129 30587 0.18 C,T 1.00
rs6885224 rs730610 30894 0.73 A,T 1.00
rs6885224 rs27720 31916 0.14 A,G 1.00
rs6885224 rs6874039 32024 0.73 C,T 1.00
rs6885224 rs6873671 32250 0.73 C,G 1.00
rs6885224 rs6873490 32507 0.73 G,A 1.00
rs6885224 rs2214599 33052 0.41 C,T 1.00
rs6885224 rs1302802 33481 0.28 C,T 1.00
rs6885224 rs7736192 33643 0.73 A,C 1.00
rs6885224 rs7714658 33694 0.73 T,C 1.00
rs6885224 rs7732347 33714 0.73 A,G 1.00
rs6885224 rs7732720 33781 0.11 G,A 1.00
rs6885224 rs7731822 34048 0.73 A,G 1.00
rs6885224 rs6892380 34330 0.73 C,T 1.00
rs6885224 rs7713315 34737 0.1 C,T 1.00
rs6885224 rs10513073 35173 0.72 C,T 1.00
rs6885224 rs62339082 35574 0.42 C,A 1.00
rs6885224 rs6881497 36040 0.72 C,G 1.00
rs6885224 rs6876115 36792 0.67 C,G 1.00
rs6885224 rs2158444 37603 0.67 G,T 1.00
rs6885224 rs9942305 37760 0.1 C,T 1.00
rs6885224 rs10069711 37950 0.68 G,T 1.00
rs6885224 rs149188423 38111 0.11 G,T 1.00
rs6885224 rs10069596 38112 0.68 G,A 1.00
rs6885224 rs62339081 38270 0.24 G,A 1.00
rs6885224 rs6865035 38831 0.24 G,A 1.00
rs6885224 rs6864900 38888 0.24 G,C 1.00
rs6885224 rs153603 39885 0.19 T,C 1.00
rs6885224 rs13189665 40373 0.86 A,G 1.00
rs6885224 rs73742130 40426 0.35 C,T 1.00
rs6885224 rs16901404 41987 0.1 T,A 1.00
rs6885224 rs11748430 42226 0.1 A,G 1.00
rs6885224 rs1547940 42586 0.46 T,C 1.00
rs6885224 rs739957 42726 0.1 C,G 1.00
rs6885224 rs11133648 42754 0.37 T,C 0.99
rs6885224 rs2023923 43154 0.37 C,A 1.00
rs6885224 rs76254229 43306 0.21 C,T 1.00
rs6885224 rs79655595 43332 0.33 T,C 1.00
도 7에 나타낸 바와 같이, 마커 rs6885224의 경우 본 실시예의 유전자칩을 이용한 단일염기 다형성 예측 정확도는 평균 17.3개의 선정된 근연 마커를 사용했을 때 정확도가 99.9%였다. 반면에, 선정 기준과 무관한 마커가 배열된 Axiom APMRA 칩의 단일염기 다형성 예측 정확도는 마커의 수를 늘려도 정확도가 높아지지 않았으며, 마커 150개를 사용한 경우 93.2%였다. 상기 결과는 실시예 2의 조건에 따라 선정된 근연 마커가 단일염기 다형성 예측 정확도를 현저히 향상시킬 수 있음을 의미한다.
종합적으로 본 발명자들은 단일염기 다형성 예측의 정확도를 높이기 위하여, (i) 목표 마커를 2회 이상 반복하여 포함하고, (ii) 하기 조건을 만족하는 근연 마커를 포함하는 맞춤형 유전자칩을 개발하였다.
- 목표 마커로부터의 거리 : 250 Kb 미만
- 대립유전자형 빈도 : 0.1 이상
- 마커의 대립 유전자 수 : 2개(Di-allele)
- 유전형 생산율 : 90% 이상
본 발명에 따른 맞춤형 유전자칩은 단일염기 다형성 예측 정확도가 현저히 증가된 것으로, 적은 수의 근연 마커로도 정확도가 높은 데이터를 획득할 수 있다.
이상, 본 발명내용의 특정한 부분을 상세히 기술하였는바, 당업계의 통상의 지식을 가진 자에게 있어서, 이러한 구체적인 기술은 단지 바람직한 실시양태일 뿐이며, 이에 의해 본 발명의 범위가 제한되는 것이 아닌 점은 명백할 것이다. 따라서 본 발명의 실질적인 범위는 첨부된 청구항들과 그것들의 등가물에 의해 정의된다고 할 것이다.

Claims (10)

  1. 목표 마커; 및
    상기 목표 마커와 연관비평형 관계인 근연 마커;를 포함하는, 유전자 검사의 정확도가 향상된 맞춤형 유전자칩.
  2. 제1항에 있어서,
    상기 목표 마커는 유전자칩 내에 2회 이상 포함되는 것인, 유전자칩.
  3. 제1항에 있어서,
    상기 근연 마커는
    조건 (a) 목표 마커로부터의 거리가 1b 내지 500 Kb;
    조건 (b) 분석하고자하는 집단 내 대립유전자형 빈도가 0.01 내지 0.5;
    조건 (c) 대립유전자 수가 2개(Di-allele); 및
    조건 (d) 유전형 생산율(calling rate)이 50 내지 99.99%;로 이루어진 군에서 선택된 1 이상의 조건을 만족하는, 유전자칩.
  4. 목표 마커와 연관비평형 관계인 근연 마커를 선정하는 단계;를 포함하는 유전자 검사의 정확도 향상을 위한 근연 마커 선정 방법.
  5. 제4항에 있어서,
    상기 근연 마커는
    조건 (a) 목표 마커로부터의 거리가 1b 내지 500 Kb;
    조건 (b) 분석하고자하는 집단 내 대립유전자형 빈도가 0.01 내지 0.5;
    조건 (c) 대립유전자 수가 2개(Di-allele); 및
    조건 (d) 유전형 생산율(calling rate)이 50 내지 99.99%;로 이루어진 군에서 선택된 1 이상의 조건을 만족하는, 근연 마커 선정 방법.
  6. 제4항 또는 제5항에 따른 근연 마커 선정 방법을 컴퓨터에서 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체.
  7. 목표 마커와 연관비평형 관계인 근연 마커를 선정하는 단계; 및
    상기 목표 마커 및 근연 마커를 이용하여 단일염기 다형성 예측을 수행하는 단계;를 포함하는 단일염기 다형성 예측 분석 방법.
  8. 제7항에 있어서,
    상기 단일염기 다형성 예측은 목표 마커를 2 회 이상 분석하는 것인, 방법.
  9. 제7항에 있어서,
    상기 근연 마커는
    조건 (a) 목표 마커로부터의 거리가 1b 내지 500 Kb;
    조건 (b) 분석하고자하는 집단 내 대립유전자형 빈도가 0.01 내지 0.5;
    조건 (c) 대립유전자 수가 2개(Di-allele); 및
    조건 (d) 유전형 생산율(calling rate)이 50 내지 99.99%;로 이루어진 군에서 선택된 1 이상의 조건을 만족하는, 방법.
  10. 제7항 내지 제9항 중 어느 한 항에 따른 단일염기 다형성 예측 분석 방법을 컴퓨터에서 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체.
PCT/KR2020/017383 2019-12-27 2020-12-01 유전자 검사를 위한 맞춤형 유전자칩 및 이의 제작 방법 WO2021132920A1 (ko)

Priority Applications (2)

Application Number Priority Date Filing Date Title
US17/788,391 US20230129183A1 (en) 2019-12-27 2020-12-01 Tailored gene chip for genetic test and fabrication method therefor
EP20905893.2A EP4083226A4 (en) 2019-12-27 2020-12-01 CUSTOMIZED GENE CHIP FOR GENETIC TESTING AND METHOD FOR MANUFACTURING SAME

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR10-2019-0175987 2019-12-27
KR1020190175987A KR102169699B1 (ko) 2019-12-27 2019-12-27 유전자 검사를 위한 맞춤형 유전자칩 및 이의 제작 방법

Publications (1)

Publication Number Publication Date
WO2021132920A1 true WO2021132920A1 (ko) 2021-07-01

Family

ID=73039442

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/KR2020/017383 WO2021132920A1 (ko) 2019-12-27 2020-12-01 유전자 검사를 위한 맞춤형 유전자칩 및 이의 제작 방법

Country Status (4)

Country Link
US (1) US20230129183A1 (ko)
EP (1) EP4083226A4 (ko)
KR (1) KR102169699B1 (ko)
WO (1) WO2021132920A1 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114874894A (zh) * 2022-06-21 2022-08-09 余琳莉 一种专用于基因检测的电化学基因芯片测试装置

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102169699B1 (ko) * 2019-12-27 2020-10-23 주식회사 클리노믹스 유전자 검사를 위한 맞춤형 유전자칩 및 이의 제작 방법

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20100020960A (ko) * 2007-06-11 2010-02-23 주노 바이오사이언스, 엘엘씨 자궁내막증과 연관된 유전자 마커 및 이의 용도
KR20110081807A (ko) * 2008-08-12 2011-07-14 디코드 제네틱스 이에이치에프 갑상선암의 위험도 평가를 위해 유용한 유전적 변이
KR20140039278A (ko) * 2011-06-08 2014-04-01 드노보 바이오파마 (항주) 리미티드 코포레이션 레티노이드 x 수용체 모듈레이터 활성 예측 방법 및 조성물
KR20170063977A (ko) * 2014-09-30 2017-06-08 지네틱 테크놀로지스 리미티드 유방암 발생 위험의 평가 방법
KR102169699B1 (ko) * 2019-12-27 2020-10-23 주식회사 클리노믹스 유전자 검사를 위한 맞춤형 유전자칩 및 이의 제작 방법

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2000028080A2 (en) * 1998-11-10 2000-05-18 Genset Methods, software and apparati for identifying genomic regions harboring a gene associated with a detectable trait
KR100692319B1 (ko) 2006-02-20 2007-03-12 한국생명공학연구원 단백질 상호작용 네트워크 분석을 통한 새로운 질병관련유전자 선정방법
CA2724475C (en) * 2008-05-16 2019-05-07 The Children's Hospital Of Philadelphia Genetic alterations on chromosomes 21q, 6q and 15q and methods of use thereof for the diagnosis and treatment of type i diabetes
KR101906312B1 (ko) 2016-02-05 2018-10-10 사회복지법인 삼성생명공익재단 추정 자손의 유전질환 발병 위험성을 예측하는 방법 및 시스템
WO2017205827A1 (en) * 2016-05-26 2017-11-30 Singular Bio, Inc. Arrays for single molecule detection and uses thereof

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20100020960A (ko) * 2007-06-11 2010-02-23 주노 바이오사이언스, 엘엘씨 자궁내막증과 연관된 유전자 마커 및 이의 용도
KR20110081807A (ko) * 2008-08-12 2011-07-14 디코드 제네틱스 이에이치에프 갑상선암의 위험도 평가를 위해 유용한 유전적 변이
KR20140039278A (ko) * 2011-06-08 2014-04-01 드노보 바이오파마 (항주) 리미티드 코포레이션 레티노이드 x 수용체 모듈레이터 활성 예측 방법 및 조성물
KR20170063977A (ko) * 2014-09-30 2017-06-08 지네틱 테크놀로지스 리미티드 유방암 발생 위험의 평가 방법
KR102169699B1 (ko) * 2019-12-27 2020-10-23 주식회사 클리노믹스 유전자 검사를 위한 맞춤형 유전자칩 및 이의 제작 방법

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
PARK, SEON-YANG: "DNA Microarray System Development Center for Diagnostic and Prognostic Applications of Umbilical Cord Blood", THE FINAL REPORT OF THE R&D PROJECT ON HEALTH AND MEDICAL TECHNOLOGY (MINISTRY OF HEALTH AND WELFARE), 2 April 2013 (2013-04-02), pages 1 - 321, XP009528624 *
See also references of EP4083226A4 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114874894A (zh) * 2022-06-21 2022-08-09 余琳莉 一种专用于基因检测的电化学基因芯片测试装置
CN114874894B (zh) * 2022-06-21 2023-08-25 上海捷瑞生物工程有限公司 一种专用于基因检测的电化学基因芯片测试装置

Also Published As

Publication number Publication date
KR102169699B1 (ko) 2020-10-23
EP4083226A1 (en) 2022-11-02
EP4083226A4 (en) 2024-03-13
US20230129183A1 (en) 2023-04-27

Similar Documents

Publication Publication Date Title
Wright et al. Making new genetic diagnoses with old data: iterative reanalysis and reporting from genome-wide data in 1,133 families with developmental disorders
Human Genome Structural Variation Working Group Eichler Evan E. 1 2 Nickerson Deborah A. 1 Altshuler David 3 Bowcock Anne M. 4 Brooks Lisa D. 5 Carter Nigel P. 6 Church Deanna M. 7 Felsenfeld Adam 5 Guyer Mark 5 Lee Charles 3 8 Lupski James R. 9 Mullikin James C. 10 Pritchard Jonathan K. 11 Sebat Jonathan 12 Sherry Stephen T. 7 Smith Douglas 13 Valle David 14 Waterston Robert H. 1 Completing the map of human genetic variation
Banovich et al. Methylation QTLs are associated with coordinated changes in transcription factor binding, histone modifications, and gene expression levels
Topper et al. Exome sequencing and the genetics of intellectual disability
WO2021132920A1 (ko) 유전자 검사를 위한 맞춤형 유전자칩 및 이의 제작 방법
Domagalska et al. Genomes of Leishmania parasites directly sequenced from patients with visceral leishmaniasis in the Indian subcontinent
Tebbutt et al. Microarray genotyping resource to determine population stratification in genetic association studies of complex disease
WO2017116123A1 (ko) 개인 유전체의 유전변이정보를 이용한 질병원인 발굴 시스템
CN104302781A (zh) 一种检测染色体结构异常的方法及装置
Nishida et al. Evaluating the performance of Affymetrix SNP Array 6.0 platform with 400 Japanese individuals
Trujillano et al. Next generation diagnostics of cystic fibrosis and CFTR-related disorders by targeted multiplex high-coverage resequencing of CFTR
WO2017023148A1 (ko) 다양한 플랫폼에서 태아의 성별과 성염색체 이상을 구분할 수 있는 새로운 방법
Vergult et al. Mate pair sequencing for the detection of chromosomal aberrations in patients with intellectual disability and congenital malformations
Corrales et al. High-throughput molecular diagnosis of von Willebrand disease by next generation sequencing methods
WO2017116135A1 (ko) 개인 유전체의 유전변이정보를 이용한 유전형 분석 시스템 및 방법
WO2017086675A1 (ko) 대사 이상 질환 진단 장치 및 그 방법
WO2021025218A1 (ko) 연관 표현형의 유전적 위험도를 결합한 질병의 위험도 예측 장치 및 방법
CN109524060B (zh) 一种遗传病风险提示的基因测序数据处理系统与处理方法
Pennings et al. Copy number variants from 4800 exomes contribute to~ 7% of genetic diagnoses in movement disorders, muscle disorders and neuropathies
Hassan et al. Whole genome characterization of methicillin resistant Staphylococcus aureus in an Egyptian Tertiary Care Hospital
WO2020209590A1 (ko) 신경교종의 진단 또는 예후 예측용 조성물 및 이에 관한 정보를 제공하는 방법
WO2017204414A1 (ko) 시료의 교차 오염 정도를 분석하는 방법 및 장치
WO2017191871A1 (ko) 변이 검출 표지의 신뢰도를 결정하는 방법 및 장치
WO2019132581A1 (ko) 유방암 및 난소암 등 암 진단용 조성물 및 이의 용도
WO2019031867A1 (ko) 앰플리콘 기반 차세대 염기서열 분석기법에서 프라이머 서열을 제거하여 분석의 정확도를 높이는 방법

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 20905893

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

ENP Entry into the national phase

Ref document number: 2020905893

Country of ref document: EP

Effective date: 20220727