KR20110021095A - Snp markers for sex determination and/or human identification - Google Patents
Snp markers for sex determination and/or human identification Download PDFInfo
- Publication number
- KR20110021095A KR20110021095A KR1020090078690A KR20090078690A KR20110021095A KR 20110021095 A KR20110021095 A KR 20110021095A KR 1020090078690 A KR1020090078690 A KR 1020090078690A KR 20090078690 A KR20090078690 A KR 20090078690A KR 20110021095 A KR20110021095 A KR 20110021095A
- Authority
- KR
- South Korea
- Prior art keywords
- snp markers
- snp
- markers
- gender
- sex
- Prior art date
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6876—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
- C12Q1/6879—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for sex determination
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6844—Nucleic acid amplification reactions
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/156—Polymorphic or mutational markers
Landscapes
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Organic Chemistry (AREA)
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Genetics & Genomics (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Molecular Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- Biotechnology (AREA)
- Biochemistry (AREA)
- Analytical Chemistry (AREA)
- Physics & Mathematics (AREA)
- Biophysics (AREA)
- Microbiology (AREA)
- General Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Immunology (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Plant Pathology (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
Description
본 발명은 단일염기변이를 갖는 SNP(single nucleotide polymorphism) 마커를 이용한 성별 결정 및/또는 개체 식별용 마커와 이를 이용한 성별 결정 및/또는 개체 식별 방법에 관한 것이다. The present invention relates to a marker for gender determination and / or individual identification using a single nucleotide polymorphism (SNP) marker having a single base mutation and a method for gender determination and / or individual identification using the same.
성별 식별 및 개체 식별은 범죄수사과학에서 많이 사용되는 중요한 유전자 검사방법으로서 다양한 인종에서 다수의 대립유전자형을 갖고 있는 STR(short tandem repeat) 마커가 주로 사용되고 있다. 그러나 STR 마커는 높은 돌연변이율, 한꺼번에 많은 유전형(multiplexing) 정보를 얻기가 어렵고, 대립유전형을 결정하기 위해서는 큰 사이즈의 증폭 산물이 요구되는 등의 문제로 인하여 그 사용이 제한되고 있다. Gender and individual identification are important genetic testing methods widely used in criminal investigation science, and short tandem repeat (STR) markers, which have multiple alleles in various races, are mainly used. However, the use of STR markers has been limited due to problems such as high mutation rate, difficulty in obtaining a large amount of multiplexing information at once, and the need for amplification products of large size to determine alleles.
한편, SNP(Single Nucleotide Polymorphism)는 개인 간에 존재하는 두 개의 다른 유전체에서 단일염기서열의 차이에 기인된 유전변이형을 말하며 전체 인간 유전변이형에서 가장 많은 부분 즉, 전체 인간 유전변이의 약 90% 이상을 차지하는 유전변이 마커이다. On the other hand, Single Nucleotide Polymorphism (SNP) refers to a genetic variation caused by a difference in a single base sequence in two different genomes existing between individuals, and represents the largest portion of all human genetic variants, that is, about 90% of all human genetic variants. It is a genetic mutation marker that accounts for the above.
SNP 마커는 기존의 다른 유전변이형 마커들에 비해 보다 촘촘하고 안정한 유전 지도를 작성할 수 있다는 점과 새로운 기술, 특히 DNA 칩을 포함하는 고효율 유전자형 결정기술(high-throughput genotyping technology)에 보다 적합한 특성을 가지고 있다. SNP markers offer more compact and stable genetic maps than other genetically engineered markers, and are more suitable for new technologies, particularly high-throughput genotyping technology, including DNA chips. Have.
따라서 높은 돌연변이율 등의 문제점을 지닌 현재 개체 식별용으로 사용되는 STR 마커를 대신할 새로운 SNP 마커의 개발은 많은 장점을 가지고 다양한 분야에 활용도가 클 것으로 예상된다. Therefore, the development of a new SNP marker to replace the STR marker currently used for identification of individuals with problems such as high mutation rate is expected to have many advantages and to be widely used in various fields.
본 발명의 목적은 기존 STR 마커의 문제점을 해결할 수 있는 성별 판별용 SNP 마커 및/또는 개체 식별용 SNP 마커를 제공하는 데에 있다. An object of the present invention is to provide a sex discrimination SNP marker and / or individual identification SNP marker that can solve the problem of the existing STR marker.
또한, 본 발명의 다른 목적은 성별 판별용 SNP 마커와 개체 식별용 SNP 마커를 이용한 성별 판별 및 개체 식별 방법을 제공하는 데에 있다.Another object of the present invention is to provide a gender discrimination method and an individual identification method using a sex discrimination SNP marker and an individual identification SNP marker.
상기 목적을 달성하기 위하여, 본 발명은 아멜로제닌(Amelogenin) 유전자(AMELX & AMELY)에서 발굴된 성별 판별용 SNP(single nucleotide polymorphism) 마커 3개와 아연 핑거 단백질 유전자(ZFX & ZFY)에서 발굴된 성별 판별용 SNP(single nucleotide polymorphism) 마커 3개를 포함한 총 6개로 이루어진 성별 판별용 SNP 마커를 제공한다. In order to achieve the above object, the present invention is a sex discriminated from three single nucleotide polymorphism (SNP) markers and zinc finger protein genes (ZFX & ZFY) for sex discrimination found in the Amelogenin gene (AMELX & AMELY) Provided are six gender discriminating SNP markers including three discriminating single nucleotide polymorphism (SNP) markers.
또한, 본 발명은 모든 인종 집단에서 고도의 다형성을 가지고 있는 개체식별용 30개 SNP 마커로서, 상기 30개의 SNP 마커(GenBank Accession No at dbSNP)는 rs7532151, rs4846468, rs6751657, rs10185531, rs7652776, rs6443222, rs17497475, rs1350191, rs2565007, rs4607417, rs1790006, rs2813838, rs2267708, rs1293288, rs7849782, rs7907658, rs550840, rs543840, rs734075, rs1151849, rs7328030, rs978511, rs7164801, rs955665, rs4791495, rs4647887, rs1785745, rs7230112, rs8113496 및 rs2327088로 이루어진 군에서 선택된 것을 특징으로 하는 개체 식별용 SNP 마커를 제공한다.In addition, the present invention is 30 SNP markers for individual identification having a high degree of polymorphism in all ethnic groups, wherein the 30 SNP markers (GenBank Accession No at dbSNP) are rs7532151, rs4846468, rs6751657, rs10185531, rs7652776, rs6443222, rs17497475 rs1350191, rs2565007, rs4607417, rs1790006, rs2813838, rs2267708, rs1293288, rs7849782, rs7907658, rs550840, rs543840, rs734075, rs1151849, rs7328030, rs978511, rs716951, rs716 480 It provides a SNP marker for identifying an individual, characterized in that selected.
이하, 본 발명을 보다 상세하게 설명한다.Hereinafter, the present invention will be described in more detail.
1. 성별 판별 SNP 마커1. Gender Discrimination SNP Markers
기존의 성별을 결정하는 것으로는 아멜로제닌 유전자(AMELX & AMELY)에 존재하는 Insertion/deletion(Indel) DNA 마커를 이용하여 판별하였으나, 본 발명에서는 아멜로제닌 유전자(AMELX &AMELY)와 아연 핑거 유전자(ZFX &ZFY)에 존재하는 단일염기서열의 차이를 이용하여 사람의 성별을 판별하였다. Existing sex was determined using the Insertion / deletion (Indel) DNA marker present in the amelogenin gene (AMELX & AMELY), but in the present invention, the amelogenin gene (AMELX & AMELY) and zinc finger gene ( ZFX & ZFY) was used to determine the sex of humans using the difference in the single nucleotide sequence.
① 아멜로제닌 유전자의 성별 판별용 SNP 마커 발굴 ① Identifying SNP Markers for Gender Identification of Amellogenin Genes
우선 단일염기서열 차이를 이용한 성별 판별을 위해 성염색체 X & Y에 각각 존재하면서 유전자의 염기서열이 매우 유사한 아멜로제닌 유전자 2개(AMELX: X 염색체에 존재 & AMELY: Y 염색체에 존재함)의 염기서열이 매우 유사한 부위(도 3a 참조)를 우선 선별하고, 여자 12명과 남자 12명의 DNA 시료를 이용하여 시퀀싱(sequencing) 하여 성별을 완전히 구분할 수 있는 3개의 단일염기서열(도 4a 참조)을 발굴하였다. First of all, two amelogenin genes (AMELX: present on the X chromosome and AMELY: Y chromosome) of each of the sex chromosomes X & Y and very similar gene sequences for sex discrimination using a single nucleotide sequence Sites with very similar sequences (see Fig. 3a) are first selected, followed by sequencing using DNA samples from 12 females and 12 males to identify three single base sequences (see Fig. 4a) that can fully differentiate sex. It was.
성별을 판별할 수 있는 3개의 단일염기서열 위치는 NCBI GenBank에 등록된 AMELX 유전자 염기서열(GenBank Accession No: NC_000023) 정보에서 염기서열 #5139 (C/T), 염기서열 #5196 (C/G), 그리고 염기서열 #5232 (C/T)에 위치하고 있으며 단일염기서열의 차이가 성별을 정확히 판별함을 확인하였다. 이때, 구체적인 염기서열 정보는 도 1과 같다.The three single nucleotide positions for which sex can be determined are shown in nucleotide sequence # 5139 (C / T) and nucleotide sequence # 5196 (C / G) in the AMELX gene sequence (GenBank Accession No: NC_000023) information registered in NCBI GenBank. , And located in nucleotide sequence # 5232 (C / T), and it was confirmed that the difference between the single nucleotide sequences accurately determined sex. At this time, the specific sequence information is shown in FIG.
② 아연 핑거 단백질(ZFX & ZFY) 유전자의 성별 판별용 SNP 마커 발굴 ② Identifying SNP markers for gender discrimination of zinc finger protein (ZFX & ZFY) genes
아멜로제닌 유전자와 동일하게 성염색체 X & Y에 각각 존재하는 아연 핑거 단백질 유전자 2개(ZFX: X 염색체에 존재 & ZFY: Y 염색체에 존재함)의 염기서열이 매우 유사한 부위(도 3b 참조)를 우선 선별하고, 여자 12명과 남자 12명의 DNA 시료를 이용하여 시퀀싱(sequencing) 하여 성별을 완전히 구분할 수 있는 3개의 단일염기서열(도 4b 참조)을 발굴하였다. Sites with very similar nucleotide sequences of two zinc finger protein genes (ZFX: present on X chromosome & ZFY: Y chromosome), which are present on sex chromosomes X & Y, identically to the amelogenin gene (see FIG. 3B) Were first selected, and three single nucleotide sequences (see FIG. 4B) were identified to be completely distinguished by sequencing using DNA samples of 12 females and 12 males.
성별을 결정할 수 있는 3개의 단일염기서열 위치는 NCBI GenBank에 등록된 ZFX 유전자 염기서열(GenBank Accession No: NC_000023) 정보에서 염기서열 #60664 (C/T), 염기서열 #60751 (C/T), 그리고 염기서열 #60766 (A/G)에 위치하고 있으며 단일염기서열의 차이가 성별을 결정함을 확인하였다. 이때, 구체적인 염기서열 정보는 도 2와 같다.The three single nucleotide positions that can be determined by sex are shown in SEQ ID NO: # 60664 (C / T), SEQ ID NO: # 60751 (C / T), in the ZFX Gene Sequence (GenBank Accession No: NC_000023) information registered in NCBI GenBank. And it is located in the base sequence # 60766 (A / G) and it was confirmed that the difference between the single base sequence determines the sex. At this time, the specific sequence information is as shown in FIG.
즉, 사람의 성별을 판별하기 위한 SNP 마커 발굴을 위해 아멜로제닌 유전자(AMELX 및 AMELY)와 아연 핑거 단백질 유전자(ZFX 및 ZFY) 각각에서 X 염색체와 Y 염색체에서 존재하는 두 유전자 간의 다중 염기서열 정렬로 상동성이 높은 영역을 선별한다. PCR 프라이머을 이용하여 X 및 Y 염색체 상의 유전자 간 하나의 뉴클레오타이드 차이를 포함하는 표적 영역 150-250 bp를 증폭시킬 수 있다(프라미어 서열은 도 3a 및 도 3b에서 밑줄 친 부위의 염기서열임). In other words, in order to discover SNP markers for determining the sex of humans, multiple sequences of two genes on the X chromosome and the Y chromosome on the amelogenin gene (AMELX and AMELY) and the zinc finger protein genes (ZFX and ZFY), respectively Select regions with high homology. PCR primers can be used to amplify 150-250 bp of target region containing one nucleotide difference between genes on X and Y chromosomes (prime sequence is the base sequence of the underlined region in FIGS. 3A and 3B).
일실시예로서, 12명의 남성 및 12명의 여성을 포함한 24명의 개체에 대한 염기서열 분석을 통해 아멜로제닌 유전자에서 3개의 단일염기서열 부위 (AMEL-1,-2,-3)와 아연 핑거 단백질 유전자에서 3개의 단일염기서열 부위(ZF-1,-2,-3)에서 남성과 여성을 완벽하게 구별할 수 있었다(도 4a 및 도 4b 참조).As an example, three single nucleotide sequence sites (AMEL-1, -2, -3) and zinc finger protein in the amelogenin gene were analyzed by sequencing of 24 individuals, including 12 males and 12 females. Three single nucleotide sequence sites (ZF-1, -2, -3) in the gene were able to fully distinguish between male and female (see Figures 4a and 4b).
또한, 본 발명에 따른 6개의 SNP 마커 중 하나 또는 둘 이상의 SNP 마커 세 트를 이용하여 지노타이핑(genotyping)함으로써 성별을 판별할 수 있다. 일실시예로서, 다수의 피검체 DNA 시료(총 960명 DNA 시료)에서 상기 선별된 AMEL-1 (C/T) 부위, AMEL-2 (C/G) 부위 및 ZF-1 (C/T) 부위를 지노타이핑하여 예상 성별과 유전자형이 정확히 일치하였다(도 5 참조). In addition, sex may be determined by genotyping using one or two or more SNP marker sets among six SNP markers according to the present invention. In one embodiment, the selected AMEL-1 (C / T) site, AMEL-2 (C / G) site, and ZF-1 (C / T) from a plurality of subject DNA samples (total 960 DNA samples) The region was genotyped to exactly match the expected gender and genotype (see Figure 5).
2. 개체 식별용 SNP 마커 2. SNP Marker for Individual Identification
기존의 개체 식별 방법은 STR 마커가 사용되고 있으나, 본 발명에서는 SNP 마커를 이용한 개체 식별 방법을 개발하였으며 이를 위하여 개체 식별용 SNP 마커는 다음과 같은 방법을 사용하여 동정되었다. Conventional object identification methods are used STR markers, but in the present invention has been developed a method for identifying individuals using SNP markers for this purpose, the SNP markers for individual identification were identified using the following method.
우선, 총 50만개의 SNP(500K)를 지노타이핑할 수 있는 Affymetrix 회사의 제품(Genome-Wide Human SNP array 5.0)을 사용하여 한국인 2,000명에서 생산된 유전자형 정보를 사용하여 한국인에서 매우 고도로 다형성(minor allele frequency >0.45 이상)을 보이는 SNP 마커를 다수 선별하였다. First, a very high degree of polymorphism in Koreans was obtained using genotype information produced by 2,000 Koreans using Affymetrix's product (Genome-Wide Human SNP array 5.0), which can genotype 500,000 SNPs (500K) in total. A large number of SNP markers showing allele frequency> 0.45) were selected.
이렇게 선별된 SNP 마커는 다시 다른 인종집단(서양인, 아프리카인 & 동양인)에서 모두 고도의 다형성 (minor allele frequency >0.45이상)을 보이는 SNP 마커 56개를 최종 선별하였다. 그리고 선별된 56개의 SNP 마커에서 최종적으로 30개를 선별(표 1)하여 한국인 960명의 DNA 시료를 이용하여 실제 개체식별 능력을 검정한 결과 매우 우수한 개체식별 능력을 갖고 있었다(표 2). The selected SNP markers were finally selected from 56 SNP markers showing high polymorphism (minor allele frequency> 0.45) in all ethnic groups (Western, African & Oriental). Finally, 30 were selected from 56 selected SNP markers (Table 1), and the actual individual identification ability was tested using 960 Korean DNA samples.
표 1에 나타난 바와 같이 개체 식별용 SNP 마커 30개의 정보(GenBank SNP ID: dbSNP)는 다음과 같다: rs7532151, rs4846468, rs6751657, rs10185531, rs7652776, rs6443222, rs17497475, rs1350191, rs2565007, rs4607417, rs1790006, rs2813838, rs2267708, rs1293288, rs7849782, rs7907658, rs550840, rs543840, rs734075, rs1151849, rs7328030, rs978511, rs7164801, rs955665, rs4791495, rs4647887, rs1785745, rs7230112, rs8113496 & rs2327088. As shown in Table 1, information of 30 SNP markers for identification of individuals (GenBank SNP ID: dbSNP) is as follows: rs7532151, rs4846468, rs6751657, rs10185531, rs7652776, rs6443222, rs17497475, rs1350191, rs2565007, rs4607417, rs138900, rs2267708, rs1293288, rs7849782, rs7907658, rs550840, rs543840, rs734075, rs1151849, rs7328030, rs978511, rs7164801, rs955665, rs4791495, rs4647887, rs1785745, rs7230112, rs818896.r
또한, 본 발명은 상기 성별 판별용 SNP 마커 6개와 상기 개체 식별용 SNP 마커 30개를 조합하여 사용함으로써 성별과 개체를 동시에 식별할 수 있는 성별 판별 및 개체 식별 방법을 제공한다. In addition, the present invention provides a sex discrimination and individual identification method capable of simultaneously identifying a sex and an individual by using a combination of the six sex discrimination SNP markers and the individual identification SNP markers.
상기 성별 판별은 하나 이상의 성별 판별용 마커를 사용하고, 상기 개체 식별은 개체 식별용 SNP 마커를 사용하되, 10개 SNP 마커를 이용하면 100명까지, 15개 SNP 마커는 1,000명까지의 개체를 식별할 수 있으며, 더나아가, 20개의 SNP 마커를 사용한 경우에는 약 10,000명(실제분석에서 8,842명의 시료에서 검정됨을 확인함)의 개체 모두를 완벽하게 식별할 수 있다. The gender discrimination uses one or more gender discrimination markers, and the individual identification uses an individual identification SNP marker, wherein up to 100 individuals using 10 SNP markers and 15 SNP markers identify up to 1,000 individuals. Furthermore, when 20 SNP markers were used, it was possible to fully identify all 10,000 individuals (which were verified in 8,842 samples in the actual analysis).
따라서, 개체 식별용 시료의 수가 10배 증가할 때 마다 개체 식별용 SNP 마커를 5개씩 증가하여 다양한 개수의 조합으로 개체 식별용 DNA 마커 세트를 사용하여 성별 판별 및 개체 식별을 결정할 수 있다. Therefore, each time the number of individual identification samples increases 10 times, the number of individual identification SNP markers is increased by 5, and sex discrimination and individual identification can be determined using a DNA marker set for identification of individuals in various numbers of combinations.
또한, SNP 마커의 숫자를 증가하여 최대 40개를 사용하면 한국인 집단에서 STR 마커 16개를 사용하는 표준 개체식별용 마커 세트와 동일한 개체식별 능력을 가지게 된다. In addition, if the number of SNP markers is increased and used up to 40, the Korean population has the same individual identification capability as the standard identification marker set using 16 STR markers.
한편 최종적으로 선별된 30개의 SNP 마커는 마커 간의 거리가 최소 50 Mb (약 50 cM) 이상 떨어져 있어 임의로 어떤 조합을 골라도 모두 동일한 식별능력을 가지게 된다. On the other hand, the 30 selected SNP markers have a distance of at least 50 Mb (about 50 cM) apart from each other, and thus all have the same discrimination ability regardless of any combination.
또한, 본 발명에서는 성별 판별, 개체 식별 및 기타 다양한 외형(예, 피부색, 머리색 및 눈동자색 등)에 관련된 유전자형 정보를 유전자 검사에 추가적으로 사용할 수 있도록 하기 위하여 최소 1개에서 최대 386개 SNP 마커까지 동시에 지노타이핑할 수 있는 Illumina 회사의 BeadExpress 시스템을 사용함으로써 향후에 다양한 표현형에 관련된 SNP 마커를 추가할 수 있는 방법까지 확보하게 되었다. In addition, in the present invention, genotype information related to gender discrimination, individual identification, and various other appearances (eg, skin color, hair color, and eye color, etc.) may be additionally used in genetic testing for at least one to a maximum of 386 SNP markers. At the same time, the use of Illumina's BeadExpress system, which can be genotyped, provides a way to add SNP markers related to various phenotypes in the future.
본 발명에 따른 SNP 마커를 이용하여 성별 판별 및 개체 식별을 하게 되면 STR 마커와 달리 낮은 돌연변이율, 분해된 DNA 시료에 유용한 100bp보다 짧은 앰플리콘 크기의 유용성 및 고효율 지노타이핑 기술 등의 장점이 있어 성별 판별 및 개체 식별에 매우 유용하다.Gender determination and individual identification using the SNP marker according to the present invention, unlike the STR marker, has the advantages of low mutation rate, usefulness of amplicon size shorter than 100bp useful for digested DNA samples, and high efficiency genotyping technology. And very useful for identifying individuals.
하기 실시예를 통해 본 발명을 보다 상세하게 설명한다. 그러나, 이러한 실시예는 본 발명의 내용을 구체화하기 위한 설명일 뿐 실시예에 의해 본 발명이 한정되는 것은 아니다. The present invention is explained in more detail through the following examples. However, these examples are only for the purpose of embodying the subject matter of the present invention and the present invention is not limited by the examples.
이하 실시예에서 사용된 모든 DNA 시료는 표준 DNA 추출법에 따라 혈액 또는 Epstein Barr virus(EBV)-형질전환 B-세포로부터 분리된 것을 사용하였다. 그리고 이하 실험은 서울아산병원 임상시험심사위원회의 승인을 받아 수행되었다. All DNA samples used in the examples below were isolated from blood or Epstein Barr virus (EBV) -transformed B-cells according to standard DNA extraction methods. The following experiments were performed with the approval of the Asan Medical Center Institutional Review Board.
<실시예 1> 성별 결정용 SNP 마커의 선별 및 유효성 평가Example 1 Screening and Validation of SNP Markers for Gender Determination
1. 성별 판별용 SNP 마커의 선별 1. Screening of SNP Markers for Gender Discrimination
성별 판별용 SNP 마커를 동정하기 위하여, 12개 CEPH 가계 시료(시료고유번호: GM06994, GM07022, GM07347, GM07357, GM12962, GM12960, GM07000, GM07056, GM07346, GM07345, GM12863, GM12861)의 DNA[Coriell Institute for Medical Research(http://www.coriell.org/)로부터 구입하여 사용함]와 12개의 한국인 개체의 DNA 시료[질병관리본부 국립보건연구원 유전체센터 유전자원은행팀으로부터 제공받아 사용함]를 사용하였다.In order to identify SNP markers for gender discrimination, DNA of 12 CEPH household samples (sample unique number: GM06994, GM07022, GM07347, GM07357, GM12962, GM12960, GM07000, GM07056, GM07346, GM07345, GM12863, GM12861) [Coriell Institute for Purchased from Medical Research (http://www.coriell.org/) and DNA samples of 12 Korean individuals (provided for use by the Genetic Resources Bank Team, Genome Center, National Institute of Health Research, Center for Disease Control and Prevention).
아멜로제닌 유전자(AMELX 및 AMELY)와 아연 핑커 단백질 유전자(ZFX 및 ZFY)의 서열 분석을 위하여, GenBank(http://www.ncbi/nlm.nih.gov/) 데이터베이스로부터 게놈 서열을 얻고 PCR 프라이머를 Primer3 소프트웨어(http://frodo.wi.mit.edu/)를 이용하여 선정하여 X 및 Y 염색체 상의 유전자 간 하나의 염기서열 차이를 포함하는 높은 상동성 표적 영역 150-250 bp를 증폭시켰다(도 3a 및 도 3b 참조). 이때, PCR 프라이머 서열은 밑줄친 부분이다.For sequencing of the amelogenin genes (AMELX and AMELY) and zinc pinker protein genes (ZFX and ZFY), genomic sequences were obtained from the GenBank (http: //www.ncbi/nlm.nih.gov/) database and PCR primers Was selected using Primer3 software (http://frodo.wi.mit.edu/) to amplify 150-250 bp of high homology target region containing one sequence difference between genes on X and Y chromosomes ( 3a and 3b). At this time, the PCR primer sequence is an underlined part.
한편, PCR 증폭 반응은 20 ng 게놈 DNA, 0.15μM 각 프라이머, 100μM 각 dNTP, 1 unit의 AmpliTaq GoldTM(Applied Biosystems, Foster City, CA, USA) 및 1.5mM MgCl2를 포함한 반응완충액을 함유한 20㎕의 용액에서 수행되었다. PCR은 94℃에서 5분간 반응 후, 94℃에서 45초, 55℃에서 30초, 72℃에서 1분 총 35 주기를 수행하며, 마지막으로 72℃에서 10분간 연장반응을 수행하였다. PCR 산물(1㎕)는 시퀀싱용 주형으로 직접 사용하였고, ABI3730 DNA 염기서열분석기 상에서 BigDye® terminator v3.1 cycle sequencing kit(Applied Biosystems, Foster City, CA, USA)를 사용하여 제조자 지침에 따라 시퀀싱하였다. DNA 다형은 PolyPhred 프로그램(http://droog.gs.washington.edu/PolyPhred.html)을 사용하여 확인하였다. PCR amplification reactions consisted of 20 ng genomic DNA, 0.15 μM each primer, 100 μM dNTP each, 20 units containing reaction buffer containing 1 unit AmpliTaq Gold TM (Applied Biosystems, Foster City, CA, USA) and 1.5 mM MgCl 2 . It was performed in μl of solution. PCR was performed for 5 minutes at 94 ° C., followed by a total of 35 cycles of 45 seconds at 94 ° C., 30 seconds at 55 ° C., 1 minute at 72 ° C., and finally an extension reaction at 72 ° C. for 10 minutes. PCR products (1 μl) were used directly as templates for sequencing and sequenced according to manufacturer's instructions using a BigDye® terminator v3.1 cycle sequencing kit (Applied Biosystems, Foster City, CA, USA) on an ABI3730 DNA sequencer. . DNA polymorphism was confirmed using the PolyPhred program (http://droog.gs.washington.edu/PolyPhred.html).
그 결과, 12명의 남성 및 12명의 여성을 포함한 24명의 개체에 대한 서열 비교를 통해 아멜로제닌 유전자(AMEL-1,-2,-3)와 아연 핑거 단백질 유전자(ZF-1,-2,-3)에서 각각 3개 (총 6개)의 단일염기서열 차이에 의해 남성과 여성을 완벽하게 구별할 수 있었다(도 4a 및 도 4b 참조).As a result, sequence comparisons of 24 individuals, including 12 males and 12 females, resulted in the amelogenin gene (AMEL-1, -2, -3) and zinc finger protein genes (ZF-1, -2,-). In 3), the male and female were completely distinguished by three (6 total) single nucleotide sequences each (see FIGS. 4A and 4B).
2. 성별 판별용 SNP 마커의 유효성 평가 2. Evaluation of Effectiveness of SNP Marker for Gender Discrimination
앞서 선정된 성별 판별용 SNP 마커의 유효성 검사를 위하여, 총 6개의 성별 결정용 단일염기 부위 중에서 3개의 부위(AMEL-1, AMEL-2 & ZF-1)를 선별하여 조사를 하였다. 본 검정실험은 성별에 대한 정보를 확보한 한국인 DNA 시료(n=960)에서 Illumina VeraCode GoldenGate 분석을 이용하여 각 SNP 마커의 지노타이핑을 제조자의 지침에 따라 수행하였다. 지노타이핑 군집 및 콜링(calling)을 BreadStudio 소프트웨어를 이용하여 수행하였다. 그 결과, AMEL-1, AMEL-2, ZF-1를 포함한 3개 마커의 유전자형 검사는 예상된 성별 유전자형과 완벽하게 일치하였다(도 5 참조). In order to test the validity of the previously selected sex discriminating SNP markers, three sites (AMEL-1, AMEL-2 & ZF-1) were selected from a total of six sex determination single base sites. In this assay, genotyping of each SNP marker was performed according to the manufacturer's instructions using Illumina VeraCode GoldenGate analysis on a Korean DNA sample obtained with gender information (n = 960). Genotyping clusters and calling were performed using BreadStudio software. As a result, genotyping of the three markers, including AMEL-1, AMEL-2, ZF-1, was in perfect agreement with the expected gender genotype (see FIG. 5).
<실시예 2> 개체 식별용 SNP 마커의 선별 및 유효성 평가Example 2 Screening and Effectiveness Evaluation of SNP Markers for Individual Identification
1. 개체 식별용 SNP 마커의 선별 1. Selection of SNP Markers for Individual Identification
개체 식별용 SNP 마커를 선별하기 위하여, 먼저 affymetrix 회사의 500K SNP chip을 이용한 2,000명의 한국인 SNP 지노타이핑 결과 및 4개의 HapMap 인종 시료(일본인, 한족, 아프리카인, 유럽인)의 대립유전자형 빈도로 구성된 Affymetrix 500K SNP 데이터(Nat. Genet. 41, 527-534, 2009)를 이용하였다. To screen for SNP markers for identification, an Affymetrix 500K was first composed of 2,000 Korean SNP genotyping results using affymetrix's 500K SNP chip and allele frequency of four HapMap race samples (Japanese, Han Chinese, African, and European). SNP data ( Nat. Genet. 41, 527-534, 2009) was used.
다음과 같은 SNP 선별 기준을 근거로 후보 SNP 마커를 선별하였다. 즉, (i) 모든 인종 군에서 마이너 대립유전자 빈도(minor allele frequency, MAF) > 0.45, (ii) 이형접합성(heterozygosity) > 0.45, (iii) 하디-와인버그 평형(Hardy-Weinberg equilibrium, HWE) P-값 > 0.1, (iv) 지노타입 콜 레이트(call rate) = 100%, 그리고 (v) SNP 마커 간 물리적 거리 > 50Mb. 상기 SNP 선별 기준을 근거로 하여 30개의 SNP를 유효성 평가를 위해 선별하였다(표 1).Candidate SNP markers were selected based on the following SNP selection criteria. That is, (i) minor allele frequency (MAF)> 0.45 in all race groups, (ii) heterozygosity> 0.45, (iii) Hardy-Weinberg equilibrium (HWE) P -Value> 0.1, (iv) genotype call rate = 100%, and (v) physical distance between SNP markers> 50 Mb. Thirty SNPs were selected for efficacy evaluation based on the SNP selection criteria (Table 1).
2. 개체 식별용 SNP 마커의 유효성 평가 2. Evaluation of the Effectiveness of SNP Markers for Individual Identification
앞서 선정된 개체 식별용 30개 SNP 마커의 유효성 검사를 위하여, 두 가지 다른 방법을 활용하였다. 첫 번째 검정방법은 실제로 개체에 대한 정보를 확보한 한국인 960명의 DNA 시료(n=960)를 이용하여 선별된 30개의 SNP 마커를 지노타이핑하여 개체식별 능력을 조사하였다. 또 다른 방법은 선별된 30개의 SNP 마커 정보를 가지고 있는 한국인 8,842명의 Affymetrix Genome-wide Human SNP array 5.0 데이터를 분양받아 총 8,842명의 한국인 시료에서 30개의 SNP 마커를 사용하여 개체식별 능력을 검정하였다. Two different methods were used to validate the 30 SNP markers previously selected. In the first assay, 30 individual SNP markers were genotyped using DNA samples of 960 Koreans (n = 960). In another method, 8,842 Korean Affymetrix Genome-wide Human SNP array 5.0 data with 30 selected SNP markers were distributed and 30 individual SNP markers were used in a total of 8,842 Korean samples.
우선 실제 한국인 960명의 DNA 시료 세트에서 Illumina회사의 VeraCode GoldenGate 지노타이핑 방법을 사용하여 SNP 마커의 지노타이핑을 제조자의 지침에 따라 수행하였다. 지노타이핑 군집 및 콜링(calling)을 BreadStudio 소프트웨어를 이용하여 수행되었다. First, genotyping of SNP markers was performed according to the manufacturer's instructions using Illumina's VeraCode GoldenGate genotyping method on a set of 960 Korean DNA samples. Genotyping clustering and calling was performed using BreadStudio software.
선별된 30개의 SNP 마커 중에서, 29개의 SNP 마커가 성공적으로 지노타이핑 되었고, 나머지 하나의 마커(rs6443222)는 지노타이핑이 되지 않았다. 각 SNP 마커의 대립유전자형 및 유전자형 빈도는 표 1과 거의 동일한 것으로 나타났다. 예상한 대로, 선별된 모든 SNP 마커는 고른 대립유전자형 빈도를 나타내었다. 29개 SNP의 총 평균일치확률(combined power of identity)은 4.83X10-13이며, 이는 총 식별능력(combined power of discrimination) 0.999999999999517과 일치하였다. Of the 30 SNP markers selected, 29 SNP markers were successfully genotyped and the other marker (rs6443222) was not genotyped. The allele and genotype frequencies of each SNP marker were found to be nearly identical to Table 1. As expected, all selected SNP markers showed even allele frequency. The total combined power of identity of the 29 SNPs was 4.83 × 10 −13 , which is consistent with the combined power of discrimination 0.999999999999517.
그리고 960명에서의 지노타이핑 결과에서 15개의 SNP만을 사용한 경우에도 단지 한쌍(2명의 개체)만이 동일한 유전자형을 나타내었는데 이는 15개의 SNP 마커를 사용하면 약 1,000명까지의 개체도 식별할 수 있음을 의미한다. In the genotyping results of 960 people, only one pair (two individuals) showed the same genotype even when only 15 SNPs were used, which means that up to 1,000 individuals can be identified using 15 SNP markers. do.
또한, 8,842명 개체를 포함한 Affymetrix SNP array 5.0 유전자형 데이터 분석을 통해서 개체 식별 능력을 분석한 결과에 의하면, 선별된 30개 SNP의 결합 평균일치확률은 1.78X10-13이며, 이는 결합 식별력 0.999999999999822와 일치하였다. 그리고 표 2에 나타난 바와 같이 개체 식별에 사용되는 SNP 마커의 개수가 5개 증가할 때마다 개체 식별 능력이 10배 증가함을 나타내었다. 즉, 10개 또는 15개 SNP 마커를 사용하면 각각 100명과 1,000명의 개체를 식별할 수 있다. 또한, 20개의 SNP 마커를 사용한 경우에는 8,842명의 개체 모두를 완벽하게 식별할 수 있었다.In addition, according to the analysis of individual identification ability through Affymetrix SNP array 5.0 genotype data analysis including 8,842 individuals, the binding average coincidence probability of the 30 selected SNPs was 1.78X10 -13 , which was consistent with the binding identification 0.999999999999822. . As shown in Table 2, each time the number of SNP markers used to identify an individual increases by 5, the individual identification ability is increased by 10 times. That is, using 10 or 15 SNP markers can identify 100 and 1,000 individuals, respectively. In addition, when 20 SNP markers were used, all 8,842 individuals were fully identified.
*100개 및 1,000개 시료의 경우에는 분석 시료를 모든 시료(n=8,842)로부터 무작위로 3회씩 선별하였다. For 100 and 1,000 samples, analytical samples were randomly selected three times from all samples (n = 8,842).
도 1은 AMELX 유전자의 유전체 염기서열 NC_000023의 부분염기서열과 성별 판별 염기서열의 위치를 나타낸 것이고,Figure 1 shows the position of the partial base sequence and sex discrimination sequence of the genome sequence NC_000023 of the AMELX gene,
도 2는 ZFX 유전자의 유전체 염기서열 NC_000023의 부분염기서열과 성별 판별 염기서열의 위치를 나타낸 것이고,Figure 2 shows the position of the partial base sequence and sex discrimination sequence of the genome sequence NC_000023 of the ZFX gene,
도 3a 및 도 3b는 각각 아멜로제닌 유전자 및 아연 핑거 단백질 유전자의 게놈 DNA 서열을 정렬한 것이고,3A and 3B show the genomic DNA sequences of the amelogenin gene and the zinc finger protein gene, respectively,
도 4a 및 도 4b는 성별 결정용 각 아멜로제닌 유전자 및 아연 핑거 단백질 유전자에 있어서 SNP 동정 결과를 나타낸 것이고,Figures 4a and 4b shows the results of SNP identification in each of the amelogenin gene and zinc finger protein gene for sex determination,
도 5는 960명 개체에서 GoldenGate Assay을 이용한 AMEL-2 마커의 지노타이핑 결과를 나타낸 것이다(자주색 점은 남성, 파란색 점은 여성을 나타냄).Figure 5 shows the genotyping results of AMEL-2 markers using GoldenGate Assay in 960 individuals (purple dots represent males, blue dots represent females).
Claims (6)
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020090078690A KR101400303B1 (en) | 2009-08-25 | 2009-08-25 | SNP Markers for sex determination |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020090078690A KR101400303B1 (en) | 2009-08-25 | 2009-08-25 | SNP Markers for sex determination |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20110021095A true KR20110021095A (en) | 2011-03-04 |
KR101400303B1 KR101400303B1 (en) | 2014-06-10 |
Family
ID=43930057
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020090078690A KR101400303B1 (en) | 2009-08-25 | 2009-08-25 | SNP Markers for sex determination |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR101400303B1 (en) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2017532699A (en) * | 2014-09-05 | 2017-11-02 | ナントミクス,エルエルシー | Systems and methods for origin determination |
CN109735630A (en) * | 2019-01-05 | 2019-05-10 | 兰州大学 | The detection method and label application of sheep ZFY gene mononucleotide polymorphism label |
CN113564266A (en) * | 2021-09-24 | 2021-10-29 | 上海仁东医学检验所有限公司 | SNP typing genetic marker combination, detection kit and application |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102390942B1 (en) | 2019-06-25 | 2022-04-26 | 대한민국 | Composition of single nucleotide polymorphism marker for estimating race in six countries |
-
2009
- 2009-08-25 KR KR1020090078690A patent/KR101400303B1/en not_active IP Right Cessation
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2017532699A (en) * | 2014-09-05 | 2017-11-02 | ナントミクス,エルエルシー | Systems and methods for origin determination |
CN109735630A (en) * | 2019-01-05 | 2019-05-10 | 兰州大学 | The detection method and label application of sheep ZFY gene mononucleotide polymorphism label |
CN113564266A (en) * | 2021-09-24 | 2021-10-29 | 上海仁东医学检验所有限公司 | SNP typing genetic marker combination, detection kit and application |
CN113564266B (en) * | 2021-09-24 | 2021-12-17 | 上海仁东医学检验所有限公司 | SNP typing genetic marker combination, detection kit and application |
Also Published As
Publication number | Publication date |
---|---|
KR101400303B1 (en) | 2014-06-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Bulle et al. | Practical approach for typing strains of Leishmania infantum by microsatellite analysis | |
Maydan et al. | Efficient high-resolution deletion discovery in Caenorhabditis elegans by array comparative genomic hybridization | |
Chittoria et al. | Natural selection mediated association of the Duffy (FY) gene polymorphisms with Plasmodium vivax malaria in India | |
US9637788B2 (en) | Discrimination of blood type variants | |
KR101400303B1 (en) | SNP Markers for sex determination | |
CN102732514B (en) | Identification method for chemotactic factor acceptor 9 gene used as molecular marker for bovine excellent superovulation trait and application of same | |
Pichon et al. | Analysis and annotation of DNA methylation in two nonhuman primate species using the Infinium Human Methylation 450K and EPIC BeadChips | |
ES2445709T3 (en) | Method for the identification by molecular techniques of genetic variants that do not encode D (D-) antigen and encode altered C (C + W) antigen | |
Ghani et al. | Smart approach for cost-effective genotyping of single nucleotide polymorphisms | |
KR101249635B1 (en) | Novel EGR2 SNPs Related to Bipolar Disorder, Microarrays and Kits Comprising them for Diagnosing Bipolar Disorder | |
TWI579722B (en) | Method for assessing the risk of adverse drug reaction and device thereof | |
KR20180023087A (en) | Composition and method for diagnosing atopic dermatitis using COL6A6 SNP | |
JP5866669B2 (en) | Breast cancer susceptibility determination method | |
CN103013988A (en) | Method for determining correlation between single nucleotide polymorphism of TNIP1 of Chinese people and systemic lupus erythematosus (SLE) | |
WO2010007063A2 (en) | Method of diagnosing dyslexia | |
Nakayama et al. | The microsatellite alleles on chromosome 1 associated with essential hypertension and blood pressure levels | |
JP5071998B2 (en) | Method for determining essential hypertension | |
KR102565803B1 (en) | Method for providing information for hypertension and kits using the same | |
JP5656159B2 (en) | Markers for predicting the effects of interferon therapy | |
CN116287199B (en) | Primer combination and kit for detecting high myopia risk and application of primer combination and kit | |
KR101731618B1 (en) | Single nucleotide polymorphism marker composition for identification of paternity and its use | |
KR101437381B1 (en) | Method for triploid verification of Pacific oyster | |
JP5130628B2 (en) | Determination method of cerebral infarction | |
KR101148755B1 (en) | Novel SNPs and mehod for diagnosing bipolar disorder using them | |
KR20220028329A (en) | Method for providing information for cardiovascular disease and kits using the same |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E90F | Notification of reason for final refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20170524 Year of fee payment: 4 |
|
FPAY | Annual fee payment |
Payment date: 20180508 Year of fee payment: 5 |
|
LAPS | Lapse due to unpaid annual fee |