KR101406720B1 - Method for designing fusion primer used in next generation sequencing, and method for analyzing genotype of target gene using next generation sequencing and fusion primer - Google Patents

Method for designing fusion primer used in next generation sequencing, and method for analyzing genotype of target gene using next generation sequencing and fusion primer Download PDF

Info

Publication number
KR101406720B1
KR101406720B1 KR1020120065805A KR20120065805A KR101406720B1 KR 101406720 B1 KR101406720 B1 KR 101406720B1 KR 1020120065805 A KR1020120065805 A KR 1020120065805A KR 20120065805 A KR20120065805 A KR 20120065805A KR 101406720 B1 KR101406720 B1 KR 101406720B1
Authority
KR
South Korea
Prior art keywords
dna
target gene
artificial sequence
sequence
fusion primer
Prior art date
Application number
KR1020120065805A
Other languages
Korean (ko)
Other versions
KR20130142523A (en
Inventor
황승용
김지훈
이원선
Original Assignee
(주)지노첵
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by (주)지노첵 filed Critical (주)지노첵
Priority to KR1020120065805A priority Critical patent/KR101406720B1/en
Priority to PCT/KR2013/005055 priority patent/WO2013191400A1/en
Publication of KR20130142523A publication Critical patent/KR20130142523A/en
Application granted granted Critical
Publication of KR101406720B1 publication Critical patent/KR101406720B1/en

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6811Selection methods for production or design of target specific oligonucleotides or binding molecules
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6827Hybridisation assays for detection of mutation or polymorphism
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/20Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Physics & Mathematics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Organic Chemistry (AREA)
  • Biotechnology (AREA)
  • Analytical Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Evolutionary Biology (AREA)
  • Theoretical Computer Science (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Medical Informatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Immunology (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

본 발명은 한 번의 실험으로 다수의 시료에 대한 표적 유전자의 유전자형 분석을 수행하면서도 유전자형 분석결과와 각각의 시료의 매칭의 오류가 없도록 하는 차세대 염기서열 분석법을 위한 융합 프라이머의 설계방법과, 이러한 융합 프라이머 및 차세대 염기서열 분석법을 이용한 새로운 표적 유전자의 유전자형 분석방법을 제공한다. 본 발명에 따르면 한 번의 실험으로 다수의 시료에 대한 표적 유전자의 유전자형 분석을 수행하면서도 유전자형 분석결과와 각각의 시료의 매칭의 오류가 없도록 하는 차세대 염기서열 분석법을 위한 융합 프라이머의 설계방법을 제공할 수 있고, 한 번의 실험으로 대량 시료에 대한 특정 표적 유전자, 예를 들어 마커 유전자의 STR의 반복 개수를 확인하면서도 동시에 STR의 전후에 존재하는 단일염기다형성을 확인할 수 있고 이를 통해 새로운 마커 유전자의 발굴을 가능하게 하는 장점이 있다. 또한, 본 발명에 따르면 차세대 염기서열 분석법에 있어서 앰플리콘(amplicon)의 준비과정에서 소모되지 않은 프라이머들의 이량체들이 증폭되어 시퀀싱 결과에 악영향을 미치는 문제를 방지할 수 있다. The present invention relates to a method for designing a fusion primer for a next generation nucleotide sequence analysis, which makes it possible to perform genotype analysis of a target gene for a plurality of samples in one experiment and to prevent errors in genotype analysis and matching of each sample, And a method for analyzing a genotype of a new target gene using a next-generation sequencing method. According to the present invention, it is possible to provide a method of designing a fusion primer for a next-generation sequencing method, which makes it possible to perform genotype analysis of a target gene on a plurality of samples in one experiment while preventing errors in genotype analysis and matching of each sample In one experiment, it is possible to identify single nucleotide polymorphisms existing before and after STR while confirming the number of STR of a specific target gene for a large sample, for example, a marker gene, thereby enabling the discovery of a new marker gene . In addition, according to the present invention, it is possible to prevent a problem that the dimers of unused primers are amplified in the preparation of an amplicon in the next-generation sequencing method, thereby adversely affecting sequencing results.

Description

차세대 염기서열 분석법을 위한 융합 프라이머의 설계방법 그리고 이러한 융합 프라이머 및 차세대 염기서열 분석법을 이용한 표적 유전자의 유전자형 분석방법 {Method for designing fusion primer used in next generation sequencing, and method for analyzing genotype of target gene using next generation sequencing and fusion primer}TECHNICAL FIELD The present invention relates to a method for designing a fusion primer for a next-generation sequencing method, and a method for analyzing a genotype of a target gene using the fusion primer and the next-generation sequencing method generation sequencing and fusion primer}

본 발명은 차세대 염기서열 분석법을 위한 융합 프라이머의 설계방법 그리고 이러한 융합 프라이머 및 차세대 염기서열 분석법을 이용한 표적 유전자의 유전자형 분석방법에 관한 것으로서, 보다 상세하게는 수백에서 수천만에 이르는 대량 시료에 대한 유전자형 분석을 짧은 시간 내에 정확하게 할 수 있는 차세대 염기서열 분석법을 위한 융합 프라이머의 설계방법 그리고 이러한 융합 프라이머 및 차세대 염기서열 분석법을 이용한 표적 유전자의 유전자형 분석방법에 관한 것이다.The present invention relates to a method for designing a fusion primer for a next-generation sequencing method, and a method for analyzing a genotype of a target gene using the fusion primer and the next-generation sequencing method. More particularly, A method for designing a fusion primer for a next-generation nucleotide sequence analysis method capable of accurately detecting a target gene in a short time, and a method for analyzing a genotype of a target gene using such a fusion primer and a next-generation nucleotide sequence analysis method.

또한, 본 발명은 한 번의 실험으로 다수의 시료에 대한 표적 유전자의 유전자형 분석을 수행하면서도 유전자형 분석결과와 각각의 시료의 매칭의 오류가 없도록 하는 차세대 염기서열 분석법을 위한 융합 프라이머의 설계방법 그리고 이러한 융합 프라이머 및 차세대 염기서열 분석법을 이용한 표적 유전자의 유전자형 분석방법에 관한 것이다.The present invention also relates to a method for designing a fusion primer for a next-generation sequencing method, which makes it possible to perform genotype analysis of a target gene on a plurality of samples in one experiment while preventing errors in genotype analysis and matching of each sample, Primer and next generation nucleotide sequence analysis method.

특히, 본 발명은 한 번의 실험으로 대량 시료에 대한 특정 표적 유전자, 예를 들어 마커 유전자의 STR (short tandem repeat)의 반복 개수를 확인하면서도 동시에 STR의 전후에 존재하는 단일염기다형성(single nucleotide polymorphism; SNP)을 확인할 수 있고 이를 통해 새로운 마커 유전자의 발굴을 가능하게 하는 차세대 염기서열 분석법을 이용한 표적 유전자의 유전자형 분석방법에 관한 것이다.In particular, the present invention provides a method for identifying single target nucleotide polymorphism (STR) of a specific target gene for a large sample, for example, a short tandem repeat (STR) of a marker gene. SNP) of the target gene, and thereby enabling the detection of a new marker gene, using a next generation nucleotide sequence analysis method.

추가로, 본 발명은 차세대 염기서열 분석법에 있어서 앰플리콘(amplicon)의 준비과정에서 소모되지 않은 프라이머들의 이량체들이 증폭되어 시퀀싱 결과에 악영향을 미치는 문제를 방지하는 새로운 차세대 염기서열 분석법을 이용한 표적 유전자의 유전자형 분석방법에 관한 것이다. Further, the present invention relates to a method for detecting a target gene using a new generation nucleotide sequence analysis method, which prevents a problem that a dimer of primers that have not been consumed in the preparation of an amplicon in the preparation of an amplicon is amplified and adversely affects a sequencing result in a next- And a method for analyzing a genotype of the same.

최근 차세대 염기서열 분석법(Next Generation Sequencing: NGS)이 대중화되면서 많은 사람들의 관심을 받고 있다. 차세대 염기서열 분석법을 이용한 기술은 비약적으로 발전하고 있고, 이를 이용한 유전자형 분석 가격은 저렴해지고 있다. Recently, next generation sequencing (NGS) has been popularized and attracted many people's attention. The technology using the next-generation sequencing method has been developed remarkably, and the genotyping analysis price using the next-generation sequencing method is becoming cheaper.

차세대 염기서열 분석법을 구현하는 차세대 게놈 시퀀서(NGS; Next Generation Sequencer)로 대표적인 것으로는 로슈(Roche)/454, 일루미나(Illumina)/Solexa 및 라이프 테크놀로지스(ABI)의 SOLiD가 있다. 로슈/454와 SOLiD는 고체상의 지지체나 비드 상의 DNA에 주형이 상보적으로 결합된 상태에서 에멀젼 PCR (Emulsion PCR; emPCR)을 수행하여 분석대상 시료 내의 주형을 증폭하는 방식을 채택하고 있다(Michael L. Metzker, Aapplications of next-generation sequencing; Sequencing technologies the next generation, Nature Reviews Genetics, Vol.11, pp31-46, January 2010). 로슈/454의 최신형 모델로 GS FLX 티타늄 시퀀서(GS FLX Titanium sequencer)와, 이를 소형화한 GS 쥬니어 티타늄 시퀀서(GS Junior Titanium sequencer)가 있으며, 이들 장비는 7시간에 8,000만개 서열의 판독이 가능하다. 이러한 기술 발전으로 종래에는 막대한 검사 비용으로 인해 연구용으로만 사용되던 차세대 염기서열 분석법을 의료용 임상 검사에서 활용할 수 있게 되었다. Roche / 454, Illumina / Solexa, and SOLiD of Life Technologies (ABI) are examples of next generation sequencers (NGS) that implement next-generation sequencing. Roche / 454 and SOLiD employ emulsion PCR (emPCR) in which a template is complementarily bound to a solid support or bead DNA to amplify the template in the sample to be analyzed (Michael L Metzker, Aapplications of next-generation sequencing; Sequencing technologies the next generation, Nature Reviews Genetics, Vol.11, pp31-46, January 2010). The latest model of the Roche / 454 is the GS FLX Titanium sequencer and the GS Junior Titanium sequencer, which is a miniaturized version of the GS FLX Titanium sequencer. These devices can read 80 million sequences in 7 hours. This technology development has made it possible to utilize the next-generation sequencing method, which was conventionally used only for research purposes, in medical clinical examinations due to a large test cost.

차세대 염기서열 분석법은 1회의 장비 작동으로 8천만개에서 30억개 염기쌍의 염기서열 정보를 얻을 수 있는 반면에, 전술한 바와 같은 장비를 1주일에 1~2회만 운용해도 그 자료량은 엄청난 분량이 되어 생물정보 분야에서 정보 처리 속도와 염기서열 데이터 통합이라는 문제를 새롭게 부각시키게 되었다. 즉, 차세대 염기서열 분석법으로부터 나오는 염기서열 변이 정보는 너무 방대한 양이므로 사용자가 일일이 검색하기는 불가능하다.In the next generation sequencing, 80 to 3 billion base pairs of sequence information can be obtained by one operation of the apparatus. However, even if the above-described apparatus is operated once or twice a week, the amount of data is very large, In the field of information, the problem of the integration of data processing speed and nucleotide sequence data has been renewed. In other words, the nucleotide sequence variation information from the next generation sequencing method is too large to be retrieved by the user.

또한, 차세대 염기서열 분석법을 이용하여 생성된 대용량의 염기서열 데이터에서 서열의 길이는 종래의 생거(Sanger) 방법으로 생성한 염기서열 데이터에 비하여 현저하게 짧은 문제점이 있다. 즉, 차세대 염기서열 분석법은 이러한 문제로 인해 짧은 서열들을 모아서 레퍼런스(reference)가 없는 새로운 게놈 염기서열 구성하거나, 동일종 또는 비슷한 종의 서열을 참고로 하여 게놈 염기서열을 구성하는 과정이 필요한 단점이 있다.In addition, the length of the sequence in the large-capacity nucleotide sequence data generated using the next-generation sequencing method is significantly shorter than that of the nucleotide sequence data generated by the conventional Sanger method. That is, the next-generation sequencing method has a disadvantage in that it requires a process of collecting short sequences and constructing a new genome sequence having no reference, or constructing a genome sequence with reference to the same species or a similar species sequence have.

뿐만아니라, 로슈(Roche)/454 기반의 차세대 염기서열 분석용 시퀀서는 사전에 증폭되어 준비된 주형인 앰플리콘(amplicon)을 에멀젼 PCR 과정에서 고체상의 지지체나 비드 상에 결합된 DNA에 상보적으로 어닐링한 후 증폭시키는데 이때 주형 만이 증폭되는 것이 아니라 앰플리콘(amplicon)의 준비과정에서 소모되지 않은 프라이머들의 이량체들이 증폭되어 시퀀싱 결과에 악영향을 미치는 문제가 있다.In addition, Roche / 454-based sequencing sequencing for next-generation nucleotide sequencing can amplify the previously prepared template, the amplicon, by complementary annealing to a solid support or bead-bound DNA in the emulsion PCR process But there is a problem that amplification of unimplanted primers dimerizes in the preparation of the amplicon, thereby adversely affecting the sequencing result.

한편, 최근 국내 먹거리에 대한 안전성은 사회적 문제로 대두되고 있으며, 식품의 안전성 관리를 위해 식품의 제조, 유통 및 판매의 이력추적제의 도입이 검토되고 있다. 그런데, 먹거리의 안전성을 위해 구축된 쇠고기와 같은 식품 이력추적제에서 가장 큰 문제점은 소의 도축당시 원래 개체에게 주어지는 이력추적제용 번호가 가공 후에도 안전하게 유지되어야 하나 가공상의 실수, 유통 및 판매 과정에서의 실수 및 고의적인 의도로 다른 육류의 개체식별번호로 바뀔 수 있다는 것이다. On the other hand, the safety of domestic food has recently become a social problem, and the introduction of a traceability system for the manufacture, distribution and sales of food for the safety management of food is under consideration. However, the biggest problem in the food traceability system such as beef which is constructed for the safety of the food is that the trace number given to the original object at the time of sowing of the cattle must be kept safe after processing, but the mistake in processing mistake, And by intentional intentional alteration to other meat object identification numbers.

이러한 문제를 감안하여, 쇠고기의 경우 수입육을 국내산으로 둔갑시키는 것을 방지하기 위해 쇠고기이력추적제에서 DNA 동일성 검사를 도입하여 실시하고 있다. 현재 DNA 동일성 검사는 마이크로새틀라이트(microsatellite; MS) DNA의 유전적 특징을 이용하여 개체식별을 하는 방식을 이용하고 있다. In consideration of this problem, in order to prevent the imported beef from becoming domestic in case of beef, the DNA identity test is introduced in the beef trace agent. DNA identity testing now uses a method of identifying individuals using the genetic characteristics of microsatellite (MS) DNA.

참고로, 마이크로새틀라이트 DNA는 1~5개의 SSR(simple sequence repeat)로서 대부분의 진핵생물의 게놈에 골고루 분포되어 있고, 여러 가지 마커(genetic marker)가 유전분석, 예를 들어 동물의 계통분류, 유전적 유연관계 분석에 이용되고 있다. 마이크로새틀라이트 DNA는 전체 게놈에 고르게 분포되어 있고 그 수는 100,000개에 이른다고 알려져 있는데, STR(short tandem repeat)의 반복개수가 개체 간 변이를 나타낸다. 예를 들어, 특정 마이크로새틀라이트 DNA 마커에 대해 부계 쪽에서 12개의 반복과 19개의 반복의 유전자형을 갖고 있고 모계 쪽에서 18개의 반복과 15개의 반복을 가지고 있다면 1차 자손은 12개의 반복과 15개의 반복을 가질 수 있다.For reference, microsatellite DNA is uniformly distributed in the genome of most eukaryotes as 1 to 5 SSR (simple sequence repeats), and various genetic markers are used for genetic analysis, for example, It is used for genetic relationship analysis. Microsatellite DNA is uniformly distributed throughout the genome, and the number of microsatellite DNAs is known to reach 100,000. The number of repeats of STR (short tandem repeat) indicates mutation among individuals. For example, if you have 12 repeats and 19 repeats of genotype on the paternal side and 18 repeats and 15 repeats on the mother side for a particular microsatellite DNA marker, then the first offspring will have 12 repeats and 15 repeats Lt; / RTI >

그런데, 현재 쇠고기이력추적제에서 사용되는 마이크로새틀라이트 분석은 조건(기기, 시약, 실험자 등)에 따라 결과가 일정치 않아 사후에 한우개체인식 분석을 할 경우 결과가 부정확할 가능성이 존재하며, 검사과정에서 모세관 전기영동 방식을 이용하기 때문에 대량시료를 분석하기에 적합하지 않은 단점이 있다. 이러한 이유로 쇠고기의 경우, 2011년 약 270만두가 사육되고 있으나, 도축되는 약 70~100만두에 대한 시료보관 후 검사가 필요한 시료(년간 약 1만~2만)를 선정하여 선정된 개체의 검사만이 이루어지고 있다. 그러나, 이러한 검사 시스템에서 개체식별번호와 맞지 않은 개체가 발견되는 경우, 잘못된 개체에 대한 원 개체식별번호를 찾을 수 없기 때문에 정확한 오류의 원인을 찾을 수가 없다. 따라서, 전체 시료에 대한 전수 검사를 수행하여 데이터베이스화하는 것이 필요하며, 이를 위해 대량 시료를 짧은 시간 내에 정확하면서 저렴하게 분석할 수 있는 방법의 제공이 필요하다.However, there is a possibility that the result of microsatellite analysis used in beef hysteresis tracing agent is inaccurate when the analysis of Hanwoo hogwon is carried out after the condition is unstable according to the condition (instrument, reagent, experimenter, etc.) It is not suitable for analyzing a large amount of samples because it uses a capillary electrophoresis method. For this reason, about 2,700,000 beef cattle are being raised in 2011, but only about 70-100,000 slaughtered specimens (about 10,000 ~ 20,000 / year) are required to be tested after sample storage . However, if such an inspection system finds an object that does not match the object identification number, it can not find the exact cause of the error because it can not find the original object identification number for the wrong object. Therefore, it is necessary to perform a complete inspection of all the samples to form a database, and in order to do so, it is necessary to provide a method of accurately and inexpensively analyzing a large amount of samples in a short time.

이와 관련하여 대한민국 등록특허공보 제10-0816476호는 한우의 경제형질과 연관된 마이크로새틀라이트 DNA 프라이머에 대해 개시하고 있고, 대한민국 등록특허공보 제10-0901817호는 한우 생산이력체계 구축용 프라이머 세트 및 이를 이용한한우 개체 판별방법을 개시하고 있으며, 대한민국 등록특허공보 제10-1008941호는 멀티플렉싱 피씨알에 의한 한우와 수입우의 판별방법 및 이에 사용되는 프라이머를 개시하고 있다. 그러나, 이러한 종래기술들은 전술한 바와 같이 마이크로새틀라이트 DNA의 여러 마커에 대해 멀티플렉싱 PCR을 수행하고 증폭 산물에 대해 모세관 전기영동을 수행한 후 피크 값을 검출하여 STR 반복개수를 확인함으로써 한우 품종 을 확인하는 방법으로서, 대량 시료 분석에는 적합하지 않고 피크 값의 부정확성에 기인한 STR 분석의 오류 문제를 근원적으로 갖고 있다.In this regard, Korean Patent Registration No. 10-0816476 discloses a microsatellite DNA primer associated with the economic traits of Hanwoo, Korean Patent Registration No. 10-0901817 discloses a primer set for building a Hanwoo production history system, And Korean Patent Registration No. 10-1008941 discloses a method for discriminating between Korean and imported Korean beef using multiplexed PC seed and a primer used therefor. However, in the conventional techniques, as described above, multiplex PCR is performed on several markers of microsatellite DNA, capillary electrophoresis is performed on the amplified product, and peak value is detected to confirm the number of STR repeats. , Which is not suitable for mass specimen analysis and has inherent error problem of STR analysis due to inaccuracy of peak value.

따라서, 쇠고기이력추적과 같이 대량 시료에 대한 마이크로새틀라이트 분석이 필요한 분야에 있어서는 차세대 염기서열 분석법을 이용하여 대량 시료의 마이크로새틀라이트의 마커 유전자의 염기서열을 동시에 분석함으로써, 종래기술의 분석 결과 오류에 따른 문제점을 해결하는 동시에 마커 유전자의 STR 분석을 짧은 시간 내에 정확하게 할 수 있는 기술의 제공이 요구되고 있다고 할 수 있다.Therefore, in the field where microsatellite analysis is required for large samples such as beef traceability, the nucleotide sequence of the microsatellite marker gene of a large sample is simultaneously analyzed using the next generation sequence analysis, It is necessary to provide a technique for accurately performing the STR analysis of the marker gene in a short time.

대한민국 등록특허공보 제10-0816476호 (2008.03.26)Korean Registered Patent No. 10-0816476 (Mar. 26, 2008) 대한민국 등록특허공보 제10-0901817호 (2009.06.09)Korean Patent Registration No. 10-0901817 (2009.06.09) 대한민국 등록특허공보 제10-1008941호 (2011.01.17)Korean Registered Patent No. 10-1008941 (January 17, 2011)

Michael L. Metzker, Aapplications of next-generation sequencing; Sequencing technologies the next generation, Nature Reviews Genetics, Vol.11, pp31-46, January. 2010 (2010년 1월 공개)Michael L. Metzker, Aapplications of next-generation sequencing; Sequencing technologies the next generation, Nature Reviews Genetics, Vol.11, pp31-46, January. 2010 (released in January 2010)

본 발명의 목적은 수백에서 수천만에 이르는 대량 시료에 대한 유전자형 분석을 짧은 시간 내에 정확하게 할 수 있는 차세대 염기서열 분석법을 위한 융합 프라이머의 설계방법 그리고 이러한 융합 프라이머 및 차세대 염기서열 분석법을 이용한 표적 유전자의 유전자형 분석방법을 제공하는 것이다. It is an object of the present invention to provide a method for designing a fusion primer for a next-generation sequencing method that can accurately analyze a genotype of a large sample ranging from hundreds to tens of millions of samples in a short period of time, Analysis method.

또한, 본 발명의 목적은 한 번의 실험으로 다수의 시료에 대한 표적 유전자의 유전자형 분석을 수행하면서도 유전자형 분석결과와 각각의 시료의 매칭의 오류가 없도록 하는 차세대 염기서열 분석법을 위한 융합 프라이머의 설계방법 그리고 이러한 융합 프라이머 및 차세대 염기서열 분석법을 이용한 표적 유전자의 유전자형 분석방법을 제공하는 것이다.It is another object of the present invention to provide a method for designing a fusion primer for a next generation nucleotide sequence analysis, in which a genotype analysis of a target gene is performed on a plurality of samples in one experiment, And a method for analyzing a genotype of a target gene using such a fusion primer and a next-generation sequencing method.

특히, 본 발명의 목적은 한 번의 실험으로 대량 시료에 대한 특정 표적 유전자, 예를 들어 마커 유전자의 STR (short tandem repeat)의 반복 개수를 확인하면서도 동시에 STR의 전후에 존재하는 단일염기다형성(single nucleotide polymorphism; SNP)을 확인할 수 있고 이를 통해 새로운 마커 유전자의 발굴을 가능하게 하는 차세대 염기서열 분석법을 이용한 표적 유전자의 유전자형 분석방법을 제공하는 것이다.Particularly, the object of the present invention is to confirm the number of repetition of STR (short tandem repeat) of a specific target gene for a large sample, for example, a marker gene in a single experiment, while simultaneously detecting a single nucleotide polymorphism polymorphism (SNP) of the genomic region of a target gene, and thereby enables a new marker gene to be excavated.

추가로, 본 발명의 목적은 차세대 염기서열 분석법에 있어서 앰플리콘(amplicon)의 준비과정에서 소모되지 않은 프라이머들의 이량체들이 증폭되어 시퀀싱 결과에 악영향을 미치는 문제를 방지하는 새로운 차세대 염기서열 분석법을 이용한 표적 유전자의 유전자형 분석방법을 제공하는 것이다.In addition, it is an object of the present invention to provide a novel sequencing method that can prevent the problem that the dimers of unspent primers are amplified and adversely affect sequencing results in the preparation of amplicon in the next generation sequencing method And a method for analyzing the genotype of the target gene.

상기한 기술적 과제를 해결하고 상기한 발명의 목적에 부합되도록 예의 연구를 거듭한 결과, 본 발명자들은 한 번의 실험으로 다수의 시료에 대한 표적 유전자의 유전자형 분석을 수행하면서도 유전자형 분석결과와 각각의 시료의 매칭의 오류가 없도록 하는 차세대 염기서열 분석법을 위한 융합 프라이머의 설계방법과, 이러한 융합 프라이머 및 차세대 염기서열 분석법을 이용한 새로운 표적 유전자의 유전자형 분석방법을 완성하기에 이르렀다. As a result of intensive study to solve the above-described technical problems, the inventors of the present invention have found that, while performing genotype analysis of a target gene on a plurality of samples in one experiment, A method for designing a fusion primer for a next-generation nucleotide sequence analysis method and a genotype analysis method for a new target gene using the fusion primer and the next-generation nucleotide sequence analysis have been completed.

우선, 본 발명의 명세서에서 사용되는 용어를 설명하면 다음과 같다.First, terms used in the specification of the present invention will be described as follows.

본 발명의 명세서에서 사용되는 "차세대 염기서열 분석법"이란 짧은 시간 내에 분석대상이 되는 시료에 대해 대량의 염기서열의 판독이 가능하고 대량의 염기서열 데이터를 생성할 수 있는 신개념의 염기서열 분석 기술로서, 예를 들어 로슈/454, 일루미나(Illumina)/Solexa 및 SOLiD와 같은 장비를 이용한 이용한 염기서열 분석기술 등을 들 수 있다(Michael L. Metzker, Aapplications of next-generation sequencing; Sequencing technologies the next generation, Nature Reviews Genetics, Vol.11, pp31-46, January 2010). As used in the specification of the present invention, the "next-generation sequencing method" is a new concept of sequence sequencing technology capable of reading a large amount of nucleotide sequence in a sample to be analyzed within a short time and generating a large amount of nucleotide sequence data Sequencing technologies such as Roche / 454, Illumina / Solexa and SOLiD (Michael L. Metzker, Aplications of the next generation sequencing, Sequencing technologies the next generation, Nature Reviews Genetics, Vol.11, pp31-46, January 2010).

본 발명의 명세서에서 사용되는 "표적 유전자"라는 용어는 분석대상이 되는 시료 내의 유전자들 중 유전자형 분석에 유용한 변이가 존재하는 유전자로서, 예를 들어 유전자 감식이나 개체 식별에 사용되는 마커 유전자, 특정 질환의 진단에 사용되는 마커 유전자, 유전학적으로 의미가 있는 돌연변이를 갖는 유전자, STR (short tandem repeat)을 갖는 유전자 및 단일염기다형성을 갖는 유전자 등을 들 수 있다. The term "target gene" used in the specification of the present invention is a gene having a mutation useful for genotyping analysis among the genes in the sample to be analyzed, for example, a marker gene used for gene detection or individual identification, A marker gene used for the diagnosis of a disease, a gene having a genetically significant mutation, a gene having STR (short tandem repeat), and a gene having a single nucleotide polymorphism.

또한, 본 발명의 명세서에서 사용되는 "에멀젼 PCR(emPCR")이란 분석대상이 되는 시료 내의 유전자들의 DNA 라이브러리를 각각의 주형 별로 공간적으로 분리하고 오일 방울(droplet) 내의 에멀젼 상태에서 증폭함으로써 단일 주형에 대한 클로날 증폭(clonal amplification)을 수행하는 기술로서, 오일 내에 한쪽 방향 PCR 프라이머(정방향 프라이머 또는 역방향 프라이머)가 결합된 비드와 PCR 증폭 시약(DNA 중합 효소, dNTP 등 포함)을 적하시킴으로써 단일 주형을 포획한 하나의 비드와 PCR 증폭 시약이 포함된 에멀젼을 만든 후 PCR 증폭을 수행하는 기술을 의미한다. 이러한 에멀젼 PCR에서는 오일 방울에 포함된 비드 상에 한쪽 방향 프라이머가 결합되어 고정된 상태이기 때문에 증폭 후 비드의 표면에는 단일 주형이 증폭된 상태로 결합하여 존재하게 되고 이러한 비드를 회수하면 추후 수행되는 시퀀싱 작업을 수행할 수 있다.Also, the term " emulsion PCR (emPCR) " used in the specification of the present invention refers to a method in which a DNA library of genes in a sample to be analyzed is spatially separated for each template and amplified in an emulsion state in an oil droplet, As a technique for performing clonal amplification, a bead containing a one-way PCR primer (forward primer or reverse primer) and a PCR amplification reagent (including a DNA polymerase, dNTP, etc.) Means a technique in which an emulsion containing a captured bead and a PCR amplification reagent is prepared and then subjected to PCR amplification. In this emulsion PCR, since the unidirectional primer is fixed on the bead contained in the oil droplet, a single template is amplified and present on the surface of the bead after amplification. When the bead is recovered, You can do the work.

추가로, 본 발명의 명세서에서 사용되는 "젤 추출(gel extraction)"이란 DNA 또는 RNA를 젤에 로딩한 후 여러 밴드가 나타날 때 원하는 밴드만을 잘라내고, 그 안에 들어 있는 표적 DNA 또는 RNA를 정제하는 방법을 의미한다.Furthermore, the term "gel extraction" as used in the specification of the present invention refers to a technique in which DNA or RNA is loaded onto a gel, and when a plurality of bands appear, only a desired band is cut out and the target DNA or RNA contained therein is purified .

한편, 본 발명의 실시예에서 설명되는 마이크로새틀라이트 마커는 표적 유전자의 예시로서 이해되어야 하며, 본 발명의 차세대 염기서열 분석법을 위한 융합 프라이머의 설계방법과, 이러한 융합 프라이머 및 차세대 염기서열 분석법을 이용한 표적 유전자의 유전자형 분석방법은 다양한 개체 또는 시료와, 다양한 표적 유전자에 대한 유전자형 분석에 적용가능한 기반기술로서 이해되어야 할 것이다. Meanwhile, the microsatellite markers described in the examples of the present invention should be understood as an example of a target gene, and a method of designing a fusion primer for the next generation sequencing method of the present invention, and a method of using the fusion primer and the next- The genotype analysis method of the target gene should be understood as a base technology applicable to genotype analysis of various individuals or samples and various target genes.

본 발명은 하기 구조식 1을 갖는 차세대 염기서열 분석법을 위한 융합 프라이머의 설계방법을 제공한다:The present invention provides a method for designing a fusion primer for next-generation sequencing having the following structural formula:

구조식 1Structure 1

Figure 112012048820043-pat00001
Figure 112012048820043-pat00001

상기 구조식 1에서 X는 분석대상이 되는 모든 시료 내에 존재하는 적어도 하나의 표적 유전자에 특이적인 유전자 서열과는 상동성이 없는 비상동성의 프라이머 서열로 구성하고, Y는 모든 시료에 대한 상기 표적 유전자의 유전자형을 동시에 분석할 때 각각의 시료를 식별해 주는 MID (Multiflex identifier) 서열로 구성하며, Z는 상기 표적 유전자에 특이적인 유전자 서열과 상보적으로 결합하는 표적 유전자 특이적인 프라이머 서열로 구성하는 것을 특징으로 한다.Wherein X is a non-homologous primer sequence which is not homologous to a gene sequence specific to at least one target gene present in all the samples to be analyzed, and Y is a target sequence of the target gene And a MID (Multiflex identifier) sequence for identifying each sample when analyzing the genotypes at the same time, and Z is composed of a target gene-specific primer sequence complementary to the gene sequence specific to the target gene .

상기 구조식 1에서 n은 분석대상이 되는 시료의 개수와 일치하는 정수로서 2와 같거나 2보다 큰 정수이고, m은 표적 유전자의 개수와 일치하는 정수로서 1과 같거나 1보다 큰 정수이다.N is an integer equal to or greater than 2 and equal to or greater than 2, and m is an integer equal to or greater than 1, equal to the number of target genes.

본 발명의 일실시예의 차세대 염기서열 분석법을 위한 융합 프라이머의 설계방법에 있어서, 상기 구조식 1의 융합 프라이머가 정방향 융합 프라이머이면 이와 쌍을 이루는 역방향 융합 프라이머, 그리고 상기 구조식 1의 융합 프라이머가 역방향 융합 프라이머이면 이와 쌍을 이루는 정방향 융합 프라이머는 하기 구조식 2를 갖는 것을 특징으로 한다: In a method of designing a fusion primer for a next-generation sequencing method according to an embodiment of the present invention, if the fusion primer of Formula 1 is a forward fusion primer, the reverse fusion primer paired therewith, and the fusion primer of Formula 1 is a reverse fusion primer Wherein the pair of forward fusion primers are characterized by having the following structural formula 2:

구조식 2Structure 2

Figure 112012048820043-pat00002
Figure 112012048820043-pat00002

상기 구조식 2에서 X', Y 및 Z'의 정의는 상기 구조식 1의 X, Y 및 Z와 동일하고, 상기 구조식 2의 n 및 m 값도 상기 구조식 1의 n 및 m 값과 동일하다.In the above structural formula 2, X ', Y and Z' have the same definitions as X, Y and Z in the structural formula 1, and n and m in the structural formula 2 are the same as n and m in the structural formula 1, respectively.

본 발명의 일실시예의 차세대 염기서열 분석법을 위한 융합 프라이머의 설계방법에 있어서, 상기 구조식 1 및/또는 상기 구조식 2의 융합 프라이머의 길이는 50 b.p. 내지 70 b.p. (base pair)의 범위인 것이 바람직하다. In the method for designing the fusion primer for the next generation sequencing method of one embodiment of the present invention, the length of the fusion primer of the structural formula 1 and / or the structural formula 2 is 50 b.p. To 70 bp. (base pair).

또한, 상기 구조식 1 및/또는 상기 구조식 2에서 Y는 서열번호 1 내지 서열번호 132로 구성된 군으로부터 선택된 MID 서열일 수 있으며, 이 경우 n값은 132가 된다. 그러나, 본 발명은 이에 제한되는 것이 아니며 시료를 식별해 줄 수 있는 10 b.p. 내지 20 b.p. 길이의 짧은 서열이라면 본 발명에 적용가능한 것임은 물론이다. In Formula 1 and / or Formula 2, Y may be a MID sequence selected from the group consisting of SEQ ID NO: 1 to SEQ ID NO: 132, wherein n is 132. [ However, the present invention is not limited thereto, and the 10 b.p. To 20 bp. It is needless to say that the present invention is applicable to short-length sequences.

본 발명의 일실시예의 차세대 염기서열 분석법을 위한 융합 프라이머의 설계방법에 있어서, 상기 표적 유전자는 STR (short tandem repeat) 및/또는 단일염기다형성 부위를 포함할 수 있다.In a method for designing a fusion primer for a next-generation sequencing method of an embodiment of the present invention, the target gene may include STR (short tandem repeat) and / or a single base polymorphism site.

본 발명의 차세대 염기서열 분석법을 이용한 표적 유전자의 유전자형 분석방법은,The method of analyzing the genotype of the target gene using the next generation nucleotide sequence analysis method of the present invention,

(a) 하기 구조식 1의 정방향 융합 프라이머 및 이에 대응하는 하기 구조식 2의 역방향 융합 프라이머 쌍을 준비하는 단계와, (a) preparing a forward fusion primer of the following structural formula 1 and a corresponding reverse fusion primer pair of the following structural formula 2,

구조식 1Structure 1

Figure 112012048820043-pat00003
Figure 112012048820043-pat00003

구조식 2Structure 2

Figure 112012048820043-pat00004
Figure 112012048820043-pat00004

(상기 구조식 1 및 상기 구조식 2에서 X, X'는 분석대상이 되는 모든 시료 내에 존재하는 적어도 하나의 표적 유전자에 특이적인 유전자 서열과는 상동성이 없는 비상동성의 프라이머 서열로 구성하고, Y는 모든 시료에 대한 상기 표적 유전자의 유전자형을 동시에 분석할 때 각각의 시료를 식별해 주는 MID (Multiflex identifier) 서열로 구성하며, Z, Z'는 상기 표적 유전자에 특이적인 유전자 서열과 상보적으로 결합하는 표적 유전자 특이적인 프라이머 서열로 구성하고, n은 분석대상이 되는 시료의 개수와 일치하는 정수로서 2와 같거나 2보다 큰 정수이며, m은 표적 유전자의 개수와 일치하는 정수로서 1과 같거나 1보다 큰 정수임)(Wherein X and X 'in the structural formulas 1 and 2 are non-homologous primer sequences which are not homologous to gene sequences specific to at least one target gene present in all samples to be analyzed, (MID) sequence that identifies each sample when analyzing the genotype of the target gene for all samples, and Z and Z 'are complementary to the gene sequence specific to the target gene Wherein n is an integer equal to or greater than 2 and equal to the number of the target sample, m is an integer equal to or greater than 1, Lt; / RTI >

(b) 상기 (a) 단계에서 준비된 융합 프라이머 쌍을 이용하여 분석대상이 되는 모든 시료 내에 존재하는 적어도 하나의 표적 유전자를 증폭하여 각 시료 별로 상기 적어도 하나의 표적 유전자에 대한 PCR 증폭산물을 수득하는 단계와,(b) amplifying at least one target gene present in all samples to be analyzed using the fusion primer pair prepared in the step (a), and obtaining a PCR amplification product for the at least one target gene for each sample Step,

(c) 상기 (b) 단계에서 소모되지 않은 융합 프라이머들과 이들로부터 생성된 프라이머 이량체들을 제거하기 위해 상기 수득된 PCR 증폭산물에 대해 젤 추출을 수행하여 정제하는 단계와,(c) performing a gel extraction and purifying the PCR amplification product obtained in step (b) to remove fusion primers and primer dimers generated therefrom,

(d) 상기 (c) 단계에서 정제된 PCR 증폭산물을 주형으로 하여 에멀젼 PCR (emPCR)을 수행하는 단계와,(d) performing emulsion PCR (emPCR) using the PCR amplified product purified in the step (c) as a template,

(e) 상기 (d) 단계에서 수득된 에멀젼 PCR 증폭산물에 대한 시퀀싱 결과로부터 각 시료 별로 상기 적어도 하나의 표적 유전자의 서열을 결정하는 단계와,(e) determining the sequence of the at least one target gene for each sample from a sequencing result of the emulsion PCR amplification product obtained in the step (d); and

(f) 상기 (e) 단계에서 결정된 상기 적어도 하나의 표적 유전자의 서열로부터 각 시료 별로 표적 유전자의 유전자형을 분석하는 단계를 포함한다.(f) analyzing the genotype of the target gene for each sample from the sequence of the at least one target gene determined in the step (e).

본 발명의 일실시예의 차세대 염기서열 분석법을 이용한 표적 유전자의 유전자형 분석방법에 있어서, 상기 표적 유전자는 STR (short tandem repeat) 및/또는 단일염기다형성 부위를 포함하고, 상기 (f) 단계에서는 STR (short tandem repeat)의 반복 개수를 확인하고 STR의 전후에 존재하는 단일염기다형성 존재 여부를 확인하는 것을 특징으로 한다.In a method for analyzing a genotype of a target gene using a next-generation sequencing method of an embodiment of the present invention, the target gene includes a STR (short tandem repeat) and / or a single nucleotide polymorphism site, short tandem repeat) and confirms the presence or absence of a single nucleotide polymorphism present before and after the STR.

본 발명의 일실시예의 차세대 염기서열 분석법을 이용한 표적 유전자의 유전자형 분석방법에 있어서, 상기 구조식 1 및/또는 상기 구조식 2의 융합 프라이머의 길이는 50 b.p. 내지 70 b.p.의 범위인 것이 바람직하다. In the method for analyzing the genotype of a target gene using the next generation sequencing method of one embodiment of the present invention, the length of the fusion primer of the structural formula 1 and / or the structural formula 2 is 50 b.p. To 70 bp. ≪ / RTI >

또한, 본 발명의 일실시예의 차세대 염기서열 분석법을 이용한 표적 유전자의 유전자형 분석방법에 있어서, 상기 구조식 1 및/또는 상기 구조식 2에서 Y는 서열번호 1 내지 서열번호 132로 구성된 군으로부터 선택된 MID 서열일 수 있으며, 이 경우 n값은 132가 된다. 그러나, 본 발명은 이에 제한되는 것이 아니며 시료를 식별해 줄 수 있는 10 b.p. 내지 20 b.p. 길이의 짧은 서열이라면 본 발명에 적용가능한 것임은 물론이다. In the method for analyzing a genotype of a target gene using a next-generation sequencing method of an embodiment of the present invention, Y in the structural formula 1 and / or the structural formula 2 is a MID sequence selected from the group consisting of SEQ ID NOS: And in this case, the value of n is 132. However, the present invention is not limited thereto, and the 10 b.p. To 20 bp. It is needless to say that the present invention is applicable to short-length sequences.

한편, 본 발명에 있어서, 상기 에멀젼 PCR에서 사용되는 비드 상에 결합된 한쪽 방향의 프라이머는 상기 구조식 1의 X 또는 상기 구조식 2의 X'와 동일하거나 상보적인 서열을 가질 수 있다. 또한, 상기 에멀젼 PCR 증폭산물에 대한 시퀀싱에서 사용되는 시퀀싱 프라이머는 상기 구조식 1의 X 또는 상기 구조식 2의 X'와 동일하거나 상보적인 서열을 가질 수 있다.In the present invention, the unidirectional primer bonded on the bead used in the emulsion PCR may have the same or complementary sequence as X in the formula 1 or X 'in the formula 2. In addition, the sequencing primer used in the sequencing for the emulsion PCR amplification product may have the same or complementary sequence as X in the structural formula 1 or X 'in the structural formula 2.

본 발명에 따르면, 한 번의 실험으로 다수의 시료에 대한 표적 유전자의 유전자형 분석을 수행하면서도 유전자형 분석결과와 각각의 시료의 매칭의 오류가 없도록 하는 차세대 염기서열 분석법을 위한 융합 프라이머의 설계방법을 제공할 수 있으며 수백에서 수천만에 이르는 대량 시료에 대한 유전자형 분석을 짧은 시간 내에 정확하게 할 수 있다.According to the present invention, there is provided a method for designing a fusion primer for a next generation nucleotide sequence analysis, which makes it possible to perform genotype analysis of a target gene on a plurality of samples in one experiment and to prevent errors in genotype analysis and matching of each sample Genotyping of large samples from hundreds to tens of millions can be done in a short time.

또한, 본 발명에 따르면 한 번의 실험으로 대량 시료에 대한 특정 표적 유전자, 예를 들어 마커 유전자의 STR (short tandem repeat)의 반복 개수를 확인하면서도 동시에 STR의 전후에 존재하는 단일염기다형성(single nucleotide polymorphism; SNP)을 확인할 수 있고 이를 통해 새로운 마커 유전자의 발굴을 가능하게 하는 장점이 있다. In addition, according to the present invention, it is possible to confirm the repetition number of a STR (short tandem repeat) of a specific target gene for a large sample, for example, a marker gene in a single experiment, and to detect a single nucleotide polymorphism ; SNP) can be identified, thereby enabling the discovery of a new marker gene.

추가로, 본 발명에 따르면 차세대 염기서열 분석법에 있어서 앰플리콘(amplicon)의 준비과정에서 소모되지 않은 프라이머들의 이량체들이 증폭되어 시퀀싱 결과에 악영향을 미치는 문제를 방지할 수 있다. In addition, according to the present invention, it is possible to prevent a problem that the dimers of primers that have not been consumed in preparation of an amplicon in the next generation sequencing method are amplified and adversely affect the sequencing result.

도 1은 소(MID 1)의 개체 식별에 이용되는 마이크로새틀라이트 마커인 BM1824, BM2113, ETH10, ETH225, ETH3, INRA23, SPS115, TGLA122, TGLA126, TGLA227 및 TGLA53를 각각 특이적으로 증폭하기 위한 11개 쌍의 융합 프라이머 쌍의 서열을 도시하는 도면이다.
도 2는 소(MID 2)의 개체 식별에 이용되는 마이크로새틀라이트 마커인 BM1824, BM2113, ETH10, ETH225, ETH3, INRA23, SPS115, TGLA122, TGLA126, TGLA227 및 TGLA53를 각각 특이적으로 증폭하기 위한 11개 쌍의 융합 프라이머 쌍의 서열을 도시하는 도면이다.
도 3은 도 1 및 도 2의 융합 프라이머 쌍을 이용하여 멀티플렉스 PCR 증폭을 수행한 후 증폭 산물에 대한 전기영동 결과 사진(왼쪽)과, 각각의 융합 프라이머 쌍을 사용한 경우 정상적으로 PCR 증폭산물이 생성된 것을 나타내는 전기영동결과 사진(오른쪽)이다.
도 4는 본 발명의 실시예 3의 시료 라이브러리 정량 결과 그래프로서 Agilent 2100 바이오애널라이저(Agilent 2100 Bioanalyzer)를 이용하여 측정한 결과 그래프이다.
도 5는 본 발명의 실시예 5에서 TGLA227 마커에 대해 100% 일치도로 레퍼런스 염기서열과 시퀀싱된 각각의 판독 데이터를 정렬한 결과(좌측)와, 이와 같이 정렬된 그룹의 각각의 판독 데이터들의 분포를 정리한 도표 및 그래프(우측)이다.
도 6은 본 발명의 차세대 염기서열 분석법을 이용하여 BM1824, BM2113, ETH10, ETH225, SPS115 및 TGLA53 마커에 대한 STR의 반복개수(적색 박스) 및 반복 서열의 앞뒤에 위치하는 개체간 단일염기다형성(청색 박스)을 확인한 것을 나타내는 도면이다.
Brief Description of the Drawings Fig. 1 is a schematic block diagram showing an example of a microsatellite marker used for the identification of an individual (MID1); 11 microsatellite markers BM1824, BM2113, ETH10, ETH225, ETH3, INRA23, SPS115, TGLA122, TGLA126, TGLA227 and TGLA53 Lt; / RTI > pair of fusion primer pairs.
FIG. 2 is a schematic diagram of a microsatellite marker for identifying micro-satellite markers (MID2), comprising 11 markers for specifically amplifying BM1824, BM2113, ETH10, ETH225, ETH3, INRA23, SPS115, TGLA122, TGLA126, TGLA227 and TGLA53, Lt; / RTI > pair of fusion primer pairs.
FIG. 3 is a photograph showing the result of electrophoresis on the amplification product after performing multiplex PCR amplification using the fusion primer pairs of FIGS. 1 and 2 (left) and the case where each fusion primer pair is used, (Right) of the electrophoresis result.
4 is a graph showing a result of measurement using a Agilent 2100 Bioanalyzer as a graph of a sample library quantitative result of Example 3 of the present invention.
FIG. 5 shows the result (left side) of each readout data sequenced with the reference nucleotide sequence at 100% agreement with the TGLA227 marker in Example 5 of the present invention and the distribution of each readout data of the group thus aligned Charts and graphs arranged (right).
FIG. 6 is a graph showing the relationship between the number of repeats of STR (red box) and the number of interspecies single nucleotide polymorphisms (blue color) of BMs of BM1824, BM2113, ETH10, ETH225, SPS115 and TGLA53 using the next generation sequencing method of the present invention Box) is confirmed.

이하, 본 발명의 실시예에 기초하여 보다 상세하게 기술한다. 본 발명의 하기 실시예는 본 발명을 구체화하기 위한 것일 뿐 본 발명의 권리범위를 제한하거나 한정하는 것이 아님은 물론이다. 본 발명의 상세한 설명 및 실시예로부터 본 발명이 속하는 기술분야의 전문가가 용이하게 유추할 수 있는 것은 본 발명의 권리범위에 속하는 것으로 해석된다. 본 발명에 인용된 참고문헌들은 본 발명에 참고로서 통합된다.
Hereinafter, the present invention will be described in more detail based on the embodiments of the present invention. It should be understood that the following embodiments of the present invention are only for embodying the present invention and do not limit or limit the scope of the present invention. It will be understood by those of ordinary skill in the art that various changes in form and details may be made therein without departing from the spirit and scope of the invention as defined by the appended claims. The references cited in the present invention are incorporated herein by reference.

실시예Example

이하에서 설명되는 실시예들에서는 소의 개체 식별에 이용되는 마이크로새틀라이트 마커인 BM1824, BM2113, ETH10, ETH225, ETH3, INRA23, SPS115, TGLA122, TGLA126, TGLA227 및 TGLA53에 대한 각 개체별 융합 프라이머쌍의 설계, 이러한 융합 프라이머쌍 및 차세대 염기서열 분석법을 이용하여 상기 마커들에 대한 각 개체별 시퀀싱 작업의 수행 그리고 시퀀싱 결과 분석 작업이 수행되었다. 그러나, 이는 본 발명의 설명의 편의를 위한 예시로서 이해되어야 하며 본 발명은 이밖에도 다양한 개체 또는 시료와, 다양한 표적 유전자에 대한 유전자형 분석에 적용가능한 기반기술로서 이해되어야 할 것이다.
In the examples described below, the design of fusion primer pairs for each individual for microsatellite markers BM1824, BM2113, ETH10, ETH225, ETH3, INRA23, SPS115, TGLA122, TGLA126, TGLA227 and TGLA53, , Sequencing of each individual of the markers was carried out by using the fusion primer pair and the next generation sequencing method, and sequencing results were analyzed. However, this should be understood as an example for the convenience of description of the present invention, and the present invention should be understood as a base technology applicable to genotyping analysis of various objects or samples and various target genes.

실시예 1: 시료의 사전 증폭 (앰플리콘의 준비)Example 1: Preamplification of samples (preparation of amplicon)

당업계에서 일반적으로 소의 개체 식별에 이용되는 마이크로새틀라이트 마커인 BM1824, BM2113, ETH10, ETH225, ETH3, INRA23, SPS115, TGLA122, TGLA126, TGLA227 및 TGLA53를 각각 특이적으로 증폭하기 위한 11개 쌍의 융합 프라이머 쌍(정방향 융합 프라이머 및 역방향 융합 프라이머 쌍)을 도 1 및 도 2에 도시된 바와 같이 각 개체 별(MID 1 및 MID 2)로 설계하여 준비하였다. In order to specifically amplify the microsatellite markers BM1824, BM2113, ETH10, ETH225, ETH3, INRA23, SPS115, TGLA122, TGLA126, TGLA227 and TGLA53, which are generally used in the art in the art, 11 pairs of fusion Primer pairs (forward fusion primer and reverse fusion primer pairs) were designed by each individual (MID 1 and MID 2) as shown in FIGS. 1 and 2.

예를 들어, MID 1의 경우 서열번호 133 및 134의 융합 프라이머 쌍, 서열번호 135 및 136의 융합 프라이머 쌍, 서열번호 137 및 138의 융합 프라이머 쌍, 서열번호 139 및 140의 융합 프라이머 쌍, 서열번호 141 및 142의 융합 프라이머 쌍, 서열번호 143 및 144의 융합 프라이머 쌍, 서열번호 145 및 146의 융합 프라이머 쌍, 서열번호 147 및 148의 융합 프라이머 쌍, 서열번호 149 및 150의 융합 프라이머 쌍, 서열번호 151 및 152의 융합 프라이머 쌍 및 서열번호 153 및 154의 융합 프라이머 쌍을 준비하였다. For example, in the case of MID 1, a fusion primer pair of SEQ ID NOs: 133 and 134, a fusion primer pair of SEQ ID NOs: 135 and 136, a fusion primer pair of SEQ ID NOs: 137 and 138, a fusion primer pair of SEQ ID NOs: 139 and 140, 141 and 142, the fusion primer pair of SEQ ID NOs: 143 and 144, the fusion primer pair of SEQ ID NOs: 145 and 146, the fusion primer pair of SEQ ID NOs: 147 and 148, the fusion primer pair of SEQ ID NOs: 149 and 150, Fusion primer pairs of 151 and 152 and fusion primer pairs of SEQ ID NOs: 153 and 154 were prepared.

그리고, MID 2의 경우에는 서열번호 155 및 156의 융합 프라이머 쌍, 서열번호 157 및 158의 융합 프라이머 쌍, 서열번호 159 및 160의 융합 프라이머 쌍, 서열번호 161 및 162의 융합 프라이머 쌍, 서열번호 163 및 164의 융합 프라이머 쌍, 서열번호 165 및 166의 융합 프라이머 쌍, 서열번호 167 및 168의 융합 프라이머 쌍, 서열번호 169 및 170의 융합 프라이머 쌍, 서열번호 171 및 172의 융합 프라이머 쌍, 서열번호 173 및 174의 융합 프라이머 쌍 및 서열번호 175 및 176의 융합 프라이머 쌍을 준비하였다.In the case of MID 2, a fusion primer pair of SEQ ID NOs: 155 and 156, a fusion primer pair of SEQ ID NOs: 157 and 158, a fusion primer pair of SEQ ID NOs: 159 and 160, a fusion primer pair of SEQ ID NOs: 161 and 162, 167 and 168, the fusion primer pair of SEQ ID NOs: 169 and 170, the fusion primer pair of SEQ ID NOs: 171 and 172, the fusion primer pair of SEQ ID NO: 173 And 174 and a pair of fusion primers of SEQ ID NOs: 175 and 176 were prepared.

각 융합 프라이머 쌍은 "어댑터 프라이머 서열 부분 또는 시퀀싱 프라이머 서열 부분"과, 대량 개체(시료)의 마이크로새틀라이트 마커의 동시분석시 개체(시료) 식별을 위한 "바코드(barcode) 서열 또는 MID(Multiflex identifier) 서열"과, 마이크로새틀라이트 마커의 STR 부분을 포함하는 "STR 마커 특이적인 프라이머 서열 부분"을 포함하도록 설계되었다.Each fusion primer pair is referred to as a " adapter primer sequence portion or a sequencing primer sequence portion "and a" barcode sequence " or MID (Multiflex identifier ) Sequence "and an " STR marker specific primer sequence portion" containing the STR portion of the microsatellite marker.

시중에서 입수가능한 호주산 쇠고기(MID 1)와 한우 쇠고기(MID 2)로부터 각각 추출된 gDNA에 대해 10개 쌍의 융합 프라이머 쌍을 함께 사용하여 아래의 표 1 및 표 2와 같은 멀티플렉스 PCR 반응 조건 및 조성에 따라 증폭반응을 수행하였다. 참고로, MID 1에 대한 융합 프라이머 쌍 중 서열번호 143 및 144의 융합 프라이머 쌍과, MID 2에 대한 융합 프라이머 쌍 중 서열번호 165 및 166의 융합 프라이머 쌍은 사용하지 않았다. 한편, 수득된 멀티플렉스 PCR 증폭산물은 추후 진행되는 차세대 염기서열 분석법의 에멀젼 PCR에서 주형으로 사용된다. 10 pairs of fusion primer pairs were used for the gDNA extracted from commercially available Australian beef (MID 1) and Hanwoo beef (MID 2), respectively, and multiplex PCR conditions as shown in Tables 1 and 2 below The amplification reaction was performed according to the composition. For reference, the fusion primer pairs of SEQ ID NOs: 143 and 144 and the fusion primer pairs of SEQ ID NOs: 165 and 166 of the fusion primer pair for MID2 were not used in the fusion primer pair for MID1. On the other hand, the obtained multiplex PCR amplification product is used as a template in the emulsion PCR of the next-generation sequencing method.

또한, 전술한 바와 같은 멀티플렉스 PCR 증폭이 정상적으로 수행되었는지 여부를 확인하기 위해 전기영동을 수행하여 밴드를 확인한 결과, 정상적으로 증폭산물이 생성되었음을 확인하였고(도 3의 좌측 전기영동결과 사진), 각 개체(MID 1 및 MID 2)로부터 각각 추출된 gDNA에 대해 전술한 바와 같은 10개 쌍의 융합 프라이머 쌍 중 각각의 융합 프라이머 쌍을 사용하여 PCR 증폭을 수행한 후 각각의 융합 프라이머 쌍에 해당되는 PCR 증폭산물이 생성되었는지 여부를 전기영동을 수행하여 확인한 결과, 각각의 융합 프라이머 쌍으로부터도 정상적으로 증폭산물이 생성되었음을 확인하였다(도 3의 우측 전기영동결과 사진).
In order to confirm whether the multiplex PCR amplification as described above was normally performed, electrophoresis was performed to confirm bands. As a result, it was confirmed that amplification products were normally generated (photo of the left electrophoresis result in FIG. 3) (MID 1 and MID 2), PCR amplification was carried out using each pair of fusion primers out of 10 pairs of fusion primer pairs as described above, and PCR amplification corresponding to each fusion primer pair was performed As a result of confirming whether or not the product was generated by electrophoresis, it was confirmed that amplification product was normally generated from each fusion primer pair (photograph of the result of right electrophoresis in FIG. 3).

표 1: PCR 반응조건Table 1: PCR reaction conditions

Figure 112012048820043-pat00005

Figure 112012048820043-pat00005

표 2: PCR 반응조성Table 2: PCR reaction composition

Figure 112012048820043-pat00006
Figure 112012048820043-pat00006

참고로, 상기 표 2에 표시된 PCR 증폭용 프리믹스는 PCR 증폭 키트 제조사로부터 상업적으로 입수가능한 것으로서 예를 들어, PCR 버퍼, dNTP, TaKaRa Ex Taq TM으로 이루어진 것이다.
For reference, the PCR amplification premix shown in Table 2 is commercially available from the manufacturer of the PCR amplification kit, for example, PCR buffer, dNTP, TaKaRa Ex Taq .

실시예 2: PCR 증폭산물의 젤 추출Example 2: Gel extraction of PCR amplification products

실시예 1에서 수득된 PCR 증폭산물(앰플리콘)을 종래와 같이 차세대 염기서열 분석법에 사용되는 장비인 GS 쥬니어 티타늄 시퀀서(GS Junior Titanium sequencer)의 AMPure라는 키트로만 정제하게 되면, 앰플리콘 뿐만아니라 실시예 1의 PCR 반응에서 소모되지 않은 융합 프라이머들과 이들로부터 생성된 프라이머 이량체들도 함께 정제되는 문제가 발생함을 본 발명자들은 확인하였다. 이와 같이 앰플리콘을 주형으로 사용하기 위해 사전에 멀티플렉스 PCR을 수행하는 경우 앰플리콘 뿐만아니라 프라이머들의 이량체들이 생성되고, 이러한 프라이머 이량체들은 추후 수행되는 emPCR 과정에서 증폭되어 시퀀싱 결과에 악영향을 미치는 것을 확인하였다.When the PCR amplification product (amplicon) obtained in Example 1 is purified only by a kit called AMPure of a GS Junior Titanium sequencer, which is a device used in the next generation sequencing method as in the conventional method, The present inventors confirmed that the fusion primers not consumed in the PCR reaction of Example 1 and the primer dimers generated therefrom are also refined together. When multiplex PCR is performed in advance in order to use the amplicon as a template, primers dimers are generated not only in amplicon but also in primer dimers. These primer dimers are amplified in a subsequent emPCR process and adversely affect sequencing results Respectively.

따라서, 이러한 문제점을 해결하기 위해 본 발명자들은 예의 연구를 거듭한 결과, 다음과 같은 젤 추출(gel extraction) 과정을 수행함으로써 융합 프라이머들 중 소모되지 않은 프라이머들의 이량체들이 증폭되는 문제와 이로 인한 시퀀싱 결과의 악영향 문제를 해결하였다. 실시예 1의 멀티플렉스 PCR 증폭반응 후 앰플리콘에 해당하는 증폭산물 만을 순수하게 분리하기 위하여 젤 추출 과정(gel extraction)을 진행하였다. 그리고, 이를 위해 마이크로원심분리를 이용한 QIAquick 젤 추출 키트(QIAquick Gel Extraction Kit using microcentrifuge) (Cat. no. 28704)를 사용하였다. In order to solve such problems, the inventors of the present invention have conducted intensive studies. As a result, the present inventors have found that the following gel-extraction process is performed to amplify dimers of unused primers among fused primers, And solved the adverse effect of the result. After the multiplex PCR amplification reaction of Example 1, a gel extraction process was carried out in order to purely separate amplification products corresponding to the amplicons. For this purpose, a QIAquick Gel Extraction Kit using microcentrifuge (Cat. No. 28704) using micro centrifugation was used.

우선, 전기영동을 수행한 아가로즈 젤(Agarose gel)에서 원하는 DNA 절편을 잘라내어 50℃에서 젤을 녹인 후 이소프로판올을 혼합하였다. 그리고, QIAquick 젤 추출 키트의 제조사가 제공하는 완충용액, 스핀 컬럼(spin column) 및 수집 튜브(collection tube)를 이용하여 원심분리를 수행한 후 제조사가 제공하는 완충용액과 에탄올(96%~100%)이 함유된 세척용 버퍼로 세척과정을 수행하였다. 그런 다음, 용출 버퍼(elution buffer) (제조사가 제공하는 용출 버퍼 또는 H2O)를 이용하여 인큐베이션을 수행한 후 정제된 DNA를 얻어 정제된 앰플리콘 시료를 준비하였다. 준비된 시료는 사용하기 전까지 -20℃에서 보관하였다.
First, the desired DNA fragment was cut out from the agarose gel subjected to electrophoresis, and the gel was dissolved at 50 ° C., and isopropanol was mixed. After centrifugation using a buffer solution, a spin column and a collection tube provided by the manufacturer of the QIAquick gel extraction kit, the buffer solution provided by the manufacturer and ethanol (96% to 100% ). ≪ / RTI > Then, an incubation was performed using an elution buffer (elution buffer or H 2 O provided by the manufacturer), and the purified DNA was obtained to prepare a purified amplicon sample. The prepared samples were stored at -20 ° C until use.

실시예 3: 시료 라이브러리 정량(Library Quantitation)Example 3: Quantitation of a sample library (Library Quantitation)

실시예 2의 젤 추출(Gel extraction) 과정을 통해 분리 정제된 DNA 앰플리콘시료의 정량을 위해서 다음의 과정을 수행하였다.The following procedure was carried out for the quantitative determination of the DNA amplicon sample isolated and purified through the gel extraction process of Example 2.

젤-다이 믹스(Gel-dye mix)를 사용하기 전에 상온에서 30분간 온도평형을 유지한 후 칩 프라이밍 스테이션(chip priming station)에 새로운 고감도 DNA 칩(High sensitivity DNA chip)을 위치시켰다. 그리고 젤-다이 믹스(gel-dye mix)를 처음 지정된 위치에 분주하였다. Before using the gel-dye mix, temperature equilibrium was maintained at room temperature for 30 minutes, and a new high-sensitivity DNA chip was placed on a chip priming station. And the gel-dye mix was dispensed at the first specified location.

플런저(plunger)를 1㎖에 위치시킨 후 칩 프라임 스테이션을 닫았다. 플런저를 클립(clip)이 있는 위치까지 내린 후 클립(clip)을 이용하여 고정하였다. 60초간 기다린 후 클립(clip)을 개방하였다. 그리고 나서 5초간 더 기다린 후 플런저를 1㎖에 위치시켰다. Place the plunger in 1 ml and close the chip prime station. The plunger was lowered to the position of the clip and fixed using a clip. After waiting 60 seconds, the clip was opened. Then, after waiting for 5 seconds, the plunger was placed in 1 ml.

칩 프라이밍 스테이션을 개방하고 나머지 지정된 위치에 젤-다이 믹스를 분주하였다. 마커(marker)를 모든 시료(sample)와 래더 웰(ladder well)에 분주하여 비어있는 웰(well)이 없도록 하였다. 그리고 나서 고감도 DNA 래더(High sensitivity DNA ladder)를 지정된 위치에 분주하였고, 11개 시료의 각각의 웰에 시료(sample) 또는 마커(marker)를 분주하였다. The chip priming station was opened and the gel-die mix was dispensed at the other designated locations. The marker was dispensed into all samples and ladder wells to free the empty wells. A high sensitivity DNA ladder was then dispensed at the designated location and a sample or marker was dispensed into each well of eleven samples.

그런 다음, 칩(chip)을 IKA 볼텍스 믹서(IKA vortex mixer)에 위치시키고 2400 rpm에서 1분 동안 반응시켰다. Agilent 2100 바이오애널라이저(Agilent 2100 Bioanalyzer)를 이용하여 5분 안에 측정을 시작하였다. 측정 결과는 도 4에 도시된 바와 같다.
The chip was then placed in an IKA vortex mixer and reacted for 1 minute at 2400 rpm. Measurements were initiated within 5 minutes using an Agilent 2100 Bioanalyzer (Agilent 2100 Bioanalyzer). The measurement result is as shown in Fig.

실시예 4: 에멀젼 PCR (emPCR) 증폭 과정 수행Example 4: Performing emulsion PCR (emPCR) amplification procedure

차세대 염기서열 분석법에 사용되는 장비인 GS 쥬니어 티타늄 시퀀서가 제공하는 emPCR 시약, GS 쥬니어 티타늄 emPCR 오일 및 브레이킹 키트(Breaking Kit)를 이용하여 다음과 같이 emPCR 증폭을 수행하였다.
The following emPCR amplification was performed using emPCR reagent, GS junior titanium emPCR oil, and Breaking Kit provided by GS Junior Titanium Sequencer, which is a device used in the next generation sequencing method.

(1) 시약 및 에멀젼 오일 준비(1) Preparation of reagent and emulsion oil

키트 내용물을 개봉하여 모든 시약은 볼텍싱한 후 사용하였다. 엔자임 믹스(Enzyme Mix)와 PPiase(peptidyl-prolyl isomerase) 튜브는 -15℃ ~ -25℃에서 보관하였다. 볼텍싱한 제조사 키트의 첨가제(Additive)는 55℃에서 5분간 용해시키고 용해가 되지 않는 물질이 있을 경우 원심분리한 후 상층액만을 이용하였다. 엔자임(enzyme)은 -15℃ ~ -25℃에서 보관하였고, 다른 내용물은 상온에서 보관하였다. 제조사 키트의 Mock Mix와 Molecular Biology Grade Water를 혼합하여 1× Mock Mix를 만든 다음, 이를 에멀젼 오일(emulsion oil)과 혼합하였다. 그리고 이러한 에멀젼 오일 혼합물을, 410 ㎕의 Molecular Biology Grade Water, 515 ㎕의 첨가제(Additive), 270 ㎕의 증폭 믹스(Amp Mix), 80 ㎕의 증폭 프라이머(Amp Primer), 70 ㎕의 엔자임 믹스(Enzyme Mix) 및 2 ㎕의 PPiase가 혼합된 라이브 증폭 믹스(Live Amp Mix)와 혼합한 후 얼음에서 보관하였다.
The kit contents were opened and all reagents were used after vortexing. Enzyme Mix and PPiase (peptidyl-prolyl isomerase) tubes were stored at -15 ° C to -25 ° C. Additives of the vortexing kit were dissolved at 55 ° C for 5 minutes. When there was any substance that could not be dissolved, only supernatant was used after centrifugation. The enzyme was stored at -15 ° C to -25 ° C and the other contents were stored at room temperature. A 1 × mock mix was made by mixing the manufacturer's kit's Mock Mix with Molecular Biology Grade Water and then mixing it with emulsion oil. These emulsion oil mixtures were mixed with 410 μl of Molecular Biology Grade Water, 515 μl of Additive, 270 μl of Amp Mix, 80 μl of Amp Primer, 70 μl of Enzyme Mix Mix) and 2 μl of PPiase was mixed with a live amplification mix (Live Amp Mix) and stored on ice.

(2) 시료 DNA 라이브러리 포획(2) Sample DNA library capture

세척 버퍼와 Molecular Biology Grade Water를 혼합하여 1× 세척 버퍼를 만들었다. 그리고 포획 비드(Capture bead)를 준비하고, 이를 앞서 만들어 놓은 1× 세척 버퍼로 세척하였다. 그리고, 실시예 1 및 실시예 2를 통해 수득된 앰플리콘, 즉 시료 DNA 라이브러리 중 사용될 DNA 라이브러리의 양을 포획 비드를 기준으로 계산하고 계산된 양 만큼의 DNA 라이브러리를 포획 비드에 혼합하여 앰플리콘이 주형으로서 포획 비드 상의 DNA에 의해 포획되도록 하였다. 참고로, 포획 비드 상의 DNA는 실시예 1에서 설명한 융합 프라이머의 어댑터 프라이머 서열 부분(또는 시퀀싱 프라이머 서열 부분)에 대응한다.
Wash buffer and Molecular Biology Grade Water were mixed to make 1 × wash buffer. The capture beads were prepared and washed with the 1 × wash buffer previously prepared. The amount of the DNA library to be used among the amplicons obtained in Example 1 and Example 2, that is, the sample DNA library, was calculated on the basis of the capture beads, and the calculated amount of the DNA library was mixed with the capture beads, And was captured by the DNA on the capture bead as a template. For reference, the DNA on the capture bead corresponds to the adapter primer sequence portion (or the sequencing primer sequence portion) of the fusion primer described in Example 1.

(3) 에멀션화(Emulsification)(3) Emulsification

상기 (2)번 과정에서 준비한 포획 비드가 들어있는 튜브에 상기 (1)번 과정에서 준비한 라이브 증폭 믹스(Live Amp Mix)의 에멀젼 오일 혼합물을 첨가한 후 포획 비드와 에멀젼 오일 혼합물을 잘 섞어주어 에멀션화시켰다.
The emulsion oil mixture of the live amplification mix (Live Amp Mix) prepared in the above step (1) was added to the tube containing the capture beads prepared in the above step (2), and the capture beads and the emulsion oil mixture were mixed well, .

(4) 증폭(4) Amplification

상기 (3)번 과정에서 준비된 에멀션화된 혼합 용액을 8-스트립 캡 튜브(eight 8-strip cap tubes) 또는 96-웰 플레이트 (~64 웰 정도)에 100 ㎕씩 용액이 마르지 않는 범위에서 천천히 분주하고 캡(cap)을 이용하여 밀봉한 후 8-스트립 캡 튜브 또는 96-웰 플레이트를 PCR 장치(thermocycler) 내에 위치시키고 PCR 증폭을 수행하였다. 즉, 94℃에서 4분(1사이클), 94℃에서 30초(50사이클), 58℃에서 4.5분, 68℃에서 30초, 10℃에서 반응종료의 과정을 반복수행하였으며, 전체 증폭을 위해서는 최대 6시간 정도가 소요되었다.
The emulsified mixed solution prepared in the above step (3) was added to eight 8-strip cap tubes or a 96-well plate (about 64 wells) at a rate of 100 쨉 l After sealing with a cap, an 8-strip cap tube or 96-well plate was placed in a thermocycler and PCR amplification was performed. That is, the reaction was repeated at 94 ° C. for 4 minutes (1 cycle), 94 ° C. for 30 seconds (50 cycles), 58 ° C. for 4.5 minutes, 68 ° C. for 30 seconds, and 10 ° C. It took up to 6 hours.

(5) DNA-비드 회수 (Bead Recovery) (5) DNA-bead recovery (Bead Recovery)

8-스트립 캡 튜브(eight 8-strip cap tubes) 또는 96-웰 플레이트 (~64 웰 정도)에서 증폭된 에멀젼 혼합물을 모아 한 곳에 보관하였다. 100 ㎕의 이소프로판올을 각각의 웰 분주하여 웰에 남아 있는 에멀젼 혼합물을 완전히 수집하였다. 이소프로판올, 에탄올 및 인핸싱 버퍼(enhancing buffer)와 원심분리를 이용하여 펠릿(pellet)을 남기는 방식으로 세척하고 세척이 끝난 DNA-비드는 튜브에 옮겼다.
The amplified emulsion mixture was stored in one place in 8-strip cap tubes or 96-well plates (~ 64 wells). 100 [mu] l of isopropanol was dispensed into each well to collect the remaining emulsion mixture in the well. Washing was done by leaving the pellet using isopropanol, ethanol and centrifugation with an enhancing buffer, and the washed DNA-beads were transferred to a tube.

(6) DNA-비드 현탁액 (6) DNA-bead suspension

125 ㎕의 NaOH (10N)와 9.875㎖ Molecular Biology Grade Water를 혼합하여 멜팅 용액(Melt Solution)을 만들고 이를 DNA-비드 현탁액 튜브에 옮긴 후 2분 동안 상온에서 반응시켰다. 그런 다음, 반응물을 원심분리하여 상층액을 제거하고 45 ㎕의 어닐링 버퍼(Annealing Buffer)와 25 ㎕ 인리치 프라이머(Enrich Primer)를 혼합한 후 65℃에서 5분간 반응시키고 이후에 2분간 얼음에서 반응시켰다. 125 μl of NaOH (10 N) and 9.875 ml of Molecular Biology Grade Water were mixed to prepare a Melt Solution, which was transferred to a DNA-bead suspension tube and reacted at room temperature for 2 minutes. Then, the reaction mixture was centrifuged to remove the supernatant, 45 μl of an annealing buffer and 25 μl of Enrich primer were mixed and reacted at 65 ° C. for 5 minutes, followed by reaction for 2 minutes on ice .

인핸싱 버퍼(Enhancing Buffer)를 이용하여 상기 DNA-비드 현탁 튜브(인리치먼트 튜브)를 세척한 후 펠릿을 인핸싱 버퍼(Enhancing Buffer)에 녹여 다음 실험까지 보관하였다.The DNA-bead suspension tube (incubation tube) was washed with an Enhancing Buffer, and the pellet was dissolved in an Enhancing Buffer until the next experiment.

인리치먼트 비드들(Enrichment Beads)이 충분히 섞이게 한 후 MPC(Magnetic Particle Concentrator)에 위치시켜 인리치먼트 비드 펠릿(Enrichment Beads pellet)을 만든 후 비드가 마르지 않도록 상층액을 제거하고 인핸싱 버퍼(Enhancing Buffer)를 첨가하였다. 수득된 비드들을 다시 MPC에 위치시켜 펠릿을 만든 후 비드가 마르지 않도록 상층액을 제거하고 인핸싱 버퍼(Enhancing Buffer)를 첨가하여 섞어주었다. After enrichment beads were sufficiently mixed, the beads were placed in an MPC (Magnetic Particle Concentrator) to make Enrichment Beads pellets. The supernatant was removed so that the beads did not dry, and the enhancing beads Buffer) was added. The resulting beads were again placed in MPC to make pellets. The supernatant was removed so that the beads did not dry out, and the mixture was mixed with an enhancing buffer.

세척된 인리치먼트 비드들을 앞서 준비한 인리치먼트 튜브에 섞어주었다. 그리고, LabQuake를 이용하여 상온에서 5분간 회전시키며 반응시킨 후 상기 인리치먼트 튜브를 MPC에 위치시켜 펠릿을 생성한 다음, 상층액을 제거하고 갈색의 인리치먼트 비드들이 마르지 않도록 유지하였다. 그런 다음, 하얀색의 DNA-비드가 나오지 않을 때까지 계속적으로 세척한 후, MPC에서 인리치먼트 튜브를 분리하고 인리치먼트 튜브에 멜팅 용액(Melt Solution)을 첨가하였다. The washed ascetic beads were mixed in the previously prepared ascetic tube. Then, the pellet was formed by placing the trocar tube in the MPC using LabQuake for 5 minutes while rotating at room temperature for 5 minutes. Then, the supernatant was removed and the brown ascidium beads were kept dry. Thereafter, washing was continued until the white DNA-beads disappeared. Then, the incubation tube was removed from the MPC and the melting solution was added to the incubation tube.

인리치먼트 튜브를 MPC에 다시 위치시켜 펠릿이 생성되도록 하였고 상층액을 새로운 1.7 ㎖ 튜브에 옮겼다. 700 ㎕의 멜팅 용액(Melt Solution)을 원래의 인리치먼트 튜브에 첨가하여 충분히 섞어준 후 인리치먼트 튜브를 다시 한 번 MPC에 위치시켜 펠릿을 생성시켰다. 상층액을 인리치먼트 튜브에 같이 모아 주었다.The resection tube was placed back into the MPC to allow the pellet to form and the supernatant transferred to a new 1.7 ml tube. 700 μl of Melt Solution was added to the original culture tube and mixed thoroughly. The culture tube was again placed in the MPC to generate pellet. The supernatant was collected in the incubation tube.

MPC에서 분리된 인리치먼트 튜브를 원심분리하여 상층액을 제거한 후 어닐링 버퍼(Annealing Buffer)를 첨가한 다음 원심분리하여 상층액을 제거하는 세척 과정을 수행하였다. 세척 과정 완료 후 인리치먼트 튜브에 어널링 버퍼(Annealing Buffer)를 첨가하여 섞어주었다.
After removing the supernatant, the annealing buffer (Annealing Buffer) was added, and the supernatant was removed by centrifugation. After completion of the washing procedure, an annealing buffer was added to the incubation tube.

(7) 시퀀싱 프라이머 어닐링(7) Sequencing primer annealing

GS 쥬니어 티타늄 시퀀서가 제공하는 시퀀싱 프라이머를 상기 (6)번 과정에서 준비된 인리치먼트 튜브에 첨가하여 섞어준 후 65℃에서 5분간 반응시키고 이후에 2분간 얼음에서 반응시켰다. 참고로, 시퀀싱 프라이머는 실시예 1에서 설명한 융합 프라이머의 어댑터 프라이머 서열 부분(또는 시퀀싱 프라이머 서열 부분)과 동일한 서열을 갖거나 상보적인 서열을 가질 수 있다. The sequencing primer provided by the GS Junior Titanium Sequencer was added to the incubation tube prepared in the above step (6), and the mixture was reacted at 65 ° C for 5 minutes and then for 2 minutes on ice. For reference, the sequencing primer may have the same sequence as or complementary to the adapter primer sequence portion (or sequencing primer sequence portion) of the fusion primer described in Example 1.

그리고 나서, 인리치먼트 튜브에 어닐링 버퍼(Annealing Buffer)를 첨가하고 충분히 섞어준 후 원심분리하여 상층액을 제거하였다. 다시 어닐링 버퍼(Annealing Buffer)를 첨가하고 충분히 섞어준 후 원심분리하여 상층액을 제거하였다. Then, annealing buffer was added to the incubation tube, and the mixture was thoroughly mixed and centrifuged to remove the supernatant. After annealing buffer was added, the mixture was thoroughly mixed and centrifuged to remove the supernatant.

시퀀싱을 위해서는 500,000개 정도의 비드들이 필요하기 때문에 GS 쥬니어 비드 카운터(GS Junior Bead Counter)를 이용하여 비드의 개수를 측정하였다. 이를 위해 인리치먼트 튜브를 GS 쥬니어 비드 카운터 바닥의 구멍에 위치시켰다. 눈의 위치를 GS 쥬니어 비드 카운터의 창의 왼쪽에 고정하여 창에서 보이는 비드의 높이를 측정하여 비드를 계수하였다. 한편, 시퀀싱을 위해 준비된 시료는 2℃ ~ 8℃에서 약 2주간 보관 가능하다.
Since about 500,000 beads are required for sequencing, the number of beads was measured using a GS Junior Bead Counter. To this end, the institute tube was placed in the hole of the bottom of the GS junior bead counter. The position of the eye was fixed to the left side of the window of the GS junior bead counter, and the bead was counted by measuring the height of the bead in the window. On the other hand, samples prepared for sequencing can be stored at 2 ° C to 8 ° C for about 2 weeks.

실시예 5: 시퀀싱 (Sequencing) 및 결과 분석Example 5: Sequencing and analysis of results

GS 쥬니어 티타늄 시퀀싱 키트(GS Junior Titanium Sequencing Kit)를 이용하여 GS 쥬니어 티타늄 시퀀싱 장비(GS Junior Titanium Sequencing machine)의 지정된 순서 (Sequencing Method Manual, GS Junior Titanium Series)를 따라 시퀀싱을 수행하였다. 이러한 GS 쥬니어 티타늄 시퀀서의 시퀀싱은 파이로 시퀀싱(pyrosequencing) 방법을 이용하여 수행될 수 있다(Michael L. Metzker, Aapplications of next-generation sequencing; Sequencing technologies the next generation, Nature Reviews Genetics, Vol.11, pp31-46, January. 2010).Sequencing was performed using a GS Junior Titanium Sequencing Kit (GS Junior Titanium Sequencing Kit) according to a sequencing method manual (GS Junior Titanium Series). Sequencing of such a GS Junior Titanium Sequencer can be performed using a pyrosequencing method (Michael L. Metzker, Aapplications of next-generation sequencing, Sequencing technologies the next generation, Nature Reviews Genetics, Vol.11, pp31 -46, January 2010).

상기와 같이 수행된 시퀀싱 결과로부터 얻은 각 개체(MID 1 및 MID 2)의 염기서열 데이터(sequence reads)를 전술한 바와 같은 BM1824, BM2113, ETH10, ETH225, ETH3, INRA23, SPS115, TGLA122, TGLA126, TGLA227 및 TGLA53의 마이크로새틀라이트 마커들에 대한 레퍼런스 염기서열(reference sequence)과 비교하는 작업인 매핑 작업을 수행하였다. 한편, 실제 분석에서는 각 개체 간의 일치도를 분석하는 것이기 때문에 레퍼런스 염기서열을 이용하지 않고 각 개체의 마이크로새틀라이트 마커들에 대한 시퀀싱 결과를 직접 비교하여 일치도를 확인하는 방식을 채택할 수도 있다. Sequence reads of each of the individuals (MID 1 and MID 2) obtained from the sequencing performed as described above were performed using the BM1824, BM2113, ETH10, ETH225, ETH3, INRA23, SPS115, TGLA122, TGLA126, TGLA227 And a reference sequence for the microsatellite markers of TGLA53. On the other hand, in the actual analysis, it is possible to adopt a method of directly comparing the sequencing results of microsatellite markers of each individual without using the reference sequence, thereby confirming the agreement, because it analyzes the degree of agreement among the individual individuals.

본 실시예에서는 일부 마커의 경우(INRA23, TGLA126) 레퍼런스 염기서열 정보가 공개되어 있지 않아 상기 시퀀싱 결과와 마커의 레퍼런스 염기서열과의 매핑을 수행하지 않았고, 나머지 9개의 마커에 대해서만 레퍼런스 염기서열과의 매핑을 수행하였다. 즉, 본 실시예에서는 BM1824(서열번호 177), BM2113(서열번호 178), ETH10(서열번호 179), ETH225(서열번호 180), ETH3(서열번호 181), SPS115(서열번호 182), TGLA122(서열번호 183), TGLA227(서열번호 184) 및 TGLA53(서열번호 185)의 9개 마커에 대한 레퍼런스 염기서열과, 전술한 바와 같은 시퀀싱 결과로부터 얻은 각 개체(MID 1 및 MID 2)의 상기 9개 마커들에 대한 염기서열 데이터들을 정렬시켜 매핑을 진행하였다. In this embodiment, since the reference nucleotide sequence information is not disclosed in the case of some markers (INRA23, TGLA126), mapping between the sequencing result and the reference nucleotide sequence of the marker is not performed, and only the remaining nine markers are mapped to the reference nucleotide sequence Mapping. That is, in the present embodiment, BM1824 (SEQ ID NO 177), BM2113 (SEQ ID NO 178), ETH10 (SEQ ID NO 179), ETH225 (SEQ ID NO 180), ETH3 (SEQ ID NO 181), SPS115 (SEQ ID NO 182), TGLA122 (SEQ ID NO: 183), TGLA227 (SEQ ID NO: 184) and TGLA53 (SEQ ID NO: 185) and the nine nucleotide sequences of each of the nine The mapping was performed by sorting the nucleotide sequence data of the markers.

예시로서, 레퍼런스 염기서열과의 80% 일치도 및 100% 일치도로 매핑을 수행하였는데, 그 결과 TGLA53 마커에 대한 매핑 결과가 나오지 않았으며 100% 일치도로 매핑을 할 경우 MID-1 개체에 대한 매핑 실험결과가 나오지 않았다. 반면에, 80%의 일치도로 매핑을 수행하면 MID 1 및 MID 2 개체 모두에 대해 아래와 표 3 및 표 4와 같은 매핑 결과를 얻을 수 있었다.
As an example, mapping was performed with 80% agreement and 100% agreement with the reference nucleotide sequence. As a result, mapping results for the TGLA53 marker were not obtained. When the mapping was performed with 100% agreement, Did not come out. On the other hand, mapping with an 80% match yielded mapping results as shown in Table 3 and Table 4 below for both MID 1 and MID 2 entities.

표 3: 80% 일치도 매핑 결과 (MID-1 시료의 경우)Table 3: Results of 80% match mapping (for MID-1 samples)

Figure 112012048820043-pat00007
Figure 112012048820043-pat00007

표 4: 80% 일치도 매핑 결과 (MID-2 시료의 경우)Table 4: Results of 80% match mapping (for MID-2 samples)

Figure 112012048820043-pat00008
Figure 112012048820043-pat00008

한편, TGLA227 마커에 대해 100% 일치도로 레퍼런스 염기서열과 시퀀싱된 각각의 판독 데이터를 정렬하면 도 5의 좌측의 결과가 도출되었고, 이와 같이 정렬된 그룹의 각각의 판독 데이터들의 분포를 정리하면 도 5의 우측과 같은 결과가 얻어졌다. On the other hand, if the reference sequence and the sequenced read data are aligned with the 100% agreement degree with respect to the TGLA227 marker, the result on the left side of FIG. 5 is derived. The same result as that of the right side was obtained.

또한, 전술한 바와 같은 본 발명의 차세대 염기서열 분석법을 이용한 표적 유전자의 유전자형 분석방법에 따르면, 마이크로새틀라이트 마커들에 대해 각 개체 별로 얻은 서열데이터로부터는 STR(short tandem repeat)의 반복개수를 확인할 수 있을 뿐만아니라 반복 서열의 앞뒤에 위치하는 개체간 단일염기다형성(SNP)도 확인할 수 있다. 즉, 도 6에 도시된 바와 같이, BM1824, BM2113, ETH10, ETH225, SPS115 및 TGLA53 마커에 대한 본 발명의 차세대 염기서열 분석법을 이용한 표적 유전자의 유전자형 분석방법에 따른 서열분석 결과로부터는 STR의 반복개수(적색 박스)를 확인할 수 있을 뿐만아니라 반복 서열의 앞뒤에 위치하는 개체간 단일염기다형성(청색 박스)도 확인할 수 있다. In addition, according to the genotype analysis method of the target gene using the next generation sequencing method of the present invention as described above, the number of repeats of the STR (short tandem repeat) can be confirmed from the sequence data obtained for each individual microsatellite markers As well as single nucleotide polymorphisms (SNPs) between individuals located before and after the repeat sequence. That is, as shown in FIG. 6, from the result of sequence analysis according to the genotype analysis method of the target gene using the next generation nucleotide sequence analysis method of the present invention for the BM1824, BM2113, ETH10, ETH225, SPS115 and TGLA53 markers, (Red box), as well as single nucleotide polymorphism (blue box) between individuals located before and after the repeat sequence.

따라서, 본 발명의 차세대 염기서열 분석법을 이용한 표적 유전자의 유전자형 분석방법은 한 번의 실험으로 대량 시료에 대한 특정 표적 유전자, 예를 들어 마커 유전자의 STR의 반복 개수를 확인하면서도 동시에 STR의 전후에 존재하는 단일염기다형성을 확인할 수 있고 이를 통해 새로운 마커 유전자의 발굴을 가능하게 하는 장점이 있다.Therefore, the genotype analysis method of the target gene using the next generation nucleotide sequence analysis method of the present invention can be carried out by analyzing the genotype of the target gene using the next generation nucleotide sequence analysis method of the present invention, It has the advantage of being able to identify single nucleotide polymorphisms and enabling the discovery of new marker genes.

이상 본 발명을 상기 실시예를 들어 설명하였으나, 본 발명은 이에 제한되는 것이 아니다. 당업자라면 본 발명의 취지 및 범위를 벗어나지 않고 수정, 변경을 할 수 있으며 이러한 수정과 변경 또한 본 발명에 속하는 것임을 알 수 있을 것이다.
Although the present invention has been described with reference to the above embodiments, the present invention is not limited thereto. It will be understood by those skilled in the art that modifications and variations may be made without departing from the spirit and scope of the invention, and that such modifications and variations are also contemplated by the present invention.

<110> Genocheck Co.,Ltd. <120> Method for designing fusion primer used in next generation sequencing, and method for analyzing genotype of target gene using next generation sequencing and fusion primer <130> P12-0283KR <160> 185 <170> KopatentIn 1.71 <210> 1 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 1 <400> 1 acacgacgac t 11 <210> 2 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 2 <400> 2 acacgtagta t 11 <210> 3 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 3 <400> 3 acactactcg t 11 <210> 4 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 4 <400> 4 acgacacgta t 11 <210> 5 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 5 <400> 5 acgagtagac t 11 <210> 6 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 6 <400> 6 acgcgtctag t 11 <210> 7 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 7 <400> 7 acgtacacac t 11 <210> 8 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 8 <400> 8 acgtactgtg t 11 <210> 9 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 9 <400> 9 acgtagatcg t 11 <210> 10 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 10 <400> 10 actacgtctc t 11 <210> 11 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 11 <400> 11 actatacgag t 11 <210> 12 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 12 <400> 12 actcgcgtcg t 11 <210> 13 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 13 <400> 13 agactcgacg t 11 <210> 14 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 14 <400> 14 agtacgagag t 11 <210> 15 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 15 <400> 15 agtactacta t 11 <210> 16 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 16 <400> 16 agtagacgtc t 11 <210> 17 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 17 <400> 17 agtcgtacac t 11 <210> 18 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 18 <400> 18 agtgtagtag t 11 <210> 19 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 19 <400> 19 atagtatacg t 11 <210> 20 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 20 <400> 20 cagtacgtac t 11 <210> 21 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 21 <400> 21 cgacgacgcg t 11 <210> 22 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 22 <400> 22 cgacgagtac t 11 <210> 23 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 23 <400> 23 cgatactacg t 11 <210> 24 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 24 <400> 24 cgtacgtcga t 11 <210> 25 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 25 <400> 25 ctactcgtag t 11 <210> 26 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 26 <400> 26 gtacagtacg t 11 <210> 27 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 27 <400> 27 gtcgtacgta t 11 <210> 28 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 28 <400> 28 gtgtacgacg t 11 <210> 29 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 29 <400> 29 acacagtgag t 11 <210> 30 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 30 <400> 30 acactcatac t 11 <210> 31 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 31 <400> 31 acagacagcg t 11 <210> 32 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 32 <400> 32 acagactata t 11 <210> 33 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 33 <400> 33 acagagactc t 11 <210> 34 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 34 <400> 34 acagctcgtg t 11 <210> 35 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 35 <400> 35 acagtgtcga t 11 <210> 36 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 36 <400> 36 acgagcgcgc t 11 <210> 37 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 37 <400> 37 acgatgagtg t 11 <210> 38 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 38 <400> 38 acgcgagaga t 11 <210> 39 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 39 <400> 39 acgctctctc t 11 <210> 40 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 40 <400> 40 acgtcgctga t 11 <210> 41 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 41 <400> 41 acgtctagca t 11 <210> 42 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 42 <400> 42 actagtgata t 11 <210> 43 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 43 <400> 43 actcacactg t 11 <210> 44 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 44 <400> 44 actcactagc t 11 <210> 45 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 45 <400> 45 actctatata t 11 <210> 46 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 46 <400> 46 actgatctcg t 11 <210> 47 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 47 <400> 47 actgctgtac t 11 <210> 48 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 48 <400> 48 actgtagcgc t 11 <210> 49 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 49 <400> 49 agacactcac t 11 <210> 50 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 50 <400> 50 agacatatag t 11 <210> 51 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 51 <400> 51 agacgtgatc t 11 <210> 52 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 52 <400> 52 agagtacaga t 11 <210> 53 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 53 <400> 53 agagtatctc t 11 <210> 54 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 54 <400> 54 agatacgctg t 11 <210> 55 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 55 <400> 55 agatctagtc t 11 <210> 56 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 56 <400> 56 agcagcgtag t 11 <210> 57 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 57 <400> 57 agcgcacgag t 11 <210> 58 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 58 <400> 58 agcgtgtgcg t 11 <210> 59 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 59 <400> 59 agctagatac t 11 <210> 60 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 60 <400> 60 agctgtcgac t 11 <210> 61 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 61 <400> 61 agtatgcacg t 11 <210> 62 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 62 <400> 62 agtcgcgcta t 11 <210> 63 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 63 <400> 63 agtctgtctg t 11 <210> 64 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 64 <400> 64 atacacacga t 11 <210> 65 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 65 <400> 65 atacgcgtgc t 11 <210> 66 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 66 <400> 66 atactagcac t 11 <210> 67 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 67 <400> 67 atagagctag t 11 <210> 68 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 68 <400> 68 atatagagta t 11 <210> 69 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 69 <400> 69 atcgctcacg t 11 <210> 70 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 70 <400> 70 atcgtcagtc t 11 <210> 71 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 71 <400> 71 atctctcgta t 11 <210> 72 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 72 <400> 72 atctgagacg t 11 <210> 73 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 73 <400> 73 atgctacgtc t 11 <210> 74 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 74 <400> 74 atgtgactac t 11 <210> 75 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 75 <400> 75 cacgagacag t 11 <210> 76 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 76 <400> 76 cacgcgagtc t 11 <210> 77 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 77 <400> 77 cacgctacga t 11 <210> 78 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 78 <400> 78 cacgtgtata t 11 <210> 79 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 79 <400> 79 cactacgatg t 11 <210> 80 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 80 <400> 80 cactatactc t 11 <210> 81 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 81 <400> 81 cagcgtactg t 11 <210> 82 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 82 <400> 82 cagtctctag t 11 <210> 83 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 83 <400> 83 catagtcgcg t 11 <210> 84 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 84 <400> 84 cgagacacta t 11 <210> 85 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 85 <400> 85 cgagagtgtg t 11 <210> 86 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 86 <400> 86 cgagtcatcg t 11 <210> 87 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 87 <400> 87 cgatcgtata t 11 <210> 88 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 88 <400> 88 cgcagtacgc t 11 <210> 89 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 89 <400> 89 cgcgatcgta t 11 <210> 90 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 90 <400> 90 cgcgctatac t 11 <210> 91 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 91 <400> 91 cgtacagata t 11 <210> 92 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 92 <400> 92 cgtagctctc t 11 <210> 93 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 93 <400> 93 cgtatagtgc t 11 <210> 94 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 94 <400> 94 cgtcagcgac t 11 <210> 95 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 95 <400> 95 cgtcgcagtg t 11 <210> 96 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 96 <400> 96 cgtctcacga t 11 <210> 97 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 97 <400> 97 cgtgactcag t 11 <210> 98 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 98 <400> 98 ctacacgctc t 11 <210> 99 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 99 <400> 99 ctacgatatg t 11 <210> 100 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 100 <400> 100 ctagacagac t 11 <210> 101 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 101 <400> 101 ctagtactca t 11 <210> 102 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 102 <400> 102 ctatatgtcg t 11 <210> 103 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 103 <400> 103 ctatcgacac t 11 <210> 104 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 104 <400> 104 ctatgtagag t 11 <210> 105 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 105 <400> 105 ctcacgtaca t 11 <210> 106 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 106 <400> 106 ctcgagtctc t 11 <210> 107 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 107 <400> 107 ctcgtcgaga t 11 <210> 108 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 108 <400> 108 ctctacagcg t 11 <210> 109 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 109 <400> 109 ctgtcgtgcg t 11 <210> 110 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 110 <400> 110 ctgtgacgtg t 11 <210> 111 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 111 <400> 111 gacgctgtcg t 11 <210> 112 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 112 <400> 112 gacgtatgac t 11 <210> 113 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 113 <400> 113 gactagctag t 11 <210> 114 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID Code 114 <400> 114 gagacgtcgc t 11 <210> 115 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID Code 115 <400> 115 gagagagacg t 11 <210> 116 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID Code 116 <400> 116 gcgtagacta t 11 <210> 117 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID Code 117 <400> 117 gcgtcgtgtc t 11 <210> 118 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID Code 118 <400> 118 gctctctacg t 11 <210> 119 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID Code 119 <400> 119 gtacactgta t 11 <210> 120 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID Code 120 <400> 120 gtacgcgaca t 11 <210> 121 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID Code 121 <400> 121 gtactataga t 11 <210> 122 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID Code 122 <400> 122 gtactgagtc t 11 <210> 123 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID Code 123 <400> 123 gtagctagcg t 11 <210> 124 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID Code 124 <400> 124 gtagtcactg t 11 <210> 125 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID Code 125 <400> 125 gtagtgtcac t 11 <210> 126 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID Code 126 <400> 126 gtatacatag t 11 <210> 127 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID Code 127 <400> 127 gtcatcgtcg t 11 <210> 128 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID Code 128 <400> 128 gtcgacacgc t 11 <210> 129 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID Code 129 <400> 129 gtcgagtgag t 11 <210> 130 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID Code 130 <400> 130 gtctactatc t 11 <210> 131 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID Code 131 <400> 131 gtgtctagac t 11 <210> 132 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID Code 132 <400> 132 gtgtgtatcg t 11 <210> 133 <211> 62 <212> DNA <213> Artificial Sequence <220> <223> Fusion primer MID1-F1 <400> 133 ccatctcatc cctgcgtgtc tccgactcag acacgacgac tgagcaaggt gtttttccaa 60 tc 62 <210> 134 <211> 62 <212> DNA <213> Artificial Sequence <220> <223> Fusion primer MID1-R1 <400> 134 cctatcccct gtgtgccttg gcagtctcag acacgacgac tcattctcca actgcttcct 60 tg 62 <210> 135 <211> 62 <212> DNA <213> Artificial Sequence <220> <223> Fusion primer MID1-F2 <400> 135 ccatctcatc cctgcgtgtc tccgactcag acacgacgac tgctgccttc taccaaatac 60 cc 62 <210> 136 <211> 62 <212> DNA <213> Artificial Sequence <220> <223> Fusion primer MID1-R2 <400> 136 cctatcccct gtgtgccttg gcagtctcag acacgacgac tcttcctgag agaagcaaca 60 cc 62 <210> 137 <211> 64 <212> DNA <213> Artificial Sequence <220> <223> Fusion primer MID1-F3 <400> 137 ccatctcatc cctgcgtgtc tccgactcag acacgacgac tgttcaggac tggccctgct 60 aaca 64 <210> 138 <211> 64 <212> DNA <213> Artificial Sequence <220> <223> Fusion primer MID1-R3 <400> 138 cctatcccct gtgtgccttg gcagtctcag acacgacgac tcctccagcc cactttctct 60 tctc 64 <210> 139 <211> 63 <212> DNA <213> Artificial Sequence <220> <223> Fusion primer MID1-F4 <400> 139 ccatctcatc cctgcgtgtc tccgactcag acacgacgac tgatcacctt gccactattt 60 cct 63 <210> 140 <211> 62 <212> DNA <213> Artificial Sequence <220> <223> Fusion primer MID1-R4 <400> 140 cctatcccct gtgtgccttg gcagtctcag acacgacgac tacatgacag ccagctgcta 60 ct 62 <210> 141 <211> 63 <212> DNA <213> Artificial Sequence <220> <223> Fusion primer MID1-F5 <400> 141 ccatctcatc cctgcgtgtc tccgactcag acacgacgac tgaacctgcc tctcctgcat 60 tgg 63 <210> 142 <211> 63 <212> DNA <213> Artificial Sequence <220> <223> Fusion primer MID1-R5 <400> 142 cctatcccct gtgtgccttg gcagtctcag acacgacgac tactctgcct gtggccaagt 60 agg 63 <210> 143 <211> 62 <212> DNA <213> Artificial Sequence <220> <223> Fusion primer MID1-F6 <400> 143 ccatctcatc cctgcgtgtc tccgactcag acacgacgac tgagtagagc tacaagataa 60 ac 62 <210> 144 <211> 67 <212> DNA <213> Artificial Sequence <220> <223> Fusion primer MID1-R6 <400> 144 cctatcccct gtgtgccttg gcagtctcag acacgacgac ttaactacag ggtgttagat 60 gaactca 67 <210> 145 <211> 65 <212> DNA <213> Artificial Sequence <220> <223> Fusion primer MID1-F7 <400> 145 ccatctcatc cctgcgtgtc tccgactcag acacgacgac taaagtgaca caacagcttc 60 tccag 65 <210> 146 <211> 65 <212> DNA <213> Artificial Sequence <220> <223> Fusion primer MID1-R7 <400> 146 cctatcccct gtgtgccttg gcagtctcag acacgacgac taacgcgtgt cctagtttgg 60 ctgtg 65 <210> 147 <211> 62 <212> DNA <213> Artificial Sequence <220> <223> Fusion primer MID1-F8 <400> 147 ccatctcatc cctgcgtgtc tccgactcag acacgacgac tccctcctcc aggtaaatca 60 gc 62 <210> 148 <211> 66 <212> DNA <213> Artificial Sequence <220> <223> Fusion primer MID1-R8 <400> 148 cctatcccct gtgtgccttg gcagtctcag acacgacgac taatcacatg gcaaataagt 60 acatac 66 <210> 149 <211> 66 <212> DNA <213> Artificial Sequence <220> <223> Fusion primer MID1-F9 <400> 149 ccatctcatc cctgcgtgtc tccgactcag acacgacgac tctaatttag aatgagagag 60 gcttct 66 <210> 150 <211> 66 <212> DNA <213> Artificial Sequence <220> <223> Fusion primer MID1-R9 <400> 150 cctatcccct gtgtgccttg gcagtctcag acacgacgac tttggtctct attctctgaa 60 tattcc 66 <210> 151 <211> 66 <212> DNA <213> Artificial Sequence <220> <223> Fusion primer MID1-F10 <400> 151 ccatctcatc cctgcgtgtc tccgactcag acacgacgac tcgaattcca aatctgttaa 60 tttgct 66 <210> 152 <211> 65 <212> DNA <213> Artificial Sequence <220> <223> Fusion primer MID1-R10 <400> 152 cctatcccct gtgtgccttg gcagtctcag acacgacgac tacagacaga aactcaatga 60 aagca 65 <210> 153 <211> 65 <212> DNA <213> Artificial Sequence <220> <223> Fusion primer MID1-F11 <400> 153 ccatctcatc cctgcgtgtc tccgactcag acacgacgac tgctttcaga aatagtttgc 60 attca 65 <210> 154 <211> 65 <212> DNA <213> Artificial Sequence <220> <223> Fusion primer MID1-R11 <400> 154 cctatcccct gtgtgccttg gcagtctcag acacgacgac tatcttcaca tgatattaca 60 gcaga 65 <210> 155 <211> 62 <212> DNA <213> Artificial Sequence <220> <223> Fusion primer MID2-F1 <400> 155 ccatctcatc cctgcgtgtc tccgactcag acacgtagta tgagcaaggt gtttttccaa 60 tc 62 <210> 156 <211> 62 <212> DNA <213> Artificial Sequence <220> <223> Fusion primer MID2-R1 <400> 156 cctatcccct gtgtgccttg gcagtctcag acacgtagta tcattctcca actgcttcct 60 tg 62 <210> 157 <211> 62 <212> DNA <213> Artificial Sequence <220> <223> Fusion primer MID2-F2 <400> 157 ccatctcatc cctgcgtgtc tccgactcag acacgtagta tgctgccttc taccaaatac 60 cc 62 <210> 158 <211> 62 <212> DNA <213> Artificial Sequence <220> <223> Fusion primer MID2-R2 <400> 158 cctatcccct gtgtgccttg gcagtctcag acacgtagta tcttcctgag agaagcaaca 60 cc 62 <210> 159 <211> 64 <212> DNA <213> Artificial Sequence <220> <223> Fusion primer MID2-F3 <400> 159 ccatctcatc cctgcgtgtc tccgactcag acacgtagta tgttcaggac tggccctgct 60 aaca 64 <210> 160 <211> 64 <212> DNA <213> Artificial Sequence <220> <223> Fusion primer MID2-R3 <400> 160 cctatcccct gtgtgccttg gcagtctcag acacgtagta tcctccagcc cactttctct 60 tctc 64 <210> 161 <211> 63 <212> DNA <213> Artificial Sequence <220> <223> Fusion primer MID2-F4 <400> 161 ccatctcatc cctgcgtgtc tccgactcag acacgtagta tgatcacctt gccactattt 60 cct 63 <210> 162 <211> 62 <212> DNA <213> Artificial Sequence <220> <223> Fusion primer MID2-R4 <400> 162 cctatcccct gtgtgccttg gcagtctcag acacgtagta tacatgacag ccagctgcta 60 ct 62 <210> 163 <211> 63 <212> DNA <213> Artificial Sequence <220> <223> Fusion primer MID2-F5 <400> 163 ccatctcatc cctgcgtgtc tccgactcag acacgtagta tgaacctgcc tctcctgcat 60 tgg 63 <210> 164 <211> 63 <212> DNA <213> Artificial Sequence <220> <223> Fusion primer MID2-R5 <400> 164 cctatcccct gtgtgccttg gcagtctcag acacgtagta tactctgcct gtggccaagt 60 agg 63 <210> 165 <211> 62 <212> DNA <213> Artificial Sequence <220> <223> Fusion primer MID2-F6 <400> 165 ccatctcatc cctgcgtgtc tccgactcag acacgtagta tgagtagagc tacaagataa 60 ac 62 <210> 166 <211> 67 <212> DNA <213> Artificial Sequence <220> <223> Fusion primer MID2-R6 <400> 166 cctatcccct gtgtgccttg gcagtctcag acacgtagta ttaactacag ggtgttagat 60 gaactca 67 <210> 167 <211> 65 <212> DNA <213> Artificial Sequence <220> <223> Fusion primer MID2-F7 <400> 167 ccatctcatc cctgcgtgtc tccgactcag acacgtagta taaagtgaca caacagcttc 60 tccag 65 <210> 168 <211> 65 <212> DNA <213> Artificial Sequence <220> <223> Fusion primer MID2-R7 <400> 168 cctatcccct gtgtgccttg gcagtctcag acacgtagta taacgcgtgt cctagtttgg 60 ctgtg 65 <210> 169 <211> 62 <212> DNA <213> Artificial Sequence <220> <223> Fusion primer MID2-F8 <400> 169 ccatctcatc cctgcgtgtc tccgactcag acacgtagta tccctcctcc aggtaaatca 60 gc 62 <210> 170 <211> 66 <212> DNA <213> Artificial Sequence <220> <223> Fusion primer MID2-R8 <400> 170 cctatcccct gtgtgccttg gcagtctcag acacgtagta taatcacatg gcaaataagt 60 acatac 66 <210> 171 <211> 66 <212> DNA <213> Artificial Sequence <220> <223> Fusion primer MID2-F9 <400> 171 ccatctcatc cctgcgtgtc tccgactcag acacgtagta tctaatttag aatgagagag 60 gcttct 66 <210> 172 <211> 66 <212> DNA <213> Artificial Sequence <220> <223> Fusion primer MID2-R9 <400> 172 cctatcccct gtgtgccttg gcagtctcag acacgtagta tttggtctct attctctgaa 60 tattcc 66 <210> 173 <211> 66 <212> DNA <213> Artificial Sequence <220> <223> Fusion primer MID2-F10 <400> 173 ccatctcatc cctgcgtgtc tccgactcag acacgtagta tcgaattcca aatctgttaa 60 tttgct 66 <210> 174 <211> 65 <212> DNA <213> Artificial Sequence <220> <223> Fusion primer MID2-R10 <400> 174 cctatcccct gtgtgccttg gcagtctcag acacgtagta tacagacaga aactcaatga 60 aagca 65 <210> 175 <211> 65 <212> DNA <213> Artificial Sequence <220> <223> Fusion primer MID2-F11 <400> 175 ccatctcatc cctgcgtgtc tccgactcag acacgtagta tgctttcaga aatagtttgc 60 attca 65 <210> 176 <211> 65 <212> DNA <213> Artificial Sequence <220> <223> Fusion primer MID2-R11 <400> 176 cctatcccct gtgtgccttg gcagtctcag acacgtagta tatcttcaca tgatattaca 60 gcaga 65 <210> 177 <211> 180 <212> DNA <213> Bovine BM1824 <400> 177 gagcaaggtg tttttccaat ctaactttct gtgtgtgtgt gtgtgtgtgt gtgtgttagt 60 tgcttagtca tgtcacttag ccaaatttcc aaaaaagtgt gagtagaatg aaaacttatt 120 ttaatattca tgtctcagtt tacctttcac gcaccatttc aaggaagcag ttggagaatg 180 180 <210> 178 <211> 153 <212> DNA <213> Bovine BM2113 <400> 178 gctgccttct accaaatacc ccctgctccg gccccacctc aaccacacac acacacacac 60 acacacacac acacacacac acacacacac acacacagag tgagctcata gttttgagtt 120 aaaaatgtga caggtgttgc ttctctcagg aag 153 <210> 179 <211> 224 <212> DNA <213> Bovine ETH10 <400> 179 gttcaggact ggccctgcta acacccctcc tccaccacca ccaccaaaaa taaaacacac 60 acacacacac acacacacac acacacacac acacacaatc ctctcccagc ctccctcttc 120 agtgtaagca gtggctgccc cagccctctg tttccggctt ctccgactac ccaggtccct 180 ccctggagct ctgacgacac agagaagaga aagtgggctg gagg 224 <210> 180 <211> 149 <212> DNA <213> Bovine ETH225 <400> 180 gatcaccttg ccactatttc ctccaacata tgtgtgtgcg tgcacacaca cacacacaca 60 cacacacaca cacacacatg atagccactc ctttctctaa tgccacagaa ttacacagtc 120 aactctctag tagcagctgg ctgtcatgt 149 <210> 181 <211> 122 <212> DNA <213> Bovine ETH3 <400> 181 gaacctgcct ctcctgcatt ggcagtgtgt gtgtgtgtgt gtgtgtgtgt gtgtgtgtgt 60 gtgtgtgtgt gtgtgtacca ctagccacct gggaagcccg cctacttggc cacaggcaga 120 gt 122 <210> 182 <211> 245 <212> DNA <213> Bovine SPS115 <400> 182 aaagtgacac aacagcttct ccagagcatc tccaatatct cacacacaca cacacacaca 60 cacacataca cacacacaca tctcattcct ctagtgtctt ttgcctttaa agaaaaaaaa 120 aactaagcag atcaacatgg gatctccttt ttgtagattt atagaaaggg ttcctttgtt 180 gcgcactcac ttgtaagaaa atgagacaaa aacgtgaaac ccacagccaa actaggacac 240 tcgtt 245 <210> 183 <211> 142 <212> DNA <213> Bovine TGLA122 <400> 183 ccctcctcca ggtaaatcag catatatata tgtgtgtgtg tgtgtgtgtg tgtgtataca 60 catatataaa tatcttgctt ctatatcttt actctgggtt tttaaaatta ttcataggta 120 tgtacttatt tgccatgtga tt 142 <210> 184 <211> 90 <212> DNA <213> Bovine TGLA227 <400> 184 cgaattccaa atctgttaat ttgcttgtgt gtgtgtgtgt gtgtgtgtgt gtgtgtgtgt 60 gtgtcctgct ttcattgagt ttctgtctgt 90 <210> 185 <211> 155 <212> DNA <213> Bovine TGLA53 <400> 185 atcttcacat gatattacag cagacagctg caagagttag caaaagtatt actataggaa 60 aaacaataaa catatatata tatatatata tacacacaca cgcacacaca cacatagttt 120 tatgttctgc atgaatgcaa actatttctg aaagc 155 <110> Genocheck Co., Ltd. <120> Method for designing fusion primer used in next generation          sequencing, and method for analyzing genotype of target gene          using next generation sequencing and fusion primer <130> P12-0283KR <160> 185 <170> Kopatentin 1.71 <210> 1 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 1 <400> 1 acacgacgac t 11 <210> 2 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 2 <400> 2 acacgtagta t 11 <210> 3 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 3 <400> 3 acactactcg t 11 <210> 4 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 4 <400> 4 acgacacgta t 11 <210> 5 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 5 <400> 5 acgagtagac t 11 <210> 6 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 6 <400> 6 acgcgtctag t 11 <210> 7 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 7 <400> 7 acgtacacac t 11 <210> 8 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 8 <400> 8 acgtactgtg t 11 <210> 9 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 9 <400> 9 acgtagatcg t 11 <210> 10 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 10 <400> 10 actacgtctc t 11 <210> 11 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 11 <400> 11 actatacgag t 11 <210> 12 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 12 <400> 12 actcgcgtcg t 11 <210> 13 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 13 <400> 13 agactcgacg t 11 <210> 14 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 14 <400> 14 agtacgagag t 11 <210> 15 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 15 <400> 15 agtactacta t 11 <210> 16 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 16 <400> 16 agtagacgtc t 11 <210> 17 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 17 <400> 17 agtcgtacac t 11 <210> 18 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 18 <400> 18 agtgtagtag t 11 <210> 19 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 19 <400> 19 atagtatacg t 11 <210> 20 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 20 <400> 20 cagtacgtac t 11 <210> 21 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 21 <400> 21 cgacgacgcg t 11 <210> 22 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 22 <400> 22 cgacgagtac t 11 <210> 23 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 23 <400> 23 cgatactacg t 11 <210> 24 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 24 <400> 24 cgtacgtcga t 11 <210> 25 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 25 <400> 25 ctactcgtag t 11 <210> 26 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 26 <400> 26 gtacagtacg t 11 <210> 27 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 27 <400> 27 gtcgtacgta t 11 <210> 28 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 28 <400> 28 gtgtacgacg t 11 <210> 29 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 29 <400> 29 acacagtgag t 11 <210> 30 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 30 <400> 30 acactcatac t 11 <210> 31 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 31 <400> 31 acagacagcg t 11 <210> 32 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 32 <400> 32 acagactata t 11 <210> 33 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 33 <400> 33 acagagactc t 11 <210> 34 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 34 <400> 34 acagctcgtg t 11 <210> 35 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 35 <400> 35 acagtgtcga t 11 <210> 36 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 36 <400> 36 acgagcgcgc t 11 <210> 37 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 37 <400> 37 acgatgagtg t 11 <210> 38 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 38 <400> 38 acgcgagaga t 11 <210> 39 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 39 <400> 39 acgctctctc t 11 <210> 40 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 40 <400> 40 acgtcgctga t 11 <210> 41 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 41 <400> 41 acgtctagca t 11 <210> 42 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 42 <400> 42 actagtgata t 11 <210> 43 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 43 <400> 43 actcacactg t 11 <210> 44 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 44 <400> 44 actcactagc t 11 <210> 45 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 45 <400> 45 actctatata t 11 <210> 46 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 46 <400> 46 actgatctcg t 11 <210> 47 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 47 <400> 47 actgctgtac t 11 <210> 48 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 48 <400> 48 actgtagcgc t 11 <210> 49 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 49 <400> 49 agacactcac t 11 <210> 50 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 50 <400> 50 agacatatag t 11 <210> 51 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 51 <400> 51 agacgtgatc t 11 <210> 52 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 52 <400> 52 agagtacaga t 11 <210> 53 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 53 <400> 53 agagtatctc t 11 <210> 54 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 54 <400> 54 agatacgctg t 11 <210> 55 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 55 <400> 55 agatctagtc t 11 <210> 56 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 56 <400> 56 agcagcgtag t 11 <210> 57 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 57 <400> 57 agcgcacgag t 11 <210> 58 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 58 <400> 58 agcgtgtgcg t 11 <210> 59 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 59 <400> 59 agctagatac t 11 <210> 60 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 60 <400> 60 agctgtcgac t 11 <210> 61 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 61 <400> 61 agtatgcacg t 11 <210> 62 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 62 <400> 62 agtcgcgcta t 11 <210> 63 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 63 <400> 63 agtctgtctg t 11 <210> 64 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 64 <400> 64 atacacacga t 11 <210> 65 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 65 <400> 65 atacgcgtgc t 11 <210> 66 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 66 <400> 66 atactagcac t 11 <210> 67 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 67 <400> 67 atagagctag t 11 <210> 68 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 68 <400> 68 atatagagta t 11 <210> 69 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 69 <400> 69 atcgctcacg t 11 <210> 70 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 70 <400> 70 atcgtcagtc t 11 <210> 71 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 71 <400> 71 atctctcgta t 11 <210> 72 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 72 <400> 72 atctgagacg t 11 <210> 73 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 73 <400> 73 atgctacgtc t 11 <210> 74 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 74 <400> 74 atgtgactac t 11 <210> 75 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 75 <400> 75 cacgagacag t 11 <210> 76 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 76 <400> 76 cacgcgagtc t 11 <210> 77 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 77 <400> 77 cacgctacga t 11 <210> 78 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 78 <400> 78 cacgtgtata t 11 <210> 79 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 79 <400> 79 cactacgatg t 11 <210> 80 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 80 <400> 80 cactatactc t 11 <210> 81 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 81 <400> 81 cagcgtactg t 11 <210> 82 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 82 <400> 82 cagtctctag t 11 <210> 83 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 83 <400> 83 catagtcgcg t 11 <210> 84 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 84 <400> 84 cgagacacta t 11 <210> 85 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 85 <400> 85 cgagagtgtg t 11 <210> 86 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 86 <400> 86 cgagtcatcg t 11 <210> 87 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 87 <400> 87 cgatcgtata t 11 <210> 88 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 88 <400> 88 cgcagtacgc t 11 <210> 89 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 89 <400> 89 cgcgatcgta t 11 <210> 90 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 90 <400> 90 cgcgctatac t 11 <210> 91 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 91 <400> 91 cgtacagata t 11 <210> 92 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 92 <400> 92 cgtagctctc t 11 <210> 93 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 93 <400> 93 cgtatagtgc t 11 <210> 94 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 94 <400> 94 cgtcagcgac t 11 <210> 95 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 95 <400> 95 cgtcgcagtg t 11 <210> 96 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 96 <400> 96 cgtctcacga t 11 <210> 97 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 97 <400> 97 cgtgactcag t 11 <210> 98 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 98 <400> 98 ctacacgctc t 11 <210> 99 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 99 <400> 99 ctacgatatg t 11 <210> 100 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 100 <400> 100 ctagacagac t 11 <210> 101 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 101 <400> 101 ctagtactca t 11 <210> 102 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 102 <400> 102 ctatatgtcg t 11 <210> 103 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 103 <400> 103 ctatcgacac t 11 <210> 104 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 104 <400> 104 ctatgtagag t 11 <210> 105 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 105 <400> 105 ctcacgtaca t 11 <210> 106 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 106 <400> 106 ctcgagtctc t 11 <210> 107 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 107 <400> 107 ctcgtcgaga t 11 <210> 108 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 108 <400> 108 ctctacagcg t 11 <210> 109 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 109 <400> 109 ctgtcgtgcg t 11 <210> 110 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 110 <400> 110 ctgtgacgtg t 11 <210> 111 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 111 <400> 111 gacgctgtcg t 11 <210> 112 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 112 <400> 112 gacgtatgac t 11 <210> 113 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID code 113 <400> 113 gactagctag t 11 <210> 114 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID Code 114 <400> 114 gagacgtcgc t 11 <210> 115 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID Code 115 <400> 115 gagagagacg t 11 <210> 116 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID Code 116 <400> 116 gcgtagacta t 11 <210> 117 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID Code 117 <400> 117 gcgtcgtgtc t 11 <210> 118 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID Code 118 <400> 118 gctctctacg t 11 <210> 119 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID Code 119 <400> 119 gtacactgta t 11 <210> 120 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID Code 120 <400> 120 gtacgcgaca t 11 <210> 121 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID Code 121 <400> 121 gtactataga t 11 <210> 122 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID Code 122 <400> 122 gtactgagtc t 11 <210> 123 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID Code 123 <400> 123 gtagctagcg t 11 <210> 124 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID Code 124 <400> 124 gtagtcactg t 11 <210> 125 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID Code 125 <400> 125 gtagtgtcac t 11 <210> 126 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID Code 126 <400> 126 gtatacatag t 11 <210> 127 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID Code 127 <400> 127 gtcatcgtcg t 11 <210> 128 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID Code 128 <400> 128 gtcgacacgc t 11 <210> 129 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID Code 129 <400> 129 gtcgagtgag t 11 <210> 130 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID Code 130 <400> 130 gtctactatc t 11 <210> 131 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID Code 131 <400> 131 gtgtctagac t 11 <210> 132 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> MID Code 132 <400> 132 gtgtgtatcg t 11 <210> 133 <211> 62 <212> DNA <213> Artificial Sequence <220> <223> Fusion primer MID1-F1 <400> 133 ccatctcatc cctgcgtgtc tccgactcag acacgacgac tgagcaaggt gtttttccaa 60 tc 62 <210> 134 <211> 62 <212> DNA <213> Artificial Sequence <220> <223> Fusion primer MID1-R1 <400> 134 cctatcccct gtgtgccttg gcagtctcag acacgacgac tcattctcca actgcttcct 60 tg 62 <210> 135 <211> 62 <212> DNA <213> Artificial Sequence <220> <223> Fusion primer MID1-F2 <400> 135 ccatctcatc cctgcgtgtc tccgactcag acacgacgac tgctgccttc taccaaatac 60 cc 62 <210> 136 <211> 62 <212> DNA <213> Artificial Sequence <220> <223> Fusion primer MID1-R2 <400> 136 cctatcccct gtgtgccttg gcagtctcag acacgacgac tcttcctgag agaagcaaca 60 cc 62 <210> 137 <211> 64 <212> DNA <213> Artificial Sequence <220> <223> Fusion primer MID1-F3 <400> 137 ccatctcatc cctgcgtgtc tccgactcag acacgacgac tgttcaggac tggccctgct 60 aaca 64 <210> 138 <211> 64 <212> DNA <213> Artificial Sequence <220> <223> Fusion primer MID1-R3 <400> 138 cctatcccct gtgtgccttg gcagtctcag acacgacgac tcctccagcc cactttctct 60 tctc 64 <210> 139 <211> 63 <212> DNA <213> Artificial Sequence <220> <223> Fusion primer MID1-F4 <400> 139 ccatctcatc cctgcgtgtc tccgactcag acacgacgac tgatcacctt gccactattt 60 cct 63 <210> 140 <211> 62 <212> DNA <213> Artificial Sequence <220> <223> Fusion primer MID1-R4 <400> 140 cctatcccct gtgtgccttg gcagtctcag acacgacgac tacatgacag ccagctgcta 60 ct 62 <210> 141 <211> 63 <212> DNA <213> Artificial Sequence <220> <223> Fusion primer MID1-F5 <400> 141 ccatctcatc cctgcgtgtc tccgactcag acacgacgac tgaacctgcc tctcctgcat 60 tgg 63 <210> 142 <211> 63 <212> DNA <213> Artificial Sequence <220> <223> Fusion primer MID1-R5 <400> 142 cctatcccct gtgtgccttg gcagtctcag acacgacgac tactctgcct gtggccaagt 60 agg 63 <210> 143 <211> 62 <212> DNA <213> Artificial Sequence <220> <223> Fusion primer MID1-F6 <400> 143 ccatctcatc cctgcgtgtc tccgactcag acacgacgac tgagtagagc tacaagataa 60 ac 62 <210> 144 <211> 67 <212> DNA <213> Artificial Sequence <220> <223> Fusion primer MID1-R6 <400> 144 cctatcccct gtgtgccttg gcagtctcag acacgacgac ttaactacag ggtgttagat 60 gaactca 67 <210> 145 <211> 65 <212> DNA <213> Artificial Sequence <220> <223> Fusion primer MID1-F7 <400> 145 ccatctcatc cctgcgtgtc tccgactcag acacgacgac taaagtgaca caacagcttc 60 tccag 65 <210> 146 <211> 65 <212> DNA <213> Artificial Sequence <220> <223> Fusion primer MID1-R7 <400> 146 cctatcccct gtgtgccttg gcagtctcag acacgacgac taacgcgtgt cctagtttgg 60 ctgtg 65 <210> 147 <211> 62 <212> DNA <213> Artificial Sequence <220> <223> Fusion primer MID1-F8 <400> 147 ccatctcatc cctgcgtgtc tccgactcag acacgacgac tccctcctcc aggtaaatca 60 gc 62 <210> 148 <211> 66 <212> DNA <213> Artificial Sequence <220> <223> Fusion primer MID1-R8 <400> 148 cctatcccct gtgtgccttg gcagtctcag acacgacgac taatcacatg gcaaataagt 60 acatac 66 <210> 149 <211> 66 <212> DNA <213> Artificial Sequence <220> <223> Fusion primer MID1-F9 <400> 149 ccatctcatc cctgcgtgtc tccgactcag acacgacgac tctaatttag aatgagagag 60 gcttct 66 <210> 150 <211> 66 <212> DNA <213> Artificial Sequence <220> <223> Fusion primer MID1-R9 <400> 150 cctatcccct gtgtgccttg gcagtctcag acacgacgac tttggtctct attctctgaa 60 tattcc 66 <210> 151 <211> 66 <212> DNA <213> Artificial Sequence <220> <223> Fusion primer MID1-F10 <400> 151 ccatctcatc cctgcgtgtc tccgactcag acacgacgac tcgaattcca aatctgttaa 60 tttgct 66 <210> 152 <211> 65 <212> DNA <213> Artificial Sequence <220> <223> Fusion primer MID1-R10 <400> 152 cctatcccct gtgtgccttg gcagtctcag acacgacgac tacagacaga aactcaatga 60 aagca 65 <210> 153 <211> 65 <212> DNA <213> Artificial Sequence <220> <223> Fusion primer MID1-F11 <400> 153 ccatctcatc cctgcgtgtc tccgactcag acacgacgac tgctttcaga aatagtttgc 60 attca 65 <210> 154 <211> 65 <212> DNA <213> Artificial Sequence <220> <223> Fusion primer MID1-R11 <400> 154 cctatcccct gtgtgccttg gcagtctcag acacgacgac tatcttcaca tgatattaca 60 gcaga 65 <210> 155 <211> 62 <212> DNA <213> Artificial Sequence <220> <223> Fusion primer MID2-F1 <400> 155 ccatctcatc cctgcgtgtc tccgactcag acacgtagta tgagcaaggt gtttttccaa 60 tc 62 <210> 156 <211> 62 <212> DNA <213> Artificial Sequence <220> <223> Fusion primer MID2-R1 <400> 156 cctatcccct gtgtgccttg gcagtctcag acacgtagta tcattctcca actgcttcct 60 tg 62 <210> 157 <211> 62 <212> DNA <213> Artificial Sequence <220> <223> Fusion primer MID2-F2 <400> 157 ccatctcatc cctgcgtgtc tccgactcag acacgtagta tgctgccttc taccaaatac 60 cc 62 <210> 158 <211> 62 <212> DNA <213> Artificial Sequence <220> <223> Fusion primer MID2-R2 <400> 158 cctatcccct gtgtgccttg gcagtctcag acacgtagta tcttcctgag agaagcaaca 60 cc 62 <210> 159 <211> 64 <212> DNA <213> Artificial Sequence <220> <223> Fusion primer MID2-F3 <400> 159 ccatctcatc cctgcgtgtc tccgactcag acacgtagta tgttcaggac tggccctgct 60 aaca 64 <210> 160 <211> 64 <212> DNA <213> Artificial Sequence <220> <223> Fusion primer MID2-R3 <400> 160 cctatcccct gtgtgccttg gcagtctcag acacgtagta tcctccagcc cactttctct 60 tctc 64 <210> 161 <211> 63 <212> DNA <213> Artificial Sequence <220> <223> Fusion primer MID2-F4 <400> 161 ccatctcatc cctgcgtgtc tccgactcag acacgtagta tgatcacctt gccactattt 60 cct 63 <210> 162 <211> 62 <212> DNA <213> Artificial Sequence <220> <223> Fusion primer MID2-R4 <400> 162 cctatcccct gtgtgccttg gcagtctcag acacgtagta tacatgacag ccagctgcta 60 ct 62 <210> 163 <211> 63 <212> DNA <213> Artificial Sequence <220> <223> Fusion primer MID2-F5 <400> 163 ccatctcatc cctgcgtgtc tccgactcag acacgtagta tgaacctgcc tctcctgcat 60 tgg 63 <210> 164 <211> 63 <212> DNA <213> Artificial Sequence <220> <223> Fusion primer MID2-R5 <400> 164 cctatcccct gtgtgccttg gcagtctcag acacgtagta tactctgcct gtggccaagt 60 agg 63 <210> 165 <211> 62 <212> DNA <213> Artificial Sequence <220> <223> Fusion primer MID2-F6 <400> 165 ccatctcatc cctgcgtgtc tccgactcag acacgtagta tgagtagagc tacaagataa 60 ac 62 <210> 166 <211> 67 <212> DNA <213> Artificial Sequence <220> <223> Fusion primer MID2-R6 <400> 166 cctatcccct gtgtgccttg gcagtctcag acacgtagta ttaactacag ggtgttagat 60 gaactca 67 <210> 167 <211> 65 <212> DNA <213> Artificial Sequence <220> <223> Fusion primer MID2-F7 <400> 167 ccatctcatc cctgcgtgtc tccgactcag acacgtagta taaagtgaca caacagcttc 60 tccag 65 <210> 168 <211> 65 <212> DNA <213> Artificial Sequence <220> <223> Fusion primer MID2-R7 <400> 168 cctatcccct gtgtgccttg gcagtctcag acacgtagta taacgcgtgt cctagtttgg 60 ctgtg 65 <210> 169 <211> 62 <212> DNA <213> Artificial Sequence <220> <223> Fusion primer MID2-F8 <400> 169 ccatctcatc cctgcgtgtc tccgactcag acacgtagta tccctcctcc aggtaaatca 60 gc 62 <210> 170 <211> 66 <212> DNA <213> Artificial Sequence <220> <223> Fusion primer MID2-R8 <400> 170 cctatcccct gtgtgccttg gcagtctcag acacgtagta taatcacatg gcaaataagt 60 acatac 66 <210> 171 <211> 66 <212> DNA <213> Artificial Sequence <220> <223> Fusion primer MID2-F9 <400> 171 ccatctcatc cctgcgtgtc tccgactcag acacgtagta tctaatttag aatgagagag 60 gcttct 66 <210> 172 <211> 66 <212> DNA <213> Artificial Sequence <220> <223> Fusion primer MID2-R9 <400> 172 cctatcccct gtgtgccttg gcagtctcag acacgtagta tttggtctct attctctgaa 60 tattcc 66 <210> 173 <211> 66 <212> DNA <213> Artificial Sequence <220> <223> Fusion primer MID2-F10 <400> 173 ccatctcatc cctgcgtgtc tccgactcag acacgtagta tcgaattcca aatctgttaa 60 tttgct 66 <210> 174 <211> 65 <212> DNA <213> Artificial Sequence <220> <223> Fusion primer MID2-R10 <400> 174 cctatcccct gtgtgccttg gcagtctcag acacgtagta tacagacaga aactcaatga 60 aagca 65 <210> 175 <211> 65 <212> DNA <213> Artificial Sequence <220> <223> Fusion primer MID2-F11 <400> 175 ccatctcatc cctgcgtgtc tccgactcag acacgtagta tgctttcaga aatagtttgc 60 attca 65 <210> 176 <211> 65 <212> DNA <213> Artificial Sequence <220> <223> Fusion primer MID2-R11 <400> 176 cctatcccct gtgtgccttg gcagtctcag acacgtagta tatcttcaca tgatattaca 60 gcaga 65 <210> 177 <211> 180 <212> DNA <213> Bovine BM1824 <400> 177 gagcaaggtg tttttccaat ctaactttct gtgtgtgtgt gtgtgtgtgt gtgtgttagt 60 tgcttagtca tgtcacttag ccaaatttcc aaaaaagtgt gagtagaatg aaaacttatt 120 ttaatattca tgtctcagtt tacctttcac gcaccatttc aaggaagcag ttggagaatg 180                                                                          180 <210> 178 <211> 153 <212> DNA <213> Bovine BM2113 <400> 178 gctgccttct accaaatacc ccctgctccg gccccacctc aaccacacac acacacacac 60 acacacacac acacacacac acacacaca acacacagag tgagctcata gttttgagtt 120 aaaaatgtga caggtgttgc ttctctcagg aag 153 <210> 179 <211> 224 <212> DNA <213> Bovine ETH10 <400> 179 gttcaggact ggccctgcta acacccctcc tccaccacca ccaccaaaaa taaaacacac 60 acacacacac acacacacac acacacaatc ctctcccagc ctccctcttc 120 agtgtaagca gtggctgccc cagccctctg tttccggctt ctccgactac ccaggtccct 180 ccctggagct ctgacgacac agagaagaga aagtgggctg gagg 224 <210> 180 <211> 149 <212> DNA <213> Bovine ETH225 <400> 180 gatcaccttg ccactatttc ctccaacata tgtgtgtgcg tgcacacaca cacacacaca 60 cacacacaca cacacacatg atagccactc ctttctctaa tgccacagaa ttacacagtc 120 aactctctag tagcagctgg ctgtcatgt 149 <210> 181 <211> 122 <212> DNA <213> Bovine ETH3 <400> 181 gt; gtgtgtgtgt gtgtgtacca ctagccacct gggaagcccg cctacttggc cacaggcaga 120 gt 122 <210> 182 <211> 245 <212> DNA <213> Bovine SPS115 <400> 182 aaagtgacac aacagcttct ccagagcatc tccaatatct cacacacaca cacacacaca 60 cacacataca cacacacaca tctcattcct ctagtgtctt ttgcctttaa agaaaaaaaa 120 aactaagcag atcaacatgg gatctccttt ttgtagattt atagaaaggg ttcctttgtt 180 gcgcactcac ttgtaagaaa atgagacaaa aacgtgaaac ccacagccaa actaggacac 240 tcgtt 245 <210> 183 <211> 142 <212> DNA <213> Bovine TGLA122 <400> 183 ccctcctcca ggtaaatcag catatatata tgtgtgtgtg tgtgtgtgtg tgtgtataca 60 catatataaa tatcttgctt ctatatcttt actctgggtt tttaaaatta ttcataggta 120 tgtacttatt tgccatgtga tt 142 <210> 184 <211> 90 <212> DNA <213> Bovine TGLA227 <400> 184 cgaattccaa atctgttaat ttgcttgtgt gtgtgtgtgt gtgtgtgtgt gtgtgtgtgt 60 gtgtcctgct ttcattgagt ttctgtctgt 90 <210> 185 <211> 155 <212> DNA <213> Bovine TGLA53 <400> 185 atcttcacat gatattacag cagacagctg caagagttag caaaagtatt actataggaa 60 aaacaataaa catatatata tatatatata tacacacaca cgcacacaca cacatagttt 120 tatgttctgc atgaatgcaa actatttctg aaagc 155

Claims (11)

삭제delete 삭제delete 삭제delete 삭제delete 삭제delete (a) 하기 구조식 1의 정방향 융합 프라이머 및 이에 대응하는 하기 구조식 2의 역방향 융합 프라이머 쌍을 준비하는 단계와,
구조식 1
Figure 112014006108082-pat00019

구조식 2
Figure 112014006108082-pat00020

(상기 구조식 1 및 상기 구조식 2에서 X, X'는 분석대상이 되는 모든 시료 내에 존재하는 적어도 하나의 표적 유전자에 특이적인 유전자 서열과는 상동성이 없는 비상동성의 프라이머 서열로 구성하고, Y는 모든 시료에 대한 상기 표적 유전자의 유전자형을 동시에 분석할 때 각각의 시료를 식별해 주는 MID (Multiflex identifier) 서열로 구성하며, Z, Z'는 상기 표적 유전자에 특이적인 유전자 서열과 상보적으로 결합하는 표적 유전자 특이적인 프라이머 서열로 구성하고, n은 분석대상이 되는 시료의 개수와 일치하는 정수로서 2와 같거나 2보다 큰 정수이며, m은 표적 유전자의 개수와 일치하는 정수로서 1과 같거나 1보다 큰 정수임)
(b) 상기 (a) 단계에서 준비된 융합 프라이머 쌍을 이용하여 분석대상이 되는 모든 시료 내에 존재하는 적어도 하나의 표적 유전자를 증폭하여 각 시료 별로 상기 적어도 하나의 표적 유전자에 대한 PCR 증폭산물을 수득하는 단계와,
(c) 상기 (b) 단계에서 소모되지 않은 융합 프라이머들과 이들로부터 생성된 프라이머 이량체들을 제거하기 위해 상기 수득된 PCR 증폭산물에 대해 마이크로원심분리를 이용한 젤 추출 키트를 사용하여 젤 추출을 수행하여 정제하는 단계와,
(d) 상기 (c) 단계에서 정제된 PCR 증폭산물을 주형으로 하여 에멀젼 PCR (emPCR)을 수행하는 단계와,
(e) 상기 (d) 단계에서 수득된 에멀젼 PCR 증폭산물에 대한 시퀀싱 결과로부터 각 시료 별로 상기 적어도 하나의 표적 유전자의 서열을 결정하는 단계와,
(f) 상기 (e) 단계에서 결정된 상기 적어도 하나의 표적 유전자의 서열로부터 각 시료 별로 표적 유전자의 유전자형을 분석하는 단계를 포함하는 차세대 염기서열 분석법을 이용한 표적 유전자의 유전자형 분석방법.
(a) preparing a forward fusion primer of the following structural formula 1 and a corresponding reverse fusion primer pair of the following structural formula 2,
Structure 1
Figure 112014006108082-pat00019

Structure 2
Figure 112014006108082-pat00020

(Wherein X and X 'in the structural formulas 1 and 2 are non-homologous primer sequences which are not homologous to gene sequences specific to at least one target gene present in all samples to be analyzed, (MID) sequence that identifies each sample when analyzing the genotype of the target gene for all samples, and Z and Z 'are complementary to the gene sequence specific to the target gene Wherein n is an integer equal to or greater than 2 and equal to the number of the target sample, m is an integer equal to or greater than 1, Lt; / RTI &gt;
(b) amplifying at least one target gene present in all samples to be analyzed using the fusion primer pair prepared in the step (a), and obtaining a PCR amplification product for the at least one target gene for each sample Step,
(c) A gel extraction kit is used for the PCR amplification products obtained by removing the fusion primers and the primer dimers produced therefrom, which have not been consumed in the step (b), using a gel extraction kit using microfractionation ; And
(d) performing emulsion PCR (emPCR) using the PCR amplified product purified in the step (c) as a template,
(e) determining the sequence of the at least one target gene for each sample from a sequencing result of the emulsion PCR amplification product obtained in the step (d); and
(f) analyzing the genotype of the target gene for each sample from the sequence of the at least one target gene determined in the step (e), and analyzing the genotype of the target gene using the next generation sequencing method.
제6항에 있어서,
상기 표적 유전자는 STR (short tandem repeat) 및 단일염기다형성 부위를 포함하고, 상기 (f) 단계에서는 STR (short tandem repeat)의 반복 개수를 확인하고 STR의 전후에 존재하는 단일염기다형성 존재 여부를 확인하는 것을 특징으로 하는 차세대 염기서열 분석법을 이용한 표적 유전자의 유전자형 분석방법.
The method according to claim 6,
Wherein the target gene comprises STR (short tandem repeat) and a single nucleotide polymorphic site, and in step (f), the number of repeats of the STR (short tandem repeat) is checked and whether or not a single nucleotide polymorphism exists before and after the STR A method for analyzing a genotype of a target gene using a next-generation sequencing method.
제6항 또는 제7항에 있어서,
상기 융합 프라이머의 길이는 50 b.p. 내지 70 b.p.의 범위인 것을 특징으로 하는 차세대 염기서열 분석법을 이용한 표적 유전자의 유전자형 분석방법.
8. The method according to claim 6 or 7,
Wherein the length of the fusion primer is in the range of 50 bp to 70 bp.
제6항 또는 제7항에 있어서,
Y는 서열번호 1 내지 서열번호 132로 구성된 군으로부터 선택된 MID 서열인 것을 특징으로 하는 차세대 염기서열 분석법을 이용한 표적 유전자의 유전자형 분석방법.
8. The method according to claim 6 or 7,
And Y is a MID sequence selected from the group consisting of SEQ ID NO: 1 to SEQ ID NO: 132. A method for analyzing a genotype of a target gene using the next generation nucleotide sequence analysis method.
제6항 또는 제7항에 있어서,
상기 에멀젼 PCR에서 사용되는 비드 상에 결합된 한쪽 방향의 프라이머는 상기 구조식 1의 X 또는 상기 구조식 2의 X'와 동일하거나 상보적인 서열을 갖는 것을 특징으로 하는 차세대 염기서열 분석법을 이용한 표적 유전자의 유전자형 분석방법.
8. The method according to claim 6 or 7,
The one-way primer bonded on the bead used in the emulsion PCR has the same or complementary sequence as X in the formula 1 or X 'in the formula 2, and the genotype of the target gene using the next- Analysis method.
제6항 또는 제7항에 있어서,
상기 에멀젼 PCR 증폭산물에 대한 시퀀싱에서 사용되는 시퀀싱 프라이머는 상기 구조식 1의 X 또는 상기 구조식 2의 X'와 동일하거나 상보적인 서열을 갖는 것을 특징으로 하는 차세대 염기서열 분석법을 이용한 표적 유전자의 유전자형 분석방법.
8. The method according to claim 6 or 7,
Wherein the sequencing primer used in the sequencing of the emulsion PCR amplification product has a sequence identical or complementary to X in the structural formula 1 or X 'in the structural formula 2, and genotype analysis of the target gene using the next generation sequencing method .
KR1020120065805A 2012-06-19 2012-06-19 Method for designing fusion primer used in next generation sequencing, and method for analyzing genotype of target gene using next generation sequencing and fusion primer KR101406720B1 (en)

Priority Applications (2)

Application Number Priority Date Filing Date Title
KR1020120065805A KR101406720B1 (en) 2012-06-19 2012-06-19 Method for designing fusion primer used in next generation sequencing, and method for analyzing genotype of target gene using next generation sequencing and fusion primer
PCT/KR2013/005055 WO2013191400A1 (en) 2012-06-19 2013-06-10 Method for designing fusion primer for next generation sequencing, fusion primer, and method for analyzing genotype of target gene using next generation sequencing

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020120065805A KR101406720B1 (en) 2012-06-19 2012-06-19 Method for designing fusion primer used in next generation sequencing, and method for analyzing genotype of target gene using next generation sequencing and fusion primer

Publications (2)

Publication Number Publication Date
KR20130142523A KR20130142523A (en) 2013-12-30
KR101406720B1 true KR101406720B1 (en) 2014-06-13

Family

ID=49768958

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020120065805A KR101406720B1 (en) 2012-06-19 2012-06-19 Method for designing fusion primer used in next generation sequencing, and method for analyzing genotype of target gene using next generation sequencing and fusion primer

Country Status (2)

Country Link
KR (1) KR101406720B1 (en)
WO (1) WO2013191400A1 (en)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20160024139A (en) 2014-08-25 2016-03-04 바이오코아 주식회사 Method for analyzing genotype of human identifying markers based on next generation sequencing and personal identification method using the same
KR20160057536A (en) 2014-11-13 2016-05-24 대한민국(농촌진흥청장) Apis mellifera specific microsatellite molecular makers and method for determining apis mellifera species using the same
KR101632881B1 (en) 2015-11-26 2016-06-23 주식회사 지앤시바이오 Sequencing method of genomic DNA end sequence using NGS
KR101665632B1 (en) 2016-06-14 2016-10-14 주식회사 지앤시바이오 Sequencing method of cDNA end sequence using NGS

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101782806B1 (en) * 2015-02-11 2017-09-28 주식회사 랩 지노믹스 Method and kit for NGS-based high efficiency, high resolution HLA typing
KR101969905B1 (en) * 2016-06-20 2019-04-17 한국표준과학연구원 Primer set for library of base sequencing and manufacturing method of the library
WO2020164015A1 (en) * 2019-02-13 2020-08-20 武汉华大医学检验所有限公司 Fusion primer for third-generation sequencing library construction, and library construction method, sequencing method and library construction kit therefor

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009049889A1 (en) * 2007-10-16 2009-04-23 Roche Diagnostics Gmbh High resolution, high throughput hla genotyping by clonal sequencing

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009049889A1 (en) * 2007-10-16 2009-04-23 Roche Diagnostics Gmbh High resolution, high throughput hla genotyping by clonal sequencing
EP2203567A1 (en) 2007-10-16 2010-07-07 Roche Diagnostics GmbH High resolution, high throughput hla genotyping by clonal sequencing

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Mamm. Genome, Vol. 22, No. 9-10, pp. 589-601 (2011.07.30) *
Mamm. Genome, Vol. 22, No. 9-10, pp. 589-601 (2011.07.30)*

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20160024139A (en) 2014-08-25 2016-03-04 바이오코아 주식회사 Method for analyzing genotype of human identifying markers based on next generation sequencing and personal identification method using the same
KR20160057536A (en) 2014-11-13 2016-05-24 대한민국(농촌진흥청장) Apis mellifera specific microsatellite molecular makers and method for determining apis mellifera species using the same
KR101632881B1 (en) 2015-11-26 2016-06-23 주식회사 지앤시바이오 Sequencing method of genomic DNA end sequence using NGS
KR101665632B1 (en) 2016-06-14 2016-10-14 주식회사 지앤시바이오 Sequencing method of cDNA end sequence using NGS

Also Published As

Publication number Publication date
KR20130142523A (en) 2013-12-30
WO2013191400A1 (en) 2013-12-27

Similar Documents

Publication Publication Date Title
KR101406720B1 (en) Method for designing fusion primer used in next generation sequencing, and method for analyzing genotype of target gene using next generation sequencing and fusion primer
CN107075509B (en) Haploid panel assay by digitizing transposons
EP3611262B1 (en) Methods of sequencing the immune repertoire
JP2019201658A (en) Multiplex pyrosequencing using non-interfering noise canceling polynucleotide identification tags
JP2020503056A5 (en)
CN103898199A (en) High-flux nucleic acid analysis method and application thereof
WO2015200701A2 (en) Software haplotying of hla loci
CN107460254B (en) Method for researching and developing novel molecular marker based on pig LINE1 transposon insertion polymorphism
CN113168889B (en) Method for detecting tag sequence
US20210108263A1 (en) Methods and Compositions for Preparing Sequencing Libraries
Yin et al. Challenges in the application of NGS in the clinical laboratory
CN114686597A (en) SNP molecular marker for sex identification of salangid and application thereof
CN105112518B (en) A kind of HLA classifying method based on Pacbio RS II microarray dataset
CN108136389A (en) Sample is to the automatic preparation in NGS libraries
KR101778877B1 (en) Markers for discrimination of Whangkeumbae and Minibae
CN108823294B (en) Forensic medicine composite detection kit based on Y-SNP genetic markers of 20 haplotype groups D
KR20160082292A (en) Molecular Markers for Selecting radish genetic resources and use thereof
KR101769874B1 (en) Primer set for discriminating Allium cepa intra- or inter-species and uses thereof
CN111748606A (en) Method and kit for quickly constructing plasma DNA sequencing library
CN114875118B (en) Methods, kits and devices for determining cell lineage
CN106367498A (en) Periplaneta americana microsatellite loci and application thereof
KR101595016B1 (en) Primer composition for loop-mediated isothermal amplification for determining the sex of chickens and use thereof
CN115058523A (en) Specific primer and detection method for identifying litchi sharp moth based on microsatellite loci
CN114657269A (en) High-performance autosomal mini-haplotype genetic markers and primer set for detecting genetic markers
CN110964797B (en) Method for obtaining early embryo or larva male-female differential expression gene of prawn

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20180410

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20190320

Year of fee payment: 6