WO2021075750A1 - 자가 증폭이 가능한 헤어핀 구조의 ngs 라이브러리 제작용 어댑터 및 이를 이용한 ngs 라이브러리 제조방법 - Google Patents

자가 증폭이 가능한 헤어핀 구조의 ngs 라이브러리 제작용 어댑터 및 이를 이용한 ngs 라이브러리 제조방법 Download PDF

Info

Publication number
WO2021075750A1
WO2021075750A1 PCT/KR2020/012904 KR2020012904W WO2021075750A1 WO 2021075750 A1 WO2021075750 A1 WO 2021075750A1 KR 2020012904 W KR2020012904 W KR 2020012904W WO 2021075750 A1 WO2021075750 A1 WO 2021075750A1
Authority
WO
WIPO (PCT)
Prior art keywords
adapter
dna
ngs
self
library
Prior art date
Application number
PCT/KR2020/012904
Other languages
English (en)
French (fr)
Inventor
정철희
김서영
신준이
Original Assignee
고려대학교 산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 고려대학교 산학협력단 filed Critical 고려대학교 산학협력단
Priority to US17/769,636 priority Critical patent/US20240229018A9/en
Publication of WO2021075750A1 publication Critical patent/WO2021075750A1/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/6853Nucleic acid amplification reactions using modified primers or templates
    • C12Q1/6855Ligating adaptors
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1093General methods of preparing gene libraries, not provided for in other subgroups
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • CCHEMISTRY; METALLURGY
    • C40COMBINATORIAL TECHNOLOGY
    • C40BCOMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
    • C40B40/00Libraries per se, e.g. arrays, mixtures
    • C40B40/04Libraries containing only organic compounds
    • C40B40/06Libraries containing nucleotides or polynucleotides, or derivatives thereof
    • CCHEMISTRY; METALLURGY
    • C40COMBINATORIAL TECHNOLOGY
    • C40BCOMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
    • C40B50/00Methods of creating libraries, e.g. combinatorial synthesis
    • C40B50/06Biochemical methods, e.g. using enzymes or whole viable microorganisms
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2525/00Reactions involving modified oligonucleotides, nucleic acids, or nucleotides
    • C12Q2525/10Modifications characterised by
    • C12Q2525/191Modifications characterised by incorporating an adaptor
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2525/00Reactions involving modified oligonucleotides, nucleic acids, or nucleotides
    • C12Q2525/30Oligonucleotides characterised by their secondary structure
    • C12Q2525/301Hairpin oligonucleotides

Definitions

  • the present invention relates to an adapter for preparing an NGS library having a hairpin structure capable of self-amplification and a method for preparing an NGS library using the same.
  • NGS Next-generation sequencing
  • tumor heterogeneity may have different mutations in the same gene for each tumor cell. There is a problem that is difficult to tell if it is. In addition, in the case of a large number of somatic mutations, it is difficult to completely identify them because the amount is small or has characteristics that are exhibited at an extremely low frequency.
  • Duplex-Sequencing Another method is the Duplex-Sequencing (DupSeq) method, which reduces errors by attaching different UMIs to each end of the double strand in the original DNA fragment and sequencing independently. Since the two strands are complementary to each other, the true mutation is found at the ground position of the two strands in the Read Family, and if one of the two strands is detected but not the other strand, it can be determined that this is a damaged DNA or a PCR or sequencing error. . However, this method has a problem in that the number of reads required per sample is increased by about 100 times compared to the normal NGS method, which is expensive, and the presence of a barcode increases the PCR amplification bias and the complexity of the workflow.
  • DupSeq Duplex-Sequencing
  • Circle-Sequencing (Circle-Seq) method, which converts very short single-stranded DNA into circular DNA like RCA (rolling circle amplification), amplifies it into a circular state, and linearizes several amplification products identical to the original fragment. It is a method of creating (linear), and this method is cost-effective because it can maintain a uniform copy rate.
  • RCA is limited in length, causes severe biased amplification, and has limitations in detecting rare variants.
  • the O2n-Seq method is a technology complemented by combining the advantages of the barcode and RCA method, and the library of O2n-Seq is a pair of paired ends in one original piece. It is a technology that reduces sequencing errors because it exists and forms one read family.
  • the O2n-Seq method has a problem that is difficult to apply to long fragments because the efficiency of making circular DNA is low and the length of the DNA fragment to be analyzed to make circular DNA is limited, and the nick site is an artificial product as a result of incomplete cleavage.
  • the performance efficiency of the polymerase decreases in the end-repair and A-tail process, which acts as a factor in which the adapter cannot be properly attached, thus building a library. It can also lead to problems.
  • the uracil-DNA glycoslase (UDG) of the user enzyme which is used to remove the uracil base, plays a role of releasing the base, and there is a problem in that an abasic site that is contrary to amplification may be generated.
  • the present inventors studied a method that can minimize errors occurring in the DNA amplification process in the next-generation nucleotide sequence analysis, and as a result, it has a hairpin structure and self-amplification, that is, self-priming and replicating.
  • a possible adapter (SelPH: Self-priming and replicating hairpin adapter) was prepared, and it was confirmed that the library can be prepared by sequencing after amplification once by attaching the adapter (SelPH-adaptor) of the present invention to the original nucleic acid sample, At this time, it was confirmed that each of the single strands constituting the original nucleic acid sample was finally made of DNA in the form of a double (Duplicate).
  • the adapter capable of self-amplification of the present invention it is only necessary to amplify a total of two times at a time, so that a jackpot error or an error caused by biased amplification, which is a problem caused by the existing several amplification processes, can be minimized.
  • a jackpot error or an error caused by biased amplification which is a problem caused by the existing several amplification processes.
  • an object of the present invention is to provide an adapter for making a NGS (Next generation sequencing) library of a hairpin structure capable of self-priming and replicating.
  • NGS Next generation sequencing
  • Another object of the present invention is to provide a method for producing a next generation sequencing (NGS) library using an adapter for making a hairpin structure of a hairpin structure of the present invention for self-priming and replicating.
  • NGS next generation sequencing
  • Another object of the present invention is to provide a kit for preparing a next generation sequencing (NGS) library including an adapter for making a hairpin structure of a hairpin structure capable of self-priming and replicating.
  • NGS next generation sequencing
  • the present invention consists of the nucleotide sequence of SEQ ID NO: 4 and a long single-stranded first oligonucleotide having a hairpin structure; And a short single-stranded second oligonucleotide consisting of the nucleotide sequence of SEQ ID NO: 5; comprising, a self-amplifying (self-priming and replicating) hairpin structure capable of producing an adapter for making a NGS (Next generation sequencing) library.
  • NGS Next generation sequencing
  • the polymerase may bind to the first oligonucleotide, and the hairpin structure may be maintained even during an extension reaction.
  • the second oligonucleotide may not be phosphorylated at the 5'end of the nucleotide sequence consisting of SEQ ID NO: 5 so as not to be ligated with the 3'end of the first oligonucleotide.
  • the present invention (1) the step of fragmenting (fragmentation) the genomic DNA to be analyzed; (2) ligating the adapter of the present invention to the end of the fragmented genomic DNA to be analyzed; (3) adding a polymerase to the reaction solution ligated with the adapter of the present invention in step (2) and performing an extension reaction to obtain a first reaction product; (4) ligating a universal adapter for NGS to the first reaction product; (5) adding a polymerase to the reaction solution ligated with the universal adapter for NGS in step (4) and performing an extension reaction to obtain a secondary reaction product; And (6) purifying the second reaction product, and provides a method for producing a next generation sequencing (NGS) library.
  • NGS next generation sequencing
  • the genomic DNA to be analyzed and the adapter of claim 1 fragmented in step (2) are mixed at a molar ratio of 1:15 to 1:25 of the genomic DNA to be analyzed to the adapter of claim 1 It can be used.
  • step (2) before ligation of the adapter of claim 1 in step (2) and before ligation of the universal adapter for NGS in step (4), after end repair of DNA. It may be to further include a step of conjugating (A-tail) adenosine to the 3'end.
  • the first reaction product of step (4) may be an amplification product having an extended reaction hairpin structure including the adapter nucleotide sequence of claim 1.
  • the secondary reaction product in step (5), may be amplified by an extension reaction to be in the form of a linear duplex DNA.
  • the extension reaction in step (3) and the extension reaction in step (5) may be performed once, respectively.
  • the present invention provides a kit for preparing a DNA library, including an adapter for making a NGS (Next generation sequencing) library having a hairpin structure capable of self-priming and replicating according to the present invention.
  • NGS Next generation sequencing
  • the adapter for preparing an NGS library having a hairpin structure capable of self-amplification of the present invention can minimize the number of amplification reactions, thereby minimizing jackpot errors caused by the existing several amplification processes or errors due to biased amplification, and DNA
  • the workflow is simple and efficient, and there is no need to worry about errors and artificial products that may occur due to damage to the nucleic acid sample because there is no use of separate nicks and user enzymes. Therefore, when preparing a library for NGS using the adapter capable of self-amplification of the present invention, it is possible to increase the efficiency while reducing the error rate compared to the preparation of the library of the existing method, and it is possible to more accurately detect mutant sequences that exist at a low frequency. .
  • FIG. 1 is a schematic diagram showing a self-priming and replicating hairpin sequencing (SelPH-seq) analysis process, which is a next-generation base sequencing method using a self-priming and replicating hairpin adapter according to the present invention.
  • FIG. 2 shows the self-priming and replicating hairpin adapter 2a according to the present invention, and shows the results of confirming self-priming and replicating using the self-priming and replicating hairpin adapter of the present invention (2b) .
  • Figure 3 shows the result of PAGE confirming the artificial insert DNA having a size of 91bp extracted from the 21st exon of the EGFR gene in an embodiment of the present invention.
  • lane 4 is a result of confirming the PCR product according to the annealing temperature difference by PAGE in order to obtain an artificial insert DNA having a size of 285 bp targeting the 1041 position of the BRCA1 gene in an embodiment of the present invention
  • lane 1 54° C.
  • lane 2 57 °C
  • lane 3 shows the PCR product performed at 60 °C.
  • Figure 5 shows the 285bp insert DNA production process and PAGE results
  • 5a is a nested PCR product (PAGE)
  • 5b is a 1.5% agarose gel electrophoresis picture of the nested PCR product
  • 5c is a gel extraction product. It shows the results for.
  • 6 is a PAGE result of a ligation product using various ligation reagents for 91bp insert DNA, in 6a, lane 1: NEXTFlex Rapid DNA Sequencing Bundle (Bioo Scientific), lane 2: KAPA HyperPlus kit (KAPA Biosystems), Lane 3: NEBNext Ultra II FS DNA library Prep Kit (NEB) for Illumina, Lane 4: Blunt/TA Ligase Master Mix (NEB), M2: shows a 50bp DNA ladder, and 6b is for the generation of SelPH-adaptor ligation products. It shows a schematic diagram.
  • 7 is a PAGE showing the results of the ligation products according to the ligation time for 91bp and 285bp insert DNA, lane 1 of 7a: 91bp insert DNA ligated for 60 minutes, lane 2: ligation for 18 hours It is 91bp insert DNA, and lane 1: 285bp insert DNA of 7b, lane 2: 285bp insert DNA ligated for 1 hour is shown.
  • Figure 8 shows the product of the extension reaction of the 91bp insert DNA according to the DNA polymerase
  • lane 1 in 8a SelPH-adapter ligation product
  • lane 2 the product performed at a Q5 DNA polymerase annealing temperature of 78 °C
  • lane 3 Q5 DNA polymerase product performed at annealing temperature of 65°C
  • lane 4 Phi29 DNA polymerase
  • lane 5 Bst 2.0 DNA polymerase
  • M2 50 bp DNA ladder
  • 8b is a schematic diagram of the results of the first extension reaction. Is shown.
  • Figure 10 shows the product of performing the entire process of self-priming and replicating hairpin sequencing (SelPH-seq) using the SelPH-adapter of the present invention targeting 285 bp insert DNA, lane 1: 285 bp insert DNA, lane 2 : SelPH-adapter ligation product, lane 3: primary extension reaction product, lane 4: NGS adapter ligation product, lane 5: secondary extension reaction product.
  • FIG. 11 is a schematic diagram of a secondary ligation reaction process and a product produced in a self-priming and replicating hairpin sequencing (SelPH-seq) process using the SelPH-adapter according to the present invention.
  • FIG. 12 shows PAGE results for self-priming and replicating hairpin sequencing (SelPH-seq) analysis products using the SelPH-adapter of the present invention targeting the yeast genome.
  • the present invention develops a new adapter capable of minimizing errors caused by the amplification process in the next generation sequencing (NGS) process and producing a library for next generation nucleotide sequence analysis with high accuracy with minimal amplification. There is one characteristic.
  • next-generation nucleotide sequence analysis technology can produce a large amount of data in a short time, so it is a technology that drastically reduces the time and cost required for genome decoding.
  • the next-generation nucleotide sequence analysis technology has developed the technology of the sequencing platform over time and the analysis price is becoming cheaper, and succeeded in finding the gene that causes the disease using the next-generation nucleotide sequence analysis technology for genetic diseases, rare diseases, and cancers. I'm doing it.
  • the next-generation sequencing method of Illumina which is currently the most widely used, DNA is extracted from a sample, mechanically fragmented, and then a library having a specific size is produced and used for sequencing.
  • the initial sequencing data is produced by repeating four types of complementary nucleotide binding and separation reactions in one base unit. It is accomplished by performing analysis steps using bioinformatics such as identification and interpretation of mutation information.
  • This next-generation nucleotide sequence analysis method is contributing to the creation of new added value through the development of new disease treatments by discovering genomic mutations that have a high possibility or affect on diseases and various biological forms.
  • a library required for sequence analysis is prepared by ligating an adapter in the direction of 5'to 3'from a random DNA or cDNA fragment of a sample.
  • an adapter in the direction of 5'to 3'from a random DNA or cDNA fragment of a sample.
  • problems of biased amplification or noise generation there are many problems such as high cost, and when using a barcode, PCR amplification bias and complexity of a workflow increase due to the presence of a barcode, and it is difficult to detect rare mutations.
  • the present invention consisting of the nucleotide sequence of SEQ ID NO: 4, a long single-stranded first oligonucleotide having a hairpin structure; And a short single-stranded second oligonucleotide consisting of the nucleotide sequence of SEQ ID NO: 5; including, a hairpin structure capable of self-priming and replicating, an adapter for making a NGS (Next generation sequencing) library
  • NGS Next generation sequencing
  • the adapter of the present invention includes a long single-stranded first oligonucleotide and a short single-stranded second oligonucleotide, wherein the first oligonucleotide is capable of binding to a polymerase, and the hairpin There is a characteristic that the structure can be maintained, because the first oligonucleotide contains a SelPH-domain (self-priming and replicating hairpin-domain), that is, a self-amplifying nucleotide sequence.
  • SelPH-domain self-priming and replicating hairpin-domain
  • the nucleotide sequence corresponding to the SelPH-domain according to the present invention is the nucleotide sequence from the 17th nucleotide sequence to the 28th nucleotide sequence (GCGA CGAC ATCT) and the nucleotide sequence from the 33rd nucleotide to the 44th nucleotide sequence of SEQ ID NO: 4 (AGAT GTCG TCGC).
  • the nucleotide sequence of the SelPH-domain consists of a nucleotide sequence in which the 17th nucleotide sequence of SEQ ID NO: 4 to the 28th nucleotide sequence and the 33rd nucleotide to 44th nucleotide sequence are complementary to each other.
  • the 5'end of the first oligonucleotide is phosphorylated.
  • the second oligonucleotide is not phosphorylated at the 5'end so as not to be ligated with the 3'end of the first oligonucleotide, and specifically consists of the nucleotide sequence of SEQ ID NO: 5.
  • the adapter for making the NGS library according to the present invention is capable of self-amplification, that is, self-priming and replicating, and has a hairpin structure, wherein the self-amplification (self-priming and Replicating) means that when a polymerase binds to the adapter nucleotide sequence of the present invention, the nucleotide sequence of the adapter is amplified by the polymerase. That is, the adapter for making the NGS library of the present invention has a hairpin structure with a complementary nucleotide sequence, and after the polymerase binds to the adapter, amplification starts from the site corresponding to the complementary nucleotide sequence and is amplified to the conjugated DNA. .
  • the extension reaction of the polymerase can proceed only when the primer is first bound to the template strand DNA under the condition of a primer having a specific nucleotide sequence.
  • Self-priming and replicating by the adapter of the present invention is characterized in that an extension reaction by a polymerase is possible without a separate primer and a binding process between the template strand DNA and the primer due to a hairpin structure having a complementary nucleotide sequence. That is, the hairpin structure itself of the adapter of the present invention can serve as a primer.
  • an analysis was conducted to confirm the self-amplification ability of the adapter and optimal conditions using Q5 DNA polymerase.
  • the lengths of the long single-stranded oligonucleotides were differently prepared (see Table 6), and then the degree of self-amplification according to the extension reaction (amplification reaction) was analyzed.
  • the hairpin stem part is a SelPH-domain consisting of 12 bp bases, that is, the adapter having a self-amplifying nucleotide sequence has a hairpin stem length of 8 bp and 10 bp.
  • the adapter of the present invention is self-amplified in a single-stranded oligonucleotide.
  • the long single-stranded first oligonucleotide consisting of the nucleotide sequence of SEQ ID NO: 4 including the SelPH-domain has the characteristics that the polymerase can bind well and form and maintain the hairpin structure well even in the course of the extension reaction.
  • the long single-stranded first oligonucleotide of the present invention contains 4 adenines between the end of the hybridization stem and the beginning of the SelPH-domain, so that during the adapter ligation process, the 3'part of the SelPH-domain and the short single oligonucleotide are The 5'portion of the second oligonucleotide of the strand was not ligated (see Fig. 2).
  • the present invention can provide a method for producing an NGS library using the adapter for making a next generation sequencing (NGS) library having a hairpin structure capable of self-priming and replicating of the present invention.
  • NGS next generation sequencing
  • the NGS library preparation method of the present invention comprises a first step (phase I) of ligating the adapter for making an NGS library according to the present invention to genomic DNA to be analyzed and reacting for extension; And a second step (phase II) of ligating the universal adapter for NGS to the first extension reaction product and performing an extension reaction.
  • the method for preparing the NGS library of the present invention comprises the steps of: (1) fragmenting the genomic DNA to be analyzed; (2) ligating the adapter of the present invention to the end of the fragmented genomic DNA to be analyzed; (3) adding a polymerase to the reaction solution ligated with the adapter of the present invention in step (2) and extending reaction (4) ligation of a universal adapter for NGS to the first reaction product; (5) adding a polymerase to the reaction solution ligated with the universal adapter for NGS in step (4) and performing an extension reaction to obtain a secondary reaction product; And (6) purifying the secondary reaction product.
  • the first step refers to steps (1) to (3)
  • the second step refers to steps (4) to (6).
  • the DNA to be analyzed may include genomic DNA derived from all organisms to be analyzed, such as all mammals, plants, microorganisms, and fungi, including humans, and the DNA is obtained through a conventional method known in the art. And can be sectioned.
  • the adapter of the present invention is ligated to the end of the fragmented genomic DNA to be analyzed.
  • fragmented genomic DNA to be analyzed and the adapter of the present invention may be mixed at a mixing ratio of 1:15 to 1:25 to perform ligation.
  • the conjugation (ligation) and extension reaction of the adapter to the target DNA is very important.
  • conditions of the amount of DNA and adapter treatment of the present invention for optimization of ligation and extension reactions As a result, it was confirmed that it was appropriate to use the genomic DNA to be analyzed and the adapter of the present invention in a ratio of 1:15 to 1:25, and use in a ratio of 1:20 Most preferred.
  • the step of conjugating adenosine to the 3'end after end repair of the DNA (A-tail), that is, end repair and You can do the A-tail step first.
  • step (3) a polymerase is added to the reaction solution to which the adapter of the present invention is ligated in step (2), and an extension reaction is performed to obtain a first reaction product.
  • the polymerase may be any polymerase in the art used for amplification of nucleic acids, but is not limited thereto, but Q5 DNA polymerase, Phi29 DNA polymerase, or Bst 2.0 DNA polymerase may be used.
  • the extension reaction in step (3) performs only one reaction (1 cycle), and the primary reaction product is an amplification product having an extended reaction hairpin structure including the adapter nucleotide sequence of the present invention.
  • the adapter of the present invention when the adapter of the present invention is attached to the fragmented nucleic acid sample to be analyzed using a ligase enzyme, and the polymerase is added, the self-amplifying nucleotide sequence (SelPH-domain) included in the adapter of the present invention causes 3 From'the hybridized adapter stem (stem) portion (stem) is replicated toward 5'by extension reaction, and as a result, a single strand of the nucleic acid sample to be analyzed is separated, resulting in a long hairpin-shaped primary reaction product. (See phase I in Figure 1).
  • the second step proceeds, and (4) a step of ligating the universal adapter for NGS to the first reaction product is performed.
  • the DNA of the first reaction product is end repaired and adenosine is conjugated to the 3'end (A-tail), that is, End repair and A-tail steps can be performed first.
  • the universal adapter for NGS can be used as long as it is an adapter for NGS known in the art, and in one embodiment of the present invention, a NEXTFlex DNA barcode adapter from Bioo Scientific was used.
  • Any ligation enzyme known in the art may be used for the ligation.
  • a polymerase is added to the reaction solution to which the universal adapter for NGS is ligated in step (5), and an extension reaction is performed to obtain a second reaction product. To obtain.
  • the polymerase may be any polymerase in the art used for the amplification of nucleic acids, and the polymerase may be used, but is not limited thereto, but Q5 DNA polymerase, Phi29 DNA polymerase, or Bst 2.0 DNA polymerase may be used.
  • the extended reaction to obtain the secondary reaction product is performed only once (1 cycle).
  • a primer for attaching a flow cell eg, P7 primer
  • the secondary reaction product is a primary reaction product having a long hairpin structure. As this is replicated, it becomes a product in the form of a linear double DNA (duplex DNA).
  • the secondary reaction product was amplified while being duplicated into a double-form DNA having P5 and P7 at both ends.
  • the secondary reaction product amplified by the above method may be subjected to a purification step, and any method for purifying the amplified product may be used as long as it is a general method known in the art, but is not limited thereto, but gel filtration, a method using a column, or A method using an electromagnetic field or the like can be used.
  • the “extended reaction” refers to a reaction for amplifying a nucleic acid sample to be analyzed.
  • Various amplification reactions for the amplification of nucleic acid samples have been reported in the art, and polymerase chain reaction (PCR), reverse transcription-polymerase chain reaction (RT-PCR), ligase chain reaction, and recovery Repair chain reaction, transcription-mediated amplification (TMA), self-maintaining sequence replication, random priming and replicating polymerase chain reaction, nucleic acid sequence-based amplification, strand substitution amplification and ring-mediated thermostatic amplification method It may include, but is not limited thereto.
  • the present invention may provide a kit for preparing a DNA library, including an adapter for preparing a NGS (Next generation sequencing) library having a hairpin structure capable of self-amplification (self-priming and replicating) of the present invention.
  • NGS Next generation sequencing
  • the kit according to the present invention may optionally include a buffer, a DNA polymerase, and a reagent necessary to perform a target amplification PCR reaction, and may include various polynucleotide molecules, reverse transcriptase, various buffers and reagents.
  • the adapter for making a next generation sequencing (NGS) library devised in the present invention has a hairpin structure and is capable of self-priming and replicating, and the adapter (SelPH-adaptor) of the present invention is used in a nucleic acid sample to be analyzed. After attaching and performing one amplification, a known sequencing method can be performed to prepare a library very quickly and accurately.
  • NGS next generation sequencing
  • amplification of only a total of two times at a time i.e., amplification according to the extension reaction after attaching the adapter of the present invention (amplification of phase I) and extension reaction after attaching a general NGS adapter) Since only amplification according to (phase II amplification)) is required, it is possible to minimize jackpot errors caused by the existing several amplification processes or errors caused by biased amplification.
  • the length of the DNA fragment is not limited, and a pair of paired end products can be made without the self-ligation process of making circular DNA, so the workflow is simple.
  • oligonucleotides were purchased and used from IDT (Integrated DNA Technology), and the lyophilized oligonucleotides were diluted with 0.1M TE buffer and then reacted in a mixing block (MB102: Bioer) at a temperature of 50° C. for 1 hour. Post-ligation cleanup and post-amplification cleanup were performed using ProMega's ProNex Size-selective purification system. 5X Q5 reaction buffer, 5X High-fidelity DNA polymerase, Bst 2.0 DNA polymerase, 10X Isothermal amplification buffer, 10 mM dNTPs each, and the NEBNext Ultra II FS DNA library prep kit for Illumina used to prepare the yeast genome library. NEB (New england biolabs) product was used. In the 91bp and 285bp insert DNA experiments, Bio Scientific's NEXTflex Rapid DNA sequencing bundle was used.
  • oligonucleotides were diluted to a concentration of 100uM using 1M TE buffer and cultured. 5x Q5 reaction buffer 5 ⁇ l, 10mM dNTPs each 0.5 ⁇ l, Q5 DNA polymerase 0.25 ⁇ l, each oligonucleotide was diluted to 20 ⁇ M with distilled water and then added to 1 ⁇ l to make the total volume 25 ⁇ l. The temperature was gradually lowered to 98° C. for 10 seconds and 65° C., and the reaction was performed for 30 seconds, followed by 10 minutes at 72° C.
  • the single-stranded oligonucleotides constituting the 91bp insert DNA of Table 3 were each diluted to 20 ⁇ M using 1M TE buffer, and each oligonucleotide was adjusted with 1X PBS buffer so that the final concentration was 1 ⁇ M, so that the total volume was 100 ⁇ l. Thereafter, annealing was performed by gradually lowering the temperature from 95°C to 20°C using SimpliAmp Thermal Cycler (Thermo Fisher Scientific).
  • the attachment of the SelPH-adapter was 1uM 91bp insert DNA 18 ⁇ l, NEXTFlex End-Repair & Adenylation buffer mix 15 ⁇ l, 25uM SelPH-adapter 0.5 ⁇ l conditions, ligation was performed according to the manufacturer's protocol.
  • ProNex Chemistry reagent was added at three times the volume of the SelPH-adapter ligation sample, and carried out according to the manufacturer's experimental method, 40 ⁇ l of an elution buffer was added, and an elution time was given for 10 minutes.
  • ProNex Chemistry reagent was added at three times the volume of the SelPH-adapter ligation sample, and an experiment was performed according to the manufacturer, and 20 ⁇ l of the elution buffer was added to give an elution time of 10 minutes.
  • NEXTFlex End-Repair and Adenylation Buffer Mix 15 ⁇ l of NEXTFlex End-Repair and Adenylation Buffer Mix, 3 ⁇ l of NEXTFlex End-Repair, and Adenylation Enzyme Mix were added and performed according to the manufacturer's instructions.
  • NGS-adapter Secondary ligation
  • the NGS-adapter included in the NEXTFlex Rapid DNA Sequencing Bundle of Bioo Scientific was used, and 2.5 ⁇ l of 25 ⁇ M NGS-adapter was added to the sample after A-Tailing, followed by the manufacturer's instructions.
  • the ProNex Chemistry reagent was added in twice the volume of the sample after the NGS-adapter ligation was completed, and carried out according to the manufacturer's instructions, 40 ⁇ l of the elution buffer was added, and an elution time was given for 10 minutes.
  • ProNex Chemistry reagent was added in an amount of 1.3 times the volume of the sample after the second extension reaction was completed, and an experiment was performed according to the manufacturer, and 30 ⁇ l of an elution buffer was added and an elution time was given for 10 minutes.
  • the primers shown in Table 5 below were prepared to obtain a DNA fragment having a length of 285 bp targeting the 1041 position of the BRCA1 gene.
  • the annealing temperature during PCR was set to 54°C, 57°C, and 60°C, respectively, and the extension reaction temperature was set to 72°C. After repeating 35 times (denaturation 10 seconds, annealing 30 seconds, extension 30 seconds) , The final extension reaction was carried out at 72°C for 2 minutes.
  • the reaction was performed according to the manufacturer's instructions using 400 ng of 285 bp insert DNA, and the following experiments were performed in the same manner as the method using the 91 bp insert DNA.
  • Insert DNA 91bp and 285bp were both used, each of which was annealed in 1X PBS buffer at a concentration of 1 uM, and used without additional dilution. After all ligation, it was confirmed by PAGE after purification using a ProNex Size-selective purification system.
  • 91bp insert DNA 3.5 ⁇ l, 15uM SelPH-adapter 5 ⁇ l, 10X KAPA Frag buffer 5 ⁇ l, End-Repair and A-Tailing buffer 7 ⁇ l, ligation buffer 30 ⁇ l, DNA ligase 10 ⁇ l, and distilled water.
  • the total volume was made to be 110 ⁇ l.
  • Experimental conditions such as reaction time were performed according to the manufacturer's instructions, and the elution volume was set to 40 ⁇ l during purification.
  • Insert DNA of 91 bp and 285 bp and ligation reagent of NEXTFlex Rapid DNA Sequencing Bundle were used, and the experiment was performed according to the manufacturer's instructions with a difference in reaction time.
  • the ligation time was increased from 15 minutes to 60 minutes and 18 hours, respectively, and for 285 bp, it was increased to 60 minutes.
  • Purification was performed using the ProNex Size-selective purification system, and the volume ratio of the ProNex Chemistry reagent and the sample was the same as 3x during purification, the elution time was 10 minutes, and the elution volume was 40 ⁇ l.
  • SelPH-adapter ligation samples 8 ⁇ l, 5X Q5 reaction buffer 5 ⁇ l, 10 mM dNTPs 0.5 ⁇ l each, and Q5 DNA polymerase 0.25 ⁇ l were added, and two samples were each prepared using distilled water so that the total volume was 25 ⁇ l.
  • the annealing temperature was set to 78°C and 65°C, respectively, and the extension temperature was set to 72°C during PCR, once (denaturing 10 seconds, annealing 15 seconds, extension 30 seconds), and then 72°C. Finally, the reaction was extended for 5 minutes.
  • SelPH-adapter ligation sample 8 ⁇ l, 10X Isothermal amplification buffer 2 ⁇ l, 10 mM dNTPs 0.5 ⁇ l each, and Bst 2.0 DNA polymerase 0.5 ⁇ l were added, and the total volume was 20 ⁇ l using distilled water. After the reaction at 65° C. for 10 minutes, Bst 2.0 DNA polymerase was added, reacted at 65° C. for 10 minutes, inactivated at 80° C. for 20 minutes, and then the temperature was gradually lowered to 20° C.
  • Genomic DNA of about 12Mb yeast Saccharomyces cerevisiae (By4741) was used, and the concentration was 446.745ng/ ⁇ l. It was performed according to the manufacturer's instructions using the NEBNext Ultra II FS DNA library prep kit for Illumina (NEB).
  • ProNex Chemistry reagent was added at twice the volume of the SelPH-adapter ligation sample, and the experiment was conducted according to the manufacturer's instructions, and 30 ⁇ l of the elution buffer was added to give an elution time for 10 minutes.
  • the ProNex Chemistry reagent was added at twice the volume of the first extension sample and the reaction was carried out according to the manufacturer's instructions. At this time, 40 ⁇ l of an elution buffer was added and an elution time was given for 10 minutes.
  • the NEBNext Ultra II FS DNA Library Prep Kit for Illumina is an enzyme mixture in which fragmentation, end-repair, and A-Tail proceed together, and was performed using the NEBNext Ultra End-repair/dA-Tailing module (NEB). . After adding 6.5 ⁇ l of 10X End repair reaction buffer and 3 ⁇ l of End Prep Mix to 40 ⁇ l of the eluted sample, the total volume was adjusted with distilled water to make 65 ⁇ l, and the experiment was performed according to the manufacturer's instructions.
  • NGS adapter Secondary ligation
  • the NGS adapter As the NGS adapter, the one containing the NEXTFlex Rapid DNA Sequencing Bundle from Bioo Scientific was used, and 2.5 ⁇ l of the 25uM NGS adapter was added to the sample after A-Tailing, and the reaction was performed according to the manufacturer's instructions.
  • ProNex Chemistry reagent was added in twice the volume of the sample after the NGS adapter ligation was completed, and the reaction was carried out according to the manufacturer's instructions, 30 ⁇ l was added as an elution buffer, and an elution time was given for 10 minutes.
  • PCR primer 2 (acting as an Illumina P7 primer) was added according to the oligonucleotide sequence provided by Bioo Scientific, reacted at 65° C. for 10 minutes, and then Bst 2.0 DNA polymerase was added, followed by 5 at 65° C. It was allowed to react for a minute.
  • the ProNex Chemistry reagent was added in an amount of 1.3 times the volume of the sample after the second extension reaction was completed, and the reaction was carried out according to the manufacturer's instructions, and 30 ⁇ l was added as an elution buffer, and an elution time was given for 10 minutes.
  • the method of making an NGS library according to the present invention is largely composed of a Phase I step of attaching the SelPH-adaptor devised in the present invention and a Phase II of attaching an NGS adapter for sequencing.
  • genomic DNA is cut into small pieces in consideration of the read length to perform sequencing (step 1 in Fig. 1), and then End-repair (end repair) and A for attachment of SelPH-adaptor.
  • -tailing A-tailing
  • a SelPH-adaptor having a self-priming and replicating domain (SelPH domain) is attached to the DNA fragment finished to the A-tail (step 3 of FIG. 1).
  • the self-priming and replicating of the SelPH domain using DNA polymerase initiates an extension reaction from 3'to 5'past the hybridization stem.
  • the sense DNA (Target) and the antisense DNA (Target*) of the DNA fragment are separated to form a long hairpin stem shape (step 4 of FIG. 1).
  • a Phase II step is performed. End-repair (end repair) and A-tailing (A-tailing) for attaching the NGS adapter to the DNA having the shape of a long hairpin stem manufactured in the Phase I step are performed. (Step 5 of Fig. 1). Thereafter, the NGS adapter was attached, and the extension reaction was performed using a P7 primer and a DNA polymerase having a strand displacement function (step 7 in Fig. 1), and the DNA having a long hairpin stem shape was obtained by polymerase. As it replicates, it has an unfolded shape and forms a double DNA with P5 and P7 at both ends of the Gulgouk.
  • the present inventors designed a long single-stranded oligonucleotide containing a SelPH-domain for the production of SelPH-adaptor and a short single-stranded oligonucleotide constituting a hybridization stem required for ligation as shown in Table 6 below.
  • the short single strand was T-tailed at the 3'end to allow it to be combined with the A-tail by adapter ligation, and the 5'was not phosphorylated to prevent ligation with the 3'of the long single strand.
  • the long single-stranded SelPH-domain must have a structure in which DNA polymerase can bind well, and the hairpin structure is well formed and maintained at a temperature (65°C) that performs an extension reaction, so that self-priming and replicating is possible. It should be possible. Therefore, in order to prepare a self-priming and replicating adapter having such an optimal condition, the present inventors proposed a SelPH-domain having a hairpin stem length of 8 bp, 10 bp, and 12 bp, respectively, at the 3'end of a single-stranded oligonucleotide having 40 bases. Candidate sequence was added (see FIG. 2A).
  • the blue nucleotide sequence in Table 6 corresponds to the blue nucleotide sequence in FIG. 2A.
  • an artificial DNA having a size of 91bp as a small insert DNA After confirming the sequence of exon 21 of the EGFR gene in NCBI, 3'of an oligonucleotide having 90 bases from the first base to the 90th base Adenine was added to the end to complementaryly synthesize single-stranded DNA with a total length of 91 bases, and each of the single strands was annealed from 95°C to 20°C while gradually lowering to prepare a double-stranded 91bp artificial DNA ( See Fig. 3).
  • a DNA fragment having a size of 285 bp was prepared, targeting the 1041 position of the BRCA1 gene for preparation of insert DNA, which is relatively longer than 91 bp, and different temperatures (54° C., 57° C., and 60°C), and then PCR fragments were identified through a PAGE gel (see FIG. 4), and nested PCR was performed to obtain a single band of 285 bp. As a result, only a band of 285 bp was present. This was confirmed through PAGE gel (see Fig. 5), and the 285bp nucleotide sequence is shown in SEQ ID NO: 8.
  • the NGS manufacturing process of the present invention proceeds to Phase I in which the coupling and extension reaction of the adapter of the present invention is performed and Phase II in which the coupling and extension reaction of the NGS adapter is performed.
  • Phase I step the SelPH-adaptor of the present invention and the DNA fragment must be ligated to allow the self-priming and replicating of the SelPH domain to proceed with an extension reaction.
  • ligation (conjugation) with the NGS adapter is possible in Phase II only when the extension reaction proceeds in Phase I. Accordingly, the present inventors first confirmed the optimal conditions for ligation and extension reactions with the SelPH-adaptor of the present invention using 91bp and 285bp insert DNA.
  • NEXTFlex Rapid DNA Sequencing Bundle Bioo Scientific
  • KAPA HyperPlus kit KAPA Biosystems
  • NEBNext Ultra II FS DNA library Prep Kit NEBNext Ultra II FS DNA library Prep Kit
  • Blunt/TA Ligase Master Mix NEB.
  • the faint band shown at the bottom of FIG. 6A is SelPH-adaptor, and the part forming the double strand is 24 bp in total, but it has a hairpin structure and partially forms a single strand.
  • the band size of the ligated SelPH-adaptor was calculated as 28bp.
  • the band located at 91 bp at the bottom of the dense band in the center is the insert DNA to which none of the SelPH-adaptor is ligated at both ends, and the band located at the center is the adapter ligated to only one side, resulting in a size of 119 bp. It can be seen that it was found that the adapter ligated at both ends was a band having a size of 147bp. In addition, it was confirmed that among the four products, when using artificial insert DNA, a product of Bioo Scientific is used, and when fragmentation is required, a product of NEB is recommended.
  • the results of the extension reaction were analyzed using Q5 DNA polymerase, Phi29 DNA polymerase with strand displacement function, and Bst 2.0 DNA polymerase, respectively. I did.
  • Q5 DNA polymerase requires a denatured process at 98°C. If the hairpin structure is not properly formed in the process of raising and lowering the melting temperature of the hairpin stem of the SelPH domain to a high temperature of 78°C, self-priming and replicating may not be possible. Therefore, in the experiment using Q5 DNA polymerase, after the denaturation process, the temperature of the hairpin stem was lowered very slowly to the melting temperature of 78°C and the annealing temperature of 65°C so that the hairpin structure could be well formed.
  • NGS analysis was performed by performing Phase I and Phase II processes for 91bp and 285bp insert DNA under optimal conditions for ligation and extension reactions.
  • the SelPH-adaptor of the present invention and the insert DNA were mixed at a ratio of 1:20 (molar concentration ratio), and ligation was performed for 15 minutes using the NEXTFlex Rapid DNA Sequencing Bundle (Bioo Scientific) product. Performed. After that, an extension reaction was performed using Bst 2.0 DNA polymerase to complete the Phase I step. After End-repair and A-Tail to the sample performed up to the Phase I step, a NEXTFlex DNA barcode adapter, an NGS adapter manufactured by Bioo Scientific, was ligated.
  • the NGS adapter is a Y-shaped adapter in which a single strand of 58 nucleotides T-tailed with P5, a single stranded DNA of 63 nucleotides including P7' and index is hybridized to a length of 12 bp.
  • 91bp of insert DNA four bands of 135bp, 123bp, 103bp, and 91bp can appear at the time of the first extension. If the NGS adapter is approximately 60bp in size, the results are in the order of 195bp, 183bp, 163bp, and 152bp. And unligated insert DNA may also exist.
  • the two thick bands show the products of SelPH-adaptor after the attachment of the SelPH-adaptor, and the products of the extended reaction phase I are ligated with the NGS adapter, and then P7 primer and Bst 2.0 As a product from the extension reaction by DNA polymerase, the size also increased by about doubling to 389 bp and 365 bp.
  • the present inventors found that the sequencing analysis using the SelPH-adaptor devised in the present invention can work well, and that the NGS library can be produced using this.
  • a yeast genome having a size of about 12 Mb a yeast genome having a size of about 12 Mb was used, and the insert DNA size of the yeast genome was 100. It was set to ⁇ 150bp.
  • reaction products were confirmed by performing the reactions of Phase I and II under the same conditions as in ⁇ 1-5> of Example 1, targeting the insert DNA of the yeast genome prepared in ⁇ 2-1>.
  • the inventors of the present invention suggested that the SelPH-adaptor devised in the present invention performs one extension reaction with the function of self-priming and replicating of the SelPH domain, so that the biased amplification by PCR that is required several times is performed. It can be reduced, and errors caused by not using high fidelity DNA polymerase and errors caused by the error rate of DNA polymerase itself also resulted in a duplicate product in the analysis using the SelPH-adaptor of the present invention. Therefore, error correction is possible, and there are no errors that may occur due to DNA damage, and unlike the conventional circular DNA-based method, there is no limit on the length of the DNA fragment. It was found that it is possible to detect mutant sequences present at a low frequency more accurately.

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biochemistry (AREA)
  • Molecular Biology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Microbiology (AREA)
  • Biomedical Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Plant Pathology (AREA)
  • Immunology (AREA)
  • Analytical Chemistry (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Medicinal Chemistry (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

본 발명은 자가 증폭이 가능한 헤어핀 구조의 NGS 라이브러리 제작용 어댑터 및 이를 이용한 NGS 라이브러리 제조방법에 관한 것으로, 구체적으로 본 발명은 서열번호 4의 염기서열로 이루어지고 헤어핀 구조를 갖는 긴 단일 가닥의 제1 올리고뉴클레오티드; 및 서열번호 5의 염기서열로 이루어진 짧은 단일 가닥의 제2 올리고뉴클레오티드;를 포함하는, 자가 증폭(self-priming and replicating)이 가능한 헤어핀 구조의 NGS(Next generation sequencing) 라이브러리 제작용 어댑터, 상기 어댑터를 이용한 NGS 라이브러리 제작방법 및 상기 어댑터를 포함하는 NGS 라이브러리 제조용 키트에 관한 것이다.

Description

자가 증폭이 가능한 헤어핀 구조의 NGS 라이브러리 제작용 어댑터 및 이를 이용한 NGS 라이브러리 제조방법
본 발명은 자가 증폭이 가능한 헤어핀 구조의 NGS 라이브러리 제작용 어댑터 및 이를 이용한 NGS 라이브러리 제조방법에 관한 것이다.
차세대 염기서열 분석법(NGS:Next-generation sequencing)은 대규모 병렬형 염기서열 분석 기술로 유전체의 염기서열을 고속으로 분석하는 기술을 통칭한다. 이러한 NGS 기술은 암의 치료 및 연구부터 산전진단, 약물내성, 전염병 및 법의학 등 여러 분야에서 응용되고 있다.
한편, NGS의 기술적 진보에도 불구하고 분석 시 발생하는 오류율은 0.1~1%로 상당히 높은 수치이다. 오류의 원인 중 큰 부분을 차지하는 것은 시료 준비 과정인데, 그 중에서도 중합효소연쇄반응(Polymerase chain reaction: PCR)이다. DNA Polymerase의 본질적인 돌연변이 오류율과 주형 DNA의 어느 특정부분만 편향적으로 증폭하는 경향에 의해 올바른 분석이 되지 않기도 한다. 또한, PCR의 첫번째 증폭 단계에서 초기 주형 DNA의 증폭 오류로 인한 Jackpot 에러 발생 시에는 오류 교정 자체를 할 수 없다. 이외에도 PCR misincorporation, Chimeric PCR products, Template switching 및 Hairpin 구조 형성의 결과로도 시료 준비 과정에서 상당한 오류가 발생할 수 있는 문제점이 있다.
또한 이질성을 보이는 시료의 경우, 예컨대 종양의 이질성은 각 종양 세포마다 같은 유전자 내에 다른 돌연변이를 가지고 있을 수 있어, 실제 NGS로 분석을 했을 때 관찰되는 돌연변이가 NGS 자체의 오류에 의한 것인지 실제 돌연변이에 의한 것인지 구별하기 어려운 문제가 있다. 뿐만 아니라 다수의 체성 돌연변이의 경우는 그 양이 적거나 극히 낮은 빈도로 나타내는 특성을 갖기 때문에 이들을 완벽하게 식별하는 것이 어렵다.
따라서 이러한 문제점을 해결하기 위한 기술들이 개발되고 있는데, 최근 몇 년 동안 바코드 기반 혹은 UMI(Unique molecular identifier) 기반의 오류 수정(error correction) 전략이 개발되었는데, 이 전략은 DNA 조각에 길이가 8~14bp 정도의 임의의 염기서열로 이루어진 바코드를 부착하는 방법으로 어댑터를 통해 직접 부착하거나 프라이머를 통해 PCR 하여 DNA 조각에 적용시킨 후, 개별 파편들을 추적하여 시퀀싱하는 방법이다. 그러나 이러한 방법은 시료 당 요구되는 시퀀싱 양을 상당히 증가시키며 증폭과정을 필요로 하기 때문에 편향적인 증폭이나 잡음 발생의 문제가 여전히 발생할 수 있다.
다른 방법으로는 Duplex-Sequencing(DupSeq) 방법이 있는데, 원본 DNA 조각에서 이중 가닥 각각의 말단에 서로 다른 UMI를 부착하여 독립적으로 시퀀싱하는 방법으로 오류를 줄이는 기술이다. 두 가닥이 서로 상보적이기 때문에 진정한 변이는 Read Family 내에서 두 가닥의 갈은 위치에서 발견되며, 만일 둘 중 한가닥에서는 검출되지만 다른 가닥에서는 검출되지 않는다면 이것은 손상된 DNA 이거나 PCR 또는 시퀀싱 오류라고 판단할 수 있다. 그러나 이 방법은 보통의 NGS 방법과 비교하여 샘플 당 필요한 리드(read)수가 100배 정도 증가하여 많은 비용이 들고 바코드의 존재로 PCR 증폭편향 및 워크플로워(workflow)의 복잡성이 증가한다는 문제점이 있다.
또 다른 방법으로는 Circle-Sequencing(Circle-Seq) 방법이 있는데, RCA(rolling circle amplification)처럼 매우 짧은 단일 가닥 DNA를 원형 DNA화하여 원형의 상태로 증폭하여 원본조각과 동일한 여러 개의 증폭물을 선형(linear)으로 만들어 내는 방법으로, 이 방법은 복제율을 균일하게 유지할 수 있어 비용 측면에서 효율이 좋다. 그러나 RCA는 길이의 제한이 있고 심각한 편향적인 증폭을 유발하며 희귀변이(rare variants) 검출에는 한계가 있다.
최근에는 O2n-Seq 방법이 개발되어 사용되고 있는데, O2n-Seq 방법은 바코드와 RCA 방법의 장점을 합쳐 보완된 기술로서, O2n-Seq 의 라이브러리는 하나의 원본 조각에 copies가 한 쌍의 paired end 형태로 존재하여 하나의 리드 패밀리(read family)를 형성하므로 시퀀싱 에러를 줄이는 기술이다. 그러나 O2n-Seq 방법은 circular DNA를 만드는 효율이 낮고 circular DNA를 만들기 위해 분석하고자 하는 DNA 조각의 길이에 제한이 있어 긴 단편에는 적용하기 어려운 문제점이 있을 뿐만 아니라 nick 부위는 불완전한 절단의 결과로 인공산물을 생성할 수 있는 문제점이 있으며 단일가닥 DNA의 생화학적인 손상을 만들 수 있기 때문에 end-repair 및 A-tail 과정에서 폴리머라제의 수행효율이 떨어지게 되고 이는 어댑터가 제대로 부착하지 못하는 요인으로 작용하여 라이브러리 구축의 문제로도 이어질 수 있다. 또한 우라실(uracil) 염기를 제거할 때 사용되는 user enzyme의 uracil-DNA glycoslase(UDG)는 염기를 방출시키는 역할을 하는데 이때 증폭에 반하는 abasic 부위가 생성될 수 있는 등의 문제점이 있다.
그러므로 이러한 차세대염기서열분석 방법에서 발생할 수 있는 문제점을 개선 및 해결할 수 있는 새로운 분석방법의 개발이 필요하다.
이에 본 발명자들은 차세대염기서열분석에서 DNA 증폭과정에서 발생하는 오류를 최소화할 수 있는 방법을 연구한 결과, 헤어핀 구조를 가지며 자가 증폭, 즉 셀프-프라이밍과 리플리케이팅(self-priming and replicating)이 가능한 어댑터(SelPH:Self-priming and replicating hairpin adaptor)를 제조하였고, 원본 핵산 시료에 상기 본 발명의 어댑터(SelPH-adaptor)를 부착하여 1번 증폭 후 염기서열분석법으로 라이브러리 제작이 가능함을 확인하였으며, 이때 원본 핵산 시료를 구성하던 단일 가닥들 각각은 최종적으로 이중 (Duplicate)의 형태의 DNA로 만들어진다는 것을 확인하였다. 또한 본 발명의 자가 증폭이 가능한 어댑터를 사용할 경우, 1번씩 총 2회만의 증폭만 진행하면 되기에 기존 수차례의 증폭과정으로 야기되는 문제점인 jackpot 에러나 편향적인 증폭에 따른 오류를 최소화할 수 있고, DNA 조각의 길이 제한이 없으며 원형 DNA를 만드는 셀프-라이게이션 과정 없이도 한 쌍의 Paired end를 만들 수 있어 워크플로우(workflow)가 단순하고 효율적일 뿐만 아니라 Nick 및 user enzyme의 사용이 없어 핵산시료의 손상으로 인해 발생할 수 있는 오류 및 인공산물을 염려할 필요가 없는 바, 기존 방법의 라이브러리 제작보다 오류율을 줄일 수 있고, 효율을 높일 수 있으며 낮은 빈도로 존재하는 돌연변이 서열을 보다 정확하게 검출할 수 있음을 확인함으로써 본 발명을 완성하였다.
따라서 본 발명의 목적은 자가 증폭(self-priming and replicating)이 가능한 헤어핀 구조의 NGS(Next generation sequencing) 라이브러리 제작용 어댑터를 제공하는 것이다.
본 발명의 다른 목적은 본 발명의 자가 증폭(self-priming and replicating)이 가능한 헤어핀 구조의 NGS(Next generation sequencing) 라이브러리 제작용 어댑터를 이용한 NGS(Next generation sequencing) 라이브러리 제작방법을 제공하는 것이다.
본 발명의 또 다른 목적은 자가 증폭(self-priming and replicating)이 가능한 헤어핀 구조의 NGS(Next generation sequencing) 라이브러리 제작용 어댑터를 포함하는 NGS(Next generation sequencing) 라이브러리 제조용 키트를 제공하는 것이다.
그러므로 본 발명은 서열번호 4의 염기서열로 이루어지고 헤어핀 구조를 갖는 긴 단일 가닥의 제1 올리고뉴클레오티드; 및 서열번호 5의 염기서열로 이루어진 짧은 단일 가닥의 제2 올리고뉴클레오티드;를 포함하는, 자가 증폭(self-priming and replicating)이 가능한 헤어핀 구조의 NGS(Next generation sequencing) 라이브러리 제작용 어댑터를 제공한다.
본 발명의 일실시예에 있어서, 상기 제1 올리고뉴클레오티드는 중합효소가 결합할 수 있고, 연장반응(extension) 중에도 헤어핀 구조가 유지될 수 있다.
본 발명의 일실시예에 있어서, 상기 제2 올리고뉴클레오티드는 상기 제1 올리고뉴클레오티드의 3’말단과 라이게이션 되지 않도록 서열번호 5로 이루어진 염기서열의 5’말단이 인산화 되어 있지 않은 것일 수 있다.
또한 본 발명은, (1) 분석 대상 게놈 DNA를 절편화(fragmentation)화는 단계; (2) 절편화된 분석 대상 게놈 DNA의 말단에 본 발명의 어댑터를 라이게이션하는 단계; (3) 상기 (2) 단계에서 본 발명의 어댑터를 라이게이션 한 반응액에 중합효소를 첨가하고 연장 반응을 수행하여 1차 반응산물을 수득하는 단계; (4) 상기 1차 반응산물에 NGS용 유니버셜 어댑터를 라이게이션하는 단계; (5) 상기 (4) 단계에서 NGS용 유니버셜 어댑터를 라이게이션 한 반응액에 중합효소를 첨가하고 연장 반응을 수행하여 2차 반응산물을 수득하는 단계; 및 (6) 상기 2차 반응산물을 정제하는 단계를 포함하는, NGS(Next generation sequencing) 라이브러리 제작방법을 제공한다.
본 발명의 일실시예에 있어서, 상기 (2) 단계에서 절편화된 분석 대상 게놈 DNA 및 제1항의 어댑터는 상기 분석 대상 게놈 DNA 대 제1항의 어댑터를 1:15~1:25의 몰비로 혼합하여 사용하는 것일 수 있다.
본 발명의 일실시예에 있어서, 상기 (2) 단계에서 제1항의 어댑터를 라이게이션 하기 전 및 상기 (4) 단계에서 NGS용 유니버셜 어댑터를 라이게이션 하기 전에, DNA의 말단 수선(end repair) 후 3’말단에 아데노신을 접합(A-tail)하는 단계를 추가로 더 포함하는 것일 수 있다.
본 발명의 일실시예에 있어서, 상기 (4) 단계의 1차 반응산물은 제1항의 어댑터 염기서열을 포함하여 연장 반응된 헤어핀 구조를 갖는 증폭산물일 수 있다.
본 발명의 일실시예에 있어서, 상기 (5) 단계에서 상기 2차 반응산물은 연장 반응으로 증폭되어 선형의 이중 DNA(duplex DNA) 형태일 수 있다.
본 발명의 일실시예에 있어서, 상기 (3) 단계의 연장 반응 및 (5) 단계의 연장 반응은 각각 1회씩 수행하는 것일 수 있다.
또한 본 발명은 본 발명에 따른 자가 증폭(self-priming and replicating)이 가능한 헤어핀 구조의 NGS(Next generation sequencing) 라이브러리 제작용 어댑터를 포함하는, DNA 라이브러리 제조용 키트를 제공한다.
본 발명의 자가 증폭이 가능한 헤어핀 구조를 갖는 NGS 라이브러리 제조용 어댑터는 증폭반응의 횟수를 최소화할 수 있어 기존 수차례의 증폭과정으로 야기되는 jackpot 에러나 편향적인 증폭에 따른 오류를 최소화할 수 있고, DNA 조각의 길이 제한이 없으며 워크플로우(workflow)가 단순하고 효율적일 뿐만 아니라, 별도의 Nick 및 user enzyme의 사용이 없어 핵산시료의 손상으로 인해 발생할 수 있는 오류 및 인공산물을 염려할 필요가 없다. 따라서 본 발명의 자가 증폭이 가능한 어댑터를 사용하여 NGS용 라이브러리를 제조할 경우, 기존 방법의 라이브러리 제작보다 오류율을 줄이면서 효율을 높일 수 있고, 낮은 빈도로 존재하는 돌연변이 서열도 보다 정확하게 검출할 수 있다.
도 1은 본 발명에 따른 셀프 프라이밍 및 리플리케이팅 헤어핀 어댑터를 이용한 차세대염기서열분석 방법인 셀프 프라이밍 및 리플리케이팅 헤어핀 시퀀싱(SelPH-seq) 분석과정을 모식도로 나타낸 것이다.
도 2는 본 발명에 따른 셀프 프라이밍 및 리플리케이팅 헤어핀 어댑터(2a)를 나타낸 것이고, 본 발명의 셀프 프라이밍 및 리플리케이팅 헤어핀 어댑터를 이용한 셀프 프라이밍 및 리플리케이팅을 확인한 결과를 나타낸 것이다(2b).
도 3은 본 발명의 일실시예에서 EGFR 유전자의 엑손 21번째로부터 추출한 91bp 크기를 갖는 인공 인서트 DNA를 PAGE로 확인한 결과를 나타낸 것이다.
도 4는 본 발명의 일실시예에서 BRCA1 유전자의 1041 position을 타겟으로 285bp 크기를 는 인공 인서트 DNA를 수득하기 위해 어닐링 온도 차이에 따른 PCR 산물을 PAGE로 확인한 결과로서, 레인1: 54℃, 레인2: 57℃, 레인3은 60℃에서 수행한 PCR 산물을 나타낸 것이다.
도 5는 285bp 인서트 DNA 제작 과정 및 PAGE 결과를 나타낸 것으로, 5a는 네스티드 PCR 산물(PAGE)이고, 5b는 네스티드 PCR 산물에 대한 1.5% 아가로스 겔 전기영동 사진이며, 5c는 겔 추출 산물에 대한 결과를 나타낸 것이다.
도 6은 91bp 인서트 DNA를 대상으로 다양한 라이게이션 시약들을 이용한 라이게이션 산물에 대한 PAGE 결과로서, 6a에서 레인1: NEXTFlex Rapid DNA Sequencing Bundle(Bioo Scientific), 레인2: KAPA HyperPlus 키트(KAPA Biosystems), 레인3: Illumina용 NEBNext Ultra II FS DNA library Prep Kit(NEB), 레인4: 블런트/TA Ligase Master Mix(NEB), M2: 50bp DNA ladder를 나타낸 것이고, 6b는 SelPH-adaptor 라이게이션 산물 생성에 대한 모식도를 나타낸 것이다.
도 7은 91bp 및 285bp의 인서트 DNA를 대상으로 라이게이션 시간에 따른 라이게이션 산물의 결과를 PAGE로 나타낸 것으로, 7a의 레인1: 60분간 라이게이션 한 91bp 인서트 DNA, 레인2: 18시간 라이게이션 한 91bp 인서트 DNA이며, 7b의 레인1: 285bp의 인서트 DNA, 레인2: 1시간 라이게이션 한 285bp의 인서트 DNA를 나타낸 것이다.
도 8은 DNA 폴리머라제에 따른 91bp 인서트 DNA의 연장반응 산물을 나타낸 것으로, 8a에서 레인1: SelPH-어댑터 라이게이션 산물, 레인2: Q5 DNA 폴리머라제 어닐링 온도 78℃에서 수행한 산물, 레인3: Q5 DNA 폴리머라제 어닐링 온도 65℃에서 수행한 산물, 레인4: Phi29 DNA 폴리머라제, 레인5: Bst 2.0 DNA 폴리머라제, M2: 50bp DNA ladder를 나타낸 것이고, 8b는 1차 연장반응의 결과를 모식도로 나타낸 것이다.
도 9는 91bp 인서트 DNA를 대상으로 본 발명의 SelPH-어댑터를 이용하여 셀프 프라이밍 및 리플리케이팅 헤어핀 시퀀싱(SelPH-seq)의 전과정을 수행한 산물을 나타낸 것으로, 레인1: SelPH-어댑터와 91bp 인서트 DNA, 레인2: SelPH-어댑터 라이게이션 산물, 레인3: 1차 연장반응산물, 레인4: NGS 어댑터 라이게이션 산물, 레인5: 2차 연장반응산물을 나타낸 것이다.
도 10은 285bp 인서트 DNA를 대상으로 본 발명의 SelPH-어댑터를 이용하여 셀프 프라이밍 및 리플리케이팅 헤어핀 시퀀싱(SelPH-seq)의 전과정을 수행한 산물을 나타낸 것으로, 레인1: 285bp 인서트 DNA, 레인2: SelPH-어댑터 라이게이션 산물, 레인3: 1차 연장반응산물, 레인4: NGS 어댑터 라이게이션 산물, 레인5: 2차 연장반응산물을 나타낸 것이다.
도 11은 본 발명에 따른 SelPH-어댑터를 이용하여 셀프 프라이밍 및 리플리케이팅 헤어핀 시퀀싱(SelPH-seq) 과정에서 이차 라이게이션 반응 과정 및 생성 산물에 대한 모식도를 나타낸 것이다.
도 12는 효모 게놈(yeast genome)을 대상으로 본 발명의 SelPH-어댑터를 이용하여 셀프 프라이밍 및 리플리케이팅 헤어핀 시퀀싱(SelPH-seq) 분석 산물에 대한 PAGE 결과를 나타낸 것이다.
본 발명은 차세대염기서열분석(NGS; Next generation sequencing) 과정에서 증폭과정에 의해 발생하는 오류를 최소화할 수 있고 최소한의 증폭만으로도 정확도가 높은 차세대염기서열 분석용 라이브러리를 제조할 수 있는 새로운 어댑터를 개발한 점에 특징이 있다.
차세대염기서열분석 기술은 기존의 방법과 달리 대용량의 데이터를 빠른 시간에 생산할 수 있어, 유전체 해독에 필요한 시간과 비용을 획기적으로 절감시킨 기술이다. 차세대염기서열분석 기술은 시간이 지남에 따라 시퀀싱 플랫폼의 기술이 발전하고 분석 가격은 저렴해 지고 있으며, 유전질환, 희귀질환, 암 등을 차세대염기서열분석 기술을 이용하여 질병의 원인 유전자를 찾는데 성공하고 있다. 현재 가장 많이 이용되고 있는 일루미나(illumina)사의 차세대염기서열분석법은 검체로부터 DNA를 추출한 후, 기계적으로 절편화(fragmentation)한 후, 특정 크기를 갖는 라이브러리를 제작하여 시퀀싱에 사용한다. 대용량 시퀀싱 장비를 사용하여 한 개의 염기단위로 4가지 종류의 상보적 뉴클레오티드 결합 및 분리 반응을 반복하면서 최기 시퀀싱 데이터를 생산하게 되고, 이후 초기 데이터의 가공(trimming), 매핑(mapping), 유전체 변이의 동정 및 변이 정보의 해석 등 생물정보학을 이용한 분석 단계를 수행하여 이루어진다.
이러한 차세대염기서열분석법은 질병 및 다양한 생물학적 형태에 영향을 미치거나 가능성이 높은 유전체 변이를 발굴하여 새로운 질병 치료제의 개발을 통한 새로운 부가가치의 창출에도 기여하고 있다.
한편, 앞서 종래기술에서도 언급한 바와 같이, 차세대염기서열분석법에서 라이브러리의 제작은 중합효소연쇄반응(Polymerase chain reaction: PCR)을 통한 라이브러리의 시료 준비 과정이 매우 중요한데, 이 과정에서 현재 개발된 기술들은 높은 오류율을 보이고 있다는 문제점이 있다.
또한 일반적인 라이브러리의 제작은 시료의 무작위적인 DNA 또는 cDNA 조각에서 5’에서 3’방향의 어댑터를 접합(ligation)하여 서열 분석에 필요한 라이브러리를 준비하는데, 이 과정에서 편향적인 증폭이나 잡음 발생의 문제가 있고, 많은 비용이 들 뿐만 아니라 바코드 사용 시, 바코드의 존재로 PCR 증폭편향 및 워크플로워(workflow)의 복잡성이 증가하는 문제점이 있고, 희귀변이의 검출이 어렵다는 등 많은 문제점이 존재한다.
이에 본 발명에서는 증폭반응에 따른 오류를 최소화할 수 있고, 최소한의 증폭반응만으로도 정확도가 높으며, DNA 절편(조각)의 길이 제한이 없고, DNA 손상 염려도 없으며 낮은 빈도의 돌연변이 서열도 정확하게 검출할 수 있는 NGS 라이브러리를 제조용 어댑터를 개발하였다.
따라서 본 발명은, 서열번호 4의 염기서열로 이루어지고 헤어핀 구조를 갖는 긴 단일 가닥의 제1 올리고뉴클레오티드; 및 서열번호 5의 염기서열로 이루어진 짧은 단일 가닥의 제2 올리고뉴클레오티드;를 포함하는, 자가 증폭(self-priming and replicating)이 가능한 헤어핀 구조의 NGS(Next generation sequencing) 라이브러리 제작용 어댑터를 제공한다는 점에 특징이 있다.
상기 본 발명의 어댑터는 긴 단일 가닥의 제1 올리고뉴클레오티드 및 짧은 단일 가닥의 제2 올리고뉴클레오티드를 포함하고 있으며, 여기서 상기 제1 올리고뉴클레오티드는 중합효소가 결합할 수 있고, 연장반응(extension) 중에도 헤어핀 구조가 유지될 수 있는 특징이 있는데, 이는 상기 제1 올리고뉴클레오티드가 SelPH-도메인(self-priming and replicating hairpin-domain), 즉 자가 증폭 염기서열을 포함하고 있기 때문이다. 상기 본 발명에 따른 SelPH-도메인에 해당하는 염기서열은 서열번호 4의 염기서열에서 17번째 염기서열부터 28번째의 염기서열(GCGA CGAC ATCT) 및 33번째 염기서열부터 44번째의 염기서열(AGAT GTCG TCGC)에 해당한다. 상기 SelPH-도메인의 염기서열은 서열번호 4의 17번째 염기서열부터 28번째의 염기서열과 33번째 염기부터 44번째의 염기서열이 서로 상보적인 염기서열로 이루어져 있다.
또한 상기 제1 올리고뉴클레오티드의 5’말단은 인산화되어 있다.
상기 제2 올리고뉴클레오티드는 상기 제1 올리고뉴클레오티드의 3’말단과 라이게이션 되지 않도록 5’말단이 인산화 되어 있지 않으며, 구체적으로 서열번호 5의 염기서열로 이루어져 있다.
본 발명에 따른 상기 NGS 라이브러리 제작용 어댑터는 자가 증폭, 즉, 셀프-프라이밍 및 리플리케이팅(self-priming and replicating)이 가능하며 헤어핀 구조를 갖는 특성이 있는데, 여기서 상기 자가 증폭(self-priming and replicating)이란, 중합효소가 상기 본 발명의 어댑터 염기서열에 결합하면, 중합효소에 의해 상기 어댑터의 염기서열이 증폭되어지는 것을 의미한다. 즉, 본 발명의 NGS 라이브러리 제작용 어댑터는 상보적인 염기서열로 헤어핀 구조를 이루고 있으며, 상기 중합효소가 어댑터에 결합 후 상보적 염기서열에 해당하는 부위부터 증폭이 시작되어 접합되어있는 DNA까지 증폭된다. 일반적인 방법으로는 중합효소연쇄반응(Polymerase chanin reaction; PCR)의 어닐링(Annealing) 단계에서 특정 염기서열을 갖는 프라이머의 조건 하에 프라이머가 주형가닥 DNA에 먼저 결합하여야만 중합효소의 연장반응이 진행될 수 있는데, 본 발명의 어댑터에 의한 셀프-프라이밍 및 리플리케이팅은 상보적 염기서열을 갖는 헤어핀 구조로 인해 별도의 프라이머 및 주형가닥 DNA와 프라이머 간의 결합 과정 없이도 중합효소에 의한 연장반응이 가능하다는 특징이 있다. 즉, 본 발명의 어댑터가 가지고 있는 헤어핀 구조 자체가 프라이머 역할을 수행할 수 있다.
본 발명의 일실시예에서는, 본 발명의 어댑터에 대한 자가 증폭능을 확인하기 위해, Q5 DNA 폴리머라제를 이용하여 어댑터의 자가 증폭능 여부 및 최적의 조건을 확인하기 위한 분석하였는데, 이를 위해 어댑터를 구성하는 2개의 올리고뉴클레오티드 중, 긴 단일 가닥의 올리고뉴클레오티드의 길이를 각기 달리하여 제작한 후(표 6 참조), 연장 반응(증폭 반응)에 따른 자가 증폭 정도를 분석하였다.
그 결과, 긴 단일 가닥의 올리고뉴클레오티드에서 헤어핀 스템(hairpin stem) 부분이 12bp의 염기로 구성된 SelPH-도메인(self priming hairpin-domain), 즉 자가 증폭 염기서열을 갖는 어댑터가 헤어핀 스템 길이가 8bp 및 10bp를 갖는 어댑터에 비해 더 안정성이 높고 자가 증폭이 우수한 것을 확인할 수 있었고, 이를 통해 본 발명의 어댑터는 단일 가닥의 올리고뉴클레오티드에서 자가 증폭이 된다는 것으로 확인하였다.
따라서 SelPH-도메인을 포함하는 서열번호 4의 염기서열로 이루어진 긴 단일 가닥의 제1 올리고뉴클레오티드는 중합효소가 잘 결합할 수 있고 연장 반응 과정에도 헤어핀 구조를 잘 형성 및 유지할 수 있는 특징을 갖는다.
또한 본 발명의 상기 긴 단일 가닥의 제1 올리고뉴클레오티드는 hybridization stem 끝부분과 SelPH-도메인 시작부분 사이에 아데닌 4개를 포함하고 있도록 하여 어댑터 라이게이션 과정 중, SelPH-도메인의 3’부분과 짧은 단일 가닥의 제2 올리고뉴클레오티드의 5’부분이 라이게이션 되지 않도록 하였다(도 2 참조).
나아가 본 발명은 본 발명의 자가 증폭(self-priming and replicating)이 가능한 헤어핀 구조의 NGS(Next generation sequencing) 라이브러리 제작용 어댑터를 이용한 NGS 라이브러리 제작방법을 제공할 수 있다.
상기 본 발명의 NGS 라이브러리 제작방법은, 크게 본 발명에 따른 NGS라이브러리 제작용 어댑터를 분석 대상 게놈 DNA에 라이게이션하고 연장 반응시키는 제1 단계(phase I); 및 제1 연장 반응 산물에 NGS용 유니버셜 어댑터를 라이게이션하고 연장 반응시키는 제2 단계(phase II)를 통해 수행된다.
바람직하게 상기 본 발명의 NGS 라이브러리 제작방법은, (1) 분석 대상 게놈 DNA를 절편화(fragmentation)화는 단계; (2) 절편화된 분석 대상 게놈 DNA의 말단에 본 발명의 어댑터를 라이게이션하는 단계;(3) 상기 (2) 단계에서 본 발명의 어댑터를 라이게이션 한 반응액에 중합효소를 첨가하고 연장 반응을 수행하여 1차 반응산물을 수득하는 단계;(4) 상기 1차 반응산물에 NGS용 유니버셜 어댑터를 라이게이션하는 단계; (5) 상기 (4) 단계에서 NGS용 유니버셜 어댑터를 라이게이션 한 반응액에 중합효소를 첨가하고 연장 반응을 수행하여 2차 반응산물을 수득하는 단계; 및 (6) 상기 2차 반응산물을 정제하는 단계를 포함한다.
여기서 상기 제1 단계는 상기 (1) 내지 (3) 단계까지를 의미하며, 제2 단계는 상기 (4) 내지 (6) 단계를 의미한다.
각 단계별 과정을 상세히 설명하면 다음과 같다.
먼저, (1) 분석 대상 게놈 DNA를 절편화(fragmentation)한다.
여기서 상기 분석 대상의 DNA는 인간을 포함하는 모든 포유동물, 식물, 미생물 및 진균 등 분석하고자 하는 모든 생물 유래의 게놈 DNA를 포함할 수 있으며, 상기 DNA는 당업계에 공지된 통상적인 방법을 통해 수득 및 절편화할 수 있다.
이후, (2) 절편화된 분석 대상 게놈 DNA의 말단에 본 발명의 어댑터를 라이게이션한다.
여기서 상기 절편화된 분석 대상 게놈 DNA 및 본 발명의 어댑터는 1:15~1:25의 혼합비로 혼합하여 라이게이션을 수행할 수 있다.
차세대염기서열분석을 위한 라이브러리의 제조 과정에서 타겟 DNA에 어댑터의 접합(라이게이션) 및 연장 반응이 매우 중요한데, 본 발명에서는 라이게이션 및 연장 반응의 최적화를 위한 DNA 및 본 발명의 어댑터 처리양의 조건을 확인하기 위한 실험을 진행하였고, 그 결과, 분석 대상 게놈 DNA 대 본 발명의 어댑터를 1:15~1:25의 비율로 사용하는 것이 적합함을 확인하였고, 1:20의 비율로 사용하는 것이 가장 바람직하다.
만일 상기 비율을 벗어난 양으로 처리하여 반응시키면, 라이게이션 및 연장 반응의 효율이 미비하여 목적하는 효과를 도출할 수 없다.
또한, 라이게이션의 반응 시간에 대한 최적 조건을 확인하기 위한 실험을 수행하였는데, 라이게이션 시간을 각각 15분, 60분 및 18시간으로 실험한 결과, 15분이 가장 적합한 것으로 나타났다.
또한 상기 절편화된 분석 대상 게놈 DNA의 말단에 본 발명의 어댑터를 라이게이션 하기 전에는 상기 DNA의 말단 수선(end repair) 후 3’말단에 아데노신을 접합(A-tail)하는 단계, 즉 End repair 및 A-tail 단계를 먼저 수행할 수 있다.
본 발명의 어댑터의 라이게이션이 완료되면, 다음으로 (3) 상기 (2) 단계에서 본 발명의 어댑터를 라이게이션 한 반응액에 중합효소를 첨가하고 연장 반응을 수행하여 1차 반응 산물을 수득한다.
상기 중합효소는 핵산의 증폭을 위해 사용되는 당업계의 중합효소라면 모두 사용 가능하며, 이에 제한되지는 않으나, Q5 DNA 폴리머라제, Phi29 DNA 폴리머라제 또는 Bst 2.0 DNA 폴리머라제를 사용할 수 있다.
또한 본 발명에서는 상기 (3) 단계에서의 연장 반응은 1회의 반응(1 cycle)만 수행하며, 상기 1차 반응산물은 본 발명의 어댑터 염기서열을 포함하여 연장 반응된 헤어핀 구조를 갖는 증폭산물이다.
즉, 절편화된 분석 대상의 핵산시료에 라이게이즈 효소를 이용하여 본 발명의 어댑터를 부착시키고, 중합효소를 첨가하면 본 발명의 어댑터에 포함된 자가 증폭 염기서열(SelPH-도메인)로 인해 3’부터 혼성화된 어댑터의 스템(stem) 부분을 지나 5’쪽으로 연장반응에 의해 복제가 되며, 그 결과, 분석 대상의 핵산시료의 단일 가닥이 각각 분리되어 긴 헤어핀 모양의 1차 반응산물이 생성된다(도 1의 phase I 참조).
이렇게 제 1 단계의 과정이 완료되면, 제 2단계가 진행되는데, (4) 상기 1차 반응산물에 NGS용 유니버셜 어댑터를 라이게이션하는 단계를 수행한다.
이때 상기 NGS용 유니버셜 어댑터를 라이게이션 하기 전, NGS용 유니버셜 어댑터 부착을 위해 상기 1차 반응산물의 DNA는 말단 수선(end repair) 및 3’말단에 아데노신을 접합(A-tail)하는 단계, 즉 End repair 및 A-tail 단계를 먼저 수행할 수 있다.
상기 NGS용 유니버셜 어댑터는 당업계에 공지된 NGS용 어댑터라면 모두 사용 가능하며, 본 발명의 일실시예에서는 Bioo Scientific사의 NEXTFlex DNA 바코드 어댑터를 사용하였다.
상기 라이게이션은 당업계에 공지된 라이게이즈 효소라면 모두 사용 가능한다.
상기 1차 반응산물에 NGS용 유니버셜 어댑터의 라이게이션이 완료되면, 다음으로 (5) 단계로 상기 NGS용 유니버셜 어댑터를 라이게이션 한 반응액에 중합효소를 첨가하고 연장 반응을 수행하여 2차 반응산물을 수득한다.
이때 상기 중합효소는 상기 중합효소는 핵산의 증폭을 위해 사용되는 당업계의 중합효소라면 모두 사용 가능하며, 이에 제한되지는 않으나, Q5 DNA 폴리머라제, Phi29 DNA 폴리머라제 또는 Bst 2.0 DNA 폴리머라제를 사용할 수 있으며, 상기 2차 반응산물을 얻기 위한 상기 연장 반응은 1회의 반응(1 cycle)만 수행한다.
또한, 상기 2차 반응산물을 얻기 위한 상기 연장 반응에는 플로우셀 부착을 위한 프라이머(예컨대, P7 프라이머)를 중합효소와 함께 사용할 수 있으며, 상기 2차 반응산물은 긴 헤어핀 구조를 갖는 1차 반응산물이 복제되면서 선형의 이중 DNA(duplex DNA) 형태를 갖는 산물이 된다.
본 발명의 일실시예에서는 2차 반응산물의 양쪽 말단에 P5 및 P7을 갖는 이중 형태의 DNA로 복제되면서 증폭되었다.
상기 방법으로 증폭된 2차 반응산물은 정제 단계를 수행할 수 있는데, 증폭 산물의 정제방법은 당업계에 알려진 일반적인 방법이면 모두 사용가능하며, 이에 제한되지는 않으나, 겔 필트레이션, 컬럼 이용 방법 또는 전자기장을 이용한 방법 등을 사용할 수 있다.
본 발명에서 상기 “연장 반응”은 분석 대상의 핵산 시료를 증폭하는 반응을 의미한다. 핵산 시료의 증폭을 위한 반응은 다양한 증폭 반응들이 당업계에 보고되어 있으며, 중합효소연쇄반응(PCR), 역전사-중합효소연쇄반응(RT-PCR), 리가아제 연쇄반응(ligase chain reaction), 복구 연쇄반응(repair chain reaction), 전사-중재 증폭(TMA), 자가 유지 염기서열 복제, 임의적 프라이밍 및 리플리케이팅 중합효소 연쇄반응, 핵산 염기서열 기반 증폭, 가닥 치환 증폭 및 고리-중재 항온성 증폭 방법을 포함할 수 있으나, 이에 제한되지는 않는다.
나아가 본 발명은 본 발명의 자가 증폭(self-priming and replicating)이 가능한 헤어핀 구조의 NGS(Next generation sequencing) 라이브러리 제작용 어댑터를 포함하는, DNA 라이브러리 제조용 키트를 제공할 수 있다.
본 발명에 따른 상기 키트는 버퍼, DNA 중합효소 및 타겟 증폭 PCR 반응을 실시하는데 필요한 시약을 선택적으로 포함할 수 있으며, 다양한 폴리뉴클레오티드 분자, 역전사효소, 다양한 버퍼 및 시약 등을 포함할 수 있다.
이상, 본 발명에서 고안한 NGS(Next generation sequencing) 라이브러리 제작용 어댑터는 헤어핀 구조를 가지며 자가 증폭(self-priming and replicating)이 가능한 어댑터로서 분석대상 핵산시료에 본 발명의 어댑터(SelPH-adaptor)를 부착하여 1번의 증폭을 수행하고, 이후 공지된 염기서열분석법을 수행하여 매우 빠르고 정확하게 라이브러리를 제작할 수 있다.
또한, 본 발명의 자가 증폭이 가능한 어댑터를 사용할 경우, 1번씩 총 2회만의 증폭(즉, 본 발명의 어댑터 부착 후 연장반응에 따른 증폭(phase I의 증폭) 및 일반적인 NGS 어댑터 부착 후 연장반응에 따른 증폭(phase II의 증폭))만 진행하면 되므로, 기존 수차례의 증폭과정으로 야기되는 jackpot 에러나 편향적인 증폭에 따른 오류를 최소화할 수 있다.
또한, 본 발명의 자가 증폭이 가능한 어댑터를 사용할 경우, DNA 조각의 길이 제한이 없으며 원형 DNA를 만드는 셀프-라이게이션 과정 없이도 한 쌍의 Paired end 형태의 산물을 만들 수 있어 워크플로우(workflow)가 단순하고 효율적일 뿐만 아니라, 별도의 Nick 및 user enzyme의 사용이 없어 핵산시료의 손상으로 인해 발생할 수 있는 오류 및 인공산물을 염려할 필요가 없다.
그러므로 본 발명의 자가 증폭이 가능한 어댑터를 사용하여 NGS용 라이브러리를 제조할 경우, 기존 방법의 라이브러리 제작보다 오류율을 줄이면서 효율을 높일 수 있고, 낮은 빈도로 존재하는 돌연변이 서열을 보다 정확하게 검출할 수 있다.
이하, 실시예를 통하여 본 발명을 보다 상세히 설명하고자 한다. 이들 실시예는 본 발명을 보다 구체적으로 설명하기 위한 것으로, 본 발명의 범위가 이들 실시예에 한정되는 것은 아니다.
<준비예>
시약
모든 올리고뉴클레오티드는 IDT(Integrated DNA Technology)에서 구입하여 사용하였고, 동결건조된 올리고뉴클레오티드는 0.1M TE 버퍼로 희석 후, 믹싱블럭(MB102: Bioer)에서 50℃의 온도로 1시간 동안 반응시켰다. Post-ligation cleanup 과 Post-amplification cleanup은 프로메가사의 ProNex Size-selective 정제 시스템을 사용하였다. 5X Q5 반응버퍼, 5X High-fidelity DNA 폴리머라제, Bst 2.0 DNA 폴리머라제, 10X Isothermal 증폭 버퍼, 각각의 10mM dNTPs, 효모 게놈(yeast genome) 라이브러리 준비 시 사용한 일루미나용 NEBNext Ultra II FS DNA 라이브러리 프랩키트는 NEB(New england biolabs) 제품을 사용하였다. 91bp 및 285bp 인서트 DNA 실험에서는 Bio Scientific 사의 NEXTflex Rapid DNA sequencing bundle을 사용하였다.
<실험방법>
① Self-priming 및 replicating 확인
NCBI에서 EGFR 유전자의 엑손 21번의 시퀀싱을 확인 후, 6번째 염기부터 46번째의 염기까지 40개의 염기를 갖는 올리고뉴클레오티드에 Self-priming 및 replicating을 위한 헤어핀 모양의 어댑터 3종류의 시퀀스를 각각 3’에 추가하여 하기 표 1과 같이 제작하였다. 올리고뉴클레오티드는 1M TE 버퍼를 사용하여 100uM 농도로 희석하여 배양하였다. 5X Q5 반응버퍼 5μl, 10mM dNTPs 각각은 0.5μl, Q5 DNA 폴리머라제는 0.25μl, 각각의 올리고뉴클레오티드는 증류수를 사용하여 20μM로 희석 후 1μl로 첨가하여 총 부피가 25μl가 되도록 하였다. 98℃에서 10초, 65℃까지 서서히 온도를 낮추고 30초 반응 수행 후, 72℃에서 10분 동안 진행하였다.
Figure PCTKR2020012904-appb-T000001
② SelPH-adaptor 제작
SelPH-adaptor를 구성하는 긴 단일가닥, 짧은 단일 가닥의 하기 표 2의 올리고뉴클레오티드를 100μM 농도로 각각 0.1M TE 버퍼로 반응시킨 후, 각각을 2X PBS를 이용하여 최종농도 30μM의 총 부피 100 μl이 되도록 맞췄다. 이후 Thermocycler를 이용하여 95℃에서 20℃까지 온도를 서서히 낮춰 어닐링시켰다.
Figure PCTKR2020012904-appb-T000002
③ SelPH-시퀀싱 진행
SelPH-시퀀싱은 91bp 및 285bp 크기로 제작한 인서트(insert) DNA를 사용하여 수행하였다.
(i) 91bp 인서트 DNA 실험
91bp 인서트 DNA 제작
하기 표 3의 91bp 인서트 DNA를 구성하는 단일가닥의 올리고뉴클레오티드들은 각각 1M TE 버퍼를 사용하여 20μM이 되도록 희석하였고, 올리고뉴클레오티드 각각이 최종농도 1 μM이 되도록 1X PBS 버퍼로 맞춰 총 부피 100μl가 되도록 한 후, SimpliAmp Thermal Cycler(Thermo Fisher Scientific)를 사용하여 95℃에서 20℃까지 온도를 서서히 낮춰 어닐링시켰다.
Figure PCTKR2020012904-appb-T000003
1차 라이게이션(SelPH-어댑터)
SelPH-어댑터의 부착은 1uM 91bp 인서트 DNA 18μl, NEXTFlex End-Repair & Adenylation 버퍼 믹스 15μl, 25uM의 SelPH-어댑터 0.5μl 조건으로 제조사의 프로토콜대로 라이게이션을 수행하였다.
POST-ligation Cleanup
ProNex Chemistry 시약을 SelPH-어댑터 라이게이션 시료 부피의 3배로 첨가하고 제조사의 실험방법에 따라 수행하였고, 용출버퍼 40㎕를 첨가하고 10분 동안 용출시간을 주었다.
1차 연장반응(First extension)
10X Isothermal 증폭 버퍼 2㎕, 10mM dNTPs 각각 0.5㎕, Bst 2.0 DNA 폴리머라제 0.5㎕, 용출된 시료 10㎕를 혼합하고 증류수로 총 부피 20㎕가 되도록 한 후, 65℃에서 10분 간 반응시키고, Bst DNA 폴리머라제를 첨가한 후, 65℃에서 5분간 반응시켰다.
Post-amplification Cleanup
ProNex Chemistry 시약을 SelPH-어댑터 라이게이션 시료 부피의 3배로 첨가하고 제조사에 따라 실험을 수행하였으며, 용출버퍼 20㎕를 넣고 10분 용출시간을 주었다.
End repair 및 A-tail
용출한 시료에 NEXTFlex End-Repair 및 Adenylation 버퍼 믹스 15㎕, NEXTFlex End-Repair 및 Adenylation Enzyme 믹스 3㎕를 첨가하고 제조사의 지시에 따라 수행하였다.
2차 라이게이션(NGS-어댑터)
NGS-어댑터는 Bioo Scientific사의 NEXTFlex Rapid DNA Sequencing Bundle에 포함된 것을 사용하였고, A-Tailing까지 마친 시료에 25μM NGS-어댑터 2.5㎕를 첨가하여 제조사의 지시에 따라 수행하였다.
Post-ligation Cleanup
ProNex Chemistry 시약을 NGS-어댑터 라이게이션까지 마친 시료 부피의 2배로 첨가하여 제조사의 지침사항에 따라 수행하였으며, 용출버퍼 40㎕를 넣고 10분 동안 용출시간을 주었다.
2차 연장반응(Second extension)
10X Isothermal 증폭 버퍼 4㎕, 10mM dNTPs 각각 1㎕, Bst 2.0 DNA 폴리머라제 0.5㎕, 용출된 시료 30㎕를 혼합하고 증류수로 총 부피 40㎕가 되도록 하였다. 여기에 Bioo Scientific에서 제공하는 올리고뉴클레오티드 시퀀스대로 표 4의 PCR 프라이머를 2.5㎕ 첨가하고 65℃에서 10분간 반응시킨 다음, Bst DNA 폴리머라제를 넣은 후 65℃에서 5분간 반응시켰다.
Figure PCTKR2020012904-appb-T000004
Post-amplification Cleanup
ProNex Chemistry 시약을 2차 연장반응을 마친 시료 부피의 1.3배로 첨가하고 제조사에 따라 실험을 수행하였으며, 용출버퍼 30㎕를 넣고 10분 동안 용출시간을 주었다.
(ii) 285bp 인서트 DNA 실험
285bp 인서트 DNA 제작
BRCA1 유전자의 1041 position을 목표로 285bp의 길이가 나오는 DNA 절편을 얻기 위해 하기 표 5의 프라이머를 제작하였다.
Figure PCTKR2020012904-appb-T000005
인간 게놈 DNA 20ng, 5X Q5 반응버퍼 5㎕, 10mM dNTPs 각각 0.5㎕, 10uM 정방향 프라이머와 역방향 프라이머는 최종농도가 0.5uM이 되도록 하였고, Q5 High-fidelity DNA 폴리머라제는 0.25㎕ 첨가한 다음, 98℃에서 30초 동안 초기 변성시키고, PCR시 어닐링 온도를 각각 54℃, 57℃, 60℃로 하였으며, 연장반응 온도는 72℃로 하여 35회(변성 10초, 어닐링 30초, 연장 30초)반복 후, 72℃에서 2분간 최종 연장반응 시켰다. PAGE 사진 상에서 여러 개의 희미한 밴드가 확인되어 동일한 시료에 동일 조건으로 Nested PCR 실시 후, 다시 전기영동을 수행하였다. 그 결과 단독 밴드를 확인하였고 시료를 1.5% 아가로즈 겔에서 전기영동 한 후, Monarch Gel Extraction 키트(NEB사)를 이용하여 285bp 인서트 DNA를 제작하였다. 이후 다시 시료를 PAGE 수행하여 젤에서 단독 밴드를 확인한 다음, 나노드랍(DeNOVIX)를 이용하여 농도를 측정하였다.
End repair 및 A-tail
285bp 인서트 DNA 400ng을 사용하여 제조사에 지침에 따라 반응을 수행하였고 이후 과정은 상기 91bp 인서트 DNA를 사용한 방법과 동일한 방법으로 다음의 실험들을 수행하였다.
(iii) 라이게이션 조건의 최적화
인서트 DNA 91bp 및 285bp를 모두 사용하였고, 이들 각각을 1X PBS 버퍼에 1uM의 농도로 어닐링 한 것을 추가 희석 없이 사용하였다. 모든 라이게이션 후에는 ProNex Size-selective 정제 시스템을 사용하여 정제 후 PAGE로 확인하였다.
NGS 라이브러리 준비용 시약 4종 비교
시판되고 있는 NGS 라이브러리 준비용 시약 4가지를 사용하여 실험하였으며, 상품별 실험방법이 상이하여 실험들은 각 제조사의 지침사항에 따라 수행하되 91bp 인서트 DNA와 SelPH-어댑터를 사용하였고 비율은 1:20으로 고정하여 수행하였다. ProNex Size-selective 정제 시스템을 사용하여 정제 시, ProNex Chemistry 시약과 시료의 부피 비율은 동일하게 3x로 진행하였고 용출 시간은 10분으로 하였다.
㉠ NEXTFlex Rapid DNA Sequencing Bundle(Bioo Scientific)
91bp 인서트 DNA 3㎕, 25uM SelPH-어댑터 2.5㎕, EXTFlex End-Repair 및 Adenylation 버퍼 믹스 15㎕, NEXTFlex ligase enzyme 믹스 47.5㎕를 첨가하고 증류수를 첨가하여 총 부피가 100㎕가 되도록 하였다. 반응 시간 등의 실험조건은 제조사의 지침에 따라 수행하였고, 정제 시 용출 부피는 40㎕가 되도록 하였다.
㉡ KAPA HyperPlus 키트(KAPA Biosystems)
91bp 인서트 DNA 3.5㎕, 15uM SelPH-어댑터 5㎕, 10X KAPA Frag 버퍼 5㎕, End-Repair 및 A-Tailing 버퍼 7㎕, 라이게이션 버퍼 30㎕, DNA 라이게이즈 10㎕를 첨가하고 증류수를 첨가하여 총 부피가 110㎕가 되도록 하였다. 반응 시간 등의 실험조건은 제조사의 지침에 따라 수행하였고, 정제 시 용출 부피는 40㎕가 되도록 하였다.
㉢ Illumina용 NEBNext Ultra II FS DNA library Prep Kit(NEB)
91bp 인서트 DNA 5㎕, 15uM SelPH-어댑터 2.5㎕, NEBNext Ultra II FS 반응버퍼 7㎕, NEBNext Ultra II 라이게이션 마스터 믹스 30㎕, NEBNext 라이게이션 인핸서 1㎕를 첨가하고 증류수를 첨가하여 총 부피 68.5㎕가 되도록 하였다. 반응 시간 등의 실험조건은 제조사의 지침에 따라 수행하였고, 정제 시 용출 부피는 30㎕가 되도록 하였다.
㉣ 블런트/TA Ligase Master Mix(NEB)
91bp 인서트 DNA 1㎕, 30uM SelPH-어댑터 3㎕, 블런트/TA Ligase Master Mix 10㎕를 첨가하고 증류수로 총 부피가 20㎕이 되도록 하였다. 반응 시간 등의 실험조건은 제조사의 지침에 따라 수행하였고, 정제 시 용출 부피는 15㎕가 되도록 하였다.
라이게이션 시간
91bp 및 285bp 크기의 인서트 DNA와 NEXTFlex Rapid DNA Sequencing Bundle(Bioo Scientific)의 라이게이션 시약을 사용하였으며, 반응시간의 차이를 두고 제조사의 지침사항에 따라 실험을 수행하였다. 91bp 인서트 DNA의 경우, 라이게이션 시간을 기존 15분에서 60분과 18시간으로 각각 늘렸고, 285bp의 경우 60분으로 늘려주었다. ProNex Size-selective 정제 시스템을 이용하여 정제하였고, 정제 시 ProNex Chemistry시약과 시료의 부피 비율은 동일하게 3x로 하였으며, 용출시간은 10분, 용출 부피는 40 ㎕로 하였다.
(iv) 연장 조건의 최적화
91bp 인서트 DNA 1ug과 25uM SelPH-어댑터 2.5㎕로 라이게이션 후, 정제까지 마친 시료를 사용하였다.
Q5 DNA 폴리머라제
SelPH-어댑터 라이게이션 시료 8㎕, 5X Q5 반응버퍼 5㎕, 10mM dNTPs 각각 0.5㎕, Q5 DNA 폴리머라제 0.25㎕를 첨가하고 증류수를 이용하여 총 부피가 25㎕가 되도록 2개의 시료를 각각 준비하였다. 98℃에서 30초 동안 초기 변성시키고 PCR 시 어닐링 온도를 각각 78℃, 65℃로 하고, 연장 온도를 72℃로 하여 1회(변성 10초, 어닐링 15초, 연장 30초)진행 후, 72℃에서 5분 간 최종 연장반응 시켰다.
Phi29 DNA 폴리머라제
SelPH-어댑터 라이게이션 시료 8㎕, 10X Phi29 DNA 폴리머라제 반응버퍼 2㎕, 10mM dNTPs 각각 0.5㎕, 100X BSA 0.2㎕, Phi29 DNA 폴리머라제 0.2㎕를 첨가하고 증류수로 총 부피가 20㎕가 되도록 하였다. 이후 30℃에서 5분 반응 후, Phi29 DNA 폴리머라제를 첨가한 뒤 30℃에서 10분간 반응시키고 65℃에서 10분간 불활성화시킨 다음, 20℃까지 서서히 온도를 낮춰주었다.
Bst 2.0 DNA 폴리머라제
SelPH-어댑터 라이게이션 시료 8㎕, 10X Isothermal amplification 버퍼 2㎕, 10mM dNTPs 각각 0.5㎕, Bst 2.0 DNA 폴리머라제 0.5㎕를 첨가하고, 증류수를 이용하여 총 부피가 20㎕가 되도록 하였다. 이후 65℃에서 10분 반응 후, Bst 2.0DNA 폴리머라제를 첨가한 뒤 65℃에서 10분간 반응시키고 80℃에서 20분간 불활성화시킨 다음, 20℃까지 서서히 온도를 낮춰주었다.
④ SelPH-seq를 이용한 효모 게놈 라이브러리 제작
약 12Mb의 yeast인 사카로마이세스 세레비지애(By4741)의 게놈 DNA를 사용하였고 농도는 446.745ng/㎕였다. 일루미나용 NEBNext Ultra II FS DNA 라이브러리 프랩 키트(NEB사)를 이용하여 제조사의 지침사항에 따라 수행하였다.
DNA 절편화, End repair 및 A-Tail
효모 게놈 DNA 0.5㎕, NEBNext Ultra II FS 반응버퍼 7㎕, NEBNext Ultra II FS enzyme 믹스 2㎕를 혼합하고 증류수를 이용하여 총 부피가 35㎕가 되도록 하였다. 이후 37℃에서 40분 동안 반응을 하였고 이후의 실험은 제조사의 지침사항에 따라 진행하였다.
1차 라이게이션(SelPH-어댑터)
15uM 농도의 SelPH-어댑터 2.5㎕, NEBNext Ultra II 라이게이션 마스터 믹스 및 NEBNext 라이게이션 인핸서를 반응 혼합물에 첨가하고 잘 섞은 후 제조사의 지침사항에 따라 진행하였다.
Post Ligation Cleanup
ProNex Chemistry 시약을 SelPH-어댑터 라이게이션 시료 부피의 2배로 첨가하고 제조사의 지침사항에 따라 실험을 진행하였고, 용출버퍼 30 ㎕를 넣고 10분 간 용출 시간을 주었다.
1차 연장반응
10X Isothermal amplification 버퍼 4㎕, 10mM dNTPs 각각 1㎕, Bst 2.0 DNA 폴리머라제 0.5㎕, 용출된 시료 30㎕를 첨가하고 증류수를 이용하여 총 부피가 40㎕가 되도록 하였다. 이후 60℃에서 10분간 반응시키고, Bst 2.0 DNA 폴리머라제를 첨가한 후, 65℃에서 5분간 반응시켰다.
Post-amplification Cleanup
ProNex Chemistry 시약을 일차 연장 시료 부피의 2배로 첨가하고 제조사의 지침사항에 따라 반응을 수행하였다. 이때 용출버퍼 40㎕를 첨가하고 10분간 용출 시간을 주었다.
End repair 및 A-Tail
일루미나용 NEBNext Ultra II FS DNA 라이브러리 프랩 키트는 절편화(fragmentation)과 End-repair 및 A-Tail이 함께 진행되는 효소 혼합물로서 NEBNext Ultra End-repair/dA-Tailing 모듈(NEB사)을 사용하여 수행하였다. 용출된 시료 40㎕에 10X End repair 반응버퍼 6.5㎕, End 프랩 믹스 3㎕를 첨가한 후, 총 부피가 65㎕가 되도록 증류수로 맞췄고 제조사의 지침사항에 따라 실험을 수행하였다.
2차 라이게이션(NGS 어댑터)
NGS 어댑터는 Bioo Scientific사의 NEXTFlex Rapid DNA Sequencing Bundle이 포함된 것을 사용하였고, A-Tailing까지 마친 시료에 25uM NGS 어댑터 2.5㎕을 첨가한 후, 제조사의 지침사항에 따라 반응을 수행하였다.
Post-ligation Cleanup
ProNex Chemistry 시약을 NGS 어댑터 라이게이션을 마친 시료 부피의 2배로 첨가하고 제조사의 지침사항에 따라 반응을 수행하였으며, 용출버퍼로 30㎕를 첨가하고 용출 시간을 10분 주었다.
2차 연장반응
10X Isothermal amplification 버퍼 4㎕, 10mM dNTPs 각각 1㎕, Bst 2.0 DNA 폴리머라제 0.5㎕, 용출된 시료 30㎕를 첨가하고 증류수를 이용하여 총 부피가 40㎕가 되도록 하였다. 여기에 Bioo Scientific에서 제공하는 올리고뉴클레오티드 시퀀스대로 PCR 프라이머 2(일루미나 P7 프라이머의 역할 수행)를 2.5㎕ 첨가하고 65℃에서 10분간 반응시킨 다음, Bst 2.0 DNA 폴리머라제를 첨가한 후, 65℃에서 5분간 반응시켰다.
Post-amplification Cleanup
ProNex Chemistry 시약을 2차 연장 반응까지 마친 시료 부피의 1.3배로 첨가하고 제조사의 지침사항에 따라 반응을 수행하였으며, 용출버퍼로 30㎕를 첨가하고 용출 시간을 10분 주었다.
⑤ 겔 전기영동
PAGE(Polyacrylamide gel electrophoresis)는 각 시료에 Novex TBE-Sample 버퍼(5x) 2㎕를 첨가하고 잘 혼합하였고, 인비트로젠사의 10% TBE 겔에 10㎕ 분지하여 200V에서 35분 동안 전기 영동하였다. 전기영동을 마친 겔은 잘 분리하여 증류수 100ml에 SYBR Gold Nucleic acid gel stain 5㎕를 희석 후, 믹싱블럭에서 15분동안 반응시켰다. 아가로스 겔 전기영동은 1X TBE 버퍼로 1.5%와 2%의 아가로스 겔을 만들었고, 6X Purple 로딩 다이 2㎕에 시료 10㎕를 첨가하여 혼합한 후, 10㎕를 로딩하여 100V에서 50분 동안 전기영동하였다.
<참고예>
본 발명의 셀프 프라이밍 및 리플리케이팅 헤어핀 어댑터를 이용한 NGS 라이브러리 제작 방법에 대한 전반적인 실험 방법
먼저 본 발명에서 고안한 셀프 프라이밍 및 리플리케이팅 헤어핀 어댑터(SelPH-adaptor)를 이용하여 NGS 라이브러리를 제작하는 전반적인 실험 과정을 설명하면 다음과 같다(도 1 참조).
본 발명에 따른 NGS 라이브러리 제작 방법은 크게 본 발명에서 고안한 SelPH-adaptor를 부착하는 Phase I 단계와 시퀀싱을 위해 NGS용 adaptor를 부착하는 Phase II로 구성된다.
Phase I 단계는 시퀀싱을 수행할 리드(read) 길이를 생각하여 게놈 DNA(gDNA)를 작게 조각낸 후(도 1의 step 1), SelPH-adaptor의 부착을 위해 End-repair(말단 수선) 및 A-tailing(A-테일링)을 수행한다(도 1의 step 2). 이후, 셀프 프라이밍 및 리플리케이팅 도메인(SelPH domain)이 있는 SelPH-adaptor를 A-tail까지 마친 DNA 조각에 부착시킨다(도 1의 step 3). 이후 DNA 폴리머라제를 이용하여 SelPH domain의 셀프 프라이밍 및 리플리케이팅으로 3’부터 Hybridization stem을 지난 5’쪽으로 연장반응이 시작된다. 그 결과 DNA 조각의 센스 DNA(Target)와 안티센스 DNA(Target*)는 각각 분리되어 긴 헤어핀 스템(stem) 모양을 형성하게 된다(도 1의 step 4).
다음으로 Phase II 단계를 수행하는데, Phase I 단계에서 제조된 긴 헤어핀 스템(stem) 모양을 갖는 DNA에 NGS adaptor 부착을 위한 End-repair(말단 수선) 및 A-tailing(A-테일링)을 수행한다(도 1의 step 5). 이후 NGS adaptor를 부착하고, P7 프라이머와 가닥변위(strand displacement) 기능이 있는 DNA 폴리머라제를 이용하여 연장 반응을 수행하여(도 1의 step 7), 긴 헤어핀 스템 모양을 갖던 DNA가 폴리머라제에 의해 복제되면서 펼쳐진 형태를 가지게 되며 걸국 양쪽 말단에 P5 및 P7을 갖는 이중 DNA를 형성하게 된다.
<실시예 1>
본 발명의 셀프 프라이밍 및 리플리케이팅 헤어핀 어댑터를 이용한 NGS 분석
<1-1> 셀프 프라이밍 및 리플리케이팅 헤어핀 어댑터(SelPH-adaptor)의 제조와 셀프 프라이밍 및 리플리케이팅 확인
본 발명자들은 SelPH-adaptor의 제조를 위해 SelPH-domain을 포함하는 긴 단일가닥의 올리고뉴클레오티드와 라이게이션을 위해 필요한 hybridization stem을 구성하는 짧은 단일가닥의 올리고뉴클레오티드를 하기 표 6과 같이 디자인하였다. 먼저 짧은 단일가닥은 3’말단에 T-tail 하여 어댑터 라이게이션에 의해 A-tail과 결합할 수 있도록 하였고, 5’는 긴 단일가닥의 3’과 라이게이션 되는 것을 예방하기 위해 인산화시키지 않았다. 긴 단일가닥의 SelPH-domain은 DNA 폴리머라제가 잘 결합할 수 있는 구조이어야 하고 연장반응을 수행하는 온도(65℃)에서 헤어핀 구조를 잘 형성 및 유지하여 자가-증폭(self-priming and replicating)이 가능해야 한다. 이에 본 발명자들은 이러한 최적 조건을 갖는 셀프 프라이밍 및 리플리케이팅 어댑터를 제조하기 위해, 40개 염기를 갖는 단일 가닥의 올리고뉴클레오티드의 3’말단에 헤어핀 stem 길이가 각각 8bp, 10bp, 12bp인 SelPH-domain 후보 염기서열을 추가하였다(도 2a 참조). 이후 Q5 DNA 폴리머라제를 이용하여 연장이 된 것을 확인함으로써 셀프 프라이밍 및 리플리케이팅(자가 증폭)이 가능함을 확인하였다. 한편, 각기 다른 길이의 헤어핀 stem 중에서 안정성은 12bp가 가장 우수한 것으로 나타나, 본 발명의 SelPH-adaptor 제조에는 12bp를 사용하기로 하였다(도 2b 참조). 또한, hybridization stem 끝부분과 SelPH-domain의 시작 부분 사이에는 아데닌(A) 4개를 추가하여 어댑터 라이게이션 과정 중에 SelPH-domain의 3’부분과 짧은 단일가닥의 5’이 라이게이션 되지 않도록 하였다.
Figure PCTKR2020012904-appb-T000006
상기 표 6에서 파란색의 염기서열 표시는 도 2a에서 파란색으로 표시된 염기서열에 해당한다.
<1-2> 다양한 길이를 갖는 인공 DNA의 준비
상기 <1-1>에서 제작한 본 발명의 셀프 프라이밍 및 리플리케이팅헤어핀 어댑터(SelPH-adaptor)를 이중 가닥 DNA에 부착 시에도 셀프 프라이밍 및 리플리케이팅이 되는 것을 확인하기 위해 NGS 분석을 위한 다양한 길이를 갖는 인공 DNA를 준비하였다.
91bp 인공 DNA 준비
작은 크기의 인서트 DNA로서 91bp의 크기를 갖는 인공 DNA를 준비하기 위해, NCBI에서 EGFR 유전자의 엑손 21번의 시퀀스를 확인 후, 첫 번째 염기부터 90번째의 염기까지 90개 염기를 갖는 올리고뉴클레오티드의 3’말단에 아데닌을 추가하여 총 91개 염기 길이의 단일가닥 DNA를 서로 상보적으로 합성하였고, 이들 각각의 단일 가닥을 95℃에서부터 20℃까지 서서히 낮춰주면서 어닐링 시켜 이중 가닥의 91bp 인공 DNA를 준비하였다(도 3 참조).
285bp 인공 DNA 준비
다음으로 91bp에 비해 상대적으로 길이가 긴 인서트 DNA의 준비를 위해 BRCA1 유전자의 1041 position을 목표로 285bp의 크기를 갖는 DNA 절편을 준비하였고, 주형 DNA를 대상으로 각기 다른 온도(54℃, 57℃ 및 60℃)에서 PCR을 수행 후, PAGE 겔을 통해 PCR 단편을 확인하였으며(도 4 참조), 이때 285bp 크기의 단일 밴드를 얻기 위해 네스티드 PCR을 수행하였고, 그 결과, 285bp 크기의 밴드만 존재하는 것을 PAGE 겔을 통해 확인하였으며(도 5 참조), 285bp의 염기서열은 서열번호 8에 나타내었다.
<1-3> 라이게이션 조건 확립
본 발명의 NGS 제조 과정은 앞서 기술한 바와 같이, 본 발명의 어댑터의 결합 및 연장반응이 수행되는 Phase I 및 NGS 어댑터의 결합 및 연장반응이 수행되는 Phase II 단계로 진행된다. Phase I 단계는 본 발명의 SelPH-adaptor와 DNA 조각의 라이게이션이 이루어져야만 SelPH domain의 셀프 프라이밍 및 리플리케이팅으로 연장반응이 진행된다. 또한 Phase I에서 연장 반응이 진행되어야만 Phase II에서 NGS 어댑터와의 라이게이션(접합)이 가능해진다. 이에 본 발명자들은 먼저 91bp 및 285bp의 인서트 DNA를 사용하여 본 발명의 SelPH-adaptor와 라이게이션 및 연장반응을 위한 최적의 조건을 확인하였다.
라이게이션 조건의 확립을 위해, NEXTFlex Rapid DNA Sequencing Bundle(Bioo Scientific), KAPA HyperPlus 키트(KAPA Biosystems), Illumina용 NEBNext Ultra II FS DNA library Prep Kit(NEB) 및 블런트/TA Ligase Master Mix(NEB)의 4가지를 선택하여 라이게이션 반응을 수행하였으며, 이때 본 발명의 인서트 DNA : SelPH-adaptor의 혼합비율은 1:20으로 고정하여 수행하였다.
그 결과, 91bp의 인서트 DNA를 대상으로 분석한 결과에 의하면, 도 6a의 가장 하단에 보이는 희미한 밴드는 SelPH-adaptor로 이중 가닥을 형성하는 부분은 총 24bp이지만 헤어핀 구조를 가지며 부분적으로 단일 가닥 형태로 존재하는 것이 있음을 감안하면 전기영동 시 움직임에 조금씩의 차이가 있을 수 있음을 예상할 수 있으며, 라이게이션 된 SelPH-adaptor의 밴드 사이즈는 28bp로 계산하였다.
도 6a의 결과에서 가운데 밀집된 밴드 중 아래쪽에 존재하는 91bp에 위치하는 밴드는 양쪽 말단에 SelPH-adaptor가 하나도 라이게이션 되지 않은 인서트 DNA이며, 가운데 위치한 밴드는 한쪽에만 어댑터가 라이게이션 되어 119bp의 크기를 보임을 알 수 있으며, 양쪽 말단에 모두 어댑터가 라이게이션 된 것은 147bp의 크기를 갖는 밴드임을 알 수 있었다. 또한, 상기 4개의 제품 중에서 인공 인서트 DNA를 사용할 경우, Bioo Scientific사 제품을 사용하고, 절편화(Fragmentation)가 필요한 경우에는 NEB 사의 제품을 사용하는 것이 좋다는 것을 확인하였다.
또한, 양쪽 다 SelPH-adaptor가 라이게이션 될 수 있는 조건을 찾고자 어댑터와 인서트 DNA의 농도를 1:20으로 고정하고 시간을 달리하여 라이게이션을 수행하였는데, 그 결과, 라이게이션 시간을 기존 15분에서 60분 및 18시간으로 각각 늘렸으나 밴드양상을 유사한 것으로 나타났고(도 7a 참조), 285bp 인서트 DNA로 60분 라이게이션을 수행하였으나, 91bp의 인서트 DNA와 비슷한 양상을 보였다(도 7b 참조). 한편, 양쪽 다 라이게이션 되거나 또는 한쪽만 라이게이션이 되더라도 셀프 프라이밍 및 리플리케이팅(자가-복제)는 모두 가능하기에, 라이게이션 시간은 15분 동안 수행하는 것이 효율적임을 확인하였다. 따라서 phase I 및 II에서 라이게이션 시간은 15분 간 수행하였다.
<1-4> 연장반응 조건 확립
다음으로 SelPH-adaptor가 라이게이션된 후, 연장반응이 되는 조건을 확립하기 위해, Q5 DNA 폴리머라제, 가닥변위 기능을 있는 Phi29 DNA 폴리머라제 및 Bst 2.0 DNA 폴리머라제를 각각 사용하여 연장반응 결과를 분석하였다. 이때 Q5 DNA 폴리머라제는 98℃ 변성 과정이 필요한데, SelPH domain의 헤어핀 스템의 멜팅 온도가 78℃의 고온으로 올렸다가 낮추는 과정에서 헤어핀 구조가 제대로 형성되지 않게되면 셀프 프라이밍 및 리플리케이팅이 되지 않을 수 있으므로, Q5 DNA 폴리머라제를 사용한 실험에서는 변성 과정 후, 헤어핀 스템의 멜팅 온도인 78℃와 어닐링 온도인 65℃까지 온도를 매우 천천히 낮춰 헤어핀 구조를 잘 형성할 수 있도록 하였다.
연장반응을 수행하게 되면, 91bp의 인서트 DNA에 대해 SelPH-adaptor가 라이게이션된 밴드로부터 연장반응이 된다면 양쪽 모두 붙어있는 인서트 DNA의 경우 135bp 크기의 이중가닥 DNA 2개가 나오고, 한쪽만 붙어있는 인서트 DNA의 경우 123bp크기의 이중가닥 DNA 1개와 103bp의 단일가닥 1개가 나오며, 기존 라이게이션이 되지 않은 91bp의 인서트 DNA까지 총 4개의 밴드가 나타날 수 있다(도 8 참조).
연장반응에 따른 분석 결과, Q5 DNA 폴리머라제를 사용한 경우, 135bp 및 123bp의 밴드가 잘 보이지만 상단부에 기타의 밴드가 많이 존재하는 것으로 나타났고, Phi29 DNA 폴리머라제를 사용한 경우에는 대조군으로 사용한 SelPH-adaptor 라이게이션 시료와 비슷한 패턴을 보여 연장반응이 잘 진행되지 않았음을 알 수 있었으며, Bst 2.0 DNA 폴리머라제를 사용한 경우, 135bp 및 123bp의 밴드가 잘 보였고, 상단부에 다른 크기를 갖는 밴드들이 존재하지 않는 것으로 나타나, 본 발명의 연장 반응에서는 Bst 2.0 DNA 폴리머라제를 사용하는 것이 가장 적합하다는 것을 알 수 있었다(도 8a 참조).
<1-5> 본 발명의 SelPH-adaptor를 이용한 Phase I 및 Phase II 과정 수행
앞서 실시예를 통해 본 발명의 SelPH-adaptor를 이용할 경우, 라이게이션 및 연장반응을 위한 최적의 조건 하에서 91bp 및 285bp 인서트 DNA를 대상으로 Phase I 및 Phase II 과정을 수행하여 NGS 분석을 수행하였다.
91bp 및 285bp 인서트 DNA 각각에 대하여 본 발명의 SelPH-adaptor와 인서트 DNA를 1:20의 비율(몰농도 비율)로 혼합하고 NEXTFlex Rapid DNA Sequencing Bundle(Bioo Scientific) 제품을 사용하여 15분 동안 라이게이션을 수행하였다. 이후 Bst 2.0 DNA 폴리머라제를 이용하여 연장반응을 수행하여 Phase I 단계를 완료하였다. 이후 Phase I 단계까지 수행한 시료에 End-repair 및 A-Tail 후, Bioo Scientific 사의 NGS 어댑터인 NEXTFlex DNA 바코드 어댑터를 라이게이션하였다.
이때 상기 NGS 어댑터는 P5와 T-tail된 58개 염기의 단일가닥, P7’와 index를 포함한 63개 염기의 단일 가닥 DNA 들이 12bp 길이로 hybridization된 Y자 모양을 갖는 어댑터이다. 91bp의 인서트 DNA를 사용한 경우, 1차 연장 시 135bp, 123bp, 103bp, 91bp의 4가지 밴드가 나올 수 있는데, 여기서 NGS 어댑터를 대략 60bp크기라고 계산하면, 195bp, 183bp, 163bp, 152bp의 순서대로 결과가 나오며 라이게이션 되지 않은 인서트 DNA도 함께 존재할 수 있다.
실제 분석 결과를 보면, 도 9의 레인 4를 보면 60bp 부근에서 2개의 밴드가 관찰되어지는데, 이는 NGS 어댑터가 전기영동 과정에서 분리되어 단일가닥으로 나타난 것이며, 레인 3은 1차 연장반응 산물로서 두꺼운 밴드 2개가 존재하는데 이것들은 NGS 어댑터가 라이게이션 되지 않아 잔존한 1차 연장의 증폭산물로 판단되며 최상단의 진한 밴드가 NGS 어댑터가 제대로 라이게이션된 인서트 DNA임을 알 수 있다. 레인 5번은 NGS 어댑터의 라이게이션 후, 2차 연장반응 산물을 나타낸 것으로 진한 2개의 밴드는 SelPH-adaptor 부착 후, 연장반응된 Phase I의 산물들이 NGS adaptor와 라이게이션된 후, P7 프라이머와 Bst 2.0 DNA 폴리머라제에 의해 연장반응으로 나온 산물로서 크기도 약 두배 정도 늘어난 389bp, 365bp로 나타났다.
또한, 285bp 인서트 DNA를 사용한 경우도 1차 연장 반응시, 329bp, 317bp, 297bp, 285bp 의 4가지 밴드가 나오는데 NGS adaptor를 약 60bp로 계산하면, 389bp, 377bp, 357bp, 345bp 순서로 나오게 된다. 285bp 인서트 DNA를 대상으로 Phase I 및 II 과정을 수행한 결과, 도 10에 나타낸 바와 같이 예상된 크기의 증폭 산물을 확인할 수 있었다.
따라서 이러한 결과를 통해 본 발명자들은 본 발명에서 고안한 SelPH-adaptor를 사용한 시퀀싱 분석은 잘 작동될 수 있다는 것을 알 수 있었고, 이를 이용하여 NGS 라이브러리의 제작이 가능할 수 있음을 알 수 있었다.
<실시예 2>
효모 게놈(Yeast genome)을 대상으로 본 발명의 셀프 프라이밍 및 리플리케이팅 헤어핀 어댑터를 이용한 NGS 분석
실시예 1을 통해 인공적으로 제작한 인서트 DNA에 대해 본 발명의 SelPH-adaptor를 이용한 NGS 분석이 잘 이루어짐을 확인함에 따라 본 발명자들은 실제의 게놈 DNA에서도 본 발명의 어댑터가 잘 작동하는지 확인하기 위해 다음과 같은 실험을 수행하였다.
<2-1> 라이브러리 준비
약 12Mb의 크기를 갖는 효모 게놈인 사카로마이세스 세레비지애(By4741)을 단편화하기 위해 일루미나용 NEXTFlex Ultra II FS DNA 라이브러리 프랩 키트(NEB사)를 사용하였고, 효모 게놈의 인서트 DNA의 크기는 100~150bp로 정하였다.
<2-2> 라이브러리 제조 확인
<2-1>에서 준비한 효모 게놈의 인서트 DNA를 대상으로 상기 실시예 1의 <1-5>와 동일한 조건으로 Phase I 및 II의 반응을 수행하여 반응산물을 확인하였다.
그 결과, 도 12에 나타낸 바와 같이, 100~150bp의 인서트 DNA를 사용한 경우, Phase II의 연장반응까지 마친 경우 380~500bp의 목적하는 이중(duplicate)의 산물이 생성된 것을 확인할 수 있었다.
이상의 결과를 통해 본 발명자들은 본 발명에서 고안한 SelPH-adaptor는SelPH domain의 자가 증폭(self-priming and replicating) 기능으로 1회의 연장반응을 수행하기 때문에 종래 수차례 요구되는 PCR에 의한 편향적인 증폭을 감소시킬 수 있으며, high fidelity의 DNA 폴리머라제를 사용하지 않아서 발생하는 오류 및 DNA 폴리머라제 자체의 오류율로 야기되는 오류도 본 발명의 SelPH-adaptor를 이용한 분석에서는 이중 형태의 산물(duplicate product)이 나오기 때문에 에러 수정이 가능한 효과가 있으며, DNA 손상으로 인해 발생할 수 있는 오류가 없을 뿐만 아니라 종래 Circular DNA 기반의 방법과 달리 DNA 조각의 길이 제한이 없어, 기존 방법 보다 낮은 오류율 및 높은 효율로 라이브러리의 제조가 가능하며 낮은 빈도로 존재하는 돌연변이 서열도 보다 정확하게 검출할 수 있음을 알 수 있었다.
이제까지 본 발명에 대하여 그 바람직한 실시예들을 중심으로 살펴보았다. 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자는 본 발명이 본 발명의 본질적인 특성에서 벗어나지 않는 범위에서 변형된 형태로 구현될 수 있음을 이해할 수 있을 것이다. 그러므로 개시된 실시예들은 한정적인 관점이 아니라 설명적인 관점에서 고려되어야 한다. 본 발명의 범위는 전술한 설명이 아니라 특허청구범위에 나타나 있으며, 그와 동등한 범위 내에 있는 모든 차이점은 본 발명에 포함된 것으로 해석되어야 할 것이다.

Claims (10)

  1. 서열번호 4의 염기서열로 이루어지고 헤어핀 구조를 갖는 긴 단일 가닥의 제1 올리고뉴클레오티드; 및 서열번호 5의 염기서열로 이루어진 짧은 단일 가닥의 제2 올리고뉴클레오티드;를 포함하는,
    자가 증폭(self-priming and replicating)이 가능한 헤어핀 구조의 NGS(Next generation sequencing) 라이브러리 제작용 어댑터.
  2. 제1항에 있어서,
    상기 제1 올리고뉴클레오티드는 중합효소가 결합할 수 있고, 연장반응(extension) 중에도 헤어핀 구조가 유지되는 것을 특징으로 하는, 자가 증폭(self-priming and replicating)이 가능한 헤어핀 구조의 NGS(Next generation sequencing) 라이브러리 제작용 어댑터.
  3. 제1항에 있어서,
    상기 제2 올리고뉴클레오티드는 상기 제1 올리고뉴클레오티드의 3’말단과 라이게이션 되지 않도록 서열번호 5로 이루어진 염기서열의 5’말단이 인산화 되어 있지 않은 것을 특징으로 하는, 자가 증폭(self-priming and replicating)이 가능한 헤어핀 구조의 NGS(Next generation sequencing) 라이브러리 제작용 어댑터.
  4. (1) 분석 대상 게놈 DNA를 절편화(fragmentation)화는 단계;
    (2) 절편화된 분석 대상 게놈 DNA의 말단에 제1항의 어댑터를 라이게이션하는 단계;
    (3) 상기 (2) 단계에서 제1항의 어댑터를 라이게이션 한 반응액에 중합효소를 첨가하고 연장 반응을 수행하여 1차 반응산물을 수득하는 단계;
    (4) 상기 1차 반응산물에 NGS용 유니버셜 어댑터를 라이게이션하는 단계;
    (5) 상기 (4) 단계에서 NGS용 유니버셜 어댑터를 라이게이션 한 반응액에 중합효소를 첨가하고 연장 반응을 수행하여 2차 반응산물을 수득하는 단계; 및
    (6) 상기 2차 반응산물을 정제하는 단계를 포함하는,
    NGS(Next generation sequencing) 라이브러리 제작방법.
  5. 제4항에 있어서,
    상기 (2) 단계에서 절편화된 분석 대상 게놈 DNA 및 제1항의 어댑터는 상기 분석 대상 게놈 DNA 대 제1항의 어댑터를 1:15~1:25의 몰비로 혼합하여 사용하는 것을 특징으로 하는, NGS(Next generation sequencing) 라이브러리 제작방법.
  6. 제4항에 있어서,
    상기 (2) 단계에서 제1항의 어댑터를 라이게이션 하기 전 및 상기 (4) 단계에서 NGS용 유니버셜 어댑터를 라이게이션 하기 전에, DNA의 말단 수선(end repair) 후 3’말단에 아데노신을 접합(A-tail)하는 단계를 추가로 더 포함하는 것을 특징으로 하는, NGS(Next generation sequencing) 라이브러리 제작방법.
  7. 제4항에 있어서,
    상기 (4) 단계의 1차 반응산물은 제1항의 어댑터 염기서열을 포함하여 연장 반응된 헤어핀 구조를 갖는 증폭산물인 것을 특징으로 하는, NGS(Next generation sequencing) 라이브러리 제작방법.
  8. 제4항에 있어서,
    상기 (5) 단계에서 상기 2차 반응산물은 연장 반응으로 증폭되어 선형의 이중 DNA(duplex DNA) 형태인 것을 특징으로 하는, NGS(Next generation sequencing) 라이브러리 제작방법.
  9. 제4항에 있어서,
    상기 (3) 단계의 연장 반응 및 (5) 단계의 연장 반응은 각각 1회씩 수행하는 것을 특징으로 하는, NGS(Next generation sequencing) 라이브러리 제작방법.
  10. 제1항의 자가 증폭(self-priming and replicating)이 가능한 헤어핀 구조의 NGS(Next generation sequencing) 라이브러리 제작용 어댑터를 포함하는, DNA 라이브러리 제조용 키트.
PCT/KR2020/012904 2019-10-18 2020-09-23 자가 증폭이 가능한 헤어핀 구조의 ngs 라이브러리 제작용 어댑터 및 이를 이용한 ngs 라이브러리 제조방법 WO2021075750A1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
US17/769,636 US20240229018A9 (en) 2019-10-18 2020-09-23 Self-priming and replicating hairpin adaptor for constructing ngs library, and method for constructing ngs library using same

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR10-2019-0129979 2019-10-18
KR1020190129979A KR102159008B1 (ko) 2019-10-18 2019-10-18 자가 증폭이 가능한 헤어핀 구조의 ngs 라이브러리 제작용 어댑터 및 이를 이용한 ngs 라이브러리 제조방법

Publications (1)

Publication Number Publication Date
WO2021075750A1 true WO2021075750A1 (ko) 2021-04-22

Family

ID=72708752

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/KR2020/012904 WO2021075750A1 (ko) 2019-10-18 2020-09-23 자가 증폭이 가능한 헤어핀 구조의 ngs 라이브러리 제작용 어댑터 및 이를 이용한 ngs 라이브러리 제조방법

Country Status (2)

Country Link
KR (1) KR102159008B1 (ko)
WO (1) WO2021075750A1 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GR20220100553A (el) * 2022-07-12 2024-02-09 Ν. Μπαζιγος Αβεε, Καλουπι αμφιπλευρης διαμορφωσης προϊοντων

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120083017A1 (en) * 2008-04-30 2012-04-05 Gi Mikawa Asymmetric adapter library construction
WO2017202389A1 (zh) * 2016-05-27 2017-11-30 深圳市海普洛斯生物科技有限公司 一种适用于超微量dna测序的接头及其应用
JP2018530536A (ja) * 2015-09-11 2018-10-18 ザ ジェネラル ホスピタル コーポレイション ヌクレアーゼDSBの完全照合およびシーケンシング(FIND−seq)
JP2019526267A (ja) * 2016-09-06 2019-09-19 スウィフト バイオサイエンシーズ, インコーポレイテッド Ngsライブラリー濃度の正規化

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101651817B1 (ko) 2015-10-28 2016-08-29 대한민국 Ngs 라이브러리 제작용 프라이머 세트 및 이를 이용한 ngs 라이브러리 제작방법 및 키트

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120083017A1 (en) * 2008-04-30 2012-04-05 Gi Mikawa Asymmetric adapter library construction
JP2018530536A (ja) * 2015-09-11 2018-10-18 ザ ジェネラル ホスピタル コーポレイション ヌクレアーゼDSBの完全照合およびシーケンシング(FIND−seq)
WO2017202389A1 (zh) * 2016-05-27 2017-11-30 深圳市海普洛斯生物科技有限公司 一种适用于超微量dna测序的接头及其应用
JP2019526267A (ja) * 2016-09-06 2019-09-19 スウィフト バイオサイエンシーズ, インコーポレイテッド Ngsライブラリー濃度の正規化

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
PARK DAECHAN, ELLINGTON ANDREW D, JUNG CHEULHEE: "Selection of self-priming molecular replicators", NUCLEIC ACIDS RESEARCH, INFORMATION RETRIEVAL LTD., vol. 47, no. 5, 18 March 2019 (2019-03-18), pages 2169 - 2176, XP055801123, ISSN: 0305-1048, DOI: 10.1093/nar/gkz044 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GR20220100553A (el) * 2022-07-12 2024-02-09 Ν. Μπαζιγος Αβεε, Καλουπι αμφιπλευρης διαμορφωσης προϊοντων

Also Published As

Publication number Publication date
US20240132876A1 (en) 2024-04-25
KR102159008B1 (ko) 2020-09-23

Similar Documents

Publication Publication Date Title
WO2013019075A2 (ko) 핵산분자의 제조방법
WO2016076672A1 (ko) 유전체에서 유전자 가위의 비표적 위치를 검출하는 방법
WO2016021973A1 (ko) 캄필로박터 제주니 crispr/cas 시스템 유래 rgen을 이용한 유전체 교정
WO2015183025A1 (ko) 표적 특이적 뉴클레아제를 이용한 표적 dna의 민감한 검출 방법
WO2013133680A1 (ko) 핫스타트 역전사반응 또는 핫스타트 역전사 중합효소 연쇄반응용 조성물
WO2015126078A1 (ko) 핵산과 신호 프로브의 비대칭 등온증폭을 이용한 핵산의 검출방법
US20050214840A1 (en) Restriction enzyme mediated method of multiplex genotyping
WO2019013451A1 (ko) 유전자 변이 특이성이 증가된 dna 중합효소 및 이의 활성 증가용 pcr 버퍼 조성물
US11912988B2 (en) Method and kit for constructing a simplified genomic library
WO2021075750A1 (ko) 자가 증폭이 가능한 헤어핀 구조의 ngs 라이브러리 제작용 어댑터 및 이를 이용한 ngs 라이브러리 제조방법
WO2018208133A1 (ko) 고순도 뉴클레오타이드 획득 방법 및 장치
WO2014092458A1 (ko) 코돈 조합화 및 변이유발을 이용한 유전자 라이브러리의 합성 방법
WO2021133088A1 (ko) 이중 가닥 핵산 분자 및 이를 이용한 dna 라이브러리 내 유리 어댑터 제거 방법
WO2018139826A1 (ko) Dna 메틸화를 이용한 연령 예측 방법
WO2018084594A1 (ko) 차세대서열결정법을 이용한 표적 단백질의 집단적 정량 방법과 그 용도
WO2013105801A1 (ko) 만성 골수성 백혈병 융합 유전자형 타이핑용 프로브, 프라이머 및 이의 이용방법
WO2020235974A9 (ko) 단일염기 치환 단백질 및 이를 포함하는 조성물
WO2015105336A1 (ko) 5&#39;-플랩 엔도뉴클레이즈 활성이 억제된 dna 폴리머레이즈를 이용하여 실시간 중합효소 연쇄반응으로 돌연변이 유전자를 검사하는 방법
WO2022098191A1 (ko) 하이드로겔화 핵산을 이용한 고분자량 단백질 생산용 원형 핵산 템플릿의 제조방법 및 고분자량 단백질 생산 시스템
WO2014178562A1 (ko) Dna 제한효소에 의해 활성 조절이 가능한 프라이머
WO2011059285A2 (ko) 지노타이핑 방법
WO2021172653A1 (ko) 단일 표적 유전자의 유전적 변이 실시간 검출용 단일핵산 및 이를 이용한 검출 방법
EP1616008A2 (en) Ligation-based synthesis of oligonucleotides with block structure
WO2024072006A1 (ko) 효소 반응을 통한 총 mrna 기반 무작위 sgrna 라이브러리 생성 방법
WO2021261924A1 (en) Computer-implemented method for providing coverage of oligonucleotide set for plurality of nucleic acid sequences

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 20877331

Country of ref document: EP

Kind code of ref document: A1

WWE Wipo information: entry into national phase

Ref document number: 17769636

Country of ref document: US

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 20877331

Country of ref document: EP

Kind code of ref document: A1