KR102200109B1 - Nucleotide for amplification of target nucleic acid sequence and amplification mathod usning the same - Google Patents

Nucleotide for amplification of target nucleic acid sequence and amplification mathod usning the same Download PDF

Info

Publication number
KR102200109B1
KR102200109B1 KR1020180108615A KR20180108615A KR102200109B1 KR 102200109 B1 KR102200109 B1 KR 102200109B1 KR 1020180108615 A KR1020180108615 A KR 1020180108615A KR 20180108615 A KR20180108615 A KR 20180108615A KR 102200109 B1 KR102200109 B1 KR 102200109B1
Authority
KR
South Korea
Prior art keywords
primer
sequence
equation
entropy
column
Prior art date
Application number
KR1020180108615A
Other languages
Korean (ko)
Other versions
KR20200030166A (en
Inventor
유석종
Original Assignee
한국과학기술정보연구원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국과학기술정보연구원 filed Critical 한국과학기술정보연구원
Priority to KR1020180108615A priority Critical patent/KR102200109B1/en
Priority to PCT/KR2018/013318 priority patent/WO2020054907A1/en
Publication of KR20200030166A publication Critical patent/KR20200030166A/en
Application granted granted Critical
Publication of KR102200109B1 publication Critical patent/KR102200109B1/en

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/686Polymerase chain reaction [PCR]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2521/00Reaction characterised by the enzymatic activity
    • C12Q2521/30Phosphoric diester hydrolysing, i.e. nuclease
    • C12Q2521/301Endonuclease
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2527/00Reactions demanding special reaction conditions
    • C12Q2527/101Temperature

Abstract

본 발명은 표적 서열의 증폭을 위한 올리고 뉴클레오타이드 및 이를 이용한 표적 서열의 증폭 방법에 관한 것으로, 더욱 상세하게는 crisper-cas9 또는 이와 상응하는 시스템을 포함하여, 카스 9 효소와의 반응을 통해 표적 서열에서 결합할 수 있는 위치를 감지하고 특별한 장비 없이 실온에서 표적 서열에 결합하여 증폭되는 올리고 뉴클레오타이드 및 이를 이용한 표적 서열의 증폭 방법에 관한 것이다. The present invention relates to an oligonucleotide for amplification of a target sequence and a method for amplifying a target sequence using the same, and more particularly, including crisper-cas9 or a system corresponding thereto, in a target sequence through reaction with a CAS 9 enzyme. It relates to an oligonucleotide that detects a position capable of binding and is amplified by binding to a target sequence at room temperature without special equipment, and a method of amplifying a target sequence using the same.

Description

표적 서열 증폭용 올리고 뉴클레오타이드 및 이를 이용한 표적 서열의 증폭 방법{NUCLEOTIDE FOR AMPLIFICATION OF TARGET NUCLEIC ACID SEQUENCE AND AMPLIFICATION MATHOD USNING THE SAME}Oligonucleotide for amplifying a target sequence, and a method of amplifying a target sequence using the same {NUCLEOTIDE FOR AMPLIFICATION OF TARGET NUCLEIC ACID SEQUENCE AND AMPLIFICATION MATHOD USNING THE SAME}

본 발명은 표적 서열의 증폭을 위한 올리고 뉴클레오타이드 및 이를 이용한 표적 서열의 증폭 방법에 관한 것으로, 더욱 상세하게는 crisper-cas9 또는 이와 상응하는 시스템을 포함하여, 카스 9 효소와의 반응을 통해 표적 서열에서 결합할 수 있는 위치를 감지하고 특별한 장비 없이 실온에서 표적 서열에 결합하여 증폭되는 올리고 뉴클레오타이드 및 이를 이용한 표적 서열의 증폭 방법에 관한 것이다. The present invention relates to an oligonucleotide for amplification of a target sequence and a method for amplifying a target sequence using the same, and more particularly, including crisper-cas9 or a system corresponding thereto, in a target sequence through reaction with a CAS 9 enzyme. It relates to an oligonucleotide that detects a position capable of binding and is amplified by binding to a target sequence at room temperature without special equipment, and a method of amplifying a target sequence using the same.

등온증폭은 동일한 온도에서 DNA 증폭반응을 수행하는 기술로, 현재 LAMP(Loop-mediated isothermal amplification), RCA(Rolling circle amplification), SDA(Strand displacement amplification) 등 다양한 증폭방법들이 개발되고 있다.Isothermal amplification is a technology that performs a DNA amplification reaction at the same temperature, and various amplification methods such as LAMP (Loop-mediated isothermal amplification), RCA (Rolling circle amplification), and SDA (Strand displacement amplification) are being developed.

이러한 등온증폭기술은 현장진단시장의 확장과 더불어서 더욱 주목 받고 있으며, 다양한 현장 진단 기기에 접목되어 새로운 제품들이 등장하고 있는 실정이다. 하지만 이러한 현장진단 기술은 전문기술이 없는 일반인이 수행하기에는 아직도 많은 진입장벽이 존재한다.This isothermal amplification technology is getting more attention with the expansion of the on-site diagnosis market, and new products are emerging by being grafted into various field diagnosis devices. However, there are still many entry barriers for the on-site diagnosis technology to be performed by ordinary people without specialized skills.

최근에 개발된 RNA 유전자가위(RNA-guided CRISPR)(clustered regularly interspaced short palindromerepeats)-연관된 뉴클레아제 Cas9에 기반된 유전체 교정(genome editing)은 표적 넉-아웃, 전사 활성화 및 single guide RNA(sgRNA)(즉, crRNA-tracrRNA 융합 전사체)를 이용한 억제에 대한 획기적인 기술을 제공하며, 이 기술은 수많은 유전자 위치를 표적 함으로써 확장성을 입증하였다. The recently developed RNA-guided CRISPR (clustered regularly interspaced short palindromerepeats)-associated nuclease Cas9-based genome editing provides targeted knock-out, transcriptional activation and single guide RNA (sgRNA). (I.e., crRNA-tracrRNA fusion transcript) provides a breakthrough technology for inhibition, and this technology has demonstrated scalability by targeting numerous gene locations.

군집형태로 주기적 간격으로 분포하는 짧은 회문 구조 반복체 (CRISPR) 및 CRISPR-관련 (Cas) 시스템은 대장균(E. coli)에서 이시노(Ishino)에 의해 처음 발견된 원핵생물 면역계이다 (Ishino et al. 1987 (Journal of Bacteriology 169 (12): 5429-5433 (1987)). "Cas9 엔도뉴클레아제(cas9 nuclease)"는 CRISPR Cas 시스템에서 이중 가닥 DNA 절단을 촉매하는 엔도뉴클레아제의 거대한 군을 지칭한다. 이러한 면역계는 바이러스 및 플라스미드의 핵산을 서열 특이적 방식으로 표적화함으로써 바이러스 및 플라스미드에 대한 면역성을 제공한다.The short palindromic repeats (CRISPR) and CRISPR-related (Cas) systems, distributed at periodic intervals in cluster form, are the prokaryotic immune system first discovered by Ishino in E. coli (Ishino et al. 1987 (Journal of Bacteriology 169 (12): 5429-5433 (1987)). "Cas9 endonucleases" are a large group of endonucleases that catalyze double-stranded DNA cleavage in the CRISPR Cas system. This immune system provides immunity against viruses and plasmids by targeting the nucleic acids of viruses and plasmids in a sequence specific manner.

CRISPR/Cas 시스템은 모든 새로운 표적 유전자좌에 대한 신생 단백질 조작을 필요로 할 수 있는, 엔도뉴클레아제, 메가뉴클레아제, 아연 핑거 뉴클레아제, 전사 활성화제-유사 이펙터 뉴클레아제 (TALEN)를 수반하는 다른 게놈 편집 방법보다 우수하다고 알려져 있다. 여러 상이한 CRISPR/Cas 시스템이 있고, 시스템의 특성이 추가로 규명될 때 이들의 명명법 및 분류가 변경되었다. 타입 II 시스템에는 CRISPR/Cas 시스템의 일부인 두 가닥의 RNA, 즉 CRISPR RNA (crRNA) 및 전사활성화 CRISPR RNA (tracrRNA)가 존재한다. tracrRNA는 프리-crRNA의 상보성 영역에 혼성화하여 프리-crRNA의 crRNA로의 성숙을 유도한다. tracrRNA 및 crRNA에 의해 형성된 듀플렉스는 표적 핵산 내의 서열에 상보성이고 이와 혼성화하는 crRNA의 서열에 의해 표적 핵산으로 유도되는 단백질인 Cas9에 의해 인식되고 이와 회합한다. RNA 기반 면역계의 이러한 최소 성분은 단일 단백질 및 2개의 RNA 가이드 서열 또는 단일 RNA 분자를 사용하여 부위 특이적 방식으로 표적 DNA로 재프로그램될 수 있다는 것이 증명되었다. The CRISPR/Cas system incorporates endonucleases, meganucleases, zinc finger nucleases, transcription activator-like effector nucleases (TALENs), which may require manipulation of new proteins for all new target loci. It is known to be superior to other accompanying genome editing methods. There are several different CRISPR/Cas systems, and their nomenclature and classification changed as the system was further characterized. In the type II system, there are two strands of RNA that are part of the CRISPR/Cas system, namely CRISPR RNA (crRNA) and transcriptionally activated CRISPR RNA (tracrRNA). The tracrRNA hybridizes to the complementary region of the pre-crRNA to induce maturation of the pre-crRNA to the crRNA. The duplex formed by tracrRNA and crRNA is recognized by and associated with Cas9, a protein that is directed to the target nucleic acid by the sequence of the crRNA that is complementary to and hybridizes to the sequence in the target nucleic acid. It has been demonstrated that this minimal component of the RNA-based immune system can be reprogrammed into target DNA in a site-specific manner using a single protein and two RNA guide sequences or a single RNA molecule.

또 다른 연구로 Natronobacterium gregoryi 의 종에서 분리한 Argonate단백질(NgAgo)이 보고되었는데(. Gao F, Shen XZ, Jiang F, Wu Y, Han C. DNA-guided genome editing using the Natronobacterium gregoryi Argonaute. Nat. Biotechnol. 2016;34:768-73), 이는 기존 Cas9과는 유사한 유전자 편집기능이 있으나 RNA를 사용하지 않고 단일나선 DNA를 가이드로 활용하고 있는 특징이 있다. 이러한 특징은 세포내에서 뿐만 아니라 in-vitro실험에서 DNA primer를 이용한 유전자 편집기능을 활용할 수 있는 새로운 대안을 제시하고 있다.In another study, an argonate protein (NgAgo) isolated from the species of Natronobacterium gregoryi was reported (. Gao F, Shen XZ, Jiang F, Wu Y, Han C. DNA-guided genome editing using the Natronobacterium gregoryi Argonaute. Nat. Biotechnol 2016;34:768-73), which has a gene editing function similar to that of existing Cas9, but it does not use RNA and uses single-stranded DNA as a guide. These features suggest a new alternative that can utilize the gene editing function using DNA primers not only in cells but also in in-vitro experiments.

하지만 이러한 CRISPR/Cas 시스템은 대부분 유전자편집에 대한 기능으로 활용되고 있으며, 진단분야에는 아직까지 활용되고 있지 못하고 있다. However, most of these CRISPR/Cas systems are used as functions for gene editing, and have not yet been used in the field of diagnosis.

본 발명에서는 CRISPER-CAS9 혹은 이에 상응하는 유전자 편집시스템의 기능을 응용하여 특별한 장비없이 실온에서 등온증폭을 수행할 수 있는 표적 서열의 증폭을 위한 올리고 뉴클레오타이드 및 이를 이용한 표적 서열의 증폭 방법을 제공하는 것을 목적으로 한다.In the present invention, by applying the function of CRISPER-CAS9 or the corresponding gene editing system to provide an oligonucleotide for amplifying a target sequence capable of performing isothermal amplification at room temperature without special equipment, and a method of amplifying a target sequence using the same The purpose.

본 발명은 상기와 같은 과제를 해결하기 위하여 표적 DNA 서열의 증폭을 위한 올리고 뉴클레오타이드에 관한 것으로, 표적 DNA 서열에 대한 혼성화하고, 카스 9 효소(Catalytically Cas 9)와 반응하는 표적 DNA 서열 증폭용 올리고 뉴클레오티드를 제공한다. The present invention relates to an oligonucleotide for amplifying a target DNA sequence in order to solve the above problems, and an oligonucleotide for amplifying a target DNA sequence that hybridizes to a target DNA sequence and reacts with Cas 9 enzyme (Catalytically Cas 9) Provides.

도 2에 본 발명에 의한 DNA 증폭용 올리고 뉴클레오티드를 이용한 증폭 과정을 나타내었다. 본 발명에 의한 DNA 증폭용 올리고 뉴클레오티드를 이용한 증폭 과정에서는 Cas 9 효소로서 Crispr-cas9 작동이 가능한 효소에 의해, 본 발명에 의한 DNA 증폭용 올리고 뉴클리오타이드가 표적 DNA 서열에 혼성화하면서 카스 9(Catalytically Cas 9)효소와 반응하여 결합함으로써 도 1에 나타낸 일반적인 Crispr-cas9 과정과는 달리 별도의 tracerRNA 가 결합되지 않아도 증폭 과정을 수행하는 것이 가능하다.Figure 2 shows the amplification process using the oligonucleotide for DNA amplification according to the present invention. In the amplification process using the oligonucleotide for DNA amplification according to the present invention, the oligonucleotide for DNA amplification according to the present invention hybridizes to the target DNA sequence by an enzyme capable of operating Crispr-cas9 as a Cas 9 enzyme. Cas 9) By reacting and binding with the enzyme, unlike the general Crispr-cas9 process shown in FIG. 1, it is possible to perform the amplification process even if a separate tracerRNA is not bound.

본 발명에 의한 DNA 증폭용 올리고 뉴클리오타이드에 있어서, 상기 DNA 증폭용 올리고 뉴클리오타이드는 5' 인산화된 것을 특징으로 한다. In the oligonucleotide for DNA amplification according to the present invention, the oligonucleotide for DNA amplification is 5'phosphorylated.

본 발명에 의한 표적 DNA 서열의 증폭을 위한 올리고 뉴클레오타이드에 있어서, 상기 DNA 증폭용 올리고 뉴클레오티드가 반응하는 카스 9 효소(Catalytically Cas 9)는 endonuclease 기능이 상실된 것을 특징으로 한다. 본 발명에 의한 표적 DNA 서열의 증폭을 위한 올리고 뉴클레오타이드는 표적 서열을 증폭하는 것을 주요 목적으로 하는바, 카스 9 효소(Catalytically Cas 9)가 유전자를 자르고 특정 유전자를 삽입하는 endonuclease 기능이 상실된 것이 바람직하다. In the oligonucleotide for amplification of the target DNA sequence according to the present invention, the Cas 9 enzyme reacted with the oligonucleotide for DNA amplification (Catalytically Cas 9) is characterized in that the endonuclease function is lost. The oligonucleotide for amplification of the target DNA sequence according to the present invention has the main purpose of amplifying the target sequence, and it is preferable that the Cas 9 enzyme (Catalytically Cas 9) cuts the gene and loses the endonuclease function of inserting a specific gene. .

본 발명에 의한 표적 DNA 서열의 증폭을 위한 올리고 뉴클레오타이드에 있어서, 상기 DNA 증폭용 올리고 뉴클레오티드는 DNA 서열인 것을 특징으로 한다. In the oligonucleotide for amplifying a target DNA sequence according to the present invention, the oligonucleotide for amplifying DNA is characterized in that it is a DNA sequence.

본 발명에 의한 표적 DNA 서열의 증폭을 위한 올리고 뉴클레오타이드에 있어서, 상기 DNA 증폭용 올리고 뉴클레오티드가 반응하는 카스 9 효소(Catalytically Cas 9)는 안내 서열이 DNA 인 경우 카스 9 효소로서 작동이 가능한 효소라면 제한되지 않으며, 구체적으로는 Natronobacteria, Corynebacter, Sutterella, Legionella, Treponema, Filifactor, Eubacterium, Streptococcus, Lactobacillus, Mycoplasma, Bacteroides, Flaviivola, Flavobacterium, Sphaerochaeta, Azospirillum, Gluconacetobacter, Neisseria, Roseburia, Parvibaculum, Staphylococcus, Nitratifractor, Mycoplasma 및 Campylobacter으로 이루어지는 군으로부터 선택되는 미생물 속으로부터 유래한 것을 사용하는 것이 가능하다. 이 중에서 Natronobacteria 로부터 유래한 카스 9 효소가 안내 서열이 DNA 인 경우에도 카스 9 효소로서 기능을 한다는 점이 발표된 바 있다(DNA-guided genome editing using the Natronobacterium gregoryi Argonaute, Nature Biotechnology volume 34, pages 768-773 (2016)). In the oligonucleotide for amplification of the target DNA sequence according to the present invention, the Cas 9 enzyme reacted by the DNA amplification oligonucleotide (Catalytically Cas 9) is an enzyme capable of operating as a Cas 9 enzyme when the guide sequence is DNA. Not specifically, Natronobacteria, Corynebacter, Sutterella, Legionella, Treponema, Filifactor, Eubacterium, Streptococcus, Lactobacillus, Mycoplasma, Bacteroides, Flaviivola, Flavobacterium, Sphaerochaeta, Azospirillum, Gluconacetobacter, Sphaerochaeta, Azospirillum, Gluconacetobacterium, Neissculeria, Nitraphylla, and Staphyloccus, Mycoplasma, and Staphyburia, Mycoplasma and Roseburia, It is possible to use those derived from the genus of microorganisms selected from the group consisting of Campylobacter. Among them, it has been reported that the CAS 9 enzyme derived from Natronobacteria functions as a CAS 9 enzyme even when the guide sequence is DNA (DNA-guided genome editing using the Natronobacterium gregoryi Argonaute, Nature Biotechnology volume 34, pages 768-773. (2016)).

본 발명은 또한, 표적 DNA 서열의 증폭을 위한 올리고 뉴클레오타이드에 관한 것으로, 상기 DNA 증폭용 올리고 뉴클레오티드; 및 상기 올리고 뉴클레오티드와 연결된 스템 서열; 및 상기 스템 서열에 부분적으로 또는 완전히 상보적인 뉴클레오티드 서열을 포함하는 tracrRNA 분절; 을 포함하는 DNA 증폭용 제 2 올리고 뉴클리오타이드를 제공한다. The present invention also relates to an oligonucleotide for amplifying a target DNA sequence, comprising: an oligonucleotide for amplifying the DNA; And a stem sequence linked to the oligonucleotide. And a tracrRNA segment comprising a nucleotide sequence partially or completely complementary to the stem sequence; It provides a second oligonucleotide for DNA amplification comprising a.

본 발명에 의한 DNA 증폭용 올리고 뉴클리오타이드는 카스 9 효소(Catalytically Cas 9)와 반응하고 표적 서열에 상보적인 올리고 뉴클레오티드 서열만을 포함하여도 카스 9 효소의 특성에 의해 카스 9 효소와의 반응에 의해 증폭이 가능하나, 상기 올리고 뉴클레오티드와 연결된 스템 서열; 및 상기 스템 서열에 부분적으로 또는 완전히 상보적인 뉴클레오티드 서열을 포함하는 tracrRNA 분절; 을 더 포함하는 것이 가능하다. The oligonucleotide for DNA amplification according to the present invention reacts with Cas 9 enzyme (Catalytically Cas 9) and contains only an oligonucleotide sequence complementary to the target sequence by reaction with Cas 9 enzyme due to the characteristics of Cas 9 enzyme. Amplification is possible, but stem sequence linked to the oligonucleotide; And a tracrRNA segment comprising a nucleotide sequence partially or completely complementary to the stem sequence; It is possible to further include.

본 발명에 의한 표적 DNA 서열의 증폭을 위한 올리고 뉴클레오타이드는 당업자에게 자명한 다양한 방법으로 설계되는 것이 가능하며, 다중 서열 정렬 결과 및 섀넌 엔트로피를 이용하여 유전자 증폭시 증폭 대상이 되는 유전자에서 유전자의 변이가 가장 적은 영역을 선택하여 설계되는 것이 가능하다. The oligonucleotide for amplification of the target DNA sequence according to the present invention can be designed in various ways that are obvious to those skilled in the art, and mutations in the gene to be amplified in the gene to be amplified when amplifying the gene using the result of multiple sequence alignment and Shannon entropy are It is possible to design by selecting the smallest area.

더욱 구체적으로는 복수 개의 유전자 데이터들을 다중 서열 정렬(Multiple sequence alignment) 하는 제1 단계;More specifically, a first step of performing multiple sequence alignment of a plurality of gene data;

상기 제1 단계에서 다중 서열 정렬된 데이터에서 각각의 컬럼(column)에 대한 제 1 컬럼 엔트로피(column entropy)를 산출하는 제2 단계;A second step of calculating a first column entropy for each column from the multi-sequence aligned data in the first step;

상기 제2 단계에서 정렬된 전체 유전자의 서열로부터 첫번째 염기서열로부터 마지막 염기서열까지 시작 위치를 이동하면서 길이를 변화시키면서 정방향, 역방향 후보 프라이머, 및, 정방향 프라이머(Forward primer) 및 역방향 프라이머(Reverse primer)의 프라이머 세트를 생성하는 제 3 단계;Forward and reverse candidate primers, and forward and reverse primers while changing the length while moving the starting position from the sequence of the entire gene aligned in the second step to the last nucleotide sequence A third step of generating a primer set of;

상기 제3 단계에서 생성된 후보 프라이머 각각에 대해서 상기 제 2단계에서 산출된 제 1 컬럼 엔트로피(column entropy) 값에 프라이머 내에서의 위치 특이성을 반영한 위치 특이적 그래디언트 패널티(gradient penalty) 값을 적용하여 제 2 컬럼 엔트로피를 산출하는 제 4 단계;For each of the candidate primers generated in the third step, a position-specific gradient penalty value reflecting the position specificity in the primer is applied to the first column entropy value calculated in the second step. A fourth step of calculating a second column entropy;

상기 제 3 단계에서 생성된 정방향 프라이머(Forward primer) 및 역방향 프라이머(Reverse primer)의 후보 프라이머 세트에 대해 프라이머 내의 모든 서열에서의 상기 제 2 컬럼 엔트로피를 합산하여 프라이머 엔트로피(primer entropy) 를 산출하는 제 5 단계;The agent for calculating the primer entropy by summing the second column entropy in all sequences in the primer for the candidate primer set of the forward and reverse primers generated in the third step. Step 5;

상기 제5 단계의 프라이머 엔트로피(primer entropy) 값과 프라이머의 길이, GC분률, Tm 온도, hairpin, dimer 점수 중 어느 하나 이상을 반영하여 정방향 및 역방향 프라이머의 프라이머 세트 매칭 점수를 산출하는 제 6 단계; 및 A sixth step of calculating a primer set matching score of the forward and reverse primers by reflecting at least one of a primer entropy value of the fifth step, a primer length, a GC fraction, a Tm temperature, a hairpin, and a dimer score; And

상기 제 6 단계의 프라이머 세트 매칭 점수를 바탕으로 정방향 및 역방향 프라이머를 선택하는 제 7 단계;를 포함하여 설계되는 것이 가능하다. It is possible to design including a seventh step of selecting forward and reverse primers based on the primer set matching score of the sixth step.

이와 같이 다중 서열 정렬 결과와 섀넌 엔트로피를 이용한 제 1 컬럼 엔트로피, 및 프라이머 내에서의 각각의 서열의 위치 특이적 조건을 반영한 그래디언트 페날티를 반영한 제 2 컬럼 엔트로피를 합산한 프라이머 엔트로피(primer entropy)를 활용한 프라이머 세트 매칭 점수를 기반으로 보다 유전자 서열의 상보적인 지역을 선별하여 프라이머로서의 표적 DNA 서열의 증폭을 위한 올리고 뉴클레오타이드를 선별하는 것이 가능하다. In this way, a primer entropy obtained by summing the first column entropy using the multi-sequence alignment result and the Shannon entropy, and the second column entropy reflecting the gradient penalty reflecting the position-specific conditions of each sequence in the primer Based on the used primer set matching score, it is possible to select an oligonucleotide for amplification of the target DNA sequence as a primer by selecting a more complementary region of the gene sequence.

다중 서열 정렬(multiple sequence alignment)은 3개 이상의 핵산 또는 단백질 서열을 정렬하는 것으로, 대표적인 다중 서열 정렬의 알고리즘으로는 점진적 정렬방법이 있으며, 대표적인 도구로는 ClustalW가 있다. Multiple sequence alignment is to align three or more nucleic acid or protein sequences, and a representative algorithm of multiple sequence alignment is a progressive alignment method, and a representative tool is ClustalW.

본 발명에서도 ClustalW를 활용하여 다중 서열 정렬을 수행하였다. 먼저, 가장 비슷한 두 서열에서 정렬을 시작하고, 정렬된 각 서열 쌍(pair)마다 거리 행렬(distance matrix)/거리 함수(distance function)를 만들고, 서열(sequence)의 마지막 노드에서의 matrice에서 Phylogenetic guide tree를 만든다. 그 다음, 정렬된 서열에 다음의 새로운 서열을 정렬할 때 guide tree를 사용하여 정렬한다. 다시 처음 단계로 돌아가면서 순서대로 다중 서열 정렬(multiple sequence alignment)에 서열을 계속 추가함으로써 완전한 순서대로 다중 서열 정렬(multiple sequence alignment)를 완성한다. In the present invention, multiple sequence alignment was performed using ClustalW. First, start the alignment from the two most similar sequences, create a distance matrix/distance function for each aligned sequence pair, and create a phylogenetic guide from the matrice at the last node of the sequence. Create a tree. Then, when aligning the next new sequence to the aligned sequence, it is aligned using a guide tree. Going back to the first step, multiple sequence alignments are completed in complete order by continuing to add sequences to the multiple sequence alignment.

본 발명의 상기 용어 '제 1 컬럼 엔트로피(Column entropy)'는 섀논 엔트로피(Shannon entropy)를 이용하여 유전자 데이터들의 다중 서열 정렬된 파일의 각각의 컬럼(column)에서의 돌연변이 정도를 산출한 값을 의미한다. 본 발명에 의한 목표 유전자를 선택적으로 증폭하기 위한 프라이머의 설계 방법에 있어서, 상기 제2 단계에서 제 1 컬럼 엔트로피(column entropy) 값은 하기 식 1에 따라 산출하는 것을 특징으로 한다.The term'first column entropy' of the present invention refers to a value obtained by calculating the degree of mutation in each column of a multi-sequence aligned file of genetic data using Shannon entropy. do. In the method for designing a primer for selectively amplifying a target gene according to the present invention, in the second step, a first column entropy value is calculated according to Equation 1 below.

[식 1][Equation 1]

Figure 112018090436140-pat00001
Figure 112018090436140-pat00001

(상기 식 1 에서 Pa 는 해당 위치에서의 유전자 변이 분율, K는 다중서열 처리를 한 샘플, 즉 종의 개수로 컬럼 높이, i는 유전자의 특정 위치를 나타내며, entropy(i)는 다중 서열 정렬 데이터의 i 위치에서의 컬럼 엔트로피 값을 나타냄)(In Equation 1, Pa is the gene mutation fraction at the corresponding position, K is the column height by the number of samples subjected to multi-sequence treatment, i.e., the number of species, i represents the specific position of the gene, and entropy (i) is the multi-sequence alignment data. Represents the column entropy value at the i position of)

본 발명의 일 실시예에서는, 돌연변이가 빈번한 게놈 서열 영역에서 엔트로피가 증가하는 특징을 이용하여, 다중 서열 정렬을 통해 얻은 정렬 파일에서 유전 변이가 가장 적은 영역에 대한 검색을 수행하였다. 구체적으로, 다중 서열 정렬 결과를 행렬 배열로 변환하여 행렬의 각각의 컬럼(column)에 대한 섀논 엔트로피(shannon entropy)을 적용하여 제 1 컬럼 엔트로피(Column entropy)를 산출하였다. 본 발명의 일 실시예에서는, 프라이머 설계시 저빈도의 유전변이를 무시할 수 있도록 보존분율에 대한 필터링 조건을 선택하는 것이 가능하다. 예를 들어서 5%미만의 유전변이 보고는 실제적으로 자연계에서 발생빈도가 크지 않은 편이므로 해당 변이는 배제할 수 있다. In an embodiment of the present invention, a search for a region having the least genetic variation in an alignment file obtained through multiple sequence alignment was performed using the feature of increasing entropy in a genomic sequence region where mutations are frequent. Specifically, the result of the multi-sequence alignment was converted into a matrix array, and the first column entropy was calculated by applying Shannon entropy for each column of the matrix. In an embodiment of the present invention, it is possible to select a filtering condition for a conserved fraction so that low-frequency genetic variation can be ignored when designing a primer. For example, reports of genetic variation of less than 5% can be excluded because the incidence of genetic variation is not large in nature.

본 발명에서는 상기 제 3 단계에서 다중 서열 정렬된 유전자 데이터 서열의 모든 서열, 즉, 첫번째 염기서열 부터 마지막 염기서열까지 1 bp 간격으로 프라이머의 시작 위치를 이동하면서 15 내지 25 bp 의 길이로 길이를 변경시키면서 후보 프라이머를 생성하고, 이들을 조합한 정방향 프라이머, 역방향 프라이머의 후보 프라이머 세트를 생성하였다. In the present invention, the length of the primer is changed to a length of 15 to 25 bp while moving the starting position of the primer at 1 bp intervals from the first nucleotide sequence to the last nucleotide sequence. In the meantime, candidate primers were generated, and a set of forward primers and reverse primers in which these primers were combined were generated.

본 발명에서는 먼저 이와 같이 위치와 길이를 다양하게 하여 후보 프라이머 및 후보 프라이머 세트를 가정하여 생성하고, 상기 제4 단계에서 상기 제 1 컬럼 엔트로피에 후보 프라이머 내에서의 위치 특이적 조건을 반영한 그래디언트 패널티(gradient penalty)를 적용하여 제 2 컬럼 엔트로피(position entropy)를 산출하고, 제 5 단계에서는 후보 프라이머 세트 내의 모든 유전자 위치 서열에 대한 상기 제 2 컬럼 엔트로피(position entropy) 값을 합산하여 프라이머 엔트로피(primer entropy) 로 정의하였다.In the present invention, first, a candidate primer and a candidate primer set are generated by varying the position and length as described above, and in the fourth step, a gradient penalty in which the position-specific condition in the candidate primer is reflected in the first column entropy ( gradient penalty) is applied to calculate the second column entropy, and in the fifth step, the second column position entropy values for all gene position sequences in the candidate primer set are summed to calculate the primer entropy. ).

본 발명에서는 상기 제 1 컬럼 엔트로피에 그래디언트 패널티(gradient penalty)를 적용하여 산출된 수정된 제 1 컬럼 엔트로피 값을 제 2 컬럼 엔트로피(position entropy)라고 하였다. 본 발명에서는 새넌 엔트로피를 적용하는 과정에서 일반적으로 프라이머 길이가 짧은 경우에 나타나는 엔트로피 감소 효과, 및 프라이머의 서열의 3’ 말단에 나타나는 현저한 엔트로피 증가 효과에 대한 위치 특이적 효과의 보정을 위하여 상기 제 1 컬럼 엔트로피(column entropy)값에 그래디언트 패널티(gradient penalty) 값을 적용하여 제 2 컬럼 엔트로피를 산정하였다. In the present invention, the corrected first column entropy value calculated by applying a gradient penalty to the first column entropy is referred to as a second column entropy. In the present invention, in order to correct the position-specific effect on the entropy reduction effect, which occurs when the primer length is generally short in the process of applying the Shannon entropy, and the remarkable entropy increase effect that appears at the 3'end of the primer sequence, the first The second column entropy was calculated by applying a gradient penalty value to the column entropy value.

같은 위치에서 시작되는 프라이머인 경우에도 프라이머의 길이가 작은 쪽이 프라이머 길이가 긴쪽보나 낮은 엔트로피를 갖게 된다. 본원 발명에서는 이러한 현상을 보정하고 프라이머의 서열의 3’ 말단과 가까운 위치에서의 유전변이에 중요도를 부여하기 위해서 그래디언트 패널티(gradient penalty) 를 적용하였다. 즉, 본원 발명은 새넌 엔트로피를 적용하는 과정에서 일반적으로 프라이머의 서열 3’ 말단쪽으로 나타나는 프라이머 결합 저하 현상을 엔트로피에 반영하기 위하여 상기 제 1 컬럼 엔트로피(column entropy)값에 그래디언트 패널티(gradient penalty) 값을 적용하여 제 2 컬럼 엔트로피를 산정하였다. Even in the case of primers starting at the same position, the shorter primer length will have the longer primer length or lower entropy. In the present invention, a gradient penalty was applied to correct this phenomenon and give importance to the genetic variation at a position close to the 3'end of the primer sequence. That is, the present invention is a gradient penalty value to the first column entropy value in order to reflect the primer binding decrease phenomenon generally appearing toward the 3'end of the primer sequence in the process of applying the Sannon entropy to the entropy. The entropy of the second column was calculated by applying.

즉, 본 발명에 의한 목표 유전자를 선택적으로 증폭하기 위한 프라이머의 설계 방법에서 제 1 컬럼 엔트로피는 복수개의 유전자 데이터에서 변이가 나타나는 정도를 수치화하였으며, 제 2 컬럼 엔트로피는 프라이머 내에서의 서열마다 프라이머 내에서의 위치 특이적 조건에 따른 영향을 수치화하였다. That is, in the method of designing a primer for selectively amplifying a target gene according to the present invention, the first column entropy quantifies the degree of variation appearing in a plurality of gene data, and the second column entropy is within the primer for each sequence within the primer. The influence of the site-specific conditions in was quantified.

본 발명의 목표 유전자를 검출하기 위한 프라이머 설계 방법에 있어서, 상기 제4 단계에서 프라이머 내의 특정 위치 i에서의 그래디언트 패널티(gradient penalty) 값 η(i)는 하기 식 2에 따라 산출하는 것을 특징으로 한다.In the primer design method for detecting the target gene of the present invention, in the fourth step, a gradient penalty value η (i) at a specific position i in the primer is calculated according to Equation 2 below. .

[식 2] [Equation 2]

Figure 112018090436140-pat00002
Figure 112018090436140-pat00002

(상기 식 2에서 λw는 그래디언트 패널티(gradient penalty)의 가중치, lp는 프라이머 길이, Di는 해당 프라이머의 5’ 말단에서 특정 서열 위치 i까지의 거리, τ(i)는 해당 프라이머의 특정 서열 위치 i에서의 유전적 돌연변이 유형의 수이다.)(In Equation 2, λ w is the weight of the gradient penalty, l p is the primer length, D i is the distance from the 5'end of the primer to the specific sequence position i, and τ(i) is the specificity of the primer. Is the number of the type of genetic mutation at sequence position i.)

이때 그래디언트 패널티의 가중치(λw)는 사용자에 의해 정의될 수 있으며, 0 이상의 값을 갖으며, 초기값은 1로 설정된다.At this time, the weight (λ w ) of the gradient penalty may be defined by the user, has a value of 0 or more, and the initial value is set to 1.

본 발명의 목표 유전자를 검출하기 위한 프라이머 설계 방법에 있어서, 상기 제 4 단계에서 후보 프라이머 내의 모든 위치에 대해서 각각의 열에 대한 제 2 컬럼 엔트로피(column entropy) 값은 하기 식 3에 따라 산출하는 것을 특징으로 한다. In the primer design method for detecting the target gene of the present invention, in the fourth step, the second column entropy value for each row for all positions in the candidate primer is calculated according to Equation 3 below. To do.

[식 3][Equation 3]

Figure 112018090436140-pat00003
Figure 112018090436140-pat00003

(상기 식 3에서, η(i)는 상기 식 2에 의한 특정 위치 i에서의 그래디언트 패널티(gradient penalty), entropy(i)는 상기 식 1에 의한 특정 위치에서의 컬럼 엔트로피이다.)(In Equation 3, η(i) is a gradient penalty at a specific position i according to Equation 2, and entropy(i) is a column entropy at a specific position according to Equation 1.)

본 발명의 목표 유전자를 검출하기 위한 프라이머 설계 방법에 있어서, 상기 제 5 단계에서 프라이머 엔트로피(primer entropy) 값은 상기 식 3에 의한 제 2 컬럼 엔트로피(column entropy) Q(i)를 이용하여 하기 식 4에 따라 산출하는 것을 특징으로 한다.In the primer design method for detecting the target gene of the present invention, the primer entropy value in the fifth step is the following formula using the second column entropy Q(i) according to Equation 3 above. It is characterized in that it is calculated according to 4.

[식 4][Equation 4]

Figure 112018090436140-pat00004
Figure 112018090436140-pat00004

(상기 식 4에서 K는 프라이머 길이이고, Q(i)는 상기 식 3에 의한 특정 위치 i에서의 제 2컬럼 엔트로피이다)(In Equation 4, K is the primer length, and Q(i) is the second column entropy at a specific position i according to Equation 3)

본 발명의 목표 유전자를 검출하기 위한 프라이머 설계 방법에 있어서, 상기 제 6 단계에서는 상기 제 3 단계에서 생성된 각각의 후보 프라이머에 대한 상기 제5 단계에서 산출된 프라이머 엔트로피(primer entropy) 값을 기반으로 후보 프라이머를 조합한 후보 프라이머 세트에 대해 하기 식 5에 따라 각각의 프라이머 세트에 대한 페어 매칭(pair matching) 점수를 산출하는 것을 특징으로 한다;In the primer design method for detecting the target gene of the present invention, in the sixth step, based on a primer entropy value calculated in the fifth step for each candidate primer generated in the third step. It is characterized by calculating a pair matching score for each primer set according to Equation 5 below for a candidate primer set combining the candidate primers;

[식 5][Equation 5]

Figure 112018090436140-pat00005
Figure 112018090436140-pat00005

(상기 식 5에서 Wl, Wg, Wt, Wh, Wd 및 We 는 각각 프라이머 길이, %gc, Tm, 헤어핀 형성, 다이머 형성 및 프라이머 엔트로피에 대한 가중치이다. 이 때 각각의 가중치 Wl, Wg, Wt, Wh, Wd 및 We 는 사용자에 의해 정의될 수 있으며, 0 이상의 값을 갖으며, 초기값은 1로 설정된다.(W l , W g , W t , W h , W d and W e in Equation 5 are weights for primer length, %gc, Tm, hairpin formation, dimer formation, and primer entropy, respectively. In this case, each weight is W l , W g , W t , W h , W d and W e can be defined by the user and have a value of 0 or more, and the initial value is set to 1.

lf, lr은 각각 정방향과 역방향 프라이머의 길이이며, lo는 사용자 정의에 의한 최적의 프라이머 길이이다. l f and l r are the lengths of the forward and reverse primers, respectively, and l o is the optimal primer length by user definition.

gcf, gcr은 정방향 및 역방향 프라이머의 %gc, gco는 사용자 정의에 의한 최적의 %gc 이다. gc f and gc r are %gc of the forward and reverse primers, and gc o is the optimal %gc by user definition.

hf, hr 은 정방향 및 역방향 프라이머의 헤어핀 최대 score, h f , h r is the hairpin maximum score of the forward and reverse primers,

df, dr 은 정방향 및 역방향 프라이머의 이합체(다이머) 최대 score, 및d f , d r is the maximum score of the dimer (dimer) of the forward and reverse primers, and

φf, φr은 상기 식 4에서 산출된 정방향 및 역방향 프라이머에 대한 프라이머 엔트로피임)φ f , φ r are primer entropy for forward and reverse primers calculated in Equation 4 above)

엔트로피가 낮더라도, 프라이머로써 적합한 속성을 만족하여야 한다. 본 발명에서는 이를 위하여 프라이머의 길이, GC분율, hairpin 점수, dimer점수, Tm값 중 어느 하나 이상을 반영하여 실험자가 설정한 기준 값을 기준으로 프라이머 세트를 선택하는 것이 가능하다. Even if the entropy is low, properties suitable as a primer must be satisfied. In the present invention, for this purpose, it is possible to select a primer set based on a reference value set by the experimenter by reflecting any one or more of the length of the primer, the GC fraction, the hairpin score, the dimer score, and the Tm value.

Length score = | Optimal length - primer length | Length score = | Optimal length-primer length |

GC분율 = | Optimal GC% - primer GC% | GC fraction = | Optimal GC%-primer GC% |

hairpin 점수 = Max value (3’ hairpin formation), (A/T =2, G/C=4)hairpin score = Max value (3' hairpin formation), (A/T =2, G/C=4)

dimer점수 = Max value (dimer formation), (A/T =2, G/C=4)dimer score = Max value (dimer formation), (A/T =2, G/C=4)

Tm score = | Optimal Tm - primer Tm | Tm score = | Optimal Tm-primer Tm |

너무 긴 프라이머의 사용은 프라이머 다이머(dimer)를 형성한다거나 주형의 엉뚱한 부분과 결합할 여지가 있는 서열을 더 갖게 되어 결과적으로 비특이 프라이머-주형 결합이 초래될 수 있으므로 적당한 길이에서 선정되는 것이 바람직하다. 본 발명에서는 프라이머 길이는 10-50 bp 범위에서 채택될 수 있고, 바람직하게는 10-40 bp 범위에서 채택될 수 있으며, 가장 바람직하게는 10-25 bp 범위에서 채택할 수 있다.The use of a primer that is too long may form a primer dimer or have more sequences that have room for binding to the wrong part of the template, resulting in non-specific primer-template binding, so it is preferable to select an appropriate length. . In the present invention, the primer length may be adopted in the range of 10-50 bp, preferably in the range of 10-40 bp, and most preferably in the range of 10-25 bp.

상온에서 충분한 결합력을 가지게 하기 위해서는 가급적 GC 비율을 높게 하는 것이 바람직하다. 보통 GC 비율이 높아지면 결합력이 강해진다.In order to have sufficient bonding strength at room temperature, it is desirable to increase the GC ratio as much as possible. Usually, the higher the GC ratio, the stronger the bonding force.

본 발명은 또한, 본 발명에 의한 표적 DNA 서열의 증폭을 위한 올리고 뉴클레오타이드를 포함하는 표적 DNA 서열의 증폭을 위한 조성물을 제공한다. The present invention also provides a composition for amplifying a target DNA sequence comprising an oligonucleotide for amplifying a target DNA sequence according to the present invention.

본 발명에 의한 표적 DNA 서열의 증폭을 위한 조성물은 상기 표적 DNA 서열의 증폭을 위한 올리고 뉴클레오타이드와 반응하는 카스 9 효소를 더 포함하는 것을 특징으로 한다. The composition for amplification of a target DNA sequence according to the present invention is characterized in that it further comprises a CAS 9 enzyme that reacts with an oligonucleotide for amplification of the target DNA sequence.

본 발명에 의한 표적 DNA 서열의 증폭을 위한 조성물에 있어서, 상기 DNA 증폭용 올리고 뉴클레오티드가 반응하는 카스 9 효소(Catalytically Cas 9)는 endonuclease 기능이 상실된 것을 특징으로 한다. In the composition for amplifying a target DNA sequence according to the present invention, the Cas 9 enzyme reacted with the oligonucleotide for DNA amplification (Catalytically Cas 9) is characterized in that the endonuclease function is lost.

본 발명에 의한 표적 DNA 서열의 증폭을 위한 조성물에 있어서, 상기 DNA 증폭용 올리고 뉴클레오티드가 반응하는 카스 9 효소(Catalytically Cas 9)는 Natronobacteria, Corynebacter, Sutterella, Legionella, Treponema, Filifactor, Eubacterium, Streptococcus, Lactobacillus, Mycoplasma, Bacteroides, Flaviivola, Flavobacterium, Sphaerochaeta, Azospirillum, Gluconacetobacter, Neisseria, Roseburia, Parvibaculum, Staphylococcus, Nitratifractor, Mycoplasma 및 Campylobacter으로 이루어지는 군으로부터 선택되는 미생물 속으로부터 유래한 것을 특징으로 한다. In the composition for amplification of the target DNA sequence according to the present invention, the Cas 9 enzyme reacted with the oligonucleotide for DNA amplification (Catalytically Cas 9) is Natronobacteria, Corynebacter, Sutterella, Legionella, Treponema, Filifactor, Eubacterium, Streptococcus, Lactobacillus , Mycoplasma, Bacteroides, Flaviivola, Flavobacterium, Sphaerochaeta, Azospirillum, Gluconacetobacter, Neisseria, Roseburia, Parvibaculum, Staphylococcus, Nitratifractor, Mycoplasma, and Campylobacter.

본 발명은 또한, 본 발명에 의한 표적 DNA 서열의 증폭을 위한 올리고 뉴클레오타이드를 이용한 표적 DNA 서열의 증폭 방법을 제공한다. The present invention also provides a method for amplifying a target DNA sequence using an oligonucleotide for amplifying a target DNA sequence according to the present invention.

본 발명에 의한 표적 DNA 서열의 증폭 방법은 PCR, LAMP, NGS 인 것이 가능하다. The amplification method of the target DNA sequence according to the present invention may be PCR, LAMP, or NGS.

본 발명에 의한 표적 서열의 증폭을 위한 올리고 뉴클레오타이드 및 이를 이용한 표적 서열의 증폭 방법은 CRISPER-CAS9 혹은 이에 상응하는 유전자 편집시스템을 포함하여, 표적 서열에서 결합할 수 있는 위치를 감지하고, 카스 9 효소와의 반응을 통해 특별한 장비 없이 실온에서 표적 서열에 결합하여 증폭되는 효과를 나타낸다. The oligonucleotide for amplification of the target sequence according to the present invention and the method of amplifying the target sequence using the same include CRISPER-CAS9 or a gene editing system corresponding thereto, detecting a position capable of binding in the target sequence, and CAS 9 enzyme It exhibits the effect of binding and amplifying the target sequence at room temperature without special equipment through reaction with

도 1 은 종래 CRISPER-CAS9 시스템을 나타낸다.
도 2 는 본 발명에 의하여 표적 서열이 증폭되는 과정을 나타낸다.
1 shows a conventional CRISPER-CAS9 system.
2 shows the process of amplifying a target sequence according to the present invention.

표적 DNA 서열에 대한 혼성화하고, 카스 9 효소(Catalytically Cas 9)와 반응하는 표적 DNA 서열 증폭용 올리고 뉴클레오티드를 이용한 표적 DNA 서열의 증폭 방법으로, 상기 올리고뉴클레오티드는:
복수 개의 유전자 데이터들을 다중 서열 정렬(Multiple sequence alignment) 하는 제1 단계;
상기 제1 단계에서 다중 서열 정렬된 유전자 데이터 각각의 컬럼(column)에 대한 제 1 컬럼 엔트로피(column entropy)를 산출하는 제2 단계;
상기 제2 단계에서 다중 서열 정렬된 유전자 서열의 첫번째 염기서열로부터 마지막 염기서열까지 전체 서열에 대해 프라이머의 시작 위치 및 프라이머의 길이를 변경시키면서 정방향과 역방향의 후보 프라이머를 생성하는 제 3단계;
상기 제3 단계에서 생성된 정방향과 역방향의 후보 프라이머 내의 서열에 대해 상기 제 2단계의 컬럼 엔트로피(column entropy) 값에 후보 프라이머 내에서의 위치 정보를 반영한 위치 특이적 그래디언트 패널티(gradient penalty) 값을 적용하여 제 2 컬럼 엔트로피를 산출하는 제4 단계;
상기 정방향과 역방향의 후보 프라이머 내의 모든 서열 위치에서의 제 2 컬럼 엔트로피를 합산하여 정방향과 역방향의 후보 프라이머에 대한 프라이머 엔트로피(primer entropy) 를 산출하는 제5 단계;
상기 제5 단계의 프라이머 엔트로피(primer entropy) 값을 기반으로 프라이머의 길이, GC분률(%gc), Tm 온도, 헤어핀(hairpin) 또는 다이머(dimer) 점수 중 어느 하나 이상을 반영하여 정방향 및 역방향 프라이머의 프라이머 세트 매칭 점수를 산출하는 제6 단계; 및
상기 프라이머 세트 매칭 점수를 바탕으로 정방향 및 역방향 프라이머를 선택하는 제 7 단계;를 포함하는 방법에 의해 설계되는 것을 특징으로 한다.
A method for amplifying a target DNA sequence using an oligonucleotide for amplifying a target DNA sequence that hybridizes to a target DNA sequence and reacts with a Cas 9 enzyme (Catalytically Cas 9), wherein the oligonucleotide comprises:
A first step of performing multiple sequence alignment of a plurality of gene data;
A second step of calculating a first column entropy for each column of gene data aligned with multiple sequences in the first step;
A third step of generating forward and reverse candidate primers while changing the starting position of the primer and the length of the primer for the entire sequence from the first nucleotide sequence to the last nucleotide sequence of the multi-sequence aligned gene sequence in the second step;
For the sequence in the forward and reverse candidate primers generated in the third step, a position-specific gradient penalty value reflecting the position information in the candidate primer in the column entropy value of the second step Applying a fourth step of calculating a second column entropy;
A fifth step of calculating primer entropy for the forward and reverse candidate primers by summing the entropy of the second column at all sequence positions in the forward and reverse candidate primers;
Forward and reverse primers reflecting any one or more of the primer length, GC fraction (%gc), Tm temperature, hairpin or dimer score based on the primer entropy value of the fifth step. A sixth step of calculating a primer set matching score of; And
It characterized in that it is designed by a method comprising; a seventh step of selecting forward and reverse primers based on the primer set matching score.

Claims (12)

표적 DNA 서열에 대한 혼성화하고, 카스 9 효소(Catalytically Cas 9)와 반응하는 표적 DNA 서열 증폭용 올리고 뉴클레오티드를 이용한 표적 DNA 서열의 증폭 방법으로, 상기 올리고뉴클레오티드는:
복수 개의 유전자 데이터들을 다중 서열 정렬(Multiple sequence alignment) 하는 제1 단계;
상기 제1 단계에서 다중 서열 정렬된 유전자 데이터 각각의 컬럼(column)에 대한 제 1 컬럼 엔트로피(column entropy)를 산출하는 제2 단계;
상기 제2 단계에서 다중 서열 정렬된 유전자 서열의 첫번째 염기서열로부터 마지막 염기서열까지 전체 서열에 대해 프라이머의 시작 위치 및 프라이머의 길이를 변경시키면서 정방향과 역방향의 후보 프라이머를 생성하는 제 3단계;
상기 제3 단계에서 생성된 정방향과 역방향의 후보 프라이머 내의 서열에 대해 상기 제 2단계의 컬럼 엔트로피(column entropy) 값에 후보 프라이머 내에서의 위치 정보를 반영한 위치 특이적 그래디언트 패널티(gradient penalty) 값을 적용하여 제 2 컬럼 엔트로피를 산출하는 제4 단계;
상기 정방향과 역방향의 후보 프라이머 내의 모든 서열 위치에서의 제 2 컬럼 엔트로피를 합산하여 정방향과 역방향의 후보 프라이머에 대한 프라이머 엔트로피(primer entropy) 를 산출하는 제5 단계;
상기 제5 단계의 프라이머 엔트로피(primer entropy) 값을 기반으로 프라이머의 길이, GC분률(%gc), Tm 온도, 헤어핀(hairpin) 또는 다이머(dimer) 점수 중 어느 하나 이상을 반영하여 정방향 및 역방향 프라이머의 프라이머 세트 매칭 점수를 산출하는 제6 단계; 및
상기 프라이머 세트 매칭 점수를 바탕으로 정방향 및 역방향 프라이머를 선택하는 제 7 단계;를 포함하는 방법에 의해 설계되는 것을 특징으로 하는 것인, 방법.
A method for amplifying a target DNA sequence using an oligonucleotide for amplifying a target DNA sequence that hybridizes to a target DNA sequence and reacts with a Cas 9 enzyme (Catalytically Cas 9), wherein the oligonucleotide comprises:
A first step of performing multiple sequence alignment of a plurality of gene data;
A second step of calculating a first column entropy for each column of gene data aligned with multiple sequences in the first step;
A third step of generating forward and reverse candidate primers while changing the starting position of the primer and the length of the primer for the entire sequence from the first nucleotide sequence to the last nucleotide sequence of the multi-sequence aligned gene sequence in the second step;
For the sequence in the forward and reverse candidate primers generated in the third step, a position-specific gradient penalty value reflecting the position information in the candidate primer in the column entropy value of the second step Applying a fourth step of calculating a second column entropy;
A fifth step of calculating primer entropy for the forward and reverse candidate primers by summing the entropy of the second column at all sequence positions in the forward and reverse candidate primers;
Forward and reverse primers reflecting any one or more of the primer length, GC fraction (%gc), Tm temperature, hairpin or dimer score based on the primer entropy value of the fifth step. A sixth step of calculating a primer set matching score of; And
The method characterized in that it is designed by a method comprising; a seventh step of selecting forward and reverse primers based on the primer set matching score.
제 1 항에 있어서,
상기 DNA 증폭용 올리고 뉴클레오티드는 5' 인산화된 것인
방법.
The method of claim 1,
The DNA amplification oligonucleotide is 5'phosphorylated
Way.
제 1 항에 있어서,
상기 DNA 증폭용 올리고 뉴클레오티드가 반응하는 카스 9 효소(Catalytically Cas 9)는 endonuclease 기능이 상실된 것인
방법
The method of claim 1,
The DNA amplification oligonucleotide reacts with the Cas 9 enzyme (Catalytically Cas 9) is the endonuclease function is lost
Way
제 1 항에 있어서,
상기 DNA 증폭용 올리고 뉴클레오티드가 반응하는 카스 9 효소(Catalytically Cas 9)는
Natronobacteria, Corynebacter, Sutterella, Legionella, Treponema, Filifactor, Eubacterium, Streptococcus, Lactobacillus, Mycoplasma, Bacteroides, Flaviivola, Flavobacterium, Sphaerochaeta, Azospirillum, Gluconacetobacter, Neisseria, Roseburia, Parvibaculum, Staphylococcus, Nitratifractor, Mycoplasma 및 Campylobacter으로 이루어지는 군으로부터 선택되는 미생물 속으로부터 유래한 것인
방법.
The method of claim 1,
The Cas 9 enzyme reacted with the DNA amplification oligonucleotide (Catalytically Cas 9)
Selected from the group consisting of Natronobacteria, Corynebacter, Sutterella, Legionella, Treponema, Filifactor, Eubacterium, Streptococcus, Lactobacillus, Mycoplasma, Bacteroides, Flaviivola, Flavobacterium, Sphaerochaeta, Azospirillum, Gluconacetobacter, Neisseria, Roseburybacteria, Parvibaculum, and Niisseria, Roseburybacteria, Parvibaculum Is derived from the microorganism
Way.
제 1 항에 있어서,
상기 표적 DNA 서열 증폭용 올리고 뉴클레오티드는 DNA 서열인 것인
방법.
The method of claim 1,
The oligonucleotide for amplifying the target DNA sequence is a DNA sequence
Way.
제1항에 있어서,
상기 제2 단계에서 제 1 컬럼 엔트로피(column entropy) 값은 하기 식 1에 따라 산출하는 것인, 방법.
[식 1]
Figure 112020074860146-pat00008

(상기 식 1 에서 Pa 는 해당위치의 유전자 변이 분율, K는 다중 서열 처리를 한 종의 개수로 컬럼 높이, i는 다중 서열 정렬된 유전자 데이터에서 유전자의 특정 위치를 나타냄)
The method of claim 1,
In the second step, the first column entropy value is calculated according to Equation 1 below.
[Equation 1]
Figure 112020074860146-pat00008

(In Equation 1, Pa is the gene mutation fraction at the corresponding position, K is the column height as the number of species subjected to multiple sequence processing, and i represents a specific position of the gene in the multi-sequence aligned gene data)
제1항에 있어서,
상기 제4 단계에서의 그래디언트 패널티(gradient penalty) 값 η(i)는 하기 식 2에 의한 것인, 방법.
[식 2]
Figure 112020074860146-pat00009

(상기 식 2에서 λ는 그래디언트 패널티(gradient penalty)의 가중치, lp는 프라이머 길이, Di는 해당 프라이머의 5' 말단에서 특정 서열 위치 i까지의 거리, τ는 해당 프라이머의 특정 서열 위치 i에서의 유전적 돌연변이 유형의 수이다.)
The method of claim 1,
The gradient penalty value η(i) in the fourth step is according to Equation 2 below.
[Equation 2]
Figure 112020074860146-pat00009

(In Equation 2, λ is the weight of the gradient penalty, lp is the primer length, Di is the distance from the 5'end of the primer to the specific sequence position i, and τ is the inheritance at the specific sequence position i of the primer. It is the number of enemy mutation types.)
제6항 또는 제7항에 있어서,
상기 제4 단계에서 프라이머 내에서의 각각의 열에 대한 제 2 컬럼 엔트로피(column entropy) 값은 하기 식 3에 따라 산출하는 것인, 방법.
[식 3]
Figure 112020074860146-pat00010

(상기 식 3에서, η(i)는 상기 식 2에 의한 특정 위치 i에서의 그래디언트 패널티(gradient penalty), entropy(i)는 상기 식 1에 의한 특정 위치에서의 컬럼 엔트로피이다.)
The method according to claim 6 or 7,
In the fourth step, the second column entropy value for each row in the primer is calculated according to Equation 3 below.
[Equation 3]
Figure 112020074860146-pat00010

(In Equation 3, η(i) is a gradient penalty at a specific position i according to Equation 2, and entropy(i) is a column entropy at a specific position according to Equation 1.)
제8항에 있어서,
상기 제5 단계에서 프라이머 엔트로피(primer entropy) 값은 하기 식 4에 따라 산출하는 것인 방법.
[식 4]
Figure 112020074860146-pat00011

(상기 식 4에서 K는 프라이머 길이이고, Q(i)는 상기 식 3에 의한 특정 위치 i에서의 제 2컬럼 엔트로피이다)
The method of claim 8,
In the fifth step, the primer entropy value is calculated according to Equation 4 below.
[Equation 4]
Figure 112020074860146-pat00011

(In Equation 4, K is the primer length, and Q(i) is the second column entropy at a specific position i according to Equation 3)
제9항에 있어서,
상기 제6 단계에서 프라이머 세팅 매칭 점수는 하기 식 5에 따라 산출하는 것인, 방법.
[식 5]
Figure 112020074860146-pat00012

(상기 식 5에서 Wl, Wg, Wt, Wh, Wd 및 We 는 각각 프라이머 길이, %gc, Tm, 헤어핀 형성, 다이머 형성 및 프라이머 엔트로피에 대한 가중치이다. 이 때 각각의 가중치 Wl, Wg, Wt, Wh, Wd 및 We 는 사용자에 의해 정의될 수 있으며, 0 이상의 값을 갖으며, 초기값은 1로 설정된다.
lf, lr은 각각 정방향과 역방향 프라이머의 길이이며, lo는 사용자 정의에 의한 최적의 프라이머 길이이다.
gcf, gcr은 정방향 및 역방향 프라이머의 %gc, gco는 사용자 정의에 의한 최적의 %gc 이다.
hf, hr 은 정방향 및 역방향 프라이머의 헤어핀 최대 score,
df, dr 은 정방향 및 역방향 프라이머의 이합체(다이머) 최대 score, 및
φf, φr은 상기 식 4에서 산출된 정방향 및 역방향 프라이머에 대한 프라이머 엔트로피이다)
The method of claim 9,
In the sixth step, the primer setting matching score is calculated according to Equation 5 below.
[Equation 5]
Figure 112020074860146-pat00012

(W l , W g , W t , W h , W d and W e in Equation 5 are weights for primer length, %gc, Tm, hairpin formation, dimer formation, and primer entropy, respectively. In this case, each weight is W l , W g , W t , W h , W d and W e can be defined by the user and have a value of 0 or more, and the initial value is set to 1.
l f and l r are the lengths of the forward and reverse primers, respectively, and l o is the optimal primer length by user definition.
gc f and gc r are %gc of the forward and reverse primers, and gc o is the optimal %gc by user definition.
h f , h r is the hairpin maximum score of the forward and reverse primers,
d f , d r is the maximum score of the dimer (dimer) of the forward and reverse primers, and
φ f and φ r are the primer entropy for the forward and reverse primers calculated in Equation 4 above)
제 1 항에 의한 표적 DNA 서열의 증폭을 위한 올리고 뉴클레오타이드를 이용한 표적 DNA 서열의 증폭 방법
A method of amplifying a target DNA sequence using an oligonucleotide for amplifying a target DNA sequence according to claim 1
제 11 항에 있어서,
상기 표적 DNA 서열의 증폭 방법은 PCR, LAMP, 또는 NGS 인 것인
표적 DNA 서열의 증폭 방법
The method of claim 11,
The method of amplifying the target DNA sequence is PCR, LAMP, or NGS.
Amplification method of target DNA sequence
KR1020180108615A 2018-09-12 2018-09-12 Nucleotide for amplification of target nucleic acid sequence and amplification mathod usning the same KR102200109B1 (en)

Priority Applications (2)

Application Number Priority Date Filing Date Title
KR1020180108615A KR102200109B1 (en) 2018-09-12 2018-09-12 Nucleotide for amplification of target nucleic acid sequence and amplification mathod usning the same
PCT/KR2018/013318 WO2020054907A1 (en) 2018-09-12 2018-11-05 Oligonucleotides for target sequence amplification, and target sequence amplification method using same

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020180108615A KR102200109B1 (en) 2018-09-12 2018-09-12 Nucleotide for amplification of target nucleic acid sequence and amplification mathod usning the same

Publications (2)

Publication Number Publication Date
KR20200030166A KR20200030166A (en) 2020-03-20
KR102200109B1 true KR102200109B1 (en) 2021-01-08

Family

ID=69777215

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020180108615A KR102200109B1 (en) 2018-09-12 2018-09-12 Nucleotide for amplification of target nucleic acid sequence and amplification mathod usning the same

Country Status (2)

Country Link
KR (1) KR102200109B1 (en)
WO (1) WO2020054907A1 (en)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015116686A1 (en) 2014-01-29 2015-08-06 Agilent Technologies, Inc. Cas9-based isothermal method of detection of specific dna sequence
WO2018061695A1 (en) 2016-09-29 2018-04-05 富士フイルム株式会社 Method for designing primers for multiplex pcr

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101886381B1 (en) * 2014-05-28 2018-08-10 기초과학연구원 A method for isolating target DNA using inactivated site-specific nuclease
WO2017100343A1 (en) * 2015-12-07 2017-06-15 Arc Bio, Llc Methods and compositions for the making and using of guide nucleic acids

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015116686A1 (en) 2014-01-29 2015-08-06 Agilent Technologies, Inc. Cas9-based isothermal method of detection of specific dna sequence
WO2018061695A1 (en) 2016-09-29 2018-04-05 富士フイルム株式会社 Method for designing primers for multiplex pcr

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Brodin 등, BMC Bioinformatics., Vol. 14, No. 255, 페이지 1-9 (2013.)

Also Published As

Publication number Publication date
WO2020054907A1 (en) 2020-03-19
KR20200030166A (en) 2020-03-20

Similar Documents

Publication Publication Date Title
US11692213B2 (en) Compositions and methods for targeted depletion, enrichment, and partitioning of nucleic acids using CRISPR/Cas system proteins
US20230123754A1 (en) RNA-DIRECTED DNA CLEAVAGE BY THE Cas9-crRNA COMPLEX
Wang et al. Precise, predictable multi-nucleotide deletions in rice and wheat using APOBEC–Cas9
JP2021087454A (en) Crispr enabled multiplexed genome engineering
Tseng et al. A novel megaprimed and ligase-free, PCR-based, site-directed mutagenesis method
JP6745599B2 (en) Preparation of molecule
JP5725540B2 (en) Methods for in vitro linking and combinatorial assembly of nucleic acid molecules
US5514568A (en) Enzymatic inverse polymerase chain reaction
US10982200B2 (en) Enzymes with RuvC domains
WO2017172860A1 (en) Methods and compositions for the single tube preparation of sequencing libraries using cas9
IL288263B (en) Crispr hybrid dna/rna polynucleotides and methods of use
JPH1066576A (en) Double-stranded dna having protruding terminal and shuffling method using the same
CN114075559B (en) 2-type CRISPR/Cas9 gene editing system and application thereof
JP6994730B2 (en) Genome editing method for filamentous fungus genome editing by direct introduction of protein
KR102200109B1 (en) Nucleotide for amplification of target nucleic acid sequence and amplification mathod usning the same
US20230220434A1 (en) Composistions and methods for crispr enabled dna synthesis
EP2152901B1 (en) Method for introducing common and/or individual sequence elements in a target nucleic acid molecule
JP2023121643A (en) Type ii crispr/cas9 genome editing system and the application thereof
Shankar et al. Restriction endonucleases
JP5129498B2 (en) Nucleic acid cloning method
WO2015089339A2 (en) Compositions, methods and kits for dna fragmentation and tagmentation
US20210355519A1 (en) Demand synthesis of polynucleotide sequences
Tang et al. Single transcript unit CRISPR 2.0 systems for genome editing in rice
JP7125727B1 (en) Compositions for modifying nucleic acid sequences and methods for modifying target sites in nucleic acid sequences
GB2617659A (en) Enzymes with RUVC domains

Legal Events

Date Code Title Description
E701 Decision to grant or registration of patent right
GRNT Written decision to grant