KR20220106079A - Genome replacement and insertion technology using reverse transcriptase based on Francisella novicida Cas9 module - Google Patents

Genome replacement and insertion technology using reverse transcriptase based on Francisella novicida Cas9 module Download PDF

Info

Publication number
KR20220106079A
KR20220106079A KR1020220009084A KR20220009084A KR20220106079A KR 20220106079 A KR20220106079 A KR 20220106079A KR 1020220009084 A KR1020220009084 A KR 1020220009084A KR 20220009084 A KR20220009084 A KR 20220009084A KR 20220106079 A KR20220106079 A KR 20220106079A
Authority
KR
South Korea
Prior art keywords
leu
lys
ile
ala
glu
Prior art date
Application number
KR1020220009084A
Other languages
Korean (ko)
Inventor
이승환
김선욱
오윤선
박영호
Original Assignee
한국생명공학연구원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국생명공학연구원 filed Critical 한국생명공학연구원
Publication of KR20220106079A publication Critical patent/KR20220106079A/en

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/102Mutagenizing nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Zoology (AREA)
  • Molecular Biology (AREA)
  • Organic Chemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biomedical Technology (AREA)
  • Biotechnology (AREA)
  • Wood Science & Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • Plant Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Medicinal Chemistry (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Mycology (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Epidemiology (AREA)
  • Animal Behavior & Ethology (AREA)
  • Public Health (AREA)
  • Veterinary Medicine (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

The present invention relates to a genome replacement and insertion technology using reverse transcriptase based on the Francisella novicida Cas9 module. Since the gene replacement and insertion technology according to the present invention has a different nick position formed in a non-target strand inside a target DNA, the technology has an advantage capable of expanding the existing insertion and replacement technology.

Description

Francisella novicida Cas9 모듈 기반의 역전사 효소를 사용한 유전체 치환 및 삽입 기술 {Genome replacement and insertion technology using reverse transcriptase based on Francisella novicida Cas9 module}{Genome replacement and insertion technology using reverse transcriptase based on Francisella novicida Cas9 module}

본 발명은 프란시셀라 노비시다(Francisella novicida) Cas9 모듈 기반의 역전사 효소를 사용한 유전체 치환 및 삽입 기술에 관한 것이다.The present invention relates to a genome replacement and insertion technology using a reverse transcriptase based on a Francisella novicida Cas9 module.

CRISPR-Cas9 system은 표적 유전자 염기서열에 따른 DNA binding domain을 매번 새로 만들 필요 없이 가이드 RNA 염기서열만 교체하여 쉽게 활용할 수 있고 제작이 용이하여 표적 유전체 교정시 효과적으로 사용되고 있다. The CRISPR-Cas9 system can be easily utilized by replacing only the guide RNA sequence without the need to create a new DNA binding domain according to the target gene sequence every time.

최근 새롭게 제시된 RT(reverse-transcriptase) 효소 기반 표적 DNA 외부 유전자 삽입 기술 (Prime editing)은 S.pyogene Cas9 (SpCas9) 모듈을 기반으로 작동하나, 비표적 삽입, 다중 유전자 표적의 어려움 등의 단점이 지적되고 있어 많은 개선의 여지를 가지고 있다. The recently proposed RT (reverse-transcriptase) enzyme-based target DNA external gene insertion technology ( prime editing) works based on the S. There is a lot of room for improvement.

Reverse transcriptase(RT)를 CRISPR-SpCas9 모듈에 결합하여 외부 유전자를 목표 DNA에 삽입하는 prime editing 기술의 경우 기존에 염기 치환 기술로 표적하지 못했던 병원성 mutation (pyrimidine(C,T) 내지 purine(A,G) 또는 purine(A,G) 내지 pyrimidine(C,T) transversion)까지 교정을 할 수 있다는 장점이 있기 때문에, 현재까지 보고된 병원성 돌연변이(mutation)들의 90% 이상 복구가 가능한 것으로 조사되고 있다. In the case of prime editing technology, which combines reverse transcriptase (RT) with the CRISPR-SpCas9 module and inserts an external gene into the target DNA, pathogenic mutations (pyrimidine(C,T) or purine(A,G) ) or purine (A, G) to pyrimidine (C, T) transversion), since it has the advantage of being able to correct, it is being investigated that more than 90% of the pathogenic mutations reported so far can be recovered.

그러나, 질병을 유발하는 많은 mutation 중, singe-gene disorder disease에 비해 polygenic disease가 흔한데, S.pyogene Cas9 기반의 Prime editing만으로는 이의 모든 교정이 쉽지 않다. However, among many disease-causing mutations, polygenic disease is more common than singe-gene disorder disease.

즉, 현재 SpCas9을 기반으로 하는 Prime editing 기술은 표적하는 target site가 여러 locus에 존재하게 될 경우 비표적 교정 이슈와 가이드 중복 이슈 때문에 multiple locus targeting이 사실상 어렵다. 또한, SpCas9 기반 Prime editing 기술은 표적 DNA 상의 PAM(NGG) 사이트로부터 3bp 거리에 유전자 삽입 및 치환이 가능하기 때문에 PAM 제한성이 있다는 점을 해소하지 않는 이상 이의 활용 측면에 상당한 제한이 있을 것으로 판단된다. In other words, with the current SpCas9-based Prime editing technology, when the target site exists in multiple locus, multiple locus targeting is practically difficult due to non-target correction issues and guide duplication issues. In addition, since SpCas9-based Prime editing technology allows gene insertion and substitution at a distance of 3bp from the PAM (NGG) site on the target DNA, it is judged that there will be significant limitations in its application unless the limitation of PAM is resolved.

이러한 배경 하에, 본 발명자들은 기존 prime editing 기술을 확장하여 FnCas9 기반의 prime editing 기술을 새롭게 제시하여, 비표적 특이성을 감소시키고 인체 대상 유전자 치료제 개발시 안전성을 증진시킨 새로운 기술을 개발하여 본 발명을 완성하였다. Under this background, the present inventors have completed the present invention by extending the existing prime editing technology and presenting a new FnCas9-based prime editing technology to develop a new technology that reduces off-target specificity and improves safety when developing gene therapy for human subjects. did.

본 발명자들은 FnCas9(H969A)이 SpCas9(H840A)과 비교하여 표적 DNA에 nick을 형성하는 위치가 다르기 때문에(FnCas9(H969A)의 경우 PAM으로부터 6bp 떨어지는 반면, SpCas9(H840A)의 경우 PAM으로부터 3bp 떨어짐), 기존의 교정 기술보다 유전체 교정이 용이함(유전체 교정 확장성 증가)을 확인하여 본 발명을 완성하였다. 더욱이, FnCas9이 인식하는 guide RNA scaffold 구조가 SpCas9과 다르기 때문에, FnCas9 기반 prime editing 기술을 기존 SpCas9 기반 prime editing 기술과 동시 적용함으로써 다중 유전자내 각각의 염기서열에 대해 서로 간섭없이 prime editing을 통한 외부 유전자 삽입 또는 치환이 가능하게 할 수 있다. 또한, 신규 FnCas9 모듈 기반 prime editing을 통해 polygenic 유래한 질병의 치료 및 다중 유전자 동시 교정에 응용할 수 있는 multiplexed prime editing 기술을 수행할 수 있다. The present inventors found that FnCas9(H969A) has a different nick-forming position on the target DNA compared to SpCas9(H840A) (6bp away from PAM for FnCas9(H969A), whereas 3bp away from PAM for SpCas9(H840A)) , completed the present invention by confirming that genome editing is easier (increasing genome editing scalability) than the existing correction technology. Moreover, since the guide RNA scaffold structure recognized by FnCas9 is different from that of SpCas9, by simultaneously applying FnCas9-based prime editing technology with existing SpCas9-based prime editing technology, each nucleotide sequence within multiple genes is subjected to prime editing without interfering with each other. Insertion or substitution may be made possible. In addition, multiplexed prime editing technology that can be applied to the treatment of polygenic diseases and simultaneous correction of multiple genes can be performed through prime editing based on the novel FnCas9 module.

이에 본 발명은 Francisella novicida Cas9 단백질; Accordingly, the present invention is Francisella novicida Cas9 protein;

역전사 효소 단백질; 및reverse transcriptase protein; and

프라임 편집 가이드 RNA (PEgRNA)를 포함하는 프라임 편집 복합체로서, 프라임 편집 가이드 RNA (PEgRNA)는 연장 아암 (extension arm)을 가지는 프라임 편집 복합체를 제공하는 것을 목적으로 한다. A prime editing complex comprising a prime editing guide RNA (PEgRNA), wherein the prime editing guide RNA (PEgRNA) aims to provide a prime editing complex having an extension arm.

본 발명은 또한 Francisella novicida Cas9 단백질; 역전사 효소 단백질; 및 프라임 편집 가이드 RNA (PEgRNA)를 포함하는 프라임 편집 복합체를 코딩하는 1개 이상의 폴리뉴클레오티드를 제공하는 것을 목적으로 한다.The present invention also relates to Francisella novicida Cas9 protein; reverse transcriptase protein; and one or more polynucleotides encoding a prime editing complex comprising a prime editing guide RNA (PEgRNA).

본 발명은 또한 Francisella novicida Cas9 단백질 및 역전사 효소 단백질을 코딩하는 폴리뉴클레오티드를 제공하는 것을 목적으로 한다. Another object of the present invention is to provide a polynucleotide encoding a Francisella novicida Cas9 protein and a reverse transcriptase protein.

본 발명은 또한 Francisella novicida Cas9 단백질 및 역전사 효소 단백질을 코딩하는 폴리뉴클레오티드를 포함하는 벡터를 제공하는 것을 목적으로 한다. Another object of the present invention is to provide a vector comprising a polynucleotide encoding a Francisella novicida Cas9 protein and a reverse transcriptase protein.

본 발명은 또한 프라임 편집 가이드 RNA (PEgRNA)를 코딩하는 폴리뉴클레오티드를 포함하는 벡터를 제공하는 것을 목적으로 한다. The present invention also aims to provide a vector comprising a polynucleotide encoding a prime editing guide RNA (PEgRNA).

본 발명은 또한 Francisella novicida Cas9 단백질 및 역전사 효소 단백질을 코딩하는 폴리뉴클레오티드를 포함하는 벡터; 및 프라임 편집 가이드 RNA (PEgRNA)를 코딩하는 폴리뉴클레오티드를 포함하는 벡터를 포함하는 프라임 편집 복합체 시스템을 제공하는 것을 목적으로 한다. The present invention also relates to a vector comprising a polynucleotide encoding a Francisella novicida Cas9 protein and a reverse transcriptase protein; And it aims to provide a prime editing complex system comprising a vector comprising a polynucleotide encoding a prime editing guide RNA (PEgRNA).

본 발명은 또한 Francisella novicida Cas9 단백질 및 역전사 효소 단백질을 코딩하는 폴리뉴클레오티드를 포함하는 벡터; 및 프라임 편집 가이드 RNA (PEgRNA)를 코딩하는 폴리뉴클레오티드를 포함하는 벡터를 포함하는 프라임 편집 복합체를 포함하는 유전자 교정용 조성물을 제공하는 것을 목적으로 한다. The present invention also relates to a vector comprising a polynucleotide encoding a Francisella novicida Cas9 protein and a reverse transcriptase protein; And it aims to provide a composition for gene editing comprising a prime editing complex comprising a vector comprising a polynucleotide encoding the prime editing guide RNA (PEgRNA).

본 발명은 또한 Francisella novicida Cas9 단백질 및 역전사 효소 단백질을 코딩하는 폴리뉴클레오티드를 포함하는 벡터; 및 프라임 편집 가이드 RNA (PEgRNA)를 코딩하는 폴리뉴클레오티드를 포함하는 벡터를 포함하는 프라임 편집 복합체를 포함하는 약제학적 조성물을 제공하는 것을 목적으로 한다. The present invention also relates to a vector comprising a polynucleotide encoding a Francisella novicida Cas9 protein and a reverse transcriptase protein; It is an object of the present invention to provide a pharmaceutical composition comprising a prime editing complex comprising a vector comprising a polynucleotide encoding a prime editing guide RNA (PEgRNA).

본 발명은 또한 Francisella novicida Cas9 단백질; 역전사 효소 단백질; 및 프라임 편집 가이드 RNA (PEgRNA)를 포함하는 프라임 편집 복합체를 포함하는 세포를 제공 하는 것을 목적으로 한다.The present invention also relates to Francisella novicida Cas9 protein; reverse transcriptase protein; And it aims to provide a cell comprising a prime editing complex comprising a prime editing guide RNA (PEgRNA).

본 발명은 또한 핵산 서열을 프라임 편집 복합체와 접촉시키는 단계를 포함하여 핵산 서열에 치환, 결실, 삽입 또는 이의 조합을 제공하는 방법으로써, The invention also provides a method of providing a substitution, deletion, insertion or combination thereof in a nucleic acid sequence comprising contacting the nucleic acid sequence with a prime editing complex, the method comprising:

상기 방법은 (i) 이중 가닥 DNA 서열을 표적 가닥 (또는 PAM 가닥) 상에서 닉킹하고, 3' 단부를 갖는 유리 단일 가닥 DNA를 생성하는 것;The method comprises (i) nicking a double-stranded DNA sequence onto a target strand (or PAM strand) and generating free single-stranded DNA having a 3' end;

(ii) 유리 단일 가닥 DNA의 3' 단부를 가이드 RNA의 프라이머 결합 부위에 혼성화시킴으로써, 폴리머라제를 프라이밍하는 것; (ii) priming the polymerase by hybridizing the 3' end of the free single-stranded DNA to the primer binding site of the guide RNA;

(iii) 3' 단부로부터 DNA의 가닥을 중합시킴으로써, 뉴클레오티드 변화를 포함하는 단일 가닥 DNA 플랩을 생성하는 것; 및(iii) polymerizing a strand of DNA from the 3' end, thereby creating a single-stranded DNA flap comprising a nucleotide change; and

(iv) 표적 가닥 (또는 PAM 가닥) 상의 절단 부위의 하류에 바로 인접한 내인성 DNA 가닥을 단일 가닥 DNA 플랩으로 대체함으로써, 이중 가닥 DNA 서열에 목적하는 뉴클레오티드 변화를 제공하는 것을 포함하는 것인, 핵산 서열에 치환, 결실, 삽입 또는 이의 조합을 제공하는 방법을 제공하는 것을 목적으로 한다. (iv) replacing the endogenous DNA strand immediately downstream of the cleavage site on the target strand (or PAM strand) with a single stranded DNA flap, thereby providing the desired nucleotide change in the double stranded DNA sequence. An object of the present invention is to provide a method for providing substitution, deletion, insertion or a combination thereof.

본 발명은 또한 핵산 서열을 프라임 편집 복합체와 접촉시키는 단계를 포함하여 유전자를 교정하는 방법을 제공하는 것을 목적으로 한다.The present invention also aims to provide a method for correcting a gene comprising the step of contacting a nucleic acid sequence with a prime editing complex.

본 발명은 또한 핵산 서열을 프라임 편집 복합체와 접촉시키는 단계를 포함하여 유전자 산물의 발현을 변경시키는 방법을 제공하는 것을 목적으로 한다. The present invention also aims to provide a method for altering the expression of a gene product comprising the step of contacting the nucleic acid sequence with a prime editing complex.

본 발명은 또한 핵산 서열을 프라임 편집 복합체와 접촉시키는 단계를 포함하여 돌연변이 또는 단일-뉴클레오티드 다형태(SNP)와 관련된 질환의 치료 방법을 제공하는 것을 목적으로 한다. The present invention also aims to provide a method of treating a disease associated with a mutation or single-nucleotide polymorphism (SNP) comprising the step of contacting the nucleic acid sequence with a prime editing complex.

본 발명은 Francisella novicida Cas9 단백질; 역전사 효소 단백질; 및The present invention is Francisella novicida Cas9 protein; reverse transcriptase protein; and

프라임 편집 가이드 RNA (PEgRNA)를 포함하는 프라임 편집 복합체, 또는 프라임 편집 복합체를 코딩하는 1개 이상의 폴리뉴클레오티드, 또는 이들 폴리뉴클레오티드를 포함하는 1 이상의 벡터 또는 세포를 포함하는 약제학적 조성물을 제공하는 것을 목적으로 한다. It is an object to provide a pharmaceutical composition comprising a prime editing complex comprising a prime editing guide RNA (PEgRNA), or one or more polynucleotides encoding the prime editing complex, or one or more vectors or cells comprising these polynucleotides do it with

본 발명은 (1) Francisella novicida Cas9 단백질; 역전사 효소 단백질; 및The present invention relates to (1) Francisella novicida Cas9 protein; reverse transcriptase protein; and

프라임 편집 가이드 RNA (PEgRNA)를 포함하는 프라임 편집 복합체, 또는 프라임 편집 복합체를 코딩하는 1개 이상의 폴리뉴클레오티드, 또는 이들 폴리뉴클레오티드를 포함하는 1 이상의 벡터 또는 세포, 및 (2) 약제학적으로 허용가능한 담체를 포함하는 약제학적 조성물을 제공하는 것을 목적으로 한다. a prime editing complex comprising a prime editing guide RNA (PEgRNA), or one or more polynucleotides encoding the prime editing complex, or one or more vectors or cells comprising these polynucleotides, and (2) a pharmaceutically acceptable carrier An object of the present invention is to provide a pharmaceutical composition comprising a.

본 발명은 Francisella novicida Cas9 단백질; 역전사 효소 단백질; 및The present invention is Francisella novicida Cas9 protein; reverse transcriptase protein; and

프라임 편집 가이드 RNA (PEgRNA)를 포함하는 프라임 편집 복합체, 또는 프라임 편집 복합체를 코딩하는 1개 이상의 폴리뉴클레오티드, 또는 이들 폴리뉴클레오티드를 포함하는 1 이상의 벡터 또는 세포를 포함하는 돌연변이 또는 단일-뉴클레오티드 다형태(SNP)와 관련된 질환의 예방 또는 치료용 약제학적 조성물을 제공하는 것을 목적으로 한다.A mutant or single-nucleotide polymorphism comprising a prime editing complex comprising a prime editing guide RNA (PEgRNA), or one or more polynucleotides encoding the prime editing complex, or one or more vectors or cells comprising these polynucleotides ( An object of the present invention is to provide a pharmaceutical composition for preventing or treating diseases related to SNP).

이하 본 발명에 대해 구체적으로 설명한다. Hereinafter, the present invention will be described in detail.

본 발명에 따른 기술은 아래와 같은 특징을 가진다:The technology according to the invention has the following features:

1. CRISPR-Cas9 ortholog 중 하나인 FnCas9(Francicella novicida Cas9) 모듈을 사용하여 역전사 효소(reverse transcriptase)를 결합하여 표적 DNA 염기서열에 외부 유전자를 삽입하거나 치환할 수 있는 기술(prime editing)에 해당한다. 1. It corresponds to a technology that can insert or substitute a foreign gene into the target DNA sequence by binding reverse transcriptase using the FnCas9 ( Franicella novicida Cas9 ) module, one of the CRISPR-Cas9 orthologs (prime editing). .

2. FnCas9(Francicella novicida Cas9) 모듈을 사용한 외부 유전자 삽입 및 치환 기술 (prime editing)은 기존 SpCas9 에 비하여 표적 DNA 내부 non-target strand 에 형성되는 nick position이 다르기 때문에 기존 유전체 삽입 및 치환 기술을 확장할 수 있다는 장점을 가진다. 2. External gene insertion and substitution technology (prime editing) using FnCas9 ( Franicella novicida Cas9 ) module is different from the existing SpCas9 in that the nick position formed on the non-target strand inside the target DNA is different, so it is possible to expand the existing genome insertion and substitution technology. has the advantage of being able to

3. FnCas9(Francicella novicida Cas9) 모듈을 사용한 외부 유전자 삽입 및 치환 기술 (prime editing)은 기존 SpCas9을 사용한 prime editing 기술보다 비표적 바인딩이 적어 표적 특이성(안전성)이 높아 보다 정확한 prime editing을 수행할 수 있다. 3. External gene insertion and substitution technology (prime editing) using the FnCas9 ( Franicella novicida Cas9 ) module has less non-target binding than the existing prime editing technology using SpCas9, so it has higher target specificity (safety), so more accurate prime editing can be performed. have.

4. FnCas9(Francicella novicida Cas9) prime editor(역전사 효소 결합)와 기존 SpCas9 prime editor를 복합하여 사용시 상호 교차 간섭이 없기 때문에 다중 유전자의 외부 유전자 삽입 및 치환이 용이하다는 장점을 가진다. 4. When using the FnCas9 ( Francicella novicida Cas9 ) prime editor (reverse transcriptase linkage) and the existing SpCas9 prime editor in combination, there is no cross-interference, so it has the advantage of easy insertion and substitution of external genes of multiple genes.

5. FnCas9 모듈을 엔지니어링 하여 다양한 PAM 염기서열 인식이 가능하거나 성질을 개선하여 효과적인 FnCas9 prime editor(FnCas9-PE)를 개발할 수 있다. 5. By engineering the FnCas9 module, it is possible to recognize various PAM sequences or to improve the properties to develop an effective FnCas9 prime editor (FnCas9-PE).

6. FnCas9(H969A)-PE를 SpCas9 nickase (H840A)와 목표 염기서열에 동시 사용하여 NTS(non-target strand) 와 TS(target strand)에 각각 nick을 생성하여 외부 유전자가 FnCas9-PE에 의하여 삽입되는 효율을 증폭할 수 있다. 6. FnCas9(H969A)-PE is used simultaneously with SpCas9 nickase (H840A) and the target sequence to generate nicks in NTS (non-target strand) and TS (target strand), respectively, and foreign genes are inserted by FnCas9-PE efficiency can be amplified.

본 발명은 Francisella novicida Cas9 단백질; The present invention is Francisella novicida Cas9 protein;

역전사 효소 단백질; 및reverse transcriptase protein; and

프라임 편집 가이드 RNA (PEgRNA)를 포함하는 프라임 편집 복합체로서, 프라임 편집 가이드 RNA (PEgRNA)는 연장 아암 (extension arm)을 가지는 프라임 편집 복합체를 제공한다. A prime editing complex comprising a prime editing guide RNA (PEgRNA), wherein the prime editing guide RNA (PEgRNA) provides a prime editing complex having an extension arm.

본 발명의 일 실시양태에 따르면, 본 발명은 Francisella novicida Cas9 단백질; According to one embodiment of the present invention, the present invention relates to a Francisella novicida Cas9 protein;

역전사 효소 단백질; 및reverse transcriptase protein; and

프라임 편집 가이드 RNA (PEgRNA)를 포함하는 프라임 편집 복합체로서, A prime editing complex comprising a prime editing guide RNA (PEgRNA), comprising:

상기 프라임 편집 가이드 RNA (PEgRNA)는 프라이머 결합 부위(Primer binding site, PBS), 편집 주형(Scaffold) 및 상동성 아암(extension arm)을 포함하는 것을 제공한다. The prime editing guide RNA (PEgRNA) provides that it includes a primer binding site (PBS), an editing template (Scaffold) and a homology arm (extension arm).

프라임 편집Prime Edit

"프라임 편집"은 게놈 편집을 위한 플랫폼으로써 Cas9 단백질을 사용하여 명시된 DNA 부위 내로 새로운 유전자 정보를 직접 기록하는 다목적의 정확한 게놈 편집 방법이며, 여기서 프라임 편집 시스템은 표적 부위를 명시하고 또한 가이드 RNA 상에 (예를 들어, 5' 또는 3' 단부에 또는 가이드 RNA의 내부 부분에) 조작된 연장부 (DNA 또는 RNA)에 의해 대체 DNA 가닥의 형태로 목적하는 편집의 합성의 주형이 되는 프라임 편집 (PE) 가이드 RNA ("PEgRNA")로 프로그램화된다. 목적하는 편집 (예를 들어, 단일 핵염기 치환)을 함유하는 대체 가닥은 편집될 표적 부위의 내인성 가닥과 동일한 서열을 공유한다. DNA 복구 및/또는 복제 기구를 통해, 표적 부위의 내인성 가닥은 목적하는 편집을 함유하는 새로 합성된 대체 가닥에 의해 대체된다. 구체적으로, Cas9 단백질-역전사 효소 단백질을 사용하여 가이드 RNA에 의해 특이적 DNA 서열을 표적화하고, 표적 부위에서 단일 가닥 닉을 생성하고, 닉킹된 DNA를 가이드 RNA와 통합된 역전사 효소 단백질의 역전사를 위한 프라이머로서 사용하는 방식을 이용한다. "Prime editing" is a versatile, accurate genome editing method that directly records new genetic information into a specified DNA site using the Cas9 protein as a platform for genome editing, wherein the prime editing system specifies the target site and also on the guide RNA. Prime editing (PE) to be the template for the synthesis of the desired editing in the form of an alternative DNA strand by means of an engineered extension (DNA or RNA) (e.g., at the 5' or 3' end or on the inner portion of the guide RNA) ) is programmed with a guide RNA (“PEgRNA”). The replacement strand containing the desired edit (eg, a single nucleobase substitution) shares the same sequence as the endogenous strand of the target site to be edited. Through DNA repair and/or replication machinery, the endogenous strand of the target site is replaced by a newly synthesized replacement strand containing the desired edit. Specifically, a Cas9 protein-reverse transcriptase protein is used to target a specific DNA sequence by a guide RNA, generate a single-stranded nick at the target site, and convert the nicked DNA into a guide RNA for reverse transcription of the integrated reverse transcriptase protein. The method used as a primer is used.

프라임 편집은 표적 DNA 분자를 프라임 편집 가이드 RNA (PEgRNA)와 복합체화된 Francisella novicida Cas9 단백질과 접촉시킴으로써 작동한다Prime editing works by contacting a target DNA molecule with the Francisella novicida Cas9 protein complexed with a prime editing guide RNA (PEgRNA).

프라임 편집 가이드 RNA (PEgRNA)는 가이드 RNA의 3' 또는 5' 단부에 또는 가이드 RNA 내의 분자내 위치에 연장부를 포함하고, 목적하는 뉴클레오티드 변화 (예를 들어, 단일 뉴클레오티드 변화, 삽입 또는 결실)를 코딩한다. Francisella novicida Cas9 단백질/연장된 gRNA 복합체는 DNA 분자와 접촉하고, 연장된 gRNA는 Francisella novicida Cas9 단백질이 표적 유전자좌에 결합하도록 가이드한다.A prime editing guide RNA (PEgRNA) comprises an extension at the 3' or 5' end of the guide RNA or at an intramolecular location within the guide RNA and encodes a desired nucleotide change (e.g., a single nucleotide change, insertion or deletion). do. The Francisella novicida Cas9 protein/extended gRNA complex contacts the DNA molecule, and the extended gRNA guides the Francisella novicida Cas9 protein to bind to the target locus.

그리고 나서, 표적 유전자좌의 DNA의 가닥 중 하나에 닉을 도입하여, 표적 유전자좌의 가닥 중 하나에 이용가능한 3' 단부를 생성한다. 다음으로, DNA 가닥의 3' 단부 (닉에 의해 형성됨)는 역전사를 프라이밍하기 위해 (즉, "표적-프라이밍된 RT") 가이드 RNA의 연장된 부분과 상호작용한다. 특정 실시양태에서, 3' 단부 DNA 가닥은 가이드 RNA의 연장된 부분 상의 특이적 RT 프라이밍 서열, 즉 PEgRNA 상의 "역전사 효소 프라이밍 서열" 또는 "프라이머 결합 부위"에 혼성화한다. 다음으로, 프라이밍된 부위의 3' 단부로부터 프라임 편집 가이드 RNA의 5' 단부를 향해 DNA의 단일 가닥을 합성하는 역전사 효소가 도입된다. 이는 목적하는 뉴클레오티드 변화 (예를 들어, 단일 염기 변화, 삽입 또는 결실 또는 그의 조합)를 포함하고, 그 외에는 닉 부위의 또는 그에 인접한 내인성 DNA에 상동인 단일 가닥 DNA 플랩을 형성한다. 그리고 나서, Francisella novicida Cas9 및 가이드 RNA가 방출된다. 마지막으로, 목적하는 뉴클레오티드 변화가 표적 유전자좌 내로 혼입되도록 하는 단일 가닥 DNA 플랩의 분해에 관한 것이다. 이러한 과정은 3' 단일가닥 DNA 플랩이 내인성 DNA 서열에 침입하고 혼성화하였을 때 형성되는 상응하는 5' 내인성 DNA 플랩을 제거함으로써, 목적하는 생성물 형성을 향해 구동될 수 있다. 이러한 과정은 또한 제2 가닥 닉킹"에 의해 생성물 형성을 향해 구동될 수 있다. 이 과정은 앞서 언급한 전환, 전이, 결실 및 삽입 중 적어도 하나 이상을 도입할 수 있다.A nick is then introduced into one of the strands of the DNA of the target locus, making a 3' end available for one of the strands of the target locus. Next, the 3' end of the DNA strand (formed by the nick) interacts with the extended portion of the guide RNA to prime reverse transcription (ie, “target-primed RT”). In certain embodiments, the 3' end DNA strand hybridizes to a specific RT priming sequence on the extended portion of the guide RNA, i.e., a “reverse transcriptase priming sequence” or “primer binding site” on the PEgRNA. Next, a reverse transcriptase enzyme is introduced that synthesizes a single strand of DNA from the 3' end of the primed site towards the 5' end of the prime editing guide RNA. It contains the desired nucleotide changes (eg, single base changes, insertions or deletions, or combinations thereof) and otherwise forms a single-stranded DNA flap homologous to endogenous DNA at or adjacent to the nick site. Then, Francisella novicida Cas9 and guide RNA are released. Finally, it relates to the degradation of single-stranded DNA flaps that allow for the incorporation of desired nucleotide changes into the target locus. This process can be driven towards the desired product formation by eliminating the corresponding 5' endogenous DNA flap, which is formed when a 3' single-stranded DNA flap invades and hybridizes to an endogenous DNA sequence. This process may also be driven towards product formation by "second strand nicking. This process may introduce at least one or more of the aforementioned conversions, transfers, deletions and insertions.

"프라임 편집 (PE) 시스템", "프라임 편집 (PE)" 또는 "PE 시스템"은 "Prime Edit (PE) System", "Prime Edit (PE)" or "PE System"

Francisella novicida Cas9 단백질, 역전사 효소, 및 프라임 편집 가이드 RNA를 포함하는 복합체, 뿐만 아니라 프라임 편집 과정을 편집된 생성물 형성을 향해 구동시키는 것을 돕기 위한 보조 요소, 예컨대 표적 DNA target-strand (TS)에 닉을 형성하는 제2 가닥 닉킹 성분 (예를 들어, 제2 가닥 sgRNA) 및 5' 내인성 DNA 플랩 제거 엔도뉴클레아제 (예를 들어, FEN1)를 포함하나 이에 제한되지는 않는 게놈 편집 방법에 수반되는 조성물을 지칭한다.A complex comprising Francisella novicida Cas9 protein, reverse transcriptase, and prime editing guide RNA, as well as auxiliary elements to help drive the prime editing process towards edited product formation, such as the target DNA target-strand (TS) Compositions involved in genome editing methods including, but not limited to, forming a second strand nicking component (e.g., second strand sgRNA) and a 5' endogenous DNA flap removal endonuclease (e.g., FEN1) refers to

예시적으로 아래와 같이 PE 시스템이 구성될 수 있다: By way of example, the PE system may be configured as follows:

[NLS]-[Francisella novicida Cas9(H969A)]-[링커]-[MMLV_RT(wt)] + 목적하는 PEgRNA[NLS]-[ Francisella novicida Cas9 (H969A)]-[Linker]-[MMLV_RT(wt)] + PEgRNA of interest

[NLS]-[Francisella novicida Cas9(H969A)]-[링커]-[MMLV_RT(D200N)(T330P)(L603W)(T306K)(W313F)] + 목적하는 PEgRNA[NLS]-[ Francisella novicida Cas9 (H969A)]-[Linker]-[MMLV_RT(D200N)(T330P)(L603W)(T306K)(W313F)] + PEgRNA of interest

본 발명에서 Francisella novicida Cas9 단백질 및 역전사 효소 단백질이 프라임 편집 가이드 RNA (PEgRNA)와 복합체화된 경우 표적 DNA 서열에 결합할 수 있다. In the present invention, when the Francisella novicida Cas9 protein and the reverse transcriptase protein are complexed with a prime editing guide RNA (PEgRNA), they can bind to a target DNA sequence.

본 발명에 따른 according to the invention

PE 시스템은 표적 또는 상보적 비-표적 가닥(non-target strand)이 닉킹되어 유리 3' 말단부를 갖는 프라이밍 서열을 가지는 것일 수 있다. 이러한 닉 부위가 PAM 서열의 5' 말단부로터 6 bp upstream (-6)인 PE 시스템일 수 있다. The PE system may be one in which the target or complementary non-target strand is nicked to have a priming sequence with a free 3' end. This nick site may be a PE system, 6 bp upstream (-6) from the 5' end of the PAM sequence.

본 발명에 따른 프라임 편집기(PE)는 Francisella novicida Cas9 단백질 및 역전사 효소를 포함하는 것을 의미하고 이를 별개로 또는 융합 단백질과 같은 융합 구축물로써 이용할 수 있다. 이는 PEgRNA (또는 "연장된 가이드 RNA")의 존재 하에 표적 뉴클레오티드 서열 상에서 프라임 편집을 수행할 수 있다. The prime editor (PE) according to the present invention means that it includes a Francisella novicida Cas9 protein and a reverse transcriptase and can be used separately or as a fusion construct such as a fusion protein. It can perform prime editing on the target nucleotide sequence in the presence of PEgRNA (or "extended guide RNA").

Cas9Cas9

용어 "Cas9" 또는 "Cas9 뉴클레아제"는 Cas9 도메인 또는 그의 단편 (예를 들어, Cas9의 활성 또는 불활성 DNA 절단 도메인 및/또는 Cas9의 gRNA 결합 도메인을 포함하는 단백질)을 포함하는 RNA-가이드 뉴클레아제를 지칭한다.The term “Cas9” or “Cas9 nuclease” refers to an RNA-guided nuclease comprising a Cas9 domain or fragment thereof (eg, a protein comprising an active or inactive DNA cleavage domain of Cas9 and/or a gRNA binding domain of Cas9). refers to cleavage.

Francisella novicida Cas9 단백질이란 닉카제 활성을 가지는 Francisella novicida 유래 Cas9 또는 이의 기능적 등가물로써 Francisella novicida 유래 뉴클레아제 활성 Cas9, 뉴클레아제 불활성 Cas9 (dCas9) 또는 Cas9 닉카제 (nCas9)일 수 있다. Francisella novicida Cas9 protein may be Francisella novicida- derived Cas9 having nickase activity or a functional equivalent thereof, and may be Francisella novicida- derived nuclease-active Cas9, nuclease-inactive Cas9 (dCas9) or Cas9 nickase (nCas9).

뉴클레아제-불활성화된 Cas9 도메인은 상호교환가능하게 "dCas9" 단백질 (뉴클레아제-"기능상실" Cas9의 경우)로 지칭될 수 있다. 불활성 DNA 절단 도메인을 갖는 Cas9 도메인 (또는 그의 단편)을 생성하는 방법은 공지되어 있다.The nuclease-inactivated Cas9 domain may be interchangeably referred to as a “dCas9” protein (for nuclease-“dysfunctional” Cas9). Methods for generating a Cas9 domain (or fragment thereof) having an inactive DNA cleavage domain are known.

예를 들어, Francisella novicida 에 있어서 돌연변이 H969A는 Francisella novicida Cas9의 뉴클레아제 활성을 완전히 불활성화시킨다. 이에 따라, 본 발명에 따른 Francisella novicida는 모서열로부터 돌연변이 H969A를 포함하는 것으로 Francisella novicida Cas9(H969A)일 수 있다. For example, in Francisella novicida , mutation H969A completely inactivates the nuclease activity of Francisella novicida Cas9 . Accordingly, Francisella novicida according to the present invention may be Francisella novicida Cas9 (H969A) including the mutation H969A from the parent sequence.

보다 구체적으로, Francisella novicida에서 유래하는 Cas9은 서열번호 1의 아미노산 서열을 갖는 것일 수 있다. More specifically, Cas9 derived from Francisella novicida may have the amino acid sequence of SEQ ID NO: 1.

"dCas9" 단백질로서 Francisella novicida Cas9(H969A)는 예를 들어 서열번호 2의 아미노산 서열을 가지는 것일 수 있다. 본 발명에 따른 Francisella novicida Cas9은 변경된 PAM 특이성을 가진다. 구체적으로, 표적 DNA에 nick을 형성하는 위치가 PAM 으로부터 6-8bp 떨어진 곳에 발생하기 때문에 유전자 교정의 확장성을 크게 증대시킨다. As a "dCas9" protein, Francisella novicida Cas9 (H969A) may have, for example, the amino acid sequence of SEQ ID NO: 2. Francisella novicida Cas9 according to the present invention has altered PAM specificity. Specifically, the scalability of gene editing is greatly increased because the nick-forming site on the target DNA occurs 6-8bp away from the PAM.

본 발명에 따르면 상기 Francisella novicida Cas9은 이의 전장 단백질 서열 또는 이의 단편이 사용될 수 있다. Francisella novicida Cas9 또는 그의 단편을 포함하는 단백질은 "Francisella novicida Cas9 변이체"로 지칭될 수 있으며, 위 언급된 단백질에 대한 상동성을 공유한다.According to the present invention, for Francisella novicida Cas9 , its full-length protein sequence or a fragment thereof may be used. Proteins comprising Francisella novicida Cas9 or fragments thereof may be referred to as " Francisella novicida Cas9 variants" and share homology to the above-mentioned proteins.

예를 들어, 서열번호 2의 Francisella novicida Cas9(H969A)에 대하여 적어도 적어도 약 95% 동일하거나, 적어도 약 96% 동일하거나, 적어도 약 97% 동일하거나, 적어도 약 98% 동일하거나, 적어도 약 99% 동일하거나, 적어도 약 99.5% 동일하거나, 적어도 약 99.8% 동일하거나 또는 적어도 약 99.9% 동일한 것일 수 있다. For example, at least about 95% identical, at least about 96% identical, at least about 97% identical, at least about 98% identical, or at least about 99% identical to Francisella novicida Cas9 (H969A) of SEQ ID NO: 2 or at least about 99.5% identical, at least about 99.8% identical, or at least about 99.9% identical.

본 발명에 따른 Francisella novicida Cas9(H969A)는 HNH 뉴클레아제 도메인 내의 탈활성화 돌연변이를 가지는 것일 수 있다. Francisella novicida Cas9 (H969A) according to the present invention may have a deactivating mutation in the HNH nuclease domain.

"닉카제"는 2개의 뉴클레아제 도메인 중 하나가 불활성화된 Cas9를 지칭한다. 이 효소는 표적 DNA의 한 가닥만을 절단할 수 있다"Nickase" refers to Cas9 in which one of the two nuclease domains is inactivated. This enzyme can only cleave one strand of the target DNA

역전사 효소(reverse transcriptase. RT) 단백질 reverse transcriptase (RT) protein

역전사 효소"는 RNA-의존성 DNA 폴리머라제로서 특징화되는 폴리머라제의 부류를 기재한다. 모든 공지된 역전사 효소는 RNA 주형으로부터 DNA 전사체를 합성하기 위한 프라이머를 필요로 한다."Reverse transcriptase" describes a class of polymerases that are characterized as RNA-dependent DNA polymerases. All known reverse transcriptases require a primer to synthesize a DNA transcript from an RNA template.

역전사 효소는 주로 mRNA를 cDNA로 전사하는데 사용되어 왔으며, 이는 이어서 추가의 조작을 위해 벡터 내로 클로닝될 수 있다. 효소는 5'-3' RNA-지시된 DNA 폴리머라제 활성, 5'-3' DNA-지시된 DNA 폴리머라제 활성 및 RNase H 활성을 갖는다. Reverse transcriptase has been mainly used to transcribe mRNA into cDNA, which can then be cloned into a vector for further manipulation. The enzyme has 5'-3' RNA-directed DNA polymerase activity, 5'-3' DNA-directed DNA polymerase activity and RNase H activity.

가이드 RNA와 통합된 RT 주형을 기반으로 하는 단일 가닥 DNA 플랩의 합성 동안, 오류-유발 역전사 효소는 RT 주형 서열과 미스매칭된 1개 이상의 뉴클레오티드를 도입하여, 단일 가닥 DNA 플랩의 오류성 중합을 통해 뉴클레오티드 서열에 변화를 도입할 수 있다. 이어서, 단일 가닥 DNA 플랩의 합성 동안 도입된 이들 오류는 상응하는 내인성 표적 가닥에 대한 혼성화, 내인성 대체된 가닥의 제거, 라이게이션을 통해 및 활성에 있어서 오류-유발성인 특정 역전사 효소의 특성을 지칭한다.During the synthesis of a single-stranded DNA flap based on an RT template integrated with a guide RNA, error-causing reverse transcriptase introduces one or more nucleotides that are mismatched with the RT template sequence, through error polymerization of the single-stranded DNA flap. Changes can be introduced in the nucleotide sequence. These errors introduced during the synthesis of single-stranded DNA flaps then refer to the properties of certain reverse transcriptases that are error-prone in activity and through hybridization to the corresponding endogenous target strand, removal of the endogenous replaced strand, ligation. .

이러한 예시적인 역전사 효소는 예를 들어, 임의의 자연 발생 돌연변이체 RT, 조작된 돌연변이체 RT, 또는 기능을 보유하는 말단 절단된 변이체를 포함한 다른 변이체 RT를 사용할 수 있다. Such exemplary reverse transcriptase enzymes may use, for example, any naturally occurring mutant RT, engineered mutant RT, or other variant RT, including truncated variants that retain function.

보다 구체적으로, 역전사 효소는 전형적으로 RNA- 및 DNA-의존성 DNA 중합 활성을 비롯한 3가지 효소적 활성, 및 RNA-DNA 하이브리드에서 RNA의 절단을 촉매하는 RNaseH 활성을 갖는 다기능성 효소이다. 역전사 효소의 일부 돌연변이체는 RNaseH 모이어티를 무력화시켜 mRNA에 대한 의도하지 않은 손상을 방지한다. 주형으로서 mRNA를 사용하여 상보적 DNA (cDNA)를 합성하는 이들 효소가 RNA 바이러스에서 최초로 확인되었다.More specifically, reverse transcriptases are multifunctional enzymes that typically have three enzymatic activities, including RNA- and DNA-dependent DNA polymerization activities, and an RNaseH activity that catalyzes the cleavage of RNA in RNA-DNA hybrids. Some mutants of reverse transcriptase incapacitate the RNaseH moiety, preventing unintended damage to mRNA. These enzymes that synthesize complementary DNA (cDNA) using mRNA as a template were first identified in RNA viruses.

후속적으로, 바이러스 입자, 세포 또는 조직으로부터 역전사 효소가 직접 단리 및 정제되었다.Subsequently, reverse transcriptase was isolated and purified directly from viral particles, cells or tissues.

(예를 들어, 문헌 [Kacian et al., 1971, Biochim. Biophys. Acta 46: 365-83; Yang et al., 1972, Biochem. Biophys. Res. Comm. 47: 505-11; Gerard et al., 1975, J. Virol. 15: 785-97; Liu et al., 1977, Arch. Virol. 55 187-200; Kato et al., 1984, J. Virol. Methods 9: 325-39; Luke et al., 1990, Biochem. 29: 1764-69 and Le Grice et al., 1991, J. Virol. 65: 7004-07] 참조, 이들 각각은 참조로 포함됨). 보다 최근에, 열안정성, 충실도 및 활성과 같은 개선된 특성에 대한 연구에서 돌연변이체 및 융합 단백질이 생성되었다.(See, e.g., Kacian et al., 1971, Biochim. Biophys. Acta 46: 365-83; Yang et al., 1972, Biochem. Biophys. Res. Comm. 47: 505-11; Gerard et al. , 1975, J. Virol. 15: 785-97; Liu et al., 1977, Arch. Virol. 55 187-200; Kato et al., 1984, J. Virol. Methods 9: 325-39; Luke et al ., 1990, Biochem. 29: 1764-69 and Le Grice et al., 1991, J. Virol. 65: 7004-07, each of which is incorporated by reference). More recently, mutants and fusion proteins have been generated in the search for improved properties such as thermostability, fidelity and activity.

관련 기술분야에 공지되어 있거나 또는 관련 기술분야에 공지된 방법을 사용하여 제조될 수 있는 역전사 효소의 야생형, 변이체, 및/또는 돌연변이체 형태 중 임의의 것이 본원에서 고려된다.Any of the wild-type, variant, and/or mutant forms of a reverse transcriptase known in the art or that can be prepared using methods known in the art are contemplated herein.

역전사 효소 (RT) 유전자 (또는 그 안에 함유된 유전자 정보)는 다수의 상이한 공급원으로부터 수득될 수 있다. 예를 들어, 유전자는 레트로바이러스로 감염된 진핵 세포로부터, 또는 레트로바이러스 게놈의 부분 또는 전체를 함유하는 다수의 플라스미드로부터 수득될 수 있다. 또한, RT 유전자를 함유하는 메신저 RNA-유사 RNA는 레트로바이러스로부터 수득될 수 있다. RT에 대한 공급원의 예는 몰로니 뮤린 백혈병 바이러스 (MMLV 또는 MLVRT); 인간 T-세포 백혈병 바이러스 유형 1 (HTLV-1); 소 백혈병 바이러스 (BLV); 라우스 육종 바이러스 (RSV); 인간 면역결핍 바이러스 (HIV); 효모, 예컨대 사카로미세스(Saccharomyces), 뉴로스포라 (Neurospora), 드로소필라(Drosophila); 영장류; 및 설치류를 포함하나 이에 제한되지는 않는다. 예를 들어, 문헌 [Weiss, et al., 미국 특허 번호 4,663,290 (1987); Gerard, G. R., DNA:271-79 (1986); Kotewicz, M. L., et al., Gene 35:249-58 (1985); Tanese, N., et al., Proc. Natl. Acad. Sci. (USA):4944-48 (1985);The reverse transcriptase (RT) gene (or the genetic information contained therein) can be obtained from a number of different sources. For example, a gene can be obtained from a eukaryotic cell infected with a retrovirus, or from multiple plasmids containing part or all of the retroviral genome. In addition, messenger RNA-like RNA containing the RT gene can be obtained from a retrovirus. Examples of sources for RT include Moloney Murine Leukemia Virus (MMLV or MLVRT); human T-cell leukemia virus type 1 (HTLV-1); bovine leukemia virus (BLV); roux sarcoma virus (RSV); human immunodeficiency virus (HIV); Yeasts such as Saccharomyces, Neurospora, Drosophila; primates; and rodents. See, eg, Weiss, et al., US Pat. No. 4,663,290 (1987); Gerard, G. R., DNA:271-79 (1986); Kotewicz, M. L., et al., Gene 35:249-58 (1985); Tanese, N., et al., Proc. Natl. Acad. Sci. (USA):4944-48 (1985);

Roth, M. J., et al., J. Biol. Chem. 260:9326-35 (1985); Michel, F., et al., Nature 316:641-43 (1985); Akins, R. A., et al., Cell 47:505-16 (1986), EMBO J. 4:1267-75 (1985); 및 Fawcett, D. F., Cell 47:1007-15 (1986)]을 참조한다 (각각은 그 전문이 본원에 참조로 포함됨).Roth, M. J., et al., J. Biol. Chem. 260:9326-35 (1985); Michel, F., et al., Nature 316:641-43 (1985); Akins, R. A., et al., Cell 47:505-16 (1986), EMBO J. 4:1267-75 (1985); and Fawcett, D. F., Cell 47:1007-15 (1986), each of which is incorporated herein by reference in its entirety.

야생형 RTwild-type RT

M-MLV 역전사 효소 및 RSV 역전사 효소를 포함할 수 있으나 이에 제한되지는 않는다. 역전사 효소 활성을 갖는 효소는 상업적으로 입수가능하다. 특정 실시양태에서, 역전사 효소는 프라임 편집제 (PE) 시스템의 다른 성분에 트랜스로 제공된다. 즉, 역전사 효소는 개별 성분으로서 발현되거나 또는 달리 제공되며, 즉 napDNAbp와의 융합 단백질로서가 아니다.M-MLV reverse transcriptase and RSV reverse transcriptase. Enzymes with reverse transcriptase activity are commercially available. In certain embodiments, the reverse transcriptase is provided in trans to another component of the prime editor (PE) system. That is, the reverse transcriptase is expressed or otherwise provided as a separate component, ie not as a fusion protein with napDNAbp.

관련 기술분야의 통상의 기술자는 몰로니 뮤린 백혈병 바이러스 (M-MLV); 인간 면역결핍 바이러스 (HIV) 역전사 효소 및 조류 육종-백혈증 바이러스 (ASLV) 역전사 효소, 예컨대 비제한적으로 라우스 육종 바이러스 (RSV) 역전사 효소, 조류 골수모구증 바이러스 (AMV) 역전사 효소, 조류 적모구증 바이러스 (AEV) 헬퍼 바이러스 MCAV 역전사 효소, 조류 골수구종증 바이러스 MC29 헬퍼 바이러스 MCAV 역전사 효소, 조류 세망내피증 바이러스 (REV-T) 헬퍼 바이러스 REV-A 역전사 효소, 조류 육종 바이러스 UR2 헬퍼 바이러스 UR2AV 역전사 효소, 조류 육종 바이러스 Y73 헬퍼 바이러스 YAV 역전사 효소, 라우스 연관 바이러스 (RAV) 역전사 효소, 및 골수모구증 연관 바이러스 (MAV) 역전사 효소를 포함하나 이에 제한되지는 않는 야생형 역전사 효소가 본원에 기재된 대상 방법 및 조성물에 적합하게 사용될 수 있다는 것을 인식할 것이다.Those of ordinary skill in the art are skilled in the art of Moloney murine leukemia virus (M-MLV); Human immunodeficiency virus (HIV) reverse transcriptase and avian sarcoma-leukemia virus (ASLV) reverse transcriptase such as, but not limited to, Rous sarcoma virus (RSV) reverse transcriptase, avian myeloblastosis virus (AMV) reverse transcriptase, avian erythroblastosis virus (AEV) helper virus MCAV reverse transcriptase, avian myelocytosis virus MC29 helper virus MCAV reverse transcriptase, avian reticuloendotheliosis virus (REV-T) helper virus REV-A reverse transcriptase, avian sarcoma virus UR2 helper virus UR2AV reverse transcriptase, avian Wild-type reverse transcriptases including, but not limited to, sarcoma virus Y73 helper virus YAV reverse transcriptase, Rous-associated virus (RAV) reverse transcriptase, and myeloblastosis-associated virus (MAV) reverse transcriptase are suitable for the subject methods and compositions described herein. will recognize that it can be used

변이체 및 오류-유발 RTVariant and error-prone RT

역전사 효소는 RNA 주형으로부터 상보적 DNA (cDNA) 가닥을 합성하는데 필수적이다. 역전사 효소는 상이한 생화학적 활성을 나타내는 별개의 도메인으로 구성된 효소이다. 효소는 하기와 같이 RNA 주형으로부터 DNA의 합성을 촉매한다: 어닐링된 프라이머의 존재 하에, 역전사 효소는 RNA 주형에 결합하여 중합 반응을 개시한다. RNA-의존성 DNA 폴리머라제 활성은 상보적 DNA (cDNA) 가닥을 합성하여, dNTP를 혼입시킨다. RNase H 활성은 DNA:RNA 복합체의 RNA 주형을 분해한다. 따라서, 역전사 효소는 (a) RNA/DNA 하이브리드를 인식하고 이에 결합하는 결합 활성, (b) RNA-의존성 DNA 폴리머라제 활성, 및 (c) RNase H 활성을 포함한다. 또한, 역전사 효소는 일반적으로 그의 열안정성, 프로세싱성 (dNTP 혼입 속도), 및 충실도 (또는 오류율)를 비롯한 다양한 속성을 갖는 것으로 간주된다. 본원에서 고려되는 역전사 효소 변이체는 이들 효소적 활성 (예를 들어, RNA-의존성 DNA 폴리머라제 활성, RNase H 활성, 또는 DNA/RNA 하이브리드-결합 활성) 또는 효소 특성 (예를 들어, 열안정성, 프로세싱성, 또는 충실도) 중 어느 하나 이상에 영향을 미치거나 이를 변화시키는 역전사 효소에 대한 임의의 돌연변이를 포함할 수 있다. 이러한 변이체는 관련 기술분야에서 공공 도메인에서 입수가능하거나, 상업적으로 입수가능하거나, 또는 방향적 진화상 과정 (예를 들어, PACE 또는 PANCE)을 포함한 공지된 돌연변이유발 방법을 사용하여 제조될 수 있다.Reverse transcriptase is essential for synthesizing a complementary DNA (cDNA) strand from an RNA template. Reverse transcriptases are enzymes composed of distinct domains that exhibit different biochemical activities. The enzyme catalyzes the synthesis of DNA from the RNA template as follows: In the presence of annealed primers, the reverse transcriptase binds to the RNA template and initiates the polymerization reaction. RNA-dependent DNA polymerase activity synthesizes complementary DNA (cDNA) strands to incorporate dNTPs. RNase H activity degrades the RNA template of the DNA:RNA complex. Thus, reverse transcriptases include (a) binding activity that recognizes and binds to RNA/DNA hybrids, (b) RNA-dependent DNA polymerase activity, and (c) RNase H activity. In addition, reverse transcriptases are generally considered to have various properties including their thermostability, processability (rate of dNTP incorporation), and fidelity (or error rate). Reverse transcriptase variants contemplated herein have their enzymatic activity (e.g., RNA-dependent DNA polymerase activity, RNase H activity, or DNA/RNA hybrid-binding activity) or enzymatic properties (e.g., thermostability, processing sex, or fidelity); Such variants are available in the public domain, commercially available in the art, or can be prepared using known mutagenesis methods, including directed evolutionary processes (eg, PACE or PANCE).

다양한 실시양태에서, 역전사 효소는 변이체 역전사 효소일 수 있다. 본원에 사용된 "변이체 역전사 효소"는 참조 서열 (예를 들어, 참조 야생형 서열)에 비해 1개 이상의 돌연변이 (단일 돌연변이, 역위, 결실, 삽입, 및 재배열 포함)를 포함하는 임의의 자연 발생 또는 유전자 조작된 변이체를 포함한다. RT는 자연적으로 RNA-의존성 DNA 폴리머라제 활성, 리보뉴클레아제 H 활성, 및 DNA-의존성 DNA 폴리머라제 활성을 비롯한 여러 활성을 갖는다. 집합적으로, 이들 활성은 효소가 단일 가닥 RNA를 이중 가닥 cDNA로 전환시킬 수 있게 한다. 레트로바이러스 및 레트로트랜스포손에서, 이러한 cDNA는 이어서 숙주 게놈 내로 통합될 수 있고, 이로부터 숙주-세포 전사를 통해 새로운 RNA 카피가 제조될 수 있다. 변이체 RT는 이들 활성 중 1종 이상에 영향을 미치는 (이들 활성을 감소 또는 증가시키거나, 또는 이들 활성을 모두 함께 제거하는) 돌연변이를 포함할 수 있다. 또한, 변이체 RT는 RT를 더 안정하게 또는 덜 안정하게 하고, 응집 경향을 낮추고, 정제 및/또는 검출, 및/또는 특성 또는 특징의 다른 변형을 용이하게 하는 1개 이상의 돌연변이를 포함할 수 있다.In various embodiments, the reverse transcriptase may be a variant reverse transcriptase. As used herein, "variant reverse transcriptase" refers to any naturally occurring or genetically engineered variants. RT naturally has several activities, including RNA-dependent DNA polymerase activity, ribonuclease H activity, and DNA-dependent DNA polymerase activity. Collectively, these activities enable enzymes to convert single-stranded RNA into double-stranded cDNA. In retroviruses and retrotransposons, this cDNA can then be integrated into the host genome, from which a new RNA copy can be made via host-cell transcription. Variant RTs can include mutations that affect one or more of these activities (either reducing or increasing these activities, or eliminating them all together). In addition, a variant RT may contain one or more mutations that make the RT more or less stable, lower the tendency to aggregation, facilitate purification and/or detection, and/or other modification of a property or characteristic.

관련 기술분야의 통상의 기술자는 몰로니 뮤린 백혈병 바이러스 (M-MLV); 인간 면역결핍 바이러스 (HIV) 역전사 효소 및 조류 육종-백혈증 바이러스 (ASLV) 역전사 효소, 예컨대 비제한적으로 라우스 육종 바이러스 (RSV) 역전사 효소, 조류 골수모구증 바이러스 (AMV) 역전사 효소, 조류 적모구증 바이러스 (AEV) 헬퍼 바이러스 MCAV 역전사 효소, 조류 골수구종증 바이러스 MC29 헬퍼 바이러스 MCAV 역전사 효소, 조류 세망내피증 바이러스 (REV-T) 헬퍼 바이러스 REV-A 역전사 효소, 조류 육종 바이러스 UR2 헬퍼 바이러스 UR2AV 역전사 효소, 조류 육종 바이러스 Y73 헬퍼 바이러스 YAV 역전사 효소, 라우스 연관 바이러스 (RAV) 역전사 효소, 및 골수모구증 연관 바이러스 (MAV) 역전사 효소를 포함하나 이에 제한되지는 않는 다른 역전사 효소로부터 유래된 변이체 역전사 효소가 본원에 기재된 대상 방법 및 조성물에 적합하게 사용될 수 있다는 것을 인식할 것이다.Those of ordinary skill in the art are skilled in the art of Moloney murine leukemia virus (M-MLV); Human immunodeficiency virus (HIV) reverse transcriptase and avian sarcoma-leukemia virus (ASLV) reverse transcriptase such as, but not limited to, Rous sarcoma virus (RSV) reverse transcriptase, avian myeloblastosis virus (AMV) reverse transcriptase, avian erythroblastosis virus (AEV) helper virus MCAV reverse transcriptase, avian myelocytosis virus MC29 helper virus MCAV reverse transcriptase, avian reticuloendotheliosis virus (REV-T) helper virus REV-A reverse transcriptase, avian sarcoma virus UR2 helper virus UR2AV reverse transcriptase, avian Variant reverse transcriptases derived from other reverse transcriptases including, but not limited to, sarcoma virus Y73 helper virus YAV reverse transcriptase, Rous-associated virus (RAV) reverse transcriptase, and myeloblastosis-associated virus (MAV) reverse transcriptase are described herein. It will be appreciated that the subject methods and compositions may be suitably used.

프라임 편집기의 RT는 "오류-유발" 역전사 효소 변이체일 수 있다. 관련 기술분야에 공지되고/거나 이용가능한 오류-유발 역전사 효소가 사용될 수 있다. 역전사 효소는 자연적으로 어떠한 교정 기능도 갖지 않고; 따라서 역전사 효소의 오류율은 교정 활성을 포함하는 DNA 폴리머라제보다 일반적으로 더 높다는 것이 인지될 것이다. 임의의 특정한 역전사 효소의 오류율은 그의 RNA 주형에 대한 DNA의 주형-지정 중합의 정확도를 나타내는 효소의 "충실도"의 특성이다. 고충실도를 갖는 RT는 낮은 오류율을 갖는다. 반대로, 저충실도를 갖는 RT는 높은 오류율을 갖는다. M-MLV-기반 리버스 트랜스크립타제의 충실도는 합성된 15,000 내지 27,000개 뉴클레오티드에서 1개 오류 범위의 오류율을 갖는 것으로 보고되어 있다. RTs in the prime editor can be "error-causing" reverse transcriptase variants. Error-causing reverse transcriptases known and/or available in the art may be used. Reverse transcriptases do not have any corrective function in nature; It will therefore be appreciated that the error rate of reverse transcriptase is generally higher than that of DNA polymerases with corrective activity. The error rate of any particular reverse transcriptase is a property of the enzyme's "fidelity" indicative of the accuracy of the template-directed polymerization of DNA to its RNA template. RTs with high fidelity have a low error rate. Conversely, RTs with low fidelity have high error rates. The fidelity of M-MLV-based reverse transcriptase is reported to have an error rate ranging from 1 error to 15,000 to 27,000 nucleotides synthesized.

따라서, 본 출원의 목적상, "오류-유발"인 것으로 간주되거나 또는 "오류-유발 충실도"를 갖는 것으로 간주되는 역전사 효소는 합성된 15,000개 뉴클레오티드에서 1개 오류 미만의 오류율을 갖는 것이다.Thus, for the purposes of this application, a reverse transcriptase that is considered "error-prone" or has "error-prone fidelity" is one that has an error rate of less than one error in the 15,000 nucleotides synthesized.

또한 RNaseH 도메인에서 돌연변이를 갖는 역전사 효소를 고려한다. 상기 언급된 바와 같이, 역전사 효소의 내재적 특성 중 하나는 RNA:cDNA 하이브리드의 RNA 주형을 중합과 동시에 절단하는 RNase H 활성이다. RNase H 활성은 RNA 주형이 전장 역전사의 완료 전에 분해될 수 있기 때문에 긴 cDNA의 합성에 바람직하지 않을 수 있다. RNase H 활성은 또한, 아마도 효소의 폴리머라제 활성과 그의 경쟁으로 인해, 역전사 효율을 저하시킬 수 있다. 따라서, 본 개시내용은 변형된 RNaseH 활성을 포함하는 임의의 역전사 효소 변이체를 고려한다.Also consider reverse transcriptases with mutations in the RNaseH domain. As mentioned above, one of the intrinsic properties of reverse transcriptase is its RNase H activity, which simultaneously cleaves the RNA template of an RNA:cDNA hybrid. RNase H activity may be undesirable for the synthesis of long cDNAs as the RNA template may be degraded prior to completion of full-length reverse transcription. RNase H activity may also reduce reverse transcription efficiency, possibly due to its competition with the enzyme's polymerase activity. Accordingly, the present disclosure contemplates any reverse transcriptase variant comprising altered RNaseH activity.

본원의 개시내용은 또한 RNA-의존성 DNA 폴리머라제 도메인에서 돌연변이를 갖는 역전사 효소를 고려한다. 상기 언급된 바와 같이, 역전사 효소의 내재적 특성 중 하나는 RNA:cDNA 하이브리드의 주형 RNA 가닥에 의해 코딩된 바와 같이 신생 cDNA 가닥 내로 핵염기를 혼입시키는 RNA-의존성 DNA 폴리머라제 활성이다. RNA-의존성 DNA 폴리머라제 활성은 증가 또는 감소되어 (즉, 그의 혼입 속도의 관점에서) 효소의 프로세싱성을 증가 또는 감소시킬 수 있다. 따라서, 본 개시내용은 비변형된 버전에 비해 효소의 프로세싱성이 증가 또는 감소되도록 변형된 RNA-의존성 DNA 폴리머라제 활성을 포함하는 임의의 역전사 효소 변이체를 고려한다.The disclosure herein also contemplates a reverse transcriptase having a mutation in the RNA-dependent DNA polymerase domain. As mentioned above, one of the intrinsic properties of reverse transcriptase is its RNA-dependent DNA polymerase activity, which incorporates a nucleobase into the emerging cDNA strand as encoded by the template RNA strand of the RNA:cDNA hybrid. RNA-dependent DNA polymerase activity can be increased or decreased (ie, in terms of its rate of incorporation) to increase or decrease the processability of the enzyme. Accordingly, the present disclosure contemplates any reverse transcriptase variant comprising an RNA-dependent DNA polymerase activity modified to increase or decrease the processing power of the enzyme compared to an unmodified version.

또한, 변경된 열안정성 특징을 갖는 역전사 효소 변이체가 본원에서 고려된다. 역전사 효소가 고온을 견디는 능력은 cDNA 합성의 중요한 측면이다. 상승된 반응 온도는 강한 2차 구조 및/또는 높은 GC 함량을 갖는 RNA를 변성시키는 것을 도와, 역전사 효소가 서열을 따라 판독하도록 한다. 그 결과, 보다 높은 온도에서의 역전사는 전장 cDNA 합성 및 보다 높은 수율을 가능하게 하며, 이는 프라임 편집 과정의 결과로서 3' 플랩 ssDNA의 개선된 생성으로 이어질 수 있다. 야생형 M-MLV 역전사 효소는 전형적으로 37-48 ℃범위의 최적 온도를 갖지만; 49 ℃, 50℃, 51℃, 52℃, 53℃, 54℃, 55℃, 56℃, 57℃, 58℃, 59℃, 60℃, 61℃, 62℃, 63℃, 64℃, 65℃, 66℃, 및 그 초과를 포함한 48℃초과의 보다 높은 온도에서 역전사 활성을 허용하는 돌연변이가 도입될 수 있다.Also contemplated herein are reverse transcriptase variants with altered thermostability characteristics. The ability of reverse transcriptases to withstand high temperatures is an important aspect of cDNA synthesis. Elevated reaction temperature helps to denature RNA with strong secondary structure and/or high GC content, allowing reverse transcriptase to read along the sequence. As a result, reverse transcription at higher temperatures enables full-length cDNA synthesis and higher yields, which may lead to improved production of 3' flap ssDNA as a result of the prime editing process. Wild-type M-MLV reverse transcriptase typically has an optimum temperature in the range of 37-48 °C; 49 °C, 50 °C, 51 °C, 52 °C, 53 °C, 54 °C, 55 °C, 56 °C, 57 °C, 58 °C, 59 °C, 60 °C, 61 °C, 62 °C, 63 °C, 64 °C, 65 °C Mutations can be introduced that allow for reverse transcription activity at higher temperatures above 48°C, including , 66°C, and above.

본 발명에 따르면, 상기 역전사 효소는 서열번호 3 내지 14으로 이루어진 군으로부터 선택되는 어느 하나의 서열을 가지는 것이다. 보다 구체적으로 상기 역전사 효소는 몰로니 뮤린 백혈병 바이러스 (M-MLV) 역전사 효소이며, 서열번호 3을 가진다. According to the present invention, the reverse transcriptase has any one sequence selected from the group consisting of SEQ ID NOs: 3 to 14. More specifically, the reverse transcriptase is Moloney murine leukemia virus (M-MLV) reverse transcriptase and has SEQ ID NO:3.

상기 서열번호 3의 야생형 M-MLV RT에서 또는 또 다른 야생형 RT 폴리펩티드 서열에서의 상응하는 아미노산 위치에서 하기 돌연변이: P51L, S67K, E69K, L139P, T197A, D200N, H204R, F209N, E302K, E302R, T306K, F309N, W313F, T330P, L345G, L435G, N454K, D524G, E562Q, D583N, H594Q, L603W, E607K, 또는 D653N 중 1개 이상을 포함하는 변이체 RT를 포함할 수 있다.The following mutations at the corresponding amino acid positions in the wild-type M-MLV RT of SEQ ID NO: 3 or in another wild-type RT polypeptide sequence: P51L, S67K, E69K, L139P, T197A, D200N, H204R, F209N, E302K, E302R, T306K, variant RT comprising one or more of F309N, W313F, T330P, L345G, L435G, N454K, D524G, E562Q, D583N, H594Q, L603W, E607K, or D653N.

보다 구체적으로, 본 발명에 따른 서열은 야생형 M-MLV RT의 변이서열일 수 있으며 구체적으로 서열번호 15의 염기서열을 가지는 것일 수 있다. More specifically, the sequence according to the present invention may be a mutant sequence of wild-type M-MLV RT, and specifically may have the nucleotide sequence of SEQ ID NO: 15.

융합 단백질 fusion protein

본 발명에 따른 Francisella novicida Cas9 단백질; 및 역전사 효소 단백질은 융합 단백질의 형태로도 제공될 수 있다. Francisella novicida Cas9 protein according to the present invention; and the reverse transcriptase protein may also be provided in the form of a fusion protein.

본원에 기재된 프라임 편집제 (PE) 시스템은 Francisella novicida Cas9 단백질; 및 역전사 효소 단백질를 임의로 링커에 의해 연결된 융합 단백질의 형태로 제공할 수 있다. The prime editor (PE) system described herein comprises the Francisella novicida Cas9 protein; and the reverse transcriptase protein may optionally be provided in the form of a fusion protein linked by a linker.

본원에서 앞서 기재된 Francisella novicida Cas9 단백질과 역전사 효소 단백질의 임의의 예시에 대한 조합이 고려되며, 임의의 링커 서열을 통해 이들이 조합될 수 있다. Combinations of any of the examples of the Francisella novicida Cas9 protein and reverse transcriptase protein previously described herein are contemplated, and they may be combined via any linker sequence.

링커는 "링커"는 2개의 분자 또는 모이어티, 예를 들어 뉴클레아제의 절단 도메인 및 결합 도메인을 연결하는 화학적 기 또는 분자를 지칭한다. Linker "Linker" refers to a chemical group or molecule that connects two molecules or moieties, eg, the cleavage domain and the binding domain of a nuclease.

일부 실시양태에서, 링커는 아미노산 또는 복수의 아미노산 (예를 들어, 펩티드 또는 단백질)이다. 일부 실시양태에서, 링커는 유기 분자, 기, 중합체, 또는 화학적 모이어티이다. 일부 실시양태에서, 링커는 5-100개 아미노산 길이, 예를 들어, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 30-35, 35-40, 40-45, 45-50, 50-60, 60-70, 70-80, 80-90, 90-100, 100-150, 또는 150-200개 아미노산 길이이다. 보다 길거나 보다 짧은 링커가 또한 고려된다.In some embodiments, the linker is an amino acid or a plurality of amino acids (eg, a peptide or protein). In some embodiments, the linker is an organic molecule, group, polymer, or chemical moiety. In some embodiments, the linker is 5-100 amino acids in length, e.g., 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 30-35, 35-40, 40-45, 45-50, 50-60, 60-70, 70-80, 80- 90, 90-100, 100-150, or 150-200 amino acids in length. Longer or shorter linkers are also contemplated.

이와 관련된 예시적인 링커는 GGS (서열번호:16); GGSGGS (서열번호: 17);Exemplary linkers in this regard include GGS (SEQ ID NO:16); GGSGGS (SEQ ID NO: 17);

GGSGGSGGS (서열식별번호: 18);SGGSSGGSSGSETPGTSESATPESSGGSSGGSS (서열번호: 19); SGSETPGTSESATPES (서열번호: 20) 를 예시적으로 들 수 있다. GGSGGSGGS (SEQ ID NO: 18); SGGSSGGSSGSETPGTSESATPESSGGSSGGSS (SEQ ID NO: 19); SGSETPGTSESATPES (SEQ ID NO: 20) can be exemplified.

또한, 필요에 따라 본 발명에 따른 융합 단백질은 세포 핵으로의 단백질의 전위를 촉진하기 위한 핵 위치화 신호(Nucleus localization signal, NLS)를 포함할 수 있다. In addition, if necessary, the fusion protein according to the present invention may include a nuclear localization signal (NLS) for promoting the translocation of the protein to the cell nucleus.

NLS는 관련 기술분야의 임의의 공지된 NLS 서열일 수 있다. NLS는 또한 핵 국재화를 위한 임의의 추후-발견될 NLS일 수 있다. NLS는 또한 임의의 자연 발생 NLS, 또는 임의의 비-자연 발생 NLS (예를 들어, 1개 이상의 목적하는 돌연변이를 갖는 NLS)일 수 있다.The NLS can be any known NLS sequence in the art. The NLS may also be any later-discovered NLS for nuclear localization. The NLS can also be any naturally occurring NLS, or any non-naturally occurring NLS (eg, an NLS with one or more desired mutations).

이러한 예시적인 서열은 PKKKRKV (서열번호: 21), MDSLLMNRRKFLYQFKNVRWAKGRRETYLC (서열번호: 22) 등을 포함하나, 이에 제한되지 않는다. Exemplary such sequences include, but are not limited to, PKKKRKV (SEQ ID NO: 21), MDSLLMNRRKFLYQFKNVRWAKGRRETYLC (SEQ ID NO: 22), and the like.

프라임 편집 가이드 RNA (PEgRNA)Prime Editing Guide RNA (PEgRNA)

가이드 RNA는 대부분 통상적으로 Cas9 단백질과 회합되고 Cas9 단백질을 가이드 RNA의 프로토스페이서 서열에 대한 상보성을 포함하는 DNA 분자 내의 특이적 서열로 지시하는 가이드 핵산의 특정한 유형이다. A guide RNA is a specific type of guide nucleic acid that most commonly associates with a Cas9 protein and directs the Cas9 protein to a specific sequence within a DNA molecule that includes complementarity to the protospacer sequence of the guide RNA.

본원에 사용된 "프라임 편집 가이드 RNA" (또는"PEgRNA")는 연장 아암(arm)을 가질 수 있다. As used herein, a “prime editing guide RNA” (or “PEgRNA”) may have an extension arm.

연장 아암(arm)은 프라이머 결합 부위 및 폴리머라제 (예를 들어, 역전사 효소)를 통해 관심 유전적 변화를 함유하는 단일 가닥 DNA 플랩을 코딩하는 DNA 합성 주형 서열을 포함하는, PEgRNA의 3' 단부 또는 5' 단부에서의 단일 가닥 연장부, 이는 이어서 상응하는 내인성 가닥을 대체함으로써 내인성 DNA 내로 통합되어, 목적하는 유전적 변화를 제공할 수 있다. The extension arm comprises a primer binding site and a DNA synthesis template sequence encoding a single-stranded DNA flap containing the genetic change of interest via a polymerase (eg, reverse transcriptase) at the 3' end of the PEgRNA or A single stranded extension at the 5' end, which can then be integrated into endogenous DNA by replacing the corresponding endogenous strand, to provide the desired genetic change.

특히, 연장 아암은 프라이머 결합 서열, 상동성 아암, 편집 주형을 가질 수 있다. 프라이머 결합 부위는 프라임 편집제 복합체에 의해 닉킹될 때 표적 부위의 내인성 DNA 가닥으로부터 형성된 프라이머 서열에 결합하여, 내인성 닉킹된 가닥 상의 3' 단부를 노출시킨다. In particular, the extension arm may have a primer binding sequence, a homology arm, an editing template. The primer binding site binds to a primer sequence formed from the endogenous DNA strand of the target site when nicked by the prime editor complex, exposing the 3' end on the endogenous nicked strand.

편집 주형은 작게는 단일 뉴클레오티드 치환일 수 있거나, 또는 DNA의 삽입 또는 역위일 수 있다. 추가로, 편집 주형은 또한 결실을 포함할 수 있으며, 이는 목적하는 결실을 함유하는 상동성 아암을 코딩함으로써 조작될 수 있다.The editing template may be as small as a single nucleotide substitution, or it may be an insertion or inversion of DNA. Additionally, the editing template may also contain deletions, which may be engineered by encoding the homology arms containing the desired deletions.

"상동성 아암"은 내인성 가닥을 대체함으로써 표적 DNA 부위 내로 통합될, 생성된 역전사 효소-코딩된 단일 가닥 DNA 플랩의 부분을 코딩하는 연장 아암의 부분을 지칭한다. 상동성 아암에 의해 코딩되는 단일 가닥 DNA 플랩의 부분은 표적 DNA 서열의 비-편집된 가닥에 상보적이며, 이는 내인성 가닥의 대체 및 그 자리에서의 단일 가닥 DNA 플랩의 어닐링을 용이하게 함으로써, 편집을 설치한다. 이 성분은 다른 곳에 추가로 정의된다. 상동성 아암은 정의에 의해 본원에 기재된 프라임 편집기의 폴리머라제에 의해 코딩되기 때문에 DNA 합성 주형의 일부이다. "Homology arm" refers to the portion of the extension arm that encodes the portion of the resulting reverse transcriptase-encoded single-stranded DNA flap that will be integrated into the target DNA site by replacing the endogenous strand. The portion of the single-stranded DNA flap encoded by the homology arms is complementary to the non-edited strand of the target DNA sequence, which facilitates replacement of the endogenous strand and annealing of the single-stranded DNA flap in situ. to install This component is further defined elsewhere. The homology arms are by definition part of the DNA synthesis template because they are encoded by the polymerase of the prime editor described herein.

본원에 사용된 "프라임 편집 가이드 RNA" (또는"PEgRNA")는 연장 아암에 더하여 하기 구성요소 중 적어도 하나 이상을 더 포함할 수 있다 As used herein, a “prime editing guide RNA” (or “PEgRNA”) may further comprise, in addition to an extension arm, at least one or more of the following components:

스페이서 서열 - 표적 DNA 내의 프로토스페이서에 결합하는 PEgRNA 내의 서열 (약 20개 nt 길이를 가짐).Spacer sequence - a sequence in the PEgRNA that binds to a protospacer in the target DNA (about 20 nt in length).

gRNA 코어 (또는 gRNA 스캐폴드 또는 백본 서열) - Cas9 결합을 담당하는 gRNA 내의 서열을 지칭하며, 이는 Cas9를 표적 DNA로 가이드하는데 사용되는 20 bp 스페이서/표적화 서열을 포함하지 않음.gRNA core (or gRNA scaffold or backbone sequence) - refers to the sequence within the gRNA responsible for Cas9 binding, which does not contain the 20 bp spacer/targeting sequence used to guide Cas9 to the target DNA.

전사 종결인자 - 가이드 RNA 또는 PEgRNA는 분자의 3'에 전사 종결 서열을 포함할 수 있음.Transcription Terminator - A guide RNA or PEgRNA may contain a transcription termination sequence 3' of the molecule.

프라임 편집 가이드 RNA" 또는 "PEgRNA"는 본원에 기재된 프라임 편집 방법 및 조성물을 구현하기 위한 1개 이상의 추가의 서열을 포함하도록 변형된 특수화된 형태의 가이드 RNA를 지칭한다. Prime editing guide RNA” or “PEgRNA” refers to a specialized form of a guide RNA that has been modified to include one or more additional sequences for implementing the prime editing methods and compositions described herein.

본원에 기재된 바와 같이, 프라임 편집 가이드 RNA는 핵산 서열의 1개 이상의 "연장된 영역" 을 포함한다. 연장된 영역은 단일 가닥 RNA 또는 DNA를 포함할 수 있지만, 이에 제한되지는 않는다. 추가로, 연장된 영역은 전통적인 가이드 RNA의 3' 단부에서 발생할 수 있다. 다른 배열에서, 연장된 영역은 전통적인 가이드 RNA의 5' 단부에서 발생할 수 있다. 또 다른 배열에서, 연장된 영역은 전통적인 가이드 RNA의 분자내 영역에서, 예를 들어 Cas9에 회합 및/또는 결합하는 gRNA 코어 영역에서 발생할 수 있다. 연장된 영역은 (a) 편집될 내인성 표적 DNA와 상동이도록 설계되었고, (b) 내인성 표적 DNA 내로 도입 또는 통합될 적어도 1개의 목적하는 뉴클레오티드 변화 (예를 들어, 전이, 전환, 결실 또는 삽입)를 포함하는 단일 가닥 DNA를 (프라임 편집제의 폴리머라제에 의해) 코딩하는 "DNA 합성 주형"을 포함한다. 연장된 영역은 또한 다른 기능적 서열 요소, 예컨대 비제한적으로 "프라이머 결합 부위" 및 "스페이서 또는 링커" 서열, 또는 다른 구조적 요소, 예컨대 비제한적으로 압타머, 스템 루프, 헤어핀, 토루프 (예를 들어, 3' 토루프) 또는 RNA-단백질 동원 도메인 (예를 들어, MS2 헤어핀)을 포함할 수 있다. 본원에 사용된 "프라이머 결합 부위"는 R-루프의 닉킹된 DNA로부터 생성된 3' 단부를 갖는 단일 가닥 DNA 서열에 혼성화하는 서열을 포함한다.As described herein, a prime editing guide RNA comprises one or more “extended regions” of a nucleic acid sequence. The extended region may include, but is not limited to, single stranded RNA or DNA. Additionally, extended regions may occur at the 3' end of the traditional guide RNA. In another arrangement, the extended region may occur at the 5' end of the traditional guide RNA. In another arrangement, the extended region may occur in the intramolecular region of a traditional guide RNA, eg, in the gRNA core region that associates and/or binds Cas9. The extended region is (a) designed to be homologous to the endogenous target DNA to be edited, and (b) contains at least one desired nucleotide change (e.g., a transition, transformation, deletion or insertion) to be introduced or integrated into the endogenous target DNA. "DNA synthesis template" that encodes (by a polymerase of a prime editor) comprising single-stranded DNA. The extended region may also include other functional sequence elements such as, but not limited to, “primer binding sites” and “spacer or linker” sequences, or other structural elements such as, but not limited to, aptamers, stem loops, hairpins, toe loops (e.g., , 3' to loop) or an RNA-protein recruitment domain (eg, MS2 hairpin). As used herein, "primer binding site" includes a sequence that hybridizes to a single stranded DNA sequence having a 3' end generated from the nicked DNA of an R-loop.

특정 실시양태에서, PEgRNA는 5' 연장 아암, 스페이서 및 gRNA 코어를 갖는 PEgRNA를 보여준다. 5' 연장부는 5'에서 3' 방향으로 역전사 효소 주형, 프라이머 결합 부위 및 링커를 추가로 포함한다. In certain embodiments, the PEgRNA exhibits a PEgRNA having a 5' extension arm, a spacer and a gRNA core. The 5' extension further comprises a reverse transcriptase template, a primer binding site and a linker in the 5' to 3' direction.

특정의 다른 실시양태에서, PEgRNA는 5' 연장 아암, 스페이서 및 gRNA 코어를 갖는 PEgRNA를 보여준다. 5' 연장부는 5'에서 3' 방향으로 역전사 효소 주형, 프라이머 결합 부위 및 링커를 추가로 포함한다. In certain other embodiments, the PEgRNA exhibits a PEgRNA having a 5' extension arm, a spacer and a gRNA core. The 5' extension further comprises a reverse transcriptase template, a primer binding site and a linker in the 5' to 3' direction.

또 다른 실시양태에서, PEgRNA는 5'에서 3' 방향으로 스페이서 (1), gRNA 코어 (2) 및 연장 아암 (3)을 갖는 PEgRNA를 보여준다. 연장 아암 (3)은 PEgRNA의 3' 단부에 있다. 연장 아암 (3)은 5'에서 3' 방향으로 "프라이머 결합 부위" (A), "편집 주형" (B) 및 "상동성 아암" (C)을 추가로 포함한다. 연장 아암 (3)은 또한 3' 및 5' 단부에, 동일한 서열 또는 상이한 서열일 수 있는 임의적인 변형제 영역을 포함할 수 있다. 추가로, PEgRNA의 3' 단부는 전사 종결인자 서열을 포함할 수 있다. PEgRNA의 이들 서열 요소는 본원에 추가로 기재되고 정의된다.In another embodiment, the PEgRNA shows a PEgRNA having a spacer (1), a gRNA core (2) and an extension arm (3) in the 5′ to 3′ direction. The extension arm (3) is at the 3' end of the PEgRNA. The extension arm (3) further comprises a "primer binding site" (A), a "editing template" (B) and a "homology arm" (C) in the 5' to 3' direction. The extension arm 3 may also comprise, at the 3' and 5' ends, an optional modifier region, which may be the same sequence or a different sequence. Additionally, the 3' end of the PEgRNA may comprise a transcription terminator sequence. These sequence elements of PEgRNA are further described and defined herein.

또 다른 실시양태에서, PEgRNA는 5'에서 3' 방향으로 연장 아암 (3), 스페이서 (1) 및 gRNA 코어 (2)를 갖는 PEgRNA를 보여준다. 연장 아암 (3)은 PEgRNA의 5' 단부에 있다. 연장 아암 (3)은 3'에서 5' 방향으로 "프라이머 결합 부위" (A), "편집 주형" (B) 및 "상동성 아암" (C)을 추가로 포함한다. 연장 아암 (3)은 또한 3' 및 5' 단부에, 동일한 서열 또는 상이한 서열일 수 있는 임의적인 변형제 영역을 포함할 수 있다. PEgRNA는 또한 3' 단부에 전사 종결인자 서열을 포함할 수 있다. PEgRNA의 이들 서열 요소는 본원에 추가로 기재되고 정의된다.In another embodiment, the PEgRNA shows a PEgRNA having extending arms (3), a spacer (1) and a gRNA core (2) in the 5′ to 3′ direction. The extension arm (3) is at the 5' end of the PEgRNA. The extension arm (3) further comprises in the 3' to 5' direction a "primer binding site" (A), a "editing template" (B) and a "homology arm" (C). The extension arm 3 may also comprise, at the 3' and 5' ends, an optional modifier region, which may be the same sequence or a different sequence. The PEgRNA may also include a transcription terminator sequence at the 3' end. These sequence elements of PEgRNA are further described and defined herein.

본 발명의 일 실시양태에 따르면, 가이드 RNA는 ~20개의 nt 프로토스페이서 서열 및 Cas9과 결합하는 gRNA 코어 영역을 포함한다. 가이드 RNA는 5' 단부에 연장된 RNA 절편, 즉 5' 연장부를 포함한다. 이러한 실시양태에서, 5' 연장부는 역전사 주형 서열, 역전사 프라이머 결합 부위, 및 임의적인 5-20개의 뉴클레오티드 링커 서열을 포함한다. RT 프라이머 결합 부위는 R-루프의 비-표적 가닥에 닉이 형성된 후에 형성된 유리 3' 단부에 혼성화하여, 역전사 효소의 5'-3' 방향으로의 DNA 중합을 프라이밍한다.According to one embodiment of the present invention, the guide RNA comprises a -20 nt protospacer sequence and a gRNA core region that binds Cas9. The guide RNA comprises an RNA fragment extending at the 5' end, i.e., a 5' extension. In this embodiment, the 5' extension comprises a reverse transcription template sequence, a reverse transcription primer binding site, and an optional 5-20 nucleotide linker sequence. The RT primer binding site hybridizes to the free 3' end formed after the nicking of the non-target strand of the R-loop, priming DNA polymerization in the 5'-3' direction of the reverse transcriptase.

본 발명의 다른 실시양태에 다르면, 가이드 RNA는 ~20개의 nt 프로토스페이서 서열 및 Cas9와 결합하는 gRNA 코어를 포함한다. 이러한 실시양태에서, 가이드 RNA는 3' 단부에 연장된 RNA 절편, 즉 3' 연장부를 포함한다. 이러한 실시양태에서, 3' 연장부는 역전사 주형 서열, 및 역전사 프라이머 결합 부위를 포함한다. According to another embodiment of the present invention, the guide RNA comprises a -20 nt protospacer sequence and a gRNA core that binds Cas9. In this embodiment, the guide RNA comprises an RNA segment extending at the 3' end, ie a 3' extension. In this embodiment, the 3' extension comprises a reverse transcription template sequence, and a reverse transcription primer binding site.

RT 프라이머 결합 부위는 R-루프의 비-표적 가닥에 닉이 형성된 후에 형성된 유리 3' 단부에 혼성화하여, 역전사 효소의 5'-3' 방향으로의 DNA 중합을 프라이밍한다.The RT primer binding site hybridizes to the free 3' end formed after the nicking of the non-target strand of the R-loop, priming DNA polymerization in the 5'-3' direction of the reverse transcriptase.

본 발명의 또 다른 실시양태에 따르면, 가이드 RNA는 ~20개의 nt 프로토스페이서 서열 및 Cas9와 결합하는 gRNA 코어를 포함한다. 가이드 RNA는 gRNA 코어 내의 분자간 위치에서 연장된 RNA 절편, 즉 분자내 연장부를 포함한다. 분자내 연장부는 역전사 주형 서열, 및 역전사 프라이머 결합 부위를 포함한다. RT 프라이머 결합 부위는 R-루프의 비-표적 가닥에 닉이 형성된 후에 형성된 유리 3' 단부에 혼성화하여, 역전사 효소의 5'-3' 방향으로의 DNA 중합을 프라이밍한다.According to another embodiment of the present invention, the guide RNA comprises a -20 nt protospacer sequence and a gRNA core that binds Cas9. Guide RNAs comprise RNA segments extending at intermolecular locations within the gRNA core, ie, intramolecular extensions. The intramolecular extension includes a reverse transcription template sequence, and a reverse transcription primer binding site. The RT primer binding site hybridizes to the free 3' end formed after the nicking of the non-target strand of the R-loop, priming DNA polymerization in the 5'-3' direction of the reverse transcriptase.

RNA 연장부의 길이는 임의의 유용한 길이일 수 있다. 다양한 실시양태에서, RNA 연장부는 적어도 5개 뉴클레오티드, 적어도 10개 뉴클레오티드, 적어도 20개 뉴클레오티드, 적어도 30개 뉴클레오티드, 적어도 40개 뉴클레오티드, 적어도 50개 뉴클레오티드, 적어도 60개 뉴클레오티드, 적어도 70개 뉴클레오티드, 적어도 80개 뉴클레오티드, 적어도 90개 뉴클레오티드, 적어도 100개 뉴클레오티드, 적어도 200개 뉴클레오티드, 적어도 300개 뉴클레오티드, 적어도 400개 뉴클레오티드, 또는 적어도 500개 뉴클레오티드 길이이다.The length of the RNA extension can be any useful length. In various embodiments, the RNA extension is at least 5 nucleotides, at least 10 nucleotides, at least 20 nucleotides, at least 30 nucleotides, at least 40 nucleotides, at least 50 nucleotides, at least 60 nucleotides, at least 70 nucleotides, at least 80 nucleotides, at least 90 nucleotides, at least 100 nucleotides, at least 200 nucleotides, at least 300 nucleotides, at least 400 nucleotides, or at least 500 nucleotides in length.

RT 주형 서열은 또한 임의의 적합한 길이일 수 있다. 예를 들어, RT 주형 서열은 적어도 5개 뉴클레오티드, 적어도 10개 뉴클레오티드, 적어도 20개 뉴클레오티드, 적어도 30개 뉴클레오티드, 적어도 40개 뉴클레오티드, 적어도 50개 뉴클레오티드, 적어도 60개 뉴클레오티드, 적어도 70개 뉴클레오티드, 적어도 80개 뉴클레오티드, 적어도 90개 뉴클레오티드, 적어도 100개 뉴클레오티드, 적어도 200개 뉴클레오티드, 적어도 300개 뉴클레오티드, 적어도 400개 뉴클레오티드, 또는 적어도 500개 뉴클레오티드 길이일 수 있다.The RT template sequence may also be of any suitable length. For example, the RT template sequence may be at least 5 nucleotides, at least 10 nucleotides, at least 20 nucleotides, at least 30 nucleotides, at least 40 nucleotides, at least 50 nucleotides, at least 60 nucleotides, at least 70 nucleotides, at least 80 nucleotides, at least 90 nucleotides, at least 100 nucleotides, at least 200 nucleotides, at least 300 nucleotides, at least 400 nucleotides, or at least 500 nucleotides in length.

또 다른 실시양태에서, 역전사 프라이머 결합 부위 서열은 적어도 적어도 5개 뉴클레오티드, 적어도 10개 뉴클레오티드, 적어도 20개 뉴클레오티드, 적어도 30개 뉴클레오티드, 적어도 40개 뉴클레오티드, 적어도 50개 뉴클레오티드, 적어도 60개 뉴클레오티드, 적어도 70개 뉴클레오티드, 적어도 80개 뉴클레오티드, 적어도 90개 뉴클레오티드, 적어도 100개 뉴클레오티드, 적어도 200개 뉴클레오티드, 적어도 300개 뉴클레오티드, 적어도 400개 뉴클레오티드, 또는 적어도 500개 뉴클레오티드 길이이다.In another embodiment, the reverse transcription primer binding site sequence is at least 5 nucleotides, at least 10 nucleotides, at least 20 nucleotides, at least 30 nucleotides, at least 40 nucleotides, at least 50 nucleotides, at least 60 nucleotides, at least 70 nucleotides, at least 80 nucleotides, at least 90 nucleotides, at least 100 nucleotides, at least 200 nucleotides, at least 300 nucleotides, at least 400 nucleotides, or at least 500 nucleotides in length.

다른 실시양태에서, 임의적인 링커 또는 스페이서 서열은 적어도 5개 뉴클레오티드, 적어도 10개 뉴클레오티드, 적어도 20개 뉴클레오티드, 적어도 30개 뉴클레오티드, 적어도 40개 뉴클레오티드, 적어도 50개 뉴클레오티드, 적어도 60개 뉴클레오티드, 적어도 70개 뉴클레오티드, 적어도 80개 뉴클레오티드, 적어도 90개 뉴클레오티드, 적어도 100개 뉴클레오티드, 적어도 200개 뉴클레오티드, 적어도 300개 뉴클레오티드, 적어도 400개 뉴클레오티드, 또는 적어도 500개 뉴클레오티드 길이이다.In other embodiments, the optional linker or spacer sequence is at least 5 nucleotides, at least 10 nucleotides, at least 20 nucleotides, at least 30 nucleotides, at least 40 nucleotides, at least 50 nucleotides, at least 60 nucleotides, at least 70 nucleotides. nucleotides, at least 80 nucleotides, at least 90 nucleotides, at least 100 nucleotides, at least 200 nucleotides, at least 300 nucleotides, at least 400 nucleotides, or at least 500 nucleotides in length.

RT 주형 서열은 비-표적 가닥에 상동성이지만 (따라서, 표적 가닥의 상응하는 부위에 상보성이지만), 1개 이상의 뉴클레오티드 변화를 포함하는 단일 가닥 DNA 분자를 코딩한다. 적어도 1개의 뉴클레오티드 변화는 1개 이상의 단일-염기 뉴클레오티드 변화, 1개 이상의 결실, 및 1개 이상의 삽입을 포함할 수 있다.The RT template sequence encodes a single-stranded DNA molecule that is homologous to the non-target strand (and thus complementary to the corresponding site of the target strand), but contains one or more nucleotide changes. The at least one nucleotide change may comprise one or more single-base nucleotide changes, one or more deletions, and one or more insertions.

RT 주형 서열의 합성된 단일 가닥 DNA 생성물은 비-표적 가닥과 상동성이고, 1개 이상의 뉴클레오티드 변화를 함유한다. RT 주형 서열의 단일 가닥 DNA 생성물은 상보적 표적 가닥 서열과 평형 상태로 혼성화하여, 상동 내인성 표적 가닥 서열을 대체한다. 대체된 내인성 가닥은 일부 실시양태에서 5' 내인성 DNA 플랩 종으로 지칭될 수 있다. 이러한 5' 내인성 DNA 플랩 종은 5' 플랩 엔도뉴클레아제 (예를 들어, FEN1)에 의해 제거될 수 있고, 이제 내인성 표적 가닥에 혼성화된 단일 가닥 DNA 생성물은 라이게이션되어 내인성 서열과 새로 합성된 가닥 사이에 미스매치를 생성할 수 있다. 미스매치는 세포의 선천성 DNA 복구 및/또는 복제 과정에 의해 분해될 수 있다. The synthesized single-stranded DNA product of the RT template sequence is homologous to the non-target strand and contains one or more nucleotide changes. The single-stranded DNA product of the RT template sequence hybridizes in equilibrium with the complementary target strand sequence, displacing the homologous endogenous target strand sequence. The replaced endogenous strand may in some embodiments be referred to as a 5' endogenous DNA flap species. This 5' endogenous DNA flap species can be removed by a 5' flap endonuclease (e.g., FEN1), and the single-stranded DNA product now hybridized to the endogenous target strand is ligated and synthesized de novo with the endogenous sequence. Mismatches can be created between the strands. Mismatches can be resolved by the cell's innate DNA repair and/or replication processes.

연장된 가이드 RNA의 다양한 실시양태에서, 단일 가닥 DNA 플랩의 세포 복구는 목적하는 뉴클레오티드 변화의 설치를 발생시켜, 목적하는 생성물을 형성한다.In various embodiments of the extended guide RNA, cellular repair of the single stranded DNA flap results in the installation of the desired nucleotide change to form the desired product.

또 다른 실시양태에서, 목적하는 뉴클레오티드 변화는 닉 부위의 약 -5 내지 약 +5 사이, 또는 닉 부위의 약 -10 내지 약 +10 사이, 또는 닉 부위의 약 -50 내지 약 +50 사이에 편집 윈도우를 설치하고 이의 편집을 목적한다. In another embodiment, the desired nucleotide change is between about -5 and about +5 of the nick site, or between about -10 and about +10 of the nick site, or between about -50 and about +50 of the nick site To install Windows and edit it.

특히, 본원 발명에 따른 프라임 에디팅 기술은 기존 프라임 에디터와 비교하여 6-8bp 앞의 nicking 효과가 큰 장점을 이용하여 편집을 목적할 수 있다. In particular, the prime editing technique according to the present invention can be used for editing by taking advantage of the large advantage of the nicking effect 6-8bp ahead compared to the existing prime editor.

가이드 서열은 임의의 표적 서열을 표적화하도록 선택될 수 있다. 일부 실시양태에서, 표적 서열은 세포의 게놈 내의 서열이다. The guide sequence can be selected to target any target sequence. In some embodiments, the target sequence is a sequence within the genome of a cell.

PEgRNA는 5'에서 3' 방향으로 정렬된 3개의 주요 성분 요소, 즉 스페이서, gRNA 코어, 및 3' 단부의 연장 아암을 포함한다. 연장 아암은 5'에서 3' 방향으로 하기 구조적 요소, 즉: 프라이머 결합 부위 (A), 편집 주형 (B), 및 상동성 아암 (C)으로 추가로 나뉠 수 있다. PEgRNA comprises three major component elements aligned in the 5' to 3' direction: a spacer, a gRNA core, and an extension arm at the 3' end. The extension arm can be further divided into the following structural elements in the 5' to 3' direction: the primer binding site (A), the editing template (B), and the homology arm (C).

PEgRNA는 5'에서 3' 방향으로 정렬된 3개의 주요 성분 요소, 즉 스페이서, gRNA 코어, 및 3'단부의 연장 아암을 포함한다. 연장 아암은 5'에서 3' 방향으로 하기 구조적 요소, 즉: 프라이머 결합 부위(A), 편집 주형 (B), 및 상동성 아암 (C)으로 추가로 나뉠 수 있다. PEgRNA comprises three major component elements aligned in the 5' to 3' direction: a spacer, a gRNA core, and an extension arm at the 3' end. The extension arm can be further divided into the following structural elements in the 5' to 3' direction: a primer binding site (A), an editing template (B), and a homology arm (C).

프라임 편집 가이드 RNA (PEgRNA)가 서열번호 23의 Francisella novicida Cas9(H969A) 결합 서열을 포함하는 것일 수 있다. 이러한 Francisella novicida Cas9(H969A) 결합 서열은 상기 서열번호 23를 기초로 하여 적어도 약 96% 동일하거나, 적어도 약 97% 동일하거나, 적어도 약 98% 동일하거나, 적어도 약 99% 동일하거나, 적어도 약 99.5% 동일하거나, 적어도 약 99.8% 동일하거나 또는 적어도 약 99.9% 동일한 것으로, Francisella novicida Cas9(H969A) 결합을 나타내는 서열을 사용할 수 있다. Prime editing guide RNA (PEgRNA) may include the Francisella novicida Cas9 (H969A) binding sequence of SEQ ID NO: 23. This Francisella novicida Cas9 (H969A) binding sequence is at least about 96% identical, at least about 97% identical, at least about 98% identical, at least about 99% identical, or at least about 99.5% identical based on SEQ ID NO:23, above. Sequences that are identical, at least about 99.8% identical, or at least about 99.9% identical, exhibit Francisella novicida Cas9 (H969A) binding can be used.

본 발명은 또한 Francisella novicida Cas9 단백질; 역전사 효소 단백질; 및 프라임 편집 가이드 RNA (PEgRNA)를 포함하는 프라임 편집 복합체를 코딩하는 1개 이상의 폴리뉴클레오티드를 제공한다. The present invention also relates to Francisella novicida Cas9 protein; reverse transcriptase protein; and one or more polynucleotides encoding a prime editing complex comprising a prime editing guide RNA (PEgRNA).

보다 구체적으로, Francisella novicida Cas9 단백질을 코딩하는 폴리뉴클레오티드를 제공한다. 본 발명의 일실시양태에 따르면, 이러한 서열은 예를 들어 서열번호 24의 염기서열을 가질 수 있다. More specifically, a polynucleotide encoding a Francisella novicida Cas9 protein is provided. According to one embodiment of the present invention, such a sequence may have, for example, the nucleotide sequence of SEQ ID NO: 24.

역전사 효소 단백질을 코딩하는 폴리뉴클레오티드를 제공한다. 본 발명의 일실시양태에 따르면, 이러한 서열은 예를 들어 서열번호 25의 염기서열을 가질 수 있다.A polynucleotide encoding a reverse transcriptase protein is provided. According to one embodiment of the present invention, such a sequence may have, for example, the nucleotide sequence of SEQ ID NO: 25.

프라임 편집 가이드 RNA (PEgRNA)를 코딩하는 폴리뉴클레오티드를 제공한다. Francisella novicida Cas9 단백질; 및 역전사 효소 단백질을 포함하는 융합 단백질을 코딩하는 폴리뉴클레오티드를 제공한다. 본 발명의 일실시양태에 따르면, 이러한 서열은 예를 들어 서열번호 26의 염기서열을 가질 수 있다.A polynucleotide encoding a prime editing guide RNA (PEgRNA) is provided. Francisella novicida Cas9 protein; and a polynucleotide encoding a fusion protein comprising a reverse transcriptase protein. According to one embodiment of the present invention, such a sequence may have, for example, the nucleotide sequence of SEQ ID NO: 26.

또한, 본 발명은 또한 Francisella novicida Cas9 단백질 및 역전사 효소 단백질을 코딩하는 폴리뉴클레오티드를 포함하는 벡터를 제공한다. In addition, the present invention also provides a vector comprising a polynucleotide encoding a Francisella novicida Cas9 protein and a reverse transcriptase protein.

본 발명은 또한 프라이머 결합 부위, 편집 주형 및 상동성 아암을 포함하는 프라임 편집 가이드 RNA (PEgRNA)를 코딩하는 폴리뉴클레오티드를 포함하는 벡터를 제공하는 것을 목적으로 한다. 본 발명의 일실시양태에 따른 벡터의 개략적인 모식도를 도 2에 나타내었다. 구체적으로, SV40 NLS-FnCas9(H969A) nickase-linker- M-MLV RT를 이어서 융합 단백질을 제조할 수 있는 벡터를 제조하였다. The present invention also aims to provide a vector comprising a polynucleotide encoding a prime editing guide RNA (PEgRNA) comprising a primer binding site, an editing template and a homology arm. A schematic schematic diagram of a vector according to an embodiment of the present invention is shown in FIG. 2 . Specifically, SV40 NLS-FnCas9(H969A) nickase-linker-M-MLV RT was followed to prepare a vector capable of preparing a fusion protein.

본 발명은 또한 프라임 편집 가이드 RNA (PEgRNA)를 코딩하는 폴리뉴클레오티드를 포함하는 벡터를 제공한다. The invention also provides a vector comprising a polynucleotide encoding a prime editing guide RNA (PEgRNA).

재조합 벡터는 상기 뉴클레오티드에 작동가능하게 연결된 프로모터를 포함할 수 있다.The recombinant vector may comprise a promoter operably linked to said nucleotide.

본 발명에서 사용되는 용어, "프로모터"는 폴리머라아제와 결합되고, 다운스트림(3' 방향) 코딩 또는 비-코딩 서열의 전사를 개시할 수 있는 DNA 조절 영역이다.As used herein, the term "promoter" is a DNA regulatory region capable of binding to a polymerase and initiating transcription of a downstream (3' direction) coding or non-coding sequence.

본 발명에서 사용되는 용어, "작동가능하게 연결된"은 유전자 발현 조절 서열과 다른 뉴클레오티드 서열사이의 기능적인 결합(cis)을 의미한다. 상기 유전자 발현 조절 서열은 복제원점(replication origin), 프로모터, 전사 종결 서열(terminator) 등으로 이루어진 군에서 선택된 1종 이상일 수 있다.As used herein, the term "operably linked" refers to a functional linkage (cis) between a gene expression control sequence and another nucleotide sequence. The gene expression control sequence may be at least one selected from the group consisting of a replication origin, a promoter, a transcription terminator, and the like.

본 발명의 프로모터는 특정 유전자의 전사 개시를 조절하는 전사 조절 서열 중 하나로, 통상적으로 약 100bp 내지 약 2500bp 길이의 폴리뉴클레오티드 단편일 수 있다. The promoter of the present invention is one of the transcriptional regulatory sequences that regulate the initiation of transcription of a specific gene, and may be a polynucleotide fragment typically of about 100 bp to about 2500 bp in length.

상기 프로모터는 세포, 예를 들어, 진핵 세포(예를 들어, 식물 세포, 또는 동물 세포(예를 들어, 인간, 마우스 등의 포유류 세포 등) 등)에서 전사 개시를 조절할 수 있으면, 제한 없이 사용 가능하다. 예를 들어, 상기 프로모터는 CMV 프로모터(cytomegalovirus promoter;예를 들어, 인간 또는 마우스 CMV immediate-early 프로모터), U6 프로모터, EF1-alpha(elongation factor 1-a) 프로모터, EF1-alpha short(EFS) 프로모터, SV40 프로모터, 아데노바이러스 프로모터(major late promoter), pL

Figure pat00001
프로모터, trp 프로모터, lac 프로모터, tac 프로모터, T7 프로모터, 백시니아 바이러스 7.5K 프로모터, HSV의 tk 프로모터, SV40E1 프로모터, 호흡기 세포융합 바이러스(Respiratory syncytial virus; RSV) 프로모터, 메탈로티오닌 프로모터(metallothionin promoter), β-액틴 프로모터, 유비퀴틴 C 프로모터, 인간 IL-2(human interleukin-2) 유전자 프로모터, 인간 림포톡신(human lymphotoxin) 유전자 프로모터, 인간 GM-CSF(human granulocyte-macrophage colony stimulating factor) 유전자 프로모터 등으로 이루어진 군에서 선택된 1종 이상일 수 있으나, 이에 한정되는 것은 아니다. 일 예에서, 상기 프로모터는 CMV immediate-early 프로모터, U6 프로모터, EF1-alpha(elongation factor 1-a) 프로모터, EF1-alpha short(EFS) 프로모터 등으로 이루어진 군에서 선택된 것일 수 있다. 상기 전사 종결 서열은 폴리아데닐화 서열(pA) 등일 수 있다. 상기 복제 원점은 f1 복제원점, SV40 복제원점, pMB1 복제원점, 아데노 복제원점, AAV 복제원점, BBV 복제원점 등일 수 있다.The promoter can be used without limitation, as long as it can regulate transcription initiation in a cell, for example, a eukaryotic cell (eg, a plant cell, or an animal cell (eg, a mammalian cell such as a human, a mouse, etc.), etc.) do. For example, the promoter is a CMV promoter (cytomegalovirus promoter; for example, human or mouse CMV immediate-early promoter), U6 promoter, EF1-alpha (elongation factor 1-a) promoter, EF1-alpha short (EFS) promoter , SV40 promoter, adenovirus promoter (major late promoter), pL
Figure pat00001
promoter, trp promoter, lac promoter, tac promoter, T7 promoter, vaccinia virus 7.5K promoter, HSV tk promoter, SV40E1 promoter, Respiratory syncytial virus (RSV) promoter, metallotionin promoter ), β-actin promoter, ubiquitin C promoter, human IL-2 (human interleukin-2) gene promoter, human lymphotoxin gene promoter, human GM-CSF (human granulocyte-macrophage colony stimulating factor) gene promoter, etc. It may be one or more selected from the group consisting of, but is not limited thereto. In one example, the promoter may be selected from the group consisting of CMV immediate-early promoter, U6 promoter, EF1-alpha (elongation factor 1-a) promoter, EF1-alpha short (EFS) promoter, and the like. The transcription termination sequence may be a polyadenylation sequence (pA) or the like. The origin of replication may be an f1 origin of replication, an SV40 origin of replication, a pMB1 origin of replication, an adeno origin of replication, an AAV origin of replication, or a BBV origin of replication.

본 발명의 벡터는 플라스미드 벡터, 코즈미드 벡터 및 박테리오파아지 벡터, 아데노바이러스 벡터, 레트로바이러스 벡터 및 아데노-연관 바이러스 벡터와 같은 바이러스 벡터로 이루어진 군에서 선택된 것일 수 있다. 상기 재조합 벡터로 사용될 수 있는 벡터는 당업계에서 사용되는 플라스미드(예를 들면, pcDNA 시리즈, pSC101, pGV1106, pACYC177, ColE1, pKT230, pME290, pBR322, pUC8/9, pUC6, pBD9, pHC79, pIJ61, pLAFR1, pHV14, pGEX 시리즈, pET 시리즈, pUC19 등), 파지(예를 들면, λgt4λB, λ-Charon, λΔz1, M13 등) 또는 바이러스 벡터(예를 들면, 아데노-연관 바이러스(AAV) 벡터 등) 등을 기본으로 하여 제작될 수 있으나, 이에 한정되는 것은 아니다.The vector of the present invention may be selected from the group consisting of viral vectors such as plasmid vectors, cosmid vectors and bacteriophage vectors, adenoviral vectors, retroviral vectors and adeno-associated viral vectors. Vectors that can be used as the recombinant vector include plasmids used in the art (eg, pcDNA series, pSC101, pGV1106, pACYC177, ColE1, pKT230, pME290, pBR322, pUC8/9, pUC6, pBD9, pHC79, pIJ61, pLAFR1). , pHV14, pGEX series, pET series, pUC19, etc.), phage (eg, λgt4λB, λ-Charon, λΔz1, M13, etc.) or viral vectors (eg, adeno-associated virus (AAV) vectors, etc.) It may be manufactured on the basis of, but is not limited thereto.

본 발명의 재조합 발현벡터의 제작은 당해 기술 분야에서 잘 알려진 유전자 재조합 기술을 이용하여 제조할 수 있으며, 부위-특이적 DNA 절단 및 연결은 당해 기술 분야에서 일반적으로 알려진 효소 등을 사용하여 수행될 수 있다.The production of the recombinant expression vector of the present invention can be prepared using a genetic recombination technique well known in the art, and site-specific DNA cleavage and ligation can be performed using enzymes generally known in the art. have.

본 발명의 다른 양상은 상기 유전체 교정용 조성물을 분리된 세포 또는 유기체에 도입하는 단계를 포함하는 형질 전환체의 제조 방법을 제공한다. 여기서 상기 유기체는 인간을 제외할 수 있다. Another aspect of the present invention provides a method for producing a transformant comprising the step of introducing the composition for genome editing into an isolated cell or organism. wherein the organism may exclude a human.

본 발명의 유전체 교정용 조성물은 핵산 분자를 유기체, 세포, 조직 또는 기관에 도입하는 당 분야에서 공지된 방법에 의해 세포 또는 유기체에 도입될 수 있으며, 당 분야에서 공지된 바와 같이 숙주 세포에 따라 적합한 표준 기술을 선택하여 수행할 수 있다. 이런 방법에는 예를 들어, 전기천공법(electroporation), 인산칼슘(CaPO4) 침전, 염화칼슘(CaCl2) 침전, 미세주입법(microinjection), 폴리에틸렌글리콜(PEG)법, DEAE-덱스트란법, 양이온성 리포좀법, 및 초산 리튬-DMSO법 등이 포함될 수 있으나, 이에 한정되는 것은 아니다.The composition for genome editing of the present invention may be introduced into a cell or organism by a method known in the art for introducing a nucleic acid molecule into an organism, cell, tissue or organ, and as is known in the art, suitable according to the host cell This can be done by selecting standard techniques. Such methods include, for example, electroporation, calcium phosphate (CaPO 4 ) precipitation, calcium chloride (CaCl 2 ) precipitation, microinjection, polyethylene glycol (PEG) method, DEAE-dextran method, cationic The liposome method and the lithium acetate-DMSO method may be included, but are not limited thereto.

본 발명은 또한 Francisella novicida Cas9 단백질; 역전사 효소 단백질; 및 프라임 편집 가이드 RNA (PEgRNA)를 포함하는 프라임 편집 복합체를 포함하는 세포를 제공한다.The present invention also relates to Francisella novicida Cas9 protein; reverse transcriptase protein; and a prime editing complex comprising a prime editing guide RNA (PEgRNA).

본원에 기재된 조성물 중 임의의 것을 함유할 수 있는 세포는 원핵 세포 및 진핵 세포를 포함한다. 본원에 기재된 방법은 Cas9 단백질, 프라임 편집제, 및 프라임 편집 가이드 RNA (PEgRNA) 또는 프라임 편집 복합체 시스템을 진핵 세포 (예를 들어, 포유동물 세포, 예컨대 인간 세포) 내로 전달하는데 사용된다. 일부 실시양태에서, 세포는 시험관내의 것 (예를 들어, 배양된 세포)이다. 일부 실시양태에서, 세포는 생체내 (예를 들어, 대상체, 예컨대 인간 대상체 내)의 것이다. 일부 실시양태에서, 세포는 생체외의 것 (예를 들어, 대상체로부터 단리되고, 동일한 또는 상이한 대상체에게 다시 투여될 수 있는 것)이다.Cells that may contain any of the compositions described herein include prokaryotic and eukaryotic cells. The methods described herein are used to deliver a Cas9 protein, a prime editor, and a prime editing guide RNA (PEgRNA) or prime editing complex system into a eukaryotic cell (eg, a mammalian cell, such as a human cell). In some embodiments, the cells are in vitro (eg, cultured cells). In some embodiments, the cell is in vivo (eg, in a subject, such as a human subject). In some embodiments, the cell is ex vivo (eg, isolated from a subject and capable of being re-administered to the same or a different subject).

본 개시내용의 포유동물 세포는 인간 세포, 영장류 세포 (예를 들어, 베로 세포), 래트 세포 (예를 들어, GH3 세포, OC23 세포) 또는 마우스 세포 (예를 들어, MC3T3 세포)를 포함한다. 제한 없이, 인간 배아 신장 (HEK)세포, HeLa 세포, 국립 암 연구소의 60 암 세포주 (NCI60)로부터의 암 세포, DU145 (전립선암) 세포, Lncap (전립선암) 세포, MCF-7 (유방암) 세포, MDA-MB-438 (유방암) 세포, PC3 (전립선암) 세포, T47D (유방암) 세포, THP-1 (급성 골수성 백혈병) 세포, U87 (교모세포종) 세포, SHSY5Y 인간 신경모세포종 세포 (골수종으로부터 클로닝됨) 및 Saos-2 (골암) 세포를 포함한 다양한 인간 세포주가 존재한다. 일부 실시양태에서, rAAV 벡터는 인간 배아 신장 (HEK) 세포 (예를 들어, HEK 293 또는 HEK 293T 세포) 내로 전달된다. 일부 실시양태에서, rAAV 벡터는 줄기 세포 (예를 들어, 인간 줄기 세포), 예컨대, 예를 들어, 만능 줄기 세포 (예를 들어, 인간 유도된 만능 줄기 세포 (hiPSC)를 포함한 인간 만능 줄기 세포) 내로 전달된다. 줄기 세포는 배양 시 무한 기간 동안 분열하고 특화 세포를 생성하는 능력을 갖는 세포를 지칭한다. 만능 줄기 세포는 유기체의 모든 조직으로 분화할 수 있지만, 단독으로는 완전한 유기체 발생을 지속할 수 없는 줄기 세포의 유형을 지칭한다. 인간 유도된 만능 줄기 세포는 배아 줄기 세포의 정의 특성을 유지하는데 중요한 유전자 및 인자를 발현하Mammalian cells of the present disclosure include human cells, primate cells (eg, Vero cells), rat cells (eg, GH3 cells, OC23 cells) or mouse cells (eg, MC3T3 cells). Without limitation, human embryonic kidney (HEK) cells, HeLa cells, cancer cells from the National Cancer Institute's 60 cancer cell line (NCI60), DU145 (prostate cancer) cells, Lncap (prostate cancer) cells, MCF-7 (breast cancer) cells. , MDA-MB-438 (breast cancer) cells, PC3 (prostate cancer) cells, T47D (breast cancer) cells, THP-1 (acute myeloid leukemia) cells, U87 (glioblastoma) cells, SHSY5Y human neuroblastoma cells (cloned from myeloma) A variety of human cell lines exist, including Saos-2 (bone cancer) cells. In some embodiments, the rAAV vector is delivered into human embryonic kidney (HEK) cells (eg, HEK 293 or HEK 293T cells). In some embodiments, the rAAV vector is a stem cell (e.g., a human stem cell), such as, e.g., a pluripotent stem cell (e.g., a human pluripotent stem cell, including a human induced pluripotent stem cell (hiPSC)) transmitted to me Stem cells refer to cells that, in culture, have the ability to divide for an indefinite period of time and produce specialized cells. Pluripotent stem cells refer to a type of stem cell capable of differentiating into all tissues of an organism, but not capable of sustaining complete organism development by themselves. Human induced pluripotent stem cells express genes and factors important for maintaining the defining characteristics of embryonic stem cells.

도록 강제됨으로써 배아 줄기 세포-유사 상태로 재프로그램화된 체세포 (예를 들어, 성숙 또는 성체)를 지칭한다. 인간 유도된 만능 줄기 세포 세포는 줄기 세포 마커를 발현하고, 모든 3가지 배엽층 (외배엽, 내배엽, 중배엽)의 세포 특징을 생성할 수 있다.Refers to a somatic cell (eg, mature or adult) that has been reprogrammed to an embryonic stem cell-like state by being forced to do so. Human induced pluripotent stem cell cells express stem cell markers and are capable of generating cellular features of all three germ layers (ectoderm, endoderm, mesoderm).

본 발명은 또한 Francisella novicida Cas9 단백질 및 역전사 효소 단백질을 코딩하는 폴리뉴클레오티드를 포함하는 벡터; 및 프라임 편집 가이드 RNA (PEgRNA)를 코딩하는 폴리뉴클레오티드를 포함하는 벡터를 포함하는 프라임 편집 복합체 시스템을 제공한다. The present invention also relates to a vector comprising a polynucleotide encoding a Francisella novicida Cas9 protein and a reverse transcriptase protein; and a vector comprising a polynucleotide encoding a prime editing guide RNA (PEgRNA).

본 발명은 또한 Francisella novicida Cas9 단백질 및 역전사 효소 단백질을 코딩하는 폴리뉴클레오티드를 포함하는 벡터; 및 프라임 편집 가이드 RNA (PEgRNA)를 코딩하는 폴리뉴클레오티드를 포함하는 벡터를 포함하는 프라임 편집 복합체 시스템을 포함하는 키트를 제공한다. The present invention also relates to a vector comprising a polynucleotide encoding a Francisella novicida Cas9 protein and a reverse transcriptase protein; and a prime editing complex system comprising a vector comprising a polynucleotide encoding a prime editing guide RNA (PEgRNA).

본 발명에 따른 프라임 편집 복합체 시스템은 폴리뉴클레오티드, 예컨대 본원에 기재된 바와 같은 1개 이상의 벡터, 그의 1개 이상의 전사체, 및/또는 그로부터 전사된 1개 이상의 단백질을 숙주 세포에 전달하는 것을 포함하는 방법을 제공한다. 일부 측면에서, 본 발명은 이러한 방법에 의해 생산된 세포, 및 이러한 세포를 포함하거나 또는 그로부터 생산된 유기체 (예컨대 동물, 식물, 또는 진균)를 추가로 제공한다. 일부 실시양태에서, 가이드 서열과 조합된 (및 임의로 그와 복합체화된) 본원에 기재된 바와 같은 염기 편집제가 세포에 전달된다. A prime editing complex system according to the present invention comprises delivering a polynucleotide, such as one or more vectors as described herein, one or more transcripts thereof, and/or one or more proteins transcribed therefrom to a host cell. provides In some aspects, the invention further provides cells produced by such methods, and organisms (such as animals, plants, or fungi) comprising or produced from such cells. In some embodiments, a base editing agent as described herein in combination with (and optionally complexed with) a guide sequence is delivered to a cell.

제공된 전달 방법은 뉴클레오펙션, 미세주사, 바이오리스틱, 비로솜, 리포솜, 이뮤노리포솜, 다가양이온 또는 지질:핵산 접합체, 네이키드 DNA, 인공 비리온, 및 DNA의 작용제-증진된 흡수를 포함한다.Provided delivery methods include nucleofection, microinjection, biolistics, virosomes, liposomes, immunoliposomes, polycations or lipid:nucleic acid conjugates, naked DNA, artificial virions, and agent-enhanced uptake of DNA. .

본 발명은 또한 핵산 서열을 프라임 편집 복합체와 접촉시키는 단계를 포함하여 핵산 서열에 치환, 결실, 삽입 또는 이의 조합을 제공하는 방법으로써, The invention also provides a method of providing a substitution, deletion, insertion or combination thereof in a nucleic acid sequence comprising contacting the nucleic acid sequence with a prime editing complex, the method comprising:

상기 방법은 (i) 이중 가닥 DNA 서열을 표적 가닥 (또는 PAM 가닥) 상에서 닉킹하고, 3' 단부를 갖는 유리 단일 가닥 DNA를 생성하는 것;The method comprises (i) nicking a double-stranded DNA sequence onto a target strand (or PAM strand) and generating free single-stranded DNA having a 3' end;

(ii) 유리 단일 가닥 DNA의 3' 단부를 가이드 RNA의 프라이머 결합 부위에 혼성화시킴으로써, 폴리머라제를 프라이밍하는 것; (ii) priming the polymerase by hybridizing the 3' end of the free single-stranded DNA to the primer binding site of the guide RNA;

(iii) 3' 단부로부터 DNA의 가닥을 중합시킴으로써, 뉴클레오티드 변화를 포함하는 단일 가닥 DNA 플랩을 생성하는 것; 및(iii) polymerizing a strand of DNA from the 3' end, thereby creating a single-stranded DNA flap comprising a nucleotide change; and

(iv) 표적 가닥 (또는 PAM 가닥) 상의 절단 부위의 하류에 바로 인접한 내인성 DNA 가닥을 단일 가닥 DNA 플랩으로 대체함으로써, 이중 가닥 DNA 서열에 목적하는 뉴클레오티드 변화를 제공하는 것을 포함하는 것인, 핵산 서열에 치환, 결실, 삽입 또는 이의 조합을 제공하는 방법을 제공하는 것을 목적으로 한다. (iv) replacing the endogenous DNA strand immediately downstream of the cleavage site on the target strand (or PAM strand) with a single stranded DNA flap, thereby providing the desired nucleotide change in the double stranded DNA sequence. An object of the present invention is to provide a method for providing substitution, deletion, insertion or a combination thereof.

위와 같은 프라임 편집 복합체의 사용은 프라임 편집의 전반적 메커니즘을 보여주며, 이를 통해 하나 이상의 유전자의 변화, 전환, 전이, 결실 또는 삽입과 같은 목표를 달성할 수 있다. The use of prime editing complexes as above reveals the overall mechanism of prime editing, which can achieve goals such as changes, transformations, transfers, deletions or insertions of one or more genes.

또한, 사용하는 목적에 따라 오류-유발 RT와 함께 프라임 편집을 사용한 돌연변이유발을 할 수 있으며, 트리플렛 확장 장애를 치료하기 위한 프라임 편집을 사용할 수 있으며, 펩티드 태그부착을 위한 프라임 편집을 사용할 수 있으며, RNA 태그부착을 위한 프라임 편집을 사용할 수 있으며, 정교한 유전자 라이브러리의 생성을 위한 프라임 편집을 위해 프라임 편집을 사용할 수 있으며, 이뮤노에피토프의 삽입을 위한 프라임 편집을 사용할 수 있으며, 비편향 방식으로 오프-타겟 편집을 확인하기 위한 프라임 편집을 사용할 수 있으며, 유도성 이량체화 도메인의 삽입을 위한 프라임 편집을 사용할 수 있으며, 세포 데이터 기록을 위한 프라임 편집을 사용할 수 있으며, 생체분자 활성을 조정하기 위한 프라임 편집을 사용할 수 있으며, 레콤비나제 표적 부위를 삽입하기 위한 프라임 편집을 사용할 수 있는 등의 다양한 활용 방법에 따라 이의 사용을 목적할 수 있다. In addition, depending on the purpose of use, mutagenesis using prime editing with error-prone RT can be used, prime editing can be used to treat triplet expansion disorders, prime editing can be used for peptide tagging, Prime editing can be used for RNA tagging, prime editing can be used for generation of sophisticated gene libraries, prime editing can be used for the insertion of immunoepitopes, and can be used in an off-axis manner in an unbiased manner. Prime edits can be used to confirm target edits, prime edits can be used for insertion of inducible dimerization domains, prime edits can be used for cellular data recording, prime edits can be used to tune biomolecular activity can be used, and its use can be aimed at according to various utilization methods, such as using prime editing for inserting a recombinase target site.

이러한 예시는 WO 2020/191234에 나열된 활용방법에 관한 예시들을 포함한다. Such examples include examples of utilization methods listed in WO 2020/191234.

본 발명은 또한 핵산 서열을 프라임 편집 복합체와 접촉시키는 단계를 포함하여 유전자를 교정하는 방법을 제공하는 것을 목적으로 한다.The present invention also aims to provide a method for correcting a gene comprising the step of contacting a nucleic acid sequence with a prime editing complex.

본 발명의 유전자 교정은 진핵 유기체에 적용될 수 있다. 상기 진핵 유기체는 진핵 세포(예를 들어, 효모 등의 균류, 진핵 동물 및/또는 진핵 식물 유래 세포(예를 들어, 배아세포, 줄기세포, 체세포, 생식세포 등) 등), 진핵 동물(예를 들어, 척추동물 또는 무척추동물, 보다 구체적으로, 인간, 원숭이 등의 영장류, 개, 돼지, 소, 양, 염소, 마우스, 래트 등을 포함하는 포유류 등), 및 진핵 식물(예를 들어, 녹조류 등의 조류, 옥수수, 콩, 밀, 벼 등의 단자엽 또는 쌍자엽 식물 등)로 이루어진 군에서 선택된 것일 수 있으나, 이에 한정되는 것은 아니다.The gene editing of the present invention can be applied to eukaryotic organisms. The eukaryotic organism is a eukaryotic cell (e.g., a fungus such as yeast, eukaryotic and/or eukaryotic plant-derived cells (e.g., embryonic cells, stem cells, somatic cells, germ cells, etc.), eukaryotic cells (e.g., For example, vertebrates or invertebrates, more specifically humans, primates such as monkeys, mammals including dogs, pigs, cattle, sheep, goats, mice, rats, etc.), and eukaryotic plants (eg, green algae, etc.) may be selected from the group consisting of monocots or dicotyledons such as algae, corn, soybeans, wheat, and rice), but is not limited thereto.

본 발명은 또한 핵산 서열을 프라임 편집 복합체와 접촉시키는 단계를 포함하여 유전자 산물의 발현을 변경시키는 방법을 제공하는 것을 목적으로 한다. The present invention also aims to provide a method for altering the expression of a gene product comprising the step of contacting the nucleic acid sequence with a prime editing complex.

본 발명은 또한 핵산 서열을 프라임 편집 복합체와 접촉시키는 단계를 포함하여 돌연변이 또는 단일-뉴클레오티드 다형태(SNP)와 관련된 질환의 치료 방법을 제공하는 것을 목적으로 한다. The present invention also aims to provide a method of treating a disease associated with a mutation or single-nucleotide polymorphism (SNP) comprising the step of contacting the nucleic acid sequence with a prime editing complex.

이러한 돌연변이 또는 단일-뉴클레오티드 다형태(SNP)와 관련된 질환의 치료 방법은 편집 시스템에 의해 교정될 수 있는 점 돌연변이 또는 다른 돌연변이 (예를 들어, 결실, 삽입, 역위, 중복 등)와 연관되거나 그에 의해 유발된 질환으로 진단된 대상체의 치료 방법을 제공하는 것을 의미할 수 있다. Methods of treating diseases associated with such mutations or single-nucleotide polymorphisms (SNPs) are associated with or by point mutations or other mutations (eg, deletions, insertions, inversions, duplications, etc.) that can be corrected by an editing system. It may mean providing a method of treating a subject diagnosed with the induced disease.

실질적으로 임의의 질환-유발 유전적 결함은 프라임 편집을 사용함으로써 복구될 수 있으며, 이는 적절한 프라임 편집제 융합 단백질을 선택하는 것, 및 (a) 편집 부위를 함유하는 적절한 표적 DNA를 표적화하고, (b) 닉 부위의 바로 하류의 내인성 가닥을 치환 및 대체하는 목적하는 편집을 포함하는, 닉 부위의 3' 단부로부터의 DNA의 단일 가닥의 합성을 위한 주형을 제공하도록 설계된 적절한 PEgRNA를 설계하는 것을 포함한다. Virtually any disease-causing genetic defect can be repaired by using prime editing, which involves selecting an appropriate prime editor fusion protein, and (a) targeting the appropriate target DNA containing the editing site, ( b) designing an appropriate PEgRNA designed to provide a template for the synthesis of a single strand of DNA from the 3' end of the nick site, comprising the desired editing to replace and replace the endogenous strand immediately downstream of the nick site do.

또한, 본 발명은 Francisella novicida Cas9 단백질; 역전사 효소 단백질; 및In addition, the present invention is Francisella novicida Cas9 protein; reverse transcriptase protein; and

프라임 편집 가이드 RNA (PEgRNA)를 포함하는 프라임 편집 복합체, 또는 프라임 편집 복합체를 코딩하는 1개 이상의 폴리뉴클레오티드를 포함하는 유전자 교정용 조성물을 제공한다. It provides a prime editing complex comprising a prime editing guide RNA (PEgRNA), or a composition for editing a gene comprising one or more polynucleotides encoding the prime editing complex.

또한, 본 발명은 Francisella novicida Cas9 단백질; 역전사 효소 단백질; 및In addition, the present invention is Francisella novicida Cas9 protein; reverse transcriptase protein; and

프라임 편집 가이드 RNA (PEgRNA)를 포함하는 프라임 편집 복합체, 또는 프라임 편집 복합체를 코딩하는 1개 이상의 폴리뉴클레오티드를 포함하는 약제학적 조성물을 제공한다. Provided is a prime editing complex comprising a prime editing guide RNA (PEgRNA), or a pharmaceutical composition comprising one or more polynucleotides encoding the prime editing complex.

또한, 본 발명은 (1) Francisella novicida Cas9 단백질; 역전사 효소 단백질; 및In addition, the present invention (1) Francisella novicida Cas9 protein; reverse transcriptase protein; and

프라임 편집 가이드 RNA (PEgRNA)를 포함하는 프라임 편집 복합체, 또는 프라임 편집 복합체를 코딩하는 1개 이상의 폴리뉴클레오티드, 및 (2) 약제학적으로 허용가능한 담체를 포함하는 약제학적 조성물을 제공하는 것을 목적으로 한다. It aims to provide a pharmaceutical composition comprising a prime editing complex comprising a prime editing guide RNA (PEgRNA), or one or more polynucleotides encoding the prime editing complex, and (2) a pharmaceutically acceptable carrier. .

본 발명은 Francisella novicida Cas9 단백질; 역전사 효소 단백질; 및The present invention is Francisella novicida Cas9 protein; reverse transcriptase protein; and

프라임 편집 가이드 RNA (PEgRNA)를 포함하는 프라임 편집 복합체, 또는 프라임 편집 복합체를 코딩하는 1개 이상의 폴리뉴클레오티드를 포함하는 돌연변이 또는 단일-뉴클레오티드 다형태(SNP)와 관련된 질환의 예방 또는 치료용 약제학적 조성물을 제공한다. A pharmaceutical composition for the prophylaxis or treatment of a disease associated with a prime editing complex comprising prime editing guide RNA (PEgRNA), or a mutation or single-nucleotide polymorphism (SNP) comprising one or more polynucleotides encoding the prime editing complex provides

이러한 대상체에서 돌연변이 또는 단일-뉴클레오티드 다형태(SNP)와 관련된 질환을 예방, 개선 또는 치료를 위한 질환은 예를 들어 유전 질환, 비유전 질환, 바이러스 감염, 박테리아 감염, 암, 또는 자가 면역 질환을 포함한다. Diseases for preventing, ameliorating, or treating diseases associated with mutations or single-nucleotide polymorphisms (SNPs) in such subjects include, for example, genetic diseases, non-hereditary diseases, viral infections, bacterial infections, cancer, or autoimmune diseases. do.

여기서, 유전 질환"은 게놈에서 하나 이상의 이상, 특히 출생시 존재하는 상태에 의해 부분적으로 또는 전적으로, 직접적으로 또는 간접적으로 유발되는 질환을 지칭한다. 이상은 돌연변이, 삽입 또는 결실일 수 있다. 이상은 유전자의 코딩 서열 또는 이의 조절 서열에 영향을 줄 수 있다. 유전 질환은 DMD, 혈우병, 낭포성 섬유증, 헌팅턴 무도병, 가족성 고콜레스테롤혈증 (LDL 수용체 결함), 간모세포종, 윌슨병(Wilson's disease), 선천성 간성 포르피린증, 간 대사의 유전성 장애, 레쉬 니한 증후군(Lesch Nyhan syndrome), 겸상 적혈구 빈혈, 지중해빈혈, 색소피부건조증, 판코니 빈혈(Fanconi's anemia), 망막색소변성증, 모세혈관확장성 실조증, 블룸 증후군(Bloom's syndrome), 망막모세포종 및 테이-삭스병(Tay-Sachs disease)일 수 있지만, 이에 제한되지는 않는다. Herein, "genetic disease" refers to a disease caused in part or wholly, directly or indirectly, by one or more abnormalities in the genome, in particular a condition present at birth. The abnormality may be a mutation, insertion or deletion. It can affect the coding sequence of gene or its regulatory sequence.The genetic disease is DMD, hemophilia, cystic fibrosis, Huntington's chorea, familial hypercholesterolemia (LDL receptor defect), hepatoblastoma, Wilson's disease, Congenital hepatic porphyria, hereditary disorders of liver metabolism, Lesch Nyhan syndrome, sickle cell anemia, thalassemia, dry skin pigmentation, Fanconi's anemia, retinitis pigmentosa, telangiectasia, Bloom syndrome (Bloom's syndrome), retinoblastoma and Tay-Sachs disease.

비유전 질환 타겟은 변이된 유전자 이외 정상 유전자를 조절하여 질병을 치료하는 것으로, 대표적으로 노인성 황반 변성(AMD)일 수 있지만, 이에 제한되지는 않는다.The non-hereditary disease target treats the disease by regulating normal genes other than the mutated gene, and may typically be age-related macular degeneration (AMD), but is not limited thereto.

여기서, 바이러스, 박테리아 감염, 또는 이들에 의한 질환은 에이즈, 조류독감, 독감, CMV 감염질환, 결핵 또는 나병 등을 포함하며, 이에 제한되지 않는다. Here, the virus, bacterial infection, or a disease caused by them includes, but is not limited to, AIDS, avian flu, flu, CMV-infected disease, tuberculosis or leprosy.

여기서, 암은 방광암, 골암, 혈액암, 유방암, 흑색종양, 갑상선암, 부갑상선암, 골수암, 직장암, 인후암, 후두암, 폐암, 식도암, 췌장암, 대장암, 위암, 설암, 피부암, 뇌종양, 자궁암, 두부 또는 경부암, 담낭암, 구강암, 결장암, 항문 부근암, 중추신경계 종양, 간암 및 대장암으로 구성된 군으로부터 선택되는 어느 하나를 포함하며, 이에 제한되지 않는다. Here, the cancer is bladder cancer, bone cancer, blood cancer, breast cancer, melanoma, thyroid cancer, parathyroid cancer, bone marrow cancer, rectal cancer, throat cancer, laryngeal cancer, lung cancer, esophageal cancer, pancreatic cancer, colorectal cancer, stomach cancer, tongue cancer, skin cancer, brain tumor, uterine cancer, head or It includes any one selected from the group consisting of cervical cancer, gallbladder cancer, oral cancer, colon cancer, perianal cancer, central nervous system tumor, liver cancer, and colorectal cancer, but is not limited thereto.

여기서, 자가 면역 질환은 제1형 당뇨병, 류마티스 관절염, 셀리악 병(Celiac disease-sprue), IgA 결핍(IgA deficiency), 크론병(Crohn's disease), 다발성 경화증, 전신성 홍반성 낭창, 쇼그렌 증후군, 피부 경화증, 다발성 근염, 만성 활동성간염, 혼합 결체 조직 질환, 원발성 담즙성 간경변, 악성 빈혈, 자가면역 갑상선염, 특발성 에디슨 병, 백반, 글루텐 감수성 장병증, 그레이브병, 중증 근무력증, 자가면역성 호중구 감소증, 특발성 혈소판 감소 자반증, 간경변증, 심상성천포창, 자가면역 불임증, 구드패스츄어 증후군, 수포성 유천포창, 원판상 홍반 루푸스, 궤양성 대장염 또는 고밀도 침착병 등을 포함하며, 이에 제한되지 않는다. Here, the autoimmune disease is type 1 diabetes, rheumatoid arthritis, celiac disease-sprue, IgA deficiency, Crohn's disease, multiple sclerosis, systemic lupus erythematosus, Sjogren's syndrome, skin Sclerosis, polymyositis, chronic active hepatitis, mixed connective tissue disease, primary biliary cirrhosis, pernicious anemia, autoimmune thyroiditis, idiopathic Addison's disease, vitiligo, gluten-sensitive enteropathy, Grave's disease, myasthenia gravis, autoimmune neutropenia, idiopathic thrombocytopenia reduced purpura, liver cirrhosis, pemphigus vulgaris, autoimmune infertility, Goodpasture's syndrome, pemphigoid bullae, lupus erythematosus, ulcerative colitis or dense deposit disease, and the like.

상기 내용에 있어서, 치료는 질환 또는 병태에 대해 양성 치료 반응을 제공한다. "양성 치료 반응"이란 질환 또는 병태의 개선, 및/또는 질환 또는 병태와 관련된 증상의 개선으로 의도된다.In the context of the above, treatment provides a positive therapeutic response to the disease or condition. A “positive therapeutic response” is intended to ameliorate a disease or condition, and/or ameliorate symptoms associated with the disease or condition.

상기 증상의 개선은 유효량, 또는 치료학적 유효량의 유전체 교정용 조성물의 투여를 포함한다. "유효량" 또는 "치료학적 유효량"은 유리하거나 목적하는 결과를 가져오기에 충분한 제제의 양을 가리킨다. 치료학적 유효량은 다음 중의 하나 이상에 따라 달라질 수 있다: 대상체 및 치료되는 질환 상태, 대상체의 체중 및 연령, 질환 상태의 중증도, 투여 방식 등, 이것은 당업계의 통상의 숙련가에 의해 용이하게 결정될 수 있다.The improvement of the symptoms includes administration of an effective amount or a therapeutically effective amount of the composition for genome editing. An “effective amount” or “therapeutically effective amount” refers to an amount of an agent sufficient to produce beneficial or desired results. A therapeutically effective amount may vary depending on one or more of the following: the subject and the disease state being treated, the weight and age of the subject, the severity of the disease state, the mode of administration, etc., which can be readily determined by one of ordinary skill in the art. .

본 발명의 약제학적 조성물의 제형은 비경구용일 수 있다. 제제화할 경우에는 보통 사용하는 충진제, 증량제, 결합제, 습윤제, 붕해제, 계면활성제 등의 희석제 또는 부형제를 사용하여 조제된다. 특히, 비경구 투여를 위한 제제에는 멸균된 수용액, 비수성용제, 현탁제, 유제, 동결건조제제, 좌제가 포함된다. 비수성용제 및 현탁용제로는 프로필렌글리콜(propylene glycol), 폴리에틸렌 글리콜, 올리브 오일과 같은 식물성 기름, 에틸올레이트와 같은 주사 가능한 에스테르 등이 사용될 수 있다.The formulation of the pharmaceutical composition of the present invention may be for parenteral use. In the case of formulation, it is prepared using diluents or excipients such as fillers, extenders, binders, wetting agents, disintegrants, and surfactants that are usually used. In particular, preparations for parenteral administration include sterile aqueous solutions, non-aqueous solutions, suspensions, emulsions, freeze-dried preparations, and suppositories. Non-aqueous solvents and suspensions may include propylene glycol, polyethylene glycol, vegetable oils such as olive oil, and injectable esters such as ethyl oleate.

본 발명의 약제학적 조성물은 비경구로 투여될 수 있으며, 종양내 투여, 정맥내, 근육내, 피내, 피하, 복강내, 소동맥내, 심실내, 병변내, 척추강내, 국소, 및 이들의 조합으로 구성된 군으로부터 선택되는 어느 하나의 경로로 투여될 수 있다.The pharmaceutical composition of the present invention can be administered parenterally, and can be administered by intratumoral administration, intravenous, intramuscular, intradermal, subcutaneous, intraperitoneal, intraarterial, intraventricular, intralesional, intrathecal, topical, and combinations thereof. It may be administered by any one route selected from the group consisting of.

본 발명의 약제학적 조성물의 투여량은 환자의 체중, 연령, 성별, 건강상태, 식이, 투여시간, 투여방법, 배설율 및 질환의 중증도에 따라 그 범위가 다양하며, 당업자에 의해 적절하게 선택될 수 있다. 바람직한 효과를 위해서, 본 발명의 약제학적 조성물을 1일 0.01 ug/kg 내지 100 mg/kg으로, 구체적으로는 1 ug/kg 내지 1 mg/kg으로 투여할 수 있다. 투여는 하루에 한번 투여할 수도 있고, 수회 나누어 투여할 수 있다. 따라서, 상기 투여량은 어떠한 면으로든 본 발명의 범위를 한정하는 것은 아니다.The dosage of the pharmaceutical composition of the present invention varies depending on the patient's weight, age, sex, health condition, diet, administration time, administration method, excretion rate and severity of disease, and may be appropriately selected by those skilled in the art. can For a desirable effect, the pharmaceutical composition of the present invention may be administered at 0.01 ug/kg to 100 mg/kg per day, specifically 1 ug/kg to 1 mg/kg. Administration may be administered once a day, or may be administered in several divided doses. Accordingly, the above dosage does not limit the scope of the present invention in any way.

본 발명의 또 다른 목적은 상기 약제학적 조성물을 이용한 의약 용도를 제공하는 것이다. Another object of the present invention is to provide a pharmaceutical use using the pharmaceutical composition.

여기서 상기 의약 용도는 대상체에서 돌연변이 또는 단일-뉴클레오티드 다형태(SNP)와 관련된 질환을 예방, 개선 또는 치료하기 위한 것일 수 있다. 보다 구체적으로, 유전 질환, 비유전 질환, 바이러스 감염, 박테리아 감염, 암, 또는 자가 면역 질환을 포함하는, 돌연변이 또는 단일-뉴클레오티드 다형태(SNP)와 관련된 질환에 대한 예방, 개선 또는 치료하기 위한 것일 수 있다.Here, the pharmaceutical use may be for preventing, ameliorating or treating a disease associated with a mutation or a single-nucleotide polymorphism (SNP) in a subject. More specifically, for preventing, ameliorating or treating diseases associated with mutations or single-nucleotide polymorphisms (SNPs), including genetic diseases, non-hereditary diseases, viral infections, bacterial infections, cancer, or autoimmune diseases. can

본 발명의 또 다른 목적은 유전체 교정에 사용하기 위한, Francisella novicida Cas9 단백질; 역전사 효소 단백질; 및 프라임 편집 가이드 RNA (PEgRNA)를 포함하는 프라임 편집 복합체를 포함하는 조성물을 제공한다. Another object of the present invention for use in genome editing, Francisella novicida Cas9 protein; reverse transcriptase protein; and a prime editing complex comprising a prime editing guide RNA (PEgRNA).

본 발명의 또 다른 목적은 유전 질환, 비유전 질환, 바이러스 감염, 박테리아 감염, 암, 또는 자가 면역 질환을 포함하는, 돌연변이 또는 단일-뉴클레오티드 다형태(SNP)와 관련된 질환의 예방 또는 치료에 사용하기 위한 Francisella novicida Cas9 단백질; 역전사 효소 단백질; 및 프라임 편집 가이드 RNA (PEgRNA)를 포함하는 프라임 편집 복합체를 포함하는 조성물을 제공한다. Another object of the present invention is for use in the prophylaxis or treatment of diseases associated with mutations or single-nucleotide polymorphisms (SNPs), including genetic diseases, non-hereditary diseases, viral infections, bacterial infections, cancer, or autoimmune diseases. Francisella novicida Cas9 protein for; reverse transcriptase protein; and a prime editing complex comprising a prime editing guide RNA (PEgRNA).

본 발명의 또 다른 목적은 Francisella novicida Cas9 단백질; 역전사 효소 단백질; 및 프라임 편집 가이드 RNA (PEgRNA)를 포함하는 프라임 편집 복합체를 포함하는 조성물의 유전체 교정 용도를 제공한다. Another object of the present invention is Francisella novicida Cas9 protein; reverse transcriptase protein; and a prime editing complex comprising a prime editing guide RNA (PEgRNA).

본 발명의 또 다른 목적은 돌연변이 또는 단일-뉴클레오티드 다형태(SNP)와 관련된 질환의 예방 또는 치료에 사용하기 위한 약제의 제조에 있어서, Francisella novicida Cas9 단백질; 역전사 효소 단백질; 및 프라임 편집 가이드 RNA (PEgRNA)를 포함하는 프라임 편집 복합체를 포함하는 조성물의 용도를 제공한다. Another object of the present invention is to prepare a medicament for use in the prevention or treatment of a disease associated with mutation or single-nucleotide polymorphism (SNP), comprising: Francisella novicida Cas9 protein; reverse transcriptase protein; and a prime editing complex comprising a prime editing guide RNA (PEgRNA).

CRISPR-Cas9 ortholog 중 하나인 FnCas9(Francicella novicida Cas9) 모듈을 사용하여 역전사 효소(reverse transcriptase)를 결합하여 표적 DNA 염기서열에 외부 유전자를 삽입하거나 치환할 수 있는 기술(prime editing)이다. It is a technology that can insert or substitute foreign genes into target DNA sequences by combining reverse transcriptase using the Francicella novicida Cas9 ( FnCas9 ) module, one of the CRISPR-Cas9 orthologs (prime editing).

본 기술은 FnCas9(Francicella novicida Cas9) 모듈을 사용한 외부 유전자 삽입 및 치환 기술 (prime editing)은 기존 SpCas9 에 비하여 표적 DNA 내부 non-target strand 에 형성되는 nick position이 다르기 때문에 기존 유전체 삽입 및 치환 기술을 확장할 수 있는 장점이 있다.This technology extends the existing genome insertion and replacement technology because the nick position formed on the non-target strand inside the target DNA is different from that of the existing SpCas9 in the external gene insertion and replacement technology (prime editing) using the FnCas9 ( Franicella novicida Cas9 ) module. There are advantages to doing.

또한 FnCas9(Francicella novicida Cas9) prime editor(역전사 효소 결합)와 기존 SpCas9 prime editor를 복합하여 사용시 상호 교차 간섭이 없기 때문에 다중 유전자의 외부 유전자 삽입 및 치환이 용이한 장점을 지니며, FnCas9 모듈을 엔지니어링 하여 다양한 PAM 염기서열 인식이 가능하거나 성질을 개선하여 효과적인 FnCas9 prime editor(FnCas9-PE)를 개발할 수 있다.In addition, when using the FnCas9 ( Francicella novicida Cas9 ) prime editor (reverse transcriptase linkage) and the existing SpCas9 prime editor in combination, there is no cross-interference, so it has the advantage of easy insertion and substitution of external genes of multiple genes. It is possible to develop an effective FnCas9 prime editor (FnCas9-PE) by recognizing various PAM sequences or improving properties.

또한, FnCas9(H969A)-PE는 SpCas9 nickase (H840A) 와 목표 염기서열에 동시 사용하여 NTS(non-target strand) 와 TS(target strand)에 각각 nick을 생성하여 외부 유전자가 FnCas9-PE에 의하여 삽입되는 효율을 증폭할 수도 있다. In addition, FnCas9(H969A)-PE is used simultaneously with SpCas9 nickase (H840A) and the target nucleotide sequence to generate nicks on the NTS (non-target strand) and TS (target strand) respectively, and the foreign gene is inserted by FnCas9-PE It can also amplify the efficiency.

도 1은 FnCas9 nickase모듈과 SpCas9 nickase모듈을 이용한 prime editing 비교 모식도를 나타낸다. 도 1의 A는 Non-target strand 절단만 일으키는 SpCas9 nickase(H840A)형태의 역전사 효소(RT: reverse transcriptase) 결합 SpCas9 prime editor를 이용하여 외부 유전자(XX)를 삽입하는 방법을 나타내며, 도 1의B는 Non-target strand 절단만 일으키는 FnCas9 nickase(H969A)형태의 역전사 효소(RT: reverse transcriptase) 결합 FnCas9 prime editor를 이용하여 외부 유전자(XX)를 삽입하는 방법을 나타낸다. 이때, pegRNA의 PBS(primer binding site)와 RT template(reverse transcription template) 사이에 nick이 일어나게 된 후 상보적인 부분과 base pairing 되면서 역전사 효소가 pegRNA를 따라서 합성을 시작하게 되고 XX에 해당하는 부분의 삽입(prime editing)이 발생한다(RT(reverse transcriptase): 역전사 효소, 화살표(절단지점): nick이 발생하는 부분, 녹색: PAM(NGG) 염기서열, XX: 삽입되어질 외부 염기서열, 노란색: PBS)
도 2는 본 발명의 일실시양태로 CMV promoter 기반의 FnCas9 prime editior 발현 벡터의 모식도를 나타낸다. CMV promoter를 기반으로 하여 고등 동물 세포에서 발현될 수 있도록 디자인하였고, 기존의 wild type과 H969A mutant (nickase) 형태의 FnCas9 C-terminus에 reverse transcriptase를 연결하여 동시 발현될 수 있도록 벡터를 디자인한 것을 나타낸다.
도 3은 본 발명의 일실시양태로 U6 프로모터 기반의 FnCas9-PE를 위한 pegRNA(prime editing guide RNA) 발현 플라스미드 모식도를 나타낸다. U6 promoter를 기반으로 pegRNA가 발현될 수 있도록하고 down stream에 target 서열을 가지도록 디자인한 것을 나타낸다.
도 4는 본 발명의 일실시양태로 FnCas9-PE 작동을 위한 pegRNA의 구성도를 나타낸다 (표적 유전자 삽입 위치 및 priming 염기서열 삽입 위치 구성도). 구체적으로, PBS(primer binding site)와 reverse transcription template 서열을 삽입할 수 있는 위치를 FnCas9 scaffold의 down stream에 위치하도록 디자인 및 제작하였고, 표적 염기서열이 바뀜에 따라서, 표적 염기서열과 그에 해당하는 PBS+RT 시퀀스를 제한효소를 이용해 삽입하여 FnCas9-PE를 작동시킬 수 있도록 하였다.
도 5는 HEK3 target site로써 SpCas9과 FnCas9을 이용하여 editing을 위한 Targeting이 잘 되는지 확인하기 위한 HEK3 target site에 해당한다.
도 6은 SpCas9과 FnCas9이 처리된 HEK3 site의 amplicon으로부터 얻은 NGS 염기서열 분석 결과를 나타낸다. 파란색 막대 히스토그램은 SpCas9 처리된 세포의 HEK3 site에서 분석한 indel(%)를 나타내며, 주황색 막대 히스토그램은 FnCas9 처리된 세포의 HEK3 site에서 분석한 indel(%)을 나타낸다.
도 7은 FnCas9 cleavage point 및 SpCas9 시스템의 cleavage point를 확인하기 위한 c-Myc, EMX1 및 HEK3 표적 위치의 염기서열 분석 결과를 나타낸다. 빨간색 선은 시퀀싱이 끝난 지점으로써 FnCas9 또는 SpCas9에 의해 잘려진 DNA 부분을 나타낸다(TS: Target strand, NTS: non-target strand)
도 8은 SpCas9을 이용한 HEK3 site prime editing 예상 염기서열 및 pegRNA 디자인을 나타낸다(SpCas9 prime editor를 이용하여 'CTT' sequence insertion이 되어 editing된 후의 표적 DNA 염기서열을 나타내며, pegRNA 내부의 PBS 와 RT의 길이는 타겟에 따라서 최적화됨).
도 9는 FnCas9을 이용한 HEK3 site prime editing 예상 염기서열 및 pegRNA 디자인을 나타낸다(FnCas9 prime editor를 이용하여 TT insertion이 되어 editing 된 후의 예측된 DNA 서열로써, SpCas9과 FnCas9의 target은 동일하나, prime editing guide RNA내 primer binding site(PBS) 및 RT(reverse transcription template)의 길이를 다변화 하여 효율 최적화 시도함).
도 10은 HEK3 target site에 SpCas9과 FnCas9을 이용하여 prime editing을 진행 후 분석한 NGS 결과를 나타낸다(SpCas9 prime editor를 control로 하였으며, 같은 target 다른 위치에 염기가 삽입되도록 prime editing 하였음). NGS 결과 SpCas9의 경우 정확한 위치에 CTT insertion(빨간색 상자 표시)이 발생한 것을 확인할 수 있고 FnCas9 prime editor의 경우에도 정확한 위치에 TT insertion(빨간색 상자 표시)이 발생함을 나타낸다. 또한, FnCas9 prime editor의 경우 PAM(노란색 표시) 6bp 앞에서부터 교정이 가능해, PAM 3bp 앞에서부터 교정이 가능한 SpCas9 prime editor 보다 앞쪽에 insertion이 발생함을 확인하였다.
도 11은 SpCas9을 이용한 NRAS site prime editing 예상 염기서열 및 pegRNA 디자인을 나타낸다(SpCas9 prime editor를 이용하여 'TT' sequence insertion이 되어 editing 된 후의 표적 DNA 염기서열을 나타내며, pegRNA 내부의 PBS 와 RT의 길이는 타겟에 따라서 최적화됨).
도 12는 NRAS 유전자를 target으로 선정해 기존의 SpCas9 prime editor로 prime editing 진행 후 NGS를 통해 확인한 결과, PAM(노란색 상자 표시) 앞 3bp에 TT insertion이 발생한 것을 확인한 결과를 나타낸다
도 13은 FnCas9을 이용한 NRAS site prime editing 예상 염기서열 및 pegRNA 디자인을 나타낸다(FnCas9 prime editor를 이용하여 TT insertion이 되어 editing 된 후의 예측된 DNA 서열을 나타내며, SpCas9과 FnCas9의 target은 동일하나 FnCas9의 cleavage point에 맞게 insertion 되는 위치는 다르게 설정됨).
도 14는 NRAS 유전자를 target으로 선정해 FnCas9 prime editor를 이용하여 prime editing 진행 후 NGS로 확인한 결과, PAM(노란색 상자 표시) 앞 6bp에 TT insertion이 발생한 것을 확인한 결과를 나타낸다.
도 15는 위 NRAS target site에 SpCas9과 FnCas9을 이용하여 prime editing을 진행 후 NGS의 결과를 분석한 것을 나타낸다(빨간색 상자 표시: insertion, 노란색 상자 표시: PAM).
도 16은 FnCas9 prime editor를 이용한 Expansion된 표적 범위에 대한 개략적인 모식도를 나타낸다.
도 17은 SpCas9 nickase(H840A)와 FnCas9(H969A) nickase를 기반으로 하는 prime editing의 c-Myc 및 NRAS 유전자에 대한 표적 특이적 뉴클레오티드 삽입을 확인한 결과를 나타낸다.(노란색: PAM, 기울임 TT: 삽입서열)
도 18은 FnCas9과 reverse transcriptase 서열 사이에 링커 서열을 추가하는 경우의 insertion의 정확도 변화를 확인한 결과를 나타낸다.
도 19는 본 발명에 따른 priming editing을 위한 3중 또는 4중 플라스미드 전달 시스템의 모식도를 나타낸다.
도 20은 FnCas9(H969A)-RT을 이용한 프라임 편집의 범위 확장 확인을 위한 표적 서열 정보를 나타낸다.
도 21은 c-Myc 유전자에 대하여 AA insertion 효율을 비교한 결과를 나타낸다. (밑줄 AA: 삽입서열, CGG: PAM)
도 22는 FnCas9 prime editor를 이용시 목적하는 위치에서의 점 돌연변이 및 insertion이 상당히 자유롭게 이루어지는 것을 확인한 결과를 나타낸다.
도 23은 FnCas9(H969A)-RT를 통하여 우수한 insertion 효과를 확인한 결과를 나타낸다.
도 24는 FnCas9(H969A)-RT를 이용하는 경우 비표적 교정 효과가 더 적어 표적 특이성에서 우수한 성질을 나타내는 것을 확인한 결과이다.
1 shows a schematic diagram of comparison of prime editing using the FnCas9 nickase module and the SpCas9 nickase module. 1A shows a method of inserting an external gene (XX) using a SpCas9 nickase (H840A) type reverse transcriptase (RT) coupled SpCas9 prime editor that causes only non-target strand cleavage, FIG. 1B shows a method of inserting a foreign gene (XX) using the FnCas9 prime editor coupled with a reverse transcriptase (RT: reverse transcriptase) type of FnCas9 nickase (H969A) that only cuts non-target strands. At this time, after nick occurs between the PBS (primer binding site) of the pegRNA and the RT template (reverse transcription template), as the base pairing with the complementary part, the reverse transcriptase starts synthesis along the pegRNA, and the insertion of the part corresponding to XX (prime editing) occurs (RT(reverse transcriptase): reverse transcriptase, arrow (cleavage point): nick part, green: PAM (NGG) sequence, XX: external sequence to be inserted, yellow: PBS)
Figure 2 shows a schematic diagram of a CMV promoter-based FnCas9 prime editior expression vector in one embodiment of the present invention. It is designed to be expressed in higher animal cells based on the CMV promoter, and indicates that the vector is designed so that it can be expressed simultaneously by linking reverse transcriptase to the existing wild type and H969A mutant (nickase) FnCas9 C-terminus. .
3 shows a schematic diagram of a pegRNA (prime editing guide RNA) expression plasmid for FnCas9-PE based on the U6 promoter in one embodiment of the present invention. It indicates that pegRNA can be expressed based on the U6 promoter and designed to have a target sequence in the downstream.
4 shows a schematic diagram of a pegRNA for FnCas9-PE operation in an embodiment of the present invention (a target gene insertion site and a priming sequence insertion site diagram). Specifically, the PBS (primer binding site) and the reverse transcription template sequence were designed and manufactured to be located downstream of the FnCas9 scaffold, and as the target sequence was changed, the target sequence and the corresponding PBS The +RT sequence was inserted using a restriction enzyme to make FnCas9-PE workable.
5 is a HEK3 target site that corresponds to the HEK3 target site for checking whether targeting for editing is well using SpCas9 and FnCas9.
6 shows the NGS sequence analysis results obtained from the amplicons of the HEK3 site treated with SpCas9 and FnCas9. The blue bar histogram shows indels (%) analyzed at the HEK3 site of SpCas9-treated cells, and the orange bar histogram shows indels (%) analyzed at the HEK3 site of FnCas9-treated cells.
7 shows the nucleotide sequence analysis results of c-Myc, EMX1 and HEK3 target positions for confirming the FnCas9 cleavage point and the cleavage point of the SpCas9 system. The red line indicates the point where the sequencing was finished, indicating the DNA fragment cut by FnCas9 or SpCas9 (TS: target strand, NTS: non-target strand).
Figure 8 shows the expected nucleotide sequence and pegRNA design for HEK3 site prime editing using SpCas9 (shows the target DNA nucleotide sequence after being edited by 'CTT' sequence insertion using the SpCas9 prime editor, and the length of PBS and RT inside pegRNA is optimized according to the target).
Figure 9 shows the HEK3 site prime editing predicted nucleotide sequence and pegRNA design using FnCas9 (predicted DNA sequence after TT insertion and editing using FnCas9 prime editor. The targets of SpCas9 and FnCas9 are the same, but the prime editing guide Attempts to optimize efficiency by diversifying the length of the primer binding site (PBS) and RT (reverse transcription template) in RNA).
10 shows the NGS results analyzed after prime editing was performed using SpCas9 and FnCas9 at the HEK3 target site (SpCas9 prime editor was used as a control, and prime editing was performed so that bases were inserted at different positions of the same target). As a result of NGS, it can be confirmed that CTT insertion (marked in red box) occurred at the correct position in the case of SpCas9, and it indicates that TT insertion (marked in red box) occurs in the correct position also in the case of FnCas9 prime editor. In addition, in the case of the FnCas9 prime editor, it was confirmed that the insertion occurred in front of the SpCas9 prime editor, which can be corrected from 3bp in front of the PAM (indicated in yellow) 6bp.
11 shows the expected nucleotide sequence and pegRNA design for NRAS site prime editing using SpCas9 (shows the target DNA nucleotide sequence after editing with 'TT' sequence insertion using the SpCas9 prime editor, and the length of PBS and RT inside pegRNA is optimized according to the target).
12 shows the results of confirming that TT insertion occurred 3bp before PAM (yellow box) as a result of selecting the NRAS gene as a target and confirming it through NGS after prime editing with the existing SpCas9 prime editor
13 shows the predicted nucleotide sequence and pegRNA design for NRAS site prime editing using FnCas9 (shows the predicted DNA sequence after TT insertion and editing using FnCas9 prime editor, SpCas9 and FnCas9 have the same target, but FnCas9 cleavage The insertion position according to the point is set differently).
14 shows the results of confirming that TT insertion occurred at 6bp before PAM (indicated by yellow box) as a result of NGS after prime editing using FnCas9 prime editor by selecting the NRAS gene as a target.
Figure 15 shows the analysis of the results of NGS after prime editing using SpCas9 and FnCas9 on the NRAS target site (red box: insertion, yellow box: PAM).
16 shows a schematic schematic diagram of the expanded target range using the FnCas9 prime editor.
17 shows the results of confirming target-specific nucleotide insertion into c-Myc and NRAS genes of prime editing based on SpCas9 nickase (H840A) and FnCas9 (H969A) nickase. (Yellow: PAM, italic TT: insertion sequence )
18 shows the result of confirming the change in accuracy of insertion when a linker sequence is added between FnCas9 and reverse transcriptase sequence.
19 shows a schematic diagram of a triple or quadruple plasmid delivery system for priming editing according to the present invention.
20 shows target sequence information for confirming the range extension of prime editing using FnCas9(H969A)-RT.
21 shows the results of comparing the AA insertion efficiency with respect to the c-Myc gene. (underline AA: insertion sequence, CGG: PAM)
22 shows the results of confirming that point mutations and insertions at desired positions are made quite freely when using the FnCas9 prime editor.
23 shows the results of confirming the excellent insertion effect through FnCas9(H969A)-RT.
24 is a result confirming that when FnCas9(H969A)-RT is used, the off-target correction effect is less and exhibits excellent properties in target specificity.

이하 본 발명을 하나 이상의 실시예를 통하여 보다 상세하게 설명한다. 그러나, 이들 실시예는 본 발명을 예시적으로 설명하기 위한 것으로 본 발명의 범위가 이들 실시예에 한정되는 것은 아니다.Hereinafter, the present invention will be described in more detail through one or more embodiments. However, these examples are for illustrative purposes of the present invention, and the scope of the present invention is not limited to these examples.

실시예 1. FnCas9 기반 prime editor (FnCas9-PE) 제작Example 1. FnCas9-based prime editor (FnCas9-PE) production

기존의 prime editor는 SpCas9 nickase(H840A)를 기반으로 하여 목표 유전자 내 non-target strand에 nick을 일으킨 후 연결된 Reverse transcriptase(RT)에 의해 외부 유전자가 삽입되도록 개발되었다. The existing prime editor was developed based on SpCas9 nickase (H840A) to nick the non-target strand in the target gene and then insert the foreign gene by the linked reverse transcriptase (RT).

이와 유사한 방식으로 작동하도록 FnCas9(H969A) nickase를 기반으로 하는 prime editor(FnCas9-PE)를 개발하였고, 이의 구체적인 모식도를 도 1에 나타내었다. A prime editor (FnCas9-PE) based on FnCas9 (H969A) nickase was developed to operate in a similar manner, and a specific schematic diagram thereof is shown in FIG. 1 .

구체적으로, SpCas9 nickase(H840A)와 FnCas9(H969A) nickase를 기반으로 하는 Prime editing 기술의 차이로써 도 1의 A는 SpCas9 nickase(H840A) 기반 Prime editing 기술을 나타내며, 도 1의 B는 FnCas9(H969A) nickase 기반 Prime editing 기술을 나타낸다. Specifically, as the difference in Prime editing technology based on SpCas9 nickase (H840A) and FnCas9 (H969A) nickase, A in FIG. 1 shows SpCas9 nickase (H840A) based Prime editing technology, and B in FIG. 1 is FnCas9 (H969A) Represents nickase-based Prime editing technology.

pegRNA의 PBS(primer binding site)와 RT template(reverse transcription template) 사이에 nick이 일어나게 된 후 상보적인 부분과 base pairing 되면서 역전사 효소가 pegRNA를 따라서 합성을 시작하게 되고 XX에 해당하는 부분의 삽입(prime editing)이 발생한다. FnCas9(H969A) nickase의 사용은 SpCas9 nickase의 사용과 달리 PAM 으로부터 6bp 떨어진 곳에 nick을 형성함으로써 기존 교정 기술과 대비하여 유전체 교정상의 교정 확장성을 증가시켰다. 또한, FnCas9이 인식하는 guide RNA scaffold 구조가 SpCas9과 다르기 때문에, FnCas9 기반 새로운 prime editing 기술을 기존 SpCas9 기반 prime editing 기술과 동시 적용함으로써 서로 간섭없이 prime editing을 통하여 다중으로 외부 유전자 삽입 또는 치환이 가능하다. After nick occurs between the PBS (primer binding site) of pegRNA and the RT template (reverse transcription template), as the base pairing with the complementary part, the reverse transcriptase starts synthesis along the pegRNA, and insertion of the part corresponding to XX (prime) editing) takes place. Unlike the use of SpCas9 nickase, the use of FnCas9(H969A) nickase increased the scalability of genome editing compared to the existing editing technology by forming a nick 6bp away from the PAM. In addition, since the guide RNA scaffold structure recognized by FnCas9 is different from that of SpCas9, multiple external gene insertion or substitution is possible through prime editing without interfering with each other by simultaneously applying the new FnCas9-based prime editing technology with the existing SpCas9-based prime editing technology. .

위와 같은 방법을 통해 작동하는 FnCas9(H969A) nickase를 기반으로 하는 prime editor(FnCas9-PE)을 고등 동물 세포내에서 작동할 수 있도록, FnCas9-PE 발현 벡터를 제작하였다. An FnCas9-PE expression vector was prepared so that a prime editor (FnCas9-PE) based on FnCas9 (H969A) nickase that operates through the above method can be operated in higher animal cells.

구체적으로, FnCas9(H969A) nickase에 연결된 역전사효소(RT)의 발현을 인체유래세포 대상 최적화하기 위하여 human codon optimization을 진행하였고, CMV 프로모터 기반으로 발현할 수 있는 벡터를 제작하였다. Specifically, human codon optimization was performed to optimize the expression of reverse transcriptase (RT) linked to FnCas9 (H969A) nickase in human-derived cells, and a vector capable of expression based on the CMV promoter was prepared.

위 제조된 FnCas9-PE 발현 벡터의 모식도를 도 2에 나타내었다. A schematic diagram of the FnCas9-PE expression vector prepared above is shown in FIG. 2 .

한편, 외부 유전자 삽입을 위한 염기서열을 포함한 pegRNA (prime editing guide RNA)를 디자인은 U6 프로모터 기반으로 수행하였다. Meanwhile, pegRNA (prime editing guide RNA) including a nucleotide sequence for inserting an external gene was designed based on the U6 promoter.

구체적으로, U6 promoter를 기반으로 pegRNA가 발현될 수 있도록 디자인하였다 (도 3). 특히, PBS(primer binding site)와 reverse transcription template 서열을 삽입할 수 있는 위치를 FnCas9 scaffold의 down stream에 위치하도록 디자인하고, 표적 염기서열이 바뀜에 따라서 표적 염기서열과 그에 해당하는 PBS+RT 시퀀스를 제한효소를 이용해 삽입하여 FnCas9-PE를 작동시키도록 하였다(도 4). 외부 유전자 삽입을 위한 염기서열을 포함한 pegRNA (prime editing guide RNA)에 대한 구체적 제조방법은 이하 실시예에서 보다 구체적으로 설명한다. Specifically, it was designed so that pegRNA could be expressed based on the U6 promoter (FIG. 3). In particular, the position where the PBS (primer binding site) and reverse transcription template sequence can be inserted is designed to be located downstream of the FnCas9 scaffold, and as the target sequence is changed, the target sequence and the corresponding PBS + RT sequence are It was inserted using a restriction enzyme to operate FnCas9-PE (FIG. 4). A specific manufacturing method for pegRNA (prime editing guide RNA) including a nucleotide sequence for inserting an external gene will be described in more detail in Examples below.

실시예 2. FnCas9의 CRISPR-Cas9 effector로의 작동 확인 Example 2. Confirmation of operation of FnCas9 as a CRISPR-Cas9 effector

기존 SpCas9 기반 CRISPR-Cas9 모듈의 유전자 염기서열 타겟팅 여부를 직접적으로 비교하기 위하여 SpCas9 및 FnCas9에 대해 각각 표적 염기서열(HEK3 site)에 돌연변이(indel)를 유도할 수 있는 sgRNA(single-guide RNA) 발현 벡터를 디자인하고 제작하였다. In order to directly compare whether the gene sequence targeting of the existing SpCas9-based CRISPR-Cas9 module is targeted, sgRNA (single-guide RNA) expression capable of inducing a mutation (indel) in the target sequence ( HEK3 site) for SpCas9 and FnCas9, respectively Vector was designed and produced.

구체적으로, FnCas9-PE 발현 벡터는 상기 실시예 1에서 제조된 것을 사용하였다. Specifically, the FnCas9-PE expression vector prepared in Example 1 was used.

SpCas9-PE 발현 벡터는 FnCas9-PE 발현 벡터와 기본적으로 상동하며, FnCas9 nickase (H969A) 대신 SpCas9 nickase(H840A) 유전자를 사용하여 제조하였다. The SpCas9-PE expression vector is basically homologous to the FnCas9-PE expression vector, and was prepared by using the SpCas9 nickase (H840A) gene instead of the FnCas9 nickase (H969A) gene.

HEK3 site의 표적 위치는 기존 문헌(Nature, Anzalone et al, 2019.)을 참고하여, 선정하였다. 이의 예시적인 표적 위치를 도 5에 나타내었다(서열번호 27 : GGCCCAGACTGAGCACGTGATGG ). The target location of the HEK3 site was selected with reference to the existing literature (Nature, Anzalone et al, 2019.). An exemplary target position thereof is shown in FIG. 5 (SEQ ID NO: 27: GGCCCAGACTGAGCACGTGATGG) .

pegRNA가 발현될 수 있도록 HEK3 site의 표적 위치를 포함하는 FnCas9 pegRNA 발현 벡터 및 SpCas9 pegRNA 발현 벡터를 각각 제조하였다. An FnCas9 pegRNA expression vector and an SpCas9 pegRNA expression vector including a target position of the HEK3 site were prepared so that pegRNA could be expressed.

구체적으로, U6 프로모터를 사용하여 pegRNA가 발현될 수 있는 벡터를 사용하였으며, HEK3 site의 표적 염기서열 정보 (서열번호 27 : GGCCCAGACTGAGCACGTGATGG)와 이를 기반으로 외부유전자 삽입 서열(서열번호 28: CATCACGTAAGCTCAGTCTG (PBS + RT))을 연결하여 제작하였다. Specifically, a vector capable of expressing pegRNA using the U6 promoter was used, and the target nucleotide sequence information of the HEK3 site (SEQ ID NO: 27: GGCCCAGACTGAGCACGTGATTGG ) and the foreign gene insertion sequence (SEQ ID NO: 28: CATCACGTAAGCTCAGTCTG (PBS +) RT)) was connected.

프라임 에디터 작동 이전에 FnCas9 모듈의 활성을 테스트하기 위해서 To test the activation of the FnCas9 module before running the prime editor

상기 제조된 각각 CRISPR-Cas9 effector(SpCas9 및 FnCas9)와 sgRNA 발현 벡터를 동시에 transfection 진행하였다. The CRISPR-Cas9 effector (SpCas9 and FnCas9) and the sgRNA expression vector prepared above were simultaneously transfected.

구체적으로, 전기 천공(electroporator) 방법을 통해 tansfection을 수행하였다.Specifically, tansfection was performed through an electroporator method.

그리고나서, NGS 분석을 illumina 시퀀싱 기기를 사용하여 표적 amplicon 기반으로 수행하고, 표적 특이적(HEK3 site)인 유전체 교정 결과(indel 패턴)를 확인하였다. Then, NGS analysis was performed based on the target amplicon using an illumina sequencing device, and the target-specific ( HEK3 site) genome editing result (indel pattern) was confirmed.

그 결과를 도 6에 나타내었다. The results are shown in FIG. 6 .

도 6을 통해 확인할 수 있는 바와 같이, CRISPR-Cas9 effector로 FnCas9을 사용하는 경우에 우수한 교정 효과를 나타내는 것을 확인하였다. As can be seen from FIG. 6 , it was confirmed that an excellent correction effect was exhibited when FnCas9 was used as the CRISPR-Cas9 effector.

그리고 나서, FnCas9 모듈 및 SpCas9 모듈 각각을 이용해 prime editing을 시행하기 이전에 NTS(non-target strand)에 nick이 발생하는 위치를 확인하기 위하여 in-vitro cleavage assay를 수행하였다. Then, in-vitro cleavage assay was performed to confirm the location where nick occurred on the NTS (non-target strand) before prime editing was performed using each of the FnCas9 module and the SpCas9 module.

즉, HEK3 site, NRAS site, AAVS1 site, EMX1 site, c-Myc site 의 Target site를 T-vector에 클로닝한 후 FnCas9 또는 SpCas9으로 in-vitro cleavage를 수행한 후, 잘린 단편들을 run-off 시퀀싱 분석을 통해 FnCas9의 cleavage point를 확인하였다. That is, after cloning the target sites of HEK3 site, NRAS site, AAVS1 site, EMX1 site, and c-Myc site into T-vector, in-vitro cleavage was performed with FnCas9 or SpCas9, and then the cut fragments were analyzed by run-off sequencing. Through this, the cleavage point of FnCas9 was confirmed.

상기 표적 서열 정보는 하기 표 1에 나타내었다. The target sequence information is shown in Table 1 below.

Target genetarget gene CRISPR-FnCas9 (FnCas9)
target sequence (5' to 3')
CRISPR-FnCas9 (FnCas9)
target sequence (5' to 3')
sequence for FnCas9
(5′' to 3′')
sequence for FnCas9
(5'' to 3'')
sgRNA sequence for SpCas9 (5′'-3′')sgRNA sequence for SpCas9 (5′′-3′′)
c-Mycc-Myc AGGCAGAGGGAGCGAGCGGG CGG
(서열번호 29)
AGGCAGAGGGAGCGAGCGGG CGG
(SEQ ID NO: 29)
AGGCAGAGGGAGCGAGCGGGGUUUCAGUUGCUGAAAAUGCUCUGUAAUCAUUUAAAAGUAUUUUGAACGGACCUCUGUUUGACACGUCUGAAUAACUAAAAA
(서열번호 30)
AGGCAGAGGGAGCGAGCGGGGUUUCAGUUGCUGAAAAUGCUCUGUAAUCAUUUAAAAGUAUUUUGAACGGACCUCUGUUUGACACGUCUGAAUAACUAAAAA
(SEQ ID NO: 30)
AGGCAGAGGGAGCGAGCGGGGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU
(서열번호 31)
AGGCAGAGGGAGCGAGCGGGGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU
(SEQ ID NO: 31)
AAVS1AAVS1 TCTAACCCCCACCTCCTGTT AGG (서열번호 32)TCTAACCCCCACCTCCTGTT AGG (SEQ ID NO: 32) UCUAACCCCCACCUCCUGUUGUUUCAGUUGCUGAAAAUGCUCUGUAAUCAUUUAAAAGUAUUUUGAACGGACCUCUGUUUGACACGUCUGAAUAACUAAAAA
(서열번호 33)
UCUAACCCCCACCUCCUGUUGUUUCAGUUGCUGAAAAUGCUCUGUAAUCAUUUAAAAGUAUUUUGAACGGACCUCUGUUUGACACGUCUGAAUAACUAAAAA
(SEQ ID NO: 33)
UCUAACCCCCACCUCCUGUUGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU
(서열번호 34)
UCUAACCCCCACCUCCUGUUGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU
(SEQ ID NO: 34)
EMX1EMX1 TGGTTGCCCACCCTAGTCAT TGG (서열번호 35)TGGTTGCCCACCCTAGTCAT TGG (SEQ ID NO: 35) UGGUUGCCCACCCUAGUCAUGUUUCAGUUGCUGAAAAUGCUCUGUAAUCAUUUAAAAGUAUUUUGAACGGACCUCUGUUUGACACGUCUGAAUAACUAAAAA
(서열번호 36)
UGGUUGCCCACCCUAGUCAUGUUUCAGUUGCUGAAAAUGCUCUGUAAUCAUUUAAAAGUAUUUUGAACGGACCUCUGUUUGACACGUCUGAAUAACUAAAAA
(SEQ ID NO: 36)
UGGUUGCCCACCCUAGUCAUGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU
(서열번호 37)
UGGUUGCCCACCCUAGUCAUGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU
(SEQ ID NO: 37)
HEK3HEK3 GGCCCAGACTGAGCACGTGA TGG (서열번호 38)GGCCCAGACTGAGCACGTGA TGG (SEQ ID NO: 38) GGCCCAGACUGAGCACGUGAGUUUCAGUUGCUGAAAAUGCUCUGUAAUCAUUUAAAAGUAUUUUGAACGGACCUCUGUUUGACACGUCUGAAUAACUAAAAA
(서열번호 39)
GGCCCAGACUGAGCACGUGAGUUUCAGUUGCUGAAAAUGCUCUGUAAUCAUUUAAAAGUAUUUUGAACGGACCUCUGUUUGACACGUCUGAAUAACUAAAAA
(SEQ ID NO: 39)
GGCCCAGACUGAGCACGUGAGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU
(서열번호 40)
GGCCCAGACUGAGCACGUGAGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU
(SEQ ID NO: 40)
NRASNRAS GGTAAGGGGGCAGGGAGGGA GGG (서열번호 41)GGTAAGGGGGCAGGGAGGGA GGG (SEQ ID NO: 41) GGUAAGGGGGCAGGGAGGGAGUUUCAGUUGCUGAAAAUGCUCUGUAAUCAUUUAAAAGUAUUUUGAACGGACCUCUGUUUGACACGUCUGAAUAACUAAAAA
(서열번호 42)
GGUAAGGGGGCAGGGAGGGAGUUUCAGUUGCUGAAAAUGCUCUGUAAUCAUUUAAAAGUAUUUUGAACGGACCUCUGUUUGACACGUCUGAAUAACUAAAAA
(SEQ ID NO: 42)
GGUAAGGGGGCAGGGAGGGAGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU
(서열번호 43)
GGUAAGGGGGCAGGGAGGGAGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU
(SEQ ID NO: 43)

PAM sequences (NGG) 는 밑줄 표시함. 구체적으로 Sanger sequencing 을 통하여 FnCas9 과 SpCas9의 절단 지점을 비교 분석 하였다. PAM sequences (NGG) are underlined. Specifically, the cleavage points of FnCas9 and SpCas9 were compared and analyzed through Sanger sequencing.

그 결과를 도 7에 나타내었다. 도 7을 통해 확인할 수 있는 바와 같이, FnCas9은 non-target strand 에 6-8nt 5'-overhang으로 cleavage가 발생함을 확인할 수 있었고, SpCas9은 3nt 5'-overhang으로 cleavage가 발생하는 것을 확인할 수 있었다. The results are shown in FIG. 7 . 7, it was confirmed that cleavage occurred in FnCas9 with 6-8nt 5'-overhang on the non-target strand, and it was confirmed that cleavage occurred with 3nt 5'-overhang of SpCas9. .

위 결과를 통하여, CRISPR-Cas9 effector로 FnCas9을 사용하는 경우 기존 SpCas9을 사용하는 경우와 대비하여 표적 DNA에 nick을 형성하는 위치가 달리 나타남을 확인하였다. Through the above results, it was confirmed that when FnCas9 was used as the CRISPR-Cas9 effector, the position for forming the nick on the target DNA was different compared to the case of using the existing SpCas9.

실시예 3. FnCas9 기반 prime editing의 확인 (HEK3 표적 서열)Example 3. Identification of FnCas9-based prime editing (HEK3 target sequence)

SpCas9 기반의 prime editing 시스템과 FnCas9 기반의 prime editing을 직접적으로 비교하기 위하여 SpCas9(H840A)-RT, FnCas9(H969A)-RT 형식의 prime editor에 대해 각각 표적 염기서열(HEK3 site)에 외부 유전자(CTT or TT)를 삽입할 수 있는 pegRNA(prime editing-guide RNA) 발현 벡터를 디자인하였다. In order to directly compare the SpCas9-based prime editing system and the FnCas9-based prime editing system, the SpCas9(H840A)-RT, FnCas9(H969A)-RT type prime editor was inserted into the target sequence ( HEK3 site) of the foreign gene (CTT), respectively. or TT), a pegRNA (prime editing-guide RNA) expression vector that can be inserted was designed.

구체적으로, SpCas9을 이용한 HEK3 site prime editing 예상 염기서열 및 pegRNA 디자인의 모식도는 도 8에 나타내었다. Specifically, a schematic diagram of the expected nucleotide sequence and pegRNA design for HEK3 site prime editing using SpCas9 is shown in FIG. 8 .

도 8에 나타낸 바와 같이, SpCas9 prime editor를 이용하여 'CTT' sequence insertion이 되어 editing 될 수 있도록 디자인하고, pegRNA 내부의 PBS 와 RT의 길이는 타겟에 따라서 최적화하였다. As shown in FIG. 8, the 'CTT' sequence insertion was designed to be edited using the SpCas9 prime editor, and the lengths of PBS and RT inside the pegRNA were optimized according to the target.

구체적으로, FnCas9-PE 발현 벡터는 상기 실시예 1에서 제조된 것을 사용하였다. Specifically, the FnCas9-PE expression vector prepared in Example 1 was used.

SpCas9-PE 발현 벡터는 FnCas9-PE 발현 벡터와 기본적으로 상동하며, FnCas9 nickase (H969A) 대신 SpCas9 nickase(H840A) 유전자를 사용하여 제조하였다. The SpCas9-PE expression vector is basically homologous to the FnCas9-PE expression vector, and was prepared by using the SpCas9 nickase (H840A) gene instead of the FnCas9 nickase (H969A) gene.

HEK3 site의 표적 위치는 기존 문헌을 참고, 프라임 에디팅이 수월한 표적으로 선정하였고, 이의 예시적인 표적 위치를 도 5에 나타내었다(서열번호 27: GGCCCAGACTGAGCACGTGATGG). The target position of the HEK3 site was selected as a target for easy prime editing by referring to the existing literature, and an exemplary target position thereof is shown in FIG. 5 (SEQ ID NO: 27: GGCCCAGACTGAGCACGTGATTGG).

한편, FnCas9을 이용한 HEK3 site prime editing 예상 염기서열 및 pegRNA 디자인의 모식도는 도 9에 나타내었다. On the other hand, a schematic diagram of the expected nucleotide sequence and pegRNA design for HEK3 site prime editing using FnCas9 is shown in FIG. 9 .

도 9에 나타낸 바와 같이, FnCas9 prime editor를 이용하여 TT insertion이 되어 editing 될 수 있도록 디자인하였다. 위 언급된 SpCas9과 FnCas9의 target은 동일하나, prime editing guide RNA내 primer binding site(PBS) 및 RT(reverse transcription template)의 길이를 다변화하여 효율 최적화를 수행하였고, 이러한 서열정보를 아래 표 2에 나타내었다. As shown in Fig. 9, using the FnCas9 prime editor, the TT insertion was designed to be edited. Although the targets of SpCas9 and FnCas9 mentioned above are the same, efficiency optimization was performed by diversifying the lengths of the primer binding site (PBS) and reverse transcription template (RT) in the prime editing guide RNA, and the sequence information is shown in Table 2 below. It was.

위 실험을 위한 벡터의 제조는 앞서 실시예 1 및 2와 유사하게 진행되었다. Preparation of the vector for the above experiment was carried out similarly to Examples 1 and 2 above.

표적 유전자 위치 및 PBS+RTT
길이별 pegRNA
(PBS 길이- RTT길이)
Target gene location and PBS+RTT
pegRNA by length
(PBS length - RTT length)
표적 염기서열
(서열번호 27)
target sequence
(SEQ ID NO: 27)
pegRNA 염기서열 (5'-3')
pegRNA sequence (5'-3')
HEK3 FnCas9_pegRNA_10-10HEK3 FnCas9_pegRNA_10-10 GGCCCAGACTGAGCACGTGATGG GGCCCAGACTGAGCACGTGA TGG
서열번호 44

5'
GGGCCCAGACTGAGCACGTGA GTTTCAGTTGCTGAATTATTTGGTAAACAGTACCAAATAATTAATGCTCTGTAATCATTTAAAAGTATTTTGAACGGACCTCTGTTTGACACGTCTGAATAACTAAAAA CATCACGTAAGCTCAGTCTGTTTTTTT
3'

SEQ ID NO: 44

5'
G GGCCCAGACTGAGCACGTGA GTTTCAGTTGCTGAATTATTTGGTAAACAGTACCAAATAATTAATGCTCTGTAATCATTTAAAAGTATTTTGAACGGACCTCTGTTTGACACGTCTGAATAACTAAAAA CATCACGTAAGCTCAGTCTG TTTTTTT
3'
HEK3 FnCas9_pegRNA_10-12HEK3 FnCas9_pegRNA_10-12 GGCCCAGACTGAGCACGTGATGG GGCCCAGACTGAGCACGTGA TGG 서열번호 45

5'
GGGCCCAGACTGAGCACGTGA GTTTCAGTTGCTGAATTATTTGGTAAACAGTACCAAATAATTAATGCTCTGTAATCATTTAAAAGTATTTTGAACGGACCTCTGTTTGACACGTCTGAATAACTAAAAA GCCATCACGTaaGCTCAGTCTGTTTTTTT
3'
SEQ ID NO: 45

5'
G GGCCCAGACTGAGCACGTGA GTTTCAGTTGCTGAATTATTTGGTAAACAGTACCAAATAATTAATGCTCTGTAATCATTTAAAAGTATTTTGAACGGACCTCTGTTTGACACGTCTGAATAACTAAAAA GCCATCACGTaaGCTCAGTCTG TTTTTTT
3'
HEK3 FnCas9_pegRNA_10-15HEK3 FnCas9_pegRNA_10-15 GGCCCAGACTGAGCACGTGATGG GGCCCAGACTGAGCACGTGA TGG 서열번호 46

5'
GGGCCCAGACTGAGCACGTGA GTTTCAGTTGCTGAATTATTTGGTAAACAGTACCAAATAATTAATGCTCTGTAATCATTTAAAAGTATTTTGAACGGACCTCTGTTTGACACGTCTGAATAACTAAAAA TCTGCCATCACGTaaGCTCAGTCTGTTTTTTT
3'
SEQ ID NO: 46

5'
G GGCCCAGACTGAGCACGTGA GTTTCAGTTGCTGAATTATTTGGTAAACAGTACCAAATAATTAATGCTCTGTAATCATTTAAAAGTATTTTGAACGGACCTCTGTTTGACACGTCTGAATAACTAAAAA TCTGCCATCACGTaaGCTCAGTCTG TTTTTTT
3'
HEK3 FnCas9_pegRNA_11-10HEK3 FnCas9_pegRNA_11-10 GGCCCAGACTGAGCACGTGATGG GGCCCAGACTGAGCACGTGA TGG 서열번호 47
5'
GGGCCCAGACTGAGCACGTGA GTTTCAGTTGCTGAATTATTTGGTAAACAGTACCAAATAATTAATGCTCTGTAATCATTTAAAAGTATTTTGAACGGACCTCTGTTTGACACGTCTGAATAACTAAAAA CATCACGTaaGCTCAGTCTGGTTTTTTT
3'
SEQ ID NO: 47
5'
G GGCCCAGACTGAGCACGTGA GTTCAGTTGCTGAATTATTTGGTAAACAGTACCAAATAATTAATGCTCTGTAATCATTTAAAAGTATTTTGAACGGACCTCTGTTTGACACGTCTGAATAACTAAAAA CATCACGTaaGCTCAGTCTGG TTTTTTT
3'
HEK3 FnCas9_pegRNA_11-12HEK3 FnCas9_pegRNA_11-12 GGCCCAGACTGAGCACGTGATGG GGCCCAGACTGAGCACGTGA TGG 서열번호 48
5'
GGGCCCAGACTGAGCACGTGA GTTTCAGTTGCTGAATTATTTGGTAAACAGTACCAAATAATTAATGCTCTGTAATCATTTAAAAGTATTTTGAACGGACCTCTGTTTGACACGTCTGAATAACTAAAAA GCCATCACGTaaGCTCAGTCTGGTTTTTTT
3'
SEQ ID NO: 48
5'
G GGCCCAGACTGAGCACGTGA GTTCAGTTGCTGAATTATTTGGTAAACAGTACCAAATAATTAATGCTCTGTAATCATTTAAAAGTATTTTGAACGGACCTCTGTTTGACACGTCTGAATAACTAAAAA GCCATCACGTaaGCTCAGTCTGG TTTTTTT
3'
HEK3 FnCas9_pegRNA_11-15HEK3 FnCas9_pegRNA_11-15 GGCCCAGACTGAGCACGTGATGG GGCCCAGACTGAGCACGTGA TGG 서열번호 49
5'
GGGCCCAGACTGAGCACGTGA GTTTCAGTTGCTGAATTATTTGGTAAACAGTACCAAATAATTAATGCTCTGTAATCATTTAAAAGTATTTTGAACGGACCTCTGTTTGACACGTCTGAATAACTAAAAA TCTGCCATCACGTaaGCTCAGTCTGGTTTTTTT
3'
SEQ ID NO: 49
5'
G GGCCCAGACTGAGCACGTGA GTTTCAGTTGCTGAATTATTTGGTAAACAGTACCAAATAATTAATGCTCTGTAATCATTTAAAAGTATTTTGAACGGACCTCTGTTTGACACGTCTGAATAACTAAAAA TCTGCCATCACGTaaGCTCAGTCTGG TTTTTTT
3'
HEK3 FnCas9_pegRNA_13-10HEK3 FnCas9_pegRNA_13-10 GGCCCAGACTGAGCACGTGATGG GGCCCAGACTGAGCACGTGA TGG 서열번호 50
5'
GGGCCCAGACTGAGCACGTGA GTTTCAGTTGCTGAATTATTTGGTAAACAGTACCAAATAATTAATGCTCTGTAATCATTTAAAAGTATTTTGAACGGACCTCTGTTTGACACGTCTGAATAACTAAAAA CATCACGTaaGCTCAGTCTGGGCTTTTTTT
3'
SEQ ID NO: 50
5'
G GGCCCAGACTGAGCACGTGA GTTTCAGTTGCTGAATTATTTGGTAAACAGTACCAAATAATTAATGCTCTGTAATCATTTAAAAGTATTTTGAACGGACCTCTGTTTGACACGTCTGAATAACTAAAAA CATCACGTaaGCTCAGTCTGGGC TTTTTTT
3'
HEK3 FnCas9_pegRNA_13-12HEK3 FnCas9_pegRNA_13-12 GGCCCAGACTGAGCACGTGATGG GGCCCAGACTGAGCACGTGA TGG 서열번호 51
5'
GGGCCCAGACTGAGCACGTGA GTTTCAGTTGCTGAATTATTTGGTAAACAGTACCAAATAATTAATGCTCTGTAATCATTTAAAAGTATTTTGAACGGACCTCTGTTTGACACGTCTGAATAACTAAAAA GCCATCACGTaaGCTCAGTCTGGGCTTTTTTT
3'
SEQ ID NO: 51
5'
G GGCCCAGACTGAGCACGTGA GTTTCAGTTGCTGAATTATTTGGTAAACAGTACCAAATAATTAATGCTCTGTAATCATTTAAAAGTATTTTGAACGGACCTCTGTTTGACACGTCTGAATAACTAAAAA GCCATCACGTaaGCTCAGTCTGGGC TTTTTTT
3'
HEK3 FnCas9_pegRNA_13-15HEK3 FnCas9_pegRNA_13-15 GGCCCAGACTGAGCACGTGATGG GGCCCAGACTGAGCACGTGA TGG 서열번호 52
5'
GGGCCCAGACTGAGCACGTGA GTTTCAGTTGCTGAATTATTTGGTAAACAGTACCAAATAATTAATGCTCTGTAATCATTTAAAAGTATTTTGAACGGACCTCTGTTTGACACGTCTGAATAACTAAAAA TCTGCCATCACGTaaGCTCAGTCTGGGCTTTTTTT
3'
SEQ ID NO: 52
5'
G GGCCCAGACTGAGCACGTGA GTTTCAGTTGCTGAATTATTTGGTAAACAGTACCAAATAATTAATGCTCTGTAATCATTTAAAAGTATTTTGAACGGACCTCTGTTTGACACGTCTGAATAACTAAAAA TCTGCCATCACGTaaGCTCAGTCTGGGC TTTTTTT
3'

(TGG: PAM, Target: 밑줄, priming template(PBS+RTT): 기울임, FnCas9의 scaffold: 밑줄+기울임으로 표시함.)(TGG: PAM, Target: underlined, priming template(PBS+RTT): italic, FnCas9 scaffold: underlined+italic.)

위 제조된 벡터 시스템들을 앞서 실시예 2와 유사하게 HEK293FT 세포에 각각 prime editor 와 pegRNA 발현 벡터를 동시에 transfection 진행한 뒤 NGS 분석을 통해 표적 특이적(HEK3 site)인 외부 유전자 삽입 결과를 확인하였다.Similar to Example 2 above, the prepared vector systems were transfected with a prime editor and a pegRNA expression vector into HEK293FT cells at the same time, and then the target-specific ( HEK3 site) foreign gene insertion result was confirmed through NGS analysis.

즉, 상기 표 2의 후보 pegRNA와 prime editor를 HEK293 세포에 transfection하고, That is, the candidate pegRNA and prime editor of Table 2 were transfected into HEK293 cells,

72시간 뒤 genomic DNA(gDNA) 추출을 진행한 다음, gDNA로부터 target amplicon을 얻어내고 이를 이용해 targeted amplicon sequencing (NGS)을 진행해 외부 유전자 삽입 효율을 분석하였다. After 72 hours, genomic DNA (gDNA) was extracted, and the target amplicon was obtained from the gDNA and targeted amplicon sequencing (NGS) was performed using this to analyze the efficiency of external gene insertion.

이의 결과를 도 10에 나타내었다. The results are shown in FIG. 10 .

도 10을 통해 확인할 수 있는 바와 같이, FnCas9 prime editor를 사용하는 경우에 genomic DNA 상 표적 DNA 염기서열에 정확히 외부 유전자 'TT' 가 PAM의 6bp 앞쪽 삽입되어 있는 것을 확인할 수 있었다. 반면, SpCas9 prime editor를 사용하는 경우에 PAM의 3bp 앞쪽 위치에서의 삽입이 수행되는 것을 확인하였다. As can be seen from FIG. 10 , when using the FnCas9 prime editor, it was confirmed that the foreign gene 'TT' was inserted 6bp ahead of the PAM in the target DNA sequence on the genomic DNA. On the other hand, in the case of using the SpCas9 prime editor, it was confirmed that the insertion was performed at a position 3bp ahead of the PAM.

실시예 4. FnCas9 기반 prime editing의 확인 (NRAS 표적 서열)Example 4. Identification of FnCas9-based prime editing (NRAS target sequence)

SpCas9 기반의 prime editing 시스템과 FnCas9 기반의 prime editing을 NRAS 표적 서열에 대하여 비교 실험을 수행하였다. A comparative experiment was performed between SpCas9-based prime editing system and FnCas9-based prime editing for NRAS target sequences.

구체적으로, SpCas9 기반의 prime editing 시스템과 FnCas9 기반의 prime editing의 예시적인 모식도는 각각 도 11 및 도 13에 나타내었고, 서열 정보는 아래 표 3에 나타내었다. Specifically, exemplary schematic diagrams of SpCas9-based prime editing system and FnCas9-based prime editing are shown in FIGS. 11 and 13, respectively, and sequence information is shown in Table 3 below.

실험의 진행은 위 실시예 2 및 3의 방법과 유사하게 진행되었고, NGS를 통해 서열의 삽입을 확인한 결과를 도 12 및 도 14에 각각 나타내었다. The experiment proceeded similarly to the methods of Examples 2 and 3 above, and the results of confirming the insertion of the sequence through NGS are shown in FIGS. 12 and 14, respectively.

도 12 및 도 14를 통해 확인할 수 있는 바와 같이, FnCas9 prime editor를 사용하는 경우에 genomic DNA 상 표적 DNA 염기서열에 정확히 외부 유전자 'TT' 가 PAM의 6bp 앞쪽 삽입되어 있는 것을 확인할 수 있었다. 반면, SpCas9 prime editor를 사용하는 경우에 PAM의 3bp 앞쪽 위치에서의 삽입이 수행되는 것을 확인하였다.As can be seen through FIGS. 12 and 14 , when using the FnCas9 prime editor, it was confirmed that the foreign gene 'TT' was inserted 6bp ahead of the PAM exactly in the target DNA sequence on the genomic DNA. On the other hand, in the case of using the SpCas9 prime editor, it was confirmed that the insertion was performed at a position 3bp ahead of the PAM.

또한, 도 15에서 확인할 수 있는 바와 같이, FnCas9 prime editor를 이용하여 삽입 위치의 확장성이 2배 커졌음에도 불구하고 충분한 Editing rate를 나타내는 결과를 확인하였다. 특히, 부차적으로 생긴 원치 않은 indel 형성은 SpCas9(H840A)-RT의 경우 2.5% 유도인 반면, FnCas9(H969A)-RT의 경우 1.3%를 유도하여 정확한 교정이 가능함을 확인하였다. In addition, as can be seen in FIG. 15 , results showing a sufficient editing rate were confirmed even though the scalability of the insertion position was doubled using the FnCas9 prime editor. In particular, the secondary unwanted indel formation was 2.5% induced in the case of SpCas9(H840A)-RT, whereas 1.3% in the case of FnCas9(H969A)-RT was induced, confirming that accurate correction was possible.

실시예 5. FnCas9 기반 prime editing 최적화 수행 Example 5. FnCas9-based prime editing optimization performed

실시예 2 내지 4를 통해 확인된 FnCas9 prime editor를 이용한 Expansion된 표적 범위에 대한 개략적인 모식도를 도 16에 나타내었다. SpCas9(H840A)는 PAM(NGG)에서 3~4bp 업스트림에 닉을 형성하고 FnCas9(H969A)는 PAM(NGG)에서 6~8bp 업스트림에 닉을 형성하는 것을 앞서는 실험들을 통해 확인하였다.A schematic diagram of the expanded target range using the FnCas9 prime editor identified through Examples 2 to 4 is shown in FIG. 16 . SpCas9(H840A) formed a nick 3-4bp upstream in PAM (NGG), and FnCas9(H969A) formed a nick 6-8bp upstream in PAM(NGG) It was confirmed through previous experiments.

이에 따라, c-Myc 및 NRAS 유전자에 대한 표적 특이적 뉴클레오티드 삽입을 상기 실시예 3 및 4의 방법을 참고하여 수행하였고, 이의 결과를 도 17에 나타내었다. Accordingly, target-specific nucleotide insertion into c-Myc and NRAS genes was performed with reference to the methods of Examples 3 and 4, and the results are shown in FIG. 17 .

도 17을 통해 확인할 수 있는 바와 같이, 표적 서열에 대한 삽입 위치가 c-Myc 및 NRAS 모두에서 사용되는 Cas9 종류에 따라 상이하게 나타남을 확인하였다. As can be seen from FIG. 17 , it was confirmed that the insertion position for the target sequence was different depending on the type of Cas9 used in both c-Myc and NRAS.

그리고 나서, 정확성 개선을 위하여 FnCas9과 reverse transcriptase 서열 사이에 링커 서열을 추가하여 이의 insertion의 정확성 개선이 개선되는지 여부를 확인하였다. Then, by adding a linker sequence between the FnCas9 and reverse transcriptase sequence to improve accuracy, it was checked whether the improvement in accuracy of its insertion was improved.

링커 서열로는 서열번호 19의 서열을 중심으로 하여, 0.5X, 1X, 2X로 설정하여 실험을 수행하였다. As the linker sequence, the experiment was performed by setting the sequence of SEQ ID NO: 19 to 0.5X, 1X, and 2X.

위 서열을 포함하도록 도 18과 같이 서열을 구성한 후, 이를 이용하여 실시예 4와 같이 실험을 수행하였다. After constructing a sequence as shown in FIG. 18 to include the above sequence, an experiment was performed as in Example 4 using this.

그 결과 도 18에서 확인할 수 있는 바와 같이, 1X로 링커 서열을 포함하는 경우 prime editing 효율이 최적화됨을 확인하였다. As a result, as can be seen in FIG. 18 , it was confirmed that prime editing efficiency was optimized when the linker sequence was included as 1X.

실시예 6. FnCas9(H969A)-RT에 의한 세포내 prime editing을 위한 FnCas9(H969A)-RT 와 pegRNA 발현 벡터 제작Example 6. Preparation of FnCas9(H969A)-RT and pegRNA expression vector for intracellular prime editing by FnCas9(H969A)-RT

FnCas9(H969A)-RT 이용, 프라임 편집과 표적 서열에 대한 Nicking을 목적하는 nicking guide RNA(ngRNA)를 포함하는 시스템을 제조하였다. Using FnCas9(H969A)-RT, A system including nicking guide RNA (ngRNA) for the purpose of prime editing and nicking of the target sequence was prepared.

nicking guideRNA의 경우 보다 프라임 에디팅 효율을 제고하려는 목적으로 이용되며, 정확하고 확장된 Insersion을 위해 nicking 지점에서 -6에서 +3 위치에서 삽입되는 것이 바람직함을 확인하였다. In the case of nicking guideRNA, it is used for the purpose of improving prime editing efficiency, and it was confirmed that it is preferable to insert at the -6 to +3 position at the nicking point for accurate and extended insertion.

본원 발명에 따른 3중 또는 4중 플라스미드 전달 시스템의 모식도를 도 19에 나타내었다. A schematic diagram of the triple or quadruple plasmid delivery system according to the present invention is shown in FIG. 19 .

실시예 2와 유사하게 CMV 프로모터 기반의 SpCas9(H840A)-RT, FnCas9(H969A)-RT 발현 벡터를 제작하였다. 그리고 나서, 표적 염기서열에 외부 유전자(TT)를 삽입할 수 있도록 U6 promoter 기반의 pegRNA(prime editing-guide RNA) 발현 벡터를 디자인하였다. 그리고 나서, PE2 (ngRNA 미사용), PE3 triple (FnCas9(H969A)-RT 와 FnCas9용 ngRNA사용), PE3 triple(비교) (SpCas9(H840A)-RT 와 SpCas9용 ngRNA사용), PE3-quadruple (FnCas9(H969A)-RT 와 SpCas9용 ngRNA사용) 방식의 세포내 전달을 통하여 prime editor의 발현에 의한 유전자 교정이 가능함을 확인하였다. Similar to Example 2, CMV promoter-based SpCas9(H840A)-RT, FnCas9(H969A)-RT expression vectors were constructed. Then, a U6 promoter-based pegRNA (prime editing-guide RNA) expression vector was designed to insert a foreign gene (TT) into the target sequence. Then, PE2 (no ngRNA), PE3 triple (FnCas9(H969A)-RT with ngRNA for FnCas9), PE3 triple (comparison) (SpCas9(H840A)-RT with ngRNA for SpCas9), PE3-quadruple (FnCas9( It was confirmed that gene correction by expression of the prime editor was possible through intracellular delivery of H969A)-RT and ngRNA for SpCas9) method.

실시예 7. FnCas9(H969A)-RT을 이용한 프라임 편집의 범위 확장 Example 7. Expansion of the scope of prime editing using FnCas9(H969A)-RT

FnCas9(H969A)-RT 및 SpCas9(H840A)-RT의 프라임 범위 확장 범위에 대한 검토를 수행하였다. A review of the prime range extension range of FnCas9(H969A)-RT and SpCas9(H840A)-RT was performed.

FnCas9 nickase(H969A) 모듈은 SpCas9 nickase(H840A) 모듈에 비하여 표적 유전자의 Non-target strand 쪽에 nick을 유도하는 위치가 다르기 때문에, SpCas9 nickase(H840A) 기반의 prime editing 시스템에 비해 PAM 으로 인식되는 염기서열(NGG)로부터 더 멀리 떨어진 곳(SpCas9: 3-4bp, FnCas9:7-8bp)까지 역전사 효소에 의한 reverse transcription 시작점이 변하게 된다. 이러한 점을 활용하여 SpCas9 nickase(H969A) 모듈에 비하여 FnCas9 nickase(H969A) 모듈을 기반으로 prime editing을 유도할 수 있는 범위를 동일한 표적 염기서열에 대하여 도 20의 표적 서열을 기반으로 하여 조사하였다. Since the FnCas9 nickase (H969A) module has a different nick-inducing position on the non-target strand side of the target gene compared to the SpCas9 nickase (H840A) module, the base sequence recognized as PAM compared to the SpCas9 nickase (H840A)-based prime editing system. From (NGG) to the farther away (SpCas9: 3-4 bp, FnCas9: 7-8 bp), the reverse transcription start point by reverse transcriptase changes. Using this point, the range that can induce prime editing based on the FnCas9 nickase (H969A) module compared to the SpCas9 nickase (H969A) module was investigated based on the target sequence of FIG. 20 for the same target sequence.

293FT 세포를 대상으로 하여 유전자내 동일한 표적 염기서열에 대하여 각각의 prime editing 효율을 비교하였고, SpCas9 nickase(H840A) 모듈에 의해 nick이 형성되는 지점을 기준으로 외부 유전자가 삽입(AA)되는 지점을 표시하였다 (nicking 이 형성되는 지점을 기준으로 -6 to +3bp 지점). The prime editing efficiency of each of the 293FT cells was compared for the same target nucleotide sequence in the gene. (-6 to +3bp point based on the point at which nicking is formed).

C-myc 유전자에 대하여 실험을 수행한 결과를 도 21에 나타내었다. The results of performing an experiment on the C-myc gene are shown in FIG. 21 .

도 21을 통해 확인할 수 있는 바와 같이, AA insertion 효율을 비교한 결과 SpCas9 nickase(H969A)-RT 의 경우, nick position을 기준으로 -1 부터 +3 위치까지 10-38% 교정효율을 보였다. 반면, FnCas9 nickase(H969A)-RT의 경우 nick position을 기준으로 -6 부터 +3 위치까지 3-8% 교정효율을 보였으며, 동일한 표적내 PAM 염기서열(NGG)을 기준으로 FnCas9 nickase(H969A)-RT에 의해서 유전자 교정 범위가 크게 확장되었다. As can be seen from FIG. 21 , as a result of comparing the AA insertion efficiency, in the case of SpCas9 nickase(H969A)-RT, it showed 10-38% correction efficiency from -1 to +3 position based on the nick position. On the other hand, in the case of FnCas9 nickase (H969A)-RT, it showed 3-8% calibration efficiency from -6 to +3 position based on the nick position, and FnCas9 nickase (H969A) based on the PAM sequence (NGG) within the same target. -RT greatly expanded the range of gene editing.

또한, 목적하는 위치에서의 점 돌연변이 및 insertion이 상당히 자유롭게 이루어질 수 있음을 도 22의 결과를 통해 확인할 수 있었다. 구체적으로, 도 22는 FnCas9(H969A)-RT에 의해 유도된 부위 특이적(c-Myc, NRAS) 염기 삽입의 차세대 시퀀싱 결과를 나타내며, 1개의 염기 치환이나 염기 insertion 효율이 우수함을 확인하였다. In addition, it could be confirmed from the results of FIG. 22 that point mutations and insertions at desired positions can be made quite freely. Specifically, Figure 22 shows the next-generation sequencing result of the site-specific (c-Myc, NRAS) base insertion induced by FnCas9(H969A)-RT, and it was confirmed that the efficiency of one base substitution or base insertion was excellent.

실시예 8. FnCas9(H969A)-RT의 비표적 특이성 확인 Example 8. Confirmation of off-target specificity of FnCas9(H969A)-RT

SpCas9 nickase(H840A)-RT 보다 FnCas9 nickase(H969A)-RT 의 비표적 특이성을 확인하였다. The non-target specificity of FnCas9 nickase(H969A)-RT was confirmed rather than SpCas9 nickase(H840A)-RT.

구체적으로, 상기 실시예 5의 PE3 triple (FnCas9(H969A)-RT 와 FnCas9용 ngRNA사용), PE3 triple (SpCas9(H840A)-RT 와 SpCas9용 ngRNA사용), PE3-quadruple (FnCas9(H969A)-RT 와 SpCas9용 ngRNA사용)를 이용하여 NRAS 및 c-Myc에 대한 표적 특이성을 확인하여, 그 결과를 도 23에 나타내었다. Specifically, PE3 triple (using FnCas9(H969A)-RT and ngRNA for FnCas9) of Example 5, PE3 triple (using SpCas9(H840A)-RT and ngRNA for SpCas9), PE3-quadruple (FnCas9(H969A)-RT and ngRNA for SpCas9) were used to confirm the target specificity for NRAS and c-Myc, and the results are shown in FIG. 23 .

도 23을 통해 확인할 수 있는 바와 같이, FnCas9(H969A)-RT를 통하여 우수한 insertion 효과를 확인하였고, 비표적 타겟팅이 줄어드는 것을 확인하였다. As can be seen from FIG. 23 , an excellent insertion effect was confirmed through FnCas9(H969A)-RT, and it was confirmed that non-target targeting was reduced.

비표적에 대한 특이성을 확인한 결과를 도 24에 SpCas9(H840A)-RT, e SpCas9(H840A)-RT와 각각 비교하여 나타내었다. 도 24를 통해 확인할 수 있는 바와 같이, FnCas9(H969A)-RT에 의해 유도된 유전자(NRAS,FANCF,HBB,c-Myc,HEK3) 특이적 염기 삽입 결과에 대해 SpCas9(H840A)-RT 과 비교하였을 때, 각 유전자(NRAS,FANCF,HBB,c-Myc,HEK3) 염기서열 표적에 대한 FnCas9(H969A)-RT의 비표적 교정 효과가 더 적어 표적 특이성에서 우수한 성질을 나타내었다.The results of confirming the specificity for the non-target are shown in FIG. 24 by comparing them with SpCas9(H840A)-RT and e SpCas9(H840A)-RT, respectively. As can be seen through Figure 24, the gene (NRAS, FANCF, HBB, c-Myc, HEK3)-specific nucleotide insertion results induced by FnCas9(H969A)-RT were compared with SpCas9(H840A)-RT. In this case, the off-target correction effect of FnCas9(H969A)-RT on the nucleotide sequence target of each gene (NRAS, FANCF, HBB, c-Myc, HEK3) was less, indicating excellent properties in target specificity.

이제까지 본 발명에 대하여 그 실시예들을 중심으로 살펴보았다. 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자는 본 발명이 본 발명의 본질적인 특성에서 벗어나지 않는 범위에서 변형된 형태로 구현될 수 있음을 이해할 수 있을 것이다. 그러므로 개시된 실시예들은 한정적인 관점이 아니라 설명적인 관점에서 고려되어야 한다. 본 발명의 범위는 전술한 설명이 아니라 청구범위에 나타나 있으며, 그와 동등한 범위 내에 있는 모든 차이점은 본 발명에 포함된 것으로 해석되어야 할 것이다.Up to now, the present invention has been looked at focusing on the embodiments thereof. Those of ordinary skill in the art to which the present invention pertains will understand that the present invention may be implemented in a modified form without departing from the essential characteristics of the present invention. Therefore, the disclosed embodiments are to be considered in an illustrative rather than a restrictive sense. The scope of the present invention is indicated in the claims rather than the foregoing description, and all differences within an equivalent scope should be construed as being included in the present invention.

<110> Korea Research Institute of Bioscience and Biotechnology <120> Genome replacement and insertion technology using reverse transcriptase based on Francisella novicida Cas9 module <130> P21219-KRIBB-PA <150> KR 10-2021-0008674 <151> 2021-01-21 <160> 52 <170> KoPatentIn 3.0 <210> 1 <211> 1628 <212> PRT <213> Artificial Sequence <220> <223> Francisella novicida cas 9 <400> 1 Met Asn Phe Lys Ile Leu Pro Ile Ala Ile Asp Leu Gly Val Lys Asn 1 5 10 15 Thr Gly Val Phe Ser Ala Phe Tyr Gln Lys Gly Thr Ser Leu Glu Arg 20 25 30 Leu Asp Asn Lys Asn Gly Lys Val Tyr Glu Leu Ser Lys Asp Ser Tyr 35 40 45 Thr Leu Leu Met Asn Asn Arg Thr Ala Arg Arg His Gln Arg Arg Gly 50 55 60 Ile Asp Arg Lys Gln Leu Val Lys Arg Leu Phe Lys Leu Ile Trp Thr 65 70 75 80 Glu Gln Leu Asn Leu Glu Trp Asp Lys Asp Thr Gln Gln Ala Ile Ser 85 90 95 Phe Leu Phe Asn Arg Arg Gly Phe Ser Phe Ile Thr Asp Gly Tyr Ser 100 105 110 Pro Glu Tyr Leu Asn Ile Val Pro Glu Gln Val Lys Ala Ile Leu Met 115 120 125 Asp Ile Phe Asp Asp Tyr Asn Gly Glu Asp Asp Leu Asp Ser Tyr Leu 130 135 140 Lys Leu Ala Thr Glu Gln Glu Ser Lys Ile Ser Glu Ile Tyr Asn Lys 145 150 155 160 Leu Met Gln Lys Ile Leu Glu Phe Lys Leu Met Lys Leu Cys Thr Asp 165 170 175 Ile Lys Asp Asp Lys Val Ser Thr Lys Thr Leu Lys Glu Ile Thr Ser 180 185 190 Tyr Glu Phe Glu Leu Leu Ala Asp Tyr Leu Ala Asn Tyr Ser Glu Ser 195 200 205 Leu Lys Thr Gln Lys Phe Ser Tyr Thr Asp Lys Gln Gly Asn Leu Lys 210 215 220 Glu Leu Ser Tyr Tyr His His Asp Lys Tyr Asn Ile Gln Glu Phe Leu 225 230 235 240 Lys Arg His Ala Thr Ile Asn Asp Arg Ile Leu Asp Thr Leu Leu Thr 245 250 255 Asp Asp Leu Asp Ile Trp Asn Phe Asn Phe Glu Lys Phe Asp Phe Asp 260 265 270 Lys Asn Glu Glu Lys Leu Gln Asn Gln Glu Asp Lys Asp His Ile Gln 275 280 285 Ala His Leu His His Phe Val Phe Ala Val Asn Lys Ile Lys Ser Glu 290 295 300 Met Ala Ser Gly Gly Arg His Arg Ser Gln Tyr Phe Gln Glu Ile Thr 305 310 315 320 Asn Val Leu Asp Glu Asn Asn His Gln Glu Gly Tyr Leu Lys Asn Phe 325 330 335 Cys Glu Asn Leu His Asn Lys Lys Tyr Ser Asn Leu Ser Val Lys Asn 340 345 350 Leu Val Asn Leu Ile Gly Asn Leu Ser Asn Leu Glu Leu Lys Pro Leu 355 360 365 Arg Lys Tyr Phe Asn Asp Lys Ile His Ala Lys Ala Asp His Trp Asp 370 375 380 Glu Gln Lys Phe Thr Glu Thr Tyr Cys His Trp Ile Leu Gly Glu Trp 385 390 395 400 Arg Val Gly Val Lys Asp Gln Asp Lys Lys Asp Gly Ala Lys Tyr Ser 405 410 415 Tyr Lys Asp Leu Cys Asn Glu Leu Lys Gln Lys Val Thr Lys Ala Gly 420 425 430 Leu Val Asp Phe Leu Leu Glu Leu Asp Pro Cys Arg Thr Ile Pro Pro 435 440 445 Tyr Leu Asp Asn Asn Asn Arg Lys Pro Pro Lys Cys Gln Ser Leu Ile 450 455 460 Leu Asn Pro Lys Phe Leu Asp Asn Gln Tyr Pro Asn Trp Gln Gln Tyr 465 470 475 480 Leu Gln Glu Leu Lys Lys Leu Gln Ser Ile Gln Asn Tyr Leu Asp Ser 485 490 495 Phe Glu Thr Asp Leu Lys Val Leu Lys Ser Ser Lys Asp Gln Pro Tyr 500 505 510 Phe Val Glu Tyr Lys Ser Ser Asn Gln Gln Ile Ala Ser Gly Gln Arg 515 520 525 Asp Tyr Lys Asp Leu Asp Ala Arg Ile Leu Gln Phe Ile Phe Asp Arg 530 535 540 Val Lys Ala Ser Asp Glu Leu Leu Leu Asn Glu Ile Tyr Phe Gln Ala 545 550 555 560 Lys Lys Leu Lys Gln Lys Ala Ser Ser Glu Leu Glu Lys Leu Glu Ser 565 570 575 Ser Lys Lys Leu Asp Glu Val Ile Ala Asn Ser Gln Leu Ser Gln Ile 580 585 590 Leu Lys Ser Gln His Thr Asn Gly Ile Phe Glu Gln Gly Thr Phe Leu 595 600 605 His Leu Val Cys Lys Tyr Tyr Lys Gln Arg Gln Arg Ala Arg Asp Ser 610 615 620 Arg Leu Tyr Ile Met Pro Glu Tyr Arg Tyr Asp Lys Lys Leu His Lys 625 630 635 640 Tyr Asn Asn Thr Gly Arg Phe Asp Asp Asp Asn Gln Leu Leu Thr Tyr 645 650 655 Cys Asn His Lys Pro Arg Gln Lys Arg Tyr Gln Leu Leu Asn Asp Leu 660 665 670 Ala Gly Val Leu Gln Val Ser Pro Asn Phe Leu Lys Asp Lys Ile Gly 675 680 685 Ser Asp Asp Asp Leu Phe Ile Ser Lys Trp Leu Val Glu His Ile Arg 690 695 700 Gly Phe Lys Lys Ala Cys Glu Asp Ser Leu Lys Ile Gln Lys Asp Asn 705 710 715 720 Arg Gly Leu Leu Asn His Lys Ile Asn Ile Ala Arg Asn Thr Lys Gly 725 730 735 Lys Cys Glu Lys Glu Ile Phe Asn Leu Ile Cys Lys Ile Glu Gly Ser 740 745 750 Glu Asp Lys Lys Gly Asn Tyr Lys His Gly Leu Ala Tyr Glu Leu Gly 755 760 765 Val Leu Leu Phe Gly Glu Pro Asn Glu Ala Ser Lys Pro Glu Phe Asp 770 775 780 Arg Lys Ile Lys Lys Phe Asn Ser Ile Tyr Ser Phe Ala Gln Ile Gln 785 790 795 800 Gln Ile Ala Phe Ala Glu Arg Lys Gly Asn Ala Asn Thr Cys Ala Val 805 810 815 Cys Ser Ala Asp Asn Ala His Arg Met Gln Gln Ile Lys Ile Thr Glu 820 825 830 Pro Val Glu Asp Asn Lys Asp Lys Ile Ile Leu Ser Ala Lys Ala Gln 835 840 845 Arg Leu Pro Ala Ile Pro Thr Arg Ile Val Asp Gly Ala Val Lys Lys 850 855 860 Met Ala Thr Ile Leu Ala Lys Asn Ile Val Asp Asp Asn Trp Gln Asn 865 870 875 880 Ile Lys Gln Val Leu Ser Ala Lys His Gln Leu His Ile Pro Ile Ile 885 890 895 Thr Glu Ser Asn Ala Phe Glu Phe Glu Pro Ala Leu Ala Asp Val Lys 900 905 910 Gly Lys Ser Leu Lys Asp Arg Arg Lys Lys Ala Leu Glu Arg Ile Ser 915 920 925 Pro Glu Asn Ile Phe Lys Asp Lys Asn Asn Arg Ile Lys Glu Phe Ala 930 935 940 Lys Gly Ile Ser Ala Tyr Ser Gly Ala Asn Leu Thr Asp Gly Asp Phe 945 950 955 960 Asp Gly Ala Lys Glu Glu Leu Asp His Ile Ile Pro Arg Ser His Lys 965 970 975 Lys Tyr Gly Thr Leu Asn Asp Glu Ala Asn Leu Ile Cys Val Thr Arg 980 985 990 Gly Asp Asn Lys Asn Lys Gly Asn Arg Ile Phe Cys Leu Arg Asp Leu 995 1000 1005 Ala Asp Asn Tyr Lys Leu Lys Gln Phe Glu Thr Thr Asp Asp Leu Glu 1010 1015 1020 Ile Glu Lys Lys Ile Ala Asp Thr Ile Trp Asp Ala Asn Lys Lys Asp 1025 1030 1035 1040 Phe Lys Phe Gly Asn Tyr Arg Ser Phe Ile Asn Leu Thr Pro Gln Glu 1045 1050 1055 Gln Lys Ala Phe Arg His Ala Leu Phe Leu Ala Asp Glu Asn Pro Ile 1060 1065 1070 Lys Gln Ala Val Ile Arg Ala Ile Asn Asn Arg Asn Arg Thr Phe Val 1075 1080 1085 Asn Gly Thr Gln Arg Tyr Phe Ala Glu Val Leu Ala Asn Asn Ile Tyr 1090 1095 1100 Leu Arg Ala Lys Lys Glu Asn Leu Asn Thr Asp Lys Ile Ser Phe Asp 1105 1110 1115 1120 Tyr Phe Gly Ile Pro Thr Ile Gly Asn Gly Arg Gly Ile Ala Glu Ile 1125 1130 1135 Arg Gln Leu Tyr Glu Lys Val Asp Ser Asp Ile Gln Ala Tyr Ala Lys 1140 1145 1150 Gly Asp Lys Pro Gln Ala Ser Tyr Ser His Leu Ile Asp Ala Met Leu 1155 1160 1165 Ala Phe Cys Ile Ala Ala Asp Glu His Arg Asn Asp Gly Ser Ile Gly 1170 1175 1180 Leu Glu Ile Asp Lys Asn Tyr Ser Leu Tyr Pro Leu Asp Lys Asn Thr 1185 1190 1195 1200 Gly Glu Val Phe Thr Lys Asp Ile Phe Ser Gln Ile Lys Ile Thr Asp 1205 1210 1215 Asn Glu Phe Ser Asp Lys Lys Leu Val Arg Lys Lys Ala Ile Glu Gly 1220 1225 1230 Phe Asn Thr His Arg Gln Met Thr Arg Asp Gly Ile Tyr Ala Glu Asn 1235 1240 1245 Tyr Leu Pro Ile Leu Ile His Lys Glu Leu Asn Glu Val Arg Lys Gly 1250 1255 1260 Tyr Thr Trp Lys Asn Ser Glu Glu Ile Lys Ile Phe Lys Gly Lys Lys 1265 1270 1275 1280 Tyr Asp Ile Gln Gln Leu Asn Asn Leu Val Tyr Cys Leu Lys Phe Val 1285 1290 1295 Asp Lys Pro Ile Ser Ile Asp Ile Gln Ile Ser Thr Leu Glu Glu Leu 1300 1305 1310 Arg Asn Ile Leu Thr Thr Asn Asn Ile Ala Ala Thr Ala Glu Tyr Tyr 1315 1320 1325 Tyr Ile Asn Leu Lys Thr Gln Lys Leu His Glu Tyr Tyr Ile Glu Asn 1330 1335 1340 Tyr Asn Thr Ala Leu Gly Tyr Lys Lys Tyr Ser Lys Glu Met Glu Phe 1345 1350 1355 1360 Leu Arg Ser Leu Ala Tyr Arg Ser Glu Arg Val Lys Ile Lys Ser Ile 1365 1370 1375 Asp Asp Val Lys Gln Val Leu Asp Lys Asp Ser Asn Phe Ile Ile Gly 1380 1385 1390 Lys Ile Thr Leu Pro Phe Lys Lys Glu Trp Gln Arg Leu Tyr Arg Glu 1395 1400 1405 Trp Gln Asn Thr Thr Ile Lys Asp Asp Tyr Glu Phe Leu Lys Ser Phe 1410 1415 1420 Phe Asn Val Lys Ser Ile Thr Lys Leu His Lys Lys Val Arg Lys Asp 1425 1430 1435 1440 Phe Ser Leu Pro Ile Ser Thr Asn Glu Gly Lys Phe Leu Val Lys Arg 1445 1450 1455 Lys Thr Trp Asp Asn Asn Phe Ile Tyr Gln Ile Leu Asn Asp Ser Asp 1460 1465 1470 Ser Arg Ala Asp Gly Thr Lys Pro Phe Ile Pro Ala Phe Asp Ile Ser 1475 1480 1485 Lys Asn Glu Ile Val Glu Ala Ile Ile Asp Ser Phe Thr Ser Lys Asn 1490 1495 1500 Ile Phe Trp Leu Pro Lys Asn Ile Glu Leu Gln Lys Val Asp Asn Lys 1505 1510 1515 1520 Asn Ile Phe Ala Ile Asp Thr Ser Lys Trp Phe Glu Val Glu Thr Pro 1525 1530 1535 Ser Asp Leu Arg Asp Ile Gly Ile Ala Thr Ile Gln Tyr Lys Ile Asp 1540 1545 1550 Asn Asn Ser Arg Pro Lys Val Arg Val Lys Leu Asp Tyr Val Ile Asp 1555 1560 1565 Asp Asp Ser Lys Ile Asn Tyr Phe Met Asn His Ser Leu Leu Lys Ser 1570 1575 1580 Arg Tyr Pro Asp Lys Val Leu Glu Ile Leu Lys Gln Ser Thr Ile Ile 1585 1590 1595 1600 Glu Phe Glu Ser Ser Gly Phe Asn Lys Thr Ile Lys Glu Met Leu Gly 1605 1610 1615 Met Lys Leu Ala Gly Ile Tyr Asn Glu Thr Ser Asn 1620 1625 <210> 2 <211> 1628 <212> PRT <213> Artificial Sequence <220> <223> Francisella novicida Cas9(H969A) <400> 2 Met Asn Phe Lys Ile Leu Pro Ile Ala Ile Asp Leu Gly Val Lys Asn 1 5 10 15 Thr Gly Val Phe Ser Ala Phe Tyr Gln Lys Gly Thr Ser Leu Glu Arg 20 25 30 Leu Asp Asn Lys Asn Gly Lys Val Tyr Glu Leu Ser Lys Asp Ser Tyr 35 40 45 Thr Leu Leu Met Asn Asn Arg Thr Ala Arg Arg His Gln Arg Arg Gly 50 55 60 Ile Asp Arg Lys Gln Leu Val Lys Arg Leu Phe Lys Leu Ile Trp Thr 65 70 75 80 Glu Gln Leu Asn Leu Glu Trp Asp Lys Asp Thr Gln Gln Ala Ile Ser 85 90 95 Phe Leu Phe Asn Arg Arg Gly Phe Ser Phe Ile Thr Asp Gly Tyr Ser 100 105 110 Pro Glu Tyr Leu Asn Ile Val Pro Glu Gln Val Lys Ala Ile Leu Met 115 120 125 Asp Ile Phe Asp Asp Tyr Asn Gly Glu Asp Asp Leu Asp Ser Tyr Leu 130 135 140 Lys Leu Ala Thr Glu Gln Glu Ser Lys Ile Ser Glu Ile Tyr Asn Lys 145 150 155 160 Leu Met Gln Lys Ile Leu Glu Phe Lys Leu Met Lys Leu Cys Thr Asp 165 170 175 Ile Lys Asp Asp Lys Val Ser Thr Lys Thr Leu Lys Glu Ile Thr Ser 180 185 190 Tyr Glu Phe Glu Leu Leu Ala Asp Tyr Leu Ala Asn Tyr Ser Glu Ser 195 200 205 Leu Lys Thr Gln Lys Phe Ser Tyr Thr Asp Lys Gln Gly Asn Leu Lys 210 215 220 Glu Leu Ser Tyr Tyr His His Asp Lys Tyr Asn Ile Gln Glu Phe Leu 225 230 235 240 Lys Arg His Ala Thr Ile Asn Asp Arg Ile Leu Asp Thr Leu Leu Thr 245 250 255 Asp Asp Leu Asp Ile Trp Asn Phe Asn Phe Glu Lys Phe Asp Phe Asp 260 265 270 Lys Asn Glu Glu Lys Leu Gln Asn Gln Glu Asp Lys Asp His Ile Gln 275 280 285 Ala His Leu His His Phe Val Phe Ala Val Asn Lys Ile Lys Ser Glu 290 295 300 Met Ala Ser Gly Gly Arg His Arg Ser Gln Tyr Phe Gln Glu Ile Thr 305 310 315 320 Asn Val Leu Asp Glu Asn Asn His Gln Glu Gly Tyr Leu Lys Asn Phe 325 330 335 Cys Glu Asn Leu His Asn Lys Lys Tyr Ser Asn Leu Ser Val Lys Asn 340 345 350 Leu Val Asn Leu Ile Gly Asn Leu Ser Asn Leu Glu Leu Lys Pro Leu 355 360 365 Arg Lys Tyr Phe Asn Asp Lys Ile His Ala Lys Ala Asp His Trp Asp 370 375 380 Glu Gln Lys Phe Thr Glu Thr Tyr Cys His Trp Ile Leu Gly Glu Trp 385 390 395 400 Arg Val Gly Val Lys Asp Gln Asp Lys Lys Asp Gly Ala Lys Tyr Ser 405 410 415 Tyr Lys Asp Leu Cys Asn Glu Leu Lys Gln Lys Val Thr Lys Ala Gly 420 425 430 Leu Val Asp Phe Leu Leu Glu Leu Asp Pro Cys Arg Thr Ile Pro Pro 435 440 445 Tyr Leu Asp Asn Asn Asn Arg Lys Pro Pro Lys Cys Gln Ser Leu Ile 450 455 460 Leu Asn Pro Lys Phe Leu Asp Asn Gln Tyr Pro Asn Trp Gln Gln Tyr 465 470 475 480 Leu Gln Glu Leu Lys Lys Leu Gln Ser Ile Gln Asn Tyr Leu Asp Ser 485 490 495 Phe Glu Thr Asp Leu Lys Val Leu Lys Ser Ser Lys Asp Gln Pro Tyr 500 505 510 Phe Val Glu Tyr Lys Ser Ser Asn Gln Gln Ile Ala Ser Gly Gln Arg 515 520 525 Asp Tyr Lys Asp Leu Asp Ala Arg Ile Leu Gln Phe Ile Phe Asp Arg 530 535 540 Val Lys Ala Ser Asp Glu Leu Leu Leu Asn Glu Ile Tyr Phe Gln Ala 545 550 555 560 Lys Lys Leu Lys Gln Lys Ala Ser Ser Glu Leu Glu Lys Leu Glu Ser 565 570 575 Ser Lys Lys Leu Asp Glu Val Ile Ala Asn Ser Gln Leu Ser Gln Ile 580 585 590 Leu Lys Ser Gln His Thr Asn Gly Ile Phe Glu Gln Gly Thr Phe Leu 595 600 605 His Leu Val Cys Lys Tyr Tyr Lys Gln Arg Gln Arg Ala Arg Asp Ser 610 615 620 Arg Leu Tyr Ile Met Pro Glu Tyr Arg Tyr Asp Lys Lys Leu His Lys 625 630 635 640 Tyr Asn Asn Thr Gly Arg Phe Asp Asp Asp Asn Gln Leu Leu Thr Tyr 645 650 655 Cys Asn His Lys Pro Arg Gln Lys Arg Tyr Gln Leu Leu Asn Asp Leu 660 665 670 Ala Gly Val Leu Gln Val Ser Pro Asn Phe Leu Lys Asp Lys Ile Gly 675 680 685 Ser Asp Asp Asp Leu Phe Ile Ser Lys Trp Leu Val Glu His Ile Arg 690 695 700 Gly Phe Lys Lys Ala Cys Glu Asp Ser Leu Lys Ile Gln Lys Asp Asn 705 710 715 720 Arg Gly Leu Leu Asn His Lys Ile Asn Ile Ala Arg Asn Thr Lys Gly 725 730 735 Lys Cys Glu Lys Glu Ile Phe Asn Leu Ile Cys Lys Ile Glu Gly Ser 740 745 750 Glu Asp Lys Lys Gly Asn Tyr Lys His Gly Leu Ala Tyr Glu Leu Gly 755 760 765 Val Leu Leu Phe Gly Glu Pro Asn Glu Ala Ser Lys Pro Glu Phe Asp 770 775 780 Arg Lys Ile Lys Lys Phe Asn Ser Ile Tyr Ser Phe Ala Gln Ile Gln 785 790 795 800 Gln Ile Ala Phe Ala Glu Arg Lys Gly Asn Ala Asn Thr Cys Ala Val 805 810 815 Cys Ser Ala Asp Asn Ala His Arg Met Gln Gln Ile Lys Ile Thr Glu 820 825 830 Pro Val Glu Asp Asn Lys Asp Lys Ile Ile Leu Ser Ala Lys Ala Gln 835 840 845 Arg Leu Pro Ala Ile Pro Thr Arg Ile Val Asp Gly Ala Val Lys Lys 850 855 860 Met Ala Thr Ile Leu Ala Lys Asn Ile Val Asp Asp Asn Trp Gln Asn 865 870 875 880 Ile Lys Gln Val Leu Ser Ala Lys His Gln Leu His Ile Pro Ile Ile 885 890 895 Thr Glu Ser Asn Ala Phe Glu Phe Glu Pro Ala Leu Ala Asp Val Lys 900 905 910 Gly Lys Ser Leu Lys Asp Arg Arg Lys Lys Ala Leu Glu Arg Ile Ser 915 920 925 Pro Glu Asn Ile Phe Lys Asp Lys Asn Asn Arg Ile Lys Glu Phe Ala 930 935 940 Lys Gly Ile Ser Ala Tyr Ser Gly Ala Asn Leu Thr Asp Gly Asp Phe 945 950 955 960 Asp Gly Ala Lys Glu Glu Leu Asp Ala Ile Ile Pro Arg Ser His Lys 965 970 975 Lys Tyr Gly Thr Leu Asn Asp Glu Ala Asn Leu Ile Cys Val Thr Arg 980 985 990 Gly Asp Asn Lys Asn Lys Gly Asn Arg Ile Phe Cys Leu Arg Asp Leu 995 1000 1005 Ala Asp Asn Tyr Lys Leu Lys Gln Phe Glu Thr Thr Asp Asp Leu Glu 1010 1015 1020 Ile Glu Lys Lys Ile Ala Asp Thr Ile Trp Asp Ala Asn Lys Lys Asp 1025 1030 1035 1040 Phe Lys Phe Gly Asn Tyr Arg Ser Phe Ile Asn Leu Thr Pro Gln Glu 1045 1050 1055 Gln Lys Ala Phe Arg His Ala Leu Phe Leu Ala Asp Glu Asn Pro Ile 1060 1065 1070 Lys Gln Ala Val Ile Arg Ala Ile Asn Asn Arg Asn Arg Thr Phe Val 1075 1080 1085 Asn Gly Thr Gln Arg Tyr Phe Ala Glu Val Leu Ala Asn Asn Ile Tyr 1090 1095 1100 Leu Arg Ala Lys Lys Glu Asn Leu Asn Thr Asp Lys Ile Ser Phe Asp 1105 1110 1115 1120 Tyr Phe Gly Ile Pro Thr Ile Gly Asn Gly Arg Gly Ile Ala Glu Ile 1125 1130 1135 Arg Gln Leu Tyr Glu Lys Val Asp Ser Asp Ile Gln Ala Tyr Ala Lys 1140 1145 1150 Gly Asp Lys Pro Gln Ala Ser Tyr Ser His Leu Ile Asp Ala Met Leu 1155 1160 1165 Ala Phe Cys Ile Ala Ala Asp Glu His Arg Asn Asp Gly Ser Ile Gly 1170 1175 1180 Leu Glu Ile Asp Lys Asn Tyr Ser Leu Tyr Pro Leu Asp Lys Asn Thr 1185 1190 1195 1200 Gly Glu Val Phe Thr Lys Asp Ile Phe Ser Gln Ile Lys Ile Thr Asp 1205 1210 1215 Asn Glu Phe Ser Asp Lys Lys Leu Val Arg Lys Lys Ala Ile Glu Gly 1220 1225 1230 Phe Asn Thr His Arg Gln Met Thr Arg Asp Gly Ile Tyr Ala Glu Asn 1235 1240 1245 Tyr Leu Pro Ile Leu Ile His Lys Glu Leu Asn Glu Val Arg Lys Gly 1250 1255 1260 Tyr Thr Trp Lys Asn Ser Glu Glu Ile Lys Ile Phe Lys Gly Lys Lys 1265 1270 1275 1280 Tyr Asp Ile Gln Gln Leu Asn Asn Leu Val Tyr Cys Leu Lys Phe Val 1285 1290 1295 Asp Lys Pro Ile Ser Ile Asp Ile Gln Ile Ser Thr Leu Glu Glu Leu 1300 1305 1310 Arg Asn Ile Leu Thr Thr Asn Asn Ile Ala Ala Thr Ala Glu Tyr Tyr 1315 1320 1325 Tyr Ile Asn Leu Lys Thr Gln Lys Leu His Glu Tyr Tyr Ile Glu Asn 1330 1335 1340 Tyr Asn Thr Ala Leu Gly Tyr Lys Lys Tyr Ser Lys Glu Met Glu Phe 1345 1350 1355 1360 Leu Arg Ser Leu Ala Tyr Arg Ser Glu Arg Val Lys Ile Lys Ser Ile 1365 1370 1375 Asp Asp Val Lys Gln Val Leu Asp Lys Asp Ser Asn Phe Ile Ile Gly 1380 1385 1390 Lys Ile Thr Leu Pro Phe Lys Lys Glu Trp Gln Arg Leu Tyr Arg Glu 1395 1400 1405 Trp Gln Asn Thr Thr Ile Lys Asp Asp Tyr Glu Phe Leu Lys Ser Phe 1410 1415 1420 Phe Asn Val Lys Ser Ile Thr Lys Leu His Lys Lys Val Arg Lys Asp 1425 1430 1435 1440 Phe Ser Leu Pro Ile Ser Thr Asn Glu Gly Lys Phe Leu Val Lys Arg 1445 1450 1455 Lys Thr Trp Asp Asn Asn Phe Ile Tyr Gln Ile Leu Asn Asp Ser Asp 1460 1465 1470 Ser Arg Ala Asp Gly Thr Lys Pro Phe Ile Pro Ala Phe Asp Ile Ser 1475 1480 1485 Lys Asn Glu Ile Val Glu Ala Ile Ile Asp Ser Phe Thr Ser Lys Asn 1490 1495 1500 Ile Phe Trp Leu Pro Lys Asn Ile Glu Leu Gln Lys Val Asp Asn Lys 1505 1510 1515 1520 Asn Ile Phe Ala Ile Asp Thr Ser Lys Trp Phe Glu Val Glu Thr Pro 1525 1530 1535 Ser Asp Leu Arg Asp Ile Gly Ile Ala Thr Ile Gln Tyr Lys Ile Asp 1540 1545 1550 Asn Asn Ser Arg Pro Lys Val Arg Val Lys Leu Asp Tyr Val Ile Asp 1555 1560 1565 Asp Asp Ser Lys Ile Asn Tyr Phe Met Asn His Ser Leu Leu Lys Ser 1570 1575 1580 Arg Tyr Pro Asp Lys Val Leu Glu Ile Leu Lys Gln Ser Thr Ile Ile 1585 1590 1595 1600 Glu Phe Glu Ser Ser Gly Phe Asn Lys Thr Ile Lys Glu Met Leu Gly 1605 1610 1615 Met Lys Leu Ala Gly Ile Tyr Asn Glu Thr Ser Asn 1620 1625 <210> 3 <211> 677 <212> PRT <213> Artificial Sequence <220> <223> moloney murine leukemia virus RT <400> 3 Thr Leu Asn Ile Glu Asp Glu Tyr Arg Leu His Glu Thr Ser Lys Glu 1 5 10 15 Pro Asp Val Ser Leu Gly Ser Thr Trp Leu Ser Asp Phe Pro Gln Ala 20 25 30 Trp Ala Glu Thr Gly Gly Met Gly Leu Ala Val Arg Gln Ala Pro Leu 35 40 45 Ile Ile Pro Leu Lys Ala Thr Ser Thr Pro Val Ser Ile Lys Gln Tyr 50 55 60 Pro Met Ser Gln Glu Ala Arg Leu Gly Ile Lys Pro His Ile Gln Arg 65 70 75 80 Leu Leu Asp Gln Gly Ile Leu Val Pro Cys Gln Ser Pro Trp Asn Thr 85 90 95 Pro Leu Leu Pro Val Lys Lys Pro Gly Thr Asn Asp Tyr Arg Pro Val 100 105 110 Gln Asp Leu Arg Glu Val Asn Lys Arg Val Glu Asp Ile His Pro Thr 115 120 125 Val Pro Asn Pro Tyr Asn Leu Leu Ser Gly Leu Pro Pro Ser His Gln 130 135 140 Trp Tyr Thr Val Leu Asp Leu Lys Asp Ala Phe Phe Cys Leu Arg Leu 145 150 155 160 His Pro Thr Ser Gln Pro Leu Phe Ala Phe Glu Trp Arg Asp Pro Glu 165 170 175 Met Gly Ile Ser Gly Gln Leu Thr Trp Thr Arg Leu Pro Gln Gly Phe 180 185 190 Lys Asn Ser Pro Thr Leu Phe Asp Glu Ala Leu His Arg Asp Leu Ala 195 200 205 Asp Phe Arg Ile Gln His Pro Asp Leu Ile Leu Leu Gln Tyr Val Asp 210 215 220 Asp Leu Leu Leu Ala Ala Thr Ser Glu Leu Asp Cys Gln Gln Gly Thr 225 230 235 240 Arg Ala Leu Leu Gln Thr Leu Gly Asn Leu Gly Tyr Arg Ala Ser Ala 245 250 255 Lys Lys Ala Gln Ile Cys Gln Lys Gln Val Lys Tyr Leu Gly Tyr Leu 260 265 270 Leu Lys Glu Gly Gln Arg Trp Leu Thr Glu Ala Arg Lys Glu Thr Val 275 280 285 Met Gly Gln Pro Thr Pro Lys Thr Pro Arg Gln Leu Arg Glu Phe Leu 290 295 300 Gly Thr Ala Gly Phe Cys Arg Leu Trp Ile Pro Gly Phe Ala Glu Met 305 310 315 320 Ala Ala Pro Leu Tyr Pro Leu Thr Lys Thr Gly Thr Leu Phe Asn Trp 325 330 335 Gly Pro Asp Gln Gln Lys Ala Tyr Gln Glu Ile Lys Gln Ala Leu Leu 340 345 350 Thr Ala Pro Ala Leu Gly Leu Pro Asp Leu Thr Lys Pro Phe Glu Leu 355 360 365 Phe Val Asp Glu Lys Gln Gly Tyr Ala Lys Gly Val Leu Thr Gln Lys 370 375 380 Leu Gly Pro Trp Arg Arg Pro Val Ala Tyr Leu Ser Lys Lys Leu Asp 385 390 395 400 Pro Val Ala Ala Gly Trp Pro Pro Cys Leu Arg Met Val Ala Ala Ile 405 410 415 Ala Val Leu Thr Lys Asp Ala Gly Lys Leu Thr Met Gly Gln Pro Leu 420 425 430 Val Ile Leu Ala Pro His Ala Val Glu Ala Leu Val Lys Gln Pro Pro 435 440 445 Asp Arg Trp Leu Ser Asn Ala Arg Met Thr His Tyr Gln Ala Leu Leu 450 455 460 Leu Asp Thr Asp Arg Val Gln Phe Gly Pro Val Val Ala Leu Asn Pro 465 470 475 480 Ala Thr Leu Leu Pro Leu Pro Glu Glu Gly Leu Gln His Asn Cys Leu 485 490 495 Asp Ile Leu Ala Glu Ala His Gly Thr Arg Pro Asp Leu Thr Asp Gln 500 505 510 Pro Leu Pro Asp Ala Asp His Thr Trp Tyr Thr Asp Gly Ser Ser Leu 515 520 525 Leu Gln Glu Gly Gln Arg Lys Ala Gly Ala Ala Val Thr Thr Glu Thr 530 535 540 Glu Val Ile Trp Ala Lys Ala Leu Pro Ala Gly Thr Ser Ala Gln Arg 545 550 555 560 Ala Glu Leu Ile Ala Leu Thr Gln Ala Leu Lys Met Ala Glu Gly Lys 565 570 575 Lys Leu Asn Val Tyr Thr Asp Ser Arg Tyr Ala Phe Ala Thr Ala His 580 585 590 Ile His Gly Glu Ile Tyr Arg Arg Arg Gly Leu Leu Thr Ser Glu Gly 595 600 605 Lys Glu Ile Lys Asn Lys Asp Glu Ile Leu Ala Leu Leu Lys Ala Leu 610 615 620 Phe Leu Pro Lys Arg Leu Ser Ile Ile His Cys Pro Gly His Gln Lys 625 630 635 640 Gly His Ser Ala Glu Ala Arg Gly Asn Arg Met Ala Asp Gln Ala Ala 645 650 655 Arg Lys Ala Ala Ile Thr Glu Thr Pro Asp Thr Ser Thr Leu Leu Ile 660 665 670 Glu Asn Ser Ser Pro 675 <210> 4 <211> 560 <212> PRT <213> Artificial Sequence <220> <223> moloney murine leukemia virus RT <220> <221> MISC_FEATURE <222> (229) <223> Xaa can be any naturally occurring amino acid <400> 4 Ala Phe Pro Leu Glu Arg Pro Asp Trp Asp Tyr Thr Thr Gln Ala Gly 1 5 10 15 Arg Asn His Leu Val His Tyr Arg Gln Leu Leu Leu Ala Gly Leu Gln 20 25 30 Asn Ala Gly Arg Ser Pro Thr Asn Leu Ala Lys Val Lys Gly Ile Thr 35 40 45 Gln Gly Pro Asn Glu Ser Pro Ser Ala Phe Leu Glu Arg Leu Lys Glu 50 55 60 Ala Tyr Arg Arg Tyr Thr Pro Tyr Asp Pro Glu Asp Pro Gly Gln Glu 65 70 75 80 Thr Asn Val Ser Met Ser Phe Ile Trp Gln Ser Ala Pro Asp Ile Gly 85 90 95 Arg Lys Leu Gly Arg Leu Glu Asp Leu Lys Ser Lys Thr Leu Gly Asp 100 105 110 Leu Val Arg Glu Ala Glu Lys Ile Phe Asn Lys Arg Glu Thr Pro Glu 115 120 125 Glu Arg Glu Glu Arg Ile Arg Arg Glu Thr Glu Glu Lys Glu Glu Arg 130 135 140 Arg Arg Thr Val Asp Glu Gln Lys Glu Lys Glu Arg Asp Arg Arg Arg 145 150 155 160 His Arg Glu Met Ser Lys Leu Leu Ala Thr Val Val Ile Gly Gln Glu 165 170 175 Gln Asp Arg Gln Glu Gly Glu Arg Lys Arg Pro Gln Leu Asp Lys Asp 180 185 190 Gln Cys Ala Tyr Cys Lys Glu Lys Gly His Trp Ala Lys Asp Cys Pro 195 200 205 Lys Lys Pro Arg Gly Pro Arg Gly Pro Arg Pro Gln Thr Ser Leu Leu 210 215 220 Thr Leu Gly Asp Xaa Gly Gly Gln Gly Gln Asp Pro Pro Pro Glu Pro 225 230 235 240 Arg Ile Thr Leu Lys Val Gly Gly Gln Pro Val Thr Phe Leu Val Asp 245 250 255 Thr Gly Ala Gln His Ser Val Leu Thr Gln Asn Pro Gly Pro Leu Ser 260 265 270 Asp Lys Ser Ala Trp Val Gln Gly Ala Thr Gly Gly Lys Arg Tyr Arg 275 280 285 Trp Thr Thr Asp Arg Lys Val His Leu Ala Thr Gly Lys Val Thr His 290 295 300 Ser Phe Leu His Val Pro Asp Cys Pro Tyr Pro Leu Leu Gly Arg Asp 305 310 315 320 Leu Leu Thr Lys Leu Lys Ala Gln Ile His Phe Glu Gly Ser Gly Ala 325 330 335 Gln Val Val Gly Pro Met Gly Gln Pro Leu Gln Val Leu Thr Leu Asn 340 345 350 Ile Glu Asp Glu Tyr Arg Leu His Glu Thr Ser Lys Glu Pro Asp Val 355 360 365 Ser Leu Gly Phe Thr Trp Leu Ser Asp Phe Pro Gln Ala Trp Ala Glu 370 375 380 Ser Gly Gly Met Gly Leu Ala Val Arg Gln Ala Pro Leu Ile Ile Pro 385 390 395 400 Leu Lys Ala Thr Ser Thr Pro Val Ser Ile Lys Gln Tyr Pro Met Ser 405 410 415 Gln Glu Ala Arg Leu Gly Ile Lys Pro His Ile Gln Arg Leu Leu Asp 420 425 430 Gln Gly Ile Leu Val Pro Cys Gln Ser Pro Trp Asn Thr Pro Leu Leu 435 440 445 Pro Val Lys Lys Pro Gly Thr Asn Asp Tyr Arg Pro Val Gln Asp Leu 450 455 460 Arg Glu Val Asn Lys Arg Val Glu Asp Ile His Pro Thr Val Pro Asn 465 470 475 480 Pro Tyr Asn Leu Leu Ser Gly Leu Pro Pro Ser His Gln Trp Tyr Thr 485 490 495 Val Leu Asp Leu Lys Asp Ala Phe Phe Cys Leu Arg Leu His Pro Thr 500 505 510 Ser Gln Pro Leu Phe Ala Phe Glu Trp Arg Asp Pro Glu Met Gly Ile 515 520 525 Ser Gly Gln Leu Thr Trp Thr Arg Leu Pro Gln Gly Phe Lys Asn Ser 530 535 540 Pro Thr Leu Phe Asp Glu Ala Leu His Arg Asp Leu Ala Asp Phe Arg 545 550 555 560 <210> 5 <211> 669 <212> PRT <213> Artificial Sequence <220> <223> Feline leukemia virus RT <400> 5 Thr Leu Gln Leu Glu Glu Glu Tyr Arg Leu Phe Glu Pro Glu Ser Thr 1 5 10 15 Gln Lys Gln Glu Met Asp Ile Trp Leu Lys Asn Phe Pro Gln Ala Trp 20 25 30 Ala Glu Thr Gly Gly Met Gly Thr Ala His Cys Gln Ala Pro Val Leu 35 40 45 Ile Gln Leu Lys Ala Thr Ala Thr Pro Ile Ser Ile Arg Gln Tyr Pro 50 55 60 Met Pro His Glu Ala Tyr Gln Gly Ile Lys Pro His Ile Arg Arg Met 65 70 75 80 Leu Asp Gln Gly Ile Leu Lys Pro Cys Gln Ser Pro Trp Asn Thr Pro 85 90 95 Leu Leu Pro Val Lys Lys Pro Gly Thr Glu Asp Tyr Arg Pro Val Gln 100 105 110 Asp Leu Arg Glu Val Asn Lys Arg Val Glu Asp Ile His Pro Thr Val 115 120 125 Pro Asn Pro Tyr Asn Leu Leu Ser Thr Leu Pro Pro Ser His Pro Trp 130 135 140 Tyr Thr Val Leu Asp Leu Lys Asp Ala Phe Phe Cys Leu Arg Leu His 145 150 155 160 Ser Glu Ser Gln Leu Leu Phe Ala Phe Glu Trp Arg Asp Pro Glu Ile 165 170 175 Gly Leu Ser Gly Gln Leu Thr Trp Thr Arg Leu Pro Gln Gly Phe Lys 180 185 190 Asn Ser Pro Thr Leu Phe Asp Glu Ala Leu His Ser Asp Leu Ala Asp 195 200 205 Phe Arg Val Arg Tyr Pro Ala Leu Val Leu Leu Gln Tyr Val Asp Asp 210 215 220 Leu Leu Leu Ala Ala Ala Thr Arg Thr Glu Cys Leu Glu Gly Thr Lys 225 230 235 240 Ala Leu Leu Glu Thr Leu Gly Asn Lys Gly Tyr Arg Ala Ser Ala Lys 245 250 255 Lys Ala Gln Ile Cys Leu Gln Glu Val Thr Tyr Leu Gly Tyr Ser Leu 260 265 270 Lys Asp Gly Gln Arg Trp Leu Thr Lys Ala Arg Lys Glu Ala Ile Leu 275 280 285 Ser Ile Pro Val Pro Lys Asn Ser Arg Gln Val Arg Glu Phe Leu Gly 290 295 300 Thr Ala Gly Tyr Cys Arg Leu Trp Ile Pro Gly Phe Ala Glu Leu Ala 305 310 315 320 Ala Pro Leu Tyr Pro Leu Thr Arg Pro Gly Thr Leu Phe Gln Trp Gly 325 330 335 Thr Glu Gln Gln Leu Ala Phe Glu Asp Ile Lys Lys Ala Leu Leu Ser 340 345 350 Ser Pro Ala Leu Gly Leu Pro Asp Ile Thr Lys Pro Phe Glu Leu Phe 355 360 365 Ile Asp Glu Asn Ser Gly Phe Ala Lys Gly Val Leu Val Gln Lys Leu 370 375 380 Gly Pro Trp Lys Arg Pro Val Ala Tyr Leu Ser Lys Lys Leu Asp Thr 385 390 395 400 Val Ala Ser Gly Trp Pro Pro Cys Leu Arg Met Val Ala Ala Ile Ala 405 410 415 Ile Leu Val Lys Asp Ala Gly Lys Leu Thr Leu Gly Gln Pro Leu Thr 420 425 430 Ile Leu Thr Ser His Pro Val Glu Ala Leu Val Arg Gln Pro Pro Asn 435 440 445 Lys Trp Leu Ser Asn Ala Arg Met Thr His Tyr Gln Ala Met Leu Leu 450 455 460 Asp Ala Glu Arg Val His Phe Gly Pro Thr Val Ser Leu Asn Pro Ala 465 470 475 480 Thr Leu Leu Pro Leu Pro Ser Gly Gly Asn His His Asp Cys Leu Gln 485 490 495 Ile Leu Ala Glu Thr His Gly Thr Arg Pro Asp Leu Thr Asp Gln Pro 500 505 510 Leu Pro Asp Ala Asp Leu Thr Trp Tyr Thr Asp Gly Ser Ser Phe Ile 515 520 525 Arg Asn Gly Glu Arg Glu Ala Gly Ala Ala Val Thr Thr Glu Ser Glu 530 535 540 Val Ile Trp Ala Ala Pro Leu Pro Pro Gly Thr Ser Ala Gln Arg Ala 545 550 555 560 Glu Leu Ile Ala Leu Thr Gln Ala Leu Lys Met Ala Glu Gly Lys Lys 565 570 575 Leu Thr Val Tyr Thr Asp Ser Arg Tyr Ala Phe Ala Thr Thr His Val 580 585 590 His Gly Glu Ile Tyr Arg Arg Arg Gly Leu Leu Thr Ser Glu Gly Lys 595 600 605 Glu Ile Lys Asn Lys Asn Glu Ile Leu Ala Leu Leu Glu Ala Leu Phe 610 615 620 Leu Pro Lys Arg Leu Ser Ile Ile His Cys Pro Gly His Gln Lys Gly 625 630 635 640 Asp Ser Pro Gln Ala Lys Gly Asn Arg Leu Ala Asp Asp Thr Ala Lys 645 650 655 Lys Ala Ala Thr Glu Thr His Ser Ser Leu Thr Val Leu 660 665 <210> 6 <211> 560 <212> PRT <213> Artificial Sequence <220> <223> artificial sequence (RT) <220> <221> MISC_FEATURE <222> (280) <223> Xaa can be any naturally occurring amino acid <400> 6 Pro Ile Ser Pro Ile Glu Thr Val Pro Val Lys Leu Lys Pro Gly Met 1 5 10 15 Asp Gly Pro Lys Val Lys Gln Trp Pro Leu Thr Glu Glu Lys Ile Lys 20 25 30 Ala Leu Val Glu Ile Cys Thr Glu Met Glu Lys Glu Gly Lys Ile Ser 35 40 45 Lys Ile Gly Pro Glu Asn Pro Tyr Asn Thr Pro Val Phe Ala Ile Lys 50 55 60 Lys Lys Asp Ser Thr Lys Trp Arg Lys Leu Val Asp Phe Arg Glu Leu 65 70 75 80 Asn Lys Arg Thr Gln Asp Phe Trp Glu Val Gln Leu Gly Ile Pro His 85 90 95 Pro Ala Gly Leu Lys Lys Lys Lys Ser Val Thr Val Leu Asp Val Gly 100 105 110 Asp Ala Tyr Phe Ser Val Pro Leu Asp Glu Asp Phe Arg Lys Tyr Thr 115 120 125 Ala Phe Thr Ile Pro Ser Ile Asn Asn Glu Thr Pro Gly Ile Arg Tyr 130 135 140 Gln Tyr Asn Val Leu Pro Gln Gly Trp Lys Gly Ser Pro Ala Ile Phe 145 150 155 160 Gln Ser Ser Met Thr Lys Ile Leu Glu Pro Phe Arg Lys Gln Asn Pro 165 170 175 Asp Ile Val Ile Tyr Gln Tyr Met Asp Asp Leu Tyr Val Gly Ser Asp 180 185 190 Leu Glu Ile Gly Gln His Arg Thr Lys Ile Glu Glu Leu Arg Gln His 195 200 205 Leu Leu Arg Trp Gly Leu Thr Thr Pro Asp Lys Lys His Gln Lys Glu 210 215 220 Pro Pro Phe Leu Trp Met Gly Tyr Glu Leu His Pro Asp Lys Trp Thr 225 230 235 240 Val Gln Pro Ile Val Leu Pro Glu Lys Asp Ser Trp Thr Val Asn Asp 245 250 255 Ile Gln Lys Leu Val Gly Lys Leu Asn Trp Ala Ser Gln Ile Tyr Pro 260 265 270 Gly Ile Lys Val Arg Gln Leu Xaa Lys Leu Leu Arg Gly Thr Lys Ala 275 280 285 Leu Thr Glu Val Ile Pro Leu Thr Glu Glu Ala Glu Leu Glu Leu Ala 290 295 300 Glu Asn Arg Glu Ile Leu Lys Glu Pro Val His Gly Val Tyr Tyr Asp 305 310 315 320 Pro Ser Lys Asp Leu Ile Ala Glu Ile Gln Lys Gln Gly Gln Gly Gln 325 330 335 Trp Thr Tyr Gln Ile Tyr Gln Glu Pro Phe Lys Asn Leu Lys Thr Gly 340 345 350 Lys Tyr Ala Arg Met Arg Gly Ala His Thr Asn Asp Val Lys Gln Leu 355 360 365 Thr Glu Ala Val Gln Lys Ile Thr Thr Glu Ser Ile Val Ile Trp Gly 370 375 380 Lys Thr Pro Lys Phe Lys Leu Pro Ile Gln Lys Glu Thr Trp Glu Thr 385 390 395 400 Trp Trp Thr Glu Tyr Trp Gln Ala Thr Trp Ile Pro Glu Trp Glu Phe 405 410 415 Val Asn Thr Pro Pro Leu Val Lys Leu Trp Tyr Gln Leu Glu Lys Glu 420 425 430 Pro Ile Val Gly Ala Glu Thr Phe Tyr Val Asp Gly Ala Ala Asn Arg 435 440 445 Glu Thr Lys Leu Gly Lys Ala Gly Tyr Val Thr Asn Arg Gly Arg Gln 450 455 460 Lys Val Val Thr Leu Thr Asp Thr Thr Asn Gln Lys Thr Glu Leu Gln 465 470 475 480 Ala Ile Tyr Leu Ala Leu Gln Asp Ser Gly Leu Glu Val Asn Ile Val 485 490 495 Thr Asp Ser Gln Tyr Ala Leu Gly Ile Ile Gln Ala Gln Pro Asp Gln 500 505 510 Ser Glu Ser Glu Leu Val Asn Gln Ile Ile Glu Gln Leu Ile Lys Lys 515 520 525 Glu Lys Val Tyr Leu Ala Trp Val Pro Ala His Lys Gly Ile Gly Gly 530 535 540 Asn Glu Gln Val Asp Lys Leu Val Ser Ala Gly Ile Arg Lys Val Leu 545 550 555 560 <210> 7 <211> 440 <212> PRT <213> Artificial Sequence <220> <223> artificial sequence(RT) <400> 7 Pro Ile Ser Pro Ile Glu Thr Val Pro Val Lys Leu Lys Pro Gly Met 1 5 10 15 Asp Gly Pro Lys Val Lys Gln Trp Pro Leu Thr Glu Glu Lys Ile Lys 20 25 30 Ala Leu Val Glu Ile Cys Thr Glu Met Glu Lys Glu Gly Lys Ile Ser 35 40 45 Lys Ile Gly Pro Glu Asn Pro Tyr Asn Thr Pro Val Phe Ala Ile Lys 50 55 60 Lys Lys Asp Ser Thr Lys Trp Arg Lys Leu Val Asp Phe Arg Glu Leu 65 70 75 80 Asn Lys Arg Thr Gln Asp Phe Trp Glu Val Gln Leu Gly Ile Pro His 85 90 95 Pro Ala Gly Leu Lys Lys Lys Lys Ser Val Thr Val Leu Asp Val Gly 100 105 110 Asp Ala Tyr Phe Ser Val Pro Leu Asp Glu Asp Phe Arg Lys Tyr Thr 115 120 125 Ala Phe Thr Ile Pro Ser Ile Asn Asn Glu Thr Pro Gly Ile Arg Tyr 130 135 140 Gln Tyr Asn Val Leu Pro Gln Gly Trp Lys Gly Ser Pro Ala Ile Phe 145 150 155 160 Gln Ser Ser Met Thr Lys Ile Leu Glu Pro Phe Arg Lys Gln Asn Pro 165 170 175 Asp Ile Val Ile Tyr Gln Tyr Met Asp Asp Leu Tyr Val Gly Ser Asp 180 185 190 Leu Glu Ile Gly Gln His Arg Thr Lys Ile Glu Glu Leu Arg Gln His 195 200 205 Leu Leu Arg Trp Gly Leu Thr Thr Pro Asp Lys Lys His Gln Lys Glu 210 215 220 Pro Pro Phe Leu Trp Met Gly Tyr Glu Leu His Pro Asp Lys Trp Thr 225 230 235 240 Val Gln Pro Ile Val Leu Pro Glu Lys Asp Ser Trp Thr Val Asn Asp 245 250 255 Ile Gln Lys Leu Val Gly Lys Leu Asn Trp Ala Ser Gln Ile Tyr Pro 260 265 270 Gly Ile Lys Val Arg Gln Leu Cys Lys Leu Leu Arg Gly Thr Lys Ala 275 280 285 Leu Thr Glu Val Ile Pro Leu Thr Glu Glu Ala Glu Leu Glu Leu Ala 290 295 300 Glu Asn Arg Glu Ile Leu Lys Glu Pro Val His Gly Val Tyr Tyr Asp 305 310 315 320 Pro Ser Lys Asp Leu Ile Ala Glu Ile Gln Lys Gln Gly Gln Gly Gln 325 330 335 Trp Thr Tyr Gln Ile Tyr Gln Glu Pro Phe Lys Asn Leu Lys Thr Gly 340 345 350 Lys Tyr Ala Arg Met Arg Gly Ala His Thr Asn Asp Val Lys Gln Leu 355 360 365 Thr Glu Ala Val Gln Lys Ile Thr Thr Glu Ser Ile Val Ile Trp Gly 370 375 380 Lys Thr Pro Lys Phe Lys Leu Pro Ile Gln Lys Glu Thr Trp Glu Thr 385 390 395 400 Trp Trp Thr Glu Tyr Trp Gln Ala Thr Trp Ile Pro Glu Trp Glu Phe 405 410 415 Val Asn Thr Pro Pro Leu Val Lys Leu Trp Tyr Gln Leu Glu Lys Glu 420 425 430 Pro Ile Val Gly Ala Glu Thr Phe 435 440 <210> 8 <211> 858 <212> PRT <213> Artificial Sequence <220> <223> rous sarcoma virus RT <400> 8 Thr Val Ala Leu His Leu Ala Ile Pro Leu Lys Trp Lys Pro Asn His 1 5 10 15 Thr Pro Val Trp Ile Asp Gln Trp Pro Leu Pro Glu Gly Lys Leu Val 20 25 30 Ala Leu Thr Gln Leu Val Glu Lys Glu Leu Gln Leu Gly His Ile Glu 35 40 45 Pro Ser Leu Ser Cys Trp Asn Thr Pro Val Phe Val Ile Arg Lys Ala 50 55 60 Ser Gly Ser Tyr Arg Leu Leu His Asp Leu Arg Ala Val Asn Ala Lys 65 70 75 80 Leu Val Pro Phe Gly Ala Val Gln Gln Gly Ala Pro Val Leu Ser Ala 85 90 95 Leu Pro Arg Gly Trp Pro Leu Met Val Leu Asp Leu Lys Asp Cys Phe 100 105 110 Phe Ser Ile Pro Leu Ala Glu Gln Asp Arg Glu Ala Phe Ala Phe Thr 115 120 125 Leu Pro Ser Val Asn Asn Gln Ala Pro Ala Arg Arg Phe Gln Trp Lys 130 135 140 Val Leu Pro Gln Gly Met Thr Cys Ser Pro Thr Ile Cys Gln Leu Ile 145 150 155 160 Val Gly Gln Ile Leu Glu Pro Leu Arg Leu Lys His Pro Ser Leu Arg 165 170 175 Met Leu His Tyr Met Asp Asp Leu Leu Leu Ala Ala Ser Ser His Asp 180 185 190 Gly Leu Glu Ala Ala Gly Glu Glu Val Ile Ser Thr Leu Glu Arg Ala 195 200 205 Gly Phe Thr Ile Ser Pro Asp Lys Val Gln Lys Glu Pro Gly Val Gln 210 215 220 Tyr Leu Gly Tyr Lys Leu Gly Ser Thr Tyr Ala Ala Pro Val Gly Leu 225 230 235 240 Val Ala Glu Pro Arg Ile Ala Thr Leu Trp Asp Val Gln Lys Leu Val 245 250 255 Gly Ser Leu Gln Trp Leu Arg Pro Ala Leu Gly Ile Pro Pro Arg Leu 260 265 270 Arg Gly Pro Phe Tyr Glu Gln Leu Arg Gly Ser Asp Pro Asn Glu Ala 275 280 285 Arg Glu Trp Asn Leu Asp Met Lys Met Ala Trp Arg Glu Ile Val Gln 290 295 300 Leu Ser Thr Thr Ala Ala Leu Glu Arg Trp Asp Pro Ala Leu Pro Leu 305 310 315 320 Glu Gly Ala Val Ala Arg Cys Glu Gln Gly Ala Ile Gly Val Leu Gly 325 330 335 Gln Gly Leu Ser Thr His Pro Arg Pro Cys Leu Trp Leu Phe Ser Thr 340 345 350 Gln Pro Thr Lys Ala Phe Thr Ala Trp Leu Glu Val Leu Thr Leu Leu 355 360 365 Ile Thr Lys Leu Arg Ala Ser Ala Val Arg Thr Phe Gly Lys Glu Val 370 375 380 Asp Ile Leu Leu Leu Pro Ala Cys Phe Arg Asp Glu Leu Pro Leu Pro 385 390 395 400 Glu Gly Ile Leu Leu Ala Leu Arg Gly Phe Ala Gly Lys Ile Arg Ser 405 410 415 Ser Asp Thr Pro Ser Ile Phe Asp Ile Ala Arg Pro Leu His Val Ser 420 425 430 Leu Lys Val Arg Val Thr Asp His Pro Val Pro Gly Pro Thr Val Phe 435 440 445 Thr Asp Ala Ser Ser Ser Thr His Lys Gly Val Val Val Trp Arg Glu 450 455 460 Gly Pro Arg Trp Glu Ile Lys Glu Ile Ala Asp Leu Gly Ala Ser Val 465 470 475 480 Gln Gln Leu Glu Ala Arg Ala Val Ala Met Ala Leu Leu Leu Trp Pro 485 490 495 Thr Thr Pro Thr Asn Val Val Thr Asp Ser Ala Phe Val Ala Lys Met 500 505 510 Leu Leu Lys Met Gly Gln Glu Gly Val Pro Ser Thr Ala Ala Ala Phe 515 520 525 Ile Leu Glu Asp Ala Leu Ser Gln Arg Ser Ala Met Ala Ala Val Leu 530 535 540 His Val Arg Ser His Ser Glu Val Pro Gly Phe Phe Thr Glu Gly Asn 545 550 555 560 Asp Val Ala Asp Ser Gln Ala Thr Phe Gln Ala Tyr Pro Leu Arg Glu 565 570 575 Ala Lys Asp Leu His Thr Ala Leu His Ile Gly Pro Arg Ala Leu Ser 580 585 590 Lys Ala Cys Asn Ile Ser Met Gln Gln Ala Arg Glu Val Val Gln Thr 595 600 605 Cys Pro His Cys Asn Ser Ala Pro Ala Leu Glu Ala Gly Val Asn Pro 610 615 620 Arg Gly Leu Gly Pro Leu Gln Ile Trp Gln Thr Asp Phe Thr Leu Glu 625 630 635 640 Pro Arg Met Ala Pro Arg Ser Trp Leu Ala Val Thr Val Asp Thr Ala 645 650 655 Ser Ser Ala Ile Val Val Thr Gln His Gly Arg Val Thr Ser Val Ala 660 665 670 Ala Gln His His Trp Ala Thr Val Ile Ala Val Leu Gly Arg Pro Lys 675 680 685 Ala Ile Lys Thr Asp Asn Gly Ser Cys Phe Thr Ser Lys Ser Thr Arg 690 695 700 Glu Trp Leu Ala Arg Trp Gly Ile Ala His Thr Thr Gly Ile Pro Gly 705 710 715 720 Asn Ser Gln Gly Gln Ala Met Val Glu Arg Ala Asn Arg Leu Leu Lys 725 730 735 Asp Lys Ile Arg Val Leu Ala Glu Gly Asp Gly Phe Met Lys Arg Ile 740 745 750 Pro Thr Ser Lys Gln Gly Glu Leu Leu Ala Lys Ala Met Tyr Ala Leu 755 760 765 Asn His Phe Glu Arg Gly Glu Asn Thr Lys Thr Pro Ile Gln Lys His 770 775 780 Trp Arg Pro Thr Val Leu Thr Glu Gly Pro Pro Val Lys Ile Arg Ile 785 790 795 800 Glu Thr Gly Glu Trp Glu Lys Gly Trp Asn Val Leu Val Trp Gly Arg 805 810 815 Gly Tyr Ala Ala Val Lys Asn Arg Asp Thr Asp Lys Val Ile Trp Val 820 825 830 Pro Ser Arg Lys Val Lys Pro Asp Ile Ala Gln Lys Asp Glu Val Thr 835 840 845 Lys Lys Asp Glu Ala Ser Pro Leu Phe Ala 850 855 <210> 9 <211> 675 <212> PRT <213> Artificial Sequence <220> <223> cauliflower mosaic virus RT <400> 9 Met Met Asp His Leu Leu Gln Lys Thr Gln Ile Gln Asn Gln Thr Glu 1 5 10 15 Gln Val Met Asn Ile Thr Asn Pro Asn Ser Ile Tyr Ile Lys Gly Arg 20 25 30 Leu Tyr Phe Lys Gly Tyr Lys Lys Ile Glu Leu His Cys Phe Val Asp 35 40 45 Thr Gly Ala Ser Leu Cys Ile Ala Ser Lys Phe Val Ile Pro Glu Glu 50 55 60 His Trp Ile Asn Ala Glu Arg Pro Ile Met Val Lys Ile Ala Asp Gly 65 70 75 80 Ser Ser Ile Thr Ile Asn Lys Val Cys Arg Asp Ile Asp Leu Ile Ile 85 90 95 Ala Gly Glu Ile Phe His Ile Pro Thr Val Tyr Gln Gln Glu Ser Gly 100 105 110 Ile Asp Phe Ile Ile Gly Asn Asn Phe Cys Gln Leu Tyr Glu Pro Phe 115 120 125 Ile Gln Phe Thr Asp Arg Val Ile Phe Thr Lys Asp Arg Thr Tyr Pro 130 135 140 Val His Ile Ala Lys Leu Thr Arg Ala Val Arg Val Gly Thr Glu Gly 145 150 155 160 Phe Leu Glu Ser Met Lys Lys Arg Ser Lys Thr Gln Gln Pro Glu Pro 165 170 175 Val Asn Ile Ser Thr Asn Lys Ile Ala Ile Leu Ser Glu Gly Arg Arg 180 185 190 Leu Ser Glu Glu Lys Leu Phe Ile Thr Gln Gln Arg Met Gln Lys Ile 195 200 205 Glu Glu Leu Leu Glu Lys Val Cys Ser Glu Asn Pro Leu Asp Pro Asn 210 215 220 Lys Thr Lys Gln Trp Met Lys Ala Ser Ile Lys Leu Ser Asp Pro Ser 225 230 235 240 Lys Ala Ile Lys Val Lys Pro Met Lys Tyr Ser Pro Met Asp Arg Glu 245 250 255 Glu Phe Asp Lys Gln Ile Lys Glu Leu Leu Asp Leu Lys Val Ile Lys 260 265 270 Pro Ser Lys Ser Pro His Met Ala Pro Ala Phe Leu Val Asn Asn Glu 275 280 285 Ala Glu Lys Arg Arg Gly Lys Lys Arg Met Val Val Asn Tyr Lys Ala 290 295 300 Met Asn Lys Ala Thr Val Gly Asp Ala Tyr Asn Leu Pro Asn Lys Asp 305 310 315 320 Glu Leu Leu Thr Leu Ile Arg Gly Lys Lys Ile Phe Ser Ser Phe Asp 325 330 335 Cys Lys Ser Gly Phe Trp Gln Val Leu Leu Asp Gln Asp Ser Arg Pro 340 345 350 Leu Thr Ala Phe Thr Cys Pro Gln Gly His Tyr Glu Trp Asn Val Val 355 360 365 Pro Phe Gly Leu Lys Gln Ala Pro Ser Ile Phe Gln Arg His Met Asp 370 375 380 Glu Ala Phe Arg Val Phe Arg Lys Phe Cys Cys Val Tyr Val Asp Asp 385 390 395 400 Ile Leu Val Phe Ser Asn Asn Glu Glu Asp His Leu Leu His Val Ala 405 410 415 Met Ile Leu Gln Lys Cys Asn Gln His Gly Ile Ile Leu Ser Lys Lys 420 425 430 Lys Ala Gln Leu Phe Lys Lys Lys Ile Asn Phe Leu Gly Leu Glu Ile 435 440 445 Asp Glu Gly Thr His Lys Pro Gln Gly His Ile Leu Glu His Ile Asn 450 455 460 Lys Phe Pro Asp Thr Leu Glu Asp Lys Lys Gln Leu Gln Arg Phe Leu 465 470 475 480 Gly Ile Leu Thr Tyr Ala Ser Asp Tyr Ile Pro Lys Leu Ala Gln Ile 485 490 495 Arg Lys Pro Leu Gln Ala Lys Leu Lys Glu Asn Val Pro Trp Lys Trp 500 505 510 Thr Lys Glu Asp Thr Leu Tyr Met Gln Lys Val Lys Lys Asn Leu Gln 515 520 525 Gly Phe Pro Pro Leu His His Pro Leu Pro Glu Glu Lys Leu Ile Ile 530 535 540 Glu Thr Asp Ala Ser Asp Asp Tyr Trp Gly Gly Met Leu Lys Ala Ile 545 550 555 560 Lys Ile Asn Glu Gly Thr Asn Thr Glu Leu Ile Cys Arg Tyr Ala Ser 565 570 575 Gly Ser Phe Lys Ala Ala Glu Lys Asn Tyr His Ser Asn Asp Lys Glu 580 585 590 Thr Leu Ala Val Ile Asn Thr Ile Lys Lys Phe Ser Ile Tyr Leu Thr 595 600 605 Pro Val His Phe Leu Ile Arg Thr Asp Asn Thr His Phe Lys Ser Phe 610 615 620 Val Asn Leu Asn Tyr Lys Gly Asp Ser Lys Leu Gly Arg Asn Ile Arg 625 630 635 640 Trp Gln Ala Trp Leu Ser His Tyr Ser Phe Asp Val Glu His Ile Lys 645 650 655 Gly Thr Asp Asn His Phe Ala Asp Phe Leu Ser Arg Glu Phe Asn Arg 660 665 670 Val Asn Ser 675 <210> 10 <211> 366 <212> PRT <213> Artificial Sequence <220> <223> Klebsiella pneuomiae RT <400> 10 Met Lys Glu Lys Ile Ser Lys Ile Asp Lys Asn Phe Tyr Thr Asp Ile 1 5 10 15 Phe Ile Lys Thr Ser Phe Gln Asn Glu Phe Glu Ala Gly Gly Val Ile 20 25 30 Pro Pro Ile Ala Lys Asn Gln Val Ser Thr Ile Ser Asn Lys Asn Lys 35 40 45 Thr Phe Tyr Ser Leu Ala His Ser Ser Pro His Tyr Ser Ile Gln Thr 50 55 60 Arg Ile Glu Lys Phe Leu Leu Lys Asn Ile Pro Leu Ser Ala Ser Ser 65 70 75 80 Phe Ala Phe Arg Lys Glu Arg Ser Tyr Leu His Tyr Leu Glu Pro His 85 90 95 Thr Gln Asn Val Lys Tyr Cys His Leu Asp Ile Val Ser Phe Phe His 100 105 110 Ser Ile Asp Val Asn Ile Val Arg Asp Thr Phe Ser Val Tyr Phe Ser 115 120 125 Asp Glu Phe Leu Val Lys Glu Lys Gln Ser Leu Leu Asp Ala Phe Met 130 135 140 Ala Ser Val Thr Leu Thr Ala Glu Leu Asp Gly Val Glu Lys Thr Phe 145 150 155 160 Ile Pro Met Gly Phe Lys Ser Ser Pro Ser Ile Ser Asn Ile Ile Phe 165 170 175 Arg Lys Ile Asp Ile Leu Ile Gln Lys Phe Cys Asp Lys Asn Lys Ile 180 185 190 Thr Tyr Thr Arg Tyr Ala Asp Asp Leu Leu Phe Ser Thr Lys Lys Glu 195 200 205 Asn Asn Ile Leu Ser Ser Thr Phe Phe Ile Asn Glu Ile Ser Ser Ile 210 215 220 Leu Ser Ile Asn Lys Phe Lys Leu Asn Lys Ser Lys Tyr Leu Tyr Lys 225 230 235 240 Glu Gly Thr Ile Ser Leu Gly Gly Tyr Val Ile Glu Asn Ile Leu Lys 245 250 255 Asp Asn Ser Ser Gly Asn Ile Arg Leu Ser Ser Ser Lys Leu Asn Pro 260 265 270 Leu Tyr Lys Ala Leu Tyr Glu Ile Lys Lys Gly Ser Ser Ser Lys His 275 280 285 Ile Cys Ile Lys Val Phe Asn Leu Lys Leu Lys Arg Phe Ile Tyr Lys 290 295 300 Lys Asn Lys Glu Lys Phe Glu Ala Lys Phe Tyr Ser Ser Gln Leu Lys 305 310 315 320 Asn Lys Leu Leu Gly Tyr Arg Ser Tyr Leu Leu Ser Phe Val Ile Phe 325 330 335 His Lys Lys Tyr Lys Cys Ile Asn Pro Ile Phe Leu Glu Lys Cys Val 340 345 350 Phe Leu Ile Ser Glu Ile Glu Ser Ile Met Asn Arg Lys Phe 355 360 365 <210> 11 <211> 263 <212> PRT <213> Artificial Sequence <220> <223> Escerichia coli RT <400> 11 Met Lys Ile Thr Ser Asn Asn Val Thr Ala Val Ile Asn Gly Lys Gly 1 5 10 15 Trp His Ser Ile Asn Trp Lys Lys Cys His Gln His Val Lys Thr Ile 20 25 30 Gln Thr Arg Ile Ala Lys Ala Ala Cys Asn Gln Gln Trp Arg Thr Val 35 40 45 Gly Arg Leu Gln Arg Leu Leu Val Arg Ser Phe Ser Ala Arg Ala Leu 50 55 60 Ala Val Lys Arg Val Thr Glu Asn Ser Gly Arg Lys Thr Pro Gly Val 65 70 75 80 Asp Gly Gln Ile Trp Ser Thr Pro Glu Ser Lys Trp Glu Ala Ile Phe 85 90 95 Lys Leu Arg Arg Lys Gly Tyr Lys Pro Leu Pro Leu Lys Arg Val Phe 100 105 110 Ile Pro Lys Ser Asn Gly Lys Lys Arg Pro Leu Gly Ile Pro Val Met 115 120 125 Leu Asp Arg Ala Met Gln Ala Leu His Leu Leu Gly Leu Glu Pro Val 130 135 140 Ser Glu Thr Asn Ala Asp His Asn Ser Tyr Gly Phe Arg Pro Ala Arg 145 150 155 160 Cys Thr Ala Asp Ala Ile Gln Gln Val Cys Asn Met Tyr Ser Ser Arg 165 170 175 Asn Ala Ser Lys Trp Val Leu Glu Gly Asp Ile Lys Gly Cys Phe Glu 180 185 190 His Ile Ser His Glu Trp Leu Leu Glu Asn Ile Pro Met Asp Lys Gln 195 200 205 Ile Leu Arg Asn Trp Leu Lys Ala Gly Ile Ile Glu Lys Ser Ile Phe 210 215 220 Ser Lys Thr Leu Ser Gly Thr Pro Gln Gly Gly Ile Ile Ser Pro Val 225 230 235 240 Leu Ala Asn Met Ala Leu Asp Gly Leu Glu Arg Leu Leu Gln Asn Arg 245 250 255 Phe Gly Arg Asn Arg Leu Ile 260 <210> 12 <211> 438 <212> PRT <213> Artificial Sequence <220> <223> Bacillus subtilis RT <400> 12 Met Ser Lys Ile Lys Ile Asn Tyr Glu Lys Tyr His Ile Lys Pro Phe 1 5 10 15 Pro His Phe Asp Gln Arg Ile Lys Val Asn Lys Lys Val Lys Glu Asn 20 25 30 Leu Gln Asn Pro Phe Tyr Ile Ala Ala His Ser Phe Tyr Pro Phe Ile 35 40 45 His Tyr Lys Lys Ile Ser Tyr Lys Phe Lys Asn Gly Thr Leu Ser Ser 50 55 60 Pro Lys Glu Arg Asp Ile Phe Tyr Ser Gly His Met Asp Gly Tyr Ile 65 70 75 80 Tyr Lys His Tyr Gly Glu Ile Leu Asn His Lys Tyr Asn Asn Thr Cys 85 90 95 Ile Gly Lys Gly Ile Asp His Val Ser Leu Ala Tyr Arg Asn Asn Lys 100 105 110 Met Gly Lys Ser Asn Ile His Phe Ala Ala Glu Val Ile Asn Phe Ile 115 120 125 Ser Glu Gln Gln Gln Ala Phe Ile Phe Val Ser Asp Phe Ser Ser Tyr 130 135 140 Phe Asp Ser Leu Asp His Ala Ile Leu Lys Glu Lys Leu Ile Glu Val 145 150 155 160 Leu Glu Glu Gln Asp Lys Leu Ser Lys Asp Trp Trp Asn Val Phe Lys 165 170 175 His Ile Thr Arg Tyr Asn Trp Val Glu Lys Glu Glu Val Ile Ser Asp 180 185 190 Leu Glu Cys Thr Lys Glu Lys Ile Ala Arg Asp Lys Lys Ser Arg Glu 195 200 205 Arg Tyr Tyr Thr Pro Ala Glu Phe Arg Glu Phe Arg Lys Arg Val Asn 210 215 220 Ile Lys Ser Asn Asp Thr Gly Val Gly Ile Pro Gln Gly Thr Ala Ile 225 230 235 240 Ser Ala Val Leu Ala Asn Val Tyr Ala Ile Asp Leu Asp Gln Lys Leu 245 250 255 Asn Gln Tyr Ala Leu Lys Tyr Gly Gly Ile Tyr Arg Arg Tyr Ser Asp 260 265 270 Asp Ile Ile Met Val Leu Pro Met Thr Ser Asp Gly Gln Asp Pro Ser 275 280 285 Asn Asp His Val Ser Phe Ile Lys Ser Val Val Lys Arg Asn Lys Val 290 295 300 Thr Met Gly Asp Ser Lys Thr Ser Val Leu Tyr Tyr Ala Asn Asn Asn 305 310 315 320 Ile Tyr Glu Asp Tyr Gln Arg Lys Arg Glu Ser Lys Met Asp Tyr Leu 325 330 335 Gly Phe Ser Phe Asp Gly Met Thr Val Lys Ile Arg Glu Lys Ser Leu 340 345 350 Phe Lys Tyr Tyr His Arg Thr Tyr Lys Lys Ile Asn Ser Ile Asn Trp 355 360 365 Ala Ser Val Lys Lys Glu Lys Lys Val Gly Arg Lys Lys Leu Tyr Leu 370 375 380 Leu Tyr Ser His Leu Gly Arg Asn Tyr Lys Gly His Gly Asn Phe Ile 385 390 395 400 Ser Tyr Cys Lys Lys Ala His Ala Val Phe Glu Gly Asn Lys Lys Ile 405 410 415 Glu Ser Leu Ile Asn Gln Gln Ile Lys Arg His Trp Lys Lys Ile Gln 420 425 430 Lys Arg Leu Val Asp Val 435 <210> 13 <211> 426 <212> PRT <213> Artificial Sequence <220> <223> Eubacterium rectale RT <400> 13 Asp Thr Ser Asn Leu Met Glu Gln Ile Leu Ser Ser Asp Asn Leu Asn 1 5 10 15 Arg Ala Tyr Leu Gln Val Val Arg Asn Lys Gly Ala Glu Gly Val Asp 20 25 30 Gly Met Lys Tyr Thr Glu Leu Lys Glu His Leu Ala Lys Asn Gly Glu 35 40 45 Thr Ile Lys Gly Gln Leu Arg Thr Arg Lys Tyr Lys Pro Gln Pro Ala 50 55 60 Arg Arg Val Glu Ile Pro Lys Pro Asp Gly Gly Val Arg Asn Leu Gly 65 70 75 80 Val Pro Thr Val Thr Asp Arg Phe Ile Gln Gln Ala Ile Ala Gln Val 85 90 95 Leu Thr Pro Ile Tyr Glu Glu Gln Phe His Asp His Ser Tyr Gly Phe 100 105 110 Arg Pro Asn Arg Cys Ala Gln Gln Ala Ile Leu Thr Ala Leu Asn Ile 115 120 125 Met Asn Asp Gly Asn Asp Trp Ile Val Asp Ile Asp Leu Glu Lys Phe 130 135 140 Phe Asp Thr Val Asn His Asp Lys Leu Met Thr Leu Ile Gly Arg Thr 145 150 155 160 Ile Lys Asp Gly Asp Val Ile Ser Ile Val Arg Lys Tyr Leu Val Ser 165 170 175 Gly Ile Met Ile Asp Asp Glu Tyr Glu Asp Ser Ile Val Gly Thr Pro 180 185 190 Gln Gly Gly Asn Leu Ser Pro Leu Leu Ala Asn Ile Met Leu Asn Glu 195 200 205 Leu Asp Lys Glu Met Glu Lys Arg Gly Leu Asn Phe Val Arg Tyr Ala 210 215 220 Asp Asp Cys Ile Ile Met Val Gly Ser Glu Met Ser Ala Asn Arg Val 225 230 235 240 Met Arg Asn Ile Ser Arg Phe Ile Glu Glu Lys Leu Gly Leu Lys Val 245 250 255 Asn Met Thr Lys Ser Lys Val Asp Arg Pro Ser Gly Leu Lys Tyr Leu 260 265 270 Gly Phe Gly Phe Tyr Phe Asp Pro Arg Ala His Gln Phe Lys Ala Lys 275 280 285 Pro His Ala Lys Ser Val Ala Lys Phe Lys Lys Arg Met Lys Glu Leu 290 295 300 Thr Cys Arg Ser Trp Gly Val Ser Asn Ser Tyr Lys Val Glu Lys Leu 305 310 315 320 Asn Gln Leu Ile Arg Gly Trp Ile Asn Tyr Phe Lys Ile Gly Ser Met 325 330 335 Lys Thr Leu Cys Lys Glu Leu Asp Ser Arg Ile Arg Tyr Arg Leu Arg 340 345 350 Met Cys Ile Trp Lys Gln Trp Lys Thr Pro Gln Asn Gln Glu Lys Asn 355 360 365 Leu Val Lys Leu Gly Ile Asp Arg Asn Thr Ala Arg Arg Val Ala Tyr 370 375 380 Thr Gly Lys Arg Ile Ala Tyr Val Cys Asn Lys Gly Ala Val Asn Val 385 390 395 400 Ala Ile Ser Asn Lys Arg Leu Ala Ser Phe Gly Leu Ile Ser Met Leu 405 410 415 Asp Tyr Tyr Ile Glu Lys Cys Val Thr Cys 420 425 <210> 14 <211> 412 <212> PRT <213> Artificial Sequence <220> <223> Geobacillus stearothermophilus <400> 14 Ala Leu Leu Glu Arg Ile Leu Ala Arg Asp Asn Leu Ile Thr Ala Leu 1 5 10 15 Lys Arg Val Glu Ala Asn Gln Gly Ala Pro Gly Ile Asp Gly Val Ser 20 25 30 Thr Asp Gln Leu Arg Asp Tyr Ile Arg Ala His Trp Ser Thr Ile His 35 40 45 Ala Gln Leu Leu Ala Gly Thr Tyr Arg Pro Ala Pro Val Arg Arg Val 50 55 60 Glu Ile Pro Lys Pro Gly Gly Gly Thr Arg Gln Leu Gly Ile Pro Thr 65 70 75 80 Val Val Asp Arg Leu Ile Gln Gln Ala Ile Leu Gln Glu Leu Thr Pro 85 90 95 Ile Phe Asp Pro Asp Phe Ser Ser Ser Ser Phe Gly Phe Arg Pro Gly 100 105 110 Arg Asn Ala His Asp Ala Val Arg Gln Ala Gln Gly Tyr Ile Gln Glu 115 120 125 Gly Tyr Arg Tyr Val Val Asp Met Asp Leu Glu Lys Phe Phe Asp Arg 130 135 140 Val Asn His Asp Ile Leu Met Ser Arg Val Ala Arg Lys Val Lys Asp 145 150 155 160 Lys Arg Val Leu Lys Leu Ile Arg Ala Tyr Leu Gln Ala Gly Val Met 165 170 175 Ile Glu Gly Val Lys Val Gln Thr Glu Glu Gly Thr Pro Gln Gly Gly 180 185 190 Pro Leu Ser Pro Leu Leu Ala Asn Ile Leu Leu Asp Asp Leu Asp Lys 195 200 205 Glu Leu Glu Lys Arg Gly Leu Lys Phe Cys Arg Tyr Ala Asp Asp Cys 210 215 220 Asn Ile Tyr Val Lys Ser Leu Arg Ala Gly Gln Arg Val Lys Gln Ser 225 230 235 240 Ile Gln Arg Phe Leu Glu Lys Thr Leu Lys Leu Lys Val Asn Glu Glu 245 250 255 Lys Ser Ala Val Asp Arg Pro Trp Lys Arg Ala Phe Leu Gly Phe Ser 260 265 270 Phe Thr Pro Glu Arg Lys Ala Arg Ile Arg Leu Ala Pro Arg Ser Ile 275 280 285 Gln Arg Leu Lys Gln Arg Ile Arg Gln Leu Thr Asn Pro Asn Trp Ser 290 295 300 Ile Ser Met Pro Glu Arg Ile His Arg Val Asn Gln Tyr Val Met Gly 305 310 315 320 Trp Ile Gly Tyr Phe Arg Leu Val Glu Thr Pro Ser Val Leu Gln Thr 325 330 335 Ile Glu Gly Trp Ile Arg Arg Arg Leu Arg Leu Cys Gln Trp Leu Gln 340 345 350 Trp Lys Arg Val Arg Thr Arg Ile Arg Glu Leu Arg Ala Leu Gly Leu 355 360 365 Lys Glu Thr Ala Val Met Glu Ile Ala Asn Thr Arg Lys Gly Ala Trp 370 375 380 Arg Thr Thr Lys Thr Pro Gln Leu His Gln Ala Leu Gly Lys Thr Tyr 385 390 395 400 Trp Thr Ala Gln Gly Leu Lys Ser Leu Thr Gln Arg 405 410 <210> 15 <211> 679 <212> PRT <213> Artificial Sequence <220> <223> moloney murine leukemia virus mutant RT <400> 15 Thr Leu Asn Ile Glu Asp Glu Tyr Arg Leu His Glu Thr Ser Lys Glu 1 5 10 15 Pro Asp Val Ser Leu Gly Ser Thr Trp Leu Ser Asp Phe Pro Gln Ala 20 25 30 Trp Ala Glu Thr Gly Gly Met Gly Leu Ala Val Arg Gln Ala Pro Leu 35 40 45 Ile Ile Pro Leu Lys Ala Thr Ser Thr Pro Val Ser Ile Lys Gln Tyr 50 55 60 Pro Met Ser Gln Glu Ala Arg Leu Gly Ile Lys Pro His Ile Gln Arg 65 70 75 80 Leu Leu Asp Gln Gly Ile Leu Val Pro Cys Gln Ser Pro Trp Asn Thr 85 90 95 Pro Leu Leu Pro Val Lys Lys Pro Gly Thr Asn Asp Tyr Arg Pro Val 100 105 110 Gln Asp Leu Arg Glu Val Asn Lys Arg Val Glu Asp Ile His Pro Thr 115 120 125 Val Pro Asn Pro Tyr Asn Leu Leu Ser Gly Leu Pro Pro Ser His Gln 130 135 140 Trp Tyr Thr Val Leu Asp Leu Lys Asp Ala Phe Phe Cys Leu Arg Leu 145 150 155 160 His Pro Thr Ser Gln Pro Leu Phe Ala Phe Glu Trp Arg Asp Pro Glu 165 170 175 Met Gly Ile Ser Gly Gln Leu Thr Trp Thr Arg Leu Pro Gln Gly Phe 180 185 190 Lys Asn Ser Pro Thr Leu Phe Asn Glu Ala Leu His Arg Asp Leu Ala 195 200 205 Asp Phe Arg Ile Gln His Pro Asp Leu Ile Leu Leu Gln Tyr Val Asp 210 215 220 Asp Leu Leu Leu Ala Ala Thr Ser Glu Leu Asp Cys Gln Gln Gly Thr 225 230 235 240 Arg Ala Leu Leu Gln Thr Leu Gly Asn Leu Gly Tyr Arg Ala Ser Ala 245 250 255 Lys Lys Ala Gln Ile Cys Gln Lys Gln Val Lys Tyr Leu Gly Tyr Leu 260 265 270 Leu Lys Glu Gly Gln Arg Trp Leu Thr Glu Ala Arg Lys Glu Thr Val 275 280 285 Met Gly Gln Pro Thr Pro Lys Thr Pro Arg Gln Leu Arg Glu Phe Leu 290 295 300 Gly Lys Ala Gly Phe Cys Arg Leu Phe Ile Pro Gly Phe Ala Glu Met 305 310 315 320 Ala Ala Pro Leu Tyr Pro Leu Thr Lys Pro Gly Thr Leu Phe Asn Trp 325 330 335 Gly Pro Asp Gln Gln Lys Ala Tyr Gln Glu Ile Lys Gln Ala Leu Leu 340 345 350 Thr Ala Pro Ala Leu Gly Leu Pro Asp Leu Thr Lys Pro Phe Glu Leu 355 360 365 Phe Val Asp Glu Lys Gln Gly Tyr Ala Lys Gly Val Leu Thr Gln Lys 370 375 380 Leu Gly Pro Trp Arg Arg Pro Val Ala Tyr Leu Ser Lys Lys Leu Asp 385 390 395 400 Pro Val Ala Ala Gly Trp Pro Pro Cys Leu Arg Met Val Ala Ala Ile 405 410 415 Ala Val Leu Thr Lys Asp Ala Gly Lys Leu Thr Met Gly Gln Pro Leu 420 425 430 Val Ile Leu Ala Pro His Ala Val Glu Ala Leu Val Lys Gln Pro Pro 435 440 445 Asp Arg Trp Leu Ser Asn Ala Arg Met Thr His Tyr Gln Ala Leu Leu 450 455 460 Leu Asp Thr Asp Arg Val Gln Phe Gly Pro Val Val Ala Leu Asn Pro 465 470 475 480 Ala Thr Leu Leu Pro Leu Pro Glu Glu Gly Leu Gln His Asn Cys Leu 485 490 495 Asp Ile Leu Ala Glu Ala His Gly Thr Arg Pro Asp Leu Thr Asp Gln 500 505 510 Pro Leu Pro Asp Ala Asp His Thr Trp Tyr Thr Asp Gly Ser Ser Leu 515 520 525 Leu Gln Glu Gly Gln Arg Lys Ala Gly Ala Ala Val Thr Thr Glu Thr 530 535 540 Glu Val Ile Trp Ala Lys Ala Leu Pro Ala Gly Thr Ser Ala Gln Arg 545 550 555 560 Ala Glu Leu Ile Ala Leu Thr Gln Ala Leu Lys Met Ala Glu Gly Lys 565 570 575 Lys Leu Asn Val Tyr Thr Asp Ser Arg Tyr Ala Phe Ala Thr Ala His 580 585 590 Ile His Gly Glu Ile Tyr Arg Arg Arg Gly Trp Leu Thr Ser Glu Gly 595 600 605 Lys Glu Ile Lys Asn Lys Asp Glu Ile Leu Ala Leu Leu Lys Ala Leu 610 615 620 Phe Leu Pro Lys Arg Leu Ser Ile Ile His Cys Pro Gly His Gln Lys 625 630 635 640 Gly His Ser Ala Glu Ala Arg Gly Asn Arg Met Ala Asp Gln Ala Ala 645 650 655 Arg Lys Ala Ala Ile Thr Glu Thr Pro Asp Thr Ser Thr Leu Leu Ile 660 665 670 Glu Asn Ser Ser Pro Ser Gly 675 <210> 16 <211> 3 <212> PRT <213> Artificial Sequence <220> <223> linker <400> 16 Gly Gly Ser 1 <210> 17 <211> 6 <212> PRT <213> Artificial Sequence <220> <223> linker <400> 17 Gly Gly Ser Gly Gly Ser 1 5 <210> 18 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> linker <400> 18 Gly Gly Ser Gly Gly Ser Gly Gly Ser 1 5 <210> 19 <211> 33 <212> PRT <213> Artificial Sequence <220> <223> linker <400> 19 Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Ser Glu Thr Pro Gly Thr 1 5 10 15 Ser Glu Ser Ala Thr Pro Glu Ser Ser Gly Gly Ser Ser Gly Gly Ser 20 25 30 Ser <210> 20 <211> 16 <212> PRT <213> Artificial Sequence <220> <223> linker <400> 20 Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser 1 5 10 15 <210> 21 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> linker <400> 21 Pro Lys Lys Lys Arg Lys Val 1 5 <210> 22 <211> 30 <212> PRT <213> Artificial Sequence <220> <223> linker <400> 22 Met Asp Ser Leu Leu Met Asn Arg Arg Lys Phe Leu Tyr Gln Phe Lys 1 5 10 15 Asn Val Arg Trp Ala Lys Gly Arg Arg Glu Thr Tyr Leu Cys 20 25 30 <210> 23 <211> 109 <212> DNA <213> Artificial Sequence <220> <223> FnCas9 scaffold <400> 23 gtttcagttg ctgaattatt tggtaaacag taccaaataa ttaatgctct gtaatcattt 60 aaaagtattt tgaacggacc tctgtttgac acgtctgaat aactaaaaa 109 <210> 24 <211> 4884 <212> DNA <213> Artificial Sequence <220> <223> Francisella novicida Cas9(H969A) <400> 24 atgaacttca agatcctgcc tatcgccatc gacctgggcg tgaagaacac cggcgtgttc 60 agcgccttct accagaaggg caccagcctg gaacggctgg acaacaagaa cggcaaggtg 120 tacgagctga gcaaggacag ctacaccctg ctgatgaaca accggaccgc cagacggcac 180 cagcggagag gcatcgacag aaagcagctc gtgaagcggc tgttcaagct gatctggacc 240 gagcagctga acctggaatg ggacaaggac acccagcagg ccatcagctt tctgttcaac 300 agacggggct tcagcttcat caccgacggc tacagccccg agtacctgaa catcgtgccc 360 gaacaagtga aggccatcct gatggacatc ttcgacgact acaacggcga ggacgacctg 420 gactcctacc tgaagctggc caccgagcag gaaagcaaga tcagcgaaat ctacaacaag 480 ctgatgcaga agatcctgga gtttaagctg atgaagctgt gcaccgacat caaggacgat 540 aaggtgtcca ccaagaccct gaaagagatc accagctacg agttcgagct gctggccgac 600 tacctggcca actacagcga gagcctgaaa acccagaagt tctcctacac cgacaagcag 660 ggcaatctga aagagctgag ctactaccac cacgacaagt acaacatcca ggaatttctg 720 aagcggcacg ccaccatcaa cgacagaatc ctggacacac tgctgaccga cgatctggac 780 atctggaact tcaacttcga gaagttcgac ttcgacaaga acgaggaaaa gctgcagaac 840 caggaagata aggaccacat ccaggcccat ctgcaccact tcgtgttcgc cgtgaacaag 900 atcaagagcg agatggccag cggcggcaga cacagaagcc agtacttcca ggaaatcacc 960 aacgtgctgg acgagaacaa ccaccaggaa ggctatctga agaatttctg cgagaacctg 1020 cacaacaaaa agtacagcaa cctgtccgtg aagaatctcg tgaacctgat cggcaacctg 1080 agcaacctgg aactgaagcc tctgcgcaag tacttcaacg acaagatcca cgccaaggcc 1140 gaccactggg acgagcagaa gttcaccgag acatactgcc actggattct gggcgagtgg 1200 cgcgtgggag tgaaggacca ggacaagaag gacggcgcca agtactccta caaggacctg 1260 tgcaacgagc tgaaacagaa agtgaccaag gccggactgg tggacttcct gctggaactg 1320 gacccctgca ggaccatccc cccctacctg gataacaaca atcggaagcc ccccaagtgc 1380 cagagcctga tcctgaaccc caagttcctg gacaaccagt accccaactg gcagcagtat 1440 ctgcaggaac tgaaaaaact gcagagcatc cagaactacc tggacagctt cgagacagac 1500 ctgaaggtgc tgaagtccag caaggaccag ccctacttcg tggagtacaa gagcagcaac 1560 cagcagatcg cctccggcca gcgggactac aaggatctgg atgcccgcat cctgcagttc 1620 atcttcgata gagtgaaagc ctccgatgag ctgctgctga acgaaatcta ttttcaggcc 1680 aagaaactga agcagaaggc cagctccgaa ctggaaaagc tggaaagcag caagaaactg 1740 gacgaagtga tcgccaacag ccagctgtcc cagatcctga aaagccagca caccaacggc 1800 atcttcgagc agggcacctt cctgcacctc gtgtgcaagt actacaagca gcggcagcgg 1860 gccagagaca gcagactgta catcatgccc gagtacagat acgacaagaa gctgcacaag 1920 tataacaaca ccggccgctt cgacgatgac aaccagctgc tgacctactg caaccacaag 1980 ccccggcaga agcggtatca gctgctgaat gatctggccg gcgtgctgca ggtgtccccc 2040 aacttcctga aggacaagat cggctccgac gacgacctgt tcatctccaa gtggctggtg 2100 gaacacatcc gcggcttcaa gaaagcctgc gaggacagcc tgaagattca gaaggacaac 2160 cggggcctgc tgaaccacaa aatcaatatc gcccggaaca ccaagggcaa gtgcgagaaa 2220 gagattttta acctgatctg caagatcgag ggatccgagg ataagaaggg caattacaag 2280 cacggcctgg cctacgagct gggagtgctg ctgttcggcg agcccaatga ggccagcaag 2340 cccgagttcg accggaagat taagaagttc aacagcatct acagctttgc ccagatccag 2400 cagattgctt tcgccgagcg gaagggcaac gccaatacct gcgccgtgtg cagcgccgac 2460 aacgcccata gaatgcagca gatcaagatc accgagcccg tggaagataa caaggataag 2520 atcatcctgt ctgccaaggc ccagcggctg cctgccatcc ctaccagaat tgtggatggc 2580 gccgtgaaaa agatggccac catcctggcc aagaacatcg tggacgacaa ctggcagaac 2640 atcaaacagg tgctgagcgc caagcaccag ctgcacatcc ccatcatcac cgagagcaac 2700 gccttcgagt tcgagcccgc cctggccgat gtgaagggca agagcctgaa ggaccggcgg 2760 aagaaggccc tggaaagaat cagccccgag aacatcttca aggacaagaa caaccggatc 2820 aaagagttcg ccaagggcat cagcgcctac agcggcgcca atctgaccga cggcgatttc 2880 gacggcgcca aagaggaact ggacgccatc atccccagaa gccacaagaa gtacggcacc 2940 ctgaacgacg aggccaacct gatctgcgtg accagaggcg acaacaaaaa caagggcaac 3000 aggatcttct gcctgcggga cctggccgac aactacaagc tgaagcagtt cgagacaacc 3060 gacgacctgg aaatcgagaa gaagatcgcc gacaccatct gggacgccaa caagaaggac 3120 ttcaagttcg gcaactaccg cagcttcatc aacctgaccc cccaggaaca gaaagccttc 3180 cggcacgccc tgtttctggc cgacgagaac cctatcaagc aggccgtgat ccgggccatc 3240 aacaacagaa accggacctt cgtgaacggc acccagcggt actttgccga ggtgctggcc 3300 aacaatatct acctgcgggc caagaaagag aacctgaaca ccgacaagat cagcttcgac 3360 tacttcggca tccccaccat cggcaacggc agaggaatcg ccgagatccg gcagctgtac 3420 gagaaggtgg acagcgacat ccaggcttat gccaagggcg acaagcccca ggccagctac 3480 agccacctga tcgacgccat gctggctttc tgcattgccg ccgacgagca cagaaacgac 3540 ggcagcatcg gcctggaaat tgacaaaaac tacagcctgt accccctgga taagaacacc 3600 ggcgaggtgt tcaccaagga catcttcagc cagatcaaga tcaccgacaa cgagttcagc 3660 gacaagaaac tcgtgcgcaa gaaggccatc gagggcttca acacccaccg gcagatgacc 3720 agggacggca tctacgccga gaactacctg cccatcctga tccacaaaga actgaacgaa 3780 gtgcggaagg gctacacctg gaagaacagc gaggaaatca agattttcaa ggggaagaaa 3840 tacgatatcc agcagctgaa caacctggtg tactgcctga agttcgtgga caagcccatc 3900 agcatcgaca ttcagatcag caccctggaa gaactgcgga acatcctgac caccaacaac 3960 attgccgcta ccgccgagta ctactacatc aatctgaaaa cccagaagct gcacgagtac 4020 tatatcgaga attacaacac cgccctgggc tacaagaaat actccaaaga gatggagttc 4080 ctgcggagcc tggcctacag atccgagaga gtgaagatca agagcatcga cgacgtgaaa 4140 caggtgctgg acaaggacag caacttcatc atcggcaaga tcacactgcc ctttaagaaa 4200 gagtggcagc ggctgtaccg cgagtggcag aataccacca tcaaggacga ctacgagttc 4260 ctgaagagtt tcttcaacgt gaagtccatc acaaagctgc acaagaaagt gcgcaaggat 4320 ttcagcctgc ctatctctac caacgagggc aagttcctcg tgaagagaaa gacctgggac 4380 aacaatttca tctaccagat cctgaacgat agcgacagca gagccgacgg caccaagccc 4440 ttcatccccg ccttcgacat cagcaagaac gagatcgtgg aagccatcat cgacagcttt 4500 accagcaaga atatcttctg gctgcccaaa aacatcgagc tgcagaaagt ggacaacaag 4560 aacattttcg ccatcgacac ctccaagtgg ttcgaggtgg aaacccccag cgacctgaga 4620 gacatcggaa tcgccacaat ccagtacaag atcgacaaca acagccggcc caaagtgcgc 4680 gtgaagctgg actacgtgat cgacgatgac agcaagatca actacttcat gaaccacagc 4740 ctgctgaagt ccagataccc cgacaaagtg ctggaaatcc tgaagcagag cacaatcatc 4800 gagtttgaga gcagcgggtt caacaagacc atcaaagaaa tgctgggcat gaagctggcc 4860 gggatctaca acgagacaag caac 4884 <210> 25 <211> 2038 <212> DNA <213> Artificial Sequence <220> <223> moloney murine leukemia virus RT mutant <400> 25 accctaaata tagaagatga gtatcggcta catgagacct caaaagagcc agatgtttct 60 ctagggtcca catggctgtc tgattttcct caggcctggg cggaaaccgg gggcatggga 120 ctggcagttc gccaagctcc tctgatcata cctctgaaag caacctctac ccccgtgtcc 180 ataaaacaat accccatgtc acaagaagcc agactgggga tcaagcccca catacagaga 240 ctgttggacc agggaatact ggtaccctgc cagtccccct ggaacacgcc cctgctaccc 300 gttaagaaac cagggactaa tgattatagg cctgtccagg atctgagaga agtcaacaag 360 cgggtggaag acatccaccc caccgtgccc aacccttaca acctcttgag cgggctccca 420 ccgtcccacc agtggtacac tgtgcttgat ttaaaggatg cctttttctg cctgagactc 480 caccccacca gtcagcctct cttcgccttt gagtggagag atccagagat gggaatctca 540 ggacaattga cctggaccag actcccacag ggtttcaaaa acagtcccac cctgtttaat 600 gaggcactgc acagagacct agcagacttc cggatccagc acccagactt gatcctgcta 660 cagtacgtgg atgacttact gctggccgcc acttctgagc tagactgcca acaaggtact 720 cgggccctgt tacaaaccct agggaacctc gggtatcggg cctcggccaa gaaagcccaa 780 atttgccaga aacaggtcaa gtatctgggg tatcttctaa aagagggtca gagatggctg 840 actgaggcca gaaaagagac tgtgatgggg cagcctactc cgaagacccc tcgacaacta 900 agggagttcc tagggaaggc aggcttctgt cgcctcttca tccctgggtt tgcagaaatg 960 gcagcccccc tgtaccctct caccaaaccg gggactctgt ttaattgggg cccagaccaa 1020 caaaaggcct atcaagaaat caagcaagct cttctaactg ccccagccct ggggttgcca 1080 gatttgacta agccctttga actctttgtc gacgagaagc agggctacgc caaaggtgtc 1140 ctaacgcaaa aactgggacc ttggcgtcgg ccggtggcct acctgtccaa aaagctagac 1200 ccagtagcag ctgggtggcc cccttgccta cggatggtag cagccattgc cgtactgaca 1260 aaggatgcag gcaagctaac catgggacag ccactagtca ttctggcccc ccatgcagta 1320 gaggcactag tcaaacaacc ccccgaccgc tggctttcca acgcccggat gactcactat 1380 caggccttgc ttttggacac ggaccgggtc cagttcggac cggtggtagc cctgaacccg 1440 gctacgctgc tcccactgcc tgaggaaggg ctgcaacaca actgccttga tatcctggcc 1500 gaagcccacg gaacccgacc cgacctaacg gaccagccgc tcccagacgc cgaccacacc 1560 tggtacacgg atggaagcag tctcttacaa gagggacagc gtaaggcggg agctgcggtg 1620 accaccgaga ccgaggtaat ctgggctaaa gccctgccag ccgggacatc cgctcagcgg 1680 gctgaactga tagcactcac ccaggcccta aagatggcag aaggtaagaa gctaaatgtt 1740 tatactgata gccgttatgc ttttgctact gcccatatcc atggagaaat atacagaagg 1800 cgtgggtggc tcacatcaga aggcaaagag atcaaaaata aagacgagat cttggcccta 1860 ctaaaagccc tctttctgcc caaaagactt agcataatcc attgtccagg acatcaaaag 1920 ggacacagcg ccgaggctag aggcaaccgg atggctgacc aagcggcccg aaaggcagcc 1980 atcacagaga ctccagacac ctctaccctc ctcatagaaa attcatcacc ctctggcg 2038 <210> 26 <211> 7021 <212> DNA <213> Artificial Sequence <220> <223> FnCas9- RT fusion <400> 26 atgaacttca agatcctgcc tatcgccatc gacctgggcg tgaagaacac cggcgtgttc 60 agcgccttct accagaaggg caccagcctg gaacggctgg acaacaagaa cggcaaggtg 120 tacgagctga gcaaggacag ctacaccctg ctgatgaaca accggaccgc cagacggcac 180 cagcggagag gcatcgacag aaagcagctc gtgaagcggc tgttcaagct gatctggacc 240 gagcagctga acctggaatg ggacaaggac acccagcagg ccatcagctt tctgttcaac 300 agacggggct tcagcttcat caccgacggc tacagccccg agtacctgaa catcgtgccc 360 gaacaagtga aggccatcct gatggacatc ttcgacgact acaacggcga ggacgacctg 420 gactcctacc tgaagctggc caccgagcag gaaagcaaga tcagcgaaat ctacaacaag 480 ctgatgcaga agatcctgga gtttaagctg atgaagctgt gcaccgacat caaggacgat 540 aaggtgtcca ccaagaccct gaaagagatc accagctacg agttcgagct gctggccgac 600 tacctggcca actacagcga gagcctgaaa acccagaagt tctcctacac cgacaagcag 660 ggcaatctga aagagctgag ctactaccac cacgacaagt acaacatcca ggaatttctg 720 aagcggcacg ccaccatcaa cgacagaatc ctggacacac tgctgaccga cgatctggac 780 atctggaact tcaacttcga gaagttcgac ttcgacaaga acgaggaaaa gctgcagaac 840 caggaagata aggaccacat ccaggcccat ctgcaccact tcgtgttcgc cgtgaacaag 900 atcaagagcg agatggccag cggcggcaga cacagaagcc agtacttcca ggaaatcacc 960 aacgtgctgg acgagaacaa ccaccaggaa ggctatctga agaatttctg cgagaacctg 1020 cacaacaaaa agtacagcaa cctgtccgtg aagaatctcg tgaacctgat cggcaacctg 1080 agcaacctgg aactgaagcc tctgcgcaag tacttcaacg acaagatcca cgccaaggcc 1140 gaccactggg acgagcagaa gttcaccgag acatactgcc actggattct gggcgagtgg 1200 cgcgtgggag tgaaggacca ggacaagaag gacggcgcca agtactccta caaggacctg 1260 tgcaacgagc tgaaacagaa agtgaccaag gccggactgg tggacttcct gctggaactg 1320 gacccctgca ggaccatccc cccctacctg gataacaaca atcggaagcc ccccaagtgc 1380 cagagcctga tcctgaaccc caagttcctg gacaaccagt accccaactg gcagcagtat 1440 ctgcaggaac tgaaaaaact gcagagcatc cagaactacc tggacagctt cgagacagac 1500 ctgaaggtgc tgaagtccag caaggaccag ccctacttcg tggagtacaa gagcagcaac 1560 cagcagatcg cctccggcca gcgggactac aaggatctgg atgcccgcat cctgcagttc 1620 atcttcgata gagtgaaagc ctccgatgag ctgctgctga acgaaatcta ttttcaggcc 1680 aagaaactga agcagaaggc cagctccgaa ctggaaaagc tggaaagcag caagaaactg 1740 gacgaagtga tcgccaacag ccagctgtcc cagatcctga aaagccagca caccaacggc 1800 atcttcgagc agggcacctt cctgcacctc gtgtgcaagt actacaagca gcggcagcgg 1860 gccagagaca gcagactgta catcatgccc gagtacagat acgacaagaa gctgcacaag 1920 tataacaaca ccggccgctt cgacgatgac aaccagctgc tgacctactg caaccacaag 1980 ccccggcaga agcggtatca gctgctgaat gatctggccg gcgtgctgca ggtgtccccc 2040 aacttcctga aggacaagat cggctccgac gacgacctgt tcatctccaa gtggctggtg 2100 gaacacatcc gcggcttcaa gaaagcctgc gaggacagcc tgaagattca gaaggacaac 2160 cggggcctgc tgaaccacaa aatcaatatc gcccggaaca ccaagggcaa gtgcgagaaa 2220 gagattttta acctgatctg caagatcgag ggatccgagg ataagaaggg caattacaag 2280 cacggcctgg cctacgagct gggagtgctg ctgttcggcg agcccaatga ggccagcaag 2340 cccgagttcg accggaagat taagaagttc aacagcatct acagctttgc ccagatccag 2400 cagattgctt tcgccgagcg gaagggcaac gccaatacct gcgccgtgtg cagcgccgac 2460 aacgcccata gaatgcagca gatcaagatc accgagcccg tggaagataa caaggataag 2520 atcatcctgt ctgccaaggc ccagcggctg cctgccatcc ctaccagaat tgtggatggc 2580 gccgtgaaaa agatggccac catcctggcc aagaacatcg tggacgacaa ctggcagaac 2640 atcaaacagg tgctgagcgc caagcaccag ctgcacatcc ccatcatcac cgagagcaac 2700 gccttcgagt tcgagcccgc cctggccgat gtgaagggca agagcctgaa ggaccggcgg 2760 aagaaggccc tggaaagaat cagccccgag aacatcttca aggacaagaa caaccggatc 2820 aaagagttcg ccaagggcat cagcgcctac agcggcgcca atctgaccga cggcgatttc 2880 gacggcgcca aagaggaact ggacgccatc atccccagaa gccacaagaa gtacggcacc 2940 ctgaacgacg aggccaacct gatctgcgtg accagaggcg acaacaaaaa caagggcaac 3000 aggatcttct gcctgcggga cctggccgac aactacaagc tgaagcagtt cgagacaacc 3060 gacgacctgg aaatcgagaa gaagatcgcc gacaccatct gggacgccaa caagaaggac 3120 ttcaagttcg gcaactaccg cagcttcatc aacctgaccc cccaggaaca gaaagccttc 3180 cggcacgccc tgtttctggc cgacgagaac cctatcaagc aggccgtgat ccgggccatc 3240 aacaacagaa accggacctt cgtgaacggc acccagcggt actttgccga ggtgctggcc 3300 aacaatatct acctgcgggc caagaaagag aacctgaaca ccgacaagat cagcttcgac 3360 tacttcggca tccccaccat cggcaacggc agaggaatcg ccgagatccg gcagctgtac 3420 gagaaggtgg acagcgacat ccaggcttat gccaagggcg acaagcccca ggccagctac 3480 agccacctga tcgacgccat gctggctttc tgcattgccg ccgacgagca cagaaacgac 3540 ggcagcatcg gcctggaaat tgacaaaaac tacagcctgt accccctgga taagaacacc 3600 ggcgaggtgt tcaccaagga catcttcagc cagatcaaga tcaccgacaa cgagttcagc 3660 gacaagaaac tcgtgcgcaa gaaggccatc gagggcttca acacccaccg gcagatgacc 3720 agggacggca tctacgccga gaactacctg cccatcctga tccacaaaga actgaacgaa 3780 gtgcggaagg gctacacctg gaagaacagc gaggaaatca agattttcaa ggggaagaaa 3840 tacgatatcc agcagctgaa caacctggtg tactgcctga agttcgtgga caagcccatc 3900 agcatcgaca ttcagatcag caccctggaa gaactgcgga acatcctgac caccaacaac 3960 attgccgcta ccgccgagta ctactacatc aatctgaaaa cccagaagct gcacgagtac 4020 tatatcgaga attacaacac cgccctgggc tacaagaaat actccaaaga gatggagttc 4080 ctgcggagcc tggcctacag atccgagaga gtgaagatca agagcatcga cgacgtgaaa 4140 caggtgctgg acaaggacag caacttcatc atcggcaaga tcacactgcc ctttaagaaa 4200 gagtggcagc ggctgtaccg cgagtggcag aataccacca tcaaggacga ctacgagttc 4260 ctgaagagtt tcttcaacgt gaagtccatc acaaagctgc acaagaaagt gcgcaaggat 4320 ttcagcctgc ctatctctac caacgagggc aagttcctcg tgaagagaaa gacctgggac 4380 aacaatttca tctaccagat cctgaacgat agcgacagca gagccgacgg caccaagccc 4440 ttcatccccg ccttcgacat cagcaagaac gagatcgtgg aagccatcat cgacagcttt 4500 accagcaaga atatcttctg gctgcccaaa aacatcgagc tgcagaaagt ggacaacaag 4560 aacattttcg ccatcgacac ctccaagtgg ttcgaggtgg aaacccccag cgacctgaga 4620 gacatcggaa tcgccacaat ccagtacaag atcgacaaca acagccggcc caaagtgcgc 4680 gtgaagctgg actacgtgat cgacgatgac agcaagatca actacttcat gaaccacagc 4740 ctgctgaagt ccagataccc cgacaaagtg ctggaaatcc tgaagcagag cacaatcatc 4800 gagtttgaga gcagcgggtt caacaagacc atcaaagaaa tgctgggcat gaagctggcc 4860 gggatctaca acgagacaag caactctgga ggatctagcg gaggatcctc tggcagcgag 4920 acaccaggaa caagcgagtc agcaacacca gagagcagtg gcggcagcag cggcggcagc 4980 agcaccctaa atatagaaga tgagtatcgg ctacatgaga cctcaaaaga gccagatgtt 5040 tctctagggt ccacatggct gtctgatttt cctcaggcct gggcggaaac cgggggcatg 5100 ggactggcag ttcgccaagc tcctctgatc atacctctga aagcaacctc tacccccgtg 5160 tccataaaac aataccccat gtcacaagaa gccagactgg ggatcaagcc ccacatacag 5220 agactgttgg accagggaat actggtaccc tgccagtccc cctggaacac gcccctgcta 5280 cccgttaaga aaccagggac taatgattat aggcctgtcc aggatctgag agaagtcaac 5340 aagcgggtgg aagacatcca ccccaccgtg cccaaccctt acaacctctt gagcgggctc 5400 ccaccgtccc accagtggta cactgtgctt gatttaaagg atgccttttt ctgcctgaga 5460 ctccacccca ccagtcagcc tctcttcgcc tttgagtgga gagatccaga gatgggaatc 5520 tcaggacaat tgacctggac cagactccca cagggtttca aaaacagtcc caccctgttt 5580 aatgaggcac tgcacagaga cctagcagac ttccggatcc agcacccaga cttgatcctg 5640 ctacagtacg tggatgactt actgctggcc gccacttctg agctagactg ccaacaaggt 5700 actcgggccc tgttacaaac cctagggaac ctcgggtatc gggcctcggc caagaaagcc 5760 caaatttgcc agaaacaggt caagtatctg gggtatcttc taaaagaggg tcagagatgg 5820 ctgactgagg ccagaaaaga gactgtgatg gggcagccta ctccgaagac ccctcgacaa 5880 ctaagggagt tcctagggaa ggcaggcttc tgtcgcctct tcatccctgg gtttgcagaa 5940 atggcagccc ccctgtaccc tctcaccaaa ccggggactc tgtttaattg gggcccagac 6000 caacaaaagg cctatcaaga aatcaagcaa gctcttctaa ctgccccagc cctggggttg 6060 ccagatttga ctaagccctt tgaactcttt gtcgacgaga agcagggcta cgccaaaggt 6120 gtcctaacgc aaaaactggg accttggcgt cggccggtgg cctacctgtc caaaaagcta 6180 gacccagtag cagctgggtg gcccccttgc ctacggatgg tagcagccat tgccgtactg 6240 acaaaggatg caggcaagct aaccatggga cagccactag tcattctggc cccccatgca 6300 gtagaggcac tagtcaaaca accccccgac cgctggcttt ccaacgcccg gatgactcac 6360 tatcaggcct tgcttttgga cacggaccgg gtccagttcg gaccggtggt agccctgaac 6420 ccggctacgc tgctcccact gcctgaggaa gggctgcaac acaactgcct tgatatcctg 6480 gccgaagccc acggaacccg acccgaccta acggaccagc cgctcccaga cgccgaccac 6540 acctggtaca cggatggaag cagtctctta caagagggac agcgtaaggc gggagctgcg 6600 gtgaccaccg agaccgaggt aatctgggct aaagccctgc cagccgggac atccgctcag 6660 cgggctgaac tgatagcact cacccaggcc ctaaagatgg cagaaggtaa gaagctaaat 6720 gtttatactg atagccgtta tgcttttgct actgcccata tccatggaga aatatacaga 6780 aggcgtgggt ggctcacatc agaaggcaaa gagatcaaaa ataaagacga gatcttggcc 6840 ctactaaaag ccctctttct gcccaaaaga cttagcataa tccattgtcc aggacatcaa 6900 aagggacaca gcgccgaggc tagaggcaac cggatggctg accaagcggc ccgaaaggca 6960 gccatcacag agactccaga cacctctacc ctcctcatag aaaattcatc accctctggc 7020 g 7021 <210> 27 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> HEK3 target site <400> 27 ggcccagact gagcacgtga tgg 23 <210> 28 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> HEK3 target (PBS + RT) <400> 28 catcacgtaa gctcagtctg 20 <210> 29 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> c-Myc target site <400> 29 aggcagaggg agcgagcggg cgg 23 <210> 30 <211> 102 <212> RNA <213> Artificial Sequence <220> <223> sgRNA sequence for FnCas9 <400> 30 aggcagaggg agcgagcggg guuucaguug cugaaaaugc ucuguaauca uuuaaaagua 60 uuuugaacgg accucuguuu gacacgucug aauaacuaaa aa 102 <210> 31 <211> 102 <212> RNA <213> Artificial Sequence <220> <223> sgRNA sequence for SpCas9 <400> 31 aggcagaggg agcgagcggg guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60 cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uu 102 <210> 32 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> AAVS1 target site <400> 32 tctaaccccc acctcctgtt agg 23 <210> 33 <211> 102 <212> RNA <213> Artificial Sequence <220> <223> sgRNA sequence for FnCas9 <400> 33 ucuaaccccc accuccuguu guuucaguug cugaaaaugc ucuguaauca uuuaaaagua 60 uuuugaacgg accucuguuu gacacgucug aauaacuaaa aa 102 <210> 34 <211> 102 <212> RNA <213> Artificial Sequence <220> <223> sgRNA sequence for SpCas9 <400> 34 ucuaaccccc accuccuguu guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60 cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uu 102 <210> 35 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> EMX1 target site <400> 35 tggttgccca ccctagtcat tgg 23 <210> 36 <211> 102 <212> RNA <213> Artificial Sequence <220> <223> sgRNA sequence for FnCas9 <400> 36 ugguugccca cccuagucau guuucaguug cugaaaaugc ucuguaauca uuuaaaagua 60 uuuugaacgg accucuguuu gacacgucug aauaacuaaa aa 102 <210> 37 <211> 102 <212> RNA <213> Artificial Sequence <220> <223> sgRNA sequence for SpCas9 <400> 37 ugguugccca cccuagucau guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60 cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uu 102 <210> 38 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> HEK3 target site <400> 38 ggcccagact gagcacgtga tgg 23 <210> 39 <211> 102 <212> RNA <213> Artificial Sequence <220> <223> sgRNA sequence for FnCas9 <400> 39 ggcccagacu gagcacguga guuucaguug cugaaaaugc ucuguaauca uuuaaaagua 60 uuuugaacgg accucuguuu gacacgucug aauaacuaaa aa 102 <210> 40 <211> 102 <212> RNA <213> Artificial Sequence <220> <223> sgRNA sequence for SpCas9 <400> 40 ggcccagacu gagcacguga guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60 cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uu 102 <210> 41 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> NRAS target site <400> 41 ggtaaggggg cagggaggga ggg 23 <210> 42 <211> 102 <212> RNA <213> Artificial Sequence <220> <223> sgRNA sequence for FnCas9 <400> 42 gguaaggggg cagggaggga guuucaguug cugaaaaugc ucuguaauca uuuaaaagua 60 uuuugaacgg accucuguuu gacacgucug aauaacuaaa aa 102 <210> 43 <211> 102 <212> RNA <213> Artificial Sequence <220> <223> sgRNA sequence for SpCas9 <400> 43 gguaaggggg cagggaggga guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60 cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uu 102 <210> 44 <211> 157 <212> DNA <213> Artificial Sequence <220> <223> HEK3 FnCas9_pegRNA_10-10 <400> 44 gggcccagac tgagcacgtg agtttcagtt gctgaattat ttggtaaaca gtaccaaata 60 attaatgctc tgtaatcatt taaaagtatt ttgaacggac ctctgtttga cacgtctgaa 120 taactaaaaa catcacgtaa gctcagtctg ttttttt 157 <210> 45 <211> 159 <212> DNA <213> Artificial Sequence <220> <223> HEK3 FnCas9_pegRNA_10-12 <400> 45 gggcccagac tgagcacgtg agtttcagtt gctgaattat ttggtaaaca gtaccaaata 60 attaatgctc tgtaatcatt taaaagtatt ttgaacggac ctctgtttga cacgtctgaa 120 taactaaaaa gccatcacgt aagctcagtc tgttttttt 159 <210> 46 <211> 162 <212> DNA <213> Artificial Sequence <220> <223> HEK3 FnCas9_pegRNA_10-15 <400> 46 gggcccagac tgagcacgtg agtttcagtt gctgaattat ttggtaaaca gtaccaaata 60 attaatgctc tgtaatcatt taaaagtatt ttgaacggac ctctgtttga cacgtctgaa 120 taactaaaaa tctgccatca cgtaagctca gtctgttttt tt 162 <210> 47 <211> 158 <212> DNA <213> Artificial Sequence <220> <223> HEK3 FnCas9_pegRNA_11-10 <400> 47 gggcccagac tgagcacgtg agtttcagtt gctgaattat ttggtaaaca gtaccaaata 60 attaatgctc tgtaatcatt taaaagtatt ttgaacggac ctctgtttga cacgtctgaa 120 taactaaaaa catcacgtaa gctcagtctg gttttttt 158 <210> 48 <211> 160 <212> DNA <213> Artificial Sequence <220> <223> HEK3 FnCas9_pegRNA_11-12 <400> 48 gggcccagac tgagcacgtg agtttcagtt gctgaattat ttggtaaaca gtaccaaata 60 attaatgctc tgtaatcatt taaaagtatt ttgaacggac ctctgtttga cacgtctgaa 120 taactaaaaa gccatcacgt aagctcagtc tggttttttt 160 <210> 49 <211> 163 <212> DNA <213> Artificial Sequence <220> <223> HEK3 FnCas9_pegRNA_11-15 <400> 49 gggcccagac tgagcacgtg agtttcagtt gctgaattat ttggtaaaca gtaccaaata 60 attaatgctc tgtaatcatt taaaagtatt ttgaacggac ctctgtttga cacgtctgaa 120 taactaaaaa tctgccatca cgtaagctca gtctggtttt ttt 163 <210> 50 <211> 160 <212> DNA <213> Artificial Sequence <220> <223> HEK3 FnCas9_pegRNA_13-10 <400> 50 gggcccagac tgagcacgtg agtttcagtt gctgaattat ttggtaaaca gtaccaaata 60 attaatgctc tgtaatcatt taaaagtatt ttgaacggac ctctgtttga cacgtctgaa 120 taactaaaaa catcacgtaa gctcagtctg ggcttttttt 160 <210> 51 <211> 162 <212> DNA <213> Artificial Sequence <220> <223> HEK3 FnCas9_pegRNA_13-12 <400> 51 gggcccagac tgagcacgtg agtttcagtt gctgaattat ttggtaaaca gtaccaaata 60 attaatgctc tgtaatcatt taaaagtatt ttgaacggac ctctgtttga cacgtctgaa 120 taactaaaaa gccatcacgt aagctcagtc tgggcttttt tt 162 <210> 52 <211> 165 <212> DNA <213> Artificial Sequence <220> <223> HEK3 FnCas9_pegRNA_13-15 <400> 52 gggcccagac tgagcacgtg agtttcagtt gctgaattat ttggtaaaca gtaccaaata 60 attaatgctc tgtaatcatt taaaagtatt ttgaacggac ctctgtttga cacgtctgaa 120 taactaaaaa tctgccatca cgtaagctca gtctgggctt ttttt 165 <110> Korea Research Institute of Bioscience and Biotechnology <120> Genome replacement and insertion technology using reverse transcriptase based on Francisella novicida Cas9 module <130> P21219-KRIBB-PA <150> KR 10-2021-0008674 <151> 2021-01-21 <160> 52 <170> KoPatentIn 3.0 <210> 1 <211> 1628 <212> PRT <213> Artificial Sequence <220> <223> Francisella novicida cas 9 <400> 1 Met Asn Phe Lys Ile Leu Pro Ile Ala Ile Asp Leu Gly Val Lys Asn 1 5 10 15 Thr Gly Val Phe Ser Ala Phe Tyr Gln Lys Gly Thr Ser Leu Glu Arg 20 25 30 Leu Asp Asn Lys Asn Gly Lys Val Tyr Glu Leu Ser Lys Asp Ser Tyr 35 40 45 Thr Leu Leu Met Asn Asn Arg Thr Ala Arg Arg His Gln Arg Arg Gly 50 55 60 Ile Asp Arg Lys Gln Leu Val Lys Arg Leu Phe Lys Leu Ile Trp Thr 65 70 75 80 Glu Gln Leu Asn Leu Glu Trp Asp Lys Asp Thr Gln Gln Ala Ile Ser 85 90 95 Phe Leu Phe Asn Arg Arg Gly Phe Ser Phe Ile Thr Asp Gly Tyr Ser 100 105 110 Pro Glu Tyr Leu Asn Ile Val Pro Glu Gln Val Lys Ala Ile Leu Met 115 120 125 Asp Ile Phe Asp Asp Tyr Asn Gly Glu Asp Asp Leu Asp Ser Tyr Leu 130 135 140 Lys Leu Ala Thr Glu Gln Glu Ser Lys Ile Ser Glu Ile Tyr Asn Lys 145 150 155 160 Leu Met Gln Lys Ile Leu Glu Phe Lys Leu Met Lys Leu Cys Thr Asp 165 170 175 Ile Lys Asp Asp Lys Val Ser Thr Lys Thr Leu Lys Glu Ile Thr Ser 180 185 190 Tyr Glu Phe Glu Leu Leu Ala Asp Tyr Leu Ala Asn Tyr Ser Glu Ser 195 200 205 Leu Lys Thr Gln Lys Phe Ser Tyr Thr Asp Lys Gln Gly Asn Leu Lys 210 215 220 Glu Leu Ser Tyr Tyr His His Asp Lys Tyr Asn Ile Gln Glu Phe Leu 225 230 235 240 Lys Arg His Ala Thr Ile Asn Asp Arg Ile Leu Asp Thr Leu Leu Thr 245 250 255 Asp Asp Leu Asp Ile Trp Asn Phe Asn Phe Glu Lys Phe Asp Phe Asp 260 265 270 Lys Asn Glu Glu Lys Leu Gln Asn Gln Glu Asp Lys Asp His Ile Gln 275 280 285 Ala His Leu His His Phe Val Phe Ala Val Asn Lys Ile Lys Ser Glu 290 295 300 Met Ala Ser Gly Gly Arg His Arg Ser Gln Tyr Phe Gln Glu Ile Thr 305 310 315 320 Asn Val Leu Asp Glu Asn Asn His Gln Glu Gly Tyr Leu Lys Asn Phe 325 330 335 Cys Glu Asn Leu His Asn Lys Lys Tyr Ser Asn Leu Ser Val Lys Asn 340 345 350 Leu Val Asn Leu Ile Gly Asn Leu Ser Asn Leu Glu Leu Lys Pro Leu 355 360 365 Arg Lys Tyr Phe Asn Asp Lys Ile His Ala Lys Ala Asp His Trp Asp 370 375 380 Glu Gln Lys Phe Thr Glu Thr Tyr Cys His Trp Ile Leu Gly Glu Trp 385 390 395 400 Arg Val Gly Val Lys Asp Gln Asp Lys Lys Asp Gly Ala Lys Tyr Ser 405 410 415 Tyr Lys Asp Leu Cys Asn Glu Leu Lys Gln Lys Val Thr Lys Ala Gly 420 425 430 Leu Val Asp Phe Leu Leu Glu Leu Asp Pro Cys Arg Thr Ile Pro Pro 435 440 445 Tyr Leu Asp Asn Asn Asn Arg Lys Pro Pro Lys Cys Gln Ser Leu Ile 450 455 460 Leu Asn Pro Lys Phe Leu Asp Asn Gln Tyr Pro Asn Trp Gln Gln Tyr 465 470 475 480 Leu Gln Glu Leu Lys Lys Leu Gln Ser Ile Gln Asn Tyr Leu Asp Ser 485 490 495 Phe Glu Thr Asp Leu Lys Val Leu Lys Ser Ser Lys Asp Gln Pro Tyr 500 505 510 Phe Val Glu Tyr Lys Ser Ser Asn Gln Gln Ile Ala Ser Gly Gln Arg 515 520 525 Asp Tyr Lys Asp Leu Asp Ala Arg Ile Leu Gln Phe Ile Phe Asp Arg 530 535 540 Val Lys Ala Ser Asp Glu Leu Leu Leu Asn Glu Ile Tyr Phe Gln Ala 545 550 555 560 Lys Lys Leu Lys Gln Lys Ala Ser Ser Glu Leu Glu Lys Leu Glu Ser 565 570 575 Ser Lys Lys Leu Asp Glu Val Ile Ala Asn Ser Gln Leu Ser Gln Ile 580 585 590 Leu Lys Ser Gln His Thr Asn Gly Ile Phe Glu Gln Gly Thr Phe Leu 595 600 605 His Leu Val Cys Lys Tyr Tyr Lys Gln Arg Gln Arg Ala Arg Asp Ser 610 615 620 Arg Leu Tyr Ile Met Pro Glu Tyr Arg Tyr Asp Lys Lys Leu His Lys 625 630 635 640 Tyr Asn Asn Thr Gly Arg Phe Asp Asp Asp Asn Gln Leu Leu Thr Tyr 645 650 655 Cys Asn His Lys Pro Arg Gln Lys Arg Tyr Gln Leu Leu Asn Asp Leu 660 665 670 Ala Gly Val Leu Gln Val Ser Pro Asn Phe Leu Lys Asp Lys Ile Gly 675 680 685 Ser Asp Asp Asp Leu Phe Ile Ser Lys Trp Leu Val Glu His Ile Arg 690 695 700 Gly Phe Lys Lys Ala Cys Glu Asp Ser Leu Lys Ile Gln Lys Asp Asn 705 710 715 720 Arg Gly Leu Leu Asn His Lys Ile Asn Ile Ala Arg Asn Thr Lys Gly 725 730 735 Lys Cys Glu Lys Glu Ile Phe Asn Leu Ile Cys Lys Ile Glu Gly Ser 740 745 750 Glu Asp Lys Lys Gly Asn Tyr Lys His Gly Leu Ala Tyr Glu Leu Gly 755 760 765 Val Leu Leu Phe Gly Glu Pro Asn Glu Ala Ser Lys Pro Glu Phe Asp 770 775 780 Arg Lys Ile Lys Lys Phe Asn Ser Ile Tyr Ser Phe Ala Gln Ile Gln 785 790 795 800 Gln Ile Ala Phe Ala Glu Arg Lys Gly Asn Ala Asn Thr Cys Ala Val 805 810 815 Cys Ser Ala Asp Asn Ala His Arg Met Gln Gln Ile Lys Ile Thr Glu 820 825 830 Pro Val Glu Asp Asn Lys Asp Lys Ile Ile Leu Ser Ala Lys Ala Gln 835 840 845 Arg Leu Pro Ala Ile Pro Thr Arg Ile Val Asp Gly Ala Val Lys Lys 850 855 860 Met Ala Thr Ile Leu Ala Lys Asn Ile Val Asp Asp Asn Trp Gln Asn 865 870 875 880 Ile Lys Gln Val Leu Ser Ala Lys His Gln Leu His Ile Pro Ile Ile 885 890 895 Thr Glu Ser Asn Ala Phe Glu Phe Glu Pro Ala Leu Ala Asp Val Lys 900 905 910 Gly Lys Ser Leu Lys Asp Arg Arg Lys Lys Ala Leu Glu Arg Ile Ser 915 920 925 Pro Glu Asn Ile Phe Lys Asp Lys Asn Asn Arg Ile Lys Glu Phe Ala 930 935 940 Lys Gly Ile Ser Ala Tyr Ser Gly Ala Asn Leu Thr Asp Gly Asp Phe 945 950 955 960 Asp Gly Ala Lys Glu Glu Leu Asp His Ile Ile Pro Arg Ser His Lys 965 970 975 Lys Tyr Gly Thr Leu Asn Asp Glu Ala Asn Leu Ile Cys Val Thr Arg 980 985 990 Gly Asp Asn Lys Asn Lys Gly Asn Arg Ile Phe Cys Leu Arg Asp Leu 995 1000 1005 Ala Asp Asn Tyr Lys Leu Lys Gln Phe Glu Thr Thr Asp Asp Leu Glu 1010 1015 1020 Ile Glu Lys Lys Ile Ala Asp Thr Ile Trp Asp Ala Asn Lys Lys Asp 1025 1030 1035 1040 Phe Lys Phe Gly Asn Tyr Arg Ser Phe Ile Asn Leu Thr Pro Gln Glu 1045 1050 1055 Gln Lys Ala Phe Arg His Ala Leu Phe Leu Ala Asp Glu Asn Pro Ile 1060 1065 1070 Lys Gln Ala Val Ile Arg Ala Ile Asn Asn Arg Asn Arg Thr Phe Val 1075 1080 1085 Asn Gly Thr Gln Arg Tyr Phe Ala Glu Val Leu Ala Asn Asn Ile Tyr 1090 1095 1100 Leu Arg Ala Lys Lys Glu Asn Leu Asn Thr Asp Lys Ile Ser Phe Asp 1105 1110 1115 1120 Tyr Phe Gly Ile Pro Thr Ile Gly Asn Gly Arg Gly Ile Ala Glu Ile 1125 1130 1135 Arg Gln Leu Tyr Glu Lys Val Asp Ser Asp Ile Gln Ala Tyr Ala Lys 1140 1145 1150 Gly Asp Lys Pro Gln Ala Ser Tyr Ser His Leu Ile Asp Ala Met Leu 1155 1160 1165 Ala Phe Cys Ile Ala Ala Asp Glu His Arg Asn Asp Gly Ser Ile Gly 1170 1175 1180 Leu Glu Ile Asp Lys Asn Tyr Ser Leu Tyr Pro Leu Asp Lys Asn Thr 1185 1190 1195 1200 Gly Glu Val Phe Thr Lys Asp Ile Phe Ser Gln Ile Lys Ile Thr Asp 1205 1210 1215 Asn Glu Phe Ser Asp Lys Lys Leu Val Arg Lys Lys Ala Ile Glu Gly 1220 1225 1230 Phe Asn Thr His Arg Gln Met Thr Arg Asp Gly Ile Tyr Ala Glu Asn 1235 1240 1245 Tyr Leu Pro Ile Leu Ile His Lys Glu Leu Asn Glu Val Arg Lys Gly 1250 1255 1260 Tyr Thr Trp Lys Asn Ser Glu Glu Ile Lys Ile Phe Lys Gly Lys Lys 1265 1270 1275 1280 Tyr Asp Ile Gln Gln Leu Asn Asn Leu Val Tyr Cys Leu Lys Phe Val 1285 1290 1295 Asp Lys Pro Ile Ser Ile Asp Ile Gln Ile Ser Thr Leu Glu Glu Leu 1300 1305 1310 Arg Asn Ile Leu Thr Thr Asn Asn Ile Ala Ala Thr Ala Glu Tyr Tyr 1315 1320 1325 Tyr Ile Asn Leu Lys Thr Gln Lys Leu His Glu Tyr Tyr Ile Glu Asn 1330 1335 1340 Tyr Asn Thr Ala Leu Gly Tyr Lys Lys Tyr Ser Lys Glu Met Glu Phe 1345 1350 1355 1360 Leu Arg Ser Leu Ala Tyr Arg Ser Glu Arg Val Lys Ile Lys Ser Ile 1365 1370 1375 Asp Asp Val Lys Gln Val Leu Asp Lys Asp Ser Asn Phe Ile Ile Gly 1380 1385 1390 Lys Ile Thr Leu Pro Phe Lys Lys Glu Trp Gln Arg Leu Tyr Arg Glu 1395 1400 1405 Trp Gln Asn Thr Thr Ile Lys Asp Asp Tyr Glu Phe Leu Lys Ser Phe 1410 1415 1420 Phe Asn Val Lys Ser Ile Thr Lys Leu His Lys Lys Val Arg Lys Asp 1425 1430 1435 1440 Phe Ser Leu Pro Ile Ser Thr Asn Glu Gly Lys Phe Leu Val Lys Arg 1445 1450 1455 Lys Thr Trp Asp Asn Asn Phe Ile Tyr Gln Ile Leu Asn Asp Ser Asp 1460 1465 1470 Ser Arg Ala Asp Gly Thr Lys Pro Phe Ile Pro Ala Phe Asp Ile Ser 1475 1480 1485 Lys Asn Glu Ile Val Glu Ala Ile Ile Asp Ser Phe Thr Ser Lys Asn 1490 1495 1500 Ile Phe Trp Leu Pro Lys Asn Ile Glu Leu Gln Lys Val Asp Asn Lys 1505 1510 1515 1520 Asn Ile Phe Ala Ile Asp Thr Ser Lys Trp Phe Glu Val Glu Thr Pro 1525 1530 1535 Ser Asp Leu Arg Asp Ile Gly Ile Ala Thr Ile Gln Tyr Lys Ile Asp 1540 1545 1550 Asn Asn Ser Arg Pro Lys Val Arg Val Lys Leu Asp Tyr Val Ile Asp 1555 1560 1565 Asp Asp Ser Lys Ile Asn Tyr Phe Met Asn His Ser Leu Leu Lys Ser 1570 1575 1580 Arg Tyr Pro Asp Lys Val Leu Glu Ile Leu Lys Gln Ser Thr Ile Ile 1585 1590 1595 1600 Glu Phe Glu Ser Ser Gly Phe Asn Lys Thr Ile Lys Glu Met Leu Gly 1605 1610 1615 Met Lys Leu Ala Gly Ile Tyr Asn Glu Thr Ser Asn 1620 1625 <210> 2 <211> 1628 <212> PRT <213> Artificial Sequence <220> <223> Francisella novicida Cas9 (H969A) <400> 2 Met Asn Phe Lys Ile Leu Pro Ile Ala Ile Asp Leu Gly Val Lys Asn 1 5 10 15 Thr Gly Val Phe Ser Ala Phe Tyr Gln Lys Gly Thr Ser Leu Glu Arg 20 25 30 Leu Asp Asn Lys Asn Gly Lys Val Tyr Glu Leu Ser Lys Asp Ser Tyr 35 40 45 Thr Leu Leu Met Asn Asn Arg Thr Ala Arg Arg His Gln Arg Arg Gly 50 55 60 Ile Asp Arg Lys Gln Leu Val Lys Arg Leu Phe Lys Leu Ile Trp Thr 65 70 75 80 Glu Gln Leu Asn Leu Glu Trp Asp Lys Asp Thr Gln Gln Ala Ile Ser 85 90 95 Phe Leu Phe Asn Arg Arg Gly Phe Ser Phe Ile Thr Asp Gly Tyr Ser 100 105 110 Pro Glu Tyr Leu Asn Ile Val Pro Glu Gln Val Lys Ala Ile Leu Met 115 120 125 Asp Ile Phe Asp Asp Tyr Asn Gly Glu Asp Asp Leu Asp Ser Tyr Leu 130 135 140 Lys Leu Ala Thr Glu Gln Glu Ser Lys Ile Ser Glu Ile Tyr Asn Lys 145 150 155 160 Leu Met Gln Lys Ile Leu Glu Phe Lys Leu Met Lys Leu Cys Thr Asp 165 170 175 Ile Lys Asp Asp Lys Val Ser Thr Lys Thr Leu Lys Glu Ile Thr Ser 180 185 190 Tyr Glu Phe Glu Leu Leu Ala Asp Tyr Leu Ala Asn Tyr Ser Glu Ser 195 200 205 Leu Lys Thr Gln Lys Phe Ser Tyr Thr Asp Lys Gln Gly Asn Leu Lys 210 215 220 Glu Leu Ser Tyr Tyr His His Asp Lys Tyr Asn Ile Gln Glu Phe Leu 225 230 235 240 Lys Arg His Ala Thr Ile Asn Asp Arg Ile Leu Asp Thr Leu Leu Thr 245 250 255 Asp Asp Leu Asp Ile Trp Asn Phe Asn Phe Glu Lys Phe Asp Phe Asp 260 265 270 Lys Asn Glu Glu Lys Leu Gln Asn Gln Glu Asp Lys Asp His Ile Gln 275 280 285 Ala His Leu His His Phe Val Phe Ala Val Asn Lys Ile Lys Ser Glu 290 295 300 Met Ala Ser Gly Gly Arg His Arg Ser Gln Tyr Phe Gln Glu Ile Thr 305 310 315 320 Asn Val Leu Asp Glu Asn Asn His Gln Glu Gly Tyr Leu Lys Asn Phe 325 330 335 Cys Glu Asn Leu His Asn Lys Lys Tyr Ser Asn Leu Ser Val Lys Asn 340 345 350 Leu Val Asn Leu Ile Gly Asn Leu Ser Asn Leu Glu Leu Lys Pro Leu 355 360 365 Arg Lys Tyr Phe Asn Asp Lys Ile His Ala Lys Ala Asp His Trp Asp 370 375 380 Glu Gln Lys Phe Thr Glu Thr Tyr Cys His Trp Ile Leu Gly Glu Trp 385 390 395 400 Arg Val Gly Val Lys Asp Gln Asp Lys Lys Asp Gly Ala Lys Tyr Ser 405 410 415 Tyr Lys Asp Leu Cys Asn Glu Leu Lys Gln Lys Val Thr Lys Ala Gly 420 425 430 Leu Val Asp Phe Leu Leu Glu Leu Asp Pro Cys Arg Thr Ile Pro Pro 435 440 445 Tyr Leu Asp Asn Asn Asn Arg Lys Pro Pro Lys Cys Gln Ser Leu Ile 450 455 460 Leu Asn Pro Lys Phe Leu Asp Asn Gln Tyr Pro Asn Trp Gln Gln Tyr 465 470 475 480 Leu Gln Glu Leu Lys Lys Leu Gln Ser Ile Gln Asn Tyr Leu Asp Ser 485 490 495 Phe Glu Thr Asp Leu Lys Val Leu Lys Ser Ser Lys Asp Gln Pro Tyr 500 505 510 Phe Val Glu Tyr Lys Ser Ser Asn Gln Gln Ile Ala Ser Gly Gln Arg 515 520 525 Asp Tyr Lys Asp Leu Asp Ala Arg Ile Leu Gln Phe Ile Phe Asp Arg 530 535 540 Val Lys Ala Ser Asp Glu Leu Leu Leu Asn Glu Ile Tyr Phe Gln Ala 545 550 555 560 Lys Lys Leu Lys Gln Lys Ala Ser Ser Glu Leu Glu Lys Leu Glu Ser 565 570 575 Ser Lys Lys Leu Asp Glu Val Ile Ala Asn Ser Gln Leu Ser Gln Ile 580 585 590 Leu Lys Ser Gln His Thr Asn Gly Ile Phe Glu Gln Gly Thr Phe Leu 595 600 605 His Leu Val Cys Lys Tyr Tyr Lys Gln Arg Gln Arg Ala Arg Asp Ser 610 615 620 Arg Leu Tyr Ile Met Pro Glu Tyr Arg Tyr Asp Lys Lys Leu His Lys 625 630 635 640 Tyr Asn Asn Thr Gly Arg Phe Asp Asp Asp Asn Gln Leu Leu Thr Tyr 645 650 655 Cys Asn His Lys Pro Arg Gln Lys Arg Tyr Gln Leu Leu Asn Asp Leu 660 665 670 Ala Gly Val Leu Gln Val Ser Pro Asn Phe Leu Lys Asp Lys Ile Gly 675 680 685 Ser Asp Asp Asp Leu Phe Ile Ser Lys Trp Leu Val Glu His Ile Arg 690 695 700 Gly Phe Lys Lys Ala Cys Glu Asp Ser Leu Lys Ile Gln Lys Asp Asn 705 710 715 720 Arg Gly Leu Leu Asn His Lys Ile Asn Ile Ala Arg Asn Thr Lys Gly 725 730 735 Lys Cys Glu Lys Glu Ile Phe Asn Leu Ile Cys Lys Ile Glu Gly Ser 740 745 750 Glu Asp Lys Lys Gly Asn Tyr Lys His Gly Leu Ala Tyr Glu Leu Gly 755 760 765 Val Leu Leu Phe Gly Glu Pro Asn Glu Ala Ser Lys Pro Glu Phe Asp 770 775 780 Arg Lys Ile Lys Lys Phe Asn Ser Ile Tyr Ser Phe Ala Gln Ile Gln 785 790 795 800 Gln Ile Ala Phe Ala Glu Arg Lys Gly Asn Ala Asn Thr Cys Ala Val 805 810 815 Cys Ser Ala Asp Asn Ala His Arg Met Gln Gln Ile Lys Ile Thr Glu 820 825 830 Pro Val Glu Asp Asn Lys Asp Lys Ile Ile Leu Ser Ala Lys Ala Gln 835 840 845 Arg Leu Pro Ala Ile Pro Thr Arg Ile Val Asp Gly Ala Val Lys Lys 850 855 860 Met Ala Thr Ile Leu Ala Lys Asn Ile Val Asp Asp Asn Trp Gln Asn 865 870 875 880 Ile Lys Gln Val Leu Ser Ala Lys His Gln Leu His Ile Pro Ile Ile 885 890 895 Thr Glu Ser Asn Ala Phe Glu Phe Glu Pro Ala Leu Ala Asp Val Lys 900 905 910 Gly Lys Ser Leu Lys Asp Arg Arg Lys Lys Ala Leu Glu Arg Ile Ser 915 920 925 Pro Glu Asn Ile Phe Lys Asp Lys Asn Asn Arg Ile Lys Glu Phe Ala 930 935 940 Lys Gly Ile Ser Ala Tyr Ser Gly Ala Asn Leu Thr Asp Gly Asp Phe 945 950 955 960 Asp Gly Ala Lys Glu Glu Leu Asp Ala Ile Ile Pro Arg Ser His Lys 965 970 975 Lys Tyr Gly Thr Leu Asn Asp Glu Ala Asn Leu Ile Cys Val Thr Arg 980 985 990 Gly Asp Asn Lys Asn Lys Gly Asn Arg Ile Phe Cys Leu Arg Asp Leu 995 1000 1005 Ala Asp Asn Tyr Lys Leu Lys Gln Phe Glu Thr Thr Asp Asp Leu Glu 1010 1015 1020 Ile Glu Lys Lys Ile Ala Asp Thr Ile Trp Asp Ala Asn Lys Lys Asp 1025 1030 1035 1040 Phe Lys Phe Gly Asn Tyr Arg Ser Phe Ile Asn Leu Thr Pro Gln Glu 1045 1050 1055 Gln Lys Ala Phe Arg His Ala Leu Phe Leu Ala Asp Glu Asn Pro Ile 1060 1065 1070 Lys Gln Ala Val Ile Arg Ala Ile Asn Asn Arg Asn Arg Thr Phe Val 1075 1080 1085 Asn Gly Thr Gln Arg Tyr Phe Ala Glu Val Leu Ala Asn Asn Ile Tyr 1090 1095 1100 Leu Arg Ala Lys Lys Glu Asn Leu Asn Thr Asp Lys Ile Ser Phe Asp 1105 1110 1115 1120 Tyr Phe Gly Ile Pro Thr Ile Gly Asn Gly Arg Gly Ile Ala Glu Ile 1125 1130 1135 Arg Gln Leu Tyr Glu Lys Val Asp Ser Asp Ile Gln Ala Tyr Ala Lys 1140 1145 1150 Gly Asp Lys Pro Gln Ala Ser Tyr Ser His Leu Ile Asp Ala Met Leu 1155 1160 1165 Ala Phe Cys Ile Ala Ala Asp Glu His Arg Asn Asp Gly Ser Ile Gly 1170 1175 1180 Leu Glu Ile Asp Lys Asn Tyr Ser Leu Tyr Pro Leu Asp Lys Asn Thr 1185 1190 1195 1200 Gly Glu Val Phe Thr Lys Asp Ile Phe Ser Gln Ile Lys Ile Thr Asp 1205 1210 1215 Asn Glu Phe Ser Asp Lys Lys Leu Val Arg Lys Lys Ala Ile Glu Gly 1220 1225 1230 Phe Asn Thr His Arg Gln Met Thr Arg Asp Gly Ile Tyr Ala Glu Asn 1235 1240 1245 Tyr Leu Pro Ile Leu Ile His Lys Glu Leu Asn Glu Val Arg Lys Gly 1250 1255 1260 Tyr Thr Trp Lys Asn Ser Glu Glu Ile Lys Ile Phe Lys Gly Lys Lys 1265 1270 1275 1280 Tyr Asp Ile Gln Gln Leu Asn Asn Leu Val Tyr Cys Leu Lys Phe Val 1285 1290 1295 Asp Lys Pro Ile Ser Ile Asp Ile Gln Ile Ser Thr Leu Glu Glu Leu 1300 1305 1310 Arg Asn Ile Leu Thr Thr Asn Asn Ile Ala Ala Thr Ala Glu Tyr Tyr 1315 1320 1325 Tyr Ile Asn Leu Lys Thr Gln Lys Leu His Glu Tyr Tyr Ile Glu Asn 1330 1335 1340 Tyr Asn Thr Ala Leu Gly Tyr Lys Lys Tyr Ser Lys Glu Met Glu Phe 1345 1350 1355 1360 Leu Arg Ser Leu Ala Tyr Arg Ser Glu Arg Val Lys Ile Lys Ser Ile 1365 1370 1375 Asp Asp Val Lys Gln Val Leu Asp Lys Asp Ser Asn Phe Ile Ile Gly 1380 1385 1390 Lys Ile Thr Leu Pro Phe Lys Lys Glu Trp Gln Arg Leu Tyr Arg Glu 1395 1400 1405 Trp Gln Asn Thr Thr Ile Lys Asp Asp Tyr Glu Phe Leu Lys Ser Phe 1410 1415 1420 Phe Asn Val Lys Ser Ile Thr Lys Leu His Lys Lys Val Arg Lys Asp 1425 1430 1435 1440 Phe Ser Leu Pro Ile Ser Thr Asn Glu Gly Lys Phe Leu Val Lys Arg 1445 1450 1455 Lys Thr Trp Asp Asn Asn Phe Ile Tyr Gln Ile Leu Asn Asp Ser Asp 1460 1465 1470 Ser Arg Ala Asp Gly Thr Lys Pro Phe Ile Pro Ala Phe Asp Ile Ser 1475 1480 1485 Lys Asn Glu Ile Val Glu Ala Ile Ile Asp Ser Phe Thr Ser Lys Asn 1490 1495 1500 Ile Phe Trp Leu Pro Lys Asn Ile Glu Leu Gln Lys Val Asp Asn Lys 1505 1510 1515 1520 Asn Ile Phe Ala Ile Asp Thr Ser Lys Trp Phe Glu Val Glu Thr Pro 1525 1530 1535 Ser Asp Leu Arg Asp Ile Gly Ile Ala Thr Ile Gln Tyr Lys Ile Asp 1540 1545 1550 Asn Asn Ser Arg Pro Lys Val Arg Val Lys Leu Asp Tyr Val Ile Asp 1555 1560 1565 Asp Asp Ser Lys Ile Asn Tyr Phe Met Asn His Ser Leu Leu Lys Ser 1570 1575 1580 Arg Tyr Pro Asp Lys Val Leu Glu Ile Leu Lys Gln Ser Thr Ile Ile 1585 1590 1595 1600 Glu Phe Glu Ser Ser Gly Phe Asn Lys Thr Ile Lys Glu Met Leu Gly 1605 1610 1615 Met Lys Leu Ala Gly Ile Tyr Asn Glu Thr Ser Asn 1620 1625 <210> 3 <211> 677 <212> PRT <213> Artificial Sequence <220> <223> moloney murine leukemia virus RT <400> 3 Thr Leu Asn Ile Glu Asp Glu Tyr Arg Leu His Glu Thr Ser Lys Glu 1 5 10 15 Pro Asp Val Ser Leu Gly Ser Thr Trp Leu Ser Asp Phe Pro Gln Ala 20 25 30 Trp Ala Glu Thr Gly Gly Met Gly Leu Ala Val Arg Gln Ala Pro Leu 35 40 45 Ile Ile Pro Leu Lys Ala Thr Ser Thr Pro Val Ser Ile Lys Gln Tyr 50 55 60 Pro Met Ser Gln Glu Ala Arg Leu Gly Ile Lys Pro His Ile Gln Arg 65 70 75 80 Leu Leu Asp Gln Gly Ile Leu Val Pro Cys Gln Ser Pro Trp Asn Thr 85 90 95 Pro Leu Leu Pro Val Lys Lys Pro Gly Thr Asn Asp Tyr Arg Pro Val 100 105 110 Gln Asp Leu Arg Glu Val Asn Lys Arg Val Glu Asp Ile His Pro Thr 115 120 125 Val Pro Asn Pro Tyr Asn Leu Leu Ser Gly Leu Pro Pro Ser His Gln 130 135 140 Trp Tyr Thr Val Leu Asp Leu Lys Asp Ala Phe Phe Cys Leu Arg Leu 145 150 155 160 His Pro Thr Ser Gln Pro Leu Phe Ala Phe Glu Trp Arg Asp Pro Glu 165 170 175 Met Gly Ile Ser Gly Gln Leu Thr Trp Thr Arg Leu Pro Gln Gly Phe 180 185 190 Lys Asn Ser Pro Thr Leu Phe Asp Glu Ala Leu His Arg Asp Leu Ala 195 200 205 Asp Phe Arg Ile Gln His Pro Asp Leu Ile Leu Leu Gln Tyr Val Asp 210 215 220 Asp Leu Leu Leu Ala Ala Thr Ser Glu Leu Asp Cys Gln Gln Gly Thr 225 230 235 240 Arg Ala Leu Leu Gln Thr Leu Gly Asn Leu Gly Tyr Arg Ala Ser Ala 245 250 255 Lys Lys Ala Gln Ile Cys Gln Lys Gln Val Lys Tyr Leu Gly Tyr Leu 260 265 270 Leu Lys Glu Gly Gln Arg Trp Leu Thr Glu Ala Arg Lys Glu Thr Val 275 280 285 Met Gly Gln Pro Thr Pro Lys Thr Pro Arg Gln Leu Arg Glu Phe Leu 290 295 300 Gly Thr Ala Gly Phe Cys Arg Leu Trp Ile Pro Gly Phe Ala Glu Met 305 310 315 320 Ala Ala Pro Leu Tyr Pro Leu Thr Lys Thr Gly Thr Leu Phe Asn Trp 325 330 335 Gly Pro Asp Gln Gln Lys Ala Tyr Gln Glu Ile Lys Gln Ala Leu Leu 340 345 350 Thr Ala Pro Ala Leu Gly Leu Pro Asp Leu Thr Lys Pro Phe Glu Leu 355 360 365 Phe Val Asp Glu Lys Gln Gly Tyr Ala Lys Gly Val Leu Thr Gln Lys 370 375 380 Leu Gly Pro Trp Arg Arg Pro Val Ala Tyr Leu Ser Lys Lys Leu Asp 385 390 395 400 Pro Val Ala Ala Gly Trp Pro Pro Cys Leu Arg Met Val Ala Ala Ile 405 410 415 Ala Val Leu Thr Lys Asp Ala Gly Lys Leu Thr Met Gly Gln Pro Leu 420 425 430 Val Ile Leu Ala Pro His Ala Val Glu Ala Leu Val Lys Gln Pro Pro 435 440 445 Asp Arg Trp Leu Ser Asn Ala Arg Met Thr His Tyr Gln Ala Leu Leu 450 455 460 Leu Asp Thr Asp Arg Val Gln Phe Gly Pro Val Val Ala Leu Asn Pro 465 470 475 480 Ala Thr Leu Leu Pro Leu Pro Glu Glu Gly Leu Gln His Asn Cys Leu 485 490 495 Asp Ile Leu Ala Glu Ala His Gly Thr Arg Pro Asp Leu Thr Asp Gln 500 505 510 Pro Leu Pro Asp Ala Asp His Thr Trp Tyr Thr Asp Gly Ser Ser Leu 515 520 525 Leu Gln Glu Gly Gln Arg Lys Ala Gly Ala Ala Val Thr Thr Glu Thr 530 535 540 Glu Val Ile Trp Ala Lys Ala Leu Pro Ala Gly Thr Ser Ala Gln Arg 545 550 555 560 Ala Glu Leu Ile Ala Leu Thr Gln Ala Leu Lys Met Ala Glu Gly Lys 565 570 575 Lys Leu Asn Val Tyr Thr Asp Ser Arg Tyr Ala Phe Ala Thr Ala His 580 585 590 Ile His Gly Glu Ile Tyr Arg Arg Arg Gly Leu Leu Thr Ser Glu Gly 595 600 605 Lys Glu Ile Lys Asn Lys Asp Glu Ile Leu Ala Leu Leu Lys Ala Leu 610 615 620 Phe Leu Pro Lys Arg Leu Ser Ile Ile His Cys Pro Gly His Gln Lys 625 630 635 640 Gly His Ser Ala Glu Ala Arg Gly Asn Arg Met Ala Asp Gln Ala Ala 645 650 655 Arg Lys Ala Ala Ile Thr Glu Thr Pro Asp Thr Ser Thr Leu Leu Ile 660 665 670 Glu Asn Ser Ser Pro 675 <210> 4 <211> 560 <212> PRT <213> Artificial Sequence <220> <223> moloney murine leukemia virus RT <220> <221> MISC_FEATURE <222> (229) <223> Xaa can be any naturally occurring amino acid <400> 4 Ala Phe Pro Leu Glu Arg Pro Asp Trp Asp Tyr Thr Thr Gln Ala Gly 1 5 10 15 Arg Asn His Leu Val His Tyr Arg Gln Leu Leu Leu Ala Gly Leu Gln 20 25 30 Asn Ala Gly Arg Ser Pro Thr Asn Leu Ala Lys Val Lys Gly Ile Thr 35 40 45 Gln Gly Pro Asn Glu Ser Pro Ser Ala Phe Leu Glu Arg Leu Lys Glu 50 55 60 Ala Tyr Arg Arg Tyr Thr Pro Tyr Asp Pro Glu Asp Pro Gly Gln Glu 65 70 75 80 Thr Asn Val Ser Met Ser Phe Ile Trp Gln Ser Ala Pro Asp Ile Gly 85 90 95 Arg Lys Leu Gly Arg Leu Glu Asp Leu Lys Ser Lys Thr Leu Gly Asp 100 105 110 Leu Val Arg Glu Ala Glu Lys Ile Phe Asn Lys Arg Glu Thr Pro Glu 115 120 125 Glu Arg Glu Glu Arg Ile Arg Arg Glu Thr Glu Glu Lys Glu Glu Arg 130 135 140 Arg Arg Thr Val Asp Glu Gln Lys Glu Lys Glu Arg Asp Arg Arg Arg 145 150 155 160 His Arg Glu Met Ser Lys Leu Leu Ala Thr Val Val Ile Gly Gln Glu 165 170 175 Gln Asp Arg Gln Glu Gly Glu Arg Lys Arg Pro Gln Leu Asp Lys Asp 180 185 190 Gln Cys Ala Tyr Cys Lys Glu Lys Gly His Trp Ala Lys Asp Cys Pro 195 200 205 Lys Lys Pro Arg Gly Pro Arg Gly Pro Arg Pro Gln Thr Ser Leu Leu 210 215 220 Thr Leu Gly Asp Xaa Gly Gly Gln Gly Gln Asp Pro Pro Glu Pro 225 230 235 240 Arg Ile Thr Leu Lys Val Gly Gly Gln Pro Val Thr Phe Leu Val Asp 245 250 255 Thr Gly Ala Gln His Ser Val Leu Thr Gln Asn Pro Gly Pro Leu Ser 260 265 270 Asp Lys Ser Ala Trp Val Gln Gly Ala Thr Gly Gly Lys Arg Tyr Arg 275 280 285 Trp Thr Thr Asp Arg Lys Val His Leu Ala Thr Gly Lys Val Thr His 290 295 300 Ser Phe Leu His Val Pro Asp Cys Pro Tyr Pro Leu Leu Gly Arg Asp 305 310 315 320 Leu Leu Thr Lys Leu Lys Ala Gln Ile His Phe Glu Gly Ser Gly Ala 325 330 335 Gln Val Val Gly Pro Met Gly Gln Pro Leu Gln Val Leu Thr Leu Asn 340 345 350 Ile Glu Asp Glu Tyr Arg Leu His Glu Thr Ser Lys Glu Pro Asp Val 355 360 365 Ser Leu Gly Phe Thr Trp Leu Ser Asp Phe Pro Gln Ala Trp Ala Glu 370 375 380 Ser Gly Gly Met Gly Leu Ala Val Arg Gln Ala Pro Leu Ile Ile Pro 385 390 395 400 Leu Lys Ala Thr Ser Thr Pro Val Ser Ile Lys Gln Tyr Pro Met Ser 405 410 415 Gln Glu Ala Arg Leu Gly Ile Lys Pro His Ile Gln Arg Leu Leu Asp 420 425 430 Gln Gly Ile Leu Val Pro Cys Gln Ser Pro Trp Asn Thr Pro Leu Leu 435 440 445 Pro Val Lys Lys Pro Gly Thr Asn Asp Tyr Arg Pro Val Gln Asp Leu 450 455 460 Arg Glu Val Asn Lys Arg Val Glu Asp Ile His Pro Thr Val Pro Asn 465 470 475 480 Pro Tyr Asn Leu Leu Ser Gly Leu Pro Ser His Gln Trp Tyr Thr 485 490 495 Val Leu Asp Leu Lys Asp Ala Phe Phe Cys Leu Arg Leu His Pro Thr 500 505 510 Ser Gln Pro Leu Phe Ala Phe Glu Trp Arg Asp Pro Glu Met Gly Ile 515 520 525 Ser Gly Gln Leu Thr Trp Thr Arg Leu Pro Gln Gly Phe Lys Asn Ser 530 535 540 Pro Thr Leu Phe Asp Glu Ala Leu His Arg Asp Leu Ala Asp Phe Arg 545 550 555 560 <210> 5 <211> 669 <212> PRT <213> Artificial Sequence <220> <223> Feline leukemia virus RT <400> 5 Thr Leu Gln Leu Glu Glu Glu Tyr Arg Leu Phe Glu Pro Glu Ser Thr 1 5 10 15 Gln Lys Gln Glu Met Asp Ile Trp Leu Lys Asn Phe Pro Gln Ala Trp 20 25 30 Ala Glu Thr Gly Gly Met Gly Thr Ala His Cys Gln Ala Pro Val Leu 35 40 45 Ile Gln Leu Lys Ala Thr Ala Thr Pro Ile Ser Ile Arg Gln Tyr Pro 50 55 60 Met Pro His Glu Ala Tyr Gln Gly Ile Lys Pro His Ile Arg Arg Met 65 70 75 80 Leu Asp Gln Gly Ile Leu Lys Pro Cys Gln Ser Pro Trp Asn Thr Pro 85 90 95 Leu Leu Pro Val Lys Lys Pro Gly Thr Glu Asp Tyr Arg Pro Val Gln 100 105 110 Asp Leu Arg Glu Val Asn Lys Arg Val Glu Asp Ile His Pro Thr Val 115 120 125 Pro Asn Pro Tyr Asn Leu Leu Ser Thr Leu Pro Ser His Pro Trp 130 135 140 Tyr Thr Val Leu Asp Leu Lys Asp Ala Phe Phe Cys Leu Arg Leu His 145 150 155 160 Ser Glu Ser Gln Leu Leu Phe Ala Phe Glu Trp Arg Asp Pro Glu Ile 165 170 175 Gly Leu Ser Gly Gln Leu Thr Trp Thr Arg Leu Pro Gln Gly Phe Lys 180 185 190 Asn Ser Pro Thr Leu Phe Asp Glu Ala Leu His Ser Asp Leu Ala Asp 195 200 205 Phe Arg Val Arg Tyr Pro Ala Leu Val Leu Leu Gln Tyr Val Asp Asp 210 215 220 Leu Leu Leu Ala Ala Ala Thr Arg Thr Glu Cys Leu Glu Gly Thr Lys 225 230 235 240 Ala Leu Leu Glu Thr Leu Gly Asn Lys Gly Tyr Arg Ala Ser Ala Lys 245 250 255 Lys Ala Gln Ile Cys Leu Gln Glu Val Thr Tyr Leu Gly Tyr Ser Leu 260 265 270 Lys Asp Gly Gln Arg Trp Leu Thr Lys Ala Arg Lys Glu Ala Ile Leu 275 280 285 Ser Ile Pro Val Pro Lys Asn Ser Arg Gln Val Arg Glu Phe Leu Gly 290 295 300 Thr Ala Gly Tyr Cys Arg Leu Trp Ile Pro Gly Phe Ala Glu Leu Ala 305 310 315 320 Ala Pro Leu Tyr Pro Leu Thr Arg Pro Gly Thr Leu Phe Gln Trp Gly 325 330 335 Thr Glu Gln Gln Leu Ala Phe Glu Asp Ile Lys Lys Ala Leu Leu Ser 340 345 350 Ser Pro Ala Leu Gly Leu Pro Asp Ile Thr Lys Pro Phe Glu Leu Phe 355 360 365 Ile Asp Glu Asn Ser Gly Phe Ala Lys Gly Val Leu Val Gln Lys Leu 370 375 380 Gly Pro Trp Lys Arg Pro Val Ala Tyr Leu Ser Lys Lys Leu Asp Thr 385 390 395 400 Val Ala Ser Gly Trp Pro Pro Cys Leu Arg Met Val Ala Ala Ile Ala 405 410 415 Ile Leu Val Lys Asp Ala Gly Lys Leu Thr Leu Gly Gln Pro Leu Thr 420 425 430 Ile Leu Thr Ser His Pro Val Glu Ala Leu Val Arg Gln Pro Pro Asn 435 440 445 Lys Trp Leu Ser Asn Ala Arg Met Thr His Tyr Gln Ala Met Leu Leu 450 455 460 Asp Ala Glu Arg Val His Phe Gly Pro Thr Val Ser Leu Asn Pro Ala 465 470 475 480 Thr Leu Leu Pro Leu Pro Ser Gly Gly Asn His His Asp Cys Leu Gln 485 490 495 Ile Leu Ala Glu Thr His Gly Thr Arg Pro Asp Leu Thr Asp Gln Pro 500 505 510 Leu Pro Asp Ala Asp Leu Thr Trp Tyr Thr Asp Gly Ser Ser Phe Ile 515 520 525 Arg Asn Gly Glu Arg Glu Ala Gly Ala Ala Val Thr Thr Glu Ser Glu 530 535 540 Val Ile Trp Ala Ala Pro Leu Pro Pro Gly Thr Ser Ala Gln Arg Ala 545 550 555 560 Glu Leu Ile Ala Leu Thr Gln Ala Leu Lys Met Ala Glu Gly Lys Lys 565 570 575 Leu Thr Val Tyr Thr Asp Ser Arg Tyr Ala Phe Ala Thr Thr His Val 580 585 590 His Gly Glu Ile Tyr Arg Arg Arg Gly Leu Leu Thr Ser Glu Gly Lys 595 600 605 Glu Ile Lys Asn Lys Asn Glu Ile Leu Ala Leu Leu Glu Ala Leu Phe 610 615 620 Leu Pro Lys Arg Leu Ser Ile Ile His Cys Pro Gly His Gln Lys Gly 625 630 635 640 Asp Ser Pro Gln Ala Lys Gly Asn Arg Leu Ala Asp Asp Thr Ala Lys 645 650 655 Lys Ala Ala Thr Glu Thr His Ser Ser Leu Thr Val Leu 660 665 <210> 6 <211> 560 <212> PRT <213> Artificial Sequence <220> <223> artificial sequence (RT) <220> <221> MISC_FEATURE <222> (280) <223> Xaa can be any naturally occurring amino acid <400> 6 Pro Ile Ser Pro Ile Glu Thr Val Pro Val Lys Leu Lys Pro Gly Met 1 5 10 15 Asp Gly Pro Lys Val Lys Gln Trp Pro Leu Thr Glu Glu Lys Ile Lys 20 25 30 Ala Leu Val Glu Ile Cys Thr Glu Met Glu Lys Glu Gly Lys Ile Ser 35 40 45 Lys Ile Gly Pro Glu Asn Pro Tyr Asn Thr Pro Val Phe Ala Ile Lys 50 55 60 Lys Lys Asp Ser Thr Lys Trp Arg Lys Leu Val Asp Phe Arg Glu Leu 65 70 75 80 Asn Lys Arg Thr Gln Asp Phe Trp Glu Val Gln Leu Gly Ile Pro His 85 90 95 Pro Ala Gly Leu Lys Lys Lys Lys Ser Val Thr Val Leu Asp Val Gly 100 105 110 Asp Ala Tyr Phe Ser Val Pro Leu Asp Glu Asp Phe Arg Lys Tyr Thr 115 120 125 Ala Phe Thr Ile Pro Ser Ile Asn Asn Glu Thr Pro Gly Ile Arg Tyr 130 135 140 Gln Tyr Asn Val Leu Pro Gln Gly Trp Lys Gly Ser Pro Ala Ile Phe 145 150 155 160 Gln Ser Ser Met Thr Lys Ile Leu Glu Pro Phe Arg Lys Gln Asn Pro 165 170 175 Asp Ile Val Ile Tyr Gln Tyr Met Asp Asp Leu Tyr Val Gly Ser Asp 180 185 190 Leu Glu Ile Gly Gln His Arg Thr Lys Ile Glu Glu Leu Arg Gln His 195 200 205 Leu Leu Arg Trp Gly Leu Thr Thr Pro Asp Lys Lys His Gln Lys Glu 210 215 220 Pro Pro Phe Leu Trp Met Gly Tyr Glu Leu His Pro Asp Lys Trp Thr 225 230 235 240 Val Gln Pro Ile Val Leu Pro Glu Lys Asp Ser Trp Thr Val Asn Asp 245 250 255 Ile Gln Lys Leu Val Gly Lys Leu Asn Trp Ala Ser Gln Ile Tyr Pro 260 265 270 Gly Ile Lys Val Arg Gln Leu Xaa Lys Leu Leu Arg Gly Thr Lys Ala 275 280 285 Leu Thr Glu Val Ile Pro Leu Thr Glu Glu Ala Glu Leu Glu Leu Ala 290 295 300 Glu Asn Arg Glu Ile Leu Lys Glu Pro Val His Gly Val Tyr Tyr Asp 305 310 315 320 Pro Ser Lys Asp Leu Ile Ala Glu Ile Gln Lys Gln Gly Gln Gly Gln 325 330 335 Trp Thr Tyr Gln Ile Tyr Gln Glu Pro Phe Lys Asn Leu Lys Thr Gly 340 345 350 Lys Tyr Ala Arg Met Arg Gly Ala His Thr Asn Asp Val Lys Gln Leu 355 360 365 Thr Glu Ala Val Gln Lys Ile Thr Thr Glu Ser Ile Val Ile Trp Gly 370 375 380 Lys Thr Pro Lys Phe Lys Leu Pro Ile Gln Lys Glu Thr Trp Glu Thr 385 390 395 400 Trp Trp Thr Glu Tyr Trp Gln Ala Thr Trp Ile Pro Glu Trp Glu Phe 405 410 415 Val Asn Thr Pro Pro Leu Val Lys Leu Trp Tyr Gln Leu Glu Lys Glu 420 425 430 Pro Ile Val Gly Ala Glu Thr Phe Tyr Val Asp Gly Ala Ala Asn Arg 435 440 445 Glu Thr Lys Leu Gly Lys Ala Gly Tyr Val Thr Asn Arg Gly Arg Gln 450 455 460 Lys Val Val Thr Leu Thr Asp Thr Thr Asn Gln Lys Thr Glu Leu Gln 465 470 475 480 Ala Ile Tyr Leu Ala Leu Gln Asp Ser Gly Leu Glu Val Asn Ile Val 485 490 495 Thr Asp Ser Gln Tyr Ala Leu Gly Ile Ile Gln Ala Gln Pro Asp Gln 500 505 510 Ser Glu Ser Glu Leu Val Asn Gln Ile Ile Glu Gln Leu Ile Lys Lys 515 520 525 Glu Lys Val Tyr Leu Ala Trp Val Pro Ala His Lys Gly Ile Gly Gly 530 535 540 Asn Glu Gln Val Asp Lys Leu Val Ser Ala Gly Ile Arg Lys Val Leu 545 550 555 560 <210> 7 <211> 440 <212> PRT <213> Artificial Sequence <220> <223> artificial sequence (RT) <400> 7 Pro Ile Ser Pro Ile Glu Thr Val Pro Val Lys Leu Lys Pro Gly Met 1 5 10 15 Asp Gly Pro Lys Val Lys Gln Trp Pro Leu Thr Glu Glu Lys Ile Lys 20 25 30 Ala Leu Val Glu Ile Cys Thr Glu Met Glu Lys Glu Gly Lys Ile Ser 35 40 45 Lys Ile Gly Pro Glu Asn Pro Tyr Asn Thr Pro Val Phe Ala Ile Lys 50 55 60 Lys Lys Asp Ser Thr Lys Trp Arg Lys Leu Val Asp Phe Arg Glu Leu 65 70 75 80 Asn Lys Arg Thr Gln Asp Phe Trp Glu Val Gln Leu Gly Ile Pro His 85 90 95 Pro Ala Gly Leu Lys Lys Lys Lys Ser Val Thr Val Leu Asp Val Gly 100 105 110 Asp Ala Tyr Phe Ser Val Pro Leu Asp Glu Asp Phe Arg Lys Tyr Thr 115 120 125 Ala Phe Thr Ile Pro Ser Ile Asn Asn Glu Thr Pro Gly Ile Arg Tyr 130 135 140 Gln Tyr Asn Val Leu Pro Gln Gly Trp Lys Gly Ser Pro Ala Ile Phe 145 150 155 160 Gln Ser Ser Met Thr Lys Ile Leu Glu Pro Phe Arg Lys Gln Asn Pro 165 170 175 Asp Ile Val Ile Tyr Gln Tyr Met Asp Asp Leu Tyr Val Gly Ser Asp 180 185 190 Leu Glu Ile Gly Gln His Arg Thr Lys Ile Glu Glu Leu Arg Gln His 195 200 205 Leu Leu Arg Trp Gly Leu Thr Thr Pro Asp Lys Lys His Gln Lys Glu 210 215 220 Pro Pro Phe Leu Trp Met Gly Tyr Glu Leu His Pro Asp Lys Trp Thr 225 230 235 240 Val Gln Pro Ile Val Leu Pro Glu Lys Asp Ser Trp Thr Val Asn Asp 245 250 255 Ile Gln Lys Leu Val Gly Lys Leu Asn Trp Ala Ser Gln Ile Tyr Pro 260 265 270 Gly Ile Lys Val Arg Gln Leu Cys Lys Leu Leu Arg Gly Thr Lys Ala 275 280 285 Leu Thr Glu Val Ile Pro Leu Thr Glu Glu Ala Glu Leu Glu Leu Ala 290 295 300 Glu Asn Arg Glu Ile Leu Lys Glu Pro Val His Gly Val Tyr Tyr Asp 305 310 315 320 Pro Ser Lys Asp Leu Ile Ala Glu Ile Gln Lys Gln Gly Gln Gly Gln 325 330 335 Trp Thr Tyr Gln Ile Tyr Gln Glu Pro Phe Lys Asn Leu Lys Thr Gly 340 345 350 Lys Tyr Ala Arg Met Arg Gly Ala His Thr Asn Asp Val Lys Gln Leu 355 360 365 Thr Glu Ala Val Gln Lys Ile Thr Thr Glu Ser Ile Val Ile Trp Gly 370 375 380 Lys Thr Pro Lys Phe Lys Leu Pro Ile Gln Lys Glu Thr Trp Glu Thr 385 390 395 400 Trp Trp Thr Glu Tyr Trp Gln Ala Thr Trp Ile Pro Glu Trp Glu Phe 405 410 415 Val Asn Thr Pro Pro Leu Val Lys Leu Trp Tyr Gln Leu Glu Lys Glu 420 425 430 Pro Ile Val Gly Ala Glu Thr Phe 435 440 <210> 8 <211> 858 <212> PRT <213> Artificial Sequence <220> <223> rous sarcoma virus RT <400> 8 Thr Val Ala Leu His Leu Ala Ile Pro Leu Lys Trp Lys Pro Asn His 1 5 10 15 Thr Pro Val Trp Ile Asp Gln Trp Pro Leu Pro Glu Gly Lys Leu Val 20 25 30 Ala Leu Thr Gln Leu Val Glu Lys Glu Leu Gln Leu Gly His Ile Glu 35 40 45 Pro Ser Leu Ser Cys Trp Asn Thr Pro Val Phe Val Ile Arg Lys Ala 50 55 60 Ser Gly Ser Tyr Arg Leu Leu His Asp Leu Arg Ala Val Asn Ala Lys 65 70 75 80 Leu Val Pro Phe Gly Ala Val Gln Gln Gly Ala Pro Val Leu Ser Ala 85 90 95 Leu Pro Arg Gly Trp Pro Leu Met Val Leu Asp Leu Lys Asp Cys Phe 100 105 110 Phe Ser Ile Pro Leu Ala Glu Gln Asp Arg Glu Ala Phe Ala Phe Thr 115 120 125 Leu Pro Ser Val Asn Asn Gln Ala Pro Ala Arg Arg Phe Gln Trp Lys 130 135 140 Val Leu Pro Gln Gly Met Thr Cys Ser Pro Thr Ile Cys Gln Leu Ile 145 150 155 160 Val Gly Gln Ile Leu Glu Pro Leu Arg Leu Lys His Pro Ser Leu Arg 165 170 175 Met Leu His Tyr Met Asp Asp Leu Leu Leu Ala Ala Ser Ser His Asp 180 185 190 Gly Leu Glu Ala Ala Gly Glu Glu Val Ile Ser Thr Leu Glu Arg Ala 195 200 205 Gly Phe Thr Ile Ser Pro Asp Lys Val Gln Lys Glu Pro Gly Val Gln 210 215 220 Tyr Leu Gly Tyr Lys Leu Gly Ser Thr Tyr Ala Ala Pro Val Gly Leu 225 230 235 240 Val Ala Glu Pro Arg Ile Ala Thr Leu Trp Asp Val Gln Lys Leu Val 245 250 255 Gly Ser Leu Gln Trp Leu Arg Pro Ala Leu Gly Ile Pro Pro Arg Leu 260 265 270 Arg Gly Pro Phe Tyr Glu Gln Leu Arg Gly Ser Asp Pro Asn Glu Ala 275 280 285 Arg Glu Trp Asn Leu Asp Met Lys Met Ala Trp Arg Glu Ile Val Gln 290 295 300 Leu Ser Thr Thr Ala Ala Leu Glu Arg Trp Asp Pro Ala Leu Pro Leu 305 310 315 320 Glu Gly Ala Val Ala Arg Cys Glu Gin Gly Ala Ile Gly Val Leu Gly 325 330 335 Gln Gly Leu Ser Thr His Pro Arg Pro Cys Leu Trp Leu Phe Ser Thr 340 345 350 Gln Pro Thr Lys Ala Phe Thr Ala Trp Leu Glu Val Leu Thr Leu Leu 355 360 365 Ile Thr Lys Leu Arg Ala Ser Ala Val Arg Thr Phe Gly Lys Glu Val 370 375 380 Asp Ile Leu Leu Leu Pro Ala Cys Phe Arg Asp Glu Leu Pro Leu Pro 385 390 395 400 Glu Gly Ile Leu Leu Ala Leu Arg Gly Phe Ala Gly Lys Ile Arg Ser 405 410 415 Ser Asp Thr Pro Ser Ile Phe Asp Ile Ala Arg Pro Leu His Val Ser 420 425 430 Leu Lys Val Arg Val Thr Asp His Pro Val Pro Gly Pro Thr Val Phe 435 440 445 Thr Asp Ala Ser Ser Ser Thr His Lys Gly Val Val Val Trp Arg Glu 450 455 460 Gly Pro Arg Trp Glu Ile Lys Glu Ile Ala Asp Leu Gly Ala Ser Val 465 470 475 480 Gln Gln Leu Glu Ala Arg Ala Val Ala Met Ala Leu Leu Leu Trp Pro 485 490 495 Thr Thr Pro Thr Asn Val Val Thr Asp Ser Ala Phe Val Ala Lys Met 500 505 510 Leu Leu Lys Met Gly Gin Glu Gly Val Pro Ser Thr Ala Ala Ala Phe 515 520 525 Ile Leu Glu Asp Ala Leu Ser Gln Arg Ser Ala Met Ala Ala Val Leu 530 535 540 His Val Arg Ser His Ser Glu Val Pro Gly Phe Phe Thr Glu Gly Asn 545 550 555 560 Asp Val Ala Asp Ser Gln Ala Thr Phe Gln Ala Tyr Pro Leu Arg Glu 565 570 575 Ala Lys Asp Leu His Thr Ala Leu His Ile Gly Pro Arg Ala Leu Ser 580 585 590 Lys Ala Cys Asn Ile Ser Met Gln Gln Ala Arg Glu Val Val Gln Thr 595 600 605 Cys Pro His Cys Asn Ser Ala Pro Ala Leu Glu Ala Gly Val Asn Pro 610 615 620 Arg Gly Leu Gly Pro Leu Gln Ile Trp Gln Thr Asp Phe Thr Leu Glu 625 630 635 640 Pro Arg Met Ala Pro Arg Ser Trp Leu Ala Val Thr Val Asp Thr Ala 645 650 655 Ser Ser Ala Ile Val Val Thr Gln His Gly Arg Val Thr Ser Val Ala 660 665 670 Ala Gln His His Trp Ala Thr Val Ile Ala Val Leu Gly Arg Pro Lys 675 680 685 Ala Ile Lys Thr Asp Asn Gly Ser Cys Phe Thr Ser Lys Ser Thr Arg 690 695 700 Glu Trp Leu Ala Arg Trp Gly Ile Ala His Thr Thr Gly Ile Pro Gly 705 710 715 720 Asn Ser Gln Gly Gln Ala Met Val Glu Arg Ala Asn Arg Leu Leu Lys 725 730 735 Asp Lys Ile Arg Val Leu Ala Glu Gly Asp Gly Phe Met Lys Arg Ile 740 745 750 Pro Thr Ser Lys Gln Gly Glu Leu Leu Ala Lys Ala Met Tyr Ala Leu 755 760 765 Asn His Phe Glu Arg Gly Glu Asn Thr Lys Thr Pro Ile Gln Lys His 770 775 780 Trp Arg Pro Thr Val Leu Thr Glu Gly Pro Pro Val Lys Ile Arg Ile 785 790 795 800 Glu Thr Gly Glu Trp Glu Lys Gly Trp Asn Val Leu Val Trp Gly Arg 805 810 815 Gly Tyr Ala Ala Val Lys Asn Arg Asp Thr Asp Lys Val Ile Trp Val 820 825 830 Pro Ser Arg Lys Val Lys Pro Asp Ile Ala Gln Lys Asp Glu Val Thr 835 840 845 Lys Lys Asp Glu Ala Ser Pro Leu Phe Ala 850 855 <210> 9 <211> 675 <212> PRT <213> Artificial Sequence <220> <223> cauliflower mosaic virus RT <400> 9 Met Met Asp His Leu Leu Gln Lys Thr Gln Ile Gln Asn Gln Thr Glu 1 5 10 15 Gln Val Met Asn Ile Thr Asn Pro Asn Ser Ile Tyr Ile Lys Gly Arg 20 25 30 Leu Tyr Phe Lys Gly Tyr Lys Lys Ile Glu Leu His Cys Phe Val Asp 35 40 45 Thr Gly Ala Ser Leu Cys Ile Ala Ser Lys Phe Val Ile Pro Glu Glu 50 55 60 His Trp Ile Asn Ala Glu Arg Pro Ile Met Val Lys Ile Ala Asp Gly 65 70 75 80 Ser Ser Ile Thr Ile Asn Lys Val Cys Arg Asp Ile Asp Leu Ile Ile 85 90 95 Ala Gly Glu Ile Phe His Ile Pro Thr Val Tyr Gln Gln Glu Ser Gly 100 105 110 Ile Asp Phe Ile Ile Gly Asn Asn Phe Cys Gln Leu Tyr Glu Pro Phe 115 120 125 Ile Gln Phe Thr Asp Arg Val Ile Phe Thr Lys Asp Arg Thr Tyr Pro 130 135 140 Val His Ile Ala Lys Leu Thr Arg Ala Val Arg Val Gly Thr Glu Gly 145 150 155 160 Phe Leu Glu Ser Met Lys Lys Arg Ser Lys Thr Gln Gln Pro Glu Pro 165 170 175 Val Asn Ile Ser Thr Asn Lys Ile Ala Ile Leu Ser Glu Gly Arg Arg 180 185 190 Leu Ser Glu Glu Lys Leu Phe Ile Thr Gln Gln Arg Met Gln Lys Ile 195 200 205 Glu Glu Leu Leu Glu Lys Val Cys Ser Glu Asn Pro Leu Asp Pro Asn 210 215 220 Lys Thr Lys Gln Trp Met Lys Ala Ser Ile Lys Leu Ser Asp Pro Ser 225 230 235 240 Lys Ala Ile Lys Val Lys Pro Met Lys Tyr Ser Pro Met Asp Arg Glu 245 250 255 Glu Phe Asp Lys Gln Ile Lys Glu Leu Leu Asp Leu Lys Val Ile Lys 260 265 270 Pro Ser Lys Ser Pro His Met Ala Pro Ala Phe Leu Val Asn Asn Glu 275 280 285 Ala Glu Lys Arg Arg Gly Lys Lys Arg Met Val Val Asn Tyr Lys Ala 290 295 300 Met Asn Lys Ala Thr Val Gly Asp Ala Tyr Asn Leu Pro Asn Lys Asp 305 310 315 320 Glu Leu Leu Thr Leu Ile Arg Gly Lys Lys Ile Phe Ser Ser Phe Asp 325 330 335 Cys Lys Ser Gly Phe Trp Gln Val Leu Leu Asp Gln Asp Ser Arg Pro 340 345 350 Leu Thr Ala Phe Thr Cys Pro Gin Gly His Tyr Glu Trp Asn Val Val 355 360 365 Pro Phe Gly Leu Lys Gln Ala Pro Ser Ile Phe Gln Arg His Met Asp 370 375 380 Glu Ala Phe Arg Val Phe Arg Lys Phe Cys Cys Val Tyr Val Asp Asp 385 390 395 400 Ile Leu Val Phe Ser Asn Asn Glu Glu Asp His Leu Leu His Val Ala 405 410 415 Met Ile Leu Gln Lys Cys Asn Gln His Gly Ile Ile Leu Ser Lys Lys 420 425 430 Lys Ala Gln Leu Phe Lys Lys Lys Ile Asn Phe Leu Gly Leu Glu Ile 435 440 445 Asp Glu Gly Thr His Lys Pro Gin Gly His Ile Leu Glu His Ile Asn 450 455 460 Lys Phe Pro Asp Thr Leu Glu Asp Lys Lys Gln Leu Gln Arg Phe Leu 465 470 475 480 Gly Ile Leu Thr Tyr Ala Ser Asp Tyr Ile Pro Lys Leu Ala Gln Ile 485 490 495 Arg Lys Pro Leu Gln Ala Lys Leu Lys Glu Asn Val Pro Trp Lys Trp 500 505 510 Thr Lys Glu Asp Thr Leu Tyr Met Gln Lys Val Lys Lys Asn Leu Gln 515 520 525 Gly Phe Pro Pro Leu His His Pro Leu Pro Glu Glu Lys Leu Ile Ile 530 535 540 Glu Thr Asp Ala Ser Asp Asp Tyr Trp Gly Gly Met Leu Lys Ala Ile 545 550 555 560 Lys Ile Asn Glu Gly Thr Asn Thr Glu Leu Ile Cys Arg Tyr Ala Ser 565 570 575 Gly Ser Phe Lys Ala Ala Glu Lys Asn Tyr His Ser Asn Asp Lys Glu 580 585 590 Thr Leu Ala Val Ile Asn Thr Ile Lys Lys Phe Ser Ile Tyr Leu Thr 595 600 605 Pro Val His Phe Leu Ile Arg Thr Asp Asn Thr His Phe Lys Ser Phe 610 615 620 Val Asn Leu Asn Tyr Lys Gly Asp Ser Lys Leu Gly Arg Asn Ile Arg 625 630 635 640 Trp Gln Ala Trp Leu Ser His Tyr Ser Phe Asp Val Glu His Ile Lys 645 650 655 Gly Thr Asp Asn His Phe Ala Asp Phe Leu Ser Arg Glu Phe Asn Arg 660 665 670 Val Asn Ser 675 <210> 10 <211> 366 <212> PRT <213> Artificial Sequence <220> <223> Klebsiella pneuomiae RT <400> 10 Met Lys Glu Lys Ile Ser Lys Ile Asp Lys Asn Phe Tyr Thr Asp Ile 1 5 10 15 Phe Ile Lys Thr Ser Phe Gln Asn Glu Phe Glu Ala Gly Gly Val Ile 20 25 30 Pro Pro Ile Ala Lys Asn Gln Val Ser Thr Ile Ser Asn Lys Asn Lys 35 40 45 Thr Phe Tyr Ser Leu Ala His Ser Ser Pro His Tyr Ser Ile Gln Thr 50 55 60 Arg Ile Glu Lys Phe Leu Leu Lys Asn Ile Pro Leu Ser Ala Ser Ser 65 70 75 80 Phe Ala Phe Arg Lys Glu Arg Ser Tyr Leu His Tyr Leu Glu Pro His 85 90 95 Thr Gln Asn Val Lys Tyr Cys His Leu Asp Ile Val Ser Phe Phe His 100 105 110 Ser Ile Asp Val Asn Ile Val Arg Asp Thr Phe Ser Val Tyr Phe Ser 115 120 125 Asp Glu Phe Leu Val Lys Glu Lys Gln Ser Leu Leu Asp Ala Phe Met 130 135 140 Ala Ser Val Thr Leu Thr Ala Glu Leu Asp Gly Val Glu Lys Thr Phe 145 150 155 160 Ile Pro Met Gly Phe Lys Ser Ser Pro Ser Ile Ser Asn Ile Ile Phe 165 170 175 Arg Lys Ile Asp Ile Leu Ile Gln Lys Phe Cys Asp Lys Asn Lys Ile 180 185 190 Thr Tyr Thr Arg Tyr Ala Asp Asp Leu Leu Phe Ser Thr Lys Lys Glu 195 200 205 Asn Asn Ile Leu Ser Ser Thr Phe Phe Ile Asn Glu Ile Ser Ser Ile 210 215 220 Leu Ser Ile Asn Lys Phe Lys Leu Asn Lys Ser Lys Tyr Leu Tyr Lys 225 230 235 240 Glu Gly Thr Ile Ser Leu Gly Gly Tyr Val Ile Glu Asn Ile Leu Lys 245 250 255 Asp Asn Ser Ser Gly Asn Ile Arg Leu Ser Ser Ser Lys Leu Asn Pro 260 265 270 Leu Tyr Lys Ala Leu Tyr Glu Ile Lys Lys Gly Ser Ser Ser Lys His 275 280 285 Ile Cys Ile Lys Val Phe Asn Leu Lys Leu Lys Arg Phe Ile Tyr Lys 290 295 300 Lys Asn Lys Glu Lys Phe Glu Ala Lys Phe Tyr Ser Ser Gln Leu Lys 305 310 315 320 Asn Lys Leu Leu Gly Tyr Arg Ser Tyr Leu Leu Ser Phe Val Ile Phe 325 330 335 His Lys Lys Tyr Lys Cys Ile Asn Pro Ile Phe Leu Glu Lys Cys Val 340 345 350 Phe Leu Ile Ser Glu Ile Glu Ser Ile Met Asn Arg Lys Phe 355 360 365 <210> 11 <211> 263 <212> PRT <213> Artificial Sequence <220> <223> Escerichia coli RT <400> 11 Met Lys Ile Thr Ser Asn Asn Val Thr Ala Val Ile Asn Gly Lys Gly 1 5 10 15 Trp His Ser Ile Asn Trp Lys Lys Cys His Gln His Val Lys Thr Ile 20 25 30 Gln Thr Arg Ile Ala Lys Ala Ala Cys Asn Gln Gln Trp Arg Thr Val 35 40 45 Gly Arg Leu Gln Arg Leu Leu Val Arg Ser Phe Ser Ala Arg Ala Leu 50 55 60 Ala Val Lys Arg Val Thr Glu Asn Ser Gly Arg Lys Thr Pro Gly Val 65 70 75 80 Asp Gly Gln Ile Trp Ser Thr Pro Glu Ser Lys Trp Glu Ala Ile Phe 85 90 95 Lys Leu Arg Arg Lys Gly Tyr Lys Pro Leu Pro Leu Lys Arg Val Phe 100 105 110 Ile Pro Lys Ser Asn Gly Lys Lys Arg Pro Leu Gly Ile Pro Val Met 115 120 125 Leu Asp Arg Ala Met Gln Ala Leu His Leu Leu Gly Leu Glu Pro Val 130 135 140 Ser Glu Thr Asn Ala Asp His Asn Ser Tyr Gly Phe Arg Pro Ala Arg 145 150 155 160 Cys Thr Ala Asp Ala Ile Gln Gln Val Cys Asn Met Tyr Ser Ser Arg 165 170 175 Asn Ala Ser Lys Trp Val Leu Glu Gly Asp Ile Lys Gly Cys Phe Glu 180 185 190 His Ile Ser His Glu Trp Leu Leu Glu Asn Ile Pro Met Asp Lys Gln 195 200 205 Ile Leu Arg Asn Trp Leu Lys Ala Gly Ile Ile Glu Lys Ser Ile Phe 210 215 220 Ser Lys Thr Leu Ser Gly Thr Pro Gln Gly Gly Ile Ile Ser Pro Val 225 230 235 240 Leu Ala Asn Met Ala Leu Asp Gly Leu Glu Arg Leu Leu Gln Asn Arg 245 250 255 Phe Gly Arg Asn Arg Leu Ile 260 <210> 12 <211> 438 <212> PRT <213> Artificial Sequence <220> <223> Bacillus subtilis RT <400> 12 Met Ser Lys Ile Lys Ile Asn Tyr Glu Lys Tyr His Ile Lys Pro Phe 1 5 10 15 Pro His Phe Asp Gln Arg Ile Lys Val Asn Lys Lys Val Lys Glu Asn 20 25 30 Leu Gln Asn Pro Phe Tyr Ile Ala Ala His Ser Phe Tyr Pro Phe Ile 35 40 45 His Tyr Lys Lys Ile Ser Tyr Lys Phe Lys Asn Gly Thr Leu Ser Ser 50 55 60 Pro Lys Glu Arg Asp Ile Phe Tyr Ser Gly His Met Asp Gly Tyr Ile 65 70 75 80 Tyr Lys His Tyr Gly Glu Ile Leu Asn His Lys Tyr Asn Asn Thr Cys 85 90 95 Ile Gly Lys Gly Ile Asp His Val Ser Leu Ala Tyr Arg Asn Asn Lys 100 105 110 Met Gly Lys Ser Asn Ile His Phe Ala Ala Glu Val Ile Asn Phe Ile 115 120 125 Ser Glu Gln Gln Gln Ala Phe Ile Phe Val Ser Asp Phe Ser Ser Tyr 130 135 140 Phe Asp Ser Leu Asp His Ala Ile Leu Lys Glu Lys Leu Ile Glu Val 145 150 155 160 Leu Glu Glu Gln Asp Lys Leu Ser Lys Asp Trp Trp Asn Val Phe Lys 165 170 175 His Ile Thr Arg Tyr Asn Trp Val Glu Lys Glu Glu Val Ile Ser Asp 180 185 190 Leu Glu Cys Thr Lys Glu Lys Ile Ala Arg Asp Lys Lys Ser Arg Glu 195 200 205 Arg Tyr Tyr Thr Pro Ala Glu Phe Arg Glu Phe Arg Lys Arg Val Asn 210 215 220 Ile Lys Ser Asn Asp Thr Gly Val Gly Ile Pro Gln Gly Thr Ala Ile 225 230 235 240 Ser Ala Val Leu Ala Asn Val Tyr Ala Ile Asp Leu Asp Gln Lys Leu 245 250 255 Asn Gln Tyr Ala Leu Lys Tyr Gly Gly Ile Tyr Arg Arg Tyr Ser Asp 260 265 270 Asp Ile Ile Met Val Leu Pro Met Thr Ser Asp Gly Gln Asp Pro Ser 275 280 285 Asn Asp His Val Ser Phe Ile Lys Ser Val Val Lys Arg Asn Lys Val 290 295 300 Thr Met Gly Asp Ser Lys Thr Ser Val Leu Tyr Tyr Ala Asn Asn Asn 305 310 315 320 Ile Tyr Glu Asp Tyr Gln Arg Lys Arg Glu Ser Lys Met Asp Tyr Leu 325 330 335 Gly Phe Ser Phe Asp Gly Met Thr Val Lys Ile Arg Glu Lys Ser Leu 340 345 350 Phe Lys Tyr Tyr His Arg Thr Tyr Lys Lys Ile Asn Ser Ile Asn Trp 355 360 365 Ala Ser Val Lys Lys Glu Lys Lys Val Gly Arg Lys Lys Leu Tyr Leu 370 375 380 Leu Tyr Ser His Leu Gly Arg Asn Tyr Lys Gly His Gly Asn Phe Ile 385 390 395 400 Ser Tyr Cys Lys Lys Ala His Ala Val Phe Glu Gly Asn Lys Lys Ile 405 410 415 Glu Ser Leu Ile Asn Gln Gln Ile Lys Arg His Trp Lys Lys Ile Gln 420 425 430 Lys Arg Leu Val Asp Val 435 <210> 13 <211> 426 <212> PRT <213> Artificial Sequence <220> <223> Eubacterium rectale RT <400> 13 Asp Thr Ser Asn Leu Met Glu Gln Ile Leu Ser Ser Asp Asn Leu Asn 1 5 10 15 Arg Ala Tyr Leu Gln Val Val Arg Asn Lys Gly Ala Glu Gly Val Asp 20 25 30 Gly Met Lys Tyr Thr Glu Leu Lys Glu His Leu Ala Lys Asn Gly Glu 35 40 45 Thr Ile Lys Gly Gln Leu Arg Thr Arg Lys Tyr Lys Pro Gln Pro Ala 50 55 60 Arg Arg Val Glu Ile Pro Lys Pro Asp Gly Gly Val Arg Asn Leu Gly 65 70 75 80 Val Pro Thr Val Thr Asp Arg Phe Ile Gln Gln Ala Ile Ala Gln Val 85 90 95 Leu Thr Pro Ile Tyr Glu Glu Gln Phe His Asp His Ser Tyr Gly Phe 100 105 110 Arg Pro Asn Arg Cys Ala Gln Gln Ala Ile Leu Thr Ala Leu Asn Ile 115 120 125 Met Asn Asp Gly Asn Asp Trp Ile Val Asp Ile Asp Leu Glu Lys Phe 130 135 140 Phe Asp Thr Val Asn His Asp Lys Leu Met Thr Leu Ile Gly Arg Thr 145 150 155 160 Ile Lys Asp Gly Asp Val Ile Ser Ile Val Arg Lys Tyr Leu Val Ser 165 170 175 Gly Ile Met Ile Asp Asp Glu Tyr Glu Asp Ser Ile Val Gly Thr Pro 180 185 190 Gln Gly Gly Asn Leu Ser Pro Leu Leu Ala Asn Ile Met Leu Asn Glu 195 200 205 Leu Asp Lys Glu Met Glu Lys Arg Gly Leu Asn Phe Val Arg Tyr Ala 210 215 220 Asp Asp Cys Ile Ile Met Val Gly Ser Glu Met Ser Ala Asn Arg Val 225 230 235 240 Met Arg Asn Ile Ser Arg Phe Ile Glu Glu Lys Leu Gly Leu Lys Val 245 250 255 Asn Met Thr Lys Ser Lys Val Asp Arg Pro Ser Gly Leu Lys Tyr Leu 260 265 270 Gly Phe Gly Phe Tyr Phe Asp Pro Arg Ala His Gln Phe Lys Ala Lys 275 280 285 Pro His Ala Lys Ser Val Ala Lys Phe Lys Lys Arg Met Lys Glu Leu 290 295 300 Thr Cys Arg Ser Trp Gly Val Ser Asn Ser Tyr Lys Val Glu Lys Leu 305 310 315 320 Asn Gln Leu Ile Arg Gly Trp Ile Asn Tyr Phe Lys Ile Gly Ser Met 325 330 335 Lys Thr Leu Cys Lys Glu Leu Asp Ser Arg Ile Arg Tyr Arg Leu Arg 340 345 350 Met Cys Ile Trp Lys Gln Trp Lys Thr Pro Gln Asn Gln Glu Lys Asn 355 360 365 Leu Val Lys Leu Gly Ile Asp Arg Asn Thr Ala Arg Arg Val Ala Tyr 370 375 380 Thr Gly Lys Arg Ile Ala Tyr Val Cys Asn Lys Gly Ala Val Asn Val 385 390 395 400 Ala Ile Ser Asn Lys Arg Leu Ala Ser Phe Gly Leu Ile Ser Met Leu 405 410 415 Asp Tyr Tyr Ile Glu Lys Cys Val Thr Cys 420 425 <210> 14 <211> 412 <212> PRT <213> Artificial Sequence <220> <223> Geobacillus stearothermophilus <400> 14 Ala Leu Leu Glu Arg Ile Leu Ala Arg Asp Asn Leu Ile Thr Ala Leu 1 5 10 15 Lys Arg Val Glu Ala Asn Gln Gly Ala Pro Gly Ile Asp Gly Val Ser 20 25 30 Thr Asp Gln Leu Arg Asp Tyr Ile Arg Ala His Trp Ser Thr Ile His 35 40 45 Ala Gln Leu Leu Ala Gly Thr Tyr Arg Pro Ala Pro Val Arg Arg Val 50 55 60 Glu Ile Pro Lys Pro Gly Gly Gly Thr Arg Gln Leu Gly Ile Pro Thr 65 70 75 80 Val Val Asp Arg Leu Ile Gln Gln Ala Ile Leu Gln Glu Leu Thr Pro 85 90 95 Ile Phe Asp Pro Asp Phe Ser Ser Ser Ser Phe Gly Phe Arg Pro Gly 100 105 110 Arg Asn Ala His Asp Ala Val Arg Gln Ala Gln Gly Tyr Ile Gln Glu 115 120 125 Gly Tyr Arg Tyr Val Val Asp Met Asp Leu Glu Lys Phe Phe Asp Arg 130 135 140 Val Asn His Asp Ile Leu Met Ser Arg Val Ala Arg Lys Val Lys Asp 145 150 155 160 Lys Arg Val Leu Lys Leu Ile Arg Ala Tyr Leu Gln Ala Gly Val Met 165 170 175 Ile Glu Gly Val Lys Val Gln Thr Glu Glu Gly Thr Pro Gln Gly Gly 180 185 190 Pro Leu Ser Pro Leu Leu Ala Asn Ile Leu Leu Asp Asp Leu Asp Lys 195 200 205 Glu Leu Glu Lys Arg Gly Leu Lys Phe Cys Arg Tyr Ala Asp Asp Cys 210 215 220 Asn Ile Tyr Val Lys Ser Leu Arg Ala Gly Gln Arg Val Lys Gln Ser 225 230 235 240 Ile Gln Arg Phe Leu Glu Lys Thr Leu Lys Leu Lys Val Asn Glu Glu 245 250 255 Lys Ser Ala Val Asp Arg Pro Trp Lys Arg Ala Phe Leu Gly Phe Ser 260 265 270 Phe Thr Pro Glu Arg Lys Ala Arg Ile Arg Leu Ala Pro Arg Ser Ile 275 280 285 Gln Arg Leu Lys Gln Arg Ile Arg Gln Leu Thr Asn Pro Asn Trp Ser 290 295 300 Ile Ser Met Pro Glu Arg Ile His Arg Val Asn Gln Tyr Val Met Gly 305 310 315 320 Trp Ile Gly Tyr Phe Arg Leu Val Glu Thr Pro Ser Val Leu Gln Thr 325 330 335 Ile Glu Gly Trp Ile Arg Arg Arg Leu Arg Leu Cys Gln Trp Leu Gln 340 345 350 Trp Lys Arg Val Arg Thr Arg Ile Arg Glu Leu Arg Ala Leu Gly Leu 355 360 365 Lys Glu Thr Ala Val Met Glu Ile Ala Asn Thr Arg Lys Gly Ala Trp 370 375 380 Arg Thr Thr Lys Thr Pro Gln Leu His Gln Ala Leu Gly Lys Thr Tyr 385 390 395 400 Trp Thr Ala Gln Gly Leu Lys Ser Leu Thr Gln Arg 405 410 <210> 15 <211> 679 <212> PRT <213> Artificial Sequence <220> <223> moloney murine leukemia virus mutant RT <400> 15 Thr Leu Asn Ile Glu Asp Glu Tyr Arg Leu His Glu Thr Ser Lys Glu 1 5 10 15 Pro Asp Val Ser Leu Gly Ser Thr Trp Leu Ser Asp Phe Pro Gln Ala 20 25 30 Trp Ala Glu Thr Gly Gly Met Gly Leu Ala Val Arg Gln Ala Pro Leu 35 40 45 Ile Ile Pro Leu Lys Ala Thr Ser Thr Pro Val Ser Ile Lys Gln Tyr 50 55 60 Pro Met Ser Gln Glu Ala Arg Leu Gly Ile Lys Pro His Ile Gln Arg 65 70 75 80 Leu Leu Asp Gln Gly Ile Leu Val Pro Cys Gln Ser Pro Trp Asn Thr 85 90 95 Pro Leu Leu Pro Val Lys Lys Pro Gly Thr Asn Asp Tyr Arg Pro Val 100 105 110 Gln Asp Leu Arg Glu Val Asn Lys Arg Val Glu Asp Ile His Pro Thr 115 120 125 Val Pro Asn Pro Tyr Asn Leu Leu Ser Gly Leu Pro Pro Ser His Gln 130 135 140 Trp Tyr Thr Val Leu Asp Leu Lys Asp Ala Phe Phe Cys Leu Arg Leu 145 150 155 160 His Pro Thr Ser Gln Pro Leu Phe Ala Phe Glu Trp Arg Asp Pro Glu 165 170 175 Met Gly Ile Ser Gly Gln Leu Thr Trp Thr Arg Leu Pro Gln Gly Phe 180 185 190 Lys Asn Ser Pro Thr Leu Phe Asn Glu Ala Leu His Arg Asp Leu Ala 195 200 205 Asp Phe Arg Ile Gln His Pro Asp Leu Ile Leu Leu Gln Tyr Val Asp 210 215 220 Asp Leu Leu Leu Ala Ala Thr Ser Glu Leu Asp Cys Gln Gln Gly Thr 225 230 235 240 Arg Ala Leu Leu Gln Thr Leu Gly Asn Leu Gly Tyr Arg Ala Ser Ala 245 250 255 Lys Lys Ala Gln Ile Cys Gln Lys Gln Val Lys Tyr Leu Gly Tyr Leu 260 265 270 Leu Lys Glu Gly Gln Arg Trp Leu Thr Glu Ala Arg Lys Glu Thr Val 275 280 285 Met Gly Gln Pro Thr Pro Lys Thr Pro Arg Gln Leu Arg Glu Phe Leu 290 295 300 Gly Lys Ala Gly Phe Cys Arg Leu Phe Ile Pro Gly Phe Ala Glu Met 305 310 315 320 Ala Ala Pro Leu Tyr Pro Leu Thr Lys Pro Gly Thr Leu Phe Asn Trp 325 330 335 Gly Pro Asp Gln Gln Lys Ala Tyr Gln Glu Ile Lys Gln Ala Leu Leu 340 345 350 Thr Ala Pro Ala Leu Gly Leu Pro Asp Leu Thr Lys Pro Phe Glu Leu 355 360 365 Phe Val Asp Glu Lys Gln Gly Tyr Ala Lys Gly Val Leu Thr Gln Lys 370 375 380 Leu Gly Pro Trp Arg Arg Pro Val Ala Tyr Leu Ser Lys Lys Leu Asp 385 390 395 400 Pro Val Ala Ala Gly Trp Pro Pro Cys Leu Arg Met Val Ala Ala Ile 405 410 415 Ala Val Leu Thr Lys Asp Ala Gly Lys Leu Thr Met Gly Gln Pro Leu 420 425 430 Val Ile Leu Ala Pro His Ala Val Glu Ala Leu Val Lys Gln Pro Pro 435 440 445 Asp Arg Trp Leu Ser Asn Ala Arg Met Thr His Tyr Gln Ala Leu Leu 450 455 460 Leu Asp Thr Asp Arg Val Gln Phe Gly Pro Val Val Ala Leu Asn Pro 465 470 475 480 Ala Thr Leu Leu Pro Leu Pro Glu Glu Gly Leu Gln His Asn Cys Leu 485 490 495 Asp Ile Leu Ala Glu Ala His Gly Thr Arg Pro Asp Leu Thr Asp Gln 500 505 510 Pro Leu Pro Asp Ala Asp His Thr Trp Tyr Thr Asp Gly Ser Ser Leu 515 520 525 Leu Gln Glu Gly Gln Arg Lys Ala Gly Ala Ala Val Thr Thr Glu Thr 530 535 540 Glu Val Ile Trp Ala Lys Ala Leu Pro Ala Gly Thr Ser Ala Gln Arg 545 550 555 560 Ala Glu Leu Ile Ala Leu Thr Gln Ala Leu Lys Met Ala Glu Gly Lys 565 570 575 Lys Leu Asn Val Tyr Thr Asp Ser Arg Tyr Ala Phe Ala Thr Ala His 580 585 590 Ile His Gly Glu Ile Tyr Arg Arg Arg Gly Trp Leu Thr Ser Glu Gly 595 600 605 Lys Glu Ile Lys Asn Lys Asp Glu Ile Leu Ala Leu Leu Lys Ala Leu 610 615 620 Phe Leu Pro Lys Arg Leu Ser Ile Ile His Cys Pro Gly His Gln Lys 625 630 635 640 Gly His Ser Ala Glu Ala Arg Gly Asn Arg Met Ala Asp Gln Ala Ala 645 650 655 Arg Lys Ala Ala Ile Thr Glu Thr Pro Asp Thr Ser Thr Leu Leu Ile 660 665 670 Glu Asn Ser Ser Pro Ser Gly 675 <210> 16 <211> 3 <212> PRT <213> Artificial Sequence <220> <223> linker <400> 16 Gly Gly Ser One <210> 17 <211> 6 <212> PRT <213> Artificial Sequence <220> <223> linker <400> 17 Gly Gly Ser Gly Gly Ser 1 5 <210> 18 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> linker <400> 18 Gly Gly Ser Gly Gly Ser Gly Gly Ser 1 5 <210> 19 <211> 33 <212> PRT <213> Artificial Sequence <220> <223> linker <400> 19 Ser Gly Gly Ser Ser Gly Gly Gly Ser Ser Gly Ser Glu Thr Pro Gly Thr 1 5 10 15 Ser Glu Ser Ala Thr Pro Glu Ser Ser Gly Gly Ser Ser Gly Gly Ser 20 25 30 Ser <210> 20 <211> 16 <212> PRT <213> Artificial Sequence <220> <223> linker <400> 20 Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser 1 5 10 15 <210> 21 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> linker <400> 21 Pro Lys Lys Lys Arg Lys Val 1 5 <210> 22 <211> 30 <212> PRT <213> Artificial Sequence <220> <223> linker <400> 22 Met Asp Ser Leu Leu Met Asn Arg Arg Lys Phe Leu Tyr Gln Phe Lys 1 5 10 15 Asn Val Arg Trp Ala Lys Gly Arg Arg Glu Thr Tyr Leu Cys 20 25 30 <210> 23 <211> 109 <212> DNA <213> Artificial Sequence <220> <223> FnCas9 scaffold <400> 23 gtttcagttg ctgaattatt tggtaaacag taccaaataa ttaatgctct gtaatcattt 60 aaaagtattt tgaacggacc tctgtttgac acgtctgaat aactaaaaa 109 <210> 24 <211> 4884 <212> DNA <213> Artificial Sequence <220> <223> Francisella novicida Cas9 (H969A) <400> 24 atgaacttca agatcctgcc tatcgccatc gacctgggcg tgaagaacac cggcgtgttc 60 agcgccttct accagaaggg caccagcctg gaacggctgg acaacaagaa cggcaaggtg 120 tacgagctga gcaaggacag ctacaccctg ctgatgaaca accggaccgc cagacggcac 180 cagcggagag gcatcgacag aaagcagctc gtgaagcggc tgttcaagct gatctggacc 240 gagcagctga acctggaatg ggacaaggac acccagcagg ccatcagctt tctgttcaac 300 agacggggct tcagcttcat caccgacggc tacagccccg agtacctgaa catcgtgccc 360 gaacaagtga aggccatcct gatggacatc ttcgacgact acaacggcga ggacgacctg 420 gactcctacc tgaagctggc caccgagcag gaaagcaaga tcagcgaaat ctacaacaag 480 ctgatgcaga agatcctgga gtttaagctg atgaagctgt gcaccgacat caaggacgat 540 aaggtgtcca ccaagaccct gaaagagatc accagctacg agttcgagct gctggccgac 600 tacctggcca actacagcga gagcctgaaa acccagaagt tctcctacac cgacaagcag 660 ggcaatctga aagagctgag ctactaccac cacgacaagt acaacatcca ggaatttctg 720 aagcggcacg ccaccatcaa cgacagaatc ctggacacac tgctgaccga cgatctggac 780 atctggaact tcaacttcga gaagttcgac ttcgacaaga acgaggaaaa gctgcagaac 840 caggaagata aggaccacat ccaggcccat ctgcaccact tcgtgttcgc cgtgaacaag 900 atcaagagcg agatggccag cggcggcaga cacagaagcc agtacttcca ggaaatcacc 960 aacgtgctgg acgagaacaa ccaccaggaa ggctatctga agaatttctg cgagaacctg 1020 cacaacaaaa agtacagcaa cctgtccgtg aagaatctcg tgaacctgat cggcaacctg 1080 agcaacctgg aactgaagcc tctgcgcaag tacttcaacg acaagatcca cgccaaggcc 1140 gaccactggg acgagcagaa gttcaccgag acatactgcc actggattct gggcgagtgg 1200 cgcgtgggag tgaaggacca ggacaagaag gacggcgcca agtactccta caaggacctg 1260 tgcaacgagc tgaaacagaa agtgaccaag gccggactgg tggacttcct gctggaactg 1320 gacccctgca ggaccatccc cccctacctg gataacaaca atcggaagcc ccccaagtgc 1380 cagagcctga tcctgaaccc caagttcctg gacaaccagt accccaactg gcagcagtat 1440 ctgcaggaac tgaaaaaact gcagagcatc cagaactacc tggacagctt cgagacagac 1500 ctgaaggtgc tgaagtccag caaggaccag ccctacttcg tggagtacaa gagcagcaac 1560 cagcagatcg cctccggcca gcgggactac aaggatctgg atgcccgcat cctgcagttc 1620 atcttcgata gagtgaaagc ctccgatgag ctgctgctga acgaaatcta ttttcaggcc 1680 aagaaactga agcagaaggc cagctccgaa ctggaaaagc tggaaagcag caagaaactg 1740 gacgaagtga tcgccaacag ccagctgtcc cagatcctga aaagccagca caccaacggc 1800 atcttcgagc agggcacctt cctgcacctc gtgtgcaagt actacaagca gcggcagcgg 1860 gccagagaca gcagactgta catcatgccc gagtacagat acgacaagaa gctgcacaag 1920 tataacaaca ccggccgctt cgacgatgac aaccagctgc tgacctactg caaccacaag 1980 ccccggcaga agcggtatca gctgctgaat gatctggccg gcgtgctgca ggtgtccccc 2040 aacttcctga aggacaagat cggctccgac gacgacctgt tcatctccaa gtggctggtg 2100 gaacacatcc gcggcttcaa gaaagcctgc gaggacagcc tgaagattca gaaggacaac 2160 cggggcctgc tgaaccacaa aatcaatatc gcccggaaca ccaagggcaa gtgcgagaaa 2220 gagatttta acctgatctg caagatcgag ggatccgagg ataagaaggg caattacaag 2280 cacggcctgg cctacgagct gggagtgctg ctgttcggcg agcccaatga ggccagcaag 2340 cccgagttcg accggaagat taagaagttc aacagcatct acagctttgc ccagatccag 2400 cagattgctt tcgccgagcg gaagggcaac gccaatacct gcgccgtgtg cagcgccgac 2460 aacgcccata gaatgcagca gatcaagatc accgagcccg tggaagataa caaggataag 2520 atcatcctgt ctgccaaggc ccagcggctg cctgccatcc ctaccagaat tgtggatggc 2580 gccgtgaaaa agatggccac catcctggcc aagaacatcg tggacgacaa ctggcagaac 2640 atcaaacagg tgctgagcgc caagcaccag ctgcacatcc ccatcatcac cgagagcaac 2700 gccttcgagt tcgagcccgc cctggccgat gtgaagggca agagcctgaa ggaccggcgg 2760 aagaaggccc tggaaagaat cagccccgag aacatcttca aggacaagaa caaccggatc 2820 aaagagttcg ccaagggcat cagcgcctac agcggcgcca atctgaccga cggcgatttc 2880 gacggcgcca aagaggaact ggacgccatc atccccagaa gccacaagaa gtacggcacc 2940 ctgaacgacg aggccaacct gatctgcgtg accagaggcg acaacaaaaa caagggcaac 3000 aggatcttct gcctgcggga cctggccgac aactacaagc tgaagcagtt cgagacaacc 3060 gacgacctgg aaatcgagaa gaagatcgcc gacaccatct gggacgccaa caagaaggac 3120 ttcaagttcg gcaactaccg cagcttcatc aacctgaccc cccaggaaca gaaagccttc 3180 cggcacgccc tgtttctggc cgacgagaac cctatcaagc aggccgtgat ccgggccatc 3240 aacaacagaa accggacctt cgtgaacggc acccagcggt actttgccga ggtgctggcc 3300 aacaatatct acctgcgggc caagaaagag aacctgaaca ccgacaagat cagcttcgac 3360 tacttcggca tccccaccat cggcaacggc agaggaatcg ccgagatccg gcagctgtac 3420 gagaaggtgg acagcgacat ccaggcttat gccaagggcg acaagcccca ggccagctac 3480 agccacctga tcgacgccat gctggctttc tgcattgccg ccgacgagca cagaaacgac 3540 ggcagcatcg gcctggaaat tgacaaaaac tacagcctgt accccctgga taagaacacc 3600 ggcgaggtgt tcaccaagga catcttcagc cagatcaaga tcaccgacaa cgagttcagc 3660 gacaagaaac tcgtgcgcaa gaaggccatc gagggcttca acacccaccg gcagatgacc 3720 agggacggca tctacgccga gaactacctg cccatcctga tccacaaaga actgaacgaa 3780 gtgcggaagg gctacacctg gaagaacagc gaggaaatca agattttcaa ggggaagaaa 3840 tacgatatcc agcagctgaa caacctggtg tactgcctga agttcgtgga caagcccatc 3900 agcatcgaca ttcagatcag caccctggaa gaactgcgga acatcctgac caccaacaac 3960 attgccgcta ccgccgagta ctactacatc aatctgaaaa cccagaagct gcacgagtac 4020 tatatcgaga attacaacac cgccctgggc tacaagaaat actccaaaga gatggagttc 4080 ctgcggagcc tggcctacag atccgagaga gtgaagatca agagcatcga cgacgtgaaa 4140 caggtgctgg acaaggacag caacttcatc atcggcaaga tcacactgcc ctttaagaaa 4200 gagtggcagc ggctgtaccg cgagtggcag aataccacca tcaaggacga ctacgagttc 4260 ctgaagagtt tcttcaacgt gaagtccatc acaaagctgc acaagaaagt gcgcaaggat 4320 ttcagcctgc ctatctctac caacgagggc aagttcctcg tgaagagaaa gacctgggac 4380 aacaatttca tctaccagat cctgaacgat agcgacagca gagccgacgg caccaagccc 4440 ttcatccccg ccttcgacat cagcaagaac gagatcgtgg aagccatcat cgacagcttt 4500 accagcaaga atatcttctg gctgcccaaa aacatcgagc tgcagaaagt ggacaacaag 4560 aacattttcg ccatcgacac ctccaagtgg ttcgaggtgg aaacccccag cgacctgaga 4620 gacatcggaa tcgccacaat ccagtacaag atcgacaaca acagccggcc caaagtgcgc 4680 gtgaagctgg actacgtgat cgacgatgac agcaagatca actacttcat gaaccacagc 4740 ctgctgaagt ccagataccc cgacaaagtg ctggaaatcc tgaagcagag cacaatcatc 4800 gagtttgaga gcagcgggtt caacaagacc atcaaagaaa tgctgggcat gaagctggcc 4860 gggatctaca acgagacaag caac 4884 <210> 25 <211> 2038 <212> DNA <213> Artificial Sequence <220> <223> moloney murine leukemia virus RT mutant <400> 25 accctaaata tagaagatga gtatcggcta catgagacct caaaagagcc agatgtttct 60 ctagggtcca catggctgtc tgattttcct caggcctggg cggaaaccgg gggcatggga 120 ctggcagttc gccaagctcc tctgatcata cctctgaaag caacctctac ccccgtgtcc 180 ataaaacaat accccatgtc acaagaagcc agactgggga tcaagcccca catacagaga 240 ctgttggacc agggaatact ggtaccctgc cagtccccct ggaacacgcc cctgctaccc 300 gttaagaaac cagggactaa tgattatagg cctgtccagg atctgagaga agtcaacaag 360 cgggtggaag acatccaccc caccgtgccc aacccttaca acctcttgag cgggctccca 420 ccgtcccacc agtggtacac tgtgcttgat ttaaaggatg cctttttctg cctgagactc 480 caccccacca gtcagcctct cttcgccttt gagtggagag atccagagat gggaatctca 540 ggacaattga cctggaccag actcccacag ggtttcaaaa acagtcccac cctgtttaat 600 gaggcactgc acagagacct agcagacttc cggatccagc acccagactt gatcctgcta 660 cagtacgtgg atgacttact gctggccgcc acttctgagc tagactgcca acaaggtact 720 cgggccctgt tacaaaccct agggaacctc gggtatcggg cctcggccaa gaaagcccaa 780 atttgccaga aacaggtcaa gtatctgggg tatcttctaa aagagggtca gagatggctg 840 actgaggcca gaaaagagac tgtgatgggg cagcctactc cgaagacccc tcgacaacta 900 agggagttcc tagggaaggc aggcttctgt cgcctcttca tccctgggtt tgcagaaatg 960 gcagcccccc tgtaccctct caccaaaccg gggactctgt ttaattgggg cccagaccaa 1020 caaaaggcct atcaagaaat caagcaagct cttctaactg ccccagccct ggggttgcca 1080 gatttgacta agccctttga actctttgtc gacgagaagc agggctacgc caaaggtgtc 1140 ctaacgcaaa aactgggacc ttggcgtcgg ccggtggcct acctgtccaa aaagctagac 1200 ccagtagcag ctgggtggcc cccttgccta cggatggtag cagccattgc cgtactgaca 1260 aaggatgcag gcaagctaac catgggacag ccactagtca ttctggcccc ccatgcagta 1320 gaggcactag tcaaacaacc ccccgaccgc tggctttcca acgcccggat gactcactat 1380 caggccttgc ttttggacac ggaccgggtc cagttcggac cggtggtagc cctgaacccg 1440 gctacgctgc tcccactgcc tgaggaaggg ctgcaacaca actgccttga tatcctggcc 1500 gaagcccacg gaacccgacc cgacctaacg gaccagccgc tcccagacgc cgaccacacc 1560 tggtacacgg atggaagcag tctcttacaa gagggacagc gtaaggcggg agctgcggtg 1620 accaccgaga ccgaggtaat ctgggctaaa gccctgccag ccgggacatc cgctcagcgg 1680 gctgaactga tagcactcac ccaggcccta aagatggcag aaggtaagaa gctaaatgtt 1740 tatactgata gccgttatgc ttttgctact gcccatatcc atggagaaat atacagaagg 1800 cgtgggtggc tcacatcaga aggcaaagag atcaaaaata aagacgagat cttggcccta 1860 ctaaaagccc tctttctgcc caaaagactt agcataatcc attgtccagg acatcaaaag 1920 ggacacagcg ccgaggctag aggcaaccgg atggctgacc aagcggcccg aaaggcagcc 1980 atcacagaga ctccagacac ctctaccctc ctcatagaaa attcatcacc ctctggcg 2038 <210> 26 <211> 7021 <212> DNA <213> Artificial Sequence <220> <223> FnCas9-RT fusion <400> 26 atgaacttca agatcctgcc tatcgccatc gacctgggcg tgaagaacac cggcgtgttc 60 agcgccttct accagaaggg caccagcctg gaacggctgg acaacaagaa cggcaaggtg 120 tacgagctga gcaaggacag ctacaccctg ctgatgaaca accggaccgc cagacggcac 180 cagcggagag gcatcgacag aaagcagctc gtgaagcggc tgttcaagct gatctggacc 240 gagcagctga acctggaatg ggacaaggac acccagcagg ccatcagctt tctgttcaac 300 agacggggct tcagcttcat caccgacggc tacagccccg agtacctgaa catcgtgccc 360 gaacaagtga aggccatcct gatggacatc ttcgacgact acaacggcga ggacgacctg 420 gactcctacc tgaagctggc caccgagcag gaaagcaaga tcagcgaaat ctacaacaag 480 ctgatgcaga agatcctgga gtttaagctg atgaagctgt gcaccgacat caaggacgat 540 aaggtgtcca ccaagaccct gaaagagatc accagctacg agttcgagct gctggccgac 600 tacctggcca actacagcga gagcctgaaa acccagaagt tctcctacac cgacaagcag 660 ggcaatctga aagagctgag ctactaccac cacgacaagt acaacatcca ggaatttctg 720 aagcggcacg ccaccatcaa cgacagaatc ctggacacac tgctgaccga cgatctggac 780 atctggaact tcaacttcga gaagttcgac ttcgacaaga acgaggaaaa gctgcagaac 840 caggaagata aggaccacat ccaggcccat ctgcaccact tcgtgttcgc cgtgaacaag 900 atcaagagcg agatggccag cggcggcaga cacagaagcc agtacttcca ggaaatcacc 960 aacgtgctgg acgagaacaa ccaccaggaa ggctatctga agaatttctg cgagaacctg 1020 cacaacaaaa agtacagcaa cctgtccgtg aagaatctcg tgaacctgat cggcaacctg 1080 agcaacctgg aactgaagcc tctgcgcaag tacttcaacg acaagatcca cgccaaggcc 1140 gaccactggg acgagcagaa gttcaccgag acatactgcc actggattct gggcgagtgg 1200 cgcgtgggag tgaaggacca ggacaagaag gacggcgcca agtactccta caaggacctg 1260 tgcaacgagc tgaaacagaa agtgaccaag gccggactgg tggacttcct gctggaactg 1320 gacccctgca ggaccatccc cccctacctg gataacaaca atcggaagcc ccccaagtgc 1380 cagagcctga tcctgaaccc caagttcctg gacaaccagt accccaactg gcagcagtat 1440 ctgcaggaac tgaaaaaact gcagagcatc cagaactacc tggacagctt cgagacagac 1500 ctgaaggtgc tgaagtccag caaggaccag ccctacttcg tggagtacaa gagcagcaac 1560 cagcagatcg cctccggcca gcgggactac aaggatctgg atgcccgcat cctgcagttc 1620 atcttcgata gagtgaaagc ctccgatgag ctgctgctga acgaaatcta ttttcaggcc 1680 aagaaactga agcagaaggc cagctccgaa ctggaaaagc tggaaagcag caagaaactg 1740 gacgaagtga tcgccaacag ccagctgtcc cagatcctga aaagccagca caccaacggc 1800 atcttcgagc agggcacctt cctgcacctc gtgtgcaagt actacaagca gcggcagcgg 1860 gccagagaca gcagactgta catcatgccc gagtacagat acgacaagaa gctgcacaag 1920 tataacaaca ccggccgctt cgacgatgac aaccagctgc tgacctactg caaccacaag 1980 ccccggcaga agcggtatca gctgctgaat gatctggccg gcgtgctgca ggtgtccccc 2040 aacttcctga aggacaagat cggctccgac gacgacctgt tcatctccaa gtggctggtg 2100 gaacacatcc gcggcttcaa gaaagcctgc gaggacagcc tgaagattca gaaggacaac 2160 cggggcctgc tgaaccacaa aatcaatatc gcccggaaca ccaagggcaa gtgcgagaaa 2220 gagatttta acctgatctg caagatcgag ggatccgagg ataagaaggg caattacaag 2280 cacggcctgg cctacgagct gggagtgctg ctgttcggcg agcccaatga ggccagcaag 2340 cccgagttcg accggaagat taagaagttc aacagcatct acagctttgc ccagatccag 2400 cagattgctt tcgccgagcg gaagggcaac gccaatacct gcgccgtgtg cagcgccgac 2460 aacgcccata gaatgcagca gatcaagatc accgagcccg tggaagataa caaggataag 2520 atcatcctgt ctgccaaggc ccagcggctg cctgccatcc ctaccagaat tgtggatggc 2580 gccgtgaaaa agatggccac catcctggcc aagaacatcg tggacgacaa ctggcagaac 2640 atcaaacagg tgctgagcgc caagcaccag ctgcacatcc ccatcatcac cgagagcaac 2700 gccttcgagt tcgagcccgc cctggccgat gtgaagggca agagcctgaa ggaccggcgg 2760 aagaaggccc tggaaagaat cagccccgag aacatcttca aggacaagaa caaccggatc 2820 aaagagttcg ccaagggcat cagcgcctac agcggcgcca atctgaccga cggcgatttc 2880 gacggcgcca aagaggaact ggacgccatc atccccagaa gccacaagaa gtacggcacc 2940 ctgaacgacg aggccaacct gatctgcgtg accagaggcg acaacaaaaa caagggcaac 3000 aggatcttct gcctgcggga cctggccgac aactacaagc tgaagcagtt cgagacaacc 3060 gacgacctgg aaatcgagaa gaagatcgcc gacaccatct gggacgccaa caagaaggac 3120 ttcaagttcg gcaactaccg cagcttcatc aacctgaccc cccaggaaca gaaagccttc 3180 cggcacgccc tgtttctggc cgacgagaac cctatcaagc aggccgtgat ccgggccatc 3240 aacaacagaa accggacctt cgtgaacggc acccagcggt actttgccga ggtgctggcc 3300 aacaatatct acctgcgggc caagaaagag aacctgaaca ccgacaagat cagcttcgac 3360 tacttcggca tccccaccat cggcaacggc agaggaatcg ccgagatccg gcagctgtac 3420 gagaaggtgg acagcgacat ccaggcttat gccaagggcg acaagcccca ggccagctac 3480 agccacctga tcgacgccat gctggctttc tgcattgccg ccgacgagca cagaaacgac 3540 ggcagcatcg gcctggaaat tgacaaaaac tacagcctgt accccctgga taagaacacc 3600 ggcgaggtgt tcaccaagga catcttcagc cagatcaaga tcaccgacaa cgagttcagc 3660 gacaagaaac tcgtgcgcaa gaaggccatc gagggcttca acacccaccg gcagatgacc 3720 agggacggca tctacgccga gaactacctg cccatcctga tccacaaaga actgaacgaa 3780 gtgcggaagg gctacacctg gaagaacagc gaggaaatca agattttcaa ggggaagaaa 3840 tacgatatcc agcagctgaa caacctggtg tactgcctga agttcgtgga caagcccatc 3900 agcatcgaca ttcagatcag caccctggaa gaactgcgga acatcctgac caccaacaac 3960 attgccgcta ccgccgagta ctactacatc aatctgaaaa cccagaagct gcacgagtac 4020 tatatcgaga attacaacac cgccctgggc tacaagaaat actccaaaga gatggagttc 4080 ctgcggagcc tggcctacag atccgagaga gtgaagatca agagcatcga cgacgtgaaa 4140 caggtgctgg acaaggacag caacttcatc atcggcaaga tcacactgcc ctttaagaaa 4200 gagtggcagc ggctgtaccg cgagtggcag aataccacca tcaaggacga ctacgagttc 4260 ctgaagagtt tcttcaacgt gaagtccatc acaaagctgc acaagaaagt gcgcaaggat 4320 ttcagcctgc ctatctctac caacgagggc aagttcctcg tgaagagaaa gacctgggac 4380 aacaatttca tctaccagat cctgaacgat agcgacagca gagccgacgg caccaagccc 4440 ttcatccccg ccttcgacat cagcaagaac gagatcgtgg aagccatcat cgacagcttt 4500 accagcaaga atatcttctg gctgcccaaa aacatcgagc tgcagaaagt ggacaacaag 4560 aacattttcg ccatcgacac ctccaagtgg ttcgaggtgg aaacccccag cgacctgaga 4620 gacatcggaa tcgccacaat ccagtacaag atcgacaaca acagccggcc caaagtgcgc 4680 gtgaagctgg actacgtgat cgacgatgac agcaagatca actacttcat gaaccacagc 4740 ctgctgaagt ccagataccc cgacaaagtg ctggaaatcc tgaagcagag cacaatcatc 4800 gagtttgaga gcagcgggtt caacaagacc atcaaagaaa tgctgggcat gaagctggcc 4860 gggatctaca acgagacaag caactctgga ggatctagcg gaggatcctc tggcagcgag 4920 acaccaggaa caagcgagtc agcaacacca gagagcagtg gcggcagcag cggcggcagc 4980 agcaccctaa atatagaaga tgagtatcgg ctacatgaga cctcaaaaga gccagatgtt 5040 tctctagggt ccacatggct gtctgatttt cctcaggcct gggcggaaac cggggggcatg 5100 ggactggcag ttcgccaagc tcctctgatc atacctctga aagcaacctc tacccccgtg 5160 tccataaaac aataccccat gtcacaagaa gccagactgg ggatcaagcc ccacatacag 5220 agactgttgg accagggaat actggtaccc tgccagtccc cctggaacac gcccctgcta 5280 cccgttaaga aaccagggac taatgattat aggcctgtcc aggatctgag agaagtcaac 5340 aagcgggtgg aagacatcca ccccaccgtg cccaaccctt acaacctctt gagcgggctc 5400 ccaccgtccc accagtggta cactgtgctt gatttaaagg atgccttttt ctgcctgaga 5460 ctccacccca ccagtcagcc tctcttcgcc tttgagtgga gagatccaga gatgggaatc 5520 tcaggacaat tgacctggac cagactccca cagggtttca aaaacagtcc caccctgttt 5580 aatgaggcac tgcacagaga cctagcagac ttccggatcc agcacccaga cttgatcctg 5640 ctacagtacg tggatgactt actgctggcc gccacttctg agctagactg ccaacaaggt 5700 actcgggccc tgttacaaac cctagggaac ctcgggtatc gggcctcggc caagaaagcc 5760 caaatttgcc agaaacaggt caagtatctg gggtatcttc taaaagaggg tcagagatgg 5820 ctgactgagg ccagaaaaga gactgtgatg gggcagccta ctccgaagac ccctcgacaa 5880 ctaagggagt tcctagggaa ggcaggcttc tgtcgcctct tcatccctgg gtttgcagaa 5940 atggcagccc ccctgtaccc tctcaccaaa ccggggactc tgtttaattg gggcccagac 6000 caacaaaagg cctatcaaga aatcaagcaa gctcttctaa ctgccccagc cctggggttg 6060 ccagatttga ctaagccctt tgaactcttt gtcgacgaga agcagggcta cgccaaaggt 6120 gtcctaacgc aaaaactggg accttggcgt cggccggtgg cctacctgtc caaaaagcta 6180 gacccagtag cagctgggtg gcccccttgc ctacggatgg tagcagccat tgccgtactg 6240 acaaaggatg caggcaagct aaccatggga cagccactag tcattctggc cccccatgca 6300 gtagaggcac tagtcaaaca accccccgac cgctggcttt ccaacgcccg gatgactcac 6360 tatcaggcct tgcttttgga cacggaccgg gtccagttcg gaccggtggt agccctgaac 6420 ccggctacgc tgctcccact gcctgaggaa gggctgcaac acaactgcct tgatatcctg 6480 gccgaagccc acggaacccg acccgaccta acggaccagc cgctcccaga cgccgaccac 6540 acctggtaca cggatggaag cagtctctta caagagggac agcgtaaggc gggagctgcg 6600 gtgaccaccg agaccgaggt aatctgggct aaagccctgc cagccgggac atccgctcag 6660 cgggctgaac tgatagcact cacccaggcc ctaaagatgg cagaaggtaa gaagctaaat 6720 gtttatactg atagccgtta tgcttttgct actgcccata tccatggaga aatatacaga 6780 aggcgtgggt ggctcacatc agaaggcaaa gagatcaaaa ataaagacga gatcttggcc 6840 ctactaaaag ccctctttct gcccaaaaga cttagcataa tccattgtcc aggacatcaa 6900 aagggacaca gcgccgaggc tagaggcaac cggatggctg accaagcggc ccgaaaggca 6960 gccatcacag agactccaga cacctctacc ctcctcatag aaaattcatc accctctggc 7020 g 7021 <210> 27 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> HEK3 target site <400> 27 ggcccagact gagcacgtga tgg 23 <210> 28 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> HEK3 target (PBS + RT) <400> 28 catcacgtaa gctcagtctg 20 <210> 29 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> c-Myc target site <400> 29 aggcagaggg agcgagcggg cgg 23 <210> 30 <211> 102 <212> RNA <213> Artificial Sequence <220> <223> sgRNA sequence for FnCas9 <400> 30 aggcagaggg agcgagcggg guuucaguug cugaaaaugc ucuguaauca uuuaaaagua 60 uuuugaacgg accucuguuu gacacgucug aauaacuaaa aa 102 <210> 31 <211> 102 <212> RNA <213> Artificial Sequence <220> <223> sgRNA sequence for SpCas9 <400> 31 aggcagaggg agcgagcggg guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60 cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uu 102 <210> 32 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> AAVS1 target site <400> 32 tctaaccccc acctcctgtt agg 23 <210> 33 <211> 102 <212> RNA <213> Artificial Sequence <220> <223> sgRNA sequence for FnCas9 <400> 33 ucuaaccccc accuccuguu guuucaguug cugaaaaugc ucuguaauca uuuaaaagua 60 uuuugaacgg accucuguuu gacacgucug aauaacuaaa aa 102 <210> 34 <211> 102 <212> RNA <213> Artificial Sequence <220> <223> sgRNA sequence for SpCas9 <400> 34 ucuaaccccc accuccuguu guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60 cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uu 102 <210> 35 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> EMX1 target site <400> 35 tggttgccca ccctagtcat tgg 23 <210> 36 <211> 102 <212> RNA <213> Artificial Sequence <220> <223> sgRNA sequence for FnCas9 <400> 36 ugguugccca cccuagucau guuucaguug cugaaaaugc ucuguaauca uuuaaaagua 60 uuuugaacgg accucuguuu gacacgucug aauaacuaaa aa 102 <210> 37 <211> 102 <212> RNA <213> Artificial Sequence <220> <223> sgRNA sequence for SpCas9 <400> 37 ugguugccca cccuagucau guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60 cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uu 102 <210> 38 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> HEK3 target site <400> 38 ggcccagact gagcacgtga tgg 23 <210> 39 <211> 102 <212> RNA <213> Artificial Sequence <220> <223> sgRNA sequence for FnCas9 <400> 39 ggcccagacu gagcacguga guuucaguug cugaaaaugc ucuguaauca uuuaaaagua 60 uuuugaacgg accucuguuu gacacgucug aauaacuaaa aa 102 <210> 40 <211> 102 <212> RNA <213> Artificial Sequence <220> <223> sgRNA sequence for SpCas9 <400> 40 ggcccagacu gagcacguga guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60 cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uu 102 <210> 41 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> NRAS target site <400> 41 ggtaaggggg cagggaggga ggg 23 <210> 42 <211> 102 <212> RNA <213> Artificial Sequence <220> <223> sgRNA sequence for FnCas9 <400> 42 gguaaggggg cagggaggga guuucaguug cugaaaaugc ucuguaauca uuuaaaagua 60 uuuugaacgg accucuguuu gacacgucug aauaacuaaa aa 102 <210> 43 <211> 102 <212> RNA <213> Artificial Sequence <220> <223> sgRNA sequence for SpCas9 <400> 43 gguaaggggg cagggaggga guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60 cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uu 102 <210> 44 <211> 157 <212> DNA <213> Artificial Sequence <220> <223> HEK3 FnCas9_pegRNA_10-10 <400> 44 gggcccagac tgagcacgtg agtttcagtt gctgaattat ttggtaaaca gtaccaaata 60 attaatgctc tgtaatcatt taaaagtatt ttgaacggac ctctgtttga cacgtctgaa 120 taactaaaaa catcacgtaa gctcagtctg ttttttt 157 <210> 45 <211> 159 <212> DNA <213> Artificial Sequence <220> <223> HEK3 FnCas9_pegRNA_10-12 <400> 45 gggcccagac tgagcacgtg agtttcagtt gctgaattat ttggtaaaca gtaccaaata 60 attaatgctc tgtaatcatt taaaagtatt ttgaacggac ctctgtttga cacgtctgaa 120 taactaaaaa gccatcacgt aagctcagtc tgttttttt 159 <210> 46 <211> 162 <212> DNA <213> Artificial Sequence <220> <223> HEK3 FnCas9_pegRNA_10-15 <400> 46 gggcccagac tgagcacgtg agtttcagtt gctgaattat ttggtaaaca gtaccaaata 60 attaatgctc tgtaatcatt taaaagtatt ttgaacggac ctctgtttga cacgtctgaa 120 taactaaaaa tctgccatca cgtaagctca gtctgttttt tt 162 <210> 47 <211> 158 <212> DNA <213> Artificial Sequence <220> <223> HEK3 FnCas9_pegRNA_11-10 <400> 47 gggcccagac tgagcacgtg agtttcagtt gctgaattat ttggtaaaca gtaccaaata 60 attaatgctc tgtaatcatt taaaagtatt ttgaacggac ctctgtttga cacgtctgaa 120 taactaaaaa catcacgtaa gctcagtctg gttttttt 158 <210> 48 <211> 160 <212> DNA <213> Artificial Sequence <220> <223> HEK3 FnCas9_pegRNA_11-12 <400> 48 gggcccagac tgagcacgtg agtttcagtt gctgaattat ttggtaaaca gtaccaaata 60 attaatgctc tgtaatcatt taaaagtatt ttgaacggac ctctgtttga cacgtctgaa 120 taactaaaaa gccatcacgt aagctcagtc tggttttttt 160 <210> 49 <211> 163 <212> DNA <213> Artificial Sequence <220> <223> HEK3 FnCas9_pegRNA_11-15 <400> 49 gggcccagac tgagcacgtg agtttcagtt gctgaattat ttggtaaaca gtaccaaata 60 attaatgctc tgtaatcatt taaaagtatt ttgaacggac ctctgtttga cacgtctgaa 120 taactaaaaa tctgccatca cgtaagctca gtctggtttt ttt 163 <210> 50 <211> 160 <212> DNA <213> Artificial Sequence <220> <223> HEK3 FnCas9_pegRNA_13-10 <400> 50 gggcccagac tgagcacgtg agtttcagtt gctgaattat ttggtaaaca gtaccaaata 60 attaatgctc tgtaatcatt taaaagtatt ttgaacggac ctctgtttga cacgtctgaa 120 taactaaaaa catcacgtaa gctcagtctg ggcttttttt 160 <210> 51 <211> 162 <212> DNA <213> Artificial Sequence <220> <223> HEK3 FnCas9_pegRNA_13-12 <400> 51 gggcccagac tgagcacgtg agtttcagtt gctgaattat ttggtaaaca gtaccaaata 60 attaatgctc tgtaatcatt taaaagtatt ttgaacggac ctctgtttga cacgtctgaa 120 taactaaaaa gccatcacgt aagctcagtc tgggcttttt tt 162 <210> 52 <211> 165 <212> DNA <213> Artificial Sequence <220> <223> HEK3 FnCas9_pegRNA_13-15 <400> 52 gggcccagac tgagcacgtg agtttcagtt gctgaattat ttggtaaaca gtaccaaata 60 attaatgctc tgtaatcatt taaaagtatt ttgaacggac ctctgtttga cacgtctgaa 120 taactaaaaa tctgccatca cgtaagctca gtctgggctt ttttt 165

Claims (21)

Francisella novicida Cas9 단백질;
역전사 효소 단백질; 및
프라임 편집 가이드 RNA (PEgRNA)를 포함하는 프라임 편집 복합체로서,
상기 프라임 편집 가이드 RNA (PEgRNA)는 프라이머 결합 부위, 편집 주형 및 상동성 아암을 포함하는 것인, 프라임 편집 복합체.
Francisella novicida Cas9 protein;
reverse transcriptase protein; and
A prime editing complex comprising a prime editing guide RNA (PEgRNA), comprising:
wherein the prime editing guide RNA (PEgRNA) comprises a primer binding site, an editing template and a homology arm.
제1항에 있어서, Francisella novicida Cas9 단백질은 서열번호 2의 Francisella novicida Cas9(H969A)에 대하여 적어도 98 % 이상 동일한 것인, 프라임 편집 복합체.The prime editing complex according to claim 1, wherein the Francisella novicida Cas9 protein is at least 98% identical to Francisella novicida Cas9 (H969A) of SEQ ID NO: 2. 제2항에 있어서, Francisella novicida Cas9 단백질은 서열번호 2의 Francisella novicida Cas9(H969A)는 서열번호 2의 아미노산 서열을 가지는 것인, 프라임 편집 복합체.The prime editing complex according to claim 2, wherein the Francisella novicida Cas9 protein has the amino acid sequence of SEQ ID NO: 2, Francisella novicida Cas9 (H969A) of SEQ ID NO: 2. 제1항에 있어서, Francisella novicida Cas9 단백질은 표적 DNA에 nick을 형성하는 위치가 PAM 으로부터 6bp 떨어진 곳인, 프라임 편집 복합체. The prime editing complex according to claim 1, wherein the Francisella novicida Cas9 protein has a position that forms a nick in the target DNA 6bp away from the PAM. 제1항에 있어서, 상기 역전사 효소는 서열번호 15의 서열을 가지는 것인, 프라임 편집 복합체.The prime editing complex according to claim 1, wherein the reverse transcriptase has the sequence of SEQ ID NO: 15. 제1항에 있어서, Francisella novicida Cas9 단백질 및 역전사 효소 단백질은 융합 단백질의 형태를 가지는 것인, 프라임 편집 복합체.The prime editing complex according to claim 1, wherein the Francisella novicida Cas9 protein and the reverse transcriptase protein are in the form of a fusion protein. 제1항에 있어서, Francisella novicida Cas9 단백질 및 역전사 효소 단백질이 프라임 편집 가이드 RNA (PEgRNA)와 복합체화 된 경우 표적 DNA 서열에 결합할 수 있는 것인, 프라임 편집 복합체.The prime editing complex according to claim 1, wherein the Francisella novicida Cas9 protein and the reverse transcriptase protein are capable of binding to a target DNA sequence when complexed with a prime editing guide RNA (PEgRNA). 제1항에 있어서, 프라임 편집 가이드 RNA (PEgRNA)의 스페이서 서열은 표적 DNA 내의 프로토스페이서에 결합하는 서열인, 프라임 편집 복합체.The prime editing complex of claim 1 , wherein the spacer sequence of the prime editing guide RNA (PEgRNA) is a sequence that binds to a protospacer in the target DNA. 제1항에 있어서, 프라임 편집 가이드 RNA (PEgRNA)의 gRNA 코어는 Cas9 결합을 담당하는 gRNA 내의 서열인, 프라임 편집 복합체. The prime editing complex of claim 1 , wherein the gRNA core of the prime editing guide RNA (PEgRNA) is a sequence within the gRNA responsible for Cas9 binding. 제1항에 있어서, 프라임 편집 가이드 RNA (PEgRNA)의 연장 아암은 프라이머 결합 부위 및 역전사 효소를 통해 관심 유전적 변화를 함유하는 단일 가닥 DNA 플랩을 코딩하는 DNA 합성 주형 서열을 포함하는, PEgRNA의 단일 가닥 연장부인, 프라임 편집 복합체. The single stranded DNA of claim 1 , wherein the extension arm of the prime editing guide RNA (PEgRNA) comprises a DNA synthesis template sequence encoding a primer binding site and a single stranded DNA flap containing the genetic change of interest via reverse transcriptase. A strand extension, the prime editing complex. 제1항에 있어서, 프라임 편집 가이드 RNA (PEgRNA)가 서열번호 23의 서열을 포함하는 것인, 프라임 편집 복합체. The prime editing complex of claim 1 , wherein the prime editing guide RNA (PEgRNA) comprises the sequence of SEQ ID NO:23. 제1항에 있어서, 표적 또는 상보적 비-표적 가닥이 닉킹되어 유리 3' 단부를 갖는 프라이밍 서열을 형성하는 것인, 프라임 편집 복합체. The prime editing complex of claim 1 , wherein the target or complementary non-target strand is nicked to form a priming sequence having a free 3′ end. 제1항에 있어서, 닉 부위가 PAM 서열의 5' 단부에 대해 -6인, 프라임 편집 복합체.The prime editing complex of claim 1 , wherein the nick site is -6 to the 5' end of the PAM sequence. Francisella novicida Cas9 단백질; 및 역전사 효소 단백질을 포함하는 융합 단백질을 코딩하는 폴리뉴클레오티드. Francisella novicida Cas9 protein; and a polynucleotide encoding a fusion protein comprising a reverse transcriptase protein. Francisella novicida Cas9 단백질 및 역전사 효소 단백질을 코딩하는 폴리뉴클레오티드를 포함하는 벡터.A vector comprising a polynucleotide encoding a Francisella novicida Cas9 protein and a reverse transcriptase protein. 프라이머 결합 부위, 편집 주형 및 상동성 아암을 포함하는 프라임 편집 가이드 RNA (PEgRNA)를 코딩하는 폴리뉴클레오티드를 포함하는 벡터.A vector comprising a polynucleotide encoding a prime editing guide RNA (PEgRNA) comprising a primer binding site, an editing template and a homology arm. Francisella novicida Cas9 단백질; 역전사 효소 단백질; 및 프라임 편집 가이드 RNA (PEgRNA)를 포함하는 프라임 편집 복합체를 포함하는 세포. Francisella novicida Cas9 protein; reverse transcriptase protein; and a prime editing complex comprising a prime editing guide RNA (PEgRNA). 제1항 내지 제13항 중 어느 한 항에 따른 프라임 편집 복합체를 포함하는 유전자 교정용 조성물. A composition for gene editing comprising the prime editing complex according to any one of claims 1 to 13. Francisella novicida Cas9 단백질 및 역전사 효소 단백질을 코딩하는 폴리뉴클레오티드를 포함하는 벡터; 및 프라이머 결합 부위, 편집 주형 및 상동성 아암을 포함하는 프라임 편집 가이드 RNA (PEgRNA)를 코딩하는 폴리뉴클레오티드를 포함하는 벡터를 포함하는 유전자 교정용 조성물. a vector comprising a polynucleotide encoding a Francisella novicida Cas9 protein and a reverse transcriptase protein; and a vector comprising a polynucleotide encoding a prime editing guide RNA (PEgRNA) comprising a primer binding site, an editing template, and a homology arm. 제1항 내지 제13항 중 어느 한 항에 따른 프라임 편집 복합체를 포함하는 돌연변이 또는 단일-뉴클레오티드 다형태(SNP)와 관련된 질환의 예방 또는 치료용 약제학적 조성물.A pharmaceutical composition for preventing or treating a disease associated with a mutation or single-nucleotide polymorphism (SNP) comprising the prime editing complex according to any one of claims 1 to 13. Francisella novicida Cas9 단백질 및 역전사 효소 단백질을 코딩하는 폴리뉴클레오티드를 포함하는 벡터; 및 프라이머 결합 부위, 편집 주형 및 상동성 아암을 포함하는 프라임 편집 가이드 RNA (PEgRNA)를 코딩하는 폴리뉴클레오티드를 포함하는 벡터를 포함하는 돌연변이 또는 단일-뉴클레오티드 다형태(SNP)와 관련된 질환의 예방 또는 치료용 약제학적 조성물.a vector comprising a polynucleotide encoding a Francisella novicida Cas9 protein and a reverse transcriptase protein; and a vector comprising a polynucleotide encoding a prime editing guide RNA (PEgRNA) comprising a primer binding site, an editing template and a homology arm for the prevention or treatment of a disease associated with a mutation or single-nucleotide polymorphism (SNP) pharmaceutical composition for use.
KR1020220009084A 2021-01-21 2022-01-21 Genome replacement and insertion technology using reverse transcriptase based on Francisella novicida Cas9 module KR20220106079A (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR20210008674 2021-01-21
KR1020210008674 2021-01-21

Publications (1)

Publication Number Publication Date
KR20220106079A true KR20220106079A (en) 2022-07-28

Family

ID=82548883

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020220009084A KR20220106079A (en) 2021-01-21 2022-01-21 Genome replacement and insertion technology using reverse transcriptase based on Francisella novicida Cas9 module

Country Status (2)

Country Link
KR (1) KR20220106079A (en)
WO (1) WO2022158898A1 (en)

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
BR112021018606A2 (en) * 2019-03-19 2021-11-23 Harvard College Methods and compositions for editing nucleotide sequences

Also Published As

Publication number Publication date
WO2022158898A1 (en) 2022-07-28

Similar Documents

Publication Publication Date Title
KR101785847B1 (en) Targeted genome editing based on CRISPR/Cas9 system using short linearized double-stranded DNA
CA3129988A1 (en) Methods and compositions for editing nucleotide sequences
US11667917B2 (en) Composition for genome editing using CRISPR/CPF1 system and use thereof
KR20200121782A (en) Uses of adenosine base editor
CN113631708A (en) Methods and compositions for editing RNA
CA3174483A1 (en) Improved methods and compositions for modulating a genome
KR20230003467A (en) Methods and compositions for directed genome editing
JP2020503899A (en) Method for in vitro site-directed mutagenesis using gene editing technology
CN110577971B (en) CRISPR/Sa-SauriCas9 gene editing system and application thereof
WO2023070062A2 (en) Genome editing compositions and methods for treatment of usher syndrome type 3
CN117384880A (en) Engineered nucleic acid modification editor
US20230332184A1 (en) Template guide rna molecules
KR20220106079A (en) Genome replacement and insertion technology using reverse transcriptase based on Francisella novicida Cas9 module
AU2022325166A1 (en) Improved prime editors and methods of use
KR20180128864A (en) Gene editing composition comprising sgRNAs with matched 5&#39; nucleotide and gene editing method using the same
US20230051661A1 (en) Nucleobase Editors
CN110551763B (en) CRISPR/SlutCas9 gene editing system and application thereof
CN110577970B (en) CRISPR/Sa-SlutCas9 gene editing system and application thereof
KR102551876B1 (en) Composition for Genome Editing or Inhibiting Gene Expression comprising Cpf1 and Chimeric DNA-RNA Guide
WO2023029492A1 (en) System and method for site-specific integration of exogenous genes
KR20230120366A (en) Composition for gene editing CRISPR-Cas12a-based Nickase
WO2023024089A1 (en) Base editing system for achieving a-to-c and/or a-to-t base mutation and use thereof
AU2022334454A1 (en) Genome editing compositions and methods for treatment of retinopathy
WO2023192655A2 (en) Methods and compositions for editing nucleotide sequences
WO2023154011A2 (en) Compositions and methods for genome editing