KR20240049838A - 개선된 가이드된 에디팅 시스템 - Google Patents

개선된 가이드된 에디팅 시스템 Download PDF

Info

Publication number
KR20240049838A
KR20240049838A KR1020247010828A KR20247010828A KR20240049838A KR 20240049838 A KR20240049838 A KR 20240049838A KR 1020247010828 A KR1020247010828 A KR 1020247010828A KR 20247010828 A KR20247010828 A KR 20247010828A KR 20240049838 A KR20240049838 A KR 20240049838A
Authority
KR
South Korea
Prior art keywords
sequence
reverse transcriptase
seq
pegrna
protein
Prior art date
Application number
KR1020247010828A
Other languages
English (en)
Inventor
카이샤 가오
유안 종
Original Assignee
쑤저우 치 바이오디자인 바이오테크놀로지 컴퍼니 리미티드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 쑤저우 치 바이오디자인 바이오테크놀로지 컴퍼니 리미티드 filed Critical 쑤저우 치 바이오디자인 바이오테크놀로지 컴퍼니 리미티드
Publication of KR20240049838A publication Critical patent/KR20240049838A/ko

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8201Methods for introducing genetic material into plant cells, e.g. DNA, RNA, stable or transient incorporation, tissue culture methods adapted for transformation
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01HNEW PLANTS OR NON-TRANSGENIC PROCESSES FOR OBTAINING THEM; PLANT REPRODUCTION BY TISSUE CULTURE TECHNIQUES
    • A01H5/00Angiosperms, i.e. flowering plants, characterised by their plant parts; Angiosperms characterised otherwise than by their botanic taxonomy
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/102Mutagenizing nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/62DNA sequences coding for fusion proteins
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8216Methods for controlling, regulating or enhancing expression of transgenes in plant cells
    • C12N15/8218Antisense, co-suppression, viral induced gene silencing [VIGS], post-transcriptional induced gene silencing [PTGS]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8261Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield
    • C12N15/8271Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance
    • C12N15/8274Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance for herbicide resistance
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/12Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)
    • C12N9/1241Nucleotidyltransferases (2.7.7)
    • C12N9/1276RNA-directed DNA polymerase (2.7.7.49), i.e. reverse transcriptase or telomerase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y207/00Transferases transferring phosphorus-containing groups (2.7)
    • C12Y207/07Nucleotidyltransferases (2.7.7)
    • C12Y207/07049RNA-directed DNA polymerase (2.7.7.49), i.e. telomerase or reverse-transcriptase
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/10Plasmid DNA
    • C12N2800/106Plasmid DNA for vertebrates
    • C12N2800/107Plasmid DNA for vertebrates for mammalian

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Biomedical Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Cell Biology (AREA)
  • Medicinal Chemistry (AREA)
  • Physiology (AREA)
  • Botany (AREA)
  • Developmental Biology & Embryology (AREA)
  • Environmental Sciences (AREA)
  • Virology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Crystallography & Structural Chemistry (AREA)

Abstract

본 발명은 개선된 프라이머 에디팅 시스템, 및 상기 시스템을 이용하여 유전자 에디팅을 수행하는 방법에 관한 것이다.

Description

개선된 가이드된 에디팅 시스템
본 발명은 유전공학 분야에 관한 것이다. 구체적으로, 본 발명은 개선된 프라임 에디팅 시스템 및 프라임 에디팅 시스템을 이용한 유전자 에디팅(편집) 방법에 관한 것이다.
많은 중요한 농경학적 특성은 게놈의 서열에 따라 달라진다. 게놈의 특정 서열을 지시적으로(directionally) 변경함으로써 새로운 유전 특성이 유기체에 부여되어 질병 치료 및 육종 개선의 가능성을 제공할 수 있다. 현재, 특정 서열에 대한 에디팅은 게놈 에디팅 기술(예: CRISPR/Cas 기술)에 의해 달성될 수 있으므로 세포의 복구 경로가 활성화되어 손상 부위를 복구할 수 있다. 프라임 에디팅(prime editing, PE) 시스템은 타겟 부위 서열을 정확하게 수정할 수 있는 CRISPR/Cas 기술을 기반으로 한 시스템이다. 이 시스템은 1) 비표적 가닥 절단(nicking) 활성을 갖는 Cas9 뉴클레아제(Cas9-H840A)와 역전사효소(reverse transcriptase, RT)를 포함하는 융합 단백질, 및 2) 3' 말단에 자유 단일 가닥의 복구 주형(repair template)(RT 주형)과 프라이머 결합 부위(primer binding site, PBS)가 있는 pegRNA(프라임 에디팅 gRNA)의 두 부분으로 구성된다. 시스템의 작동 원리는, PBS가 Cas9-H840A에 의해 생성된 유리 단일 가닥에 결합하여 융합 단백질이 지정된 부위에 결합하도록 가이드하고, 지정된 돌연변이를 포함하는 단일 가닥 DNA 서열은 주어진 RT 주형에 따라 전사되고, 표적 부위에 위치한 게놈의 DNA 서열의 임의의 변화가 달성될 수 있다는 것이다.
현재 연구에 따르면 PE의 전반적인 에디팅 효율성은 낮으며 다양한 측면에서 개선이 필요하다. M-MLV 단백질을 변형하거나 다른 관련 단백질과 융합하여 PE 단백질의 안정성이나 발현을 향상시키는 것은 PE 에디팅 효율성을 향상시키는 효과적인 방법이다.
발명의 요약
본 발명은 i) 역전사효소에 점 돌연변이를 일으키거나(point-mutating) 또는 역전사효소로부터 RNase H 도메인과 같은 중복(redundant) 도메인을 삭제하는 것; ii) 역전사효소를 뉴클레오캡시드 단백질 NC와 융합시키는 것; 또는 i)와 ii)의 조합에 의해 프라임 에디팅 효율성을 향상시키는 것에 관한 것이다.
본 발명은 적어도 다음과 같은 구현예를 포함한다:
구현예 1: 하기를 포함하는 식물 게놈의 표적화된 변형을 위한 프라임 에디팅 시스템:
i) 프라임 에디팅 융합 단백질 및/또는 프라임 에디팅 융합 단백질을 코딩하는(encoding) 뉴클레오티드 서열을 포함하는 발현 구축물(construct), 여기서 프라임 에디팅 융합 단백질은 CRISPR 닉카아제(nickase) 및 역전사효소를 포함함; 및/또는
ii) 적어도 하나의 pegRNA 및/또는 적어도 하나의 pegRNA를 코딩하는 뉴클레오티드 서열을 포함하는 발현 구축물,
여기서 적어도 하나의 pegRNA는 5'에서 3' 방향으로 가이드 서열, 스캐폴드 서열, 역전사(RT) 주형 서열 및 프라이머 결합 부위(PBS) 서열을 포함하고,
여기서 적어도 하나의 pegRNA는 융합 단백질과 복합체를 형성하고 융합 단백질을 게놈의 표적 서열에 표적화하여 닉(nick)이 표적 서열에 형성될 수 있게 한다.
구현예 2: 구현예 1에 있어서, CRISPR 닉카아제가 예를 들어 서열번호 2에 나타난 아미노산 서열을 포함하는 Cas9 닉카아제인, 시스템.
구현예 3: 구현예 1 또는 2에 있어서, 역전사효소가 M-MLV 역전사효소 또는 이의 기능적 변이체인, 시스템.
구현예 4: 구현예 1-3 중 어느 하나에 있어서,
(a) 역전사효소가 F155Y, F155V, F156Y, D524N, D200C 중 어느 하나로부터 선택되는 돌연변이를 포함하고, 여기서 아미노산 위치는 서열번호 3을 참조하며;
(b) 역전사효소의 연결 서열(connection sequence)이 결실되고; 및/또는
(c) 역전사효소의 RNase H 도메인이 돌연변이되거나 결실되는 것인,
시스템
구현예 5: 구현예 4에 있어서, 역전사효소가 서열번호 9-15 중 어느 하나에 나타난 서열을 포함하는 것인, 시스템.
구현예 6: 구현예 1-5 중 어느 하나에 있어서, M-MLV 역전사효소와 같은 역전사효소 또는 이의 기능적 변이체가 N-말단 또는 C-말단에서 뉴클레오캡시드 단백질(nucleocapsid protein, NC), 프로테아제(protease, PR) 또는 인테그라제(integrase, IN)와 직접적으로 또는 융합 단백질의 링커를 통해 융합되는 것인, 시스템.
구현예 7: 구현예 6에 있어서, 뉴클레오캡시드 단백질(NC)이 서열번호 6에 나타난 아미노산 서열을 함유하거나, 프로테아제(PR)가 서열번호 7에 나타난 아미노산 서열을 함유하거나, 또는 인테그라제(IN)가 서열번호 8에 나타난 아미노산 서열을 함유하는 것인, 시스템.
구현예 8: 구현예 6 또는 7에 있에서, 역전사효소가 N-말단에서 뉴클레오캡시드 단백질(NC)과 직접적으로 또는 링커를 통해 융합되고, 바람직하게는 RNase H 도메인이 결실된 M-MLV 역전사효소의 기능적 변이체가 N-말단에서 뉴클레오캡시드 단백질(NC)과 직접적으로 또는 링커를 통해 융합되는 것인, 시스템.
구현예 9: 구현예 1-8 중 어느 하나에 있어서, pegRNA의 가이드 서열이 표적 서열과 충분한 서열 동일성(identity)을 가지도록 구성되고 따라서 염기쌍 형성(base pairing)에 의해 표적 서열의 상보적 가닥에 결합하여 서열-특이적 표적화를 달성할 수 있는 것인, 시스템.
구현예 10: 구현예 1-9 중 어느 하나에 있어서, pegRNA의 스캐폴드 서열이 서열번호 17에 나타난 서열을 포함하는 것인, 시스템.
구현예 11: 구현예 1-10 중 어느 하나에 있어서, 프라이머 결합 서열이 표적 서열의 적어도 일부에 상보적이도록 구성되고, 바람직하게는 프라이머 결합 서열이 닉에 의해 유발된 3' 자유 단일 가닥의 적어도 일부, 특히 3' 자유 단일 가닥의 3' 말단에 있는 뉴클레오티드 서열에 상보적인, 시스템.
구현예 12: 구현예 1-11 중 어느 하나에 있어서, 프라이머 결합 서열의 Tm(용융 온도)이 약 18-52℃, 바람직하게는 약 24-36℃, 더욱 바람직하게는 약 28-32℃, 가장 바람직하게는 약 30℃인, 시스템.
구현예 13. 구현예 1-12 중 어느 하나에 있어서, RT 주형 서열이 닉의 하류 서열에 상응하도록 구성되고 원하는 변형을 포함하고, 변형은 하나 이상의 뉴클레오티드의 치환, 결실 및/또는 부가(addition)를 포함하는 것인, 시스템.
구현예 14: 구현예 1-13 중 어느 하나에 있어서, 프라임 에디팅 융합 단백질이 서열번호 19에 나타난 아미노산 서열을 포함하는 것인, 시스템.
구현예 15: 구현예 1-14 중 어느 하나의 프라임 에디팅 시스템을 적어도 하나의 세포에 도입하여 적어도 하나의 세포의 게놈의 표적 서열에 변형을 초래하는 것을 포함하는 유전자 변형 식물을 생산하는 방법.
도 1은 다양한 변형된 PPE 구축물을 나타낸 것이다.
도 2는 벼 원형질체(protoplast)에서 유동 세포 계측법(flow cytometry) 분석으로 얻고 BFP-GFP 리포팅 시스템으로 스크리닝한 다양한 구축물의 에디팅 효율성을 나타낸 것이다.
도 3은 향상된 에디팅 효율성을 갖는 스크리닝된 구축물 PPE-NCv1, PPE-NCv2 및 PPE-ΔRNase H를 pegRNA와 함께 벼 원형질체 세포에 공동 형질전환시킨 후 앰플리콘 시퀀싱 분석에 의해 얻은 다양한 내인성 테스트 부위에 대한 프라임 에디팅 시스템의 에디팅 효율성을 나타낸 것이다.
도 4는 PPE-NCv1, PPE-ΔRNase H, 및 융합된 NC와 결실된 RNase H 두 가지의 조합으로 구축한 ePPE 구축물을 pegRNA와 함께 벼 원형질체 세포에 각각 공동 형질전환시킨 후 앰플리콘 시퀀싱 분석에 의해 얻은 다양한 내인성 테스트 부위에 대한 프라임 에디팅 시스템의 에디팅 효율성을 나타낸 것이다.
도 5는 벼 원형질체에서 에디팅 효율성이 향상된 PPE 단백질의 발현을 나타낸 것이다.
도 6은 ePPE 단백질이 15 bp보다 큰 단편을 결실시키거나 삽입하는 에디팅 효율성을 효과적으로 향상시킬 수 있음을 보여준다.
도 7은 ePPE 단백질이 프라임 에디팅 시스템의 범위를 효과적으로 확장할 수 있음을 보여준다.
도 8은 벼 calli(유합 조직)에서 ePPE의 에디팅 효율성을 나타낸 것이다.
도 9는 ePPE를 사용한 제초제 저항성 벼 식물의 생성을 나타낸 것이다.
도 10은 돼지 세포에서 ePE의 에디팅을 나타낸 것이다.
도 11은 ePPE가 대부분의 벼 내인성 테스트 부위에서 비-표적(off-target) 에디팅의 효율성을 크게 증가시키지 않음을 보여주며, 다양한 내인성 테스트 부위 및 앰플리콘 시퀀싱 분석을 통해 얻은 예상 내인성 비-표적 부위에 대한 프라임 에디팅 시스템의 에디팅 효율성을 보여준다.
도 12는 에디팅된 부위에서 ePPE와 염기 에디팅의 보완적인 기능을 보여준다.
도 13은 ePPE와 이중-pegRNA 전략 및 epegRNAs 전략의 조합이 프라임 에디팅의 효율성을 더욱 향상시킨다는 것을 보여준다.
I. 정의
본 발명에 있어서, 달리 명시하지 않는 한, 본원에서 사용되는 과학 및 기술 용어는 당업자가 일반적으로 이해하는 의미를 지칭한다. 또한, 단백질 및 뉴클레오티드 화학, 분자 생물학, 세포 및 조직 배양, 미생물학, 면역학과 관련하여 본원에서 사용되는 용어 및 실험 과정은 모두 해당 분야에서 일반적으로 사용되는 용어 및 통상적인 방법에 속한다. 예를 들어, 본원에서 사용되는 표준 DNA 재조합 및 분자 클로닝 기술은 당업자에게 잘 알려져 있으며, 다음 참고문헌에 상세하게 설명되어 있다: Sambrook, J., Fritsch, E.F.and Maniatis, T., Molecular Cloning: A Laboratory Manual; Cold Spring Harbor Laboratory Press: Cold Spring Harbor, 1989. 한편, 본 발명의 이해를 돕기 위해 관련 용어에 대한 정의 및 설명을 이하에 제시한다.
본원에서 사용되는 "및/또는"이라는 용어는 해당 용어로 연결되는 항목들의 모든 조합을 포함하며, 각 조합은 본원에 개별적으로 나열된 것으로 간주되어야 한다. 예를 들어, "A 및/또는 B"는 "A", "A 및 B", 및 "B"를 포함한다. 예를 들어, "A, B 및/또는 C"는 "A", "B", "C", "A 및 B", "A 및 C", "B 및 C", 및 "A 및 B 및 C"를 포함한다.
본원에서 "포함하다"라는 용어가 단백질 또는 핵산의 서열을 설명하는 데 사용되는 경우, 단백질 또는 핵산은 해당 서열로 구성될 수도 있고, 단백질 또는 핵산의 한쪽 또는 양쪽 말단에 추가의 아미노산 또는 뉴클레오티드를 가질 수 있지만, 여전히 본 발명에 기술된 활성을 갖는다. 또한, 당업자는 폴리펩티드의 N-말단에 있는 시작 코돈에 의해 코딩된 메티오닌이 특정 실제 조건(예를 들어, 특정 발현 시스템에서 발현되는 경우) 하에서 유지되지만 폴리펩티드의 기능에는 실질적으로 영향을 미치지 않는다는 것을 알고 있다. 따라서, 본 출원의 명세서 및 특허청구범위에 특정 폴리펩티드의 아미노산 서열을 기술할 때, 비록 N-말단의 시작 코돈에 의해 코딩된 메티오닌을 포함하지 않을 수도 있지만, 메티오닌을 포함하는 서열도 포함되며, 상응하게, 그의 코딩 뉴클레오티드 서열은 또한 시작 코돈을 함유할 수 있고; 그 반대도 가능하다.
본원에서 사용되는 "게놈"은 핵에 존재하는 염색체 DNA뿐만 아니라 세포의 세포하(subcellular) 구성요소(예: 미토콘드리아, 색소체(plastids))에 존재하는 소기관(organelle) DNA도 포함한다.
본 문서에서 사용되는 "유기체"에는 게놈 에디팅에 적합한 모든 유기체, 바람직하게는 진핵생물이 포함된다. 유기체의 예로는 인간, 마우스, 래트, 원숭이, 개, 돼지, 양, 소 및 고양이와 같은 포유동물; 닭, 오리 및 거위와 같은 가금류; 벼(쌀), 옥수수, 밀, 수수, 보리, 대두, 땅콩, 애기장대(arabidopsis) 등 외떡잎식물과 쌍떡잎식물을 포함한 식물을 포함하나 이에 국한되지 않는다.
"유전자 변형 유기체"는 외인성 폴리뉴클레오티드를 포함하거나 그의 게놈 내에 변형된 유전자 또는 발현 조절 서열을 포함하는 유기체를 의미한다. 예를 들어, 외인성 폴리뉴클레오티드는 유기체의 게놈에 안정적으로 통합되어 연속적인 세대로 유전될 수 있다. 외인성 폴리뉴클레오티드는 단독으로 또는 재조합 DNA 구축물의 일부로서 게놈에 통합될 수 있다. 변형된 유전자 또는 발현 조절 서열은 유기체 게놈에서 하나 이상의 뉴클레오티드 치환, 결실 및 부가를 포함하는 유전자 또는 발현 조절 서열이다.
"폴리뉴클레오티드", "핵산 서열", "뉴클레오티드 서열" 또는 "핵산 단편"은 단일 또는 이중 가닥이고 선택적으로 합성, 비천연 또는 변경된 뉴클레오티드 염기를 포함하는 RNA 또는 DNA의 중합체를 지칭하기 위해 상호교환적으로 사용된다. 뉴클레오티드는 다음과 같이 단일 문자 지정으로 표시된다: "A"는 아데닐레이트(adenylate) 또는 데옥시아데닐레이트(각각 RNA 또는 DNA의 경우), "C"는 시티딜레이트(cytidylate) 또는 데옥시시티딜레이트, "G"는 구아닐레이트(guanylate) 또는 데옥시구아닐레이트, "U"는 우리딜레이트(uridylate), "T"는 데옥시티미딜레이트(deoxythymidylate), "R"은 퓨린(A 또는 G), "Y"는 피리미딘(C 또는 T), "K"는 G 또는 T, "H"는 A 또는 C 또는 T, "D"는 A, T 또는 G, "I"는 이노신, "N"은 임의의 뉴클레오티드이다.
"폴리펩티드", "펩티드" 및 "단백질"은 아미노산 잔기의 중합체를 지칭하기 위해 본원에서 상호교환적으로 사용된다. 이 용어는 하나 이상의 아미노산 잔기가 상응하는 자연 발생 아미노산의 인공 화학적 유사체인 아미노산 중합체뿐만 아니라 자연 발생 아미노산 중합체에도 적용된다. 용어 "폴리펩티드", "펩티드", "아미노산 서열" 및 "단백질"은 또한 글리코실화, 지질 부착, 황산화(sulfation), 글루탐산 잔기의 감마-카르복실화, 수산화 및 ADP-리보실화(ribosylation)를 포함하지만 이에 제한되지 않는 변형을 또한 포함한다.
본원에서 사용되는 "발현 구축물"은 재조합 벡터와 같이 유기체에서 관심 뉴클레오티드 서열의 발현에 적합한 벡터를 지칭한다. "발현"은 기능성 생산물의 생산을 지칭한다. 예를 들어, 뉴클레오티드 서열의 발현은 뉴클레오티드 서열의 전사(transcription)(예컨대 mRNA 또는 기능적 RNA를 생성하기 위한 전사) 및/또는 RNA의 단백질 전구체 또는 성숙 단백질로의 번역(translation)을 지칭할 수 있다.
본 발명의 "발현 구축물"은 선형 핵산 단편, 원형 플라스미드, 바이러스 벡터일 수 있거나, 또는 일부 구현예에서는, 시험관 내 전사에 의해 생성된 mRNA와 같이 번역될 수 있는 RNA(예컨대 mRNA)일 수 있다.
본 발명의 "발현 구축물"은 상이한 공급원으로부터 유래된 조절 서열 및 관심 뉴클레오티드 서열, 또는 동일한 공급원으로부터 유래되었으나 자연에서 일반적으로 발견되는 것과는 다른 방식으로 배열된 조절 서열 및 관심 뉴클레오티드 서열을 포함할 수 있다.
"프로모터"는 다른 핵산 단편의 전사를 제어할 수 있는 핵산 단편을 지칭한다. 본 발명의 일부 구현예에서, 프로모터는 세포로부터 유래된 것인지 여부에 관계없이 세포 내 유전자의 전사를 제어할 수 있는 프로모터이다. 프로모터는 구성적(constitutive) 프로모터 또는 조직-특이적 프로모터 또는 발달 조절(developmentally-regulated) 프로모터 또는 유도성 프로모터일 수 있다.
프로모터의 예로는 폴리머라제(pol) I, pol II 또는 pol III 프로모터를 포함하지만 이에 국한되지는 않는다. pol I 프로모터의 예로는 닭 RNA pol I 프로모터를 포함한다. pol II 프로모터의 예로는 사이토메갈로바이러스 즉시 초기(cytomegalovirus immediate early)(CMV) 프로모터, 로우스 육종 바이러스 긴 말단 반복(rous sarcoma virus long terminal repeat)(RSV-LTR) 프로모터 및 유인원(simian) 바이러스 40(SV40) 즉시 초기 프로모터를 포함하지만 이에 국한되지는 않는다. pol III 프로모터의 예로는 U6 및 H1 프로모터를 포함한다. 메탈로티오네인(metalothionein) 프로모터와 같은 유도성 프로모터가 사용될 수 있다. 프로모터의 다른 예로는 T7 박테리오파지 프로모터, T3 박테리오파지 프로모터, β-갈락토시다제 프로모터 및 Sp6 박테리오파지 프로모터 등을 포함한다. 식물에 사용되는 경우, 사용될 수 있는 프로모터에는 콜리플라워 모자이크 바이러스(cauliflower mosaic virus) 35S 프로모터, 옥수수(maize) Ubi-1 프로모터, 밀 U6 프로모터, 벼 U3 프로모터, 옥수수 U3 프로모터 및 벼 액틴 프로모터 등이 포함되지만 이에 국한되지는 않는다.
유기체 내로 핵산 분자(예: 플라스미드, 선형 핵산 단편, RNA 등) 또는 단백질의 "도입"은 핵산 또는 단백질이 세포 내에서 기능하도록 핵산 또는 단백질을 유기체의 세포를 형질전환(transform)시키는 데 사용하는 것을 의미한다. 본 발명에서 사용되는 "형질전환"은 안정적인 형질전환과 일시적인 형질전환을 모두 포함한다. "안정적인 형질전환"은 외인성 뉴클레오티드 서열이 게놈에 도입되어 외래 유전자가 안정적으로 유전되는 것을 지칭한다. 일단 안정적으로 형질전환되면, 외인성 핵산 서열은 유기체와 그 연속 세대의 게놈에 안정적으로 통합된다. "일시적인 형질전환"은 외인성 유전자의 안정적인 유전 없이 기능을 수행하는 핵산 분자 또는 단백질이 세포 내로 도입되는 것을 지칭한다. 일시적인 형질전환에서는 외인성 핵산 서열이 게놈에 통합되지 않는다.
"특성(trait)"은 세포 또는 유기체의 생리학적, 형태학적, 생화학적 또는 물리적 특성을 지칭한다.
II. 개선된 프라임 에디팅 시스템
일 측면에서, 본 발명은 하기를 포함하는 유기체 게놈의 표적화된 변형을 위한 프라임 에디팅 시스템에 관한 것이다:
i) 프라임 에디팅 융합 단백질 및/또는 프라임 에디팅 융합 단백질을 코딩하는 뉴클레오티드 서열을 포함하는 발현 구축물, 여기서 프라임 에디팅 융합 단백질은 CRISPR 닉카아제 및 역전사효소를 포함함; 및/또는
ii) 적어도 하나의 pegRNA 및/또는 적어도 하나의 pegRNA를 코딩하는 뉴클레오티드 서열을 포함하는 발현 구축물,
여기서 적어도 하나의 pegRNA는 5'에서 3' 방향으로 가이드 서열, 스캐폴드 서열, 역전사(RT) 주형 서열 및 프라이머 결합 부위(PBS) 서열을 포함한다.
일부 구현예에서, 프라임 에디팅 융합 단백질의 CRISPR 닉카아제 및 역전사효소는 링커를 통해 연결된다.
일부 구현예에서, 적어도 하나의 pegRNA는 융합 단백질과 복합체를 형성하고 융합 단백질을 게놈의 표적 서열에 표적화하여 표적 서열에 닉을 초래할 수 있다.
일 측면에서, 본 발명은 프라임 에디팅 융합 단백질에 관한 것이며, 여기서 프라임 에디팅 융합 단백질은 CRISPR 닉카아제 및 역전사효소를 함유한다.
일 측면에서, 본 발명은 유기체 게놈의 DNA 서열의 표적화된 변형에서 본 발명의 프라임 에디팅 융합 단백질의 용도에 관한 것이다.
일부 구현예에서, 유기체는 식물이다.
본원에서 사용되는 "프라임 에디팅 시스템"은 세포 내 게놈의 역전사 기반 게놈 에디팅에 필요한 구성 요소의 조합을 지칭한다. 시스템의 개별 구성요소, 예를 들어 프라임 에디팅 융합 단백질, gRNA 등은 서로 독립적으로 존재할 수 있거나, 또는 조성물로서 임의의 조합으로 존재할 수 있다.
본원에서 사용되는 "표적 서열"은 게놈에서 길이가 대략 20개 뉴클레오티드이고 5' 또는 3' 플랭킹(flanking) PAM(프로토스페이서 인접 모티프(protospacer adjacent motif)) 서열로 표시되는 서열을 지칭한다. 일반적으로 PAM은 CRISPR 뉴클레아제 또는 그 변이체와 가이드 RNA가 형성하는 복합체에 의해 표적 서열을 인식하는데 필요하다. 예를 들어, Cas9 뉴클레아제 및 이의 변이체의 경우, 표적 서열은 3' 말단에 PAM에 밀접하게 인접해 있고, 예를 들어 5'-NGG-3'이다. PAM의 존재에 기초하여, 당업자는 표적화를 위해 게놈에서 이용가능한 표적 서열을 쉽게 결정할 수 있다. 또한, PAM의 위치에 따라, 표적 서열은 게놈 DNA 분자의 임의의 가닥에 위치할 수 있다. Cas9 또는 이의 유도체, 예컨대 Cas9 닉카아제의 경우, 표적 서열의 길이는 바람직하게는 20개 뉴클레오티드이다.
일부 구현예에서, 융합 단백질의 CRISPR 닉카아제는 게놈 DNA의 표적 서열 내에 닉을 형성할 수 있다. 일부 구현예에서, CRISPR 닉카아제는 Cas9 닉카아제이다.
일부 구현예에서, Cas9 닉카아제는 스트렙토코커스 피오게네 (Streptococcus pyogenes)(S. pyogenes) SpCas9로부터 유래되고, 야생형 SpCas9에 비해 적어도 아미노산 치환 H840A를 포함한다. 예시적인 야생형 SpCas9는 서열번호 1에 기재된 아미노산 서열을 포함한다. 일부 구현예에서, Cas9 닉카아제는 서열번호 2에 기재된 아미노산 서열을 포함한다. 일부 구현예에서, 융합 단백질의 Cas9 닉카아제는 표적 서열의 PAM의 -3 위치 뉴클레오티드(각 PAM 서열의 5' 말단에 있는 첫 번째 뉴클레오티드가 +1 부위 뉴클레오티드로 간주됨)와 -4 위치 뉴클레오티드 사이에 닉을 형성할 수 있다.
일부 구현예에서, Cas9 닉카아제는 변경된 PAM 서열을 인식할 수 있는 Cas9 닉카아제 변이체이다. 변경된 PAM 서열을 인식할 수 있는 다양한 Cas9 닉카아제 변이체가 해당 분야에 알려져 있다. 일부 바람직한 구현예에서, Cas9 닉카아제는 PAM 서열 5'-NG-3'를 인식하는 Cas9 변이체이다. 일부 구현예에서, PAM 서열 5'-NG-3'을 인식하는 Cas9 닉카아제 변이체는 야생형 Cas9에 비해 다음 아미노산 치환 H840A, R1335V, L1111R, D1135V, G1218R, E1219F, A1322R 및 T1337R을 포함하며, 여기서 아미노산 번호 넘버링은 서열번호 1을 참조한다.
본 발명의 Cas9 닉카아제에 의해 형성된 닉은 표적 서열이 3' 말단에서 자유 단일 가닥(3' 자유 단일 가닥) 및 5' 말단에서 자유 단일 가닥(5' 자유 단일 가닥)을 형성하도록 할 수 있다.
일부 구현예에서, 본 발명의 융합 단백질의 역전사효소는 다양한 공급원으로부터 유래될 수 있다. 일부 구현예에서, 역전사효소는 바이러스 유래 역전사효소이다. 예를 들어, 일부 구현예에서, 역전사효소는 M-MLV 역전사효소 또는 이의 기능적 변이체이다. 예시적인 야생형 M-MLV 역전사효소 서열은 서열번호 3에 제시되어 있다.
일부 구현예에서 M-MLV 역전사효소와 같은 역전사효소 또는 이의 기능적 변이체는
(a) 155, 156, 200 및/또는 524 중 어느 하나로부터 선택되는 위치에 돌연변이를 포함하며, 예컨대 F155Y, F155V, F156Y, D524N, D200C 또는 이들의 조합 중 어느 하나로부터 선택되는 돌연변이를 포함하고, 여기서 아미노산 위치는 서열번호 3을 참조하고;
(b) 연결 서열이 결실되고; 및/또는
(c) RNase H 도메인이 돌연변이되거나 결실된다.
일부 바람직한 구현예에서, M-MLV 역전사효소와 같은 역전사효소 또는 이의 기능적 변이체는 D524N으로부터 선택되는 돌연변이를 함유하고, 아미노산 위치는 서열번호 3을 참조한다.
일부 바람직한 구현예에서, M-MLV 역전사효소와 같은 역전사효소 또는 이의 기능적 변이체의 RNase H 도메인이 결실된다.
일부 구현예에서, 연결 서열은 서열번호 4에 나타난 아미노산 서열을 함유한다.
일부 구현예에서, RNase H 도메인은 서열번호 5에 나타난 아미노산 서열을 함유한다.
일부 구현예에서, M-MLV 역전사효소와 같은 역전사효소 또는 이의 기능적 변이체는 서열번호 9-15 중 어느 하나에 나타난 서열을 함유한다.
일부 구현예에서, M-MLV 역전사효소와 같은 역전사효소 또는 이의 기능적 변이체는 N-말단 또는 C-말단에서 뉴클레오캡시드 단백질(NC), 프로테아제(PR) 또는 인테그라제(IN)와 직접적으로 또는 융합 단백질의 링커를 통해 융합된다. 예를 들어, 뉴클레오캡시드 단백질(NC), 프로테아제(PR) 또는 인테그라제(IN)는 M-MLV로부터 유래된다.
일부 구현예에서, 뉴클레오캡시드 단백질(NC)은 서열번호 6에 나타난 아미노산 서열을 함유한다.
일부 구현예에서, 프로테아제(PR)는 서열번호 7에 나타난 아미노산 서열을 함유한다.
일부 구현예에서, 인테그라제(IN)는 서열번호 8에 나타난 아미노산 서열을 함유한다.
일부 바람직한 구현예에서, M-MLV 역전사효소와 같은 역전사효소 또는 이의 기능적 변이체는 N-말단에서 직접적으로 또는 링커를 통해 뉴클레오캡시드 단백질(NC)과 융합된다.
일부 바람직한 구현예에서, M-MLV 역전사효소와 같은 역전사효소 또는 이의 기능적 변이체는 C-말단에서 직접적으로 또는 링커를 통해 뉴클레오캡시드 단백질(NC)과 융합된다.
본원에서 사용되는 "링커"는 길이가 1-50개(예를 들어, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20 또는 20-25 또는 25-50개) 이상의 아미노산이고 2차 또는 그 이상의 구조가 없는 비기능성 아미노산 서열일 수 있다. 예를 들어, 링커는 유연한 링커, 예를 들어 GGGGS, GS, GAP, (GGGGS)x3, GGS, (GGS) x7 등일 수 있다. 예를 들어, 링커는 서열번호 6에 기재된 링커일 수 있다.
일부 구현예에서, 융합 단백질의 CRISPR 닉카아제는 역전사효소의 N-말단에 위치한다. 일부 구현예에서, 융합 단백질의 CRISPR 닉카아제는 역전사효소의 C-말단에 위치한다.
본 발명의 일부 구현예에서, 본 발명의 융합 단백질은 핵 국소화 서열(nuclear localization sequence, NLS)을 추가로 포함할 수 있다. 일반적으로, 융합 단백질의 하나 이상의 NLS는 에디팅 기능을 실현할 수 있는 양으로 세포의 핵에 융합 단백질의 축적을 유도하기에 충분한 강도를 가져야 한다. 일반적으로, 핵 국소화 활성의 강도는 융합 단백질의 NLS의 개수, 융합 단백질의 NLS의 위치, 융합 단백질에 사용되는 하나 이상의 특정 NLS, 또는 이러한 요인의 조합에 의해 결정된다.
일부 구현예에서, 융합 단백질은 서열번호 19에 나타난 아미노산 서열을 함유한다.
본 발명의 적어도 하나의 pegRNA에 포함된 가이드 서열(시드(seed) 서열 또는 스페이서(spacer) 서열이라고도 함)은 표적 서열에 대해 충분한 서열 동일성(바람직하게는 100% 동일성)을 가지도록 구성되어 염기쌍 형성을 통해 표적 서열의 상보적 가닥에 결합함으로써 서열-특이적 표적화를 달성한다.
CRISPR 뉴클레아제(예: Cas9)를 기반으로 하는 게놈 에디팅에 적합한 gRNA의 다양한 스캐폴드 서열이 해당 분야에 알려져 있으며 본 발명의 pegRNA에 사용될 수 있다. 일부 구현예에서, gRNA의 스캐폴드 서열은 서열번호 17에 기재되어 있다.
일부 구현예에서, 프라이머 결합 서열은 표적 서열의 적어도 일부에 상보적이도록 구성되고(바람직하게는 표적 서열의 적어도 일부와 완전히 쌍을 이루며), 바람직하게는 프라이머 결합 서열은 표적 서열이 위치하는 DNA 가닥의 닉에 의해 유발된 3' 자유 단일 가닥의 적어도 일부에 상보적이며(바람직하게는 3' 자유 단일 가닥의 적어도 일부와 완전히 쌍을 이루며), 특히 3' 자유 단일 가닥의 3' 말단에 있는 뉴클레오티드 서열에 상보적이다(바람직하게는 완전히 쌍을 이룬다). 가닥의 3' 자유 단일 가닥이 염기쌍 형성에 의해 프라이머 결합 서열과 결합할 때, 3' 자유 단일 가닥은 프라이머 역할을 할 수 있고, 프라이머 결합 서열에 밀접하게 인접한 역전사(RT) 주형 서열은 융합 단백질 내 역전사효소에 의한 역전사를 위한 주형 역할을 할 수 있으며, 역전사(RT) 주형 서열에 해당하는 DNA 서열은 신장(extension)을 통해 획득된다.
프라이머 결합 서열은 CRISPR 닉카아제에 의해 표적 서열에 형성된 자유 단일 가닥의 길이에 따라 달라지지만, 특이적 결합을 보장할 수 있는 최소 길이를 가져야 한다. 일부 구현예에서, 프라이머 결합 서열은 길이가 4-20개 뉴클레오티드, 예를 들어 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 및 20개 길이의 뉴클레오티드이다.
일부 구현예에서, 프라이머 결합 서열은 약 52℃ 이하의 Tm(용융 온도)을 갖도록 구성된다. 일부 구현예에서, 프라이머 결합 서열의 Tm(용융 온도)은 약 18℃-52℃, 바람직하게는 약 24℃-36℃, 더욱 바람직하게는 약 28℃-32℃, 가장 바람직하게는 약 30℃이다.
핵산 서열의 Tm을 계산하는 방법은 당업계에 잘 알려져 있으며, 예를 들어 Oligo Analysis Tool 온라인 분석 도구를 계산에 사용할 수 있다. 예시적인 계산식은 Tm=N G:C *< 4+N A:T *< 2 이며, 여기서 N G:C는 서열 내 G 및 C 염기의 개수이고 N A:T는 서열 내 A 및 T 염기의 개수이다. 적절한 PBS 길이를 선택함으로써 적절한 Tm을 얻을 수 있다. 대안적으로, 적절한 표적 서열을 선택함으로써 적절한 Tm을 갖는 PBS 서열을 얻을 수 있다.
일부 구현예에서, RT 주형 서열은 임의의 서열일 수 있다. 상기 역전사를 통해, 표적 서열이 위치한 DNA 가닥(즉, 표적 서열의 PAM을 포함하는 가닥)에 그의 서열 정보가 통합될 수 있으며, 이후 세포의 DNA 복구를 통해 RT 주형의 서열 정보를 함유하는 DNA 이중 가닥이 형성된다. 일부 구현예에서, RT 주형 서열은 원하는 변형(들)을 포함한다. 예를 들어, 원하는 변형은 하나 이상의 뉴클레오티드의 치환, 결실 및/또는 부가를 포함한다. 예를 들어, 변형은 C에서 T로의 치환, C에서 G로의 치환, C에서 A로의 치환, G에서 T로의 치환, G에서 C로의 치환, G에서 A로의 치환, A에서 T로의 치환, A에서 G로의 치환, A에서 C로의 치환, T에서 C로의 치환, T에서 G로의 치환 및 T에서 A로의 치환으로부터 선택되는 하나 이상의 치환을 포함하고; 및/또는 하나 이상의 뉴클레오티드의 결실, 예를 들어 1 내지 약 100개 이상의 뉴클레오티드의 결실, 예를 들어 1, 2, 3, 4, 5, 약 10, 약 20, 약 30, 약 40, 약 50, 약 75, 약 100개 뉴클레오티드의 결실을 포함하고; 및/또는 하나 이상의 뉴클레오티드의 삽입(insertion), 예를 들어 1 내지 약 100개 이상의 뉴클레오티드의 삽입, 예를 들어 1 내지 약 100개 이상의 뉴클레오티드의 삽입, 예를 들어 1, 2, 3, 4, 5, 약 10, 약 20, 약 30, 약 40, 약 50, 약 75, 약 100개 뉴클레오티드의 삽입을 포함한다.
일부 구현예에서, RT 주형 서열은 표적 서열의 닉 하류의 서열에 상응하는 것으로 구성되고(예를 들어, 표적 서열의 닉 하류의 서열의 적어도 일부에 상보적임) 원하는 변형(들)을 함유한다. 예를 들어, 원하는 변형은 하나 이상의 뉴클레오티드의 치환, 결실 및/또는 부가를 포함한다. 예를 들어, 변형은 C에서 T로의 치환, C에서 G로의 치환, C에서 A로의 치환, G에서 T로의 치환, G에서 C로의 치환, G에서 A로의 치환, A에서 T로의 치환, A에서 G로의 치환, A에서 C로의 치환, T에서 C로의 치환, T에서 G로의 치환 및 T에서 A로의 치환으로부터 선택되는 하나 이상의 치환을 포함하고; 및/또는 하나 이상의 뉴클레오티드의 결실, 예를 들어 1 내지 약 100개 이상의 뉴클레오티드의 결실, 예를 들어 1, 2, 3, 4, 5, 약 10, 약 20, 약 30, 약 40, 약 50, 약 75, 약 100개 뉴클레오티드의 결실을 포함하고; 및/또는 하나 이상의 뉴클레오티드의 삽입, 예를 들어 1 내지 약 100개 이상의 뉴클레오티드의 삽입, 예를 들어 1 내지 약 100개 이상의 뉴클레오티드의 삽입, 예를 들어 1, 2, 3, 4, 5, 약 10, 약 20, 약 30, 약 40, 약 50, 약 75, 약 100개 뉴클레오티드의 삽입을 포함한다.
일부 구현예에서, RT 주형 서열은 길이가 약 1-300개 이상의 뉴클레오티드, 예를 들어 1, 2, 3, 4, 5, 약 10, 약 20, 약 30, 약 40, 약 50, 약 75, 약 100, 약 125, 약 150, 약 175, 약 200, 약 225, 약 250, 약 275, 약 300개 뉴클레오티드 또는 그 이상의 뉴클레오티드 길이일 수 있다. 바람직하게는, RT 주형 서열은 길이가 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22 및 23개 뉴클레오티드이다.
일부 구현예에서, 프라임 에디팅 시스템은 닉킹 gRNA(닉킹 gRNA는 추가적인 닉을 생성하는 데 사용됨) 및/또는 닉킹 gRNA를 인코딩하는 뉴클레오티드 서열을 포함하는 발현 구축물을 추가로 포함하며, 여기서 닉킹 gRNA는 가이드 서열 및 스캐폴드 서열을 포함한다. 일부 바람직한 구현예에서, 닉킹 gRNA는 역전사(RT) 주형 서열 및 프라이머 결합 부위(PBS) 서열을 함유하지 않는다.
본 발명의 닉킹 gRNA의 가이드 서열(시드 서열 또는 스페이서 서열이라고도 함)은 게놈 내의 닉킹 표적 서열에 대해 충분한 서열 동일성(바람직하게는 100% 동일성)을 가지도록 구성되어, 본 발명의 융합 단백질은 닉킹 표적 서열에 표적화되어 닉킹 표적 서열에 닉이 발생하며, 여기서 닉킹 표적 서열과 pegRNA가 표적화하는 표적 서열(pegRNA 표적 서열)은 게놈 DNA의 반대편 가닥에 위치한다. 일부 구현예에서, 닉킹 RNA에 의해 형성된 닉과 pegRNA에 의해 형성된 닉은 약 1 내지 약 300개 이상의 뉴클레오티드만큼 떨어져 있으며, 예를 들어 1, 2, 3, 4, 5, 약 10, 약 20, 약 30, 약 40, 약 50, 약 75, 약 100, 약 125, 약 150, 약 175, 약 200, 약 225, 약 250, 약 275, 약 300개의 뉴클레오티드 또는 그 이상의 뉴클레오티드만큼 떨어져 있다. 일부 구현예에서, 닉킹 RNA에 의해 생성된 닉은 pegRNA에 의해 형성된 닉의 상류 또는 하류에 위치한다(상류 또는 하류는 pegRNA 표적 서열이 위치하는 DNA 가닥을 지칭한다). 일부 구현예에서, 닉킹 gRNA의 가이드 서열은 에디팅 이벤트가 발생한 후 반대 가닥의 pegRNA 표적 서열(변형된 pegRNA 표적 서열)에 대해 충분한 서열 동일성(바람직하게는 100% 동일성)을 가져서 닉킹 gRNA는 pegRNA에 의해 유도된 서열 표적화 및 변형 후에 생성된 닉킹 표적 서열만을 표적으로 삼는다. 일부 구현예에서, 닉킹 표적 서열의 PAM은 pegRNA 표적 서열의 상보적 서열 내에 위치한다.
일부 구현예에서, pegRNA 및/또는 닉킹 gRNA의 서열은 자가 처리 시스템을 사용하여 정확하게 처리될 수 있다. 일부 특정 구현예에서, pegRNA 및/또는 닉킹 gRNA의 5' 말단은 첫 번째 리보자임(ribozyme)의 3' 말단에 연결되며, 여기서 첫 번째 리보자임은 pegRNA 및/또는 닉킹 gRNA의 5' 말단에서 융합체를 절단하도록 설계되고; 및/또는 pegRNA 및/또는 닉킹 gRNA의 3' 말단은 두 번째 리보자임의 5' 말단에 연결되며, 여기서 두 번째 리보자임은 pegRNA 및/또는 닉킹 gRNA의 3' 말단에서 융합체를 절단하도록 설계된다. 첫 번째 또는 두 번째 리보자임의 설계는 당업자의 능력 내에 있다. 예를 들어, Gao et al. JIPB, apr, 2014; Vol 56, Issue 4, 343-349를 참조하라. gRNA를 정밀하게 처리하는 방법에 대해서는 예를 들어 WO 2018/149418을 참조하라.
일부 구현예에서, 프라임 에디팅 시스템은 적어도 한 쌍의 pegRNA 및/또는 적어도 한 쌍의 pegRNA를 코딩하는 뉴클레오티드 서열을 포함하는 발현 구축물을 포함한다. 일부 구현예에서, pegRNA 쌍 중 2개의 pegRNA는 게놈 DNA의 동일한 가닥 상의 상이한 표적 서열을 표적화하도록 구성된다. 일부 구현예에서, pegRNA 쌍 중 2개의 pegRNA는 게놈 DNA의 서로 다른 가닥에 있는 표적 서열을 표적화하도록 구성된다. 일부 구현예에서, pegRNA 쌍 중 하나의 pegRNA의 표적 서열에 대한 PAM은 센스 가닥에 위치하고, 다른 pegRNA에 대한 PAM은 안티센스 가닥에 위치한다. 일부 구현예에서, 2개의 pegRNA의 유도된 닉은 각각 변형될 부위의 양쪽에 위치한다. 일부 구현예에서, 센스 가닥에 대한 pegRNA 유도 닉은 변형될 부위의 상류(5' 방향)에 위치하고, 안티센스 가닥에 대한 pegRNA 유도 닉은 변형될 부위의 하류(3' 방향)에 위치한다. "상류" 또는 "하류"는 센스 가닥을 지칭한다. 일부 구현예에서, 2개의 pegRNA에 의해 유도된 닉은 약 1 내지 약 300개 이상의 뉴클레오티드만큼 떨어져 있고, 예를 들어 1-15개의 뉴클레오티드만큼 떨어져 있다.
일부 구현예에서, pegRNA 쌍 중 2개의 pegRNA는 동일한 원하는 변형을 도입하도록 구성된다. 예를 들어, 하나의 pegRNA는 센스 가닥에 A에서 G로의 치환을 도입하도록 구성되고, 다른 pegRNA는 안티센스 가닥의 상응하는 위치에 T에서 C로의 치환을 도입하도록 구성된다. 또 다른 예를 들어, 하나의 pegRNA는 센스 가닥에 2개의 뉴클레오티드 결실을 도입하도록 구성되고, 다른 pegRNA는 유사하게 안티센스 가닥의 상응하는 위치에 2개의 뉴클레오티드 결실을 도입하도록 구성된다. 다른 유형의 변형도 비슷한 방식으로 이루어질 수 있다. 적절한 RT 주형 서열을 설계하면 두 개의 서로 다른 가닥을 표적으로 하는 pegRNA가 동일한 원하는 변형을 달성할 수 있다.
일부 바람직한 구현예에서, 본 발명의 pegRNA는 epegRNA이다. epegRNA의 구성은 본 명세서에 참고로 포함된 James W. Nelson et al., Engineered pegRNAs improve prime editing efficiency. Nature Biotechnology volume 40, 402-410 (2022)을 참조할 수 있다. 일부 구현예에서, epegRNA는 3'-tevopreQ1-8nt 링커 변형이 있는 epegRNA이다.
다양한 유기체에서 효율적인 발현을 얻기 위해, 본 발명의 일부 구현예에서, 융합 단백질을 코딩하는 뉴클레오티드 서열은 게놈이 변형될 유기체 종에 대해 코돈 최적화(codon optimization)를 거친다.
코돈 최적화는 천연 서열의 적어도 하나의 코돈(예를 들어, 약 1, 2, 3, 4, 5, 10, 15, 20, 25, 50개 이상의 코돈 또는 그 이상)을 천연 아미노산 서열을 유지하면서 해당 숙주 세포의 유전자에서 더 빈번하게 또는 가장 빈번하게 사용되는 코돈으로 대체함으로써 관심 숙주 세포에서의 발현 강화를 위해 핵산 서열을 변형시키는 과정을 지칭한다. 다양한 종은 특정 아미노산의 특정 코돈에 대해 특별한 편향(bias)을 나타낸다. 코돈 편향(유기체 간 코돈 사용의 차이)은 종종 메신저 RNA(mRNA)의 번역 효율성과 관련이 있으며, 이는 무엇보다도 번역되는 코돈의 특성과 특정 트랜스퍼(transfer) RNA(tRNA) 분자의 이용 가능성에 따라 달라지는 것으로 여겨진다. 세포에서 선택된 tRNA의 우세는 일반적으로 펩타이드 합성에서 가장 자주 사용되는 코돈을 반영한다. 따라서, 유전자는 코돈 최적화에 기초하여 주어진 유기체에서 최적의 유전자 발현을 위해 맞춤화될 수 있다. 코돈 사용 테이블은 예를 들어 www.kazusa.orjp/codon/에서 이용 가능한 "코돈 사용 데이터베이스"에서 쉽게 사용할 수 있으며 이러한 테이블은 다양한 방법으로 조정할 수 있다. Nakamura, Y, et al. "Codon usage tabulated from the international DNA sequence databases: status for the year 2000" Nucl. Acids Res. 28:292 (2000)을 참조하라.
III. 세포 게놈의 표적 서열을 변형하는 방법
또 다른 측면에서, 본 발명은 본 발명의 프라임 에디팅 시스템을 적어도 하나의 세포에 도입하여 적어도 하나의 세포의 게놈의 표적 서열을 변형시키는 것을 포함하는 유전자 변형 세포를 생산하는 방법을 제공한다. 변형은 하나 이상의 뉴클레오티드의 치환, 결실 및/또는 부가를 포함한다. 예를 들어, 변형은 C에서 T로의 치환, C에서 G로의 치환, C에서 A로의 치환, G에서 T로의 치환, G에서 C로의 치환, G에서 A로의 치환, A에서 T로의 치환, A에서 G로의 치환, A에서 C로의 치환, T에서 C로의 치환, T에서 G로의 치환 및 T에서 A로의 치환으로부터 선택되는 하나 이상의 치환을 포함하고; 및/또는 하나 이상의 뉴클레오티드의 결실, 예를 들어 1 내지 약 100개 이상의 뉴클레오티드의 결실, 예를 들어 1, 2, 3, 4, 5, 약 10, 약 20, 약 30, 약 40, 약 50, 약 75, 약 100개 뉴클레오티드의 결실을 포함하고; 및/또는 하나 이상의 뉴클레오티드의 삽입, 예를 들어 1 내지 약 100개 이상의 뉴클레오티드의 삽입, 예를 들어 1 내지 약 100개 이상의 뉴클레오티드의 삽입, 예를 들어 1, 2, 3, 4, 5, 약 10, 약 20, 약 30, 약 40, 약 50, 약 75, 약 100개 뉴클레오티드의 삽입을 포함한다.
또 다른 측면에서, 본 발명은 또한 본 발명의 프라임 에디팅 시스템을 세포에 도입하는 것을 포함하는 유전자 변형 세포를 생산하는 방법을 제공한다.
또 다른 측면에서, 본 발명은 또한 본 발명의 방법에 의해 생산된 유전자 변형된 세포 및 세포의 자손을 함유하는 유전자 변형 유기체를 제공한다.
본 발명에 있어서, 변형되는 표적 서열은 게놈 내 임의의 위치, 예를 들어 단백질을 코딩하는 유전자와 같은 기능적 유전자에 위치할 수 있거나, 또는 예를 들어 프로모터 영역 또는 인핸서 영역과 같은 유전자 발현 조절 영역에 위치함으로써 유전자 기능적 변형 또는 유전자 발현 변형이 달성될 수 있다. 세포의 표적 서열의 변형은 T7EI, PCR/RE 또는 서열분석 방법으로 검출할 수 있다.
본 발명의 방법에 있어서, 프라임 에디팅 시스템은 당업자에게 잘 알려진 다양한 방법에 의해 세포 내로 도입될 수 있다.
본 발명의 프라임 에디팅 시스템을 세포에 도입하는 데 사용할 수 있는 방법으로는 인산칼슘 형질감염(transfection), 원형질체(protoplast) 융합, 전기천공(electroporation), 리포펙션(lipofection), 미세주사, 바이러스 감염(예: 바쿨로바이러스(baculovirus), 백시니아(vaccinia) 바이러스, 아데노바이러스, 아데노-연관 바이러스, 렌티바이러스 및 기타 바이러스), 유전자 총(gene gun) 방법, PEG 매개 원형질체 형질전환, 아그로박테리움 매개 형질전환을 포함하나 이에 국한되지는 않는다.
본 발명의 방법에 의해 유전적으로 에디팅될 수 있는 세포는 예를 들어 인간, 마우스, 래트, 원숭이, 개, 돼지, 양, 소 및 고양이와 같은 포유동물; 닭, 오리 및 거위와 같은 가금류; 및 벼, 옥수수, 밀, 수수, 보리, 대두, 땅콩, 애기장대 등 외떡잎식물과 쌍떡잎식물을 포함한 식물로부터 유래될 수 있다.
일부 구현예에서, 본 발명의 방법은 시험관 내에서 수행된다. 예를 들어, 세포는 분리된 세포이거나, 분리된 조직이나 기관의 세포이다.
일부 다른 구현예에서, 본 발명의 방법은 또한 생체내에서 수행될 수 있다. 예를 들어, 세포는 유기체 내의 세포이고, 본 발명의 시스템은 예를 들어 바이러스 또는 아그로박테리움-매개 방법에 의해 생체 내 도입될 수 있다.
IV. 유전자 변형 식물을 생산하는 방법
또 다른 측면에서, 본 발명은 본 발명의 프라임 에디팅 시스템을 적어도 하나의 식물에 도입하여 적어도 하나의 식물의 게놈을 변형시키는 것을 포함하는, 유전자 변형 식물을 생산하는 방법을 제공한다. 변형은 하나 이상의 뉴클레오티드의 치환, 결실 및/또는 부가를 포함한다. 예를 들어, 변형은 C에서 T로의 치환, C에서 G로의 치환, C에서 A로의 치환, G에서 T로의 치환, G에서 C로의 치환, G에서 A로의 치환, A에서 T로의 치환, A에서 G로의 치환, A에서 C로의 치환, T에서 C로의 치환, T에서 G로의 치환 및 T에서 A로의 치환으로부터 선택되는 하나 이상의 치환을 포함하고; 및/또는 하나 이상의 뉴클레오티드의 결실, 예를 들어 1 내지 약 100개 이상의 뉴클레오티드의 결실, 예를 들어 1, 2, 3, 4, 5, 약 10, 약 20, 약 30, 약 40, 약 50, 약 75, 약 100개 뉴클레오티드의 결실을 포함하고; 및/또는 하나 이상의 뉴클레오티드의 삽입, 예를 들어 1 내지 약 100개 이상의 뉴클레오티드의 삽입, 예를 들어 1 내지 약 100개 이상의 뉴클레오티드의 삽입, 예를 들어 1, 2, 3, 4, 5, 약 10, 약 20, 약 30, 약 40, 약 50, 약 75, 약 100개 뉴클레오티드의 삽입을 포함한다.
일부 구현예에서, 방법은 적어도 하나의 식물로부터 원하는 변형을 갖는 식물을 스크리닝하는 단계를 추가로 포함한다.
본 발명의 방법에 있어서, 프라임 에디팅 시스템은 당업자에게 잘 알려진 다양한 방법으로 식물에 도입될 수 있다. 본 발명의 게놈 에디팅 시스템을 식물에 도입하기 위해 사용되는 방법으로는 유전자 총 방법, PEG 매개 원형질체 형질전환, 아그로박테리움 매개 형질전환, 식물 바이러스 매개 형질전환, 꽃가루 관(pollen tube) 경로 및 난소 주입 방법을 포함하지만 이에 국한되지는 않는다. 바람직하게는, 프라임 에디팅 시스템은 일시적인 형질전환에 의해 식물에 도입된다.
본 발명의 방법에 있어서, 식물 세포에 프라임 에디팅 융합 단백질과 gRNA를 도입 또는 생산하는 것만으로 게놈의 변형이 이루어질 수 있으며, 에디팅 시스템의 구성요소를 코딩하는 외인성 폴리뉴클레오티드를 식물로 안정적으로 형질전환시키지 않고도 변형은 안정적으로 유전될 수 있다. 이는 안정적으로 존재하는(지속적으로 생산되는) 게놈 에디팅 시스템으로 인한 잠재적인 비-표적(off-target) 효과를 방지하고 또한 식물 게놈에 외인성 뉴클레오티드 서열의 통합을 방지하여 더 큰 생물학적 안전성을 제공한다.
일부 바람직한 구현예에서, 외인성 뉴클레오티드 서열이 식물 게놈으로 통합되는 것을 피하기 위해 선택압(selection pressure) 없이 도입이 수행된다.
일부 구현예에서, 도입은 본 발명의 게놈 에디팅 시스템을 분리된 식물 세포 또는 조직으로 형질전환시킨 다음, 형질전환된 식물 세포 또는 조직을 온전한 식물로 재생시키는 것을 포함한다. 바람직하게는, 재생은 선택압 없이 수행되며, 즉 조직 배양 동안 발현 벡터 상의 선택가능한 유전자에 대한 선택제(selection agent)가 사용되지 않는다. 선택제의 사용을 피하면 식물의 재생 효율을 증가시켜 외인성 뉴클레오티드 서열이 없는 변형된 식물을 얻을 수 있다.
다른 구현예에서, 본 발명의 프라임 에디팅 시스템은 잎, 새싹 끝, 꽃가루 관, 어린 이삭(young ear) 또는 배축(hypocotyl)과 같은 온전한 식물의 특정 부분 내로 형질전환될 수 있다. 이는 조직 배양에서 재생하기가 어려운 식물의 형질전환에 특히 적합한다.
본 발명의 일부 구현예에서, 시험관 내 발현된 단백질 및/또는 시험관 내 전사된 RNA 분자(예를 들어, 발현 구축물은 시험관 내 전사된 RNA 분자이다)는 식물 내로 직접 형질전환된다. 단백질 및/또는 RNA 분자는 식물 세포에서 게놈 에디팅을 수행할 수 있으며 이후 세포에 의해 분해되어 식물 게놈에 외인성 뉴클레오티드 서열이 통합되는 것을 방지한다.
따라서, 일부 구현예에서, 식물 유전자 변형 및 육종을 위한 본 발명의 방법을 사용하면 외인성 폴리뉴클레오티드 통합이 없는 게놈을 갖는 식물, 즉 트랜스진(transgene)이 없는 변형 식물을 얻을 수 있다.
일부 구현예에서, 방법은 프라임 에디팅 시스템이 도입된 식물 세포, 조직 또는 전체 식물을 상승된 온도에서 배양하는 것을 추가로 포함하며, 예를 들어 상승된 온도는 37℃이다.
본 발명의 일부 구현예에서, 변형된 게놈 영역은 농경학적 특성과 같은 식물 특성과 연관되어, 변형된 결과 야생형 식물에 비해 농경학적 특성과 같은 변경된(바람직하게는 개선된) 특성을 갖는 식물이 생성된다.
일부 구현예에서, 방법은 원하는 변형 및/또는 농경학적 특성과 같은 원하는 특성을 갖는 식물을 스크리닝하는 단계를 추가로 포함한다.
본 발명의 일부 구현예에서, 방법은 유전자 변형 식물의 자손을 얻는 단계를 추가로 포함한다. 바람직하게는, 유전자 변형 식물 또는 이의 자손은 원하는 변형 및/또는 농경학적 특성과 같은 원하는 특성을 갖는다.
또 다른 측면에서, 본 발명은 또한 유전자 변형 식물 또는 이의 자손 또는 이의 일부를 제공하며, 여기서 식물은 위에서 설명한 본 발명에 따른 방법에 의해 수득된다. 일부 구현예에서, 유전자 변형 식물 또는 이의 자손 또는 이의 일부는 트랜스진이 없다. 바람직하게는, 유전자 변형 식물 또는 이의 자손은 원하는 유전적 변형 및/또는 농경학적 특성과 같은 원하는 특성을 갖는다.
또 다른 측면에서, 본 발명은 상기 본 발명의 방법에 의해 얻은 제1 유전자 변형 식물을 변형을 포함하지 않는 제2 식물과 교배시켜 유전자 변형을 제2 식물에 도입하는 단계를 포함하는 식물 육종 방법을 제공한다. 바람직하게는, 제1 유전자 변형 식물은 농경학적 특성과 같은 원하는 특성을 가진다.
"농업적 특성"은 잎의 녹색도, 수확량, 성장률, 바이오매스, 성숙 시 신선 중량, 성숙 시 건조 중량, 과일 수확량, 종자 수확량, 총 식물 질소 함량, 과일 질소 함량, 종자 질소 함량, 영양(vegetative) 조직 내 질소 함량, 총 식물 유리 아미노산 함량, 과일 유리 아미노산 함량, 종자 유리 아미노산 함량, 영양 조직 내 유리 아미노산 함량, 총 식물 단백질 함량, 과일 단백질 함량, 종자 단백질 함량, 영양 조직 내 단백질 함량, 가뭄 저항성, 질소 흡수, 뿌리 롯징(lodging), 수확 지수, 줄기 롯징, 식물 높이, 이삭 높이, 이삭 길이, 질병 저항성, 내한성, 내염성 및 경작자 수(tiller number) 등을 포함하지만 이에 국한되지 않는 측정 가능한 파라미터이다.
V. 키트
본 발명은 또한 본 발명의 방법에 사용하기 위한 키트를 포함하고, 이 키트는 적어도 본 발명의 프라임 에디팅 시스템 또는 프라임 에디팅 융합 단백질의 발현 구축물을 포함한다. 키트는 pegRNA를 제조하기 위한 발현 구축물 및 관련 시약을 또한 포함한다. 키트는 또한 유기체 또는 유기체 세포에 프라임 에디팅 시스템을 도입하기 위한 시약을 포함할 수 있다. 키트는 또한 키트 내용물의 의도된 용도 및/또는 사용 방법을 나타내는 라벨을 포함한다. 라벨이라는 용어에는 키트에 포함되어 있거나 키트와 함께 제공되는 모든 서면 또는 녹음 자료가 포함된다.
실시예
재료 및 방법
1. 벡터 구축
PPE-F155Y, PPE-F155V, PPE-F156Y, PPE-D524N, PPE-N200C, PPE-ΔRNase H 및 PPE-ΔRNase H-ΔConnection을 코딩하는 유전자 단편을 각각 중합효소연쇄반응(PCR)에 의해 PPE(서열번호 18)를 코딩하는 유전자 단편 내 M-MLV 역전사효소의 상응하는 부위에서 점 돌연변이 또는 상응하는 단편의 결실을 통해 수득한 후, 생성된 단편을 Gibson 방법으로 연결하여 상응하는 최종 플라스미드를 얻었다. F155Y, F155V, F156Y, D524N 및 N200C를 함유하는 M-MLV 역전사효소 서열을 각각 서열번호 9-13에 나타내었다. M-MLV 역전사효소 ΔRNase H의 서열은 서열번호 14에 나타내었다. M-MLV 역전사효소 ΔRNase H-ΔConnection의 서열은 서열번호 15에 나타내었다.
또한, 뉴클레오캡시드 단백질 NC(서열번호 6), 프로테아제 PR(서열번호 7) 또는 인테그라제 IN(서열번호 8)을 코딩하는 유전자 단편을 식물에 대해 코돈 최적화하고 PPE의 M-MLV를 코딩하는 유전자 단편의 5'-말단 또는 3'-말단에 각각 융합시킨 후, 생성된 단편을 Gibson 방법으로 구축하여 상응하는 최종 플라스미드를 얻었다. 유사하게, 뉴클레오캡시드 단백질 NC를 코딩하는 유전자 단편을 식물에 대해 코돈 최적화하고 PPE-ΔRNase H의 M-MLV 역전사효소 ΔRNase H를 코딩하는 유전자 단편의 5'-말단에 융합시켜 PPE-ΔRNase H-NC(향상된 PPE, ePPE, 및 서열번호 19에 나타난 아미노산 서열)를 얻었다. 이어서, 이를 Gibson 방법으로 구축하여 상응하는 최종 벡터를 얻었다. 특정 벡터를 도 1에 나타내었다.
벼에 사용하기에 적합한 OsU3-pegRNA 구축물을 얻기 위해 Gibson 방법을 사용하여 pegRNA 단편(RT 및 PBS 서열 포함)을 OsU3 프로모터에 의해 구동되는 벡터로 구축하였다.
2. 원형질체 분리 및 형질전환
본 발명에 사용된 원형질체는 벼 품종 Zhonghua 11로부터 유래되었다.
2.1 벼 모종 재배
벼 품종은 Zhonghua 11이었다. 종자를 75% 에탄올로 1분간 먼저 헹군 다음, 4% 차아염소산나트륨(sodium hypochlorite)으로 30분간 처리하고, 멸균수로 5회 이상 세척하였다. 처리된 종자를 M6 배양 배지에서 26℃에서 3-4주 동안 배양하고 빛으로부터 보호하였다.
2.2 벼 원형질체의 분리
(1) 벼의 줄기를 잘라낸 후, 가운데 부분을 칼날을 사용하여 0.5-1 mm 필라멘트(filament)로 자른다. 필라멘트를 암실에서 0.6 M 만니톨 용액으로 10분 동안 처리하고, 필터로 여과하고, 효소분해 용액(0.45 μm 막으로 여과) 50 mL에 넣고, 30분 동안 진공화(약 15 Kpa의 압력 강도)하고, 꺼내어 실온에서 5시간 동안 효소분해를 위해 진탕기(10 rpm)에 두었다.
(2) 효소분해 산물을 30-50 mL W5를 첨가하여 희석하고 75 μm 나일론 필터막으로 여과하여 둥근 바닥 원심분리 튜브(50 mL)에 넣었다.
(3) 250 g(rcf)에서 23℃에서 3분 동안 원심분리를 수행한 후 상청액을 폐기하였다.
(4) 세포를 20 mL W5로 약간 현탁시키고, 단계 (3)을 반복하였다.
(5) 형질전환을 위해 세포를 현탁시키기 위해 적당량의 MMG를 첨가하였다.
2.3 원형질체의 형질전환
(1) 형질전환하려는 벡터 10 μg을 각각 2 mL 원심분리용 튜브에 첨가하고 잘 혼합하였다. 200 μL의 원형질체를 팁이 있는 피펫으로 채취하고 가볍게 두드려 잘 혼합하였다. 220 μL PEG4000 용액을 첨가하고 가볍게 두드려 잘 혼합한 후 빛이 없는 상온에서 20-30분간 형질전환을 유도하였다.
(2) 880 μL W5를 첨가하고 약간 뒤집어 잘 혼합하고, 250 g(rcf)에서 3분 동안 원심분리를 수행한 후 상청액을 버렸다.
(3) 1 mL WI 용액을 첨가하고 부드럽게 뒤집어 잘 혼합한 후 유동관으로 부드럽게 옮겨 실온에서 약 40시간 동안 암실에서 배양하였다.
3. 유동 세포 계측법 분석(flow cytometry analysis)
유동 세포 계측법 분석을 위한 FACSAria III(BD Biosciences) 기기는 하기 특정 작업 단계를 가진다:
(1) 외장(sheath) 탱크와 에탄올 탱크에 충분한 액체가 있는지 확인하고 폐액 탱크를 비웠다. 안정화된 전압 공급 장치를 켜고, 기기를 켜고, 형광 스위치를 켜고, BD FACSDiva 소프트웨어를 시작하여 시동(startup) 절차에 들어갔다.
(2) 공기 및 유체 라인을 분리한 후 외장 탱크에 연결하고, 폐쇄 루프 노즐이 유동 세포의 해당 위치에 있는지 확인하고, 시동 프로세스를 수행하였다.
(3) 적절한 크기의 노즐을 교체하고, 실제 노즐과 일치하도록 소프트웨어 모드를 설정한 후, 레이저를 켜고 스트림을 시작하였다.
(4) "새 프로토콜"을 클릭하여 적합한 실험 프로토콜을 만들었다.
(5) FSC/SSC 산포도(scatter diagram) 및 GFP/PE-Texas Red 산포도를 그리기 위해 "밀도 플롯"을 선택하였다.
(6) 산포도 중앙에 점이 나타나도록 FSC/SSC 전압을 조정하였다. 야생형 대조군 원형질체 집단이 산포도 중앙에 나타나도록 FL1 전압을 조정하였고, 실험군의 원형질체 집단(예컨대 GFP 형광 단백질로 형질전환된 원형질체)은 GFP 형광 채널 신호가 더 높은 위치에 나타나도록 하였다. 필요한 경우 보상 규제가 이루어졌으므로 두 모집단이 더 뚜렷해졌다.
(7) 게이트(gate)의 역치(threshold)는 대조군을 기준으로 결정되었으며, 실험군의 원형질체 집단은 역치 내에 위치하고 대조군의 원형질체 집단은 역치 외부에 위치하도록 보장하였다.
(8) 정렬할 세포 집단을 클릭하고, "왼쪽 정렬"을 선택하고, 실험 요구 사항과 표적 세포의 비율에 따라 분석 조건과 분석 모드를 설정하였다.
(9) 데이터를 읽을 수 있는 순서대로 샘플을 로딩하고, 해당 데이터를 기록하였다.
(10) 스트림을 끄고, 폐쇄 루프 노즐을 교체하고, 유동 세포를 FACS 깨끗한 액체와 멸균수로 세척하고, 소프트웨어와 기기를 끄고, 안정화된 전압 공급을 끄고, 기기 압력을 배출하였다.
4. 원형질체 DNA 추출 및 앰플리콘 시퀀싱 분석
4.1 원형질체 DNA 추출
원형질체를 2 mL 원심분리용 튜브에 수집하고, NanoDrop 초미세 분광광도계로 측정한 농도(30-60 ng/μL)의 원형질체 DNA(~30 μL)를 CTAB 방법으로 추출하여 -20℃에서 보관하였다.
4.2 앰플리콘 시퀀싱 분석
(1) 게놈 프라이머를 사용하여 원형질체 DNA 주형에 대해 PCR 증폭을 수행하였다. 20 μL 증폭 시스템은 4 μL 5×Fastpfu 완충액, 1.6 μL dNTPs(2.5 mM), 0.4 μL 정방향 프라이머(10 μM), 0.4 μL 역방향 프라이머(10 μM), 0.4 μL FastPfu 폴리머라제(2.5U/μL), 및 2 μL DNA 주형(~60 ng)으로 구성되었다. 증폭 조건은 다음과 같았다: 95℃에서 5분 동안 사전 변성; 95℃에서 30초 동안 변성, 50-64℃에서 30초 동안 어닐링, 72℃에서 30초 동안 연장, 35주기; 72℃에서 5분 동안 완전 확장, 및 12℃에서 보관.
(2) 상기 증폭 산물을 10배로 희석하여 1 μL 증폭 산물을 2차 PCR 증폭 주형으로 하고, 증폭 프라이머는 바코드가 포함된 시퀀싱 프라이머로 하였다. 50 μL 증폭 시스템은 10 μL 5× Fastpfu 완충액, 4 μL dNTPs(2.5 mM), 1 μL 정방향 프라이머(10 μM), 1 μL 역방향 프라이머(10 μM), 1 μL FastPfu 폴리머라제(2.5U/μL) 및 1 μL DNA 주형으로 구성되었다. 증폭 조건은 상기와 동일하였으며, 증폭주기는 35주기였다.
(3) PCR 산물을 2% 아가로스 겔 전기영동으로 분리한 후, AxyPrep DNA Gel Extraction kit를 사용하여 표적 단편에 대한 겔 추출을 실시하고, 생성된 산물을 NanoDrop 초미세 분광광도계를 사용하여 정량 분석하였다. 회수된 산물 100 ng을 취하여 혼합한 후 앰플리콘 시퀀싱 라이브러리 구축 및 앰플리콘 시퀀싱 분석을 위해 Sangon Bioengineering Co., Ltd.로 보냈다.
(4) 시퀀싱이 완료된 후, 원본 데이터를 시퀀싱 프라이머에 따라 분할하고, WT를 대조군으로 사용하여 3회 반복 실험을 통해 서로 다른 유전자 표적 유전자좌(loci)에서 산물의 에디팅 유형 및 에디팅 효율성을 비교 및 분석하였다.
5. 원형질체 단백질 추출 및 웨스턴-블랏
5.1. 원형질체 단백질 추출
(1) 48시간 배양 후 원형질체 샘플을 준비하고 뒤집어 균일하게 혼합한 후 12000 rpm에서 8분 동안 원심분리하였다. 상청액을 따라낸 후, 새로 제조한 단백질 추출액 50 μL를 첨가하고 볼텍싱(vortexing)하여 균일하게 혼합하였다.
(2) 이전 단계에서 얻은 1.5 mL 원심분리용 튜브를 얼음 위에 30분 동안 놓은 후 볼텍싱하여 균일하게 혼합하였다.
(3) 1.5 mL 원심분리용 튜브를 저온 원심분리기에서 12000 rpm으로 4℃에서 15분 동안 원심분리하였다.
(4) 상청액을 피펫으로 피펫팅한 후, 새로운 1.5 mL 원심분리용 튜브에 옮겼다.
(5) 상기 원심분리용 튜브로부터 2 μL를 피펫팅하여 새로운 1.5 mL 원심분리용 튜브로 옮기고, 18 μL의 이중증류수를 첨가하여 희석하였다.
(6) Bradford 1×Dye Reagent 1 mL를 상기 시스템에 첨가하고 볼텍싱으로 균일하게 혼합한 후 5분 동안 방치한 후, Eppendorf 생체 광도계(Biophotometer) 및 핵산 단백질 광도계를 사용하여 단백질 농도를 사전에 측정하였다.
(7) 단백질 추출 완충액을 사용하여 서로 다른 샘플의 농도를 조정한 후 로딩 완충액 10 μL를 첨가하고 볼텍싱하여 균일하게 혼합한 후 100℃ 금속조에서 5분 동안 변성시켰다.
(8) 생성물을 12000 rpm에서 1분 동안 원심분리한 후 상청액을 피펫으로 피펫팅한 후 SDS-PAGE 겔 전기영동을 실시하였다.
5.2. 웨스턴-블랏
(1) 8% 하층 분리 겔과 5% 상층 스태킹 겔을 준비하였다. 샘플을 로딩하고 120 V에서 1.5시간 동안 전기영동을 수행하였다.
(2) NC 멤브레인과 여과지를 미리 잘라서, 멤브레인 트랜스퍼 버퍼로 완전히 침지시켰다.
(3) 멤브레인으로의 전달(transfer-to-membrane) 작업을 반건식법으로 수행하였다. 침지된 여과지, 침지된 NC 멤브레인, 전기영동 후 얻은 SDS-PAGE 겔, 및 침지된 여과지를 밑에서부터 위로 배치하였다. 50 mL 둥근 바닥 원심분리용 튜브를 사용하여 앞뒤로 굴려 모든 기포를 제거하였다.
(4) 단백질 전달을 위해 200 mA의 정전류를 1시간 동안 적용하였다.
(5) NC 멤브레인을 TBST 버퍼에 넣어 상온에서 5분 동안 진탕기에서 진탕하여 멤브레인 트랜스퍼 버퍼를 씻어냈다.
(6) 버퍼를 따라내고, 5% 무지방 우유(TBST로 제제화)를 적당량 첨가한 후, 멤브레인을 천천히 진탕시키고 실온에서 진탕기에서 2시간 동안 인큐베이션하여 차단시켰다.
(7) 차단 용액을 따라내고, 적절한 비율로 희석한 1차 항체를 신선한 5% 무지방 우유에 첨가한 후, 멤브레인을 4℃의 진탕기에서 저속으로 밤새 인큐베이션하였다.
(8) 1차 항체를 따라내고, NC 멤브레인을 TBST 완충액으로 5분씩 3회 세척하였다.
(9) 희석된 상응하는 2차 항체가 함유된 우유를 첨가하고, 멤브레인을 실온에서 몇 시간 동안 인큐베이션하였다.
(10) 2차 항체를 따라내고, NC 멤브레인을 TBST 버퍼로 5분씩 3회 세척한 후, NC 멤브레인을 전용 비닐백에 밀봉하였다.
(11) 현상액(developing solution) A와 현상액 B(Tiangen)를 동량으로 균일하게 혼합한 후, 위의 비닐백에 첨가하고, 멤브레인을 3분 동안 인큐베이션하였다.
(12) 현상액을 비닐백에서 따라낸 후, 어두운 폴더에 넣고, 암실에서 현상하였으며, 단백질 존재량에 따라 현상시간을 조정하였다.
실시예 1: 리포터 시스템을 사용한 다양한 구축물의 스크리닝
위의 여러 변형을 통해 효율성이 향상된 구축물을 신속하고 시각적으로 스크리닝하기 위해 벼 원형질체에서 BFP-GFP 리포터 시스템을 사용하여 예비 스크리닝을 수행하였다. 유동 세포 계측법 분석에 의해, 그 결과를 도 2에 나타내었으며, 이는 PPE-ΔRNase H, PPE-NCv1 및 PPE-NCv2의 에디팅 효율성이 원래 PPE에 비해 향상되었음을 나타낸다. 따라서, 이 세 가지 구축물을 내인성 표적에 대한 후속 테스트를 위해 선택하였다.
실시예 2: 다양한 PPE 단백질 변형을 갖는 프라임 에디팅 시스템의 에디팅 효율성의 향상
위에서 선택한 구축물의 프라임 에디팅 시스템에 대한 효과를 테스트하기 위해 벼의 16개 내인성 표적을 테스트하였다. 이들 구축물을 pegRNA와 함께 벼 원형질체 세포로 공동 형질전환시켰으며, 프라임 에디팅 시스템의 에디팅 효율성을 앰플리콘 시퀀싱 분석을 통해 분석하였다. 그 결과를 도 3에 나타내었으며, 이는 대부분의 테스트 부위에서 PPE-NCv1, PPE-NCv2 및 PPE-ΔRNase H가 PPE와 비교하여 효율성 향상 정도가 서로 다름을 나타낸다. PPE-NCv1은 가장 높은 개선 정도를 달성하였으며 PPE-NCv2와 PPE-ΔRNase H는 2위를 차지하였다.
실시예 3: 다양한 PPE 단백질 변형의 조합에 의한 프라임 에디팅 시스템의 에디팅 효율성의 추가적인 향상
NC와의 융합과 RNase H의 결실의 조합(ePPE)에 의해 프라임 에디팅 시스템의 효율성이 더욱 향상될 수 있는지 테스트하기 위해, 12개 부위를 테스트용으로 선택하였다. 이들 구축물을 pegRNA와 함께 벼 원형질체 세포로 공동 형질전환시켰으며, 프라임 에디팅 시스템의 에디팅 효율성을 앰플리콘 시퀀싱 분석을 통해 분석하였다. 그 결과를 도 4에 나타내었으며, 이는 대부분의 부위에서 ePPE(PPE-NCv1+ΔRNase H)의 에디팅 효율성이 가장 높았으며, 효율성이 높은 것부터 낮은 순으로 ePPE > PPE-NCv1 > PPE-ΔRNase H > PPE 순이었음을 나타낸다.
실시예 4: 다양한 변형된 PPE 단백질의 단백질 발현 테스트
상기 변형된 PPE 단백질이 원래의 PPE 단백질에 비해 단백질 발현이 증가되어 프라임 에디팅 효율성이 향상되는지 테스트하기 위해, 해당 단백질을 벼 원형질체로 형질전환시키고, 웨스턴 블롯을 위해 원형질체 단백질을 추출하였다. 그 결과를 도 5에 나타내었으며, 이는 PPE-NCv1, PPE-NCv2, PPE-ΔRNase H, 및 ePPE 단백질의 발현이 원래의 PPE 단백질에 비해 현저히 높았으며, ePPE 단백질의 발현이 프라임 에디팅 효율성에 상응하게 가장 높았음을 나타낸다.
실시예 5: ePPE 단백질은 15 bp보다 큰 단편을 결실시키거나 삽입하는 에디팅 효율성을 효과적으로 향상시킬 수 있다.
프라임 에디팅 시스템이 염기 치환 또는 몇 개의 염기의 결실 또는 삽입에 효과적이라는 관점에서, 원래 PPE 단백질과 비교하여 더 큰 단편의 삽입 또는 결실에 대한 ePPE의 효율성을 추가로 테스트하였다. 테스트를 위해 18개 부위를 선택하였고, 이들 구축물을 pegRNA와 함께 벼 원형질체 세포로 공동 형질전환시켰으며, 프라임 에디팅 시스템의 에디팅 효율성을 앰플리콘 시퀀싱 분석에 의해 분석하였다. 그 결과를 도 6에 나타내었으며, 이는 테스트된 부위에서 ePPE의 에디팅 효율성이 가장 높았으며, 18-34 bp의 단편의 삽입과 15-90 bp의 단편의 결실을 효과적으로 달성할 수 있음을 나타낸다.
실시예 6: ePPE 단백질은 프라임 에디팅 시스템의 범위를 효과적으로 확장할 수 있다.
원래 PPE 단백질과 비교하여 다른 PAM에 대한 SpG 뉴클레아제와 융합된 ePPE의 표적화 효과를 테스트하기 위해, 4개 부위의 NGC, NGA, NGG PAM을 테스트용으로 선택하고, 이들 구축물을 pegRNA와 함께 벼 원형질체 세포로 공동 형질전환시켰으며, 프라임 에디팅 시스템의 에디팅 효율성을 앰플리콘 시퀀싱 분석에 의해 분석하였다. 그 결과를 도 7에 나타내었으며, ePPE의 에디팅 효율성은 테스트된 부위에서 프라임 에디팅 효과를 효과적으로 확장할 수 있다.
실시예 7: 벼 calli(유합 조직)에서 ePPE의 에디팅 효율성
안정적으로 형질전환된 벼 calli에서 ePPE의 돌연변이 효율성을 추가로 테스트하기 위해, 벼에서 4개의 표적을 테스트용으로 선택하였다. 저항성 calli를 식별한 후, 결과를 도 8에 나타내었으며, calli에서 ePPE의 에디팅 효율성은 원형질체에서 테스트한 효율성과 일치하였으며, 두 가지 모두 대조 PPE의 에디팅 효율성보다 높았고, 에디팅 효율성은 최대 31.5%까지 향상될 수 있었다.
실시예 8: ePPE에 의한 제초제 저항성 벼 식물의 생성
OsALS 유전자의 W548 부위를 표적으로 삼아 W548M의 돌연변이를 생성함으로써, ePPE에 의해 매개되는 돌연변이 효율은 11.3%인 반면 PPE에 의해 매개되는 효율은 0.6%에 불과한 것으로 나타났다. 이형접합성(heterozygous) 돌연변이체를 제초제 저항성에 대해 시험한 결과, 니코설푸론(nicosulfuron) 및 이마자픽(imazapic) 뿐만 아니라 이들의 조합에 대해 우수한 저항성을 갖는 것으로 확인되었다. 결과를 도 9에 나타내었다.
실시예 9: ePE를 사용한 돼지 세포에서의 에디팅
다른 종에서 ePPE의 에디팅 효율성을 테스트하기 위해, 돼지 세포의 3개 표적을 테스트용으로 선택하였다(ePE라고 함). 결과를 도 10에 나타내었다. ePE는 실제로 원래 PE를 사용한 처리와 비교하여 서로 다른 정도의 효율성 향상을 나타내었다.
실시예 10: 프라임 에디팅에서 ePPE 단백질의 비-표적(off-target) 현상
ePPE가 비-표적 에디팅의 효율성을 크게 증가시켰는지 확인하기 위해, pegRNA의 미스매치에 대한 ePPE의 내성 및 테스트된 내인성 부위와 1-3개의 미스매치가 있는 잠재적인 게놈 비-표적 부위의 에디팅 효율성을 각각 테스트하였다. 내인성 표적 및 잠재적인 비-표적 부위에서의 프라임 에디팅 시스템의 에디팅 효율성을 앰플리콘 시퀀싱 분석을 통해 분석하였다. 그 결과를 도 11에 나타내었다. ePPE는 PPE에 비해 대부분의 부위에서 비-표적 에디팅 현상을 크게 증가시키지 않았다.
실시예 11: ePPE와 염기 에디팅의 비교
염기 돌연변이 도입 측면에서 일반적으로 사용되는 염기 에디터와 ePPE의 에디팅 효율성을 비교하기 위해, 7개의 벼 내인성 표적을 선택하여 ePPE를 A3A-PBE 및 PABE8e와 각각 비교하였다. 앰플리콘 시퀀싱 분석 결과를 도 12에 나타내었다. PAM의 한계로 인해, 다른 에디팅 부위의 C 또는 A가 포함되지 않은 경우, 프라임 에디팅은 표적 부위를 정확하게 에디팅하는데 큰 이점을 나타냈으며 ePPE와 염기 에디팅은 기능면에서 상호보완적이어서 식물 게놈 에디팅에 보다 유연하게 적용할 수 있다.
실시예 12: ePPE와 pegRNA 최적화 전략을 조합하여 프라임 에디팅 효율성의 추가 개선
식물 프라임 에디팅 효율성을 추가로 향상시키기 위해, ePPE 단백질을 이중 pegRNA 전략 및 epegRNA 전략과 조합하였다. 결과를 도 13에 나타내었다. 다양한 epegRNA에 대한 평가를 통해, PPE 및 ePPE와 함께 3'-tevopreQ1-8nt 링커 변형을 갖는 이중-pegRNA로 원형질체를 공동 형질전환시키는 것으로 결정되었다. ePPE와 이중-pegRNA 전략 및 epegRNAs 전략의 조합에 의한 프라임 에디팅 효율성은 더욱 향상되었으며, ePPE-이중-epegRNA의 조합은 PPE-이중-pegRNA보다 7.9배 더 높았다.
서열 목록
>야생형 SpCas9 아미노산 서열(서열번호 1)
MDKKYSIGLDIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD
>nCas9(H840A) 아미노산 서열(서열번호 2)
MDKKYSIGLDIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDAIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD
>야생형 M-MLV-RT 아미노산 서열(서열번호 3)
TLNIEDEYRLHETSKEPDVSLGSTWLSDFPQAWAETGGMGLAVRQAPLIIPLKATSTPVSIKQYPMSQEARLGIKPHIQRLLDQGILVPCQSPWNTPLLPVKKPGTNDYRPVQDLREVNKRVEDIHPTVPNPYNLLSGLPPSHQWYTVLDLKDAFFCLRLHPTSQPLFAFEWRDPEMGISGQLTWTRLPQGFKNSPTLFNEALHRDLADFRIQHPDLILLQYVDDLLLAATSELDCQQGTRALLQTLGNLGYRASAKKAQICQKQVKYLGYLLKEGQRWLTEARKETVMGQPTPKTPRQLREFLGKAGFCRLFIPGFAEMAAPLYPLTKPGTLFNWGPDQQKAYQEIKQALLTAPALGLPDLTKPFELFVDEKQGYAKGVLTQKLGPWRRPVAYLSKKLDPVAAGWPPCLRMVAAIAVLTKDAGKLTMGQPLVILAPHAVEALVKQPPDRWLSNARMTHYQALLLDTDRVQFGPVVALNPATLLPLPEEGLQHNCLDILAEAHGTRPDLTDQPLPDADHTWYTDGSSLLQEGQRKAGAAVTTETEVIWAKALPAGTSAQRAELIALTQALKMAEGKKLNVYTDSRYAFATAHIHGEIYRRRGWLTSEGKEIKNKDEILALLKALFLPKRLSIIHCPGHQKGHSAEARGNRMADQAARKAAITETPDTSTLLIENSSP
>M-MLV-RT-connection(서열번호 4)
DQQKAYQEIKQALLTAPALGLPDLTKPFELFVDEKQGYAKGVLTQKLGPWRRPVAYLSKKLDPVAAGWPPCLRMVAAIAVLTKDAGKLTMGQPLVILAPHAVEALVKQPPDRWLSNARMTHYQALLLDT
>RT-RNase H(서열번호 5)
PDADHTWYTDGSSLLQEGQRKAGAAVTTETEVIWAKALPAGTSAQRAELIALTQALKMAEGKKLNVYTDSRYAFATAHIHGEIYRRRGWLTSEGKEIKNKDEILALLKALFLPKRLSIIHCPGHQKGHSAEARGNRMADQAARKAAITETPDTSTLL
>NC(서열번호 6)
ATVVSGQKQDRQGGERRRSQLDRDQCAYCKEKGHWAKDCPKKPRGPRGPRPQTSLL
>PR(서열번호 7)
TLDDQGGQGQEPPPEPRITLKVGGQPVTFLVDTGAQHSVLTQNPGPLSDKSAWVQGATGGKRYRWTTDRKVHLATGKVTHSFLHVPDCPYPLLGRDLLTKLKAQIHFEGSGAQVMGPMGQPLQVL
>IN(서열번호 8)
ENSSPYTSEHFHYTVTDIKDLTKLGAIYDKTKKYWVYQGKPVMPDQFTFELLDFLHQLTHLSFSKMKALLERSHSPYYMLNRDRTLKNITETCKACAQVNASKSAVKQGTRVRGHRPGTHWEIDFTEIKPGLYGYKYLLVFIDTFSGWIEAFPTKKETAKVVTKKLLEEIFPRFGMPQVLGTDNGPAFVSKVSQTVADLLGIDWKLHCAYRPQSSGQVERMNRTIKETLTKLTLATGSRDWVLLLPLALYRARNTPGPHGLTPYEILYGAPPPLVNFPDPDMTRVTNSPSLQAHLQALYLVQHEVWRPLAAAYQEQLDRPVVPHPYRVGDTVWVRRHQTKNLEPRWKGPYTVLLTTPTALKVDGIAAWIHAAHVKAADPGGGPSSRLTWRVQRSQNPLKIRLTREAP
> M-MLV-RT-F155Y(서열번호 9)
TLNIEDEYRLHETSKEPDVSLGSTWLSDFPQAWAETGGMGLAVRQAPLIIPLKATSTPVSIKQYPMSQEARLGIKPHIQRLLDQGILVPCQSPWNTPLLPVKKPGTNDYRPVQDLREVNKRVEDIHPTVPNPYNLLSGLPPSHQWYTVLDLKDAYFCLRLHPTSQPLFAFEWRDPEMGISGQLTWTRLPQGFKNSPTLFNEALHRDLADFRIQHPDLILLQYVDDLLLAATSELDCQQGTRALLQTLGNLGYRASAKKAQICQKQVKYLGYLLKEGQRWLTEARKETVMGQPTPKTPRQLREFLGKAGFCRLFIPGFAEMAAPLYPLTKPGTLFNWGPDQQKAYQEIKQALLTAPALGLPDLTKPFELFVDEKQGYAKGVLTQKLGPWRRPVAYLSKKLDPVAAGWPPCLRMVAAIAVLTKDAGKLTMGQPLVILAPHAVEALVKQPPDRWLSNARMTHYQALLLDTDRVQFGPVVALNPATLLPLPEEGLQHNCLDILAEAHGTRPDLTDQPLPDADHTWYTDGSSLLQEGQRKAGAAVTTETEVIWAKALPAGTSAQRAELIALTQALKMAEGKKLNVYTDSRYAFATAHIHGEIYRRRGWLTSEGKEIKNKDEILALLKALFLPKRLSIIHCPGHQKGHSAEARGNRMADQAARKAAITETPDTSTLLIENSSP
> M-MLV-RT-F155V(서열번호 10)
TLNIEDEYRLHETSKEPDVSLGSTWLSDFPQAWAETGGMGLAVRQAPLIIPLKATSTPVSIKQYPMSQEARLGIKPHIQRLLDQGILVPCQSPWNTPLLPVKKPGTNDYRPVQDLREVNKRVEDIHPTVPNPYNLLSGLPPSHQWYTVLDLKDAVFCLRLHPTSQPLFAFEWRDPEMGISGQLTWTRLPQGFKNSPTLFNEALHRDLADFRIQHPDLILLQYVDDLLLAATSELDCQQGTRALLQTLGNLGYRASAKKAQICQKQVKYLGYLLKEGQRWLTEARKETVMGQPTPKTPRQLREFLGKAGFCRLFIPGFAEMAAPLYPLTKPGTLFNWGPDQQKAYQEIKQALLTAPALGLPDLTKPFELFVDEKQGYAKGVLTQKLGPWRRPVAYLSKKLDPVAAGWPPCLRMVAAIAVLTKDAGKLTMGQPLVILAPHAVEALVKQPPDRWLSNARMTHYQALLLDTDRVQFGPVVALNPATLLPLPEEGLQHNCLDILAEAHGTRPDLTDQPLPDADHTWYTDGSSLLQEGQRKAGAAVTTETEVIWAKALPAGTSAQRAELIALTQALKMAEGKKLNVYTDSRYAFATAHIHGEIYRRRGWLTSEGKEIKNKDEILALLKALFLPKRLSIIHCPGHQKGHSAEARGNRMADQAARKAAITETPDTSTLLIENSSP
> M-MLV-RT-F156Y(서열번호 11)
TLNIEDEYRLHETSKEPDVSLGSTWLSDFPQAWAETGGMGLAVRQAPLIIPLKATSTPVSIKQYPMSQEARLGIKPHIQRLLDQGILVPCQSPWNTPLLPVKKPGTNDYRPVQDLREVNKRVEDIHPTVPNPYNLLSGLPPSHQWYTVLDLKDAFYCLRLHPTSQPLFAFEWRDPEMGISGQLTWTRLPQGFKNSPTLFNEALHRDLADFRIQHPDLILLQYVDDLLLAATSELDCQQGTRALLQTLGNLGYRASAKKAQICQKQVKYLGYLLKEGQRWLTEARKETVMGQPTPKTPRQLREFLGKAGFCRLFIPGFAEMAAPLYPLTKPGTLFNWGPDQQKAYQEIKQALLTAPALGLPDLTKPFELFVDEKQGYAKGVLTQKLGPWRRPVAYLSKKLDPVAAGWPPCLRMVAAIAVLTKDAGKLTMGQPLVILAPHAVEALVKQPPDRWLSNARMTHYQALLLDTDRVQFGPVVALNPATLLPLPEEGLQHNCLDILAEAHGTRPDLTDQPLPDADHTWYTDGSSLLQEGQRKAGAAVTTETEVIWAKALPAGTSAQRAELIALTQALKMAEGKKLNVYTDSRYAFATAHIHGEIYRRRGWLTSEGKEIKNKDEILALLKALFLPKRLSIIHCPGHQKGHSAEARGNRMADQAARKAAITETPDTSTLLIENSSP
> M-MLV-RT-D524N(서열번호 12)
TLNIEDEYRLHETSKEPDVSLGSTWLSDFPQAWAETGGMGLAVRQAPLIIPLKATSTPVSIKQYPMSQEARLGIKPHIQRLLDQGILVPCQSPWNTPLLPVKKPGTNDYRPVQDLREVNKRVEDIHPTVPNPYNLLSGLPPSHQWYTVLDLKDAFFCLRLHPTSQPLFAFEWRDPEMGISGQLTWTRLPQGFKNSPTLFNEALHRDLADFRIQHPDLILLQYVDDLLLAATSELDCQQGTRALLQTLGNLGYRASAKKAQICQKQVKYLGYLLKEGQRWLTEARKETVMGQPTPKTPRQLREFLGKAGFCRLFIPGFAEMAAPLYPLTKPGTLFNWGPDQQKAYQEIKQALLTAPALGLPDLTKPFELFVDEKQGYAKGVLTQKLGPWRRPVAYLSKKLDPVAAGWPPCLRMVAAIAVLTKDAGKLTMGQPLVILAPHAVEALVKQPPDRWLSNARMTHYQALLLDTDRVQFGPVVALNPATLLPLPEEGLQHNCLDILAEAHGTRPDLTDQPLPDADHTWYTNGSSLLQEGQRKAGAAVTTETEVIWAKALPAGTSAQRAELIALTQALKMAEGKKLNVYTDSRYAFATAHIHGEIYRRRGWLTSEGKEIKNKDEILALLKALFLPKRLSIIHCPGHQKGHSAEARGNRMADQAARKAAITETPDTSTLLIENSSP
> M-MLV-RT-N200C(서열번호 13)
TLNIEDEYRLHETSKEPDVSLGSTWLSDFPQAWAETGGMGLAVRQAPLIIPLKATSTPVSIKQYPMSQEARLGIKPHIQRLLDQGILVPCQSPWNTPLLPVKKPGTNDYRPVQDLREVNKRVEDIHPTVPNPYNLLSGLPPSHQWYTVLDLKDAYFCLRLHPTSQPLFAFEWRDPEMGISGQLTWTRLPQGFKNSPTLFCEALHRDLADFRIQHPDLILLQYVDDLLLAATSELDCQQGTRALLQTLGNLGYRASAKKAQICQKQVKYLGYLLKEGQRWLTEARKETVMGQPTPKTPRQLREFLGKAGFCRLFIPGFAEMAAPLYPLTKPGTLFNWGPDQQKAYQEIKQALLTAPALGLPDLTKPFELFVDEKQGYAKGVLTQKLGPWRRPVAYLSKKLDPVAAGWPPCLRMVAAIAVLTKDAGKLTMGQPLVILAPHAVEALVKQPPDRWLSNARMTHYQALLLDTDRVQFGPVVALNPATLLPLPEEGLQHNCLDILAEAHGTRPDLTDQPLPDADHTWYTDGSSLLQEGQRKAGAAVTTETEVIWAKALPAGTSAQRAELIALTQALKMAEGKKLNVYTDSRYAFATAHIHGEIYRRRGWLTSEGKEIKNKDEILALLKALFLPKRLSIIHCPGHQKGHSAEARGNRMADQAARKAAITETPDTSTLLIENSSP
> M-MLV-RT-ΔRNase H(서열번호 14)
TLNIEDEYRLHETSKEPDVSLGSTWLSDFPQAWAETGGMGLAVRQAPLIIPLKATSTPVSIKQYPMSQEARLGIKPHIQRLLDQGILVPCQSPWNTPLLPVKKPGTNDYRPVQDLREVNKRVEDIHPTVPNPYNLLSGLPPSHQWYTVLDLKDAFFCLRLHPTSQPLFAFEWRDPEMGISGQLTWTRLPQGFKNSPTLFNEALHRDLADFRIQHPDLILLQYVDDLLLAATSELDCQQGTRALLQTLGNLGYRASAKKAQICQKQVKYLGYLLKEGQRWLTEARKETVMGQPTPKTPRQLREFLGKAGFCRLFIPGFAEMAAPLYPLTKPGTLFNWGPDQQKAYQEIKQALLTAPALGLPDLTKPFELFVDEKQGYAKGVLTQKLGPWRRPVAYLSKKLDPVAAGWPPCLRMVAAIAVLTKDAGKLTMGQPLVILAPHAVEALVKQPPDRWLSNARMTHYQALLLDTDRVQFGPVVALNPATLLPLPEEGLQHNCLDILAEAHGTRPDLTDQPL
>M-MLV-RT-ΔRNase H-Δ Connection(서열번호 15)
TLNIEDEYRLHETSKEPDVSLGSTWLSDFPQAWAETGGMGLAVRQAPLIIPLKATSTPVSIKQYPMSQEARLGIKPHIQRLLDQGILVPCQSPWNTPLLPVKKPGTNDYRPVQDLREVNKRVEDIHPTVPNPYNLLSGLPPSHQWYTVLDLKDAFFCLRLHPTSQPLFAFEWRDPEMGISGQLTWTRLPQGFKNSPTLFNEALHRDLADFRIQHPDLILLQYVDDLLLAATSELDCQQGTRALLQTLGNLGYRASAKKAQICQKQVKYLGYLLKEGQRWLTEARKETVMGQPTPKTPRQLREFLGKAGFCRLFIPGFAEMAAPLYPLTKPGTLFNWGP
>링커 서열(서열번호 16)
SGGSSGGSSGSETPGTSESATPESSGGSSGGS
>gRNA 스캐폴드(서열번호 17)
guuuuagagcuagaaauagcaaguuaaaauaaggcuaguccguuaucaacuugaaaaaguggcaccgagucggugc
>PPE(서열번호 18)
MPKKKRKVDKKYSIGLDIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDAIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGDEFPKKKRKVELSGGSSGGSSGSETPGTSESATPESSGGSSGGSRPTLNIEDEYRLHETSKEPDVSLGSTWLSDFPQAWAETGGMGLAVRQAPLIIPLKATSTPVSIKQYPMSQEARLGIKPHIQRLLDQGILVPCQSPWNTPLLPVKKPGTNDYRPVQDLREVNKRVEDIHPTVPNPYNLLSGLPPSHQWYTVLDLKDAFFCLRLHPTSQPLFAFEWRDPEMGISGQLTWTRLPQGFKNSPTLFNEALHRDLADFRIQHPDLILLQYVDDLLLAATSELDCQQGTRALLQTLGNLGYRASAKKAQICQKQVKYLGYLLKEGQRWLTEARKETVMGQPTPKTPRQLREFLGKAGFCRLFIPGFAEMAAPLYPLTKPGTLFNWGPDQQKAYQEIKQALLTAPALGLPDLTKPFELFVDEKQGYAKGVLTQKLGPWRRPVAYLSKKLDPVAAGWPPCLRMVAAIAVLTKDAGKLTMGQPLVILAPHAVEALVKQPPDRWLSNARMTHYQALLLDTDRVQFGPVVALNPATLLPLPEEGLQHNCLDILAEAHGTRPDLTDQPLPDADHTWYTDGSSLLQEGQRKAGAAVTTETEVIWAKALPAGTSAQRAELIALTQALKMAEGKKLNVYTDSRYAFATAHIHGEIYRRRGWLTSEGKEIKNKDEILALLKALFLPKRLSIIHCPGHQKGHSAEARGNRMADQAARKAAITETPDTSTLLIENSSPSGGSPKKKRKV
>ePPE(서열번호 19)
MPKKKRKVDKKYSIGLDIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDAIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGDEFSGSETPGTSESATPESATVVSGQKQDRQGGERRRSQLDRDQCAYCKEKGHWAKDCPKKPRGPRGPRPQTSLLPKKKRKVELSGGSSGGSSGSETPGTSESATPESSGGSSGGSRPTLNIEDEYRLHETSKEPDVSLGSTWLSDFPQAWAETGGMGLAVRQAPLIIPLKATSTPVSIKQYPMSQEARLGIKPHIQRLLDQGILVPCQSPWNTPLLPVKKPGTNDYRPVQDLREVNKRVEDIHPTVPNPYNLLSGLPPSHQWYTVLDLKDAFFCLRLHPTSQPLFAFEWRDPEMGISGQLTWTRLPQGFKNSPTLFNEALHRDLADFRIQHPDLILLQYVDDLLLAATSELDCQQGTRALLQTLGNLGYRASAKKAQICQKQVKYLGYLLKEGQRWLTEARKETVMGQPTPKTPRQLREFLGKAGFCRLFIPGFAEMAAPLYPLTKPGTLFNWGPDQQKAYQEIKQALLTAPALGLPDLTKPFELFVDEKQGYAKGVLTQKLGPWRRPVAYLSKKLDPVAAGWPPCLRMVAAIAVLTKDAGKLTMGQPLVILAPHAVEALVKQPPDRWLSNARMTHYQALLLDTDRVQFGPVVALNPATLLPLPEEGLQHNCLDILAEAHGTRPDLTDQPLSGGSPKKKRKV

Claims (15)

  1. 하기를 포함하는 식물 게놈의 표적화된 변형을 위한 프라임 에디팅(prime editing) 시스템:
    i) 프라임 에디팅 융합 단백질 및/또는 프라임 에디팅 융합 단백질을 코딩하는(encoding) 뉴클레오티드 서열을 포함하는 발현 구축물(construct), 여기서 프라임 에디팅 융합 단백질은 CRISPR 닉카아제(nickase) 및 역전사효소를 포함함; 및/또는
    ii) 적어도 하나의 pegRNA 및/또는 적어도 하나의 pegRNA를 코딩하는 뉴클레오티드 서열을 포함하는 발현 구축물,
    여기서 적어도 하나의 pegRNA는 5'에서 3' 방향으로 가이드 서열, 스캐폴드 서열, 역전사(reverse transcriptase, RT) 주형(template) 서열 및 프라이머 결합 부위(PBS) 서열을 포함하고,
    여기서 적어도 하나의 pegRNA는 융합 단백질과 복합체를 형성하고 융합 단백질을 게놈의 표적 서열에 표적화하여 닉(nick)이 표적 서열에 형성될 수 있게 한다.
  2. 제1항에 있어서, CRISPR 닉카아제가 예를 들어 서열번호 2에 나타난 아미노산 서열을 포함하는 Cas9 닉카아제인, 시스템.
  3. 제1항 또는 제2항에 있어서, 역전사효소가 M-MLV 역전사효소 또는 이의 기능적 변이체인, 시스템.
  4. 제1항 내지 제3항 중 어느 한 항에 있어서,
    (a) 역전사효소가 F155Y, F155V, F156Y, D524N, D200C 중 어느 하나로부터 선택되는 돌연변이를 포함하고, 여기서 아미노산 위치는 서열번호 3을 참조하며;
    (b) 역전사효소의 연결 서열(connection sequence)이 결실되고; 및/또는
    (c) 역전사효소의 RNase H 도메인이 돌연변이되거나 결실되는 것인,
    시스템
  5. 제4항에 있어서, 역전사효소가 서열번호 9-15 중 어느 하나에 나타난 서열을 포함하는 것인, 시스템.
  6. 제1항 내지 제5항 중 어느 한 항에 있어서, M-MLV 역전사효소와 같은 역전사효소 또는 이의 기능적 변이체가 N-말단 또는 C-말단에서 뉴클레오캡시드 단백질(nucleocapsid protein, NC), 프로테아제(protease, PR) 또는 인테그라제(integrase, IN)와 직접적으로 또는 융합 단백질의 링커를 통해 융합되는 것인, 시스템.
  7. 제6항에 있어서, 뉴클레오캡시드 단백질(NC)이 서열번호 6에 나타난 아미노산 서열을 함유하거나, 프로테아제(PR)가 서열번호 7에 나타난 아미노산 서열을 함유하거나, 또는 인테그라제(IN)가 서열번호 8에 나타난 아미노산 서열을 함유하는 것인, 시스템.
  8. 제6항 또는 제7항에 있어서, 역전사효소가 N-말단에서 뉴클레오캡시드 단백질(NC)과 직접적으로 또는 링커를 통해 융합되고, 바람직하게는 RNase H 도메인이 결실된 M-MLV 역전사효소의 기능적 변이체가 N-말단에서 뉴클레오캡시드 단백질(NC)과 직접적으로 또는 링커를 통해 융합되는 것인, 시스템.
  9. 제1항 내지 제8항 중 어느 한 항에 있어서, pegRNA의 가이드 서열이 표적 서열과 충분한 서열 동일성(identity)을 가지도록 구성되고 따라서 염기쌍 형성(base pairing)에 의해 표적 서열의 상보적 가닥에 결합하여 서열-특이적 표적화를 달성할 수 있는 것인, 시스템.
  10. 제1항 내지 제9항 중 어느 한 항에 있어서, pegRNA의 스캐폴드 서열이 서열번호 18에 나타난 서열을 포함하는 것인, 시스템.
  11. 제1항 내지 제10항 중 어느 한 항에 있어서, 프라이머 결합 서열이 표적 서열의 적어도 일부에 상보적이도록 구성되고, 바람직하게는 프라이머 결합 서열이 닉에 의해 유발된 3' 자유 단일 가닥의 적어도 일부, 특히 3' 자유 단일 가닥의 3' 말단에 있는 뉴클레오티드 서열에 상보적인, 시스템.
  12. 제1항 내지 제11항 중 어느 한 항에 있어서, 프라이머 결합 서열의 Tm(용융 온도)이 약 18-52℃, 바람직하게는 약 24-36℃, 더욱 바람직하게는 약 28-32℃, 가장 바람직하게는 약 30℃인, 시스템.
  13. 제1항 내지 제12항 중 어느 한 항에 있어서, RT 주형 서열이 닉의 하류 서열에 상응하도록 구성되고 원하는 변형을 포함하고, 변형은 하나 이상의 뉴클레오티드의 치환, 결실 및/또는 부가(addition)를 포함하는 것인, 시스템.
  14. 제1항 내지 제13항 중 어느 한 항에 있어서, 프라임 에디팅 융합 단백질이 서열번호 19에 나타난 아미노산 서열을 포함하는 것인, 시스템.
  15. 제1항 내지 제14항 중 어느 한 항의 프라임 에디팅 시스템을 적어도 하나의 세포에 도입하여 적어도 하나의 세포의 게놈의 표적 서열에 변형을 초래하는 것을 포함하는 유전자 변형 식물을 생산하는 방법.
KR1020247010828A 2021-09-06 2022-09-06 개선된 가이드된 에디팅 시스템 KR20240049838A (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN202111039979.X 2021-09-06
CN202111039979 2021-09-06
PCT/CN2022/117258 WO2023030534A1 (zh) 2021-09-06 2022-09-06 改进的引导编辑系统

Publications (1)

Publication Number Publication Date
KR20240049838A true KR20240049838A (ko) 2024-04-17

Family

ID=85410700

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020247010828A KR20240049838A (ko) 2021-09-06 2022-09-06 개선된 가이드된 에디팅 시스템

Country Status (3)

Country Link
KR (1) KR20240049838A (ko)
CN (1) CN116555224A (ko)
WO (1) WO2023030534A1 (ko)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117720672B (zh) * 2024-02-07 2024-04-30 深锐(天津)生物医学有限公司 先导编辑系统及其应用

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
BR112019017138A2 (pt) 2017-02-20 2020-04-14 Inst Genetics & Developmental Biology Cas sistema e método de edição de genoma
WO2021080922A1 (en) * 2019-10-21 2021-04-29 The Trustees Of Columbia University In The City Of New York Methods of performing rna templated genome editing
BR112022008468A2 (pt) * 2019-11-01 2022-07-19 Shanghai Bluecross Medical Science Inst Método para modificação direcionada de uma sequência de genoma de planta
WO2021092204A1 (en) * 2019-11-05 2021-05-14 Spotlight Therapeutics Methods and compositions for nucleic acid-guided nuclease cell targeting screen
US20230357784A1 (en) * 2020-02-21 2023-11-09 Limagrain Europe Prime editing technology for plant genome engineering

Also Published As

Publication number Publication date
WO2023030534A1 (zh) 2023-03-09
CN116555224A (zh) 2023-08-08

Similar Documents

Publication Publication Date Title
RU2679510C2 (ru) Обогащение активируемой флуоресценцией сортировки клеток (facs) для создания растений
WO2019120310A1 (en) Base editing system and method based on cpf1 protein
US11441151B2 (en) Increased protein expression in plants
US20230075587A1 (en) Method for targeted modification of sequence of plant genome
CA3226233A1 (en) Optimal soybean loci for targeted transgene integration
US20230365984A1 (en) Compositions and methods for increasing shelf-life of banana
UA121197C2 (uk) Нуклеаза &#34;цинкові пальці&#34; для модифікацїї гена ahas та спосіб її використання
CN110526993A (zh) 一种用于基因编辑的核酸构建物
CN112048493B (zh) 一种增强Cas9及其衍生蛋白介导的基因操纵系统的方法及应用
CN110396523B (zh) 一种重复片段介导的植物定点重组方法
KR20240049838A (ko) 개선된 가이드된 에디팅 시스템
Meng et al. An efficient sorghum protoplast assay for transient gene expression and gene editing by CRISPR/Cas9
KR20230021743A (ko) 이형접합 cenh3 외떡잎식물 및 반수체 유도 및 동시 게놈 편집을 위한 이의 사용 방법
WO2018187347A1 (en) Compositions and methods for transferring cytoplasmic or nuclear traits or components
CN116004573A (zh) 编辑活性提高的Cas蛋白及其应用
KR20160065952A (ko) 제아 메이스 메탈로티오네인-유사 조절 요소 및 그의 용도
KR20220150363A (ko) 개선된 사이토신 염기 편집 시스템
WO2024051850A1 (zh) 基于dna聚合酶的基因组编辑系统和方法
WO2024040874A1 (zh) 突变的Cas12j蛋白及其应用
WO2021098709A1 (zh) 衍生自黄杆菌的基因编辑系统
CN115109798A (zh) 改进的cg碱基编辑系统