TW202134439A - Rna導引之核酸酶及其活性片段與變體以及使用方法 - Google Patents

Rna導引之核酸酶及其活性片段與變體以及使用方法 Download PDF

Info

Publication number
TW202134439A
TW202134439A TW109146714A TW109146714A TW202134439A TW 202134439 A TW202134439 A TW 202134439A TW 109146714 A TW109146714 A TW 109146714A TW 109146714 A TW109146714 A TW 109146714A TW 202134439 A TW202134439 A TW 202134439A
Authority
TW
Taiwan
Prior art keywords
seq
sequence
sequence identity
rna
crispr
Prior art date
Application number
TW109146714A
Other languages
English (en)
Inventor
亞歷山卓 布萊勒 克羅雷
菲利普 博登
泰森 D 伯恩
麥可 柯伊雷
麥迪遜 拉奇爾
泰德 D 艾力奇
Original Assignee
美商生命編輯公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 美商生命編輯公司 filed Critical 美商生命編輯公司
Publication of TW202134439A publication Critical patent/TW202134439A/zh

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/46Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
    • C07K14/47Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
    • C07K14/4701Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals not used
    • C07K14/4702Regulators; Modulating activity
    • C07K14/4705Regulators; Modulating activity stimulating, promoting or activating activity
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/102Mutagenizing nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/01Fusion polypeptide containing a localisation/targetting motif
    • C07K2319/09Fusion polypeptide containing a localisation/targetting motif containing a nuclear localisation signal
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/20Fusion polypeptide containing a tag with affinity for a non-protein ligand
    • C07K2319/21Fusion polypeptide containing a tag with affinity for a non-protein ligand containing a His-tag
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/40Fusion polypeptide containing a tag for immunodetection, or an epitope for immunisation
    • C07K2319/43Fusion polypeptide containing a tag for immunodetection, or an epitope for immunisation containing a FLAG-tag
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2521/00Reaction characterised by the enzymatic activity
    • C12Q2521/30Phosphoric diester hydrolysing, i.e. nuclease
    • C12Q2521/301Endonuclease

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biomedical Technology (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Microbiology (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Medicinal Chemistry (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Toxicology (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Peptides Or Proteins (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Medicinal Preparation (AREA)
  • Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)
  • Medicines Containing Material From Animals Or Micro-Organisms (AREA)
  • Breeding Of Plants And Reproduction By Means Of Culturing (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)

Abstract

提供了用於結合至所關注之標的序列的組成物及方法。該組成物可用於剪切或修飾所關注之標的序列、檢測所關注之標的序列、及修飾所關注之序列的表現。組成物包含RNA導引之核酸酶多肽、CRISPR RNA、反式活化的CRISPR RNA、導引RNA、及編碼同者之核酸分子、CRISPR RNA、反式活化的CRISPR RNA、導引RNA的核酸分子。還提供了包含該核酸分子的載體及宿主細胞。進一步提供了用於結合所關注之標的序列的CRISPR系統,其中該CRISPR系統包含RNA導引之核酸酶多肽及一或更多導引RNA。

Description

RNA導引之核酸酶及其活性片段與變體以及使用方法
[ 相關申請案的交叉引用 ]
本申請案主張2019年12月30日提交之第62/955,014號美國臨時申請案及2020年7月29日提交之第63/058,169號美國臨時申請案之優先權,上述每一個專利申請都藉由引用整體地併入本文中。[ 關於序列表之聲明 ]
與本申請案關聯之序列表業已藉由ASCII格式代替紙質拷貝來提供,茲藉由引用併入本說明書。該ASCII拷貝被命名為L103438_1180WO_(0077_8)_SL,其大小為558,899位元組,其創建於2020年12月17日,且以電子方式經由EFS-Web提交。
本發明與分子生物學及基因編輯領域有關。
靶向基因組編輯或修飾正迅速成為基礎及應用研究的重要工具。最初的方法涉及例如大範圍核酸酶(meganuclease)、鋅指融合蛋白或TALEN之類的工程核酸酶,這需要產生具有對每一種特定標的序列專一的工程化、可程式化、序列專一的DNA結合域的嵌合核酸酶。RNA導引之核酸酶(例如,成簇規律間隔的短迴文重複子(Clustered Regularly Interspaced Short Palindromic Repeats)(CRISPR)-關聯(Cas)的CRISPR-Cas細菌系統的蛋白)藉由將核酸酶與導引RNA(導引RNA與特定標的序列專一性雜合)複合而允許專一性序列(specific sequence)之靶向。相較於為每一個標的序列產生嵌合核酸酶,產生標的專一性導引RNA的成本更低且更有效。該種RNA導引之核酸酶可用於透過序列專一性斷裂的引入來編輯基因組,該斷裂經由易錯的非同源末側連結(NHEJ)被修復,以在專一性基因組位址(specific genomic location)引入突變。作為另一種選擇,可經由同源導向修復將異源DNA引入基因組位點。RNA導引之核酸酶亦可當與脫胺酶融合時用於鹼基編輯,或用於檢測專一性核苷酸序列。
提供了用於結合所關注之標的序列的組成物及方法。該組成物可用於剪切或修飾所關注之標的序列、檢測所關注之標的序列、以及修飾所關注之序列的表現。組成物包括RNA導引之核酸酶(RGN)多肽、CRISPR RNA(crRNA)、反式活化的CRISPR RNA(tracrRNA)、導引RNA(gRNA)、編碼同者之核酸分子、包括核酸分子的載體及宿主細胞、以及包括RGN、gRNA及檢測單股DNA的套組。還提供了用於結合所關注之標的序列的CRISPR系統,其中該CRISPR系統包括RNA導引之核酸酶多肽以及一或更多導引RNA。因此,本文所揭露之方法選為用於結合所關注之標的序列,並且在一些實施方式中,用於剪切或修飾所關注之標的序列。所關注之標的序列可舉例而言由於非同源末側連結、引入的供體序列的同源導向修復或鹼基編輯而被修飾。進一步提供了使用檢測單股DNA檢測DNA分子的標的DNA序列的方法和套組。
受益於前述描述及關聯圖式中呈現的教導的、本發明所屬領域中具有通常知識者將想到本文中闡述的本發明之許多修改及其他實施方式。因此,應該明白,本發明不限於所揭露的具體實施方式,且修改以及其他實施方式預期被包括於所附實施方式的範疇內。雖然本文採用特定術語,但此等術語僅以一般性及描述性意義使用,而非出於限制性目的。I .概述
RNA導引之核酸酶(RGN)允許在基因組內的(各)專一性位點的靶向操縱,並且在基因靶向之背景下有用於治療及研究應用。在各種生物體(包括哺乳動物)中,舉例而言,藉由刺激非同源末側連結和同源重組,RNA導引之核酸酶已被用於基因組工程。本文所述的組成物及方法有用於在多核苷酸中創建單股或雙股斷裂、修飾多核苷酸、檢測多核苷酸內的特定位點、或修飾特定基因的表現。
本文所揭露之RNA導引之核酸酶可藉由修飾標的序列來改變基因表現。於具體實施方式中,RNA導引之核酸酶係藉由導引RNA(gRNA)作為成簇規律間隔的短迴文重複子(CRISPR)RNA導引之核酸酶系統的局部(part)而被導向至標的序列。RGN是所考慮「RNA導引」,因為導引RNA與RNA導引之核酸酶形成複合物,以將RNA導引之核酸酶導向至與標的序列結合,並且於一些實施方式中,在該標的序列處引入單股或雙股斷裂。在標的序列已被剪切後,斷裂可以被修復,藉以使得該標的序列的DNA序列在修復過程期間被修飾。由此,本文提供了使用RNA導引之核酸酶修飾宿主細胞的DNA中的標的序列的方法。舉例而言,RNA導引之核酸酶可用於修飾真核細胞或原核細胞的基因組基因座處的標的序列。II. RNA 導引之核酸酶
本文提供了RNA導引之核酸酶。術語「RNA導引之核酸酶(RGN)」係指以序列專一性方式結合至特定標的核苷酸序列且藉由與多肽複合並與該標的序列雜合的導引RNA分子而被導向至該標的核苷酸序列的多肽。雖然RNA導引之核酸酶可以有能力在結合時剪切標的序列,但術語「RNA導引之核酸酶」還涵蓋能夠結合至標的序列但不剪切標的序列的無核酸酶活性的RNA導引之核酸酶。藉由RNA導引之核酸酶剪切標的序列可導致單股或雙股斷裂。僅能剪切雙股核酸分子之單股的RNA導引之核酸酶在本文中被稱為切口酶。
本發明之RGN為2類CRISPR-Cas系統之成員。更具體地說,彼等為V型CRISPR-Cas系統之成員。V型CRISPR-Cas系統廣義上被定義為含有負責使用該導引RNA來靶向dsDNA(雙股DNA)之單效應子核酸酶之系統;另外,該單效應子核酸酶含有造成催化活性之割裂RuvC核酸酶域(Jinek等人2014,Science doi:10.1126/science.1247997;Zetsche等人2015,Cell doi:10.1016/j.cell.2015.09.038;Shmakov等人2017,Nat Rev Microbiol doi:10.1038/nrmicro.2016.184;Yan等人2018,Science doi:10.1126/science.aav7271;Harrington等人2018,Science doi:10.1126/science.aav4294;彼等中之每一者之全部內容藉由引用併入本文)。大多數V型效應子亦可靶向ssDNA(單股DNA),而常常沒有PAM要求(Zetsche等人2015;Yan等人2018;Harrington等人2018)。
該V-A型印記蛋白(signature protein)為Cas12a。其長度為1,000-1,400個胺基酸,且除了RuvC域,還具有數個域,包括具有辨識葉(recognition lobe)之楔入域(wedge domain)(Yamano等人(2016)Cell 165:949-962)。相對地,相較於大多數其他V型系統,V-U型系統的大小較小(長度為500-700個胺基酸)。V-U’亦擁有割裂RuvC域及帶正電荷之橋式螺旋(Shmakov等人2017)。儘管Cas12a與cas1、cas2且偶爾與cas4共定位,但該V-U蛋白常常不具有用效應子蛋白編碼之輔助Cas蛋白,(Shmakov等人20170)。基於V-U型系統與其他V型成員之間之此等不同,Shmakov等人(2017)建議在確定功能性時,該V-U型系統應當接收新型/子型標示。
舉例而言,Cas14酵素之長度為400-700個胺基酸。於第一次揭露時,此等系統被吹捧為來自Vs型之規範Cas 12效應子蛋白之各別Cas酵素。Yan等人後來之揭露已於該V型命名規則內將Cas14a、-b、及-c稱為V-F子型。Cas14a及b與為V-U3型之c2c10最密切相關。Cas14c與分別為V-U2及V-U4型之c2c8及c2c9最密切相關(Harrington等人2018;Yan等人2018)。該Cas14 RGN之基因組基因座與輔助Cas蛋白關聯,且該tracrRNA於該Cas14與該重複子-間隔體陣列(repeat-spacer array)之間被編碼。與能夠處理來自含有複數導引RNA之單轉錄物之個別導引之Cas12a不同(Harrington et al 2018),此等系統不能處理彼等自己之導引RNA。
除APG06369外,本發明之全部RGN都含有割裂RuvC域。然而,本發明之許多RGN具有唯一基因座排列,暗示此等RGN對2類CRISPR-Cas分類系統為新穎的。本發明之RGN取得自的基因座(見範例1中之表1)沒有一者含有Cas1或Cas2。
如本文所揭露的,APG07339、APG09624、APG03003、APG05405、APG09777、APG05680、APG02119、APG03285、APG04998、及APG07078為未用輔助基因編碼且除了crRNA還可要求tracrRNA之分立Cas效應子。基於本文之揭露,此等CRISPR-Cas系統需要接收新分類。另外,譜系分析(phylogenetic analysis)揭示可將此等RGN分組為三個不同子類。一個子類含有APG07078。第二子類含有APG05680及APG03285。第三子類含有APG07339、APG09624、APG03003、APG05405、APG09777、APG02119、及APG04998。
APG06369為唯一效應子核酸酶,該唯一效應子核酸酶缺少可區別RuvC域且坐落於具有不規範輔助基因、以前從未見過之CRISPR基因座中。APG06369具有四個輔助基因(該四個輔助蛋白如SEQ ID NO:178-181所示),彼等中沒有一者擁有注釋域(annotated domain)或功能。APG06369為唯一Cas蛋白。
在譜系上(phylogenetically),APG03847、APG05625、APG03759、APG05123、及APG03524形成含有效應子核酸酶之唯一RuvC之支系(clade)。此等RGN擁有至多3個輔助基因:一者為HNH核酸內切酶,一者為HTH轉錄調節子(regulator),而第三者具有未知功能或域。APG03847之輔助蛋白如SEQ ID NO:182、183、及184所示。APG05625之輔助蛋白如SEQ ID NO:185、186、及187所示。APG03524之輔助蛋白如SEQ ID NO:188、189、及190所示。APG03759及APG05123之輔助蛋白分別如SEQ ID NO:191及192所示。彼等在彼等之基因座處具有唯一CRISPR重複子排列,其中與APG03847、APG05625、APG03759、APG05123、及APG03524關聯之重複子對齊(flush with)大量蛋白之編碼序列。此為CRISPR-Cas系統之極不尋常特徵,且暗示一種不需要該前導序列之CRISPR表現形式。此CRISPR表現形式不同於迄今已知之任何系統。
本文所揭露之RNA導引之核酸酶包括表1中顯示之RNA導引之核酸酶,其胺基酸序列如SEQ ID NO:1至109所示,且其活性片段或變體保持以RNA導引之序列專一性方式結合至標的核苷酸序列之能力。於一些實施方式中,RGN之此活性片段或變體能夠剪切單股或雙股標的序列。於一些實施方式中,本發明之RGN之活性變體包含與如SEQ ID NO:1至109所示之胺基酸序列中任一者具有至少40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高序列一致性之胺基酸序列。於某些實施方式中,本發明之RGN之活性片段包含如SEQ ID NO:1至109所示之胺基酸序列中任一者之至少50、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000、1050個或更多個連續胺基酸殘基。本文提供之RNA導引之核酸酶可包含至少一個核酸酶域(例如,DNase、RNase)及至少一個RNA辨識域及/或RNA 結合域,以與導引RNA相互作用。可在本文提供之RNA導引之核酸酶中發現的另外域包括但不限於:DNA結合域、解旋酶域、蛋白質-蛋白質相互作用域及二聚化域。於具體實施方式中,本文提供之RNA導引之核酸酶可與DNA結合域、解旋酶域、蛋白質-蛋白質相互作用域及二聚化域中的一或更多包括至少70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高之序列一致性。
於各種實施方式中,標的核苷酸序列藉由本文提供之RNA導引之核酸酶結合,並與RNA導引之核酸酶關聯之導引RNA雜合。如果該多肽擁有核酸酶活性,則可由RNA導引之核酸酶隨後剪切該標的序列。術語「剪切(cleave)」或「剪切(cleavage)」係指標的核苷酸序列的主鏈內的至少一個磷酸二酯鍵之水解,其可導致該標的序列內的單股或雙股斷裂。於各種實施方式中,本發明揭露之RGN可剪切多核苷酸內的核苷酸,起核酸內切酶的作用,或者,本發明揭露之RGN可為核酸外切酶,從多核苷酸之末側(5'末側及/或3'末側)移除連續的核苷酸。於一些實施方式中,所揭露之RGN可在多核苷酸的任何位置內剪切標的序列之核苷酸,且由此起核酸內切酶及核酸外切酶二者的作用。藉由本發明揭露之RGN對標的多核苷酸之剪切可導致交錯的斷裂或鈍末側。
於一些實施方式中,為結合至及/或剪切標的多核苷酸,RGN需要至少一個RGN輔助蛋白之表現或存在。於此等實施方式中之一些實施方式中,RGN需要如SEQ ID NO:178-192所示之至少一個RGN輔助蛋白或其活性變體或片段。於其中該RGN為APG06369(SEQ ID NO:11)或其變體或片段之特定實施方式中,如SEQ ID NO:178-181所示之至少一個RGN輔助蛋白或其活性變體或片段針對活性而被需要。於此等實施方式中其中該RGN為APG03847(SEQ ID NO:12)或其變體或片段之一些實施方式中,如SEQ ID NO:182-184所示之至少一個RGN輔助蛋白或其活性變體或片段針對活性而被需要。於其中該RGN為APG05625(SEQ ID NO:13)或其變體或片段之某些實施方式中,如SEQ ID NO:185-187所示之至少一個RGN輔助蛋白或其活性變體或片段針對活性而被需要。於其中該RGN為APG03524(SEQ ID NO:16)或其變體或片段之一些實施方式中,如SEQ ID NO:188-190所示之至少一個RGN輔助蛋白或其活性變體或片段針對活性而被需要。於其中該RGN為APG03759(SEQ ID NO: 14)或其變體或片段之特定實施方式中,如SEQ ID NO:191所示之RGN輔助蛋白或其活性變體或片段需要活性。於其中該RGN為APG05123(SEQ ID NO: 15)或其變體或片段之某些實施方式中,如SEQ ID NO:192所示之RGN輔助蛋白或其活性變體或片段針對活性而被需要。
於一些實施方式中,本發明揭露之RNA導引之核酸酶可為自細菌物種或古生菌物種取得的野生型序列。於一些實施方式中,RNA導引之核酸酶可為野生型多肽的變體或片段。舉例而言,可修飾該野生型RGN以改變核酸酶活性或改變PAM專一性。於一些實施方式中,RNA導引之核酸酶不是天然存在的。
於某些實施方式中,RNA導引之核酸酶起切口酶(nickase)之作用,僅剪切標的核苷酸序列之單股。此種RNA導引之核酸酶具有單一作用之核酸酶域。於特定實施方式中,切口酶能夠剪切該正股(positive strand)或負股(negative strand)。在此等實施方式中之一些實施方式中,額外的核酸酶域已經突變,藉以使得核酸酶活性降低或消除。
於一些實施方式中,RNA導引之核酸酶完全缺少核酸酶活性,且在本文中被稱為無核酸酶活性(nuclease-dead)或滅核酸酶活性(nuclease inactive)。本領域中用於將突變引入胺基酸序列內之任何已知方法(諸如PCR介導的誘變(PCR-mediated mutagenesis)及定點誘變(site-directed mutagenesis))可用於產生無切口酶或無核酸酶活性的RGN。例如參見第2014/0068797號美國公開以及第9,790,490號美國專利;此美國公開和美國專利中的每一者的全部內容藉由引用而被併入本文。
缺少核酸酶活性的RNA導引之核酸酶可用於將經融合多肽、多核苷酸或小分子載荷(payload)遞送至特定基因組位址。於此等實施方式中之一些實施方式中,RGN多肽或導引RNA可與可檢測示蹤物融合,以允許特定序列之檢測。作為非限制性範例,無核酸酶活性之RGN可與可檢測示蹤物(例如,螢光蛋白)融合且靶向至與疾病關聯之特定序列,以允許該疾病關聯序列之檢測。
於一些實施方式中,無核酸酶活性之RGN可靶向至特定基因組位址,以改變期望序列之表現。於一些實施方式中,藉由干擾所靶向之基因組區域內之RNA聚合酶或轉錄因子之結合,無核酸酶活性的RNA導引之核酸酶與標的序列之結合導致該標的序列之或受該標的序列的轉錄控制的基因之表現減少。於其他實施方式中,RGN(例如,無核酸酶活性的RGN)或其複合的導引RNA進一步包含表現調控子(modulator),其在與標的序列結合時用來阻抑或活化該標的序列或受該標的序列的轉錄控制的基因之表現。於此等實施方式中之一些實施方式中,表現調控子透過表觀遺傳(epigenetic)機制調控該標的序列或所調節基因之表現。
於一些實施方式中,無核酸酶活性之RGN或僅有切口酶活性之RGN可靶向至特定基因組位址,以透過與鹼基編輯多肽(舉例而言,脫胺酶多肽)或其活性變體或片段融合(此舉直接化學修飾核鹼基(例如,直接使核鹼基脫胺基))來修飾標的多核苷酸之序列,導致從一種核鹼基轉化為另一種核鹼基。該鹼基編輯多肽可在其N末端側或C末端側與該RGN融合。另外,該鹼基編輯多肽可經由胜肽聯結子而與該RGN融合。有用於此類組成物及方法之脫胺酶多肽的非限制性範例包括胞苷脫胺酶或腺嘌呤脫胺酶(諸如,Gaudelli等人(2017)Nature 551:464-471、第2017/0121693號及第2018/0073012號美國專利公開、第WO/2018/027078號國際專利公開中描述的腺苷鹼基編輯器,或者第WO 2020/139873號國際專利公開及第62/785,391號(2018年12月27日提交申請)、第62/932,169號(2019年11月7日提交申請)、及第63/077,089號(2020年9月11日提交申請)之美國臨時專利申請中揭露之脫胺酶中任一者,上述之每一者之全部內容藉由引用而被併入本文)。此外,本領域中已知RGN與鹼基編輯酵素之間之某些融合蛋白亦可包含至少一個尿嘧啶穩定多肽(uracil stabilizing polypeptide),其藉由脫胺酶增加胞苷(cytidine)、脫氧胞苷(deoxycytidine)或胞嘧啶(cytosine)與核酸分子中之胸苷(thymidine)、脫氧胸苷(deoxythymidine)或胸腺嘧啶(thymine)的突變率。尿嘧啶穩定多肽的非限制性範例包括2020年7月15日提交申請的第63/052,175號美國臨時專利申請揭露的尿嘧啶穩定多肽及尿嘧啶糖基化酶抑制劑(uracil glycosylase inhibitor,UGI)域(SEQ ID NO:137),該尿嘧啶糖基化酶抑制劑(UGI)域可增加鹼基編輯功效。於特定實施方式中,本揭露內容提供一種包含本文描述之RGN或其變體、脫胺酶、及視情況而定的至少一個尿嘧啶穩定多肽(諸如,UGI)之融合蛋白。於某些實施方式中,融合至該鹼基編輯多肽之RGN為剪切該鹼基編輯多肽不發揮作用之DNA股之切口酶(例如,脫胺酶)。與多肽或域融合的RNA導引之核酸酶可藉由聯結子而被分開或連結。如本文所使用的,術語「聯結子」係指聯結兩個分子或部分(例如,核酸酶之結合域及剪切域)的化學基團或分子。於一些實施方式中,聯結子連結RNA導引之核酸酶的gRNA結合域與諸如脫胺酶的鹼基編輯多肽。於一些實施方式中,聯結子連結無核酸酶活性的RGN與脫胺酶。通常情況下,聯結子位於兩個基團、分子或其他部分之間或側邊有兩個基團、分子或其他部分,且經由共價鍵而被連接到每一者,由此連接該二者。於一些實施方式中,聯結子為胺基酸或複數胺基酸(例如,胜肽或蛋白質)。於一些實施方式中,聯結子為有機分子、基團、聚合物或化學部分。於一些實施方式中,聯結子之長度為5-100個胺基酸,舉例而言,長度為5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、30-35、35-40、40-45、45-50、50-60、60-70、70-80、80-90、90-100、100-150、或150-200個胺基酸。亦考量了更長或更短的聯結子。
於各種實施方式中,本揭露內容提供本發明揭露之RNA導引之核酸酶,包含至少一個核定位訊號(nuclear localization signal)(NLS),以增強該RGN向細胞之核的運輸。核定位訊號為本領域中已知的且一般而言包含一段鹼性胺基酸(參見,例如,Lange等人,J. Biol. Chem . (2007)282:5101-5105)。於特定實施方式中,RGN包含2、3、4、5、6或更多個核定位訊號。(各)核定位訊號可為異源NLS。有用於本發明揭露之RGN的核定位訊號的非限制性範例為SV40大T抗原、核質素及c-Myc的核定位訊號(參見,例如,Ray等人(2015)Bioconjug Chem 26(6):1004-7)。於特定實施方式中,RGN包含如SEQ ID NO:149或150所示之NLS序列。該RGN可在其N-端、C-端、或在N-端及C-端二者包含一或更多NLS序列。舉例而言,該RGN可在N端區域處包含二個NLS序列,而在C端區域處包含四個NLS序列。
本領域中已知的將多肽定位於(複數)特定亞細胞位址的其他定位訊號序列亦可用於靶向該RGN,包含但不限於:質體定位序列、粒線體定位序列、及靶向質體及粒線體二者的雙靶向訊號序列(參見,例如,Nassoury及Morse (2005)Biochim Biophys Acta 1743:5-19;Kunze及Berger (2015)Front Physiol dx.doi.org/10.3389/fphys.2015.00259;Herrmann及Neupert (2003)IUBMB Life 55:219-225;Soll (2002)Curr Opin Plant Biol 5:529-535;Carrie及Small (2013)Biochim Biophys Acta 1833:253-259;Carrie等人(2009)FEBS J 276:1187-1195;Silva-Filho (2003)Curr Opin Plant Biol 6:589-595;Peeters及Small (2001)Biochim Biophys Acta 1541:54-63;Murcha等人(2014)J Exp Bot 65:6301-6335;Mackenzie (2005)Trends Cell Biol 15:548-554;Glase等人(1998)Plant Mol Biol 38:311-338)。
於某些實施方式中,本發明揭露之RNA導引之核酸酶包含促進該RGN之細胞攝取的至少一個細胞穿透域。細胞穿透域為本領域中已知的且一般而言包含:數段帶正電荷的胺基酸殘基(亦即,聚陽離子細胞穿透域)、交替極性的胺基酸殘基及非極性胺基酸殘基(亦即,兩親性細胞穿透域)、或疏水性胺基酸殘基(亦即,疏水性細胞穿透域)(參見,例如,Milletti F.(2012)Drug Discov Today 17:850-860)。細胞穿透域之非限制性範例為來自人免疫缺陷病毒1的反式活化轉錄活化子(TAT)。
可將核定位訊號、質體定位訊號、粒線體定位訊號、雙靶向定位訊號、及/或細胞穿透域安置於該RNA導引之核酸酶之胺基端(N-端)、羧基端(C-端)、或內部位址中。
於某些實施方式中,本發明揭露之RGN可經由聯結子胜肽而直接或間接地與諸如剪切域、脫胺酶域、或表現調控域(expression modulator domain)的效應域融合。此域可被安置於該RNA導引之核酸酶之N端、C端或內部位址處。於此等實施方式中之一些實施方式中,融合蛋白之RGN組成為無核酸酶活性之RGN。
於一些實施方式中,RGN融合蛋白包含剪切域,該剪切域為能夠剪切多核苷酸(亦即,RNA、DNA或RNA/DNA雜合體)的任何域,並且包括但不限於限制性核酸內切酶和歸巢核酸內切酶(homing endonuclease),諸如IIS型核酸內切酶(例如,Fok I)(參見,例如,Belfort等人(1997)Nucleic Acids Res. 25:3379-3388;Linn等人(eds.)Nucleases(核酸酶),冷泉港實驗室出版社(Cold Spring Harbor Laboratory Press),1993)。
於一些實施方式中,RGN融合蛋白包含脫胺酶域,該脫胺酶域將核鹼基脫去胺基,導致一種核鹼基轉化為另一種核鹼基,且包括但不限於胞苷脫胺酶或腺嘌呤脫胺酶鹼基編輯器,(參見,例如,Gaudelli等人(2017)Nature 551:464-471、第2017/0121693號及第2018/0073012號美國專利公開、第9,840,699號美國專利及第WO/2018/027078號國際公開、第PCT/US2019/068079號國際專利申請、及第62/785,391號(2018年12月27日提交申請)及第62/932,169號(2019年11月7日提交申請)美國臨時專利申請)。
於一些實施方式中,RGN融合蛋白之效應域可為表現調控域,該表現調控域為用來向上調節或向下調節轉錄之域。該表現調控域可為表觀遺傳修飾域、轉錄阻抑域或轉錄活化域。
於此等實施方式中之一些實施方式中,RGN融合蛋白之表現調控子包含表觀遺傳修飾域,該表觀遺傳修飾域共價修飾DNA或組蛋白以改變組蛋白結構及/或染色體結構,而不改變該DNA序列,引致基因表現的變化(亦即,向上調節或向下調節)。表觀遺傳修飾的非限制性範例包括離胺酸殘基的乙醯化或甲基化、精胺酸甲基化、絲胺酸及蘇胺酸磷酸化、及組蛋白的離胺酸泛素化(ubiquitination)及SUMO化(sumoylation)、及DNA中胞嘧啶殘基的甲基化和羥甲基化。表觀遺傳修飾域的非限制性範例包括組蛋白乙醯基轉移酶域、組蛋白去乙醯基酶域、組蛋白甲基轉移酶域、組蛋白去甲基酶域、DNA甲基轉移酶域及DNA去甲基酶域。
於一些實施方式中,融合蛋白的表現調控子包含轉錄阻抑域,該轉錄阻抑域與諸如RNA聚合酶及轉錄因子的轉錄控制元素及/或轉錄調節蛋白相互作用,以減少或終止至少一個基因的轉錄。轉錄阻抑域為本領域中已知且包括但不限於類Sp1阻抑子、IκB及Krüppel關聯盒(KRAB)域。
於一些實施方式中,融合蛋白的表現調控子包含轉錄活化域,該轉錄活化域與諸如RNA聚合酶及轉錄因子的轉錄控制元素及/或轉錄調節蛋白相互作用,以增加或活化至少一個基因的轉錄。轉錄活化域為本領域中已知且包括但不限於單純皰疹病毒VP16活化域及NFAT活化域。
於一些實施方式中,本發明揭露之RGN多肽包含可檢測示蹤物(detectable label)或純化示跡物(purification tag)。該可檢測示蹤物或純化示跡物可直接地或經由聯結子胜肽間接地被安置於該RNA導引之核酸酶的N-端、C-端或內部位址處。於此等實施方式中之一些實施方式中,融合蛋白的RGN組成為無核酸酶活性RGN。於其他實施方式中,融合蛋白的RGN組成為具切口酶活性RGN。
可檢測示蹤物為可直觀的或可以其他方式觀察的分子。可檢測示蹤物可與該RGN融合為融合蛋白(例如,螢光蛋白),也可為與RGN多肽綴合的、可直觀地或藉由其他手段檢測的小分子。可與本發明揭露之RGN融合為融合蛋白之可檢測示蹤物包括任何可檢測蛋白域,包括但不限於可用專一性抗體檢測的螢光蛋白或蛋白域。螢光蛋白的非限制性範例包括綠色螢光蛋白(例如,GFP、EGFP、ZsGreen1)及黃色螢光蛋白(例如,YFP、EYFP、ZsYellow1)。小分子可檢測示蹤物的非限制性範例包括放射性示蹤物,諸如,3 H以及35 S。
於一些實施方式中,本發明揭露之RGN多肽包含純化示跡物,該純化示跡物為自混合物(例如,生物樣本、培養基)分離蛋白質或融合蛋白可採用之任何分子。純化示跡物的非限制性範例包括生物素、myc、麥芽糖結合蛋白(MBP)、及麩胱甘肽-S-轉移酶(GST)。III. 導引 RNA
本揭露內容提供導引RNA及編碼同者之多核苷酸。術語「導引RNA」係指核苷酸序列,該核苷酸序列與標的核苷酸序列具有足夠互補性,以與該標的序列雜合且將關聯RNA導引之核酸酶之序列專一性結合導向至該標的核苷酸序列。由此,RGN之分別導引RNA為一或更多RNA分子(一般而言,一或二個),其可與該RGN結合且導引RGN來與特定標的核苷酸序列結合,且在該RGN具有切口酶或核酸酶活性的那些實施方式中,還剪切該標的核苷酸序列。於一些實施方式中,導引RNA包含CRISPR RNA(crRNA)且於一些實施方式中,包含反式活化CRISPR RNA(tracrRNA)。包含crRNA及tracrRNA二者之天然導引RNA一般而言包含二個各別RNA分子,此二個各別RNA分子透過該crRNA之重複序列及該tracrRNA之抗重複序列彼此雜合。
於一些實施方式中,CRISPR陣列內之天然直接重複序列在28至37個鹼基對之長度範圍內。於一些實施方式中,CRISPR陣列內之天然直接重複序列之長度在約23 bp至約55 bp(例如,自23 bp至55 bp)之範圍內。於一些實施方式中,CRISPR陣列內之間隔體序列之長度在約32至約38bp之範圍內。於一些實施方式中,CRISPR陣列內之間隔體序列之長度在約21 bp至約72 bp(例如,自21 bp至72 bp)之範圍內。於一些實施方式中,本文所揭露之CRISPR陣列包含少於50個單位的CRISPR重複子-間隔體序列。該CRISPR被轉錄為被稱為初級CRISPR轉錄本(transcript)的長轉錄本之局部,其包含該CRISPR陣列之大部分。該初級CRISPR轉錄本被Cas蛋白剪切,以產生crRNA,或者在一些情況中,產生前驅crRNA(pre-crRNA),其被額外的Cas蛋白進一步處理為成熟的crRNA。成熟的crRNA包含間隔體序列及CRISPR重複序列。於其中將前驅crRNA處理為成熟(或經處理)crRNA的一些實施方式中,成熟化涉及移除約1至約6個或更多個5'、3'或5'及3'核苷酸。出於基因組編輯或靶向所關注之特定標的核苷酸序列的目的,在前驅crRNA分子熟化期間移除的此等核苷酸對於產生或設計導引RNA不是必需的。本發明揭露之每一個RGN蛋白(SEQ ID NO:1-109)之共有重複序列(consensus repeat sequence)分別示於SEQ ID NO:201-309中。APG07339(SEQ ID NO:1)、APG09624(SEQ ID NO:2)、APG03003(SEQ ID NO:3)、APG05405(SEQ ID NO:4)、APG09777(SEQ ID NO:5)、APG05680(SEQ ID NO:6)、APG06369(SEQ ID NO:11)、APG03847(SEQ ID NO:12)、APG05625(SEQ ID NO:13)、及APG03524(SEQ ID NO:16)中之每一者之經處理crRNA重複序列分別揭露於SEQ ID NO:110-119中。
CRISPR RNA(crRNA)包含間隔體序列及CRISPR重複序列。「間隔體序列」為與所關注之標的核苷酸序列直接雜合的核苷酸序列。該間隔體序列被工程化為與所關注之標的序列完全地或部分地互補。於各種實施方式中,間隔體序列可包含約8個核苷酸至約30個核苷酸或更多個核苷酸。舉例而言,該間隔體序列之長度可為約8、約9、約10、約11、約12、約13、約14、約15、約16、約17、約18、約19、約20、約21、約22、約23、約24、約25、約26、約27、約28、約29、約30或更多個核苷酸。於一些實施方式中,間隔體序列之長度為約10至約26個核苷酸,或長度為約12至約30個核苷酸。於特定實施方式中,間隔體序列之長度為約30個核苷酸。於一些實施方式中,當使用適合的對準(alighment)演算法進行最佳對準時,間隔體序列與其對應的標的序列之間之互補性程度為約或大於約50%、約60%、約70%、約75%、約80%、約81%、約82%、約83%、約84%、約85%、約86%、約87%、約88%、約89%、約90%、約91%、約92%、約93%、約94%、約95%、約96%、約97%、約98%、約99%或更高。於特定實施方式中,間隔體序列不含使用本領域中已知的任何適合的多核苷酸摺疊演算法可預測之二次結構,多核苷酸摺疊演算法包括但不限於mFold(參見,例如,Zuker及Stiegler(1981)Nucleic Acids Res . 9:133-148)及RNAfold(參見,例如,Gruber等人(2008)Cell 106(1):23-24)。
CRISPR RNA重複序列包含核苷酸序列,該核苷酸序列或者獨自地或者與所雜合tracrRNA配合形成藉由該RGN分子辨識之結構。於各種實施方式中,CRISPR RNA重複序列可包含約8個核苷酸至約30個核苷酸或更多個核苷酸。舉例而言,CRISPR重複序列之長度可為約8、約9、約10、約11、約12、約13、約14、約15、約16、約17、約18、約19、約20、約21、約22、約23、約24、約25、約26、約27、約28、約29、約30或更多個核苷酸。於一些實施方式中,CRISPR重複序列之長度為約21個核苷酸。於一些實施方式中,當使用適合的對準演算法進行最佳對準時,CRISPR重複序列與其對應的tracrRNA序列之間之互補性程度為約或大於約50%、約60%、約70%、約75%、約80%、約81%、約82%、約83%、約84%、約85%、約86%、約87%、約88%、約89%、約90%、約91%、約92%、約93%、約94%、約95%、約96%、約97%、約98%、約99%或更高。於特定實施方式中,CRISPR重複序列包含SEQ ID NO:110至119、139、141、143、146、及201至309之核苷酸序列之任一者或其活性變體或片段,其當被包含於導引RNA內時能夠將本文所提供之關聯RNA導引之核酸酶之序列專一性結合導向至所關注之標的序列。於某些實施方式中,野生型序列之活性CRISPR重複序列變體包含與如SEQ ID NO:110至119、139、141、143、146、及201至309所示之核苷酸序列中任一者具有至少40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高序列一致性之核苷酸序列。於某些實施方式中,野生型序列之活性CRISPR重複序列片段包含如SEQ ID NO:110至119、139、141、143、146、及201至309所示之核苷酸序列中任一者之至少5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20個連續核苷酸。
於某些實施方式中,crRNA不是天然存在的。於此等實施方式中之一些實施方式中,專一性CRISPR重複序列在本質上不與該工程化間隔體序列聯結,且該CRISPR重複序列被認為與該間隔體序列是異源的。於某些實施方式中,間隔體序列為非天然存在之工程化序列。
於一些實施方式中,導引RNA進一步包含tracrRNA分子。反式活化的CRISPR RNA或tracrRNA分子包含核苷酸序列,該核苷酸序列包含具有與crRNA之CRISPR重複序列雜合之足夠互補性的區域,其在本文中被稱為抗重複子區域(anti-repeat region)。於一些實施方式中,tracrRNA分子進一步包含具二次結構(例如,莖-環)之區域,或在與其對應的crRNA雜合時形成二次結構。於特定實施方式中,tracrRNA的與CRISPR重複序列完全地或部分地互補之區域處於分子的5'末側,且該tracrRNA的3'末側包含二次結構。此二次結構區域一般而言包含被發現與該抗重複序列相鄰、包括融合膜(nexus)髮夾的數個髮夾結構。該tracrRNA的3'末側處常常存在端髮夾,其結構及數量可變,但常常包括富含GC的Rho獨立轉錄終止子髮夾,其後在3'末側處具有一串U。參見,舉例而言,Briner等人(2014)Molecular Cell 56:333-339、Briner及Barrangou(2016)Cold Spring Harb Protoc ; doi:10.1101/pdb.top090902及第2017/0275648號美國專利公開,上述每一者之全部內容藉由引用併入本文。
於各種實施方式中,與CRISPR重複序列完全地或部分地互補的tracrRNA的抗重複子區域包含約6個核苷酸至約30個核苷酸或更多個核苷酸。舉例而言,tracrRNA抗重複序列與該CRISPR重複序列之間之鹼基配對區域之長度可為約6、約7、約8、約9、約10、約11、約12、約13、約14、約15、約16、約17、約18、約19、約20、約21、約22、約23、約24、約25、約26、約27、約28、約29、約30或更多個核苷酸。於特定實施方式中,與CRISPR重複序列完全地或部分地互補的tracrRNA的抗重複子區域之長度為約10個核苷酸。於一些實施方式中,當使用適合的對準演算法進行最佳對準時,CRISPR重複序列與其對應的tracrRNA抗重複序列之間之互補性程度為約或大於約50%、約60%、約70%、約75%、約80%、約81%、約82%、約83%、約84%、約85%、約86%、約87%、約88%、約89%、約90%、約91%、約92%、約93%、約94%、約95%、約96%、約97%、約98%、約99%或更高。
於各種實施方式中,整個tracrRNA可包含約60個核苷酸至多於約210個核苷酸。舉例而言,該tracrRNA之長度可為約60、約65、約70、約75、約80、約85、約90、約95、約100、約105、約110、約115、約120、約125、約130、約135、約140、約150、約160、約170、約180、約190、約200、約210或更多個核苷酸。於特定實施方式中,tracrRNA之長度為約100至約201個核苷酸,長度為包括約95、約96、約97、約98、約99、約100、約105、約106、約107、約108、約109及約100個核苷酸。於某些實施方式中,tracrRNA之長度為約96個核苷酸。
於特定實施方式中,tracrRNA包含SEQ ID NO:120至128、140、142、145、147、及148的核苷酸序列之任一者或其活性變體或片段,其當被包含於導引RNA內時能夠將本文提供之關聯RNA導引之核酸酶之序列專一性結合導向至所關注之標的序列。於某些實施方式中,野生型序列之活性tracrRNA序列變體包含與如SEQ ID NO:120至128、140、142、145、147、及148所示之核苷酸序列之任一者具有至少40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高序列一致性的核苷酸序列。於某些實施方式中,野生型序列之活性tracrRNA序列片段包含如SEQ ID NO:120至128、140、142、145、147、及148所示之核苷酸序列之任一者之至少5、10、15、20、25、30、35、40、45、50、55、60、65、70、75、80或更多個連續核苷酸。
當二個序列在嚴格條件下彼此雜合時,可認為該二個多核苷酸序列實質上互補。同樣地,如果與RGN結合之導引RNA在嚴格條件下與標的序列結合,則認為該RGN以序列專一性方式結合至該特定標的序列。「嚴格條件」或「嚴格雜合條件」旨在指二個多核苷酸序列彼此雜合至可檢測程度高於其他序列(例如,至少比背景高2倍)的條件。嚴格條件為序列相依的,且在不同環境下將會不同。通常情況下,嚴格條件將是這樣的條件,其中:在pH 7.0至8.3,鹽類濃度小於約1.5 M Na離子,通常情況下約0.01至1.0 M Na離子濃度(或其它鹽類),且針對短序列(例如,10至50個核苷酸),溫度為至少約30 ℃,而針對長序列(例如,大於50個核苷酸),溫度為至少約60 ℃。藉由添加諸如甲醯胺的去穩定劑亦可達到嚴格條件。範例性的低嚴格條件包括在37℃下以30至35%甲醯胺、1 M NaCl、1%SDS(十二烷基硫酸鈉)的緩衝溶液雜合及在50至55℃以1X至2X SSC洗滌(20X SSC = 3.0 M NaCl/0.3 M檸檬酸三鈉)。範例性的中等嚴格條件包括在37℃下於40至45%甲醯胺、1.0 M NaCl、1% SDS中雜合及在55至60℃下在0.5X至1X SSC中洗滌。範例性的高嚴格條件包括在37℃下於50%甲醯胺、1 M NaCl、1% SDS中雜合及在60至65℃下在0.1X SSC中洗滌。視情況,洗滌緩衝液可包含約0.1%至約1%的SDS。雜合持續時間一般而言小於約24小時,通常約4至約12小時。洗滌時間的持續時間至少為足以達到平衡的時間長度。
Tm為50%之互補標的序列與完全匹配之序列雜合之溫度(於所界定之離子強度和pH下)。對於DNA-DNA雜合體,Tm可以由Meinkoth和Wahl(1984)Anal. Biochem. 138:267-284中的等式:Tm = 81.5℃ + 16.6 (log M) + 0.41 (%GC) - 0.61 (% form) - 500/L大致估計;其中M為單價陽離子的莫耳濃度,%GC為鳥苷和胞嘧啶核苷酸於該DNA中的百分比,%form為甲醯胺於雜合溶液中之百分比,及L為鹼基對中的雜合體之長度。一般而言,嚴格條件被選擇為比在所界定之離子強度和pH下的專一性序列及其補體的熱熔點(Tm)低約5℃。然而,極度嚴格條件可採用在比該熱熔點(Tm)低1、2、3或4℃下的雜合及/或洗滌;中等嚴格條件可採用在比該熱熔點(Tm)低6、7、8、9或10℃的溫度下的雜合及/或洗滌;低嚴格條件可採用在比該熱熔點(Tm)低11、12、13、14、15或20℃的溫度下的雜合及/或洗滌。本領域具有通常知識者將明白,使用該等式、雜合及洗滌組成物以及要求的Tm,雜合及/或洗滌溶液的嚴格性的變化被固有地描述了。核酸雜合的廣泛指南可在Tijssen(1993)Laboratory Techniques in Biochemistry and Molecular Biology—Hybridization with Nucleic Acid Probes, Part I, Chapter 2(Elsevier,New York);及Ausubel等人eds.(1995) Current Protocols in Molecular Biology,Chapter 2(Greene Publishing and Wiley-Interscience,New York)中得到。參見Sambrook等人(1989)Molecular Cloning:A Laboratory Manual(2d ed., Cold Spring Harbor Laboratory Press, Plainview, New York)。
術語「序列專一性」亦可係指相較於與隨機化背景序列之結合,以更高頻率與標的序列結合。
於一些實施方式中,例如,其中該導引RNA包含crRNA及tracrRNA二者,該導引RNA可為單導引RNA或雙導引RNA系統。單導引RNA包含單RNA分子上之crRNA及tracrRNA,而雙導引RNA系統包含存在於二個相異RNA分子上之crRNA及tracrRNA,其透過該crRNA之CRISPR重複序列的至少一部位及該tracrRNA的至少一部位而彼此雜合,其可與該crRNA的CRISPR重複序列完全地或部分地互補。於其中導引RNA為單導引RNA的那些實施方式中之一些實施方式中,crRNA與tracrRNA被聯結子核苷酸序列分開。一般來說,為避免二次結構於該聯結子核苷酸序列的核苷酸內之形成或避免包含該聯結子核苷酸序列之核苷酸之二次結構之形成,聯結子核苷酸序列為不包括互補鹼基之核苷酸序列。於一些實施方式中,crRNA與tracrRNA之間之聯結子核苷酸序列之長度為至少3、至少4、至少5、至少6、至少7、至少8、至少9、至少10、至少11、至少12個或更多個核苷酸。於特定實施方式中,單導引RNA之聯結子核苷酸序列之長度為至少4個核苷酸。於某些實施方式中,聯結子核苷酸序列為如SEQ ID NO:136所示之核苷酸序列。於其他實施方式中,聯結子核苷酸序列之長度為至少6個核苷酸。
該單導引RNA或雙導引RNA可被化學合成或經由體外轉錄合成。用於確定RGN與導引RNA之間之序列專一性結合的測定法為本領域中所知、並且包括但不限於所表現RGN與該導引RNA之間之體外結合測定法,其可用可檢測示蹤物(如生物素)標記用於下拉檢測測定法,其中,該導引RNA:RGN複合物是經由該可檢測示蹤物(例如,利用鏈黴親和素珠(streptavidin bead))捕獲的。具與該導引RNA無關之序列或結構的對照物導引RNA可用作該RGN與RNA之非專一性結合的陰性對照物。於某些實施方式中,導引RNA為SEQ ID NO:129至135及310中任一者,其中該間隔體序列可為任何序列且被指示為poly-N序列。
於某些實施方式中,導引RNA可為RNA分子而被引入標的細胞、胞器或胚胎中。該導引RNA可以在體外被轉錄或被化學合成。於其他實施方式中,將編碼該導引RNA之核苷酸序列引入該細胞、胞器或胚胎中。於此等實施方式中之一些實施方式中,編碼該導引RNA之核苷酸序列可操作地被聯結至啟動子(例如,RNA聚合酶III啟動子)。該啟動子可為天然啟動子或與該導引RNA編碼的核苷酸序列異源。
於各種實施方式中,如本文所述,導引RNA可為核糖核蛋白複合物而被引入標的細胞、胞器或胚胎中,其中該導引RNA與RNA導引之核酸酶多肽結合。
導引RNA透過該導引RNA與該標的核苷酸序列之雜合而將關聯RNA導引之核酸酶導向至所關注之特定標的核苷酸序列。標的核苷酸序列可包含DNA、RNA或二者之組合,且可為單股或雙股的。標的核苷酸序列可為基因組DNA(亦即,染色體DNA)、質體DNA、或RNA分子(例如,信使RNA、核醣體RNA、轉移RNA、微RNA、小干擾RNA)。該標的核苷酸序列可在體外或在細胞中藉由RNA導引之核酸酶被結合(而於一些實施方式中,被剪切)。該RGN所靶向之染色體序列可為核、質體或粒線體染色體序列。於一些實施方式中,標的核苷酸序列於該標的基因組中為唯一的。
於一些實施方式中,標的核苷酸序列與原型間隔體相鄰模體(protospacer adjacent motif)(PAM)相鄰。於某些實施方式中,雙股標的序列之剪切依賴於PAM之存在,而單股標的序列之剪切為PAM獨立的。原型間隔體相鄰模體一般而言在距該標的核苷酸序列約1至約10個核苷酸內,包括距該標的核苷酸序列約1、約2、約3、約4、約5、約6、約7、約8、約9、或約10個核苷酸。該PAM可為該標的序列之5'或3'。於一些實施方式中,PAM為本發明揭露之RGN的標的序列之5'。一般而言,該PAM是約3-4個核苷酸之共有序列,但於特定實施方式中,PAM之長度可為1、2、3、4、5、6、7、8、9或更多個核苷酸。於一些實施方式中,PAM為該標的序列之5',且為富T。
於一些實施方式中,RNG分別與包含SEQ ID NO:110至119、139、141、143、146、及201至309中任一者所示之CRISPR重複序列或其活性變體或片段及SEQ ID NO:120至128、140、142、145、147、及148中任一者分別所示之tracrRNA序列或其活性變體或片段之導引序列結合。該RGN系統被進一步描述於本說明書之範例1及表1中。
本領域中眾所周知,PAM序列對給定核酸酶酵素之專一性受酵素濃度的影響(參見,例如,Karvelis等人(2015)Genome Biol 16:253),其可以藉由改變用於表現該RGN之啟動子或被遞送至該細胞、胞器或胚胎的核糖核蛋白複合物的量來修飾。
於藉由該RGN之結合及剪切依賴於PAM序列之此等實施方式中,在辨識其對應的PAM序列時,RGN可在專一性剪切位點剪切該標的核苷酸序列。如本文所使用的,剪切位點是由標的核苷酸序列內之二個特定核苷酸組成,其之間之核苷酸序列被RGN剪切。該剪切位點可包含在5'或3'方向上自該PAM起之第1和第2、第2和第3、第3和第4、第4和第5、第5和第6、第7和第8、或第8和第9個核苷酸。於一些實施方式中,剪切位點可在5'或3'方向上自該PAM起之10、11、12、13、14、15、16、17、18、19或20個以上的核苷酸。於一些實施方式中,剪切位點距離該PAM 4個核苷酸。於其他實施方式中,剪切位點距離該PAM至少15個核苷酸。因RGN可剪切標的核苷酸序列,導致交錯的末側,所以,於一些實施方式中,基於該多核苷酸的正(+)股上的二個核苷酸離開該PAM的距離及該多核苷酸的負(-)股上的二個核苷酸離開該PAM的距離來界定該剪切位點。IV .編碼 RNA 導引之核酸酶、 CRISPR RNA 、及 / tracrRNA 的核苷酸
本揭露內容提供包含本發明揭露之CRISPR RNA、tracrRNA及/或sgRNA的多核苷酸及包含編碼本發明揭露之RNA導引之核酸酶、CRISPR RNA、tracrRNA及/或sgRNA的核苷酸序列的多核苷酸。本發明揭露之多核苷酸包括包含或編碼CRISPR重複序列的那些多核苷酸,該CRISPR重複序列包含SEQ ID NO:110至119、139、141、143、146、及201至309的核苷酸序列中任一者或其活性變體或片段,其當被包含於導引RNA內時能夠將關聯RNA導引之核酸酶之序列專一性結合導向至所關注之標的序列。亦揭露包含或編碼tracrRNA之多核苷酸,該tracrRNA包含SEQ ID NO:120至128、140、142、145、147、and 148的核苷酸序列中任一者或其活性變體或片段,其當被包含於導引RNA內時能夠將關聯RNA導引之核酸酶之序列專一性結合導向至所關注之標的序列。還提供編碼RNA導引之核酸酶的多核苷酸,該RNA導引之核酸酶包含如SEQ ID NO:1至109所示之胺基酸序列中任一者及其活性片段或變體,其保持以RNA導引之序列專一性方式結合至標的核苷酸序列的能力。
術語「多核苷酸」的使用不旨在將本揭露內容局限於包含DNA之多核苷酸,但可考量此種DNA多核苷酸。本領域中具有通常知識者將認識到多核苷酸可包含核糖核苷酸(RNA)及核糖核苷酸與去氧核糖核苷酸之組合。此種去氧核糖核苷酸和核糖核苷酸包括天然存在的分子及合成類似物二者。此等包括例如胜肽核酸(PNA)、PNA-DNA嵌合體(chimer)、鎖核酸(LNA)、及硫代磷酸酯聯結序列。本文所揭露之多核苷酸還涵蓋所有形式的序列,包括但不限於單股形式、雙股形式、DNA-RNA雜合體、三股螺旋結構(triplex structure)、莖環結構、環狀形式(例如,包括環狀RNA)等等。
於一些實施方式中,編碼RGN之核酸分子可針對於所關注之生物體中之表現而被密碼子最佳化。「密碼子最佳化的」編碼序列為使其密碼子使用頻率設計成模擬較佳密碼子使用頻率或特定宿主細胞之轉錄條件的多核苷酸編碼序列。由於核酸層次上的一或更多密碼子的改變使得轉譯的胺基酸序列未改變,所以該特定宿主細胞或生物體中之表現被增強。核酸分子可以全部或部分地被密碼子最佳化。密碼子表和提供一大範圍生物體之偏好資訊的其他參考文獻在本領域中是可得的(參見,例如,Campbell及Gowri(1990)Plant Physiol . 92:1-11,有關植物較佳密碼子使用之討論)。本領域中用於合成植物較佳基因的方法是可得的。參見,例如,第5,380,831號和第5,436,391號美國專利及Murray等人(1989)Nucleic Acids Res . 17:477-498,彼等藉由引用併入本文。
於一些實施方式中,編碼本文中提供之RGN、crRNA、tracrRNA、及/或sgRNA的多核苷酸可在表現卡匣中提供,以用於在體外表現或在所關注之細胞、胞器、胚胎或生物體中表現。該卡匣可包括5'和3'調節序列,該5'和3'調節序列可操作地聯結至編碼本文中提供之允許該多核苷酸表現之RGN、crRNA、tracrRNA、及/或sgRNA的多核苷酸。該卡匣可額外含有至少一種額外基因或基因元素,以共轉化至該生物體內。如果包括額外基因或元素,則該組成被可操作地聯結。術語「可操作地聯結」旨在表達二個或更多個元素之間之功能性聯結。舉例而言,啟動子與所關注之編碼區域(例如,對RGN、crRNA、tracrRNA、及/或sgRNA編碼之區域)之間之可操作地聯結為允許所關注之編碼區域表現之功能性聯結。可操作地聯結之元素可為連續的或非連續的。當用於指二個蛋白質編碼區域的連結時,藉由可操作地聯結意指該編碼區域在相同之閱讀框(reading frame)中。作為另一種選擇,可在複數表現卡匣上提供(複數)額外基因或元素。舉例而言,編碼本發明揭露之RGN的核苷酸序列可存在於一個表現卡匣上,而編碼crRNA、tracrRNA或完整導引RNA之核苷酸序列可在各別表現卡匣上。此表現卡匣被提供有複數個限制性位點及/或重組位點,以使該多核苷酸的插入受調節區域的轉錄調節。該表現卡匣可額外含有選擇性標記基因。
該表現卡匣於該5'-3'轉錄方向上可包括:轉錄(而於一些實施方式中,轉譯)起始區域(亦即,啟動子)、本發明之RGN-、crRNA-、tracrRNA-及/或sgRNA-編碼多核苷酸、及於所關注之生物體中起作用的轉錄(而於一些實施方式中,轉譯)終止區域(亦即,終止區域)。本發明之啟動子能夠在宿主細胞中導向或驅動編碼序列之表現。該調節區域(例如,啟動子、轉錄調節區域、及轉譯終止區域)可與該宿主細胞或彼此為內源的或異源的。如本文所使用的,關於序列的「異源」為源自外來物種的序列,或者,如果來自相同物種,則為藉由蓄意的人為干預從其在組成物及/或基因組基因座中的天然形式實質上被修飾的序列。如本文中所使用的,嵌合基因包含與轉錄起始區域可操作地聯結的編碼序列,該轉錄起始區域與該編碼序列是異源的。
合宜的終止區域可從根癌農桿菌(A. tumefaciens )的Ti質體獲得,諸如,章魚肉鹼(octopine)合成酶及胭脂鹼(nopaline)合成酶終止區域。亦參見Guerineau等人(1991)Mol. Gen. Genet. 262:141-144;Proudfoot(1991)Cell 64:671-674;Sanfacon等人(1991)Genes Dev. 5:141-149;Mogen等人(1990)Plant Cell 2:1261-1272;Munroe等人(1990)Gene 91:151-158;Ballas等人(1989)Nucleic Acids Res . 17:7891-7903;及Joshi等人(1987)Nucleic Acids Res. 15:9627-9639。
額外調節訊號包括但不限於:轉錄起始初始位點(transcriptional initiation start site)、操作子、活化子、增強子、其他調節元素、核醣體結合位點、起始密碼子、終止訊號等等。參見,舉例而言, 第5,039,523號和第4,853,331號美國專利;EPO 0480762A2;Sambrook等人(1992),Molecular Cloning:A Laboratory Manual, ed. Maniatis等人(冷泉港實驗室出版社,冷泉港,紐約(Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y.)),後稱「Sambrook 11」;Davis等人eds.(1980)Advanced Bacterial Genetics(冷泉港實驗室出版社,冷泉港,紐約((Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y.)))以及其中引用的參考文獻。
在製備表現卡匣時,可操縱各種DNA片段,以便在適宜的取向上及恰當的情況下於適宜閱讀框中對該DNA序列進行提供。為此,可以運用轉接子或聯結子來連結該DNA片段,或者可涉及其他操縱以對合宜的限制位點、除去多餘的DNA、除去限制位點等進行提供。為此目的,可涉及體外誘變、引子修復、限制、黏合(annealing)、重新置換,例如,轉換和顛換(transversion)。
很多啟動子可用於本發明之實施。可基於期望結局來選擇啟動子。該核酸可以與構成型、誘導型、生長階段專一性、細胞類型專一性、組織較佳、組織專一性之啟動子或其他啟動子組合,用於所關注之生物體中之表現。參見,舉例而言, WO 99/43838中及第8,575,425號;第7,790,846號;第8,147,856號;第8,586832號;第7,772,369號;第7,534,939號;第6,072,050號;第5,659,026號;第5,608,149號;第5,608,144號;第5,604,121號;第5,569,597號;第5,466,785號;第5,399,680號;第5,268,463號;第5,608,142號;以及第6,177,611號美國專利中所示之啟動子;彼等藉由引用併入本文。
對於在植物中之表現,構成型啟動子亦包括CaMV 35S啟動子(Odell等人(1985)Nature 313:810-812);稻穀肌動蛋白(rice actin)(McElroy等人(1990)Plant Cell 2:163-171);泛素(Christensen等人(1989)Plant Mol. Biol. 12:619-632及Christensen等人(1992)Plant Mol. Biol. 18:675-689);pEMU(Last等人(1991)Theor. Appl. Genet. 81:581-588);及MAS(Velten等人(1984)EMBO J. 3:2723-2730)。
誘導型啟動子之範例為:可藉由缺氧或寒逆境誘導的Adh1啟動子、可藉由熱逆境誘導的Hsp70啟動子、可由光誘導的PPDK啟動子及PEP羧化酶(pepcarboxylase)啟動子。同樣有用的為化學誘導之啟動子,諸如,安全劑誘導的In2-2啟動子(第5,364,780號美國專利)、生長素誘導的且是絨氈層專一性的但在癒合組織中亦有活性的Axig1啟動子(PCT US01/22169)、類固醇反應性啟動子(參見,舉例而言,Schena等人(1991)Proc. Natl. Acad. Sci. USA 88:10421-10425及McNellis等人(1998)Plant J . 14(2):247-257中的雌激素誘導的ERE啟動子和糖皮質激素誘導型啟動子)、及四環素誘導型和四環素阻抑型啟動子(參見,舉例而言,Gatz等人(1991)Mol. Gen. Genet . 227:229-237及第5,814,618號和第5,789,156號美國專利),彼等藉由引用併入本文。
可採用組織專一性或組織較佳之啟動子來靶向特定組織內的表現構築體的表現。於某些實施方式中,組織專一性或組織較佳之啟動子在植物組織中是有活性的。在植物中受發育控制之啟動子之範例包括在諸如葉、根、果實、種子或花的某些組織中較佳地起動轉錄之啟動子。「組織專一性」啟動子為僅在某些組織中起動轉錄之啟動子。與基因的構成型表現不同,組織專一性表現是幾種水準的基因調節相互作用的結果。因此,來自同源或密切相關的植物物種之啟動子可較佳地用於在特定組織中實現轉殖基因的有效且可靠的表現。於一些實施方式中,表現包含組織較佳之啟動子。「組織較佳之」啟動子是較佳地在,但不一定完全在或僅在某些組織中起動轉錄之啟動子。
於一些實施方式中,編碼RGN、crRNA、及/或tracrRNA的核酸分子包含細胞類型專一性啟動子。「細胞類型專一性」啟動子為主要在一或更多器官的某些細胞類型中驅動表現之啟動子。舉例而言,其中在植物中起作用的細胞類型專一性啟動子可為主要活性之植物細胞的一些範例包括BETL細胞、根、葉中的維管細胞、柄細胞、及幹細胞(stem cell)。核酸分子還可包括細胞類型較佳之啟動子。「細胞類型較佳之」啟動子為主要驅動大部分在,但不一定完全在或僅在一或更多器官中的某些細胞類型中的表現之啟動子。舉例而言,其中在植物中起作用的細胞類型較佳之啟動子可具較佳活性之植物細胞的一些範例包括BETL細胞、根、葉中的維管細胞、柄細胞、及幹細胞。
編碼該RGN、crRNA、tracrRNA、及/或sgRNA的核酸序列可與舉例而言藉由用於體外mRNA合成之噬菌體RNA聚合酶辨識之啟動子序列可操作地聯結。於此類實施方式中,可純化該體外轉錄的RNA,以用於本文所述的方法。舉例而言,該啟動子序列可為T7、T3或SP6啟動子序列,或T7、T3或SP6啟動子序列的變體。於此類實施方式中,可純化所表現蛋白及/或RNA,以用於本文所述的基因組修飾方法。
於某些實施方式中,編碼該RGN、crRNA、tracrRNA、及/或sgRNA的多核苷酸亦可與多腺苷酸化訊號(例如,SV40 polyA訊號及植物中起作用的其他訊號)及/或至少一個轉錄終止序列聯結。另外,編碼該RGN的序列亦可與編碼至少一個核定位訊號、至少一個細胞穿透域及/或能夠將蛋白質運輸到特定亞細胞部位的至少一個訊號胜肽的(複數)序列聯結,如本文中別處所述。
編碼該RGN、crRNA、tracrRNA、及/或sgRNA的多核苷酸可存在於載體或複數載體中。「載體」係指用於將核酸轉移、遞送或引入宿主細胞內的多核苷酸組成物。適合的載體包括質體載體、噬菌粒、黏接質體(cosmids)、人工/微型染色體、轉位子、及病毒載體(例如,慢病毒載體、腺關聯性病毒載體、杆狀病毒載體)。該載體可包含額外的表現控制序列(例如,增強子序列、Kozak序列、多腺苷酸化序列、轉錄終止序列)、選擇性標記序列(例如,抗生素抗性基因)、複製起點等等。額外資訊可在「Current Protocols in Molecular Biology」Ausubel等人、John Wiley & Sons,紐約,2003;或 「Molecular Cloning:A Laboratory Manual」Sambrook & Russell,Cold Spring Harbor Press, Cold Spring Harbor, N.Y., 3rd edition, 2001中找到。
該載體亦可包含用於選擇轉化細胞的選擇性標記基因。對於轉化的細胞或組織之選擇採用選擇性標記基因。標記基因包括:編碼抗生素抗性的基因,諸如,編碼新黴素磷酸轉移酶II(NEO)和潮黴素磷酸轉移酶(HPT)的基因;以及對諸如草銨膦(glufosinate ammonium)、溴苯腈、咪唑啉酮及2,4-二氯苯氧乙酸鹽(2,4-d)的除草性化合物賦予抗性的基因。
於一些實施方式中,包含編碼該RGN多肽之序列的表現卡匣或載體可進一步包含編碼crRNA及/或tracrRNA或者被組合以創建導引RNA的crRNA及tracrRNA的序列。編碼該crRNA及/或tracrRNA的(複數)序列可與至少轉錄控制序列可操作地聯結,用於該crRNA及/或tracrRNA於所關注之生物體或宿主細胞中之表現。舉例而言,編碼該crRNA及/或tracrRNA之多核苷酸可與藉由RNA聚合酶III(Pol III)辨識之啟動子序列可操作地聯結。適合的Pol III啟動子之範例包括但不限於哺乳動物U6、U3、H1及7SL RNA啟動子及稻穀U6及U3啟動子。
如所指示的,包含編碼該RGN、crRNA、tracrRNA、及/或sgRNA的核苷酸序列的表現構築體可用於轉化所關注之生物體。用於轉化之方法涉及將核苷酸構築體引入所關注之生物體內。藉由「引入」旨在將該核苷酸構築體引至該宿主細胞,藉此使得該構築體進入該宿主細胞內部。本發明之方法不需要一種將核苷酸構築體引至宿主生物體,但是該核苷酸構築體進入宿主生物體之至少一個細胞內部之特定方法。該宿主細胞可為真核細胞或原核細胞。於特定實施方式中,真核宿主細胞為植物細胞、哺乳動物細胞、或昆蟲細胞。用於將核苷酸構築體引入植物及其他宿主細胞內之方法為本領域中已知,其包括但不限於:穩定轉化方法、瞬時轉化方法及病毒介導方法。
此等方法得到轉化的生物體,諸如植物,包括:整株植物以及植物器官(例如,葉、莖、根等)、種子、植物細胞、繁殖體、胚胎及其後代。植物細胞可被分化,亦可不被分化(例如,癒合組織、懸浮培養細胞、原生質體、葉細胞、根細胞、韌皮部細胞、花粉)。
「基因轉殖生物體」或「轉化生物體」或「穩定轉化的」生物體或細胞或組織係指已併入或整合了編碼本發明之RGN、crRNA、及/或tracrRNA的多核苷酸的生物體。應當認識到,其他外源或內源核酸序列或DNA片段亦可被併入該宿主細胞內。農桿菌 及基因槍介導的轉化仍然為用於植物細胞轉化而主要採用的二種方法。然而,宿主細胞之轉化可藉由感染、轉染、顯微注射、電穿孔、顯微投影(microprojection)、基因槍或粒子轟擊、電穿孔、二氧化矽/碳纖維、超音波介導的、PEG介導的、磷酸鈣共沉澱、聚陽離子DMSO技術、DEAE葡聚醣(dextran)程序、及病毒介導的、脂質體介導的等等實行。編碼RGN、crRNA、及/或tracrRNA的多核苷酸的病毒介導的引入包括反轉錄病毒、慢病毒、腺病毒、及腺關聯病毒介導的引入及表現,以及花椰菜嵌紋病毒、雙生病毒、及RNA植物病毒的使用。
轉化操作流程以及用於將多肽或多核苷酸序列引入植物內的操作流程可隨針對轉化所靶向的宿主細胞的類型(例如,單子葉植物或雙子葉植物細胞)而不同。用於轉化的方法為本領域中已知,且包括第8,575,425號、第7,692,068號、第8,802,934號、第7,541,517號美國專利中闡述的那些方法,此等專利中之每一者都藉由引用併入本文。亦參見Rakoczy-Trojanowska, M.(2002)Cell Mol Biol Lett. 7:849-858;Jones等人(2005)Plant Methods 1:5;Rivera等人(2012)Physics of Life Reviews 9:308-345;Bartlett等人(2008)Plant Methods 4:1-12;Bates, G.W.(1999)Methods in Molecular Biology 111:359-366;Binns及Thomashow(1988),Microbiology 42:575-606中之Annual Reviews ;Christou, P.(1992)The Plant Journal 2:275-281;Christou, P.(1995)Euphytica 85:13-27;Tzfira等人(2004)TRENDS in Genetics 20:375-383;Yao等人(2006)Journal of Experimental Botany 57:3737-3746;Zupan和Zambryski(1995)Plant Physiology 107:1041-1047;Jones等人(2005)Plant Methods 1:5。
轉化可導致核酸穩定或瞬時併入細胞內。「穩定轉化」旨在表達引入宿主細胞內的核苷酸構築體整合至該宿主細胞之基因組內,且能夠被其後代遺傳。「瞬時轉化」旨在表達多核苷酸被引入該宿主細胞內而不整合至該宿主細胞之基因組內。
用於葉綠體轉化之方法為本領域中已知。參見,舉例而言,Svab等人(1990)Proc. Nail. Acad. Sci. USA 87:8526-8530;Svab及Maliga (1993)Proc. Natl. Acad. Sci. USA 90:913-917;Svab及Maliga(1993)EMBO J. 12:601-606。該方法取決於含有選擇性標記的DNA的粒子槍遞送及透過同源重組將該DNA靶向至該質體基因組。另外,質體轉化可藉由核編碼的及質體導向的RNA聚合酶的組織較佳表現來轉錄活化(transactivation)緘默質體攜帶的轉殖基因來完成。McBride等人(1994)在Proc. Natl. Acad. Sci. USA 91:7301-7305已報導了此系統。
已經被轉化的細胞可按照傳統方式生長成基因轉殖生物體,諸如,植物。參見,舉例而言,McCormick等人(1986)Plant Cell Reports 5:81-84。然後,可以使此等植物生長,且用相同轉化品系(transformed strain)或不同品系授粉,且辨別出具有期望表型(phenotypic)特徵的構成型表現的所得雜合體。可生長二代或更多代,以確保穩定維持並遺傳期望表型特徵的表現,然後,收穫種子,以確保已經達成期望表型特徵的表現。以此方式,本發明提供具有穩定地併入其基因組內的本發明之核苷酸構築體(舉例而言,本發明之表現卡匣)的轉化種子(亦稱為「基因轉殖種子」)。
作為另一種選擇,可將已被轉化之細胞引入生物體內。此等細胞可源自該生物體,其中該細胞以離體措施被轉化。
本文提供之序列可用於轉化任何植物物種,包括但不限於單子葉植物及雙子葉植物。所關注之植物之範例包括但不限於:玉蜀黍(玉米)、高粱、小麥、向日葵、番茄、十字花科植物、胡椒、馬鈴薯、棉花、稻穀、大豆、甜菜、甘蔗、煙草、大麥、及油菜、芸苔屬物種(Brassica sp.)、苜蓿、黑麥、小米、紅花、花生、甘藷、木薯、咖啡、椰子、鳳梨、柑橘樹、可可、茶、香蕉、鱷梨、無花果、番石榴、芒果、橄欖、木瓜、腰果、澳洲胡桃、杏仁、燕麥、蔬菜、觀賞植物以及針葉樹。
蔬菜包括但不限於:番茄、萵苣、綠豆、皇帝豆、豌豆、及諸如胡瓜(cucumber)、網紋甜瓜(cantaloupe)及洋香瓜(musk melon)之黃瓜(Curcumis)屬的成員。觀賞植物包括但不限於:杜鵑花、繡球花、芙蓉、玫瑰、鬱金香、水仙、矮牽牛、康乃馨、猩猩木、及菊花。較佳地,本發明之植物為農作物(舉例而言,玉米、高粱、小麥、向日葵、番茄、十字花科植物、胡椒、馬鈴薯、棉花、稻穀、大豆、甜菜、甘蔗、煙草、大麥、油菜等)。
如本文所使用的,術語「植物」包括:植物細胞、植物原生質體、植物可再生所自的植物細胞組織培養物、植物癒傷組織、植物塊、及在植物或植物的諸如胚胎、花粉、胚珠、種子、葉子、花、枝、果實、仁、穗、玉米穗軸、殼、莖、根、根尖、花藥等等的局部中是完整的植物細胞。穀物旨在表達出於種植或繁殖該物種之外的目的而由商業種植者生產的成熟種子。再生植物的子代、變體及突變體亦包括於本發明之範圍內,前提條件是此等局部包含所引入的多核苷酸。進一步提供了保持了本文中揭露之序列的經處理的植物產品或副產物,舉例而言,包括豆粕。
編碼該RGN、crRNA、及/或tracrRNA的多核苷酸亦可用於轉化任何原核物種,包括但不限於:古生菌和細菌(例如,芽孢桿菌屬Bacillus sp. )、克雷伯氏菌屬Klebsiella sp. )、鏈黴菌屬Streptomyces sp. )、根瘤菌屬Rhizobium sp. )、埃希氏菌屬Escherichia sp. )、假單胞菌屬Pseudomonas sp. )、沙門氏菌屬Salmonella sp. )、志賀氏桿菌屬Shigella sp. )、弧菌屬Vibrio sp. )、耶爾森菌屬Yersinia sp. )、支原體菌屬Mycoplasma sp. )、農桿菌屬Agrobacterium )、乳酸乳桿菌屬Lactobacillus sp. )。
編碼該RGN、crRNA、及/或tracrRNA的多核苷酸可用於轉化任何真核物種,包括但不限於:動物(例如,哺乳動物、昆蟲、魚類、鳥類、及爬蟲類物)、真菌、變形蟲、藻類、及酵母。
傳統的基於病毒和非病毒的基因轉移方法可用於將核酸引入哺乳動物細胞或標的組織中。此種方法可用於將編碼CRISPR系統組成的核酸投予培養中之細胞、或宿主生物體中之細胞。非病毒載體遞送系統包括:DNA質體、RNA(例如,本文描述的載體之轉錄本)、裸核酸、及與諸如一脂質體之一遞送載劑複合的核酸。病毒載體遞送系統包括DNA及RNA病毒,其在遞送至細胞後具有附加型或整合的基因組。有關基因治療程序之綜述,參見Anderson,Science 256:808- 813 (1992);Nabel & Feigner,TIBTECH 11:211-217 (1993);Mitani & Caskey,TIBTECH 11:162-166 (1993);Dillon,TIBTECH 11:167-175 (1993);Miller,Nature 357:455-460 (1992);Van Brunt,Biotechnology 6(10):1149-1154 (1988);Vigne,Restorative Neurology and Neuroscience 8:35-36 (1995);Kremer & Perricaudet,British Medical Bulletin 51(1):31-44 (1995);Haddada等人,in Current Topics in Microbiology and Immunology, Doerfler及Bohm(編者)(1995);及Yu等人,Gene Therapy 1:13-26 (1994)。
核酸的非病毒遞送方法包括脂質體轉染、核轉染、顯微注射、基因槍(biolistics)、病毒體、脂質體、免疫脂質體、聚陽離子或脂質:核酸共軛物、裸DNA、人工病毒粒子、及DNA的藥劑增強攝取。例如,第5,049,386號、第4,946,787號、及第4,897,355號美國專利中描述了脂質體轉染,且脂質體轉染試劑是市售的(例如,Transfectam ™及Lipofectin™)。適合用於多核苷酸之有效受體辨識脂質體轉染(receptor-recognition lipofection)之陽離子及中性脂質包括Feigner的WO 91/17424;WO 91/16024中的那些陽離子和中性脂質。遞送可為至細胞(例如,在體外或離體地投予)或標的組織(例如,活體內投予)。包括靶向的脂質體諸如免疫脂質複合物的脂質:核酸複合物的製備為本領域中具有通常知識者所熟知(參見,例如,Crystal,Science 270:404-410(1995);Blaese等人,Cancer Gene Ther. 2:291- 297(1995);Behr等人,Bioconjugate Chem. 5:382-389(1994);Remy等人,Bioconjugate Chem. 5:647-654(1994);Gao等人,Gene Therapy 2:710-722(1995);Ahmad等人,Cancer Res. 52:4817-4820(1992);第4,186,183號、第4,217,344號、第4,235,871號、第4,261,975號、第4,485,054號、第4,501,728號、第4,774,085號、第4,837,028號、及第4,946,787號美國專利)。
使用基於RNA或DNA病毒的系統來遞送核酸利用高度進化的過程將病毒靶向至體內的專一性細胞且將該病毒載荷運輸至該細胞核。病毒載體可被直接投予患者(活體內),或者該病毒載體可用於體外處置細胞,並且可視情況將經修飾的細胞投予患者(離體)。傳統的基於病毒的系統可包括用於基因轉移之反轉錄病毒、慢病毒、腺病毒、腺關聯及單純皰疹病毒載體。用反轉錄病毒、慢病毒、及腺關聯病毒基因轉移方法,在宿主基因組中之整合是可能的,常常導致所插入的轉殖基因的長期表現。另外,在許多不同細胞類型及標的組織中已經觀察到高轉導功效。
反轉錄病毒的向性(tropism)可藉由併入外來套膜蛋白而被改變,從而擴展標的細胞的潛在標的族群。慢病毒載體為能夠轉導或感染非分裂細胞(non-dividing cell)並且通常情況下產生高病毒力價的反轉錄病毒載體。因此,反轉錄病毒基因轉移系統的選擇將依賴於該標的組織。反轉錄病毒載體由順式作用長端重複子構成,該順式作用長端重複子具達到6-10 kb外源序列的包裝能力。最小順式作用LTR足夠用於載體的複製及包裝,然後,使用其將治療基因整合至該標的細胞內,以提供永久轉殖基因表現。廣泛使用的反轉錄病毒載體包括:基於鼠白血病病毒(MuLV)、長臂猿白血病病毒(GaLV)、猿猴免疫缺陷病毒(SIV)、人免疫缺陷病毒(HIV)、及其組合的載體(參見,例如,Buchscher等人,J. Viral. 66:2731-2739(1992);Johann等人,J. Viral. 66:1635-1640(1992);Sommnerfelt等人,Viral. 176:58-59(1990);Wilson等人,J. Viral. 63:2374-2378(1989);Miller 等人,1 . Viral. 65:2220-2224(1991);PCT/US94/05700)。
在瞬時表現較佳的應用中,可以使用基於腺病毒的系統。基於腺病毒的載體在許多細胞類型中能夠有非常高的轉導效率,並且不需要細胞分裂(cell division)。具這樣的載體,已經獲得了高力價及高表現水準。此載體可在相對簡單的系統中大量產生。腺關聯病毒(“AAV”)載體亦可例如在核酸及胜肽的體外產生中用於轉導具標的核酸之細胞,且用於活體內及離體基因治療程序(參見,例如,West 等人,Virology 160:38-47(1987); 第4,797,368號美國專利;WO 93/24641;Katin,Human Gene Therapy 5:793-801(1994);Muzyczka,1 . Clin. Invest. 94:1351(1994))。重組AAV載體的構築描述於很多出版物中,包括第5,173,414號美國專利;Tratschin等人,Mol. Cell. Biol. 5:3251-3260(1985);Tratschin等人,Mol. Cell. Biol. 4:2072-2081(1984);Hermonat & Muzyczka,PNAS 81:6466-6470(1984);及Samulski等人,1 . Viral. 63:03822-3828(1989)。包裝細胞通常情況下用於形成能夠感染宿主細胞之病毒顆粒。此種細胞包括包裝腺病毒之293細胞和包裝反轉錄病毒之ψJ2細胞或PA317細胞。
基因治療中使用的病毒載體通常藉由產生將核酸載體包裝於病毒顆粒內的細胞系(cell line)而被產生。該載體通常情況下含有用於包裝且隨後整合至宿主內所需的最小病毒序列,其他病毒序列藉由用於要表現的(各)多核苷酸的表現卡匣置換。遺失的病毒功能通常情況下藉由該包裝細胞系以反式提供。舉例而言,基因治療中使用的AAV載體通常情況下僅擁有來自包裝及整合至該宿主基因組內所需的AAV基因組的ITR序列。病毒DNA被包裝於細胞系中,該細胞系含有編碼其他AAV基因的輔佐質體(helper plasmid),即,rep和cap,但缺少ITR序列。
亦可用腺病毒作為輔佐體(helper)來感染該細胞系。該輔佐病毒促進AAV載體的複製及來自該輔佐質體之AAV基因的表現。因於缺少ITR序列,未以顯著量包裝該輔佐質體。腺病毒的污染可藉由例如熱處置(heat treatment)來降低,腺病毒對該熱處置比對AAV更敏感。將核酸遞送至細胞的額外方法為本領域中具有通常知識者已知。參見,舉例而言,US20030087817,其藉由引用併入本文。
於一些實施方式中,用本文描述的一或更多載體暫時地或非暫時地轉染宿主細胞。於一些實施方式中,細胞在其天然存在於個體中時被轉染。於一些實施方式中,被轉染的細胞取自個體。於一些實施方式中,細胞取得自取自個體的細胞,諸如細胞系。用於組織培養之多種細胞系為本領域中已知。細胞系之範例包括但不限於:C8161、CCRF-CEM、MOLT、mIMCD-3、NHDF、HeLaS3、Huhl、Huh4、Huh7、HUVEC、HASMC、HEKn、HEKa、MiaPaCell、Panel、PC-3、TFl、CTLL-2、CIR、Rat6、CVI、RPTE、AlO、T24、182、A375、ARH-77、Calul、SW480、SW620、SKOV3、SK-UT、CaCo2、P388Dl、SEM-K2、WEHI-231、HB56、TIB55、lurkat、145.01 、 LRMB、Bcl-1、BC-3、IC21、DLD2、Raw264.7、NRK、NRK-52E、MRC5、MEF、Hep G2、HeLa B、HeLa T4. COS、COS-1、COS-6、COS-M6A、BS-C-1猴腎上皮細胞、BALB/3T3小鼠胚胎纖維母細胞、3T3 Swiss、3T3-Ll、132-d5人胎兒纖維母細胞;10.1小鼠纖維母細胞、293-T、3T3、721、9L、A2780、A2780ADR、A2780cis、A172、A20、A253、A431、A-549、ALC、B16、B35、BCP-I 細胞、BEAS-2B、bEnd.3、BHK-21、BR 293、BxPC3、C3H-10Tl/2、C6/36、Cal-27、CHO、CHO-7、CHO-IR、CHO-Kl、CHO-K2、CHO-T、CHO Dhfr-/-、COR-L23、COR-L23/CPR、COR-L235010、CORL23/ R23、COS-7、COV-434、CML Tl、CMT、CT26、D17、DH82、DU145、DuCaP、EL4、EM2、EM3、EMT6/AR1、EMT6/AR10.0、FM3、H1299、H69、HB54、HB55、HCA2、HEK-293、HeLa、Hepalclc7、HL-60、HMEC、HT-29、lurkat、lY 細胞、K562細胞、Ku812、KCL22、KGl、KYOl、LNCap、Ma-Mel 1-48、MC-38、MCF-7、MCF-l0A、MDA-MB-231、MDA-MB-468、MDA-MB-435、MDCKII、MDCKII、MOR/0.2R、MONO-MAC 6、MTD-lA、MyEnd、NCI-H69/CPR、NCI-H69/LX10、NCI-H69/LX20、NCI-H69/LX4、NIH-3T3、NALM-1、NW-145、OPCN/OPCT細胞系、Peer、PNT-lA/PNT2、RenCa、RIN-5F、RMA/RMAS、Saos-2細胞、Sf-9、SkBr3、T2、T-47D、T84、THPl細胞系、U373、U87、U937、VCaP、Vero細胞、WM39、WT-49、X63、YAC-1、YAR、及其基因轉殖品種。細胞系可從本領域中具有通常知識者已知的多種來源獲得(參見,例如,美國典型菌種保存中心(American Type Culture Collection)(ATCC)(馬納沙斯,VA.))。
於一些實施方式中,使用用本文描述的一或更多載體轉染的細胞建立包含一或更多載體取得序列(vector-derived sequence)之新細胞系。於一些實施方式中,使用用如本文描述的CRISPR系統的組成暫時轉染之(諸如,藉由一或更多載體的暫時轉染,或用RNA轉染)並透過CRISPR複合物的活性修飾之細胞建立包含含有該修飾但缺少任何其他外源序列之細胞之新細胞系。於一些實施方式中,使用用本文描述的一或更多載體暫時或非暫時轉染的細胞或自此種細胞取得的細胞系來評估一或更多測試化合物。
於一些實施方式中,使用本文描述的一或更多載體來產生非人的基因轉殖動物或基因轉殖植物。於一些實施方式中,基因轉殖動物為哺乳動物,諸如,小鼠、大鼠或兔子。V. 多肽及多核苷酸的變體及片段
本揭露內容提供:天然存在的(即,野生型)RNA導引之核酸酶的活性變體及片段,其胺基酸序列如SEQ ID NO:1至109所示;以及天然存在的CRISPR重複子的活性變體和片段,諸如,SEQ ID NO:110至119、139、141、143、146、及201至309所示之序列;及天然存在的tracrRNA的活性變體和片段,諸如,SEQ ID NO:120至128、140、142、145、147、及148所列之序列;及編碼同者的多核苷酸。亦提供諸如SEQ ID NO:178-192所示之序列的天然存在之RGN輔助蛋白之活性變體及片段。
儘管與所關注之多核苷酸或多肽相較下可以改變變體或片段之活性,但該變體和片段應保持所關注之多核苷酸或多肽的功能。舉例而言,當與所關注之多核苷酸或多肽相較時,變體或片段可具有增加的活性、降低的活性、不同的活性譜或活性的任何其他改變。
諸如本文所揭露之天然存在的RGN多肽之片段及變體將保持序列專一性的RNA導引之DNA結合活性。於特定實施方式中,諸如本文所揭露之天然存在的RGN多肽的片段及變體將保持核酸酶活性(單股或雙股)。
當導引RNA(包含tracrRNA)的局部以序列專一性方式結合至RNA導引之核酸酶(與導引RNA複合的)且將RNA導引之核酸酶(與導引RNA複合的)導引至標的核苷酸序列時,諸如本文所揭露之天然存在的CRISPR重複子之片段及變體將保持該能力。
諸如本文所揭露之天然存在的tracrRNA之片段及變體當作為導引RNA(包含CRISPR RNA)的局部時將保持以序列專一性方式將RNA導引之核酸酶(與該導引RNA複合的)導引至標的核苷酸序列之能力。
諸如本文所揭露之天然存在的RGN輔助蛋白之片段及變體(當RNA系統(亦即,RGN蛋白及導引RNA)的局部時)將保持允許該RGN系統以序列專一性方式與標的核苷酸序列結合之能力。
術語「片段」係指本發明之多核苷酸或多肽序列之部位。「片段」或「生物活性部位」包括多核苷酸,該多核苷酸包含足夠數量的連續核苷酸,以保持該生物活性(亦即,當包含於導引RNA內時,結合RNA至並以序列專一性方式將RGN導向至標的核苷酸序列)。「片段」或「生物活性部位」包括多肽,該多肽包含足夠數量的連續胺基酸殘基,以保持該生物活性(亦即,當與導引RNA複合時,以序列專一性方式與標的核苷酸序列結合)。該RGN蛋白之片段包括因於替代的下游初始位點的使用而比全長序列短的那些。RGN蛋白之生物活性部位可為包含舉例而言SEQ ID NO:1至109之10、25、50、100、150、200、250、300、350、400、450、500、550、600或更多個連續胺基酸殘基之多肽。此等生物活性部位可藉由重組技術而被製備且針對序列專一性的RNA導引之DNA結合活性而被評估。CRISPR重複序列的生物活性片段可包含SEQ ID NO:110至119、139、141、143、146、及201至309中任一者之至少8個連續胺基酸。CRISPR重複序列的生物活性部位可為包含舉例而言SEQ ID NO:110至119、139、141、143、146、及201至309中任一者之8、9、10、11、12、13、14、15、16、17、18、19或20個連續核苷酸的多核苷酸。tracrRNA的生物活性部位可為包含舉例而言SEQ ID NO:120至128、140、142、145、147、及148中任一者之8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、35、40、45、50、55、60、65、70、75、80或更多個連續核苷酸的多核苷酸。該RGN輔助蛋白之片段包括因於替代的下游初始位點的使用而比該全長序列短的那些。RGN輔助蛋白之生物活性部位可為包含舉例而言SEQ ID NO:178至192之10、25、50、100、150、200或更多個連續胺基酸殘基之多肽。此等生物活性部位可藉由重組技術而被製備且針對生物活性而被評估。
一般來說,「變體」旨在表達實質上相似的序列。對於多核苷酸,變體包含於天然多核苷酸內的一或更多內部位點處的一或更多核苷酸的刪除及/或添加及/或於天然多核苷酸中一或更多位點處的一或更多核苷酸的置換。如本文所使用的,「天然」或「野生型」多核苷酸或多肽分別包含天然存在的核苷酸序列或胺基酸序列。對於多核苷酸,保守(conservative)變體包括因為該基因密碼之簡併性(degeneracy)而編碼所關注基因之天然胺基酸序列的那些序列。與舉例而言用下面概述之聚合酶連鎖反應(PCR)及雜合技術一樣,可用眾所周知的分子生物學技術辨別諸如此等之天然存在的對偶變體。變體多核苷酸亦包括合成取得的多核苷酸,諸如藉由使用定點誘變產生的但其仍然編碼所關注之多肽或多核苷酸之那些。一般而言,本文所揭露之特定多核苷酸之變體與如藉由本文別處描述之序列對準程式及參數所確定之那個特定多核苷酸具有至少約40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高序列一致性。
本文所揭露之特定多核苷酸之變體(亦即,該參考多核苷酸)亦可藉由比較藉由變體多核苷酸所編碼之多肽與藉由該參考多核苷酸所編碼之多肽之間之序列一致性百分比來評估。可使用本文別處描述之序列對準程式及參數來計算任何二個多肽之間之序列一致性百分比。當藉由二個多肽共有的序列一致性百分比之比較來評估本文所揭露之任何給定的多核苷酸對時(其編碼該二個多肽),該二個經編碼之多肽之間之序列一致性百分比為至少約40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高之一致性。
於特定實施方式中,本發明揭露之多核苷酸編碼RNA導引之核酸酶多肽,該RNA導引之核酸酶多肽包含的胺基酸序列與SEQ ID NO:1至109中任一者之胺基酸序列具有至少40%、45%、50%、55%、60%、65%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高之一致性。
本發明之RGN多肽之生物活性變體可相差少至約1-15個胺基酸殘基、少至約1-10個(諸如,約6-10個)、少至5個、少至4個、少至3個、少至2個、或少至1個胺基酸殘基。於具體實施方式中,多肽可包含N端或C端截短,該截短可至少包含從該多肽之N端或C端刪除10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、150、200、250、300、350、400、450、500、550、600個或更多個胺基酸。
於某些實施方式中,本發明揭露之多核苷酸編碼RNA導引之核酸酶輔助多肽,該RNA導引之核酸酶輔助多肽包含與SEQ ID NO:178至192中任一者之胺基酸序列具有至少40%、45%、50%、55%、60%、65%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高之一致性之核苷酸序列。
本發明之RGN輔助多肽之生物活性變體可相差少至約1-15個胺基酸殘基、少至約1-10個(諸如,約6-10個)、少至5個、少至4個、少至3個、少至2個、或少至1個胺基酸殘基。於具體實施方式中,多肽可包含N端或C端截短(truncation),其可至少包含從該多肽之N端或C端刪除10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、150、200個或更多個胺基酸。
在某些實施方式中,本發明揭露之多核苷酸包含或編碼CRISPR重複子,該CRISPR重複子包含與如SEQ ID NO:110至119、139、141、143、146、及201至309所示之核苷酸序列中任一者具有至少40%、45%、50%、55%、60%、65%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高之一致性之核苷酸序列。
本發明揭露之多核苷酸可包含或編碼tracrRNA,該tracrRNA包含與如SEQ ID NO:120至128、140、142、145、147、及148所示之核苷酸序列中任一者具有至少40%、45%、50%、55%、60%、65%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高之一致性之核苷酸序列。
本發明之CRISPR重複子或tracrRNA之生物活性變體可相差少至約1-15個核苷酸、少至約1-10個(諸如,約6-10個)、少至5個、少至4個、少至3個、少至2個、或少至1個核苷酸。於具體實施方式中,多核苷酸可包括一5'或3'截短,該截短可至少包含從該多核苷酸之5'或3'末側刪除10、15、20、25、30、35、40、45、50、55、60、65、70、75、80個或更多個核苷酸。
應當認識到,可對本文提供之RGN多肽、CRISPR重複子及tracrRNA進行修飾,從而創建變體蛋白質及多核苷酸。人類設計的變化可透過定點誘變技術的應用而被引入。作為另一種選擇,在結構上及/或功能上與本文所揭露之序列有關的天然的、尚不知的或尚不明的多核苷酸及/或多肽亦可被認為落入本發明之範圍內。可在不改變該RGN蛋白功能的非保守區域中進行保守胺基酸置換。作為另一種選擇,可進行改良該RGN之活性的修飾。
變體多核苷酸和蛋白質亦涵蓋自諸如DNA混排(DNA shuffling)的誘變及重組程序取得的序列及蛋白質。用這種程序,操縱本文所揭露之一或更多不同的RGN蛋白質(例如,SEQ ID NO:1至109),以創建擁有期望特性的新RGN蛋白質。以這種方式,重組多核苷酸庫是自包含序列區域的有關序列多核苷酸之族群產生的,該序列區域具有實質的序列一致性且可在體外或活體內同源重組。舉例而言,使用這種措施,編碼所關注域之序列模體可在本文提供之RGN序列與其他已知RGN基因之間混排,以獲得對具有所關注之改良特性(諸如在酵素的情況中,增加的Km )之蛋白質編碼的新基因。這種DNA混排之策略為本領域中所知。舉例而言,參見Stemmer(1994)Proc. Natl. Acad. Sci. USA 91:10747-10751;Stemmer(1994)Nature 370:389-391;Crameri 等人(1997)Nature Biotech. 15:436-438;Moore等人(1997)J. Mol. Biol. 272:336-347;Zhang等人 1997 Proc. Natl. Acad. Sci. USA 94:4504-4509;Crameri等人(1998)Nature 391:288-291;及第5,605,793號及第5,837,458號美國專利。「混排之」核酸為藉由混排程序(諸如本文闡述之任何混排程序)產生之核酸。混排之核酸為藉由舉例而言以人工方式及視情況而定的遞歸方式(實體或虛擬地)重組二個或更多個核酸(或字符串)產生的。一般而言,混排過程中使用一或更多篩選步驟來辨別所關注之核酸;此篩選步驟可在任何重組步驟之前或之後實行。在一些(但不是全部)混排實施方式中,期望在選擇之前實行多輪重組,以增加要篩選之池之多樣性。重組及選擇的整個過程可視情況遞歸地重複。依賴於背景,混排可係指重組及選擇之整個過程,或者,作為另一種選擇,可僅係指該整個過程之重組部位。
如本文在二個多核苷酸或多肽序列的背景中所使用的「序列一致性」或「一致性」涉及到當在指定的比較窗上對準最大對應性時為相同的二個序列中的殘基。當使用與蛋白質有關的序列一致性百分比時,應當認識到,不一致的殘基位置常常藉由保守胺基酸置換而不同,其中胺基酸殘基置換具有類似化學性質(例如,電荷或疏水性)之其他胺基酸殘基,且因此不變更分子的功能性質。當序列在保守置換方面不同時,可向上調整序列一致性百分比,以校正該置換之保守性質。藉由這種保守置換而不同之序列被稱為具有「序列相似性」或「相似性」。用於進行此調整之手段為本領域中具有通常知識者所熟知。通常情況下,此涉及將保守置換作為一部分失配而非完全失配進行評分,從而增加序列一致性百分比。由此,舉例而言,當對一致胺基酸給予1分,而對非保守置換給予零分時,對保守置換給予0與1之間之得分。例如,如在程式PC/GENE(Intelligenetics,Mountain View,California)中所實施的那樣,計算保守置換之得分。
如本文所使用的,「序列一致性百分比」表達藉由在比較窗上比較二個最佳對準序列所確定之值,其中該多核苷酸序列於該比較窗中的部位可包含相較於用於該二個序列之最佳對準之參考序列(不包含添加或刪除)的添加或刪除(亦即,缺口)。藉由確定在二個序列中出現一致的核酸鹼基或胺基酸殘基之位置的數目來求得匹配位置的數目;將匹配位置的數目除以比較窗中之位置總數;且將該結果乘以100,求得序列一致性百分比,來計算該百分比。
除非另有陳述,否則本文提供之序列一致性/相似性值係指使用GAP版本10使用以下參數獲得的值:使用GAP權重50及長度權重3的核苷酸序列的%一致性及%相似性,及nwsgapdna.cmp評分矩陣;使用GAP權重8及長度權重2的胺基酸序列的%一致性及%相似性,及BLOSUM62評分矩陣;或其任何等效程式。藉由「等效程式」係指:對於所涉及的任何二個序列,當與GAP版本10產生的對應對準相較時,產生具有一致的核苷酸或胺基酸殘基匹配及一致的序列一致性百分比的對準的任何序列比較程式。
當為了進行相似性評分而使用所界定之胺基酸置換矩陣(例如,BLOSUM62)、缺口存在罰分(gap existence penalty)及缺口延伸罰分(gap extension penalty)對準二個序列,以達到那個序列對可能的最高分數時,二個序列被「最佳對準」。胺基酸置換矩陣及其在量化該二個序列之間之相似性中的使用為在本領域中所熟知,並且被描述於例如Dayhoff等人(1978)「A model of evolutionary change in proteins(蛋白質中的進化變遷模型)」中;「Atlas of Protein Sequence and Structure(蛋白質序列及結構的圖譜)」,Vol. 5, Suppl. 3(ed. M. O. Dayhoff),pp. 345-352;Natl. Biomed. Res. Found.,Washington, D.C.;及Henikoff等人(1992)Proc. Natl. Acad. Sci. USA 89:10915-10919中。BLOSUM62矩陣常常用作序列對準操作流程中的預設評分置換矩陣。缺口存在罰分是針對單胺基酸缺口在其中一個對準序列中的引入而施加的,而缺口延伸罰分是針對被插入已經打開的缺口內的每一個額外空胺基酸位置而施加的。該對準藉由對準開始和結束處的每一個序列的胺基酸位置界定,並且可視情況藉由一個缺口或複數缺口在一個或二個序列中的插入來界定,以便達到最高可能分數。儘管可以手動完成最佳對準和評分,但是該過程可藉由使用電腦實施的對準演算法(例如Altschul等人(1997)Nucleic Acids Res . 25:3389-3402中描述的有缺口BLAST 2.0)而被促進,並且在國家生物技術資訊中心(National Center for Biotechnology Information)網站(在ncbi.nlm.nih.gov之全球資訊網)向大眾開放。可以使用例如可透過www.ncbi.nlm.nih.gov獲得的和Altschul等人在(1997)Nucleic Acids Res. 25:3389-3402中描述的PSI-BLAST來準備包括多重對準之最佳對準。
關於與參考序列最佳對準的胺基酸序列,胺基酸殘基「對應於」該參考序列中在該對準中與該殘基配對的位置。該「位置」由數字標示,該數字基於其相對於N-端的位置依序辨別該參考序列中之每一個胺基酸。歸因於在確定最佳對準時必須考慮的刪除、插入、截短、融合等,所以,一般來說,藉由簡單地從N端計數所確定之測試序列中之胺基酸殘基數目不一定與其在該參考序列中之對應位置之數目相同。舉例而言,在所對準之測試序列中存在刪除的情況中,將不存在與刪除位點處之參考序列中之位置對應的胺基酸。當在所對準之參考序列中存在插入時,該插入將不對應於該參考序列中之任何胺基酸位置。在截短或融合的情況中,該參考序列或所對準之序列中可存在不對應於相應序列中的任何胺基酸之胺基酸拉伸段(stretch)。VI. 抗體
亦涵蓋針對本發明之RGN多肽或包含本發明該RGN多肽之核糖核蛋白,包括具有SEQ ID NO:1之109所述之胺基酸序列中任一者或其活性變體或其片段的那些RGN多肽或核糖核蛋白,或本發明該RGN輔助蛋白,包括具有SEQ ID NO:178至192所示之胺基酸序列中任一者或其活性變體或片段之那些RGN輔助蛋白的抗體。產生抗體的方法為在本領域中所熟知(參見,舉例而言,Harlow及Lane(1988)Antibodies:A Laboratory Manual,冷泉港實驗室,冷泉港,紐約(Cold Spring Harbor Laboratory, Cold Spring Harbor, N.Y.);及第4,196,265號美國專利)。此等抗體可用於套組中,用於RGN多肽或核糖核蛋白之檢測及分離。由此,本揭露內容提供了包含專一性結合至本文描述的多肽或核糖核蛋白之抗體的套組,該多肽或核糖核蛋白包括舉例而言具有SEQ ID NO:1至109或178至192中任一者之序列的多肽。VII. 用於結合所關注之標的序列的系統和核糖核蛋白複合物及其製作方法
本揭露內容提供一種用於結合所關注之標的序列的系統,其中該系統包含至少一個導引RNA或編碼該至少一個導引RNA的核苷酸序列以及至少一個RNA所導引之核酸酶或編碼該至少一個RNA導引之核酸酶的核苷酸序列。該導引RNA與所關注之標的序列雜合,且亦與該RGN多肽形成複合物,從而將該RGN多肽導向至與該標的序列結合。於此等實施方式中之一些實施方式中,RGN包含SEQ ID NO:1至109中任一者之胺基酸序列或其活性變體或片段。於各種實施方式中,導引RNA包含一CRISPR重複序列,該CRISPR重複序列包含SEQ ID NO:110至119、139、141、143、146、及201至309中任一者之核苷酸序列或其活性變體或片段。於一些特定實施方式中,導引RNA包含tracrRNA,該tracrRNA包含SEQ ID NO:120至128、140、142、145、147、及148中任一者之核苷酸序列或其活性變體或片段。該系統之導引RNA可為單導引RNA或雙導引RNA。於一些特定實施方式中,系統包含與該導引RNA異源的RNA所導引之核酸酶,其中未發現該RGN與導引RNA在本質上彼此複合(亦即,彼此結合)。
於一些實施方式中,為結合至及/或剪切一標的多核苷酸,系統還包含至少一個RGN輔助蛋白。於此等實施方式中之一些實施方式中,系統還包含如SEQ ID NO:178-192所示之至少一RGN輔助蛋白或其活性變體或片段。於其中該RGN為APG06369(SEQ ID NO:11)或其變體或片段之ㄧ些特定實施方式中,系統可進一步包含如SEQ ID NO:178-181所示之至少一RGN輔助蛋白或其活性變體或片段。於其中該RGN為APG03847(SEQ ID NO:12)或其變體或片段之此等實施方式中之一些實施方式中,系統還可包含如SEQ ID NO:182-184所示之至少一RGN輔助蛋白或其活性變體或片段。於其中該RGN為APG05625(SEQ ID NO:13)或其變體或片段之某些實施方式中,系統可進一步包含如SEQ ID NO:185-187所示之至少一RGN輔助蛋白或其活性變體或片段。於其中該RGN為APG03524(SEQ ID NO:16)或其變體或片段之一些實施方式中,系統可進一步包含如SEQ ID NO:188-190所示之至少一RGN輔助蛋白或其活性變體或片段。於其中該RGN為APG03759(SEQ ID NO:14)或其變體或片段之特定實施方式中,系統可進一步包含如SEQ ID NO:191所示之RGN輔助蛋白或其活性變體或片段。於其中該RGN為APG05123 (SEQ ID NO:15)或其變體或片段之某些實施方式中,系統可進一步包含如SEQ ID NO:192所示之RGN輔助蛋白或其活性變體或片段。
本文提供之用於結合所關注之標的序列之系統可為一核糖核蛋白複合物,其是與至少蛋白質結合之RNA之至少一個分子。本文提供之核糖核蛋白複合物包含作為該RNA組成之至少一導引RNA及作為該蛋白質組成之RNA所導引之核酸酶。該等核糖核蛋白複合物可自天然表現一RGN多肽的細胞或生物體中純化,且已經被工程化,以表現對所關注之標的序列專一的特定導引RNA。作為另一種選擇,該核糖核蛋白複合物可自已用編碼RGN多肽及導引RNA的多核苷酸轉化且在允許該RGN多肽和導引RNA表現的條件下培養的細胞或生物體中純化。由此,提供用於製造RGN多肽或RGN核糖核蛋白複合物的方法。該等方法包含:在該RGN多肽(而於一些實施方式中,導引RNA)被表現之條件下,培養包含編碼RGN多肽之核苷酸序列之細胞,而且於一些實施方式中,培養包含編碼一導引RNA的核苷酸序列之細胞。然後,可自所培養之細胞之溶胞產物中純化該RGN多肽或RGN核糖核蛋白。
用於自生物樣本之溶胞產物中純化RGN多肽或RGN核糖核蛋白複合物的方法為在本領域中所習知(例如,尺寸排阻及/或親和性層析法、2D-PAGE、HPLC、逆相層析法、免疫沉澱法)。在一些特定方法中,該RGN多肽為重組產生的且包含一純化示跡物以幫助其純化,其包括但不限於:谷胱甘肽-S-轉移酶(GST)、幾丁質結合蛋白(CBP)、麥芽糖結合蛋白、硫氧還蛋白(TRX)、聚(NANP)、串連親和純化(TAP)示跡物、myc、AcV5、AU1、AU5、E、ECS、E2、FLAG、HA、nus、Softag 1、Softag 3、Strep、SBP、Glu- Glu、HSV、KT3、S、S1、T7、V5、VSV-G、6xHis、10xHis、生物素羧基載物蛋白(BCCP)及鈣調蛋白。一般而言,所標記的RGN多肽或RGN核糖核蛋白複合物是使用固定化金屬親和性層析法純化。應當理解,可單獨地或組合地使用本領域中已知的其他類似方法,包含其他形式的層析法或舉例而言免疫沉澱法。
「分離的」或「純化的」多肽或其生物活性部位基本上或實質上不含在其天然存在的環境中發現的、正常情況下與該多肽相伴或交互作用的組成。由此,分離的或純化的多肽當藉由重組技術被產生時基本上不含其他細胞物質或培養基,或當被化學合成時基本上不含化學前驅物或其他化學物質。基本上不含細胞物質的蛋白質包括具有少於約30%、20%、10%、5%、或1%(以乾重計)的污染蛋白質的蛋白質製劑。當重組產生本發明之蛋白質或其生物活性部位時,最佳培養基呈現少於約30%、20%、10%、5%、或1%(以乾重計)的化學前驅物或所關注之非蛋白質化學物質。
本文所提供之用於結合及/或剪切所關注之標的序列之特定方法涉及使用體外組裝的RGN核糖核蛋白複合物。RGN核糖核蛋白複合物的體外組裝可使用本領域中習知的方法,其中允許該RGN多肽與該導引RNA結合的條件下使RGN多肽與導引RNA接觸。如本文中所使用的,「接觸(contact、contacting)」、contacted)」係指在適合進行期望反應的條件下,將期望反應之組成放在一起。該RGN多肽可自生物樣本、細胞溶胞產物或培養基中純化,經由體外轉換產生,或被化學合成。該導引RNA可自生物樣本、細胞溶胞產物或培養基中純化,在體外被轉譯,或被化學合成。可使該RGN多肽及導引RNA在溶液(例如,緩衝食鹽水溶液)中產生接觸以允許該RGN核糖核蛋白複合物的體外組裝。VIII. 結合、剪切或修飾標的序列的方法
本揭露內容提供用於結合、剪切及/或修飾所關注之標的核苷酸序列之方法。該方法包括向該標的序列或包含該標的序列之細胞、胞器或胚胎,遞送包含至少一導引RNA或編碼該至少導引RNA之多核苷酸及至少一RGN多肽或編碼該至少RGN一多肽之多核苷酸的系統。於此等實施方式中之一些實施方式中,RGN包含SEQ ID NO:1到109之胺基酸序列中任一者或其活性變體或片段。於各種實施方式中,導引RNA包含CRISPR重複序列,該CRISPR重複序列包含SEQ ID NO:110至119、139、141、143、146、及201至309之核苷酸序列中任一者或其活性變體或片段。於特定實施方式中,導引RNA包含tracrRNA,該tracrRNA包含SEQ ID NO:120至128、140、142、145、147、及148之核苷酸序列中任一者或其活性變體或片段。該系統之導引RNA可為單導引RNA或雙導引RNA。該系統之RGN可為無核酸酶活性的RGN,具有切口酶活性,亦可為融合多肽。於一些實施方式中,融合多肽包含鹼基編輯多肽,舉例而言,胞苷脫胺酶或腺苷脫胺酶。於其他實施方式中,RGN融合蛋白包含反轉錄酶(reverse transcriptase)。於其他實施方式中,RGN融合蛋白包含多肽,該多肽募集功能性核酸修復複合物的成員,諸如,核苷酸切除修復(NER)或轉錄耦合-核苷酸切除修復(TC-NER)路徑的成員(Wei 等人,2015,PNAS USA 112(27):E3495-504;Troelstra等人,1992,Cell 71:939-953;Marnef等人,2017,J Mol Biol 429(9):1277-1288),如2020年1月27日提交申請之第62/966,203號美國臨時專利申請中所描述的,且該美國臨時專利申請的全部內容藉由引用併入本文。於一些實施方式中,RGN融合蛋白包括CSB(van den Boom等人,2004,J Cell Biol 166(1):27-36;van Gool等人,1997,EMBO J 16(19):5955-65;其範例如SEQ ID NO:138所示),CSB為該TC-NER(核苷酸切除修復)路徑之成員且在其他成員之募集中產生功用。於進一步實施方式中,RGN融合蛋白包含CSB之活性域,諸如,包含SEQ ID NO:138之胺基酸殘基356-394之CSB的酸性域(Teng等人,2018,Nat Commun 9(1):4115)。
於特定實施方式中,RGN及/或導引RNA對於該RGN及/或導引RNA(或編碼該RGN及導引RNA中之至少一者之(各)多核苷酸)被引入到的細胞、胞器或胚胎為異源的。
於一些實施方式中,該方法還需要遞送至少一個RGN輔助蛋白或編碼該至少一個RGN輔助蛋白之(各)多核苷酸,以便該RGN結合至及/或剪切標的多核苷酸。於此等實施方式中之一些實施方式中,方法進一步需要遞送如SEQ ID NO:178-192所示之至少一個RGN輔助蛋白或其活性變體或片段或編碼該至少一個RGN輔助蛋白或其活性變體或片段之(各)多核苷酸。於其中該RGN為APG06369(SEQ ID NO: 11)或其變體或片段之特定實施方式中,該方法還包含遞送如SEQ ID NO:178-181所示之至少一個RGN輔助蛋白或其活性變體或片段或編碼該至少一個RGN輔助蛋白或其活性變體或片段之(各)多核苷酸。於其中該RGN為APG03847(SEQ ID NO:12)或其變體或片段之此等實施方式中之一些實施方式中,該方法還包含遞送如SEQ ID NO:315-317所示之至少一個RGN輔助蛋白或其活性變體或片段或編碼該至少一個RGN輔助蛋白或其活性變體或片段之(各)多核苷酸。於其中該RGN為APG05625(SEQ ID NO:13)或其變體或片段之某些實施方式中,該方法進一步包含遞送如SEQ ID NO:185-187所示之至少一個RGN輔助蛋白或其活性變體或片段或編碼該至少一個RGN輔助蛋白或其活性變體或片段之(各)多核苷酸。於其中該RGN為APG03524(SEQ ID NO:16)或其變體或片段之一些實施方式中,該方法進一步包含遞送如SEQ ID NO:188-190所示之至少一個RGN輔助蛋白或其活性變體或片段或編碼該至少一個RGN輔助蛋白或其活性變體或片段之(各)多核苷酸。於其中該RGN為APG03759(SEQ ID NO:14)或其變體或片段之特定實施方式中,該方法還包含遞送如SEQ ID NO:191所示之RGN輔助蛋白或其活性變體或片段或編碼該RGN輔助蛋白或其活性變體或片段之(各)多核苷酸。於其中該RGN為APG05123(SEQ ID NO:15)或其變體或片段之某些實施方式中,該方法進一步包含遞送如SEQ ID NO:192所示之RGN輔助蛋白或其活性變體或片段或編碼該RGN輔助蛋白或其活性變體或片段之(各)多核苷酸。
在其中該方法包含遞送編碼導引RNA及/或RGN多肽的多核苷酸的那些實施方式中,細胞或胚胎可之後在該導引RNA及/或RGN多肽被表現的條件下培養。於各種實施方式中,該方法包含使標的序列與RGN核糖核蛋白複合物接觸。該RGN核糖核蛋白複合物可包含無核酸酶活性或具有切口酶活性之RGN。於一些實施方式中,核糖核蛋白複合物之RGN為包含鹼基編輯多肽的融合多肽。於某些實施方式中,該方法包含將RGN核糖核蛋白複合物引入包含標的序列之細胞、胞器或胚胎內。該RGN核糖核蛋白複合物可為已自生物樣本被純化、重組產生並隨後純化、或如本文所描述的體外組裝的複合物。於其中與該標的序列或細胞、胞器或胚胎接觸的RGN核糖核蛋白複合物已經在體外被組裝的那些實施方式中,該方法可進一步包含該複合物在與該標的序列、細胞、胞器或胚胎接觸之前的體外組裝。
可使用本領域中已知的、包括但不限於電穿孔的任何方法將純化的或體外組裝的RGN核糖核蛋白複合物引入細胞、胞器或胚胎內。作為另一種選擇,可使用本領域中已知的任何方法(例如,電穿孔)將編碼或包含該導引RNA的RGN多肽及/或多核苷酸引入細胞、胞器或胚胎內。
在遞送至該標的序列或包含該標的序列的細胞、胞器或胚胎,或與該標的序列或包含該標的序列的細胞、胞器或胚胎接觸時,該導引RNA將該RGN導向至以序列專一性方式與該標的序列結合。於其中該RGN具有核酸酶活性的那些實施方式中,RGN多肽在結合時剪切所關注之標的序列。該標的序列隨後可經由諸如非同源末側聯結或用所提供之供體多核苷酸的同源導向修復的內源修復機制而被修飾。
量測RGN多肽與標的序列之結合之方法為本領域中所知,且包括:染色質免疫沉澱測定法、凝膠遷移率移位測定法、DNA下拉測定法、報導子測定法(reporter assay)、微量盤捕獲及檢測測定法。同樣地,量測標的序列之剪切或修飾之方法為本領域中所知,且包括體外或活體內剪切測定法,其中在為了促進降解產物的檢測而將恰當示跡物(例如,放射性同位素、螢光物質)附接至該標的序列的情況下或在未為了促進降解產物的檢測而將恰當示跡物(例如,放射性同位素、螢光物質)附接至該標的序列的情況下,使用PCR、定序或凝膠電泳來確認剪切。作為另一種選擇,可使用切口觸發的指數擴增反應(nicking triggered exponential amplification reaction)(NTEXPAR)測定法(參見,例如,Zhang等人(2016)Chem. Sci. 7:4951-4957)。可使用Surveyor測定法來評估活體內剪切(Guschin等人(2010)Methods Mol Biol 649:247-256)。
於一些實施方式中,方法涉及使用與一個以上的導引RNA複合的單一類型RGN。該一個以上的導引RNA可靶向單基因的不同區域,亦可靶向複數基因。
在其中未提供供體多核苷酸的那些實施方式中,藉由RGN多肽引入的雙股斷裂可藉由非同源末側連結(NHEJ)修復過程修復。因於NHEJ的易錯性質,該雙股斷裂的修復可導致對該標的序列的修飾。如本文所使用的,關於核酸分子的「修飾」係指該核酸分子的核苷酸序列的變化,其可為一或更多核苷酸的刪除、插入或置換或彼等之組合。該標的序列的修飾可導致改變的蛋白質產物的表現或編碼序列的滅活。
在其中存在供體多核苷酸的那些實施方式中,供體多核苷酸中的供體序列可在所引入的雙股斷裂的修復歷程期間被整合至該標的核苷酸序列內或與該標的核苷酸序列交換,導致外源供體序列的引入。由此,供體多核苷酸包含期望被引入所關注之標的序列內的供體序列。於一些實施方式中,供體序列改變該原始標的核苷酸序列,使得該新整合的供體序列將不被該RGN辨識及剪切。該供體序列之整合可藉由在該供體多核苷酸內包括與該標的核苷酸序列側翼的序列具有基本序列一致性、本文中被稱為“同源臂(homology arm)”的側翼序列(flanking sequence)來增強,以允許同源導向的修復過程。於一些實施方式中,同源臂具有至少50個鹼基對、100個鹼基對及多達2000個鹼基對或更多個鹼基對之長度,且與其在該標的核苷酸序列內之對應序列具有至少90%、至少95%或更高序列同源性。
於其中該RGN多肽引入雙股交錯斷裂的那些實施方式中,供體多核苷酸可包含側翼為相容突出部的供體序列,以允許在該雙股斷裂的修復期間藉由非同源修復過程將供體序列直接聯接至包含突出部之經剪切的標的核苷酸序列。
於其中該方法涉及使用為切口酶(亦即,僅能夠剪切雙股多核苷酸中的單股)的RGN的那些實施方式中,該方法可包含引入靶向一致的或重疊的標的序列且剪切該多核苷酸之不同股的二個RGN切口酶。舉例而言,可將僅剪切雙股多核苷酸之正(+)股的RGN切口酶與僅剪切雙股多核苷酸之負(-)股的第二RGN切口酶一起引入。
於各種實施方式中,提供一種用於結合標的核苷酸序列且檢測該標的序列之方法,其中該方法包含將至少一個導引RNA或編碼該至少導引RNA之多核苷酸及至少RGN多肽或編碼該至少RGN多肽之多核苷酸引入一細胞、胞器或胚胎中;表現該導引RNA及/或RGN多肽(如果編碼序列被引入),其中該RGN多肽為無核酸酶活性之RGN且進一步包含可檢測示蹤物,並且該方法進一步包含檢測該可檢測示蹤物。該可檢測示蹤物可與該RGN融合為融合蛋白(例如,螢光蛋白),也可為與該RGN多肽綴合或被併入該RGN多肽內、可藉由視覺或藉由其他手段檢測的小分子。
本文亦提供用於在標的序列的調節下調控所關注之標的序列或基因之表現的方法。該方法包含:將至少一個導引RNA或編碼該至少一個導引RNA之多核苷酸及至少一個RGN多肽或編碼該至少RGN多肽之多核苷酸引入細胞、胞器或胚胎內;表現該導引RNA及/或RGN多肽(如果編碼序列被引入),其中該RGN多肽為無核酸酶活性之RGN。於此等實施方式中之一些實施方式中,無核酸酶活性之RGN為包含如本文所描述之表現調控域(亦即,表觀遺傳修飾域、轉錄活化域、或轉錄阻抑域)的融合蛋白。
本揭露內容還提供用於結合及/或修飾所關注之標的核苷酸序列的方法。該方法包括遞送一系統至該標的序列或包含該標的序列之細胞、胞器或胚胎,該系統包含至少一個導引RNA或編碼該至少一個導引RNA之多核苷酸及至少一融合多肽,該至少一融合多肽包含本發明之RGN及鹼基編輯多肽(舉例而言,胞苷脫胺酶或腺苷脫胺酶)或編碼該融合多肽的多核苷酸。
本領域中具有通常知識者將理解,本發明揭露之任一方法可用於靶向單標的序列或複數標的序列。由此,這些方法包含與複數相異的導引RNA組合地使用單RGN多肽,其可靶向單基因及/或複數基因內的複數相異序列。本文亦涵蓋其中與複數相異的RGN多肽組合地引入複數相異的導引RNA之方法。此等導引RNA及導引RNA/RGN多肽系統可靶向單基因及/或複數基因內的複數相異序列。
於一個態樣中,本發明提供含有上述方法及組成物中所揭露的任何一或更多元素的套組。於一些實施方式中,該套組包含載體系統及使用該套組的說明。於一些實施方式中,載體系統包含:(a)第一調節元素,該第一調節元素與編碼該crRNA序列的DNA系列及用於在導引序列的上游插入經編碼的crRNA序列的一或更多插入位點可操作地聯結,其中當表現時,該導引序列在真核細胞中將CRISPR複合物導向至與標的序列序列專一性結合,其中該CRISPR複合物包含與(a)導引RNA多核苷酸複合之CRISPR酵素;及/或(b)第二調節元素,該第二調節元素與酵素編碼序列可操作地連結,該酵素編碼序列編碼包含核定位序列之該CRISPR酵素。
於一些實施方式中,套組包含與用於插入載體之導引序列對應的一或更多寡核苷酸,以便可操作地聯結該導引序列與調節元素。於一些實施方式中,套組包含同源重組模板多核苷酸。於一個態樣中,本發明提供用於使用CRISPR系統之一或更多元素之方法。本發明之CRISPR複合物提供用於修飾標的多核苷酸的有效手段。本發明之CRISPR複合物具有種類繁多的功用,包括在多種細胞類型中修飾(例如,刪除、插入、易位、滅活、活化、鹼基編輯)標的多核苷酸。就其本身而言,本發明之CRISPR複合物在例如基因治療、藥物篩選、疾病診斷以及預後中具有廣泛的應用。示例性的CRISPR複合物包含與導引序列複合的CRISPR酵素,該導引序列與該標的多核苷酸內之標的序列雜合。IX. 標的多核苷酸
於一個態樣中,本發明提供修飾真核細胞中之標的多核苷酸的方法,其可為在活體內、離體地或在活體外。於一些實施方式中,該方法包含:自人或非人動物或植物(包括微藻類)取樣細胞或細胞族群;及修飾該細胞或該些細胞。培養可以在任何階段離體地發生。甚至可以將該細胞或該些細胞重新引入該非人動物或植物(包含微藻類)中。
使用自然變異性,植物育種者將關於諸如產量、品質、均勻性、耐寒性以及抗害蟲性的可期望品質的大多數有用基因組合起來。此等可期望品質亦包括生長、日長度偏好、溫度要求、花卉或生殖發育的起始日期、脂肪酸含量、抗蟲性、抗病性、線蟲抗性、真菌抗性、除草劑抗性、對各種環境因素(包括乾旱、熱、濕、冷、風及包括高鹽度的不利土壤條件)的耐受性。此等有用基因的來源包括天然或外來品種、原生種(heirloom variety)、野生植物近源種、及例如以誘變劑處置植物材料的誘導突變。使用本發明,向植物育種者提供誘導突變的新工具。據此,本領域中具有通常知識者可以為有用基因來源分析基因組,且在具有所期望特徵或性狀之品種中採用本發明以誘導有用基因的增加,同時比先前的誘變劑更精確,且依此加速並改良植物育種計劃。
RGN系統的標的多核苷酸可為對真核細胞是內源或外源的任何多核苷酸。舉例而言,該標的多核苷酸可為駐留於真核細胞的細胞核中之多核苷酸。該標的多核苷酸可為編碼基因產物(例如,蛋白質)之序列或一非編碼序列(例如,調節多核苷酸或垃圾DNA(junk DNA))。於一些實施方式中,該標的序列與PAM(原型間隔體相鄰模體)相關聯;亦即,該CRISPR複合物辨識的短序列。該PAM的詳細序列和長度要求隨所使用的CRISPR酵素而不同(而於一些實施方式中,RGN不需要PAM系列),但該PAM通常情況下是與該原型間隔體(亦即,該標的序列)相鄰的2-5個鹼基對序列。
CRISPR複合物之標的多核苷酸可包括很多疾病關聯基因及多核苷酸以及傳訊生化路徑關聯基因及多核苷酸。標的多核苷酸之範例包括與傳訊生化路徑相關聯之序列,例如,傳訊生化路徑關聯基因或多核苷酸。標的多核苷酸之範例包括疾病關聯基因或多核苷酸。「疾病關聯」基因或多核苷酸係指:與非疾病控制的組織或細胞相較下,在自一感染疾病之組織取得的細胞中以異常水準或以異常形式產出轉錄或轉譯產物之任何基因或多核苷酸。其可為一種變得以異常高水準表現的基因;其可為一種變得以異常低水準表現的基因,其中改變的表現與疾病的發生及/或進展相關。疾病關聯基因亦係指擁有(各)突變或基因變異的基因,該擁有(各)突變或基因變異的基因為直接造成疾病病因(例如,因果突變),或為與造成疾病病因(例如,因果突變)的(各)基因呈連鎖不平衡(linkage disequilibrium)。該轉錄或轉譯產物可為已知的或未知的,且可進一步處於正常或異常水準。疾病關聯基因及多核苷酸之範例可自在全球資訊網上找到的約翰•霍普金斯大學(馬里蘭州巴爾的摩)麥庫席克–內森斯遺傳醫學研究所(McKusick-Nathans Institute of Genetic Medicine)和美國國家醫學圖書館(馬里蘭州貝西達)(National Library of Medicine(Bethesda, Md.))的國家生物技術資訊中心(National Center for Biotechnology Information)找到。
雖然CRISPR系統在對於其相對容易靶向所關注之基因組序列方面格外有用,但仍然存在該RGN做什麼可解決因果突變的問題。一種措施為在RGN(較佳地,該RGN之無活性或切口酶變體)與鹼基編輯酵素或鹼基編輯酵素(諸如,胞苷脫胺酶或腺苷脫胺酶基編輯器)之活性域之間產生融合蛋白(第9,840,699號美國專利,該美國專利藉由引用併入本文)。於一些實施方式中,該些方法包含使DNA分子與:(a)包含本發明之RGN及諸如脫胺酶的鹼基編輯多肽的融合蛋白;及(b)將(a)之融合蛋白靶向至該DNA股的標的核苷酸序列的gRNA接觸;其中該DNA分子以有效量並且在適於核鹼基脫胺化之條件下與該融合蛋白及gRNA接觸。於一些實施方式中,該標的DNA序列包含與疾病或病症關聯的序列,並且其中該核鹼基之脫胺化導致與疾病或病症無關聯之序列。於一些實施方式中,該標的DNA序列駐留於農作物的對偶基因中,其中所關注之性狀的特定對偶基因(allele)導致具有較低農藝價值的植物。該核鹼基的脫胺化導致改良性狀並增加植物的農藝價值的對偶基因。
於一些實施方式中,該DNA序列包含與疾病或病症關聯之T→C或A→G點突變,並且其中突變體C或G鹼基之脫胺化導致與疾病或病症無關聯的序列。於一些實施方式中,該脫胺化校正與該疾病或病症關聯之序列中之點突變。
於一些實施方式中,與該疾病或病症關聯之序列編碼蛋白質,且其中該脫胺化將停止密碼子(stop codon)引入與該疾病或病症關聯之序列中,導致編碼蛋白質之截短。於一些實施方式中,該接觸在易患有、患有或診斷患有該疾病或病症的個體活體內實行。於一些實施方式中,疾病或病症為與該基因組中之點突變或單鹼基突變關聯的疾病。於一些實施方式中,該疾病為基因疾病、癌症、代謝疾病或溶酶體貯積病。X. 醫藥組合物及醫治方法
提供醫藥組合物,該醫藥組合物包含:本發明揭露之RGN多肽及其變體或片段以及編碼該RGN多肽及其變體或片段之多核苷酸、本發明揭露之gRNA或編碼該gRNA之多核苷酸、本發明揭露之系統、或包含該RGN多肽或RGN編碼多核苷酸、gRNA或gRNA編碼多核苷酸、或該RGN系統中任一者之細胞及醫藥學上可接受之載劑。
醫藥組合物為被運用於防止、降低程度、治癒或醫治標的病況或疾病之組合物,該組合物包含活性成分(亦即,RGN多肽、RGN編碼多核苷酸、gRNA、gRNA編碼多核苷酸、RGN系統、或包含此等中任一者之細胞)及醫藥學上可接受之載劑。
如本文中使用的,「醫藥學上可接受之載劑」係指不對生物體引起顯著刺激且不消除該活性成分(亦即,RGN多肽、RGN編碼多核苷酸、gRNA、gRNA編碼多核苷酸、RGN系統、或包含此等中任一者之細胞)之活性及特性之材料。載劑必須具有足夠高之純度及足夠低之毒性,以使彼等合適投予正被醫治之個體。該載劑可為惰性的,其亦可擁有醫藥效益。於一些實施方式中,醫藥學上可接受之載劑包含合適對人或其他脊椎動物投予之一或更多相容固體或液體填充劑、稀釋劑或封裝物質。於一些實施方式中,醫藥學上可接受之載劑不為天然發生的。於一些實施方式中,未發現該醫藥學上可接受之載劑在本質上與該活性成分在一起。
本發明揭露之方法中使用的藥學組合物可由提供轉移、遞送、耐受性等等之合適載劑、賦形劑、及其他藥劑調配。眾多恰當調配物為本領域中之通常知識者所知。參見,例如,Remington,The Science and Practice of Pharmacy (21st ed. 2005)。合適之調配物舉例而言包括:粉劑、糊劑、膏劑、膠凍、蠟、油類、脂質、含脂質(陽離子或陰離子)之囊泡(諸如,LIPOFECTIN囊泡)、脂質奈米粒子、DNA共軛物、無水吸收糊劑、水包油及油包水乳液、乳液卡波蠟(emulsions carbowax)(各種分子量之聚乙二醇)、半固體凝膠(semi-solid gels)、及含有卡波蠟之半固體混合物。經口或非口服使用的藥學組合物可被製備為適合供給某個劑量之活性成分之單位劑量的劑型。此等單位劑量之劑型舉例而言包括錠劑、丸劑、膠囊、注射劑(安瓿)、栓劑等。
在其中包括或以本發明揭露之RGN、gRNA、RGN系統或編碼該RGN、gRNA、RGN系統之多核苷酸之細胞被投予個體之一些實施方式中,該等細胞與藥學上可接受之載劑一起作為懸浮劑被投予。本領域中具有通常知識者將認識到將被使用於細胞組合物中之藥學上可接受之載劑將不包括實質上干擾將被遞送至該個體之細胞之存活率之量的緩衝液、化合物、冷凍保存藥劑、保存劑、或其他藥劑。包括細胞之調配物可包含例如允許細胞膜保持完整性之滲透壓緩衝液,且視情況地,在投予時保持細胞存活率或增強植入的營養劑。該等調配物及懸浮劑為本領域中具有通常知識者所知,且/或使用例行實驗可被調適成與本文揭露之細胞一起使用。
細胞組合物亦可被乳化為或呈現為核糖體組合物,前提條件為該乳化程序不會不利地影響細胞存活率。該細胞及其他活性成分可以與藥學上可接受且與該活性成分相容之賦形劑、且以適合在本文揭露之治療方法中使用的量混合。
包含於細胞組合物中之額外藥劑可包含其內之組成之藥學上可接受之鹽。藥學上可接受之鹽包含與諸如舉例而言鹽酸或磷酸之無機酸、或與諸如醋酸、酒石酸、苯乙醇酸等等之有機酸形成之酸加成鹽(與多肽之自由胺基基團形成)。與自由羧基基團形成之鹽亦可衍生自諸如舉例而言鈉、鉀、銨、鈣或鐵的氫氧化物之無機鹼、及諸如異丙胺、三甲胺、2-乙胺乙醇、組胺酸、普魯卡因等等之有機鹼。
生理學上可耐受且藥學上可接受之載劑為本領域中所知。示例性液體載劑為無菌水溶液,其除了活性成分及水外不含有其他材料,或其含有諸如在生理pH值、生理食鹽水或二者之磷酸鈉之緩衝液(諸如,磷酸鹽緩衝食鹽水)。又此外,水性載劑可含有一種以上之緩衝鹽以及諸如氯化鈉及氯化鉀、葡萄糖、聚乙二醇及其他溶質之鹽。液體組合物亦可含有除了水及排除水的液相。該等額外液相之示例為甘油、諸如棉花籽油之植物油、及水油乳液。在特定病症或病況之醫治中有效之細胞組合物中使用之活性化合物之量可依賴於該病症或病況之本質,且可藉由標準臨床技術決定。
本發明揭露之RGN多肽、導引RNA、RGN系統、或編碼該RGN多肽、導引RNA、RGN系統之多核苷酸可依賴於投予的特定方式及劑型以諸如載劑、溶劑、穩定劑、佐劑、稀釋劑等之藥學上可接受之賦形劑調配。於一些實施方式中,此等藥學組合物被調配以達成生理學上相容之pH,且依賴於調配物及投予途徑,其pH範圍為約3之pH至約11之pH、約pH3至約pH7。於一些實施方式中,可將該pH調整至約pH5.0至約pH8的範圍。於一些實施方式中,組合物可包括本文描述之治療有效量之至少一個化合物,連同一或更多藥學上可接受之賦形劑。於一些實施方式中,組合物包括本文描述之化合物之組合,或包含於醫治或防止細菌生長中有用之第二活性成分(舉例而言而不限於,抗菌或抗微生物藥劑),或包含本揭露內容之試劑之組合。
舉例而言,適合的賦形劑包含載劑分子,該載劑分子包含大型、緩慢代謝的巨分子,諸如,蛋白質、多醣、聚乳酸、聚乙醇酸、聚合的胺基酸、胺基酸共聚物、和非活性的病毒粒子。其他示例性賦形劑可包含:抗氧化劑(舉例而言而不限於,抗壞血酸)、螯合劑(舉例而言而不限於,EDTA)、碳水化合物(舉例而言而不限於,糊精、羥烷基纖維素、及羥烷基甲基纖維素)、硬脂酸、液體(舉例而言而不限於,油、水、食鹽水、甘油及乙醇)、潤濕或乳化劑、pH緩衝物質等等。
於一些實施方式中,調配物以單位劑量或多劑量容器(舉例而言,密封安瓿及小瓶(vial))被提供,且可被儲存於凍乾(冷凍乾燥)條件下,需要在立即使用之前,添加無菌液體載劑(舉例而言,食鹽水、注射用水、半液體泡沫或凝膠)。即時注射溶液及懸浮劑可自前面描述種類的無菌粉劑、顆粒及錠劑製備。於一些實施方式中,活性成分溶解於緩衝液體溶液中,其以單位劑量或多劑量容器被冷凍,且之後被解凍用於注射或被保持/穩定在冷凍下直到使用。
該(等)治療劑可含於控制的釋放系統中。為延長藥物的作用,常常期望自皮下、鞘內腔、或肌肉內注射減緩藥物的吸收。此舉可藉由使用具水難溶性之結晶或非結晶材料之液體懸浮劑來完成。然後,藥物的吸收速率依賴於其溶解速率,而其溶解速率又可依賴於結晶大小及結晶的方式。作為另一種選擇,非經口投予藥物之延遲吸收藉由該藥物溶解或懸浮於油載具中被完成。於一些實施方式中,長期持續釋放植入劑之使用特別適合用於慢性病況之醫治。長期持續釋放植入劑為本領域中之通常知識者所知。
本文提供為需要醫治之個體疾病之方法。該方法包括以有效量對需要其醫治之個體投予本發明揭露之RGN多肽或其活性變體或片段或編碼該RGN多肽或其活性變體或片段之多核苷酸、本發明揭露之gRNA或編碼該gRNA之多核苷酸、本發明揭露之RGN系統、或藉由此等組合物中任一者修飾的或包括此等組合物中任一者之細胞。
於一些實施方式中,醫治包括藉由投予本發明揭露之RGN多肽、gRNA、或RGN系統、或編碼該RGN多肽、gRNA、或RGN系統之(複數)多核苷酸之體內基因編輯。於一些實施方式中,醫治包括體外基因編輯,其細胞是以本發明揭露之RGN多肽、gRNA、或RGN系統、或編碼該RGN多肽、gRNA、或RGN系統之(複數)多核苷酸體外基因修飾,且然後將經修飾細胞投予至個體。於一些實施方式中,經基因修飾細胞源於之後被投予該修飾細胞之該個體,且所移植細胞在本文中被稱為自體的。於一些實施方式中,經基因修飾細胞源自與被投予該經修飾細胞之個體(亦即,接受者)屬相同物種之不同個體(亦即,供體),且該所移植細胞在本文中被稱為異體的。於本文描述之一些範例中,該細胞在對需要之個體投予之前可先於培養中被擴大。
於一些實施方式中,將要用本發明揭露之組合物醫治之疾病為可用免疫療法(諸如,用嵌合抗原受體(CAR)T細胞)醫治之疾病。該等疾病包含但不限於癌症。
於一些實施方式中,將要用本發明揭露之組合物醫治之疾病與被突變之序列(亦即,該序列為對於該疾病或病症之是因果的或為對於與該疾病或病症關聯之症狀是因果的)關聯,以便醫治該疾病或病症或與該疾病或病症關聯之症狀之降低。於一些實施方式中,將要用本發明揭露之組合物醫治之疾病與因果突變關聯。如本文中使用的,「因果突變」係指對個體中疾病或病症之嚴重程度或出現有貢獻之基因組中之特殊核苷酸、複數核苷酸或核苷酸序列。因果突變之校正引致由疾病或病症導致之至少一個症狀改良。於一些實施方式中,因果突變與本文揭露之RGN所辨識之PAM位點相鄰。該因果突變可用本發明揭露之RGN或包括本發明揭露之RGN及鹼編輯的多肽(亦即,鹼編輯器)之融合多肽來校正。與因果突變關聯之疾病之非限制性範例包含:囊腫纖維化、賀勒氏(Hurler)症候群、弗里德里希共濟失調(Friedreich’s Ataxia)、亨汀頓氏舞蹈症(Huntington’s Disease)、及鐮形細胞疾病。疾病關聯基因及突變之額外非限制性範例可從在全球資訊網上取得的約翰•霍普金斯大學(麻省巴爾的摩)麥庫席克–內森斯遺傳醫學研究所(McKusick-Nathans Institute of Genetic Medicine, Johns Hopkins University (Baltimore, Md.))和美國國家醫學圖書館(麻省貝西達)的國家生物技術資訊中心(National Center for Biotechnology Information, National Library of Medicine (Bethesda, Md.) )取得。
於一些實施方式中,本文提供之方法使用於將去活化點突變引入將與疾病或病症關聯之基因產物寫碼之基因或對偶基因內。舉例而言,於一些實施方式中,本文提供運用本發明揭露之組合物將去活化點突變引入致癌基因(例如,在增生性疾病的醫治中)內之方法。於一些實施方式中,去活化突變可在編碼序列中產生過早停止密碼子,此舉導致經截短基因產物(例如,缺少全長蛋白之功能之經截短蛋白)之表現。於一些實施方式中,本文提供之方法之目的為經由基因組編輯來恢復功能不良性基因之功能。本發明揭露之RGN多肽及包含該RGN多肽之系統可對例如藉由在人類細胞培養中校正疾病關聯突變之體外基於基因編輯的人類療法有效。
如本文中使用的,「醫治」或「處理」、或「緩和」或「改善」可被互換地使用。此等術語係指用於獲得有益或期望結果之措施,該有益結果或期望結果包括但不限於治療性益處及/或預防性益處。藉由治療性益處意味著對醫治中的一或更多疾病、病況或症狀之中的任何治療相關改良或對醫治中的一或更多疾病、病況或症狀之上的效益。對於預防性益處,該組合物可被投予處於特殊疾病、病況或症狀的發展風險中之個體,或被投予報告疾病的一或更多生理症狀之個體,即使該疾病、病症或症狀可能尚未呈現徵兆。
術語「有效量」或「治療有效量」係指足以實現有益或期望結果之藥劑量。治療有效量可取決於如下之一或更多者而變化:被醫治的個體及疾病病況、該個體的重量及年齡、疾病病況之嚴重性、投予方式等等,本領域中之通常知識者可任意地對此做出決定。特定劑量可取決於如下一或更多者而變化:所選之特殊藥劑、將要遵循的給藥方案、是否與其他化合物組合地投予、投予時機、及輸送其的遞送系統。
術語「投予」係指藉由導致所引入之活性成分至少部分地定位於期望位點(諸如,受傷或修復的位點)處之方法或途徑,將活性成分置於個體內,藉以使得產生(各)期望(複數)效應。於其中細胞被投予的那些實施方式中,可藉由導致遞送至個體中之期望位址的任何恰當途徑投予該細胞,其中至少一部分所移植細胞或該細胞之組成維持存活。投予個體後之細胞之存活期可短至幾小時(例如,二十四小時)、至幾天、至長至若干年、甚或患者的生命期,亦即,長期植入。舉例而言,於本文描述之一些態樣中,光受體細胞或視網膜前驅細胞之有效量是經由身體的投予途徑(諸如腹膜內或靜脈內途徑)投予。
於一些實施方式中,投予包括藉由病毒遞送之投予。於一些實施方式中,投予包括藉由電穿孔之投予。於一些實施方式中,投予包括藉由奈米粒子遞送之投予。於一些實施方式中,投予包括藉由核糖體遞送之投予。投予的任何有效途徑均可使用於投予本文描述之藥學組合物的有效量。於一些實施方式中,投予包括藉由選自以下者組成之群組之方法的投予:靜脈內地、皮下地、肌肉內地、口服地、經直腸地、藉由氣溶膠(、非經口地、經眼地、經肺地、經皮地、經陰道地、經耳地、經鼻地、及藉由外部投予、或其任意組合。於一些實施方式中,對於細胞之遞送,使用藉由注射或灌注的投予。
如本文中使用的,術語「個體」係指期望對其進行診斷、醫治或治療之任何單體)。於一些實施方式中,個體為動物。於一些實施方式中,個體為哺乳動物。於一些實施方式中,個體為人類。
醫治效能可由熟練的臨床醫師決定。然而,如果疾病或病症之症候或症狀的任何一個或全部是以有益方式被改變(例如,至少減少10%)、或其他臨床上接受之疾病的症狀或標記被改良或改善,則該醫治被認為「有效醫治」。亦可藉由單體未發生如藉由住院評估之惡化、或不需要醫學介入(例如,疾病的進展被停止或至少減慢)來測量效能。測量此等指標之方法為本領域中之通常知識者所知。醫治包括:(1)抑制疾病,例如,遏止或減慢症狀之進展;或(2)減緩疾病,例如,引起症狀消退;及(3)預防或降低症狀發展之可能性。A. 使用鹼編輯修飾因果突變
於一些實施方式中,本發明之RGN被使用於使用鹼編輯來修飾因果突變。可使用取決於本發明之RGN-鹼編輯器融合蛋白的措施而校正的基因遺傳性疾病之範例是Hurler症候群。Hurler症候群(亦稱為MPS-1)為α-L-艾杜糖醛酸酶(IDUA)缺乏而導致在分子層次上由溶體中硫酸乙醯肝素及硫酸皮膚素的累積表徵的溶體儲積症的結果。此疾病一般而言是由寫碼α-L-艾杜糖醛酸酶的IDUA中由基因突變引起的遺傳性基因病症。常見的IDUA突變是W402X和Q70X,兩者都是無意義突變導致轉譯的過早終止。藉由精確的基因組編輯(PGE)措施很好地解決了這種突變,由於單核苷酸的逆轉(舉例而言,藉由鹼編輯措施)將恢復野生型編碼序列並導致由基因座位的內生性源調節機制控制的蛋白質表現。另外,由於已知異型合子是無症狀的,所以靶向此等突變中之一個的PGE療法對於大部分患有此疾病的患者是有用的,因為突變的對偶基因中只有一者需被校正(Bunge等人(1994) Hum. Mol. Genet. 3(6):861-866,藉由引用併入本文)。
目前對Hurler症候群的目前醫治包括含酵素替代療法及骨髓移植(Vellodi等人((1997)) Arch. Dis. Child. 76(2):92-99;Peters等人((1998)) Blood 91(7):2601-2608,藉由引用併入本文)。儘管酵素替代療法對Hurler症候群患者的生存和生活品質已具有顯著效應,但這種手段需要昂貴且耗時的每週灌注。額外措施包含在表現載體上IDUA基因的遞送或將該基因插入高度表現的基因座內,諸如,血清白蛋白的基因座內(第9,956,247號美國專利,藉由引用併入本文)。然而,此等措施不能將原始IDUA基因座恢復至正確的編碼序列。基因組編輯策略可具有很多優點,最顯著的是基因表現的調節將受健康單體中存在的天然機制的控制。另外,使用鹼編輯不一定引起雙股DNA斷裂,這可能由腫瘤阻遏機制的破壞引致大規模染色體重排、細胞死亡或致癌性。一般策略可被指向為使用本發明之RGN鹼編輯器融合蛋白來靶向並校正人類基因組中的某些疾病引起的突變。應理解,亦可尋求類似措施來靶向藉由鹼編輯可校正的疾病。亦應進一步理解,亦可使用本發明之RGN來部署以靶向其他物種(特別是一般家庭寵物或家畜)中疾病引起的突變的類似措施。常見家庭寵物和家畜包含狗、貓、馬、豬、牛、羊、雞、驢、蛇、雪貂、及包括鮭魚的魚和蝦。B. 藉由靶向刪除修飾因果突變
本發明之RGN在因果突變更複雜的人類醫治療措施中也有用。舉例而言,諸如弗里德里希共濟失調和亨汀頓氏舞蹈症的一些疾病是在基因特定區域處的三個核苷酸模體的重複子中顯著增加的結果,這會影響表現蛋白起作用或被表現的能力。弗里德里希共濟失調(FRDA)為一種導致脊髓中神經組織漸進性退化的體染色體隱性疾病。粒線體中共濟蛋白(FXN)蛋白質的降低水準引起細胞層次的氧化損傷及鐵缺乏。降低的FXN表現已被鏈結至體細胞和生殖系列FXN基因的內含子1內的GAA三聯體擴增。在FRDA患者中,GAA重複子往往由超過70個,有時甚至超過1000個(最常見的是600-900個)三聯體組成,而未受影響的單體具有約40個或更少的重複子(Pandolfo等人(2012)Handbook of Clinical Neurology 103:275-294;Campuzano等人(1996)Science 271:1423-1427;Pandolfo(2002)Adv. Exp. Med. Biol. 516:99-118;全部藉由引用併入本文)。
引起弗里德里希共濟失調(FRDA)的三核苷酸重複序列的擴增發生在FXN基因內界定的基因座位中,被稱為FRDA不穩定區域。RNA導引之核酸酶(RGN)可使用於切除FRDA患者細胞中的不穩定區域。此措施需要:1)可被程式化以靶向人類基因組中的對偶基因的RGN及導引RNA序列;以及2)對於RGN及導引序列的遞送措施。特別是當除了功能表現卡匣所需的其他基因元素之外,還要考慮到SpCas9基因及導引RNA之長度時,用於基因組編輯的許多核酸酶(諸如,來自化膿性鏈球菌(SpyCas9)的常用Cas9核酸酶)太大而無法包裝到腺相關病毒(AAV)載體內。這使得使用SpCas9的措施更加困難。
本發明之某些RNA導引之核酸酶極適合隨導引RNA一起被包裝到AAV載體內。包裝兩個導引RNA可能需要第二個載體,但此種措施與諸如SpCas9的較大核酸酶所需要的相較仍然是有利的,這可能需要在兩個載體之間割裂蛋白質序列。本發明涵蓋使用本發明之RGN的策略,其中移除了基因體的不穩定區域。該種策略適用於具有類似基因基礎的其他疾病及病症,諸如亨汀頓氏舞蹈症。使用本發明之RGN的類似策略亦可適用於具有農藝或經濟重要性的非人類動物(包含:狗、貓、馬、豬、牛、羊、雞、驢、蛇、雪貂、以及包含鮭魚的魚和蝦)的類似疾病及病症。C. 藉由靶向誘變修飾因果突變
本發明之RGN也可引入可導致有益效應的破壞性突變。寫碼血紅蛋白的基因(特別是β球蛋白鏈(HBB基因))中的基因缺陷可造成很多稱為血紅蛋白病變的疾病(包括鐮狀細胞貧血症和地中海貧血症)。
在成年人類中,血紅蛋白為包括二個α樣球蛋白鏈及二個β樣球蛋白鏈及4個血紅素(heme)基團的異四聚體。在成人中,α2β2四聚體被稱為血紅蛋白A(HbA)或成人血紅蛋白。通常情況下,α及β球蛋白鏈以大約1:1的比例合成,並且此比例就血紅蛋白和紅血球(RBC)穩定而言似乎是關鍵的。在發育中的胎兒中,產生了不同形式的血紅蛋白(胎兒血紅蛋白(HbF)),其對氧的結合親和力高於血紅蛋白A,使得氧可經由母親的血流遞送到嬰兒的系統。胎兒血紅蛋白亦含有二個α球蛋白鏈,但是代替成人β-球蛋白鏈,其具有二個胎兒γ-球蛋白鏈(亦即,胎兒血紅蛋白為α2γ2)。自γ-球蛋白的產生轉換至β-球蛋白的產生的調節相當複雜,且主要涉及γ球蛋白轉錄的向下調節與β球蛋白轉錄的同時向上調節。在妊娠約30週時,胎兒中γ球蛋白的合成開始下降,而β球蛋白的產生增加。到約10個月齡時,新生兒的血紅蛋白幾乎都是α2β2,雖然一些HbF持續到成年期(約為總血紅蛋白的1-3%)。在大多數具有血紅蛋白病變的患者中,寫碼γ球蛋白的基因仍然存在,但由於如上所述在臨近分娩時發生正常的基因阻抑(gene repression),表現相對較低。
鐮狀細胞疾病係由β球蛋白基因(HBB)中的V6E突變(DNA層次的GAG至GTG)引起的,其中所得的血紅蛋白被稱為「血紅蛋白S」或「HbS」。在低氧條件下,HbS分子聚集並形成纖維狀沉澱物。此等聚集物引起RBC異常或「鐮狀化」,導致細胞的靈活性喪失。鐮狀化RBC不再能夠擠入微血管床,且可能導致鐮狀細胞患者的血管阻塞性危機。除此之外,鐮狀化RBC比正常RBC更脆弱,且傾向於溶血,最終引致患者貧血。
鐮狀細胞患者的醫治及管理是終生的課題,其涉及抗生素醫治、疼痛管理及急性發作期間的輸液。一種措施為使用羥基脲,其藉由增加γ球蛋白的產生來部分地發揮其效應。然而,慢性羥基脲療法的長期副作用仍然是未知的,而且醫治給予不想要的副作用且可能在患者之間具有不同的效能。儘管鐮狀細胞醫治的效能有所增加,但患者的預期壽命仍然僅在50年代中期至晚期,並且關聯的疾病發病對患者的生活品質具有深遠的影響。
地中海貧血症(α地中海貧血症及β地中海貧血症)亦為與血紅蛋白有關的疾病,並且通常情況下涉及減少的球蛋白鏈表現。這可以藉由基因調節區域中之突變或從導致減少的表現或減少的水準或功能性球蛋白蛋白質的球蛋白編碼序列中的突變發生。地中海貧血症的醫治通常涉及血液輸液及鐵螯合療法。如果適當的供體可被辨別,則骨髓移植亦被使用於醫治有嚴重地中海貧血症的人,但這種程序可能具有重大風險。
已經提出用於醫治鐮狀細胞病(SCD)及β地中海貧血症的一種措施為增加γ球蛋白的表現,使得HbF在功能上取代異常的成人血紅蛋白。如上所提及,用羥基脲醫治SCD患者由於其在增加γ球蛋白表現上的效應而被認為是部分成功的(DeSimone(1982)Proc Nat'l Acad Sci USA 79(14):4428-31;Ley等人(1982)N. Engl. J. Medicine, 307:1469-1475;Ley等人(1983)Blood 62:370-380;Constantoulakis等人(1988)Blood 72(6):1961-1967,均藉由引用併入本文)。增加HbF的表現涉及辨別其產物在γ球蛋白表現的調節中擔任角色的基因。一種這樣的基因為BCL11A。BCL11A寫碼在成人紅血球前驅細胞中表現的鋅指蛋白,且其表現的向下調節引致γ球蛋白表現增加(Sankaran等人(2008)Science 322:1839,藉由引用併入本文)。已經提出使用靶向至BCL11A基因的抑制性RNA(例如,第2011/0182867號美國專利公開,藉由引用併入本文),但此技術具有若干潛在的缺點,包含可能無法實現完全減量(knock down),這種RNA的遞送可能是有問題的,且RNA必須連續存在且終生需要多次醫治。
本發明之RGN可用於靶向BCL11A增強子區域,以破壞BCL11A的表現,從而增加γ球蛋白表現。這種靶向的破壞可藉由非同源末側接合(NHEJ)來實現,藉此本發明之RGN靶向至BCL11A增強子區域內的特殊序列,使雙股斷裂,且細胞的機械修復該斷裂,通常同時引入有害突變。類似於針對其他疾病標的所描述的,本發明之RGN由於其相對小的尺寸,使得能夠將RGN及其導引RNA的表現卡匣包裝至用於體內遞送的單一AAV載體中,從而具有優於其他已知RGN的優點。使用本發明之RGN的類似策略亦可應用於人類和農藝或經濟重要性的非人類動物中的類似疾病和病症。XI. 包括多核苷酸基因修飾的細胞
本文提供了包括已使用藉由如本文所描述的RGN、crRNA、及/或tracrRNA介導的過程修飾的所關注的標的序列的細胞和生物體。於此等實施方式中之一些中,RGN包括SEQ ID NO:1至109的胺基酸序列中任一者、或其活性變體或片段。於各種實施方式中,導引RNA包括CRISPR重複序列,該CRISPR重複序列包括SEQ ID NO:110至119、139、141、143、146、及201至309的核苷酸序列中任一者、或其活性變體或片段。於特殊實施方式中,導引RNA包括tracrRNA,該tracrRNA包括SEQ ID NO:120至128、140、142、145、147、及148的核苷酸序列中任一者、或其活性變體或片段。該系統的導引RNA可為單導引RNA或雙導引RNA。
經修飾的細胞可為真核的(例如,哺乳動物、植物、昆蟲細胞)或原核的。亦提供包括至少一種核苷酸序列的胞器及胚胎,該核苷酸序列已藉由利用如本文所描述的RGN、crRNA及/或tracrRNA的過程進行了修飾。經基因修飾的細胞、生物體、胞器、及胚胎對於經修飾的核苷酸序列可為異型接合的或同型接合的。
該細胞、生物體、胞器或胚胎之染色體修飾可導致改變的表現(向上調節或向下調節)、滅活、或改變的蛋白質產物或整合的序列的表現。於其中染色體修飾導致基因滅活或非功能性蛋白質產物表現的那些實施方式中,經基因修飾的細胞、生物體、胞器或胚胎被稱為「擊出(knock out)」。該擊出表現型可為刪除突變(亦即,至少一個核苷酸的刪除)、插入突變(亦即,至少一個核苷酸的插入)、或無意義突變(亦即,至少一個核苷酸的置換,藉以使得停止密碼子被引入)的結果。
於一些實施方式中,細胞、生物體、胞器或胚胎的染色體修飾可產生「撞入(knock in)」,該「撞入」由寫碼蛋白質的核苷酸序列的染色體整合導致。於此等實施方式中之一些實施方式中,編碼序列被整合至該染色體內,藉以使得寫碼野生型蛋白質的染色體序列被滅活,但表現出外源引入的蛋白質。
於一些實施方式中,染色體修飾導致變體蛋白質產物的產生。表現的變體蛋白質產物可具有至少一個胺基酸置換及/或至少一個胺基酸的添加或刪除。當與野生型蛋白質比較時,由改變的染色體序列所寫碼的變體蛋白質產物可呈現出經修飾的特徵或活性,包含但不限於改變的酶活性或基質專一性。
於一些實施方式中,染色體修飾可導致改變的蛋白質表現模式。作為非限制性範例,控制蛋白質產物表現的調節區域中的染色體改變可導致蛋白質產物過度表現或向下調節或改變的組織或時間表現模式。
已經被修飾的細胞可按照傳統方式生長成生物體,諸如,植物。參見,舉例而言,McCormick等人(1986)Plant Cell Reports 5:81-84。然後,可使此等植物生長,且用相同修飾品系(modified strain)或不同品系授粉,且所得雜合體具有基因修飾。本發明提供基因修飾種子。再生植物的子代、變體及突變體亦包含於本發明之範圍內,前提條件是此等部分包括基因修飾。進一步提供了保持了基因修飾的經加工的植物產品或副產物,舉例而言,包含豆粕。
本文提供之方法可用於修飾任何植物物種,包含但不限於單子葉植物及雙子葉植物。所關注之植物之範例包括但不限於:玉蜀黍(玉米)、高粱、小麥、向日葵、番茄、十字花科植物、胡椒、馬鈴薯、棉花、稻穀、大豆、甜菜、甘蔗、煙草、大麥、及油菜、芸苔屬物種、苜蓿、黑麥、小米、紅花、花生、甘藷、木薯、咖啡、椰子、鳳梨、柑橘樹、可可、茶、香蕉、鱷梨、無花果、番石榴、芒果、橄欖、木瓜、腰果、澳洲胡桃、杏仁、燕麥、蔬菜、觀賞植物以及針葉樹。
蔬菜包含但不限於:番茄、萵苣、綠豆、皇帝豆、豌豆、及諸如胡瓜、網紋甜瓜及洋香瓜之黃瓜屬的成員。觀賞植物包括但不限於:杜鵑花、繡球花、芙蓉、玫瑰、鬱金香、水仙、矮牽牛、康乃馨、猩猩木及菊花。較佳地,本發明之植物為農作物(舉例而言,玉米、高粱、小麥、向日葵、番茄、十字花科植物、胡椒、馬鈴薯、棉花、稻穀、大豆、甜菜、甘蔗、煙草、大麥、油菜等)。
本文提供之方法亦可使用於基因修飾任何原核物種,包含但不限於:古生菌及細菌(例如,芽孢桿菌屬克雷伯氏菌屬鏈黴菌屬根瘤菌屬埃希氏菌屬假單胞菌屬沙門氏菌屬志賀氏桿菌屬弧菌屬耶爾森菌屬支原體菌屬農桿菌屬乳酸乳桿菌屬
本文提供之方法可使用於基因修飾任何真核物種或來自於其的細胞,包含但不限於:動物(例如,哺乳動物、昆蟲、魚類、鳥類、及爬蟲類物)、真菌、變形蟲、藻類、及酵母。於一些實施方式中,本發明揭露之方法修飾之細胞包含造血源之細胞,諸如,免疫系統的細胞(亦即,免疫細胞),包含但不限於:B細胞、T細胞、自然殺手(NK)細胞、包含富潛能幹細胞及經誘導之多能幹細胞之幹細胞、嵌合抗原受體T(CAR-T)細胞、單核細胞、巨噬細胞、及樹突細胞。
可將經修飾之細胞可被引入生物體內。在自體細胞移植的情況中,此等細胞可源自同一個生物體(例如,人),其中該細胞以離體措施被修飾。作為另一種選擇,在異體細胞移植的情況中,該細胞源自同一個物種中之另一個生物體(例如,另一個人)。XII. 用於檢測標的 DNA 或剪切單股 DNA 族群的套組和方法
本發明揭露之RGN,特別是APG09624及APG05405(如SEQ ID NO:2及4所示)一旦藉由標的DNA的刪除而被活化則可雜亂地剪切未靶向之單股DNA(ssDNA)。由此,本文提供用於檢測樣本中之標的DNA(雙股或單股)的組成物及方法。
檢測DNA分子之標的DNA之方法包括:使樣本與RGN(或編碼同者之多核苷酸)、能夠與DNA分子中之RGN及標的DNA雜合(hybridizing)之導引RNA(或編碼同者之多核苷酸)、及不與該導引RNA雜合之檢測單股DNA(檢測ssDNA)接觸,隨後,量測藉由該RGN剪切該ssDNA產生之可檢測訊號,從而檢測該DNA分子之標的DNA序列。於一些實施方式中,方法可包含在與RGN及導引RNA接觸之前或之同時進行的樣本中之核酸分子的擴增步驟。於此等實施方式中之一些實施方式中,為增加檢測方法之靈敏度,該導引RNA將與之雜合的專一性序列可被擴增。
於其中樣本與編碼RGN多肽之多核苷酸及/或編碼該導引RNA之多核苷酸接觸的那些實施方式中,樣本包含完整細胞(intact cell)且該多核苷酸被引入細胞內,其中它們然後被表現。於此等實施方式中之一些實施方式中,至少一個多核苷酸進一步包含啟動子,該啟動子可操作地聯結至編碼該RNA多肽及/或導引RNA之核苷酸序列。
於一些實施方式中,期望標的可為RNA(諸如,舉例而言諸如冠狀病毒的RNA病毒的基因組或基因組的局部)存在。於一些實施方式中,冠狀病毒可為SARS類冠狀病毒。在進一步的實施方式中,冠狀病毒可為SARS-CoV-2、SARS-CoV或諸如bat-SL-CoVZC45(寄存編號:MG772933)的bat SARS類冠狀病毒。在其中該標的作為RNA存在的實施方式中,標的可被逆轉錄為可藉由RGN有效靶向的DNA分子。逆轉錄後面可為諸如本領域中已知的涉及熱循環的RT-PCR方法的擴增步驟,或可為諸如RT-LAMP(逆轉錄-環介導等溫擴增)的等溫方法(Notomi等人Nucleic Acids Res 28: E63, (2000))。
該核酸擴增可在該樣本與該RGN、導引RNA及檢測ssDNA接觸之前發生,或擴增可與該接觸步驟同時地發生。
於某些實施方式中,方法涉及使樣本與RGN及一個以上之導引RNA接觸。為擴增該可檢測訊號且引致對那個DNA分子之檢測,每一者均能夠與RGN雜合之導引RNA可與單DNA分子之唯一標的序列結合。
此等組成物及方法涉及不與該導引RNA雜合且為非標的ssDNA的檢測ssDNA的使用。於一些實施方式中,檢測ssDNA包含可檢測示蹤物,該可檢測示蹤物在剪切該檢測ssDNA後提供可檢測訊號。非限制性範例為包含螢光團/淬滅劑(quencher)對的檢測ssDNA,其中該螢光團當該檢測ssDNA為完整的(亦即,未被剪切)時因其訊號藉由緊密相鄰的淬滅劑的存在被阻遏而不發螢光。檢測ssDNA的剪切導致淬滅劑的移除,且然後該螢光示蹤物可被檢測。螢光示蹤物或螢光染劑的非限制性範例包括Cy5、螢光素(例如,FAM、6 FAM、5(6)FAM、FITC)、Cy3、Alexa Fluor®染劑、及德克薩斯紅(Texas Red)。淬滅劑的非限制性範例包括Iowa Black®FQ、Iowa Black®RQ、Qx1淬滅劑、ATT0淬滅劑、及QSY染劑。於一些實施方式中,檢測ssDNA包含第二淬滅劑,諸如,比如ZEN™、TAO™、及黑洞淬滅劑(Black Hole Quencher®)的內部淬滅劑,其可降低背景而增加訊號檢測。
於其他實施方式中,檢測ssDNA包含可檢測示蹤物,該可檢測示蹤物在剪切檢測ssDNA之前提供可檢測訊號,而ssDNA的剪切抑制或防止該訊號的檢測。此一境況之非限制性範例為包含螢光共振能量轉移(fluorescence resonance energy transfer)(FRET)對的檢測ssDNA。FRET為能量的無輻射轉移自第一(供體)螢光團的激發態至緊密相鄰的第二(受體)螢光團發生所藉的過程。該供體螢光團的發射光譜與受體螢光團的激發光譜重疊。由此,當檢測ssDNA為完整的(亦即,未被剪切)時,受體螢光團將發螢光,而當檢測ssDNA被剪切時,因為供體與受體螢光團不再彼此緊密相鄰,所以受體螢光團不再發螢光。FRET供體及受體螢光團為本領域中所知,且包括但不限於青色螢光蛋白(CFP)/綠色螢光蛋白(GFP)、Cy3/Cy5、及GFP/黃色螢光蛋白(YFP)。
於一些實施方式中,檢測ssDNA具有之長度為約2個核苷酸至約30個核苷酸,包括但不限於:約2、約3、約4、約5、約6、約7、約8、約9、約10、約11、約12、約13、約14、約15、約16、約17、約18、約19、約20、約21、約22、約23、約24、約25個核苷酸、約26個核苷酸、約27個核苷酸、約28個核苷酸、約29個核苷酸、及約30個核苷酸。
其中使用包含檢測ssDNA的此等組成物及方法可檢測標的DNA的樣本包括包含或據信包含核酸(例如,DNR或RNA分子)的任何樣本。該樣本可自包含純化核酸的合成組合或諸如呼吸拭子(例如,鼻咽拭子)萃取物、細胞溶胞產物、患者樣本、細胞、組織、唾液、血液、血清、血漿、尿液、抽吸物、生檢樣本、腦脊液或生物體(例如,細菌、病毒)的生物樣本的任何來源取得。
使樣本與RGN、導引RNA、及檢測ssDNA接觸可包括在體外、離體地或在活體內接觸。於一些實施方式中,檢測ssDNA及/或RGN及/或導引RNA被固定於舉例而言橫向流動裝置上,其中該樣本接觸經固定化檢測ssDNA及/或RGN及/或導引RNA。於一些實施方式中,針對檢測ssDNA上的抗原部分的抗體以自完整檢測ssDNA允許分化經剪切的檢測ssDNA的方式被固定於舉例而言橫向流動裝置上。亦提供了裝置(例如,橫向流動、微流體(microfluidic)),諸如,第WO 2020/028729號國際專利公開所描述的裝置,該國際專利公開的全部內容藉由引用併入本文,該裝置包含經固定化檢測ssDNA。可於對該裝置添加該樣本之前、之同時或之後,對該樣本添加該RGN及導引RNA,而當該標的DNA存在於該樣本內時,該RGN將剪切該標的DNA以及該檢測ssDNA,引致可檢測訊號的增加或減少,該可檢測訊號可被量測,以檢測該標的DNA序列之存在。作為另一種選擇,該RGN及/或導引RNA固定於該裝置(例如,橫向流動、微流體)上,且將該樣本及檢測ssDNA添加至該裝置。可於對該裝置添加該樣本之前、期間或之後,對該樣本添加該檢測ssDNA。另一種替選裝置(例如,橫向流動裝置、微流體裝置)包含針對該檢測ssDNA上之抗原部分之經固定化抗體,且對該裝置添加該樣本、檢測ssDNA、RGN及導引RNA。於一些實施方式中,方法可進一步包含確定樣本中存在的標的DNA的量。可將測試樣本中的可檢測訊號的量測值與參考量測值(例如,參考樣本的或其包含已知量的標的DNA的系列的量測值)進行比較。
該組成物及方法的應用的非限制性範例包括單核苷酸多型性(single-nucleotide polymorphism)(SNP)檢測、癌症篩查、細菌感染的檢測、抗生素抗性的檢測、及病毒感染的檢測。
使用本領域已知的任何適合方法可量測藉由RGN剪切該ssDNA產生的可檢測訊號,該方法包括但不限於量測螢光訊號、凝膠上的帶的視覺分析、比色變化以及電訊號的存在或不存在。
本發明提供用於檢測樣本中的DNA分子的標的DNA的套組,其中該套組包含:本發明之RGN多肽(或包含編碼該RGN多肽的核苷酸序列的多核苷酸)、能夠與該RGN及DNA分子中之標的DNA序列雜合的導引RNA、及不與該導引RNA雜合的檢測ssDNA。於要檢測之標的為RNA的那些實施方式中,套組可進一步包含逆轉錄酶。於其中使用核酸擴增的那些實施方式中,包含該RGN及導引RNA(或編碼同者的多核苷酸)及檢測ssDNA的套組可進一步包含核酸擴增試劑(例如,DNA聚合酶、多核苷酸、緩衝液)。於其中該套組包含編碼RGN多肽之多核苷酸及/或編碼該導引RNA之多核苷酸的那些實施方式中,多核苷酸被引入細胞內,然後,其中它們被表現。於此等實施方式中之一些實施方式中,至少一個多核苷酸進一步包含啟動子,該啟動子可操作地聯結至編碼該RNA多肽及/或導引RNA之核苷酸序列。於某些實施方式中,套組包含一個以上之導引RNA(或編碼一個以上之導引RNA之(複數)多核苷酸),每一個導引RNA都能夠與該RGN雜合。為擴增該可檢測訊號且引致對那個DNA分子之檢測,該導引RNA可與單DNA分子之唯一標的序列結合。該套組之元件可個別地或組合地被提供,且可以被提供在任何適合的容器中,例如小瓶、瓶子或管子。於一些實施方式中,套組包括一種或多種語言的說明。於一些實施方式中,套組包含一種或更多種試劑,其於利用本文描述之一或更多元件的過程中使用。試劑可被提供於任何適合的容器中。舉例而言,套組可以提供一或更多種反應或儲存緩衝液。試劑可為以可用於特別測定法的形式、或以在使用前需要添加一或更多種其他組成的形式(例如,以濃縮或冷凍乾燥形式)被提供。緩衝液可以是任何緩衝液,包括但不限於碳酸鈉緩衝液、碳酸氫鈉緩衝液、硼酸鹽緩衝液、Tris緩衝液、MOPS緩衝液、HEPES緩衝液及其組合。於一些實施方式中,緩衝劑為鹼性的。於一些實施方式中,緩衝液具有約7至約10的pH。
本文亦提供了藉由接觸核酸族群剪切單股DNA的方法,其中該族群包括DNA分子的標的DNA序列及複數個非標的ssDNA,該非標的ssDNA具有RGN和能夠與該RGN及該標的DNA序列雜合的導引RNA。於此等實施方式中之一些實施方式中,核酸族群係於細胞溶胞產物內。於此等實施方式中之一些實施方式中,非標的ssDNA非該細胞所原有,且於此等實施方式中之一些實施方式中,非標的ssDNA為病毒DNA。於特別實施方式中,標的DNA序列為病毒序列。可在體外、活體內、或離體地實行該方法。舉例而言,可在活體內實行該方法,其中對個體投予RGN多肽及導引RNA或一或更多包含編碼該RGN多肽及/或該導引RNA之核苷酸序列的多核苷酸,且病毒標的DNA序列藉由該RGN之結合及剪切可導致所感染之細胞內的非標的病毒ssDNA的剪切。
冠詞「一(a)」和「一(an)」在本文中用於指該冠詞的一或一個以上(亦即,至少一個)的語法對象。作為範例,「多肽」表達一或更多多肽。
說明書中提及的所有出版物及專利申請案暗示本揭露內容所屬領域中具有通常知識者的層次。所有出版物及專利申請案藉由引用併入本文,如同每一個單獨出版物或專利申請案被具體且單獨地指示藉由引用而被併入本文。
雖然為了清楚理解的目的已經作為示例及範例頗詳細地描述了前述發明,但顯然可在所附實施方式的範圍內實踐某些改變及修改。 非限制性實施方式包括:
1. 一種核酸分子,包含編碼RNA導引之核酸酶(RGN)多肽的多核苷酸,其中該多核苷酸包含編碼RGN多肽的核苷酸序列,該RGN多肽包含與SEQ ID NO:1至109中任一者具有至少90%序列一致性的胺基酸序列; 其中當與能夠與該標的DNA序列雜合的導引RNA(gRNA)結合時,該RGN多肽能夠以RNA導引之序列專一性方式結合DNA分子之標的DNA序列,且 其中編碼RGN多肽的該多核苷酸可操作地聯結至與該多核苷酸異源之啟動子。
2. 如實施方式1的核酸分子,其中該RGN多肽包含與SEQ ID NO:1至109中任一者具有至少95%序列一致性的胺基酸序列。
3. 如實施方式1的核酸分子,其中該RGN多肽包含與SEQ ID NO:1至109中任一者具有100%序列一致性的胺基酸序列。
4. 如實施方式1-3中任一實施方式的核酸分子,其中該標的DNA序列位於為單股的該DNA分子的一區域內。
5. 如實施方式4的核酸分子,其中該RGN多肽能夠於結合時剪切該標的DNA序列。
6. 如實施方式1-3中任一實施方式的核酸分子,其中該標的DNA序列位於為雙股的該DNA分子的一區域內。
7. 如實施方式6的核酸分子,其中該RGN多肽能夠於結合時剪切該標的DNA序列。
8. 如實施方式7的核酸分子,其中藉由該RGN多肽之剪切產生雙股斷裂。
9. 如實施方式7的核酸分子,其中藉由該RGN多肽之剪切產生單股斷裂。
10. 如實施方式1-9中任一實施方式的核酸分子,其中該RGN多肽與鹼基編輯多肽可操作地融合。
11. 如實施方式10的核酸分子,其中該鹼基編輯多肽為脫胺酶。
12. 如實施方式1-11中任一實施方式的核酸分子,其中該標的DNA序列與原型間隔體相鄰模體(PAM)相鄰地被安置。
13. 如實施方式1-12中任一實施方式的核酸分子,其中該PGN多肽包含一或更多核定位訊號。
14. 如實施方式1-13中任一實施方式的核酸分子,其中該RGN多肽針對於真核細胞中之表現而被密碼子最佳化。
15. 一種包含如實施方式1-14中任一實施方式的核酸分子的載體。
16. 如實施方式15的載體,進一步包含至少一個核苷酸序列,該至少一個核苷酸序列編碼選自以下者組成之群組的RGN輔助蛋白: a)與SEQ ID NO:178-181中任一者具有至少90%序列一致性的至少一個RGN輔助蛋白,其中該RGN多肽包含與SEQ ID NO:11具有至少90%序列一致性的胺基酸序列; b)與SEQ ID NO:182-184中任一者具有至少90%序列一致性的至少一個RGN輔助蛋白,其中該RGN多肽包含與SEQ ID NO:12具有至少90%序列一致性的胺基酸序列; c)與SEQ ID NO:185-187中任一者具有至少90%序列一致性的至少一個RGN輔助蛋白,其中該RGN多肽包含與SEQ ID NO:13具有至少90%序列一致性的胺基酸序列; d)與SEQ ID NO:191具有至少90%序列一致性的RGN輔助蛋白,其中該RGN多肽包含與SEQ ID NO:14具有至少90%序列一致性的胺基酸序列; e)與SEQ ID NO:192具有至少90%序列一致性的RGN輔助蛋白,其中該RGN多肽包含與SEQ ID NO:15具有至少90%序列一致性的胺基酸序列;及 f)與SEQ ID NO:188-190中任一者具有至少90%序列一致性的至少一個RGN輔助蛋白,其中該RGN多肽包含與SEQ ID NO:16具有至少90%序列一致性的胺基酸序列。
17. 如實施方式16的載體,其中該RGN輔助蛋白選自以下者組成之群組: a)與SEQ ID NO:178-181中任一者具有至少95%序列一致性的至少一個RGN輔助蛋白,其中該RGN多肽包含與SEQ ID NO:11具有至少95%序列一致性的胺基酸序列; b)與SEQ ID NO:182-184中任一者具有至少95%序列一致性的至少一個RGN輔助蛋白,其中該RGN多肽包含與SEQ ID NO:12具有至少95%序列一致性的胺基酸序列; c)與SEQ ID NO:185-187中任一者具有至少95%序列一致性的至少一個RGN輔助蛋白,其中該RGN多肽包含與SEQ ID NO:13具有至少95%序列一致性的胺基酸序列; d)與SEQ ID NO:191具有至少95%序列一致性的RGN輔助蛋白,其中該RGN多肽包含與SEQ ID NO:14具有至少95%序列一致性的胺基酸序列; e)與SEQ ID NO:192具有至少95%序列一致性的RGN輔助蛋白,其中該RGN多肽包含與SEQ ID NO:15具有至少95%序列一致性的胺基酸序列;及 f)與SEQ ID NO:188-190中任一者具有至少95%序列一致性的至少一個RGN輔助蛋白,其中該RGN多肽包含與SEQ ID NO:16具有至少95%序列一致性的胺基酸序列。
18. 如實施方式16的載體,其中該RGN輔助蛋白選自以下者組成之群組: a)與SEQ ID NO:178-181中任一者具有100%序列一致性的至少一個RGN輔助蛋白,其中該RGN多肽包含與SEQ ID NO:11具有100%序列一致性的胺基酸序列; b)與SEQ ID NO:182-184中任一者具有100%序列一致性的至少一個RGN輔助蛋白,其中該RGN多肽包含與SEQ ID NO:12具有100%序列一致性的胺基酸序列; c)與SEQ ID NO:185-187中任一者具有100%序列一致性的至少一個RGN輔助蛋白,其中該RGN多肽包含與SEQ ID NO:13具有100%序列一致性的胺基酸序列; d)與SEQ ID NO:191具有100%序列一致性的RGN輔助蛋白,其中該RGN多肽包含與SEQ ID NO:14具有100%序列一致性的胺基酸序列; e)與SEQ ID NO:192具有100%序列一致性的RGN輔助蛋白,其中該RGN多肽包含與SEQ ID NO:15具有100%序列一致性的胺基酸序列;及 f)與SEQ ID NO:188-190中任一者具有100%序列一致性的至少一個RGN輔助蛋白,其中該RGN多肽包含與SEQ ID NO:16具有100%序列一致性的胺基酸序列。
19. 如實施方式15-18中任一實施方式的載體,進一步包含至少一個核苷酸序列,該至少一個核苷酸序列編碼能夠與該標的DNA序列雜合的該gRNA。
20. 如實施方式16的載體,其中該RGN多肽包含與SEQ ID NO:11具有至少90%序列一致性的胺基酸序列,且該gRNA包含CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:116具有至少90%序列一致性的CRISPR重複序列。
21. 如實施方式19的載體,其中該RGN多肽包含與SEQ ID NO:11具有至少95%序列一致性的胺基酸序列,且該gRNA包含CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:116具有至少95%序列一致性的CRISPR重複序列。
22. 如實施方式19的載體,其中該RGN多肽包含與SEQ ID NO:11具有100%序列一致性的胺基酸序列,且該gRNA包含CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:116具有100%序列一致性的CRISPR重複序列。
23. 如實施方式19的載體,其中該gRNA包含tracrRNA。
24. 如實施方式23的載體,其中該tracrRNA選自以下者組成之群組: a)與SEQ ID NO:120具有至少90%序列一致性的tracrRNA,其中該gRNA進一步包含CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:110具有至少90%序列一致性的CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:1具有至少90%序列一致性的胺基酸序列; b)與SEQ ID NO:121具有至少90%序列一致性的tracrRNA,其中該gRNA進一步包含CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:111具有至少90%序列一致性的CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:2具有至少90%序列一致性的胺基酸序列; c)與SEQ ID NO:122具有至少90%序列一致性的tracrRNA,其中該gRNA進一步包含CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:112具有至少90%序列一致性的CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:3具有至少90%序列一致性的胺基酸序列; d)與SEQ ID NO:123具有至少90%序列一致性的tracrRNA,其中該gRNA進一步包含CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:113具有至少90%序列一致性的CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:4具有至少90%序列一致性的胺基酸序列; e)與SEQ ID NO:124具有至少90%序列一致性的tracrRNA,其中該gRNA進一步包含CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:114具有至少90%序列一致性的CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:5具有至少90%序列一致性的胺基酸序列; f)與SEQ ID NO:125具有至少90%序列一致性的tracrRNA,其中該gRNA進一步包含CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:115具有至少90%序列一致性的CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:6具有至少90%序列一致性的胺基酸序列; g)與SEQ ID NO:126具有至少90%序列一致性的tracrRNA,其中該gRNA進一步包含CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:117具有至少90%序列一致性的CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:12具有至少90%序列一致性的胺基酸序列; h)與SEQ ID NO:127具有至少90%序列一致性的tracrRNA,其中該gRNA進一步包含CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:118具有至少90%序列一致性的CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:13具有至少90%序列一致性的胺基酸序列;及 i)與SEQ ID NO:128具有至少90%序列一致性的tracrRNA,其中該gRNA進一步包含CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:119具有至少90%序列一致性的CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:16具有至少90%序列一致性的胺基酸序列。
25. 如實施方式23的載體,其中該tracrRNA選自以下者組成之群組: a)與SEQ ID NO:121具有至少95%序列一致性的tracrRNA,其中該gRNA進一步包含CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:111具有至少95%序列一致性的CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:2具有至少95%序列一致性的胺基酸序列; b)與SEQ ID NO:123具有至少95%序列一致性的tracrRNA,其中該gRNA進一步包含CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:113具有至少95%序列一致性的CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:4具有至少95%序列一致性的胺基酸序列; c)與SEQ ID NO:120具有至少95%序列一致性的tracrRNA,其中該gRNA進一步包含CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:110具有至少95%序列一致性的CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:1具有至少95%序列一致性的胺基酸序列; d)與SEQ ID NO:122具有至少95%序列一致性的tracrRNA,其中該gRNA進一步包含CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:112具有至少95%序列一致性的CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:3具有至少95%序列一致性的胺基酸序列; e)與SEQ ID NO:124具有至少95%序列一致性的tracrRNA,其中該gRNA進一步包含CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:114具有至少95%序列一致性的CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:5具有至少95%序列一致性的胺基酸序列; f)與SEQ ID NO:125具有至少95%序列一致性的tracrRNA,其中該gRNA進一步包含CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:115具有至少95%序列一致性的CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:6具有至少95%序列一致性的胺基酸序列; g)與SEQ ID NO:126具有至少95%序列一致性的tracrRNA,其中該gRNA進一步包含CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:117具有至少95%序列一致性的CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:12具有至少95%序列一致性的胺基酸序列; h)與SEQ ID NO:127具有至少95%序列一致性的tracrRNA,其中該gRNA進一步包含CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:118具有至少95%序列一致性的CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:13具有至少95%序列一致性的胺基酸序列;及 i)與SEQ ID NO:128具有至少95%序列一致性的tracrRNA,其中該gRNA進一步包含CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:119具有至少95%序列一致性的CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:16具有至少95%序列一致性的胺基酸序列。
26. 如實施方式23的載體,其中該tracrRNA選自以下者組成之群組: a)與SEQ ID NO:121具有100%序列一致性的tracrRNA,其中該gRNA進一步包含CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:111具有100%序列一致性的CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:2具有100%序列一致性的胺基酸序列; b)與SEQ ID NO:123具有100%序列一致性的tracrRNA,其中該gRNA進一步包含CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:113具有100%序列一致性的CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:4具有100%序列一致性的胺基酸序列; c)與SEQ ID NO:120具有100%序列一致性的tracrRNA,其中該gRNA進一步包含CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:110具有100%序列一致性的CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:1具有100%序列一致性的胺基酸序列; d)與SEQ ID NO:122具有100%序列一致性的tracrRNA,其中該gRNA進一步包含CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:112具有100%序列一致性的CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:3具有100%序列一致性的胺基酸序列; e)與SEQ ID NO:124具有100%序列一致性的tracrRNA,其中該gRNA進一步包含CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:114具有100%序列一致性的CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:5具有100%序列一致性的胺基酸序列; f)與SEQ ID NO:125具有100%序列一致性的tracrRNA,其中該gRNA進一步包含CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:115具有100%序列一致性的CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:6具有100%序列一致性的胺基酸序列; g)與SEQ ID NO:126具有100%序列一致性的tracrRNA,其中該gRNA進一步包含CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:117具有100%序列一致性的CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:12具有100%序列一致性的胺基酸序列; h)與SEQ ID NO:127具有100%序列一致性的tracrRNA,其中該gRNA進一步包含CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:118具有100%序列一致性的CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:13具有100%序列一致性的胺基酸序列;及 i)與SEQ ID NO:128具有100%序列一致性的tracrRNA,其中該gRNA進一步包含CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:119具有100%序列一致性的CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:16具有100%序列一致性的胺基酸序列。
27. 如實施方式23-26中任一實施方式的載體,其中該gRNA為單導引RNA。
28. 如實施方式23-26中任一實施方式的載體,其中該gRNA為雙導引RNA。
29. 一種包含如實施方式1-14中任一實施方式的核酸分子或如實施方式15-28中任一實施方式的載體的細胞。
30. 一種製作RGN多肽的方法,包含在該RGN多肽被表現的條件下,培養實施方式29的細胞。
31. 一種製作RGN多肽的方法,包含將異源核酸分子引入細胞內,該異源核酸分子包含編碼RNA導引之核酸酶(RGN)多肽的核苷酸序列,該RNA導引之核酸酶(RGN)多肽包含與SEQ ID NO:1-109中任一者具有至少90%序列一致性的胺基酸序列; 其中當與能夠與該標的DNA序列雜合的導引RNA(gRNA)結合時,該RGN多肽以RNA導引之序列專一性方式結合DNA分子之標的DNA序列; 且在該RGN多肽被表現的條件下,培養該細胞。
32. 如實施方式31的方法,其中該RGN多肽包含與SEQ ID NO:1-109中任一者具有至少95%序列一致性的胺基酸序列。
33. 如實施方式31的方法,其中該RGN多肽包含與SEQ ID NO:1-109中任一者具有100%序列一致性的胺基酸序列。
34. 如實施方式30-33中任一實施方式的方法,進一步包含純化該RGN多肽。
35. 如實施方式30-33中任一實施方式的方法,其中該細胞進一步表現一或更多導引RNA,該一或更多導引RNA與該RGN多肽結合,以形成RGN核糖核蛋白複合物。
36. 如實施方式35的方法,進一步包含純化該RGN核糖核蛋白複合物。
37. 一種分離的RNA導引之核酸酶(RGN)多肽,其中該RGN多肽包含與SEQ ID NO:1-109中任一者具有至少90%序列一致性的胺基酸序列;及 其中當與能夠與該標的DNA序列雜合的導引RNA(gRNA)結合時,該RGN多肽能夠以RNA導引之序列專一性方式結合DNA分子之標的DNA序列。
38. 如實施方式37的分離的RGN多肽,其中該RGN多肽包含與SEQ ID NO:1-109中任一者具有至少90%序列一致性的胺基酸序列。
39. 如實施方式37的分離的RGN多肽,其中該RGN多肽包含與SEQ ID NO:1-109中任一者具有100%序列一致性的胺基酸序列。
40. 如實施方式37-39中任一實施方式的分離的RGN多肽,其中該標的DNA序列位於為單股的該DNA分子的一區域內。
41. 如實施方式40的分離的RGN多肽,其中該RGN多肽能夠於結合時剪切該標的DNA序列。
42. 如實施方式37-39中任一實施方式的分離的RGN多肽,其中該標的DNA序列位於為雙股的該DNA分子的一區域內。
43. 如實施方式42的分離的RGN多肽,其中該RGN多肽能夠於結合時剪切該標的DNA序列。
44. 如實施方式43的分離的RGN多肽,其中藉由該RGN多肽之剪切產生雙股斷裂。
45. 如實施方式43的分離的RGN多肽,其中藉由該RGN多肽之剪切產生單股斷裂。
46. 如實施方式37-45中任一實施方式的分離的RGN多肽,其中該RGN多肽與鹼基編輯多肽可操作地融合。
47. 如實施方式46的分離的RGN多肽,其中該鹼基編輯多肽為脫胺酶。
48. 如實施方式37-47中任一實施方式的分離的RGN多肽,其中該標的DNA序列與原型間隔體相鄰模體(PAM)相鄰地被安置。
49. 如實施方式37-48中任一實施方式的分離的RGN多肽,其中該PGN多肽包含一或更多核定位訊號。
50. 一種包含編碼CRISPR RNA(crRNA)的多核苷酸的核酸分子,其中該crRNA包含間隔體序列及CRISPR重複序列,其中該CRISPR重複序列包含與SEQ ID NO:110至119中任一者具有至少90%序列一致性的核苷酸序列; 其中導引RNA包含: a)該crRNA;或 b)該crRNA及能夠與該crRNA之該CRISPR重複序列雜合的反式活化的CRISPR RNA(tracrRNA); 當該導引RNA與RNA導引之核酸酶(RGN)多肽結合時,透過該crRNA之間隔體序列,能夠以序列專一性方式與DNA分子之標的DNA序列雜合,且 其中編碼crRNA的該多核苷酸被可操作地聯結至與該多核苷酸異源之啟動子。
51. 如實施方式50的核酸分子,其中該CRISPR重複序列包含與SEQ ID NO:110至119中任一者具有至少95%序列一致性的核苷酸序列。
52. 如實施方式50的核酸分子,其中該CRISPR重複序列包含與SEQ ID NO:110至119中任一者具有100%序列一致性的核苷酸序列。
53. 一種包含實施方式50-52中任一者的核酸分子的載體。
54. 如實施方式53的載體,其中該載體進一步包含編碼該tracrRNA的多核苷酸。
55. 如實施方式54的載體,其中該CRISPR重複序列與SEQ ID NO:110具有至少90%序列一致性,且該tracrRNA包含與SEQ ID NO:120具有至少90%序列一致性的核苷酸序列。
56. 如實施方式54的載體,其中該CRISPR重複序列與SEQ ID NO:110具有至少95%序列一致性,且該tracrRNA包含與SEQ ID NO:120具有至少95%序列一致性的核苷酸序列。
57. 如實施方式54的載體,其中該CRISPR重複序列與SEQ ID NO:110具有100%序列一致性,且該tracrRNA包含與SEQ ID NO:120具有100%序列一致性的核苷酸序列。
58. 如實施方式55-57中任一實施方式的載體,其中該載體進一步包含編碼該RGN多肽的多核苷酸,該RGN多肽包含與SEQ ID NO:1具有至少90%序列一致性的胺基酸序列。
59. 如實施方式58的載體,其中該RGN多肽包含與SEQ ID NO:1具有至少95%序列一致性的胺基酸序列。
60. 如實施方式58的載體,其中該RGN多肽包含與SEQ ID NO:1具有100%序列一致性的胺基酸序列。
61. 如實施方式54的載體,其中該CRISPR重複序列與SEQ ID NO:111具有至少90%序列一致性,且該tracrRNA包含與SEQ ID NO:121具有至少90%序列一致性的核苷酸序列。
62. 如實施方式54的載體,其中該CRISPR重複序列與SEQ ID NO:111具有至少95%序列一致性,且該tracrRNA包含與SEQ ID NO:121具有至少95%序列一致性的核苷酸序列。
63. 如實施方式54的載體,其中該CRISPR重複序列與SEQ ID NO:111具有100%序列一致性,且該tracrRNA包含與SEQ ID NO:121具有100%序列一致性的核苷酸序列。
64. 如實施方式61-63中任一實施方式的載體,其中該載體進一步包含編碼該RGN多肽的多核苷酸,該RGN多肽包含與SEQ ID NO:2具有至少90%序列一致性的胺基酸序列。
65. 如實施方式64的載體,其中該RGN多肽包含與SEQ ID NO:2具有至少95%序列一致性的胺基酸序列。
66. 如實施方式64的載體,其中該RGN多肽包含與SEQ ID NO:2具有100%序列一致性的胺基酸序列。
67. 如實施方式54的載體,其中該CRISPR重複序列與SEQ ID NO:112具有至少90%序列一致性,且該tracrRNA包含與SEQ ID NO:122具有至少90%序列一致性的核苷酸序列。
68. 如實施方式54的載體,其中該CRISPR重複序列與SEQ ID NO:112具有至少95%序列一致性,且該tracrRNA包含與SEQ ID NO:122具有至少95%序列一致性的核苷酸序列。
69. 如實施方式54的載體,其中該CRISPR重複序列與SEQ ID NO:112具有100%序列一致性,且該tracrRNA包含與SEQ ID NO:122具有100%序列一致性的核苷酸序列。
70. 如實施方式67-69中任一實施方式的載體,其中該載體進一步包含編碼該RGN多肽的多核苷酸,該RGN多肽包含與SEQ ID NO:3具有至少90%序列一致性的胺基酸序列。
71. 如實施方式70的載體,其中該RGN多肽包含與SEQ ID NO:3具有至少95%序列一致性的胺基酸序列。
72. 如實施方式70的載體,其中該RGN多肽包含與SEQ ID NO:3具有100%序列一致性的胺基酸序列。
73. 如實施方式54的載體,其中該CRISPR重複序列與SEQ ID NO:113具有至少90%序列一致性,且該tracrRNA包含與SEQ ID NO:123具有至少90%序列一致性的核苷酸序列。
74. 如實施方式54的載體,其中該CRISPR重複序列與SEQ ID NO:113具有至少95%序列一致性,且該tracrRNA包含與SEQ ID NO:123具有至少95%序列一致性的核苷酸序列。
75. 如實施方式54的載體,其中該CRISPR重複序列與SEQ ID NO:113具有100%序列一致性,且該tracrRNA包含與SEQ ID NO:123具有100%序列一致性的核苷酸序列。
76. 如實施方式73-75中任一實施方式的載體,其中該載體進一步包含編碼該RGN多肽的多核苷酸,該RGN多肽包含與SEQ ID NO:4具有至少90%序列一致性的胺基酸序列。
77. 如實施方式76的載體,其中該RGN多肽包含與SEQ ID NO:4具有至少95%序列一致性的胺基酸序列。
78. 如實施方式76的載體,其中該RGN多肽包含與SEQ ID NO:4具有100%序列一致性的胺基酸序列。
79. 如實施方式54的載體,其中該CRISPR重複序列包含與SEQ ID NO:114具有至少90%序列一致性的核苷酸序列,且該tracrRNA包含與SEQ ID NO:124具有至少90%序列一致性的核苷酸序列。
80. 如實施方式54的載體,其中該CRISPR重複序列包含與SEQ ID NO:114具有至少95%序列一致性的核苷酸序列,且該tracrRNA包含與SEQ ID NO:124具有至少95%序列一致性的核苷酸序列。
81. 如實施方式54的載體,其中該CRISPR重複序列包含與SEQ ID NO:114具有100%序列一致性的核苷酸序列,且該tracrRNA包含與SEQ ID NO:124具有100%序列一致性的核苷酸序列。
82. 如實施方式79-81中任一實施方式的載體,其中該載體進一步包含編碼該RGN多肽的多核苷酸,該RGN多肽包含與SEQ ID NO:5具有至少90%序列一致性的胺基酸序列。
83. 如實施方式82的載體,其中該RGN多肽包含與SEQ ID NO:5具有至少95%序列一致性的胺基酸序列。
84. 如實施方式82的載體,其中該RGN多肽包含與SEQ ID NO:5具有100%序列一致性的胺基酸序列。
85. 如實施方式54的載體,其中該CRISPR重複序列包含與SEQ ID NO:115具有至少90%序列一致性的核苷酸序列,且該tracrRNA包含與SEQ ID NO:125具有至少90%序列一致性的核苷酸序列。
86. 如實施方式54的載體,其中該CRISPR重複序列包含與SEQ ID NO:115具有至少95%序列一致性的核苷酸序列,且該tracrRNA包含與SEQ ID NO:125具有至少95%序列一致性的核苷酸序列。
87. 如實施方式54的載體,其中該CRISPR重複序列包含與SEQ ID NO:115具有100%序列一致性的核苷酸序列,且該tracrRNA包含與SEQ ID NO:125具有100%序列一致性的核苷酸序列。
88. 如實施方式85-87中任一實施方式的載體,其中該載體進一步包含編碼該RGN多肽的多核苷酸,該RGN多肽包含與SEQ ID NO:6具有至少90%序列一致性的胺基酸序列。
89. 如實施方式88的載體,其中該RGN多肽包含與SEQ ID NO:6具有至少95%序列一致性的胺基酸序列。
90. 如實施方式88的載體,其中該RGN多肽包含與SEQ ID NO:6具有100%序列一致性的胺基酸序列。
91. 如實施方式54的載體,其中該CRISPR重複序列包含與SEQ ID NO:117具有至少90%序列一致性的核苷酸序列,且該tracrRNA包含與SEQ ID NO:126具有至少90%序列一致性的核苷酸序列。
92. 如實施方式54的載體,其中該CRISPR重複序列包含與SEQ ID NO:117具有至少95%序列一致性的核苷酸序列,且該tracrRNA包含與SEQ ID NO:126具有至少95%序列一致性的核苷酸序列。
93. 如實施方式54的載體,其中該CRISPR重複序列包含與SEQ ID NO:117具有100%序列一致性的核苷酸序列,且該tracrRNA包含與SEQ ID NO:126具有100%序列一致性的核苷酸序列。
94. 如實施方式91-93中任一實施方式的載體,其中該載體進一步包含編碼該RGN多肽的多核苷酸,該RGN多肽包含與SEQ ID NO:12具有至少90%序列一致性的胺基酸序列。
95. 如實施方式94的載體,其中該RGN多肽包含與SEQ ID NO:12具有至少95%序列一致性的胺基酸序列。
96. 如實施方式94的載體,其中該RGN多肽包含與SEQ ID NO:12具有100%序列一致性的胺基酸序列。
97. 如實施方式54的載體,其中該CRISPR重複序列包含與SEQ ID NO:118具有至少90%序列一致性的核苷酸序列,且該tracrRNA包含與SEQ ID NO:127具有至少90%序列一致性的核苷酸序列。
98. 如實施方式54的載體,其中該CRISPR重複序列包含與SEQ ID NO:118具有至少95%序列一致性的核苷酸序列,且該tracrRNA包含與SEQ ID NO:127具有至少95%序列一致性的核苷酸序列。
99. 如實施方式54的載體,其中該CRISPR重複序列包含與SEQ ID NO:118具有100%序列一致性的核苷酸序列,且該tracrRNA包含與SEQ ID NO:127具有100%序列一致性的核苷酸序列。
100. 如實施方式97-99中任一實施方式的載體,其中該載體進一步包含編碼該RGN多肽的多核苷酸,該RGN多肽包含與SEQ ID NO:13具有至少90%序列一致性的胺基酸序列。
101. 如實施方式100的載體,其中該RGN多肽包含與SEQ ID NO:13具有至少95%序列一致性的胺基酸序列。
102. 如實施方式100的載體,其中該RGN多肽包含與SEQ ID NO:13具有100%序列一致性的胺基酸序列。
103. 如實施方式54的載體,其中該CRISPR重複序列包含與SEQ ID NO:119具有至少90%序列一致性的核苷酸序列,且該tracrRNA包含與SEQ ID NO:128具有至少90%序列一致性的核苷酸序列。
104. 如實施方式54的載體,其中該CRISPR重複序列包含與SEQ ID NO:119具有至少95%序列一致性的核苷酸序列,且該tracrRNA包含與SEQ ID NO:128具有至少95%序列一致性的核苷酸序列。
105. 如實施方式54的載體,其中該CRISPR重複序列包含與SEQ ID NO:119具有100%序列一致性的核苷酸序列,且該tracrRNA包含與SEQ ID NO:128具有100%序列一致性的核苷酸序列。
106. 如實施方式103-105中任一實施方式的載體,其中該載體進一步包含編碼該RGN多肽的多核苷酸,該RGN多肽包含與SEQ ID NO:16具有至少90%序列一致性的胺基酸序列。
107. 如實施方式106的載體,其中該RGN多肽包含與SEQ ID NO:16具有至少95%序列一致性的胺基酸序列。
108. 如實施方式106的載體,其中該RGN多肽包含與SEQ ID NO:16具有100%序列一致性的胺基酸序列。
109. 如實施方式54-108中任一實施方式的載體,其中編碼該crRNA的該多核苷酸及編碼該tracrRNA的該多核苷酸可操作地聯結至同一個啟動子,且被編碼為單導引RNA。
110. 如實施方式54-109中任一實施方式的載體,其中編碼該crRNA的該多核苷酸及編碼該tracrRNA的該多核苷酸可操作地聯結至各別啟動子。
111. 一種包含編碼反式活化的CRISPR RNA(tracrRNA)的多核苷酸的核酸分子,該反式活化的CRISPR RNA(tracrRNA)包含與SEQ ID NO:120至128中任一者具有至少90%序列一致性的核苷酸序列; 其中導引RNA包含: a)該tracrRNA;及 b)crRNA,該crRNA包含間隔體序列及CRISPR重複序列,其中該tracrRNA能夠與該crRNA之該CRISPR重複序列雜合; 當該導引RNA與RNA導引之核酸酶(RGN)多肽結合時,透過該crRNA之間隔體序列,能夠以序列專一性方式與標的DNA序列雜合,且 其中編碼tracrRNA的該多核苷酸被可操作地聯結至與該多核苷酸異源之啟動子。
112. 如實施方式111的核酸分子,其中該tracrRNA包含與SEQ ID NO:120至128中任一者具有至少95%序列一致性的核苷酸序列。
113. 如實施方式111的核酸分子,其中該tracrRNA包含與SEQ ID NO:120至128中任一者具有1000%序列一致性的核苷酸序列。
114. 一種包含實施方式111-113中任一者的核酸分子的載體。
115. 如實施方式114的載體,其中該載體進一步包含編碼該crRNA的多核苷酸。
116. 如實施方式115的載體,其中該crRNA包含與SEQ ID NO:110具有至少90%序列一致性的CRISPR重複序列,且該tracrRNA包含與SEQ ID NO:120具有至少90%序列一致性的核苷酸序列。
117. 如實施方式116的載體,其中該CRISPR重複序列與SEQ ID NO:110具有至少95%序列一致性,且該tracrRNA包含與SEQ ID NO:120具有至少95%序列一致性的核苷酸序列。
118. 如實施方式116的載體,其中該CRISPR重複序列與SEQ ID NO:110具有100%序列一致性,且該tracrRNA包含與SEQ ID NO:120具有100%序列一致性的核苷酸序列。
119. 如實施方式116-118中任一實施方式的載體,其中該載體進一步包含編碼該RGN多肽的多核苷酸,該RGN多肽包含與SEQ ID NO:1具有至少90%序列一致性的胺基酸序列。
120. 如實施方式119的載體,其中該RGN多肽包含與SEQ ID NO:1具有至少95%序列一致性的胺基酸序列。
121. 如實施方式119的載體,其中該RGN多肽包含與SEQ ID NO:1具有100%序列一致性的胺基酸序列。
122. 如實施方式115的載體,其中該crRNA包含與SEQ ID NO:111具有至少90%序列一致性的CRISPR重複序列,且該tracrRNA包含與SEQ ID NO:121具有至少90%序列一致性的核苷酸序列。
123. 如實施方式122的載體,其中該CRISPR重複序列與SEQ ID NO:111具有至少95%序列一致性,且該tracrRNA包含與SEQ ID NO:121具有至少95%序列一致性的核苷酸序列。
124. 如實施方式122的載體,其中該CRISPR重複序列與SEQ ID NO:111具有100%序列一致性,且該tracrRNA包含與SEQ ID NO:121具有100%序列一致性的核苷酸序列。
125. 如實施方式122-124中任一實施方式的載體,其中該載體進一步包含編碼該RGN多肽的多核苷酸,該RGN多肽包含與SEQ ID NO:2具有至少90%序列一致性的胺基酸序列。
126. 如實施方式125的載體,其中該RGN多肽包含與SEQ ID NO:2具有至少95%序列一致性的胺基酸序列。
127. 如實施方式125的載體,其中該RGN多肽包含與SEQ ID NO:2具有100%序列一致性的胺基酸序列。
128. 如實施方式115的載體,其中該crRNA包含與SEQ ID NO:112具有至少90%序列一致性的CRISPR重複序列,且該tracrRNA包含與SEQ ID NO:122具有至少90%序列一致性的核苷酸序列。
129. 如實施方式128的載體,其中該CRISPR重複序列與SEQ ID NO:112具有至少95%序列一致性,且該tracrRNA包含與SEQ ID NO:122具有至少95%序列一致性的核苷酸序列。
130. 如實施方式128的載體,其中該CRISPR重複序列與SEQ ID NO:112具有100%序列一致性,且該tracrRNA包含與SEQ ID NO:122具有100%序列一致性的核苷酸序列。
131. 如實施方式128-130中任一實施方式的載體,其中該載體進一步包含編碼該RGN多肽的多核苷酸,該RGN多肽包含與SEQ ID NO:3具有至少90%序列一致性的胺基酸序列。
132. 如實施方式131的載體,其中該RGN多肽包含與SEQ ID NO:3具有至少95%序列一致性的胺基酸序列。
133. 如實施方式131的載體,其中該RGN多肽包含與SEQ ID NO:3具有100%序列一致性的胺基酸序列。
134. 如實施方式115的載體,其中該crRNA包含與SEQ ID NO:113具有至少90%序列一致性的CRISPR重複序列,且該tracrRNA包含與SEQ ID NO:123具有至少90%序列一致性的核苷酸序列。
135. 如實施方式134的載體,其中該CRISPR重複序列與SEQ ID NO:113具有至少95%序列一致性,且該tracrRNA包含與SEQ ID NO:123具有至少95%序列一致性的核苷酸序列。
136. 如實施方式134的載體,其中該CRISPR重複序列與SEQ ID NO:113具有100%序列一致性,且該tracrRNA包含與SEQ ID NO:123具有100%序列一致性的核苷酸序列。
137. 如實施方式134-136中任一實施方式的載體,其中該載體進一步包含編碼該RGN多肽的多核苷酸,該RGN多肽包含與SEQ ID NO:4具有至少90%序列一致性的胺基酸序列。
138. 如實施方式137的載體,其中該RGN多肽包含與SEQ ID NO:4具有至少95%序列一致性的胺基酸序列。
139. 如實施方式137的載體,其中該RGN多肽包含與SEQ ID NO:4具有100%序列一致性的胺基酸序列。
140. 如實施方式115的載體,其中該crRNA包含與SEQ ID NO:114具有至少90%序列一致性的CRISPR重複序列,且該tracrRNA包含與SEQ ID NO:124具有至少90%序列一致性的核苷酸序列。
141. 如實施方式140的載體,其中該CRISPR重複序列與SEQ ID NO:114具有至少95%序列一致性,且該tracrRNA包含與SEQ ID NO:124具有至少95%序列一致性的核苷酸序列。
142. 如實施方式140的載體,其中該CRISPR重複序列與SEQ ID NO:114具有100%序列一致性,且該tracrRNA包含與SEQ ID NO:124具有100%序列一致性的核苷酸序列。
143. 如實施方式140-142中任一實施方式的載體,其中該載體進一步包含編碼該RGN多肽的多核苷酸,該RGN多肽包含與SEQ ID NO:5具有至少90%序列一致性的胺基酸序列。
144. 如實施方式143的載體,其中該RGN多肽包含與SEQ ID NO:5具有至少95%序列一致性的胺基酸序列。
145. 如實施方式143的載體,其中該RGN多肽包含與SEQ ID NO:5具有100%序列一致性的胺基酸序列。
146. 如實施方式115的載體,其中該crRNA包含與SEQ ID NO:115具有至少90%序列一致性的CRISPR重複序列,且該tracrRNA包含與SEQ ID NO:125具有至少90%序列一致性的核苷酸序列。
147. 如實施方式146的載體,其中該CRISPR重複序列與SEQ ID NO:115具有至少95%序列一致性,且該tracrRNA包含與SEQ ID NO:125具有至少95%序列一致性的核苷酸序列。
148. 如實施方式146的載體,其中該CRISPR重複序列與SEQ ID NO:115具有100%序列一致性,且該tracrRNA包含與SEQ ID NO:125具有100%序列一致性的核苷酸序列。
149. 如實施方式146-148中任一實施方式的載體,其中該載體進一步包含編碼該RGN多肽的多核苷酸,該RGN多肽包含與SEQ ID NO:6具有至少90%序列一致性的胺基酸序列。
150. 如實施方式149的載體,其中該RGN多肽包含與SEQ ID NO:6具有至少95%序列一致性的胺基酸序列。
151. 如實施方式149的載體,其中該RGN多肽包含與SEQ ID NO:6具有100%序列一致性的胺基酸序列。
152. 如實施方式115的載體,其中該crRNA包含與SEQ ID NO:117具有至少90%序列一致性的CRISPR重複序列,且該tracrRNA包含與SEQ ID NO:126具有至少90%序列一致性的核苷酸序列。
153. 如實施方式152的載體,其中該CRISPR重複序列與SEQ ID NO:117具有至少95%序列一致性,且該tracrRNA包含與SEQ ID NO:126具有至少95%序列一致性的核苷酸序列。
154. 如實施方式152的載體,其中該CRISPR重複序列與SEQ ID NO:117具有100%序列一致性,且該tracrRNA包含與SEQ ID NO:126具有100%序列一致性的核苷酸序列。
155. 如實施方式152-154中任一實施方式的載體,其中該載體進一步包含編碼該RGN多肽的多核苷酸,該RGN多肽包含與SEQ ID NO:16具有至少90%序列一致性的胺基酸序列。
156. 如實施方式155的載體,其中該RGN多肽包含與SEQ ID NO:16具有至少95%序列一致性的胺基酸序列。
157. 如實施方式155的載體,其中該RGN多肽包含與SEQ ID NO:16具有100%序列一致性的胺基酸序列。
158. 如實施方式115的載體,其中該crRNA包含與SEQ ID NO:118具有至少90%序列一致性的CRISPR重複序列,且該tracrRNA包含與SEQ ID NO:127具有至少90%序列一致性的核苷酸序列。
159. 如實施方式158的載體,其中該CRISPR重複序列與SEQ ID NO:118具有至少95%序列一致性,且該tracrRNA包含與SEQ ID NO:127具有至少95%序列一致性的核苷酸序列。
160. 如實施方式158的載體,其中該CRISPR重複序列與SEQ ID NO:118具有100%序列一致性,且該tracrRNA包含與SEQ ID NO:127具有100%序列一致性的核苷酸序列。
161. 如實施方式158-160中任一實施方式的載體,其中該載體進一步包含編碼該RGN多肽的多核苷酸,該RGN多肽包含與SEQ ID NO:13具有至少90%序列一致性的胺基酸序列。
162. 如實施方式161的載體,其中該RGN多肽包含與SEQ ID NO:13具有至少95%序列一致性的胺基酸序列。
163. 如實施方式161的載體,其中該RGN多肽包含與SEQ ID NO:13具有100%序列一致性的胺基酸序列。
164. 如實施方式115的載體,其中該crRNA包含與SEQ ID NO:119具有至少90%序列一致性的CRISPR重複序列,且該tracrRNA包含與SEQ ID NO:128具有至少90%序列一致性的核苷酸序列。
165. 如實施方式164的載體,其中該CRISPR重複序列與SEQ ID NO:119具有至少95%序列一致性,且該tracrRNA包含與SEQ ID NO:128具有至少95%序列一致性的核苷酸序列。
166. 如實施方式164的載體,其中該CRISPR重複序列與SEQ ID NO:119具有100%序列一致性,且該tracrRNA包含與SEQ ID NO:128具有100%序列一致性的核苷酸序列。
167. 如實施方式164-166中任一實施方式的載體,其中該載體進一步包含編碼該RGN多肽的多核苷酸,該RGN多肽包含與SEQ ID NO:16具有至少90%序列一致性的胺基酸序列。
168. 如實施方式167的載體,其中該RGN多肽包含與SEQ ID NO:16具有至少95%序列一致性的胺基酸序列。
169. 如實施方式167的載體,其中該RGN多肽包含與SEQ ID NO:16具有100%序列一致性的胺基酸序列。
170. 如實施方式115-169中任一實施方式的載體,其中編碼該crRNA的該多核苷酸及編碼該tracrRNA的該多核苷酸可操作地聯結至同一個啟動子,且被編碼為單導引RNA。
171. 如實施方式115-169中任一實施方式的載體,其中編碼該crRNA的該多核苷酸及編碼該tracrRNA的該多核苷酸可操作地聯結至各別啟動子。
172. 一種用於結合DNA分子之標的DNA序列的系統,該系統包含: a)能夠與該標的DNA序列雜合的一或更多導引RNA,或包含編碼該一或更多導引RNA(gRNA)的一或更多核苷酸序列的一或更多多核苷酸;及 b)包含與SEQ ID NO:1至109中任一者具有至少90%序列一致性的胺基酸序列的RNA導引之核酸酶(RGN)多肽,或包含編碼該RGN多肽的核苷酸序列的多核苷酸; 其中編碼該一或更多導引RNA的至少一個該核苷酸序列及編碼該RGN多肽的該核苷酸序列可操作地聯結至與該核苷酸序列異源的啟動子;且 其中該一或更多導引RNA能夠與該RGN多肽形成複合物,以便將該RGN多肽導向至與該DNA分子之該標的DNA序列結合。
173. 一種用於結合DNA分子之標的DNA序列的系統,該系統包含: a)能夠與該標的DNA序列雜合的一或更多導引RNA,或包含編碼該一或更多導引RNA(gRNA)的一或更多核苷酸序列的一或更多多核苷酸;及 b)包含與SEQ ID NO:1至109中任一者具有至少90%序列一致性的胺基酸序列的RNA導引之核酸酶(RGN)多肽; 其中該一或更多導引RNA能夠與該標的DNA序列雜合,且 其中該一或更多導引RNA能夠與該RGN多肽形成複合物,以便將該RGN多肽導向至與該DNA分子之該標的DNA序列結合。
174. 如實施方式173的系統,其中編碼該一或更多導引RNA的至少一個該核苷酸序列可操作地聯結至與該核苷酸序列異源的啟動子。
175. 如實施方式172-174中任一實施方式的系統,其中該RGN多肽包含與SEQ ID NO:1至109中任一者具有至少95%序列一致性的胺基酸序列。
176. 如實施方式172-174中任一實施方式的系統,其中該RGN多肽包含與SEQ ID NO:1至109中任一者具有100%序列一致性的胺基酸序列。
177. 如實施方式172-176中任一實施方式的系統,其中未發現該RGN多肽與該一或更多導引RNA在本質上彼此複合。
178. 如實施方式172-177中任一實施方式的系統,其中該標的DNA序列為真核標的DNA序列。
179. 如實施方式172-178中任一實施方式的系統,其中該RGN多肽包含與SEQ ID NO:11具有至少90%序列一致性的胺基酸序列且該一或更多導引RNA包含CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:116具有至少90%序列一致性的CRISPR重複序列。
180. 如實施方式172-178中任一實施方式的系統,其中該RGN多肽包含與SEQ ID NO:11具有至少95%序列一致性的胺基酸序列且該一或更多導引RNA包含CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:116具有至少95%序列一致性的CRISPR重複序列。
181. 如實施方式172-178中任一實施方式的系統,其中該RGN多肽包含與SEQ ID NO:11具有100%序列一致性的胺基酸序列且該一或更多導引RNA包含CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:116具有100%序列一致性的CRISPR重複序列。
182. 如實施方式172-181中任一實施方式的系統,其中該一或更多導引RNA包含tracrRNA。
183. 如實施方式182的系統,其中該tracrRNA選自以下者組成之群組: a)與SEQ ID NO:120具有至少90%序列一致性的tracrRNA,其中該一或更多導引RNA進一步包含CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:110具有至少90%序列一致性的CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:1具有至少90%序列一致性的胺基酸序列; b)與SEQ ID NO:121具有至少90%序列一致性的tracrRNA,其中該一或更多導引RNA進一步包含CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:111具有至少90%序列一致性的CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:2具有至少90%序列一致性的胺基酸序列; c)與SEQ ID NO:122具有至少90%序列一致性的tracrRNA,其中該一或更多導引RNA進一步包含CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:112具有至少90%序列一致性的CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:3具有至少90%序列一致性的胺基酸序列; d)與SEQ ID NO:123具有至少90%序列一致性的tracrRNA,其中該一或更多導引RNA進一步包含CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:113具有至少90%序列一致性的CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:4具有至少90%序列一致性的胺基酸序列; e)與SEQ ID NO:124具有至少90%序列一致性的tracrRNA,其中該一或更多導引RNA進一步包含CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:114具有至少90%序列一致性的CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:5具有至少90%序列一致性的胺基酸序列; f)與SEQ ID NO:125具有至少90%序列一致性的tracrRNA,其中該一或更多導引RNA進一步包含CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:115具有至少90%序列一致性的CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:6具有至少90%序列一致性的胺基酸序列; g)與SEQ ID NO:126具有至少90%序列一致性的tracrRNA,其中該一或更多導引RNA進一步包含CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:117具有至少90%序列一致性的CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:12具有至少90%序列一致性的胺基酸序列; h)與SEQ ID NO:127具有至少90%序列一致性的tracrRNA,其中該一或更多導引RNA進一步包含CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:118具有至少90%序列一致性的CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:13具有至少90%序列一致性的胺基酸序列;及 i)與SEQ ID NO:128具有至少90%序列一致性的tracrRNA,其中該一或更多導引RNA進一步包含CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:119具有至少90%序列一致性的CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:16具有至少90%序列一致性的胺基酸序列。
184. 如實施方式182的系統,其中該tracrRNA選自以下者組成之群組: a)與SEQ ID NO:120具有至少95%序列一致性的tracrRNA,其中該一或更多導引RNA進一步包含CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:110具有至少95%序列一致性的CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:1具有至少95%序列一致性的胺基酸序列; b)與SEQ ID NO:121具有至少95%序列一致性的tracrRNA,其中該一或更多導引RNA進一步包含CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:111具有至少95%序列一致性的CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:2具有至少95%序列一致性的胺基酸序列; c)與SEQ ID NO:122具有至少95%序列一致性的tracrRNA,其中該一或更多導引RNA進一步包含CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:112具有至少95%序列一致性的CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:3具有至少95%序列一致性的胺基酸序列; d)與SEQ ID NO:123具有至少95%序列一致性的tracrRNA,其中該一或更多導引RNA進一步包含CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:113具有至少95%序列一致性的CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:4具有至少95%序列一致性的胺基酸序列; e)與SEQ ID NO:124具有至少95%序列一致性的tracrRNA,其中該一或更多導引RNA進一步包含CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:114具有至少95%序列一致性的CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:5具有至少95%序列一致性的胺基酸序列; f)與SEQ ID NO:125具有至少95%序列一致性的tracrRNA,其中該一或更多導引RNA進一步包含CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:115具有至少95%序列一致性的CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:6具有至少95%序列一致性的胺基酸序列; g)與SEQ ID NO:126具有至少95%序列一致性的tracrRNA,其中該一或更多導引RNA進一步包含CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:117具有至少95%序列一致性的CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:12具有至少95%序列一致性的胺基酸序列; h)與SEQ ID NO:127具有至少95%序列一致性的tracrRNA,其中該一或更多導引RNA進一步包含CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:118具有至少95%序列一致性的CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:13具有至少95%序列一致性的胺基酸序列;及 i)與SEQ ID NO:128具有至少95%序列一致性的tracrRNA,其中該一或更多導引RNA進一步包含CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:119具有至少95%序列一致性的CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:16具有至少95%序列一致性的胺基酸序列。
185. 如實施方式182的系統,其中該tracrRNA選自以下者組成之群組: a)與SEQ ID NO:120具有100%序列一致性的tracrRNA,其中該一或更多導引RNA進一步包含CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:110具有100%序列一致性的CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:1具有100%序列一致性的胺基酸序列; b)與SEQ ID NO:121具有100%序列一致性的tracrRNA,其中該一或更多導引RNA進一步包含CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:111具有100%序列一致性的CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:2具有100%序列一致性的胺基酸序列; c)與SEQ ID NO:122具有100%序列一致性的tracrRNA,其中該一或更多導引RNA進一步包含CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:112具有100%序列一致性的CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:3具有100%序列一致性的胺基酸序列; d)與SEQ ID NO:123具有100%序列一致性的tracrRNA,其中該一或更多導引RNA進一步包含CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:113具有100%序列一致性的CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:4具有100%序列一致性的胺基酸序列; e)與SEQ ID NO:124具有100%序列一致性的tracrRNA,其中該一或更多導引RNA進一步包含CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:114具有100%序列一致性的CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:5具有100%序列一致性的胺基酸序列; f)與SEQ ID NO:125具有100%序列一致性的tracrRNA,其中該一或更多導引RNA進一步包含CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:115具有100%序列一致性的CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:6具有100%序列一致性的胺基酸序列; g)與SEQ ID NO:126具有100%序列一致性的tracrRNA,其中該一或更多導引RNA進一步包含CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:117具有100%序列一致性的CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:12具有100%序列一致性的胺基酸序列; h)與SEQ ID NO:127具有100%序列一致性的tracrRNA,其中該一或更多導引RNA進一步包含CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:118具有100%序列一致性的CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:13具有100%序列一致性的胺基酸序列;及 i)與SEQ ID NO:128具有100%序列一致性的tracrRNA,其中該一或更多導引RNA進一步包含CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:119具有100%序列一致性的CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:16具有100%序列一致性的胺基酸序列。
186. 如實施方式182-185中任一實施方式的系統,其中該一或更多導引RNA為單導引RNA(sgRNA)。
187. 如實施方式182-185中任一實施方式的系統,其中該一或更多導引RNA為雙導引RNA。
188. 如實施方式172-187中任一實施方式的系統,其中該系統進一步包含至少一個RGN輔助蛋白或包含編碼同者的核苷酸序列的多核苷酸,該同者選自以下者組成之群組: a)與SEQ ID NO:178-181中任一者具有至少90%序列一致性的至少一個RGN輔助蛋白,其中該RGN多肽包含與SEQ ID NO:11具有至少90%序列一致性的胺基酸序列; b)與SEQ ID NO:182-184中任一者具有至少90%序列一致性的至少一個RGN輔助蛋白,其中該RGN多肽包含與SEQ ID NO:12具有至少90%序列一致性的胺基酸序列; c)與SEQ ID NO:185-187中任一者具有至少90%序列一致性的至少一個RGN輔助蛋白,其中該RGN多肽包含與SEQ ID NO:13具有至少90%序列一致性的胺基酸序列; d)與SEQ ID NO:191具有至少90%序列一致性的RGN輔助蛋白,其中該RGN多肽包含與SEQ ID NO:14具有至少90%序列一致性的胺基酸序列; e)與SEQ ID NO:192具有至少90%序列一致性的RGN輔助蛋白,其中該RGN多肽包含與SEQ ID NO:15具有至少90%序列一致性的胺基酸序列;及 f)與SEQ ID NO:188-190中任一者具有至少90%序列一致性的至少一個RGN輔助蛋白,其中該RGN多肽包含與SEQ ID NO:16具有至少90%序列一致性的胺基酸序列。
189. 如實施方式188的系統,其中該至少一個RGN輔助蛋白選自以下者組成之群組: a)與SEQ ID NO:178-181中任一者具有至少95%序列一致性的至少一個RGN輔助蛋白,其中該RGN多肽包含與SEQ ID NO:11具有至少95%序列一致性的胺基酸序列; b)與SEQ ID NO:182-184中任一者具有至少95%序列一致性的至少一個RGN輔助蛋白,其中該RGN多肽包含與SEQ ID NO:12具有至少95%序列一致性的胺基酸序列; c)與SEQ ID NO:185-187中任一者具有至少95%序列一致性的至少一個RGN輔助蛋白,其中該RGN多肽包含與SEQ ID NO:13具有至少95%序列一致性的胺基酸序列; d)與SEQ ID NO:191具有至少95%序列一致性的RGN輔助蛋白,其中該RGN多肽包含與SEQ ID NO:14具有至少95%序列一致性的胺基酸序列; e)與SEQ ID NO:192具有至少95%序列一致性的RGN輔助蛋白,其中該RGN多肽包含與SEQ ID NO:15具有至少95%序列一致性的胺基酸序列;及 f)與SEQ ID NO:188-190中任一者具有至少95%序列一致性的至少一個RGN輔助蛋白,其中該RGN多肽包含與SEQ ID NO:16具有至少95%序列一致性的胺基酸序列。
190. 如實施方式188的系統,其中該至少一個RGN輔助蛋白選自以下者組成之群組: a)與SEQ ID NO:178-181中任一者具有100%序列一致性的至少一個RGN輔助蛋白,其中該RGN多肽包含與SEQ ID NO:11具有100%序列一致性的胺基酸序列; b)與SEQ ID NO:182-184中任一者具有100%序列一致性的至少一個RGN輔助蛋白,其中該RGN多肽包含與SEQ ID NO:12具有100%序列一致性的胺基酸序列; c)與SEQ ID NO:185-187中任一者具有100%序列一致性的至少一個RGN輔助蛋白,其中該RGN多肽包含與SEQ ID NO:13具有100%序列一致性的胺基酸序列; d)與SEQ ID NO:191具有100%序列一致性的RGN輔助蛋白,其中該RGN多肽包含與SEQ ID NO:14具有100%序列一致性的胺基酸序列; e)與SEQ ID NO:192具有100%序列一致性的RGN輔助蛋白,其中該RGN多肽包含與SEQ ID NO:15具有100%序列一致性的胺基酸序列;及 f)與SEQ ID NO:188-190中任一者具有100%序列一致性的至少一個RGN輔助蛋白,其中該RGN多肽包含與SEQ ID NO:16具有100%序列一致性的胺基酸序列。
191. 如實施方式172-190中任一實施方式的系統,其中該標的DNA序列位於細胞內。
192. 如實施方式191的系統,其中該細胞為真核細胞。
193. 如實施方式192的系統,其中該真核細胞為植物細胞。
194. 如實施方式192的系統,其中該真核細胞為哺乳動物細胞。
195. 如實施方式194的系統,其中該哺乳動物細胞為人類細胞。
196. 如實施方式195的系統,其中該人類細胞為免疫細胞。
197. 如實施方式196的系統,其中該人類細胞為幹細胞。
198. 如實施方式197的系統,其中該幹細胞為經誘導之多能幹細胞。
199. 如實施方式192的系統,其中該真核細胞為昆蟲細胞。
200. 如實施方式191的系統,其中該細胞為原核細胞。
201. 如實施方式172-200中任一實施方式的系統,其中該標的DNA序列位於為單股的該DNA分子的一區域內。
202. 如實施方式201的系統,其中當被轉錄時,該一或更多導引RNA能夠與該標的DNA序列雜合,且該導引RNA能夠與該RGN多肽形成複合物,以導向該標的DNA序列的剪切。
203. 如實施方式172-200中任一實施方式的系統,其中該標的DNA序列位於為雙股的該DNA分子的一區域內。
204. 如實施方式203的系統,其中當被轉錄時,該一或更多導引RNA能夠與該標的DNA序列雜合,且該導引RNA能夠與該RGN多肽形成複合物,以導向該標的DNA序列的剪切。
205. 如實施方式204的系統,其中該RGN多肽能夠產生雙股斷裂。
206. 如實施方式204的系統,其中該RGN多肽能夠產生單股斷裂。
207. 如實施方式172-206中任一實施方式的系統,其中該RGN多肽可操作地聯結至鹼基編輯多肽。
208. 如實施方式207的系統,其中該鹼基編輯多肽為脫胺酶。
209. 如實施方式172-208中任一實施方式的系統,其中該標的DNA序列與原型間隔體相鄰模體(PAM)相鄰地被安置。
210. 如實施方式172-209中任一實施方式的系統,其中該PGN多肽包含一或更多核定位訊號。
211. 如實施方式172-210中任一實施方式的系統,其中該RGN多肽針對於真核細胞中之表現而被密碼子最佳化。
212. 如實施方式172-211中任一實施方式的系統,其中包含編碼一或更多導引RNA的核苷酸序列的多核苷酸及包含編碼RGN多肽的核苷酸序列的多核苷酸被安置於一個載體上。
213. 如實施方式172-212中任一實施方式的系統,其中該系統進一步包含一或更多供體多核苷酸或包含編碼該一或更多供體多核苷酸的一或更多核苷酸序列的一或更多多核苷酸。
214. 一種醫藥組合物,包含實施方式1-14、50-52、及111-113中任一實施方式的核酸分子、實施方式15-28、53-110、及114-171中任一實施方式的載體、實施方式29的細胞、實施方式37-49中任一實施方式的分離的RGN多肽、或實施方式172-213中任一實施方式的系統及醫藥學上可接受之載劑。
215. 一種結合DNA分子之標的DNA序列的方法,包含將根據實施方式172-213中任一實施方式的系統遞送至該標的DNA序列或包含該標的DNA序列的細胞。
216. 如實施方式215的方法,其中該RGN多肽或該導引RNA進一步包含可檢測示蹤物,從而允許對該標的DNA序列的檢測。
217. 如實施方式215的方法,其中該導引RNA或該RGN多肽進一步包含表現調控子,從而調控該標的DNA序列的或受該標的DNA序列的轉錄控制的基因的表現。
218. 一種剪切DNA分子之標的DNA序列的方法,包含將根據實施方式172-213中任一實施方式的系統遞送至該標的DNA序列或包含該標的DNA序列的細胞。
219. 如實施方式218的方法,其中該經修飾的標的DNA序列包含異源DNA於該標的DNA序列內的插入。
220. 如實施方式218的方法,其中該經修飾的標的DNA序列包含至少一個核苷酸自該標的DNA序列的刪除。
221. 如實施方式218的方法,其中該經修飾的標的DNA序列包含該標的DNA序列中的至少一個核苷酸的突變。
222. 一種用於結合DNA分子之標的DNA序列的方法,該方法包含: a)在適合形成RGN核糖核苷酸複合物的條件下,藉由組合以下者,以在體外組裝RNA導引之核酸酶(RGN)核糖核苷酸複合物: i)能夠與該標的DNA序列雜合的一或更多導引RNA;及 ii)RGN多肽,該RGN多肽包含與SEQ ID NO:1-109中任一者具有至少90%序列一致性的胺基酸序列;及 b)使該標的DNA序列或包含該標的DNA序列的細胞與該在體外組裝的RGN核糖核苷酸複合物接觸; 其中該一或更多導引RNA與該標的DNA序列雜合,從而將該RGN多肽導向至與該標的DNA序列結合。
223. 如實施方式222的方法,其中該標的DNA序列位於為單股的該DNA分子的一區域內。
224. 如實施方式222的方法,其中該標的DNA序列位於為雙股的該DNA分子的一區域內。
225. 如實施方式222-224中任一實施方式的方法, 其中該標的DNA序列與原型間隔體相鄰模體(PAM)相鄰地被安置。
226. 如實施方式222-225中任一實施方式的方法, 其中該RGN多肽或該導引RNA進一步包含可檢測示蹤物,從而允許對該標的DNA序列的檢測。
227. 如實施方式222-225中任一實施方式的方法, 其中該導引RNA或該RGN多肽進一步包含表現調控子,從而允許對該標的DNA序列的表現的調控。
228. 一種用於剪切及/或修飾DNA分子之標的DNA序列的方法,包含使該DNA分子與以下者接觸: a)RNA導引之核酸酶(RGN)多肽,其中該RGN包含與SEQ ID NO:1至109中任一者具有至少90%序列一致性的胺基酸序列;及 b)能夠將(a)的RGN靶向至該標的DNA序列的一或更多導引RNA; 其中該一或更多導引RNA與該標的DNA序列雜合,從而將該RGN多肽導向至與該標的DNA序列結合,並且發生該標的DNA序列的剪切及/或修飾。
229. 如實施方式228的方法,其中該標的DNA序列位於為單股的該DNA分子的一區域內。
230. 如實施方式228的方法,其中該標的DNA序列位於為雙股的該DNA分子的一區域內。
231. 如實施方式230的方法,其中藉由該RGN多肽之剪切產生雙股斷裂。
232. 如實施方式230的方法,其中藉由該RGN多肽之剪切產生單股斷裂。
233. 如實施方式228-232中任一實施方式的方法,其中該RGN多肽可操作地聯結至鹼基編輯多肽。
234. 如實施方式233的方法,其中該鹼基編輯多肽包括脫胺酶。
235. 如實施方式228-234中任一實施方式的方法,其中該標的DNA序列與原型間隔體相鄰模體(PAM)相鄰地被安置。
236. 如實施方式228-235中任一實施方式的方法,其中該經修飾的標的DNA序列包含異源DNA於該標的DNA序列內的插入。
237. 如實施方式228-235中任一實施方式的方法,其中該經修飾的標的DNA序列包含至少一個核苷酸自該標的DNA序列的刪除。
238. 如實施方式228-235中任一實施方式的方法,其中該經修飾的標的DNA序列包含該標的DNA序列中的至少一個核苷酸的突變。
239. 如實施方式222-238中任一實施方式的方法,其中該RGN包含與SEQ ID NO:1至109中任一者具有至少95%序列一致性的胺基酸序列。
240. 如實施方式222-238中任一實施方式的方法,其中該RGN包含與SEQ ID NO:1至109中任一者具有100%序列一致性的胺基酸序列。
241. 如實施方式222-240中任一實施方式的方法,其中未發現該RGN多肽與該一或更多導引RNA在本質上彼此複合。
242. 如實施方式222-241中任一實施方式的方法,其中該標的DNA序列為真核標的DNA序列。
243. 如實施方式222-242中任一實施方式的方法,其中該RGN多肽包含與SEQ ID NO:11具有至少90%序列一致性的胺基酸序列且該一或更多導引RNA包含CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:116具有至少90%序列一致性的CRISPR重複序列。
244. 如實施方式222-242中任一實施方式的方法,其中該RGN多肽包含與SEQ ID NO:11具有至少95%序列一致性的胺基酸序列且該一或更多導引RNA包含CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:116具有至少95%序列一致性的CRISPR重複序列。
245. 如實施方式222-242中任一實施方式的方法,其中該RGN多肽包含與SEQ ID NO:11具有100%序列一致性的胺基酸序列且該一或更多導引RNA包含CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:116具有100%序列一致性的CRISPR重複序列。
246. 如實施方式222-242中任一實施方式的方法,其中該一或更多導引RNA包含tracrRNA。
247. 如實施方式246的方法,其中該tracrRNA選自以下者組成之群組: a)與SEQ ID NO:120具有至少90%序列一致性的tracrRNA,其中該一或更多導引RNA進一步包含CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:110具有至少90%序列一致性的CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:1具有至少90%序列一致性的胺基酸序列; b)與SEQ ID NO:121具有至少90%序列一致性的tracrRNA,其中該一或更多導引RNA進一步包含CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:111具有至少90%序列一致性的CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:2具有至少90%序列一致性的胺基酸序列; c)與SEQ ID NO:122具有至少90%序列一致性的tracrRNA,其中該一或更多導引RNA進一步包含CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:112具有至少90%序列一致性的CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:3具有至少90%序列一致性的胺基酸序列; d)與SEQ ID NO:123具有至少90%序列一致性的tracrRNA,其中該一或更多導引RNA進一步包含CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:113具有至少90%序列一致性的CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:4具有至少90%序列一致性的胺基酸序列; e)與SEQ ID NO:124具有至少90%序列一致性的tracrRNA,其中該一或更多導引RNA進一步包含CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:114具有至少90%序列一致性的CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:5具有至少90%序列一致性的胺基酸序列; f)與SEQ ID NO:125具有至少90%序列一致性的tracrRNA,其中該一或更多導引RNA進一步包含CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:115具有至少90%序列一致性的CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:6具有至少90%序列一致性的胺基酸序列; g)與SEQ ID NO:126具有至少90%序列一致性的tracrRNA,其中該一或更多導引RNA進一步包含CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:117具有至少90%序列一致性的CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:12具有至少90%序列一致性的胺基酸序列; h)與SEQ ID NO:127具有至少90%序列一致性的tracrRNA,其中該一或更多導引RNA進一步包含CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:118具有至少90%序列一致性的CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:13具有至少90%序列一致性的胺基酸序列;及 i)與SEQ ID NO:128具有至少90%序列一致性的tracrRNA,其中該一或更多導引RNA進一步包含CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:119具有至少90%序列一致性的CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:16具有至少90%序列一致性的胺基酸序列。
248. 如實施方式246的方法,其中該tracrRNA選自以下者組成之群組: a)與SEQ ID NO:120具有至少95%序列一致性的tracrRNA,其中該一或更多導引RNA進一步包含CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:110具有至少95%序列一致性的CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:1具有至少95%序列一致性的胺基酸序列; b)與SEQ ID NO:121具有至少95%序列一致性的tracrRNA,其中該一或更多導引RNA進一步包含CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:111具有至少95%序列一致性的CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:2具有至少95%序列一致性的胺基酸序列; c)與SEQ ID NO:122具有至少95%序列一致性的tracrRNA,其中該一或更多導引RNA進一步包含CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:112具有至少95%序列一致性的CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:3具有至少95%序列一致性的胺基酸序列; d)與SEQ ID NO:123具有至少95%序列一致性的tracrRNA,其中該一或更多導引RNA進一步包含CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:113具有至少95%序列一致性的CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:4具有至少95%序列一致性的胺基酸序列; e)與SEQ ID NO:124具有至少95%序列一致性的tracrRNA,其中該一或更多導引RNA進一步包含CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:114具有至少95%序列一致性的CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:5具有至少95%序列一致性的胺基酸序列; f)與SEQ ID NO:125具有至少95%序列一致性的tracrRNA,其中該一或更多導引RNA進一步包含CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:115具有至少95%序列一致性的CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:6具有至少95%序列一致性的胺基酸序列; g)與SEQ ID NO:126具有至少95%序列一致性的tracrRNA,其中該一或更多導引RNA進一步包含CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:117具有至少95%序列一致性的CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:12具有至少95%序列一致性的胺基酸序列; h)與SEQ ID NO:127具有至少95%序列一致性的tracrRNA,其中該一或更多導引RNA進一步包含CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:118具有至少95%序列一致性的CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:13具有至少95%序列一致性的胺基酸序列;及 i)與SEQ ID NO:128具有至少95%序列一致性的tracrRNA,其中該一或更多導引RNA進一步包含CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:119具有至少95%序列一致性的CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:16具有至少95%序列一致性的胺基酸序列。
249. 如實施方式246的方法,其中該tracrRNA選自以下者組成之群組: a)與SEQ ID NO:120具有100%序列一致性的tracrRNA,其中該一或更多導引RNA進一步包含CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:110具有100%序列一致性的CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:1具有100%序列一致性的胺基酸序列; b)與SEQ ID NO:121具有100%序列一致性的tracrRNA,其中該一或更多導引RNA進一步包含CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:111具有100%序列一致性的CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:2具有100%序列一致性的胺基酸序列; c)與SEQ ID NO:122具有100%序列一致性的tracrRNA,其中該一或更多導引RNA進一步包含CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:112具有100%序列一致性的CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:3具有100%序列一致性的胺基酸序列; d)與SEQ ID NO:123具有100%序列一致性的tracrRNA,其中該一或更多導引RNA進一步包含CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:113具有100%序列一致性的CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:4具有100%序列一致性的胺基酸序列; e)與SEQ ID NO:124具有100%序列一致性的tracrRNA,其中該一或更多導引RNA進一步包含CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:114具有100%序列一致性的CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:5具有100%序列一致性的胺基酸序列; f)與SEQ ID NO:125具有100%序列一致性的tracrRNA,其中該一或更多導引RNA進一步包含CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:115具有100%序列一致性的CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:6具有100%序列一致性的胺基酸序列; g)與SEQ ID NO:126具有100%序列一致性的tracrRNA,其中該一或更多導引RNA進一步包含CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:117具有100%序列一致性的CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:12具有100%序列一致性的胺基酸序列; h)與SEQ ID NO:127具有100%序列一致性的tracrRNA,其中該一或更多導引RNA進一步包含CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:118具有100%序列一致性的CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:13具有100%序列一致性的胺基酸序列;及 i)與SEQ ID NO:128具有100%序列一致性的tracrRNA,其中該一或更多導引RNA進一步包含CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:119具有100%序列一致性的CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:16具有100%序列一致性的胺基酸序列。
250. 如實施方式246-249中任一實施方式的方法,其中該一或更多導引RNA為單導引RNA(sgRNA)。
251. 如實施方式246-249中任一實施方式的方法,其中該一或更多導引RNA為雙導引RNA。
252. 如實施方式222-251中任一實施方式的方法,其中該方法進一步包含使DNA分子與選自以下者組成之群組的一或更多RGN輔助蛋白接觸: a)與SEQ ID NO:178-181中任一者具有至少90%序列一致性的至少一個RGN輔助蛋白,其中該RGN多肽包含與SEQ ID NO:11具有至少90%序列一致性的胺基酸序列; b)與SEQ ID NO:182-184中任一者具有至少90%序列一致性的至少一個RGN輔助蛋白,其中該RGN多肽包含與SEQ ID NO:12具有至少90%序列一致性的胺基酸序列; c)與SEQ ID NO:185-187中任一者具有至少90%序列一致性的至少一個RGN輔助蛋白,其中該RGN多肽包含與SEQ ID NO:13具有至少90%序列一致性的胺基酸序列; d)與SEQ ID NO:191具有至少90%序列一致性的RGN輔助蛋白,其中該RGN多肽包含與SEQ ID NO:14具有至少90%序列一致性的胺基酸序列; e)與SEQ ID NO:192具有至少90%序列一致性的RGN輔助蛋白,其中該RGN多肽包含與SEQ ID NO:15具有至少90%序列一致性的胺基酸序列;及 f)與SEQ ID NO:188-190中任一者具有至少90%序列一致性的至少一個RGN輔助蛋白,其中該RGN多肽包含與SEQ ID NO:16具有至少90%序列一致性的胺基酸序列。
253. 如實施方式252的方法,其中該一或更多RGN輔助蛋白選自以下者組成之群組: a)與SEQ ID NO:178-181中任一者具有至少95%序列一致性的至少一個RGN輔助蛋白,其中該RGN多肽包含與SEQ ID NO:11具有至少95%序列一致性的胺基酸序列; b)與SEQ ID NO:182-184中任一者具有至少95%序列一致性的至少一個RGN輔助蛋白,其中該RGN多肽包含與SEQ ID NO:12具有至少95%序列一致性的胺基酸序列; c)與SEQ ID NO:185-187中任一者具有至少95%序列一致性的至少一個RGN輔助蛋白,其中該RGN多肽包含與SEQ ID NO:13具有至少95%序列一致性的胺基酸序列; d)與SEQ ID NO:191具有至少95%序列一致性的RGN輔助蛋白,其中該RGN多肽包含與SEQ ID NO:14具有至少95%序列一致性的胺基酸序列; e)與SEQ ID NO:192具有至少95%序列一致性的RGN輔助蛋白,其中該RGN多肽包含與SEQ ID NO:15具有至少95%序列一致性的胺基酸序列;及 f)與SEQ ID NO:188-190中任一者具有至少95%序列一致性的至少一個RGN輔助蛋白,其中該RGN多肽包含與SEQ ID NO:16具有至少95%序列一致性的胺基酸序列。
254. 如實施方式252的方法,其中該一或更多RGN輔助蛋白選自以下者組成之群組: a)與SEQ ID NO:178-181中任一者具有100%序列一致性的至少一個RGN輔助蛋白,其中該RGN多肽包含與SEQ ID NO:11具有100%序列一致性的胺基酸序列; b)與SEQ ID NO:182-184中任一者具有100%序列一致性的至少一個RGN輔助蛋白,其中該RGN多肽包含與SEQ ID NO:12具有100%序列一致性的胺基酸序列; c)與SEQ ID NO:185-187中任一者具有100%序列一致性的至少一個RGN輔助蛋白,其中該RGN多肽包含與SEQ ID NO:13具有100%序列一致性的胺基酸序列; d)與SEQ ID NO:191具有100%序列一致性的RGN輔助蛋白,其中該RGN多肽包含與SEQ ID NO:14具有100%序列一致性的胺基酸序列; e)與SEQ ID NO:192具有100%序列一致性的RGN輔助蛋白,其中該RGN多肽包含與SEQ ID NO:15具有100%序列一致性的胺基酸序列;及 f)與SEQ ID NO:188-190中任一者具有100%序列一致性的至少一個RGN輔助蛋白,其中該RGN多肽包含與SEQ ID NO:16具有100%序列一致性的胺基酸序列。
255. 如實施方式215-254中任一實施方式的方法,其中該標的DNA序列位於細胞內。
256. 如實施方式255的方法,其中該細胞為真核細胞。
257. 如實施方式256的方法,其中該真核細胞為植物細胞。
258. 如實施方式256的方法,其中該真核細胞為哺乳動物細胞。
259. 如實施方式258的方法,其中該哺乳動物細胞為人類細胞。
260. 如實施方式259的方法,其中該人類細胞為免疫細胞。
261. 如實施方式260的方法,其中該人類細胞為幹細胞。
262. 如實施方式261的方法,其中該幹細胞為經誘導之多能幹細胞。
263. 如實施方式256的方法,其中該真核細胞為昆蟲細胞。
264. 如實施方式255的方法,其中該細胞為原核細胞。
265. 一種根據實施方式228-254中任一實施方式的方法包含經修飾的標的DNA序列的細胞。
266. 如實施方式265的細胞,其中該細胞為真核細胞。
267. 如實施方式266的細胞,其中該真核細胞為植物細胞。
268. 一種包含實施方式267的細胞的植物。
269. 一種包含實施方式267的細胞的種子。
270. 如實施方式266的細胞,其中該真核細胞為哺乳動物細胞。
271. 如實施方式270的細胞,其中該哺乳動物細胞為人類細胞。
272. 如實施方式271的細胞,其中該人類細胞為免疫細胞。
273. 如實施方式272的細胞,其中該人類細胞為幹細胞。
274. 如實施方式273的細胞,其中該幹細胞為經誘導之多能幹細胞。
275. 如實施方式266的細胞,其中該真核細胞為昆蟲細胞。
276. 如實施方式265的細胞,其中該細胞為原核細胞。
277. 一種包含實施方式266及270-274中任一實施方式的細胞的醫藥組合物及醫藥學上可接受之載劑。
278. 一種用於檢測樣本中的DNA分子的標的DNA序列的套組,該套組包含: a)包含與SEQ ID NO:1-109中任一者具有至少90%序列一致性的胺基酸序列的RNA導引之核酸酶(RGN)多肽或包含編碼該RGN多肽的核苷酸序列的多核苷酸,其中當與能夠與該標的DNA序列雜合的導引RNA結合時,該RGN多肽能夠以RNA導引之序列專一性方式結合及剪切DNA分子的該標的DNA序列; b)該導引RNA或包含編碼該導引RNA的核苷酸序列的多核苷酸;及 c)不與導引RNA雜合的檢測單股DNA(ssDNA)。
279. 如實施方式278的套組,其中該RGN多肽包含與SEQ ID NO:1至109中任一者具有至少95%序列一致性的胺基酸序列。
280. 如實施方式278的套組,其中該RGN多肽包含與SEQ ID NO:1至109中任一者具有100%序列一致性的胺基酸序列。
281. 如實施方式278-280中任一實施方式的套組,其中編碼該導引RNA的至少一個該核苷酸序列及編碼該RGN多肽的該核苷酸序列可操作地聯結至與該核苷酸序列異源的啟動子。
282. 如實施方式278-281中任一實施方式的套組,其中未發現該RGN多肽與該一或更多導引RNA在本質上彼此複合。
283. 如實施方式278-282中任一實施方式的套組,其中該標的DNA序列為真核標的DNA序列。
284. 如實施方式278-283中任一實施方式的套組,其中該檢測ssDNA包含螢光團/淬滅劑對。
285. 如實施方式278-283中任一實施方式的套組,其中該檢測ssDNA包含螢光共振能量轉移(FRET)對。
286. 如實施方式278-285中任一實施方式的套組,其中該套組進一步包含選自以下者組成之群組的至少一個RGN輔助蛋白: a)與SEQ ID NO:178-181中任一者具有至少90%序列一致性的至少一個RGN輔助蛋白,其中該RGN多肽包含與SEQ ID NO:11具有至少90%序列一致性的胺基酸序列; b)與SEQ ID NO:182-184中任一者具有至少90%序列一致性的至少一個RGN輔助蛋白,其中該RGN多肽包含與SEQ ID NO:12具有至少90%序列一致性的胺基酸序列; c)與SEQ ID NO:185-187中任一者具有至少90%序列一致性的至少一個RGN輔助蛋白,其中該RGN多肽包含與SEQ ID NO:13具有至少90%序列一致性的胺基酸序列; d)與SEQ ID NO:191具有至少90%序列一致性的RGN輔助蛋白,其中該RGN多肽包含與SEQ ID NO:14具有至少90%序列一致性的胺基酸序列; e)與SEQ ID NO:192具有至少90%序列一致性的RGN輔助蛋白,其中該RGN多肽包含與SEQ ID NO:15具有至少90%序列一致性的胺基酸序列;及 f)與SEQ ID NO:188-190中任一者具有至少90%序列一致性的至少一個RGN輔助蛋白,其中該RGN多肽包含與SEQ ID NO:16具有至少90%序列一致性的胺基酸序列。
287. 如實施方式286的套組,其中該至少一個RGN輔助蛋白選自以下者組成之群組: a)與SEQ ID NO:178-181中任一者具有至少95%序列一致性的至少一個RGN輔助蛋白,其中該RGN多肽包含與SEQ ID NO:11具有至少95%序列一致性的胺基酸序列; b)與SEQ ID NO:182-184中任一者具有至少95%序列一致性的至少一個RGN輔助蛋白,其中該RGN多肽包含與SEQ ID NO:12具有至少95%序列一致性的胺基酸序列; c)與SEQ ID NO:185-187中任一者具有至少95%序列一致性的至少一個RGN輔助蛋白,其中該RGN多肽包含與SEQ ID NO:13具有至少95%序列一致性的胺基酸序列; d)與SEQ ID NO:191具有至少95%序列一致性的RGN輔助蛋白,其中該RGN多肽包含與SEQ ID NO:14具有至少95%序列一致性的胺基酸序列; e)與SEQ ID NO:192具有至少95%序列一致性的RGN輔助蛋白,其中該RGN多肽包含與SEQ ID NO:15具有至少95%序列一致性的胺基酸序列;及 f)與SEQ ID NO:188-190中任一者具有至少95%序列一致性的至少一個RGN輔助蛋白,其中該RGN多肽包含與SEQ ID NO:16具有至少95%序列一致性的胺基酸序列。
288. 如實施方式286的套組,其中該至少一個RGN輔助蛋白選自以下者組成之群組: a)與SEQ ID NO:178-181中任一者具有100%序列一致性的至少一個RGN輔助蛋白,其中該RGN多肽包含與SEQ ID NO:11具有100%序列一致性的胺基酸序列; b)與SEQ ID NO:182-184中任一者具有100%序列一致性的至少一個RGN輔助蛋白,其中該RGN多肽包含與SEQ ID NO:12具有100%序列一致性的胺基酸序列; c)與SEQ ID NO:185-187中任一者具有100%序列一致性的至少一個RGN輔助蛋白,其中該RGN多肽包含與SEQ ID NO:13具有100%序列一致性的胺基酸序列; d)與SEQ ID NO:191具有100%序列一致性的RGN輔助蛋白,其中該RGN多肽包含與SEQ ID NO:14具有100%序列一致性的胺基酸序列; e)與SEQ ID NO:192具有100%序列一致性的RGN輔助蛋白,其中該RGN多肽包含與SEQ ID NO:15具有100%序列一致性的胺基酸序列;及 f)與SEQ ID NO:188-190中任一者具有100%序列一致性的至少一個RGN輔助蛋白,其中該RGN多肽包含與SEQ ID NO:16具有100%序列一致性的胺基酸序列。
289. 如實施方式278-288中任一實施方式的套組,其中該RGN多肽包含與SEQ ID NO:11具有至少90%序列一致性的胺基酸序列,且該一或更多導引RNA包含CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:116具有至少90%序列一致性的CRISPR重複序列。
290. 如實施方式278-288中任一實施方式的套組,其中該RGN多肽包含與SEQ ID NO:11具有至少95%序列一致性的胺基酸序列,且該一或更多導引RNA包含CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:116具有至少95%序列一致性的CRISPR重複序列。
291. 如實施方式278-288中任一實施方式的套組,其中該RGN多肽包含與SEQ ID NO:11具有100%序列一致性的胺基酸序列,且該一或更多導引RNA包含CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:116具有100%序列一致性的CRISPR重複序列。
292. 如實施方式278-288中任一實施方式的套組,其中該一或更多導引gRNA包含tracrRNA。
293. 如實施方式292的套組,其中該tracrRNA選自以下者組成之群組: a)與SEQ ID NO:120具有至少90%序列一致性的tracrRNA,其中該一或更多導引RNA進一步包含CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:110具有至少90%序列一致性的CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:1具有至少90%序列一致性的胺基酸序列; b)與SEQ ID NO:121具有至少90%序列一致性的tracrRNA,其中該一或更多導引RNA進一步包含CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:111具有至少90%序列一致性的CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:2具有至少90%序列一致性的胺基酸序列; c)與SEQ ID NO:122具有至少90%序列一致性的tracrRNA,其中該一或更多導引RNA進一步包含CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:112具有至少90%序列一致性的CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:3具有至少90%序列一致性的胺基酸序列; d)與SEQ ID NO:123具有至少90%序列一致性的tracrRNA,其中該一或更多導引RNA進一步包含CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:113具有至少90%序列一致性的CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:4具有至少90%序列一致性的胺基酸序列; e)與SEQ ID NO:124具有至少90%序列一致性的tracrRNA,其中該一或更多導引RNA進一步包含CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:114具有至少90%序列一致性的CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:5具有至少90%序列一致性的胺基酸序列; f)與SEQ ID NO:125具有至少90%序列一致性的tracrRNA,其中該一或更多導引RNA進一步包含CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:115具有至少90%序列一致性的CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:6具有至少90%序列一致性的胺基酸序列; g)與SEQ ID NO:126具有至少90%序列一致性的tracrRNA,其中該一或更多導引RNA進一步包含CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:117具有至少90%序列一致性的CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:12具有至少90%序列一致性的胺基酸序列; h)與SEQ ID NO:127具有至少90%序列一致性的tracrRNA,其中該一或更多導引RNA進一步包含CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:118具有至少90%序列一致性的CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:13具有至少90%序列一致性的胺基酸序列;及 i)與SEQ ID NO:128具有至少90%序列一致性的tracrRNA,其中該一或更多導引RNA進一步包含CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:119具有至少90%序列一致性的CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:16具有至少90%序列一致性的胺基酸序列。
294. 如實施方式292的套組,其中該tracrRNA選自以下者組成之群組: a)與SEQ ID NO:120具有至少95%序列一致性的tracrRNA,其中該一或更多導引RNA進一步包含CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:110具有至少95%序列一致性的CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:1具有至少95%序列一致性的胺基酸序列; b)與SEQ ID NO:121具有至少95%序列一致性的tracrRNA,其中該一或更多導引RNA進一步包含CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:111具有至少95%序列一致性的CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:2具有至少95%序列一致性的胺基酸序列; c)與SEQ ID NO:122具有至少95%序列一致性的tracrRNA,其中該一或更多導引RNA進一步包含CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:112具有至少95%序列一致性的CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:3具有至少95%序列一致性的胺基酸序列; d)與SEQ ID NO:123具有至少95%序列一致性的tracrRNA,其中該一或更多導引RNA進一步包含CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:113具有至少95%序列一致性的CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:4具有至少95%序列一致性的胺基酸序列; e)與SEQ ID NO:124具有至少95%序列一致性的tracrRNA,其中該一或更多導引RNA進一步包含CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:114具有至少95%序列一致性的CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:5具有至少95%序列一致性的胺基酸序列; f)與SEQ ID NO:125具有至少95%序列一致性的tracrRNA,其中該一或更多導引RNA進一步包含CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:115具有至少95%序列一致性的CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:6具有至少95%序列一致性的胺基酸序列; g)與SEQ ID NO:126具有至少95%序列一致性的tracrRNA,其中該一或更多導引RNA進一步包含CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:117具有至少95%序列一致性的CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:12具有至少95%序列一致性的胺基酸序列; h)與SEQ ID NO:127具有至少95%序列一致性的tracrRNA,其中該一或更多導引RNA進一步包含CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:118具有至少95%序列一致性的CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:13具有至少95%序列一致性的胺基酸序列;及 i)與SEQ ID NO:128具有至少95%序列一致性的tracrRNA,其中該一或更多導引RNA進一步包含CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:119具有至少95%序列一致性的CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:16具有至少95%序列一致性的胺基酸序列。
295. 如實施方式292的套組,其中該tracrRNA選自以下者組成之群組: a)與SEQ ID NO:120具有100%序列一致性的tracrRNA,其中該一或更多導引RNA進一步包含CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:110具有100%序列一致性的CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:1具有100%序列一致性的胺基酸序列; b)與SEQ ID NO:121具有100%序列一致性的tracrRNA,其中該一或更多導引RNA進一步包含CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:111具有100%序列一致性的CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:2具有100%序列一致性的胺基酸序列; c)與SEQ ID NO:122具有100%序列一致性的tracrRNA,其中該一或更多導引RNA進一步包含CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:112具有100%序列一致性的CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:3具有100%序列一致性的胺基酸序列; d)與SEQ ID NO:123具有100%序列一致性的tracrRNA,其中該一或更多導引RNA進一步包含CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:113具有100%序列一致性的CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:4具有100%序列一致性的胺基酸序列; e)與SEQ ID NO:124具有100%序列一致性的tracrRNA,其中該一或更多導引RNA進一步包含CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:114具有100%序列一致性的CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:5具有100%序列一致性的胺基酸序列; f)與SEQ ID NO:125具有100%序列一致性的tracrRNA,其中該一或更多導引RNA進一步包含CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:115具有100%序列一致性的CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:6具有100%序列一致性的胺基酸序列; g)與SEQ ID NO:126具有100%序列一致性的tracrRNA,其中該一或更多導引RNA進一步包含CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:117具有100%序列一致性的CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:12具有100%序列一致性的胺基酸序列; h)與SEQ ID NO:127具有100%序列一致性的tracrRNA,其中該一或更多導引RNA進一步包含CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:118具有100%序列一致性的CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:13具有100%序列一致性的胺基酸序列;及 i)與SEQ ID NO:128具有100%序列一致性的tracrRNA,其中該一或更多導引RNA進一步包含CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:119具有100%序列一致性的CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:16具有100%序列一致性的胺基酸序列。
296. 如實施方式292-295中任一實施方式的套組,其中該一或更多導引RNA為單導引RNA。
297. 如實施方式292-295中任一實施方式的套組,其中該一或更多導引RNA為雙導引RNA。
298. 如實施方式278-297中任一實施方式的套組,其中該標的DNA序列位於為單股的該DNA分子的一區域內。
299. 如實施方式278-297中任一實施方式的套組,其中該標的DNA序列位於為雙股的該DNA分子的一區域內。
300. 如實施方式299的套組,其中藉由該RGN多肽之剪切產生雙股斷裂。
301. 如實施方式299的套組,其中藉由該RGN多肽之剪切產生單股斷裂。
302. 如實施方式278-301中任一實施方式的套組,其中該標的DNA序列與原型間隔體相鄰模體(PAM)相鄰地被安置。
303. 一種檢測樣本中的DNA分子的標的DNA序列的方法,該方法包含: a)使樣本接觸: i)包含與SEQ ID NO:1-109中任一者具有至少90%序列一致性的胺基酸序列的RNA導引之核酸酶(RGN)多肽,其中當與能夠與該標的DNA序列雜合的導引RNA結合時,該RGN多肽能夠以RNA導引之序列專一性方式結合及剪切DNA分子的該標的DNA序列; ii)該導引RNA;及 iii)不與導引RNA雜合的檢測單股DNA(ssDNA);及 b)量測藉由RGN剪切檢測ssDNA產生的可檢測訊號,從而量測標的DNA序列。
304. 如實施方式303的方法,其中該RGN多肽包含與SEQ ID NO:1至109中任一者具有至少95%序列一致性的胺基酸序列。
305. 如實施方式303的方法,其中該RGN多肽包含與SEQ ID NO:1至109中任一者具有100%序列一致性的胺基酸序列。
306. 如實施方式303-305中任一實施方式的方法,其中該樣本包含來自細胞溶胞產物的DNA分子。
307. 如實施方式303-305中任一實施方式的方法,其中該樣本包含細胞。
308. 如實施方式307的方法,其中該細胞為真核細胞。
309. 如實施方式303-305中任一實施方式的方法,其中包含標的DNA序列的DNA分子藉由存在於包含RNA的樣本中的RNA模板分子的逆轉錄產生。
310. 如實施方式309的方法,其中該RNA模板分子為RNA病毒。
311. 如實施方式310的方法,其中該RNA病毒為冠狀病毒。
312. 如實施方式311的方法,其中該冠狀病毒為bat SARS類冠狀病毒、SARS-CoV或SARS-CoV-2。
313. 如實施方式309-312中任一實施方式的方法,其中包括RNA的樣本為自包含細胞的樣本取得的。
314. 如實施方式303-313中任一實施方式的方法,其中該檢測ssDNA包含螢光團/淬滅劑對。
315. 如實施方式303-313中任一實施方式的方法,其中該檢測ssDNA包括螢光共振能量轉移(FRET)對。
316. 如實施方式303-315中任一實施方式的方法,其中該方法進一步包含於步驟a)的接觸之前或與步驟a)的接觸一起擴增樣本中的核酸。
317. 如實施方式303-316中任一實施方式的方法,其中該方法進一步包含使樣本與選自以下者組成之群組的一或更多RGN輔助蛋白接觸: a)與SEQ ID NO:178-181中任一者具有至少90%序列一致性的至少一個RGN輔助蛋白,其中該RGN多肽包含與SEQ ID NO:11具有至少90%序列一致性的胺基酸序列; b)與SEQ ID NO:182-184中任一者具有至少90%序列一致性的至少一個RGN輔助蛋白,其中該RGN多肽包含與SEQ ID NO:12具有至少90%序列一致性的胺基酸序列; c)與SEQ ID NO:185-187中任一者具有至少90%序列一致性的至少一個RGN輔助蛋白,其中該RGN多肽包含與SEQ ID NO:13具有至少90%序列一致性的胺基酸序列; d)與SEQ ID NO:191具有至少90%序列一致性的RGN輔助蛋白,其中該RGN多肽包含與SEQ ID NO:14具有至少90%序列一致性的胺基酸序列; e)與SEQ ID NO:192具有至少90%序列一致性的RGN輔助蛋白,其中該RGN多肽包含與SEQ ID NO:15具有至少90%序列一致性的胺基酸序列;及 f)與SEQ ID NO:188-190中任一者具有至少90%序列一致性的至少一個RGN輔助蛋白,其中該RGN多肽包含與SEQ ID NO:16具有至少90%序列一致性的胺基酸序列。
318. 如實施方式317的方法,其中該一或更多RGN輔助蛋白選自以下者組成之群組: a)與SEQ ID NO:178-181中任一者具有至少95%序列一致性的至少一個RGN輔助蛋白,其中該RGN多肽包含與SEQ ID NO:11具有至少95%序列一致性的胺基酸序列; b)與SEQ ID NO:182-184中任一者具有至少95%序列一致性的至少一個RGN輔助蛋白,其中該RGN多肽包含與SEQ ID NO:12具有至少95%序列一致性的胺基酸序列; c)與SEQ ID NO:185-187中任一者具有至少95%序列一致性的至少一個RGN輔助蛋白,其中該RGN多肽包含與SEQ ID NO:13具有至少95%序列一致性的胺基酸序列; d)與SEQ ID NO:191具有至少95%序列一致性的RGN輔助蛋白,其中該RGN多肽包含與SEQ ID NO:14具有至少95%序列一致性的胺基酸序列; e)與SEQ ID NO:192具有至少95%序列一致性的RGN輔助蛋白,其中該RGN多肽包含與SEQ ID NO:15具有至少95%序列一致性的胺基酸序列;及 f)與SEQ ID NO:188-190中任一者具有至少95%序列一致性的至少一個RGN輔助蛋白,其中該RGN多肽包含與SEQ ID NO:16具有至少95%序列一致性的胺基酸序列。
319. 如實施方式317的方法,其中該一或更多RGN輔助蛋白選自以下者組成之群組: a)與SEQ ID NO:178-181中任一者具有100%序列一致性的至少一個RGN輔助蛋白,其中該RGN多肽包含與SEQ ID NO:11具有100%序列一致性的胺基酸序列; b)與SEQ ID NO:182-184中任一者具有100%序列一致性的至少一個RGN輔助蛋白,其中該RGN多肽包含與SEQ ID NO:12具有100%序列一致性的胺基酸序列; c)與SEQ ID NO:185-187中任一者具有100%序列一致性的至少一個RGN輔助蛋白,其中該RGN多肽包含與SEQ ID NO:13具有100%序列一致性的胺基酸序列; d)與SEQ ID NO:191具有100%序列一致性的RGN輔助蛋白,其中該RGN多肽包含與SEQ ID NO:14具有100%序列一致性的胺基酸序列; e)與SEQ ID NO:192具有100%序列一致性的RGN輔助蛋白,其中該RGN多肽包含與SEQ ID NO:15具有100%序列一致性的胺基酸序列;及 f)與SEQ ID NO:188-190中任一者具有100%序列一致性的至少一個RGN輔助蛋白,其中該RGN多肽包含與SEQ ID NO:16具有100%序列一致性的胺基酸序列。
320. 一種剪切單股DNA(ssDNA)的方法,該方法包含使核酸族群與以下者接觸,其中該族群包含DNA分子,該DNA分子包含標的DNA序列及複數個非標的ssDNA: a)包含與SEQ ID NO:1-109中任一者具有至少90%序列一致性的胺基酸序列的RNA導引之核酸酶(RGN)多肽,其中當與能夠與該標的DNA序列雜合的導引RNA結合時,該RGN多肽能夠以RNA導引之序列專一性方式結合及剪切該標的DNA序列;以及 b)該導引RNA; 其中該RGN多肽剪切該複數個的非標的ssDNA。
321. 如實施方式320的方法,其中該RGN多肽包含與SEQ ID NO:1至109中任一者具有至少95%序列一致性的胺基酸序列。
322. 如實施方式320的方法,其中該RGN多肽包含與SEQ ID NO:1至109中任一者具有100%序列一致性的胺基酸序列。
323. 如實施方式320-322中任一實施方式的方法,其中該核酸族群在細胞溶胞產物內。
324. 如實施方式320-323中任一實施方式的方法,其中包含標的DNA序列的DNA分子藉由RNA模板分子的逆轉錄產生。
325. 如實施方式320-324中任一實施方式的方法,其中該方法進一步包含使族群與選自以下者組成之群組的一或更多RGN輔助蛋白接觸: a)與SEQ ID NO:178-181中任一者具有至少90%序列一致性的至少一個RGN輔助蛋白,其中該RGN多肽包含與SEQ ID NO:11具有至少90%序列一致性的胺基酸序列; b)與SEQ ID NO:182-184中任一者具有至少90%序列一致性的至少一個RGN輔助蛋白,其中該RGN多肽包含與SEQ ID NO:12具有至少90%序列一致性的胺基酸序列; c)與SEQ ID NO:185-187中任一者具有至少90%序列一致性的至少一個RGN輔助蛋白,其中該RGN多肽包含與SEQ ID NO:13具有至少90%序列一致性的胺基酸序列; d)與SEQ ID NO:191具有至少90%序列一致性的RGN輔助蛋白,其中該RGN多肽包含與SEQ ID NO:14具有至少90%序列一致性的胺基酸序列; e)與SEQ ID NO:192具有至少90%序列一致性的RGN輔助蛋白,其中該RGN多肽包含與SEQ ID NO:15具有至少90%序列一致性的胺基酸序列;及 f)與SEQ ID NO:188-190中任一者具有至少90%序列一致性的至少一個RGN輔助蛋白,其中該RGN多肽包含與SEQ ID NO:16具有至少90%序列一致性的胺基酸序列。
326. 如實施方式325的方法,其中該一或更多RGN輔助蛋白選自以下者組成之群組: a)與SEQ ID NO:178-181中任一者具有至少95%序列一致性的至少一個RGN輔助蛋白,其中該RGN多肽包含與SEQ ID NO:11具有至少95%序列一致性的胺基酸序列; b)與SEQ ID NO:182-184中任一者具有至少95%序列一致性的至少一個RGN輔助蛋白,其中該RGN多肽包含與SEQ ID NO:12具有至少95%序列一致性的胺基酸序列; c)與SEQ ID NO:185-187中任一者具有至少95%序列一致性的至少一個RGN輔助蛋白,其中該RGN多肽包含與SEQ ID NO:13具有至少95%序列一致性的胺基酸序列; d)與SEQ ID NO:191具有至少95%序列一致性的RGN輔助蛋白,其中該RGN多肽包含與SEQ ID NO:14具有至少95%序列一致性的胺基酸序列; e)與SEQ ID NO:192具有至少95%序列一致性的RGN輔助蛋白,其中該RGN多肽包含與SEQ ID NO:15具有至少95%序列一致性的胺基酸序列;及 f)與SEQ ID NO:188-190中任一者具有至少95%序列一致性的至少一個RGN輔助蛋白,其中該RGN多肽包含與SEQ ID NO:16具有至少95%序列一致性的胺基酸序列。
327. 如實施方式325的方法,其中該一或更多RGN輔助蛋白選自以下者組成之群組: a)與SEQ ID NO:178-181中任一者具有100%序列一致性的至少一個RGN輔助蛋白,其中該RGN多肽包含與SEQ ID NO:11具有100%序列一致性的胺基酸序列; b)與SEQ ID NO:182-184中任一者具有100%序列一致性的至少一個RGN輔助蛋白,其中該RGN多肽包含與SEQ ID NO:12具有100%序列一致性的胺基酸序列; c)與SEQ ID NO:185-187中任一者具有100%序列一致性的至少一個RGN輔助蛋白,其中該RGN多肽包含與SEQ ID NO:13具有100%序列一致性的胺基酸序列; d)與SEQ ID NO:191具有100%序列一致性的RGN輔助蛋白,其中該RGN多肽包含與SEQ ID NO:14具有100%序列一致性的胺基酸序列; e)與SEQ ID NO:192具有100%序列一致性的RGN輔助蛋白,其中該RGN多肽包含與SEQ ID NO:15具有100%序列一致性的胺基酸序列;及 f)與SEQ ID NO:188-190中任一者具有100%序列一致性的至少一個RGN輔助蛋白,其中該RGN多肽包含與SEQ ID NO:16具有100%序列一致性的胺基酸序列。
328. 如實施方式303-327中任一實施方式的方法,其中未發現該RGN多肽與該導引RNA在本質上彼此複合。
329. 如實施方式303-328中任一實施方式的方法,其中該標的DNA序列為真核標的DNA序列。
330. 如實施方式303-329中任一實施方式的方法,其中該RGN多肽包含與SEQ ID NO:11具有至少90%序列一致性的胺基酸序列且該導引RNA包含CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:116具有至少90%序列一致性的CRISPR重複序列。
331. 如實施方式303-329中任一實施方式的方法,其中該RGN多肽包含與SEQ ID NO:11具有至少95%序列一致性的胺基酸序列且該導引RNA包含CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:116具有至少95%序列一致性的CRISPR重複序列。
332. 如實施方式303-329中任一實施方式的方法,其中該RGN多肽包含與SEQ ID NO:11具有100%序列一致性的胺基酸序列且該導引RNA包含CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:116具有100%序列一致性的CRISPR重複序列。
333. 如實施方式303-329中任一實施方式的方法,其中該導引RNA包含tracrRNA。
334. 如實施方式333的方法,其中該tracrRNA選自以下者組成之群組: a)與SEQ ID NO:120具有至少90%序列一致性的tracrRNA,其中該導引RNA進一步包含CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:110具有至少90%序列一致性的CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:1具有至少90%序列一致性的胺基酸序列; b)與SEQ ID NO:121具有至少90%序列一致性的tracrRNA,其中該導引RNA進一步包含CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:111具有至少90%序列一致性的CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:2具有至少90%序列一致性的胺基酸序列; c)與SEQ ID NO:122具有至少90%序列一致性的tracrRNA,其中該導引RNA進一步包含CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:112具有至少90%序列一致性的CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:3具有至少90%序列一致性的胺基酸序列; d)與SEQ ID NO:123具有至少90%序列一致性的tracrRNA,其中該導引RNA進一步包含CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:113具有至少90%序列一致性的CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:4具有至少90%序列一致性的胺基酸序列; e)與SEQ ID NO:124具有至少90%序列一致性的tracrRNA,其中該導引RNA進一步包含CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:114具有至少90%序列一致性的CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:5具有至少90%序列一致性的胺基酸序列; f)與SEQ ID NO:125具有至少90%序列一致性的tracrRNA,其中該導引RNA進一步包含CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:115具有至少90%序列一致性的CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:6具有至少90%序列一致性的胺基酸序列; g)與SEQ ID NO:126具有至少90%序列一致性的tracrRNA,其中該導引RNA進一步包含CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:117具有至少90%序列一致性的CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:12具有至少90%序列一致性的胺基酸序列; h)與SEQ ID NO:127具有至少90%序列一致性的tracrRNA,其中該導引RNA進一步包含CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:118具有至少90%序列一致性的CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:13具有至少90%序列一致性的胺基酸序列;及 i)與SEQ ID NO:128具有至少90%序列一致性的tracrRNA,其中該導引RNA進一步包含CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:119具有至少90%序列一致性的CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:16具有至少90%序列一致性的胺基酸序列。
335. 如實施方式333的方法,其中該tracrRNA選自以下者組成之群組: a)與SEQ ID NO:120具有至少95%序列一致性的tracrRNA,其中該導引RNA進一步包含CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:110具有至少95%序列一致性的CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:1具有至少95%序列一致性的胺基酸序列; b)與SEQ ID NO:121具有至少95%序列一致性的tracrRNA,其中該導引RNA進一步包含CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:111具有至少95%序列一致性的CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:2具有至少95%序列一致性的胺基酸序列; c)與SEQ ID NO:122具有至少95%序列一致性的tracrRNA,其中該導引RNA進一步包含CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:112具有至少95%序列一致性的CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:3具有至少95%序列一致性的胺基酸序列; d)與SEQ ID NO:123具有至少95%序列一致性的tracrRNA,其中該導引RNA進一步包含CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:113具有至少95%序列一致性的CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:4具有至少95%序列一致性的胺基酸序列; e)與SEQ ID NO:124具有至少95%序列一致性的tracrRNA,其中該導引RNA進一步包含CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:114具有至少95%序列一致性的CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:5具有至少95%序列一致性的胺基酸序列; f)與SEQ ID NO:125具有至少95%序列一致性的tracrRNA,其中該導引RNA進一步包含CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:115具有至少95%序列一致性的CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:6具有至少95%序列一致性的胺基酸序列; g)與SEQ ID NO:126具有至少95%序列一致性的tracrRNA,其中該導引RNA進一步包含CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:117具有至少95%序列一致性的CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:12具有至少95%序列一致性的胺基酸序列; h)與SEQ ID NO:127具有至少95%序列一致性的tracrRNA,其中該導引RNA進一步包含CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:118具有至少95%序列一致性的CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:13具有至少95%序列一致性的胺基酸序列;及 i)與SEQ ID NO:128具有至少95%序列一致性的tracrRNA,其中該導引RNA進一步包含CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:119具有至少95%序列一致性的CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:16具有至少95%序列一致性的胺基酸序列。
336. 如實施方式333的方法,其中該tracrRNA選自以下者組成之群組: a)與SEQ ID NO:120具有100%序列一致性的tracrRNA,其中該導引RNA進一步包含CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:110具有100%序列一致性的CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:1具有100%序列一致性的胺基酸序列; b)與SEQ ID NO:121具有100%序列一致性的tracrRNA,其中該導引RNA進一步包含CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:111具有100%序列一致性的CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:2具有100%序列一致性的胺基酸序列; c)與SEQ ID NO:122具有100%序列一致性的tracrRNA,其中該導引RNA進一步包含CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:112具有100%序列一致性的CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:3具有100%序列一致性的胺基酸序列; d)與SEQ ID NO:123具有100%序列一致性的tracrRNA,其中該導引RNA進一步包含CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:113具有100%序列一致性的CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:4具有100%序列一致性的胺基酸序列; e)與SEQ ID NO:124具有100%序列一致性的tracrRNA,其中該導引RNA進一步包含CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:114具有100%序列一致性的CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:5具有100%序列一致性的胺基酸序列; f)與SEQ ID NO:125具有100%序列一致性的tracrRNA,其中該導引RNA進一步包含CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:115具有100%序列一致性的CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:6具有100%序列一致性的胺基酸序列; g)與SEQ ID NO:126具有100%序列一致性的tracrRNA,其中該導引RNA進一步包含CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:117具有100%序列一致性的CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:12具有100%序列一致性的胺基酸序列; h)與SEQ ID NO:127具有100%序列一致性的tracrRNA,其中該導引RNA進一步包含CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:118具有100%序列一致性的CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:13具有100%序列一致性的胺基酸序列;及 i)與SEQ ID NO:128具有100%序列一致性的tracrRNA,其中該導引RNA進一步包含CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:119具有100%序列一致性的CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:16具有100%序列一致性的胺基酸序列。
337. 如實施方式333-336中任一實施方式的方法,其中該導引RNA為單導引RNA(sgRNA)。
338. 如實施方式333-336中任一實施方式的方法,其中該導引RNA為雙導引RNA。
339. 如實施方式303-338中任一實施方式的方法,其中該標的DNA序列位於為單股的該DNA分子的一區域內。
340. 如實施方式303-338中任一實施方式的方法,其中該標的DNA序列位於為雙股的該DNA分子的一區域內。
341. 如實施方式340的方法,其中該標的DNA序列藉由該RGN多肽的剪切產生雙股斷裂。
342. 如實施方式340的方法,其中該標的DNA序列藉由該RGN多肽的剪切產生單股斷裂。
343. 如實施方式303-342中任一實施方式的方法,其中該標的DNA序列與原型間隔體相鄰模體(PAM)相鄰地被安置。
344. 一種利用針對基因遺傳性疾病的因果突變(causal mutation)的校正來產生基因修飾細胞的方法,該方法包含將以下者引入該細胞內: a)RNA導引之核酸酶(RGN)多肽或編碼該RGN多肽的多核苷酸,其中該RGN多肽包含與SEQ ID NO:1至109中任一者具有至少90%序列一致性的胺基酸序列,其中編碼該RGN多肽的該多核苷酸可操作地聯結至啟動子,以賦能該RGN多肽在該細胞中的表現;及 b)導引RNA(gRNA)或編碼該gRNA的多核苷酸,其中該gRNA包含CRISPR重複序列,該CRISPR重複序列包含與SEQ ID NO:110至119中任一者具有至少90%序列一致性的核苷酸序列,其中編碼該gRNA的該多核苷酸可操作地聯結至啟動子,以賦能該gRNA在該細胞中的表現, 藉以,該RGN和gRNA靶向該因果突變的基因組位址且修飾該基因組序列以除去該因果突變。
345. 如實施方式344的方法,其中該RGN多肽包含與SEQ ID NO:1至109中任一者具有至少95%序列一致性的胺基酸序列,且該CRISPR重複序列包含與SEQ ID NO:110至119中任一者具有至少95%序列一致性的核苷酸序列。
346. 如實施方式344的方法,其中該RGN多肽包含與SEQ ID NO:1至109中任一者具有至少100%序列一致性的胺基酸序列,且該CRISPR重複序列包含與SEQ ID NO:110至119中任一者具有至少100%序列一致性的核苷酸序列。
347. 如實施方式344-346中任一實施方式的方法,其中該RGN可操作地聯結至鹼基編輯多肽。
348. 如實施方式347的方法,其中該鹼基編輯多肽為脫氨酶。
349. 如實施方式344-348中任一實施方式的方法,其中該細胞為動物細胞。
350. 如實施方式344-348中任一實施方式的方法,其中該細胞為哺乳動物細胞。
351. 如實施方式349的方法,其中該細胞為從狗、貓、小鼠、大鼠、兔、馬、牛、豬或人取得的。
352. 如實施方式349的方法,其中該基因遺傳性疾病是單核苷酸多型性引起的。
353. 如實施方式351的方法,其中該基因遺傳性疾病為賀勒氏(Hurler)症候群。
354. 如實施方式353的方法,其中該gRNA進一步包含靶向靠近該因果單核苷酸多型性的區域的間隔體序列。
355. 一種利用引起疾病的不穩定基因組區域中的刪除來產生基因修飾細胞的方法,該方法包含將以下者引入該細胞內: a)RNA導引之核酸酶(RGN)多肽或編碼該RGN多肽的多核苷酸,其中該RGN多肽包含與SEQ ID NO:1至109中任一者具有至少90%序列一致性的胺基酸序列,其中編碼該RGN多肽的該多核苷酸可操作地聯結至啟動子,以賦能該RGN多肽在該細胞中的表現;以及 b)第一導引RNA(gRNA)或編碼該第一gRNA的多核苷酸,其中該第一gRNA包含CRISPR重複序列,該CRISPR重複序列包含與SEQ ID NO:110至119中任一者具有至少90%序列一致性的核苷酸序列,其中編碼該第一gRNA的該多核苷酸可操作地聯結至啟動子,以賦能該第一gRNA在該細胞中的表現,且進一步地其中該第一gRNA包含靶向該不穩定基因組區域的5'側翼的間隔體序列;及 c)第二導引RNA(gRNA)或編碼該第二gRNA的多核苷酸,其中該第二gRNA包含CRISPR重複序列,該CRISPR重複序列包含與SEQ ID NO:110至119中任一者具有至少90%序列一致性的核苷酸序列,其中編碼該第二gRNA的該多核苷酸可操作地聯結至啟動子,以賦能該第二gRNA在該細胞中的表現,並且進一步地其中該第二gRNA包含靶向該不穩定基因組區域的3'側翼的間隔體序列; 藉以,該RGN及該第一及第二gRNA靶向該不穩定基因組區域,並且該不穩定基因組區域的至少一部分被除去。
356. 如實施方式355的方法,其中該RGN多肽包含與SEQ ID NO:1至109中任一者具有至少95%序列一致性的胺基酸序列,且該第一gRNA及該第二gRNA的該CRISPR重複序列包含與SEQ ID NO:110至119中任一者具有至少95%序列一致性的核苷酸序列。
357. 如實施方式355的方法,其中該RGN多肽包含與SEQ ID NO:1至109中任一者具有100%序列一致性的胺基酸序列,且該第一gRNA及該第二gRNA的該CRISPR重複序列包含與SEQ ID NO:110至119中任一者具有100%序列一致性的核苷酸序列。
358. 如實施方式355-357中任一實施方式的方法,其中該細胞為動物細胞。
359. 如實施方式355-357中任一實施方式的方法,其中該細胞為哺乳動物細胞。
360. 如實施方式359的方法,其中該細胞是從狗、貓、小鼠、大鼠、兔、馬、牛、豬或人取得的。
361. 如實施方式358的方法,其中該基因遺傳性疾病為弗里德里希共濟失調(Friedrich’s Ataxia)或亨汀頓氏舞蹈症。
362. 如實施方式358的方法,其中該第一gRNA的間隔體序列進一步靶向該不穩定基因組區域內的或靠近該不穩定基因組區域的區域。
363. 如實施方式362的方法,其中該第二gRNA的間隔體序列進一步靶向該不穩定基因組區域內的或靠近該不穩定基因組區域的區域。
364. 一種用於產生具有降低的BCL11A mRNA和蛋白質表現的基因修飾的哺乳動物造血祖細胞的方法,該方法包含將以下者引入分離的人造血祖細胞內: a)RNA導引之核酸酶(RGN)多肽或編碼該RGN多肽的多核苷酸,其中該RGN多肽包含與SEQ ID NO:1-109中任一者具有至少90%序列一致性的胺基酸序列,其中編碼該RGN多肽的該多核苷酸可操作地聯結至啟動子,以賦能該RGN多肽在該細胞中的表現;及 b)導引RNA(gRNA)或編碼該gRNA的多核苷酸,其中該gRNA包含CRISPR重複序列,該CRISPR重複序列包括與SEQ ID NO:110-119中任一者具有至少90%序列一致性的核苷酸序列,其中編碼該gRNA的該多核苷酸可操作地聯結至啟動子,以賦能該gRNA在該細胞中的表現, 藉以,該RGN和gRNA在細胞中表現並在BCL11A增強子區域處剪切,導致該人造血祖細胞的基因修飾且降低BCL11A的mRNA及/或蛋白質表現。
365. 如實施方式364的方法,其中該RGN多肽包含與SEQ ID NO:1至109中任一者具有至少95%序列一致性的胺基酸序列,且該CRISPR重複序列包含與SEQ ID NO:110至119中任一者具有至少95%序列一致性的核苷酸序列。
366. 如實施方式344的方法,其中該RGN多肽包含與SEQ ID NO:1至109中任一者具有100%序列一致性的胺基酸序列,且該CRISPR重複序列包含與SEQ ID NO:110至119中任一者具有100%序列一致性的核苷酸序列。
367. 如實施方式364-366中任一實施方式的方法,其中該gRNA進一步包含靶向位於該BCL11A增強子區域內的或靠近該BCL11A增強子區域的區域的間隔體序列。
368. 如實施方式344-367中任一實施方式的方法,其中該導引RNA、第一導引RNA、及第二導引RNA包含tracrRNA。
369. 如實施方式368的方法,其中該tracrRNA包含與SEQ ID NO:120至128中任一者具有至少90%序列一致性的核苷酸序列。
370. 如實施方式368的方法,其中該tracrRNA包含與SEQ ID NO:120至128中任一者具有至少95%序列一致性的核苷酸序列。
371. 如實施方式368的方法,其中該tracrRNA包含與SEQ ID NO:120至128中任一者具有100%序列一致性的核苷酸序列。
372. 一種醫治疾病的方法,該方法包含對需要醫治的個體投予有效量的實施方式214或277的醫藥組合物。
373. 如實施方式372的方法,其中該疾病與因果突變關聯,且該有效量的該醫藥組合物校正該基因突變。
374. 實施方式1-14、50-52、及111-113中任一者的核酸分子、實施方式15-28、53-110、及114-171中任一者的載體、實施方式29、266、及270-274中任一者的細胞、實施方式37-49中任一者的分離的RGN多肽、或實施方式172-213中任一者的系統對於醫治個體的疾病的用途。
375. 如實施方式374的用途,其中該疾病與因果突變關聯,且該醫治包含校正該因果突變。
376. 實施方式1-14、50-52、及111-113中任一者的核酸分子、實施方式15-28、53-110、及114-171中任一者的載體、實施方式29、266、及270-274中任一者的細胞、實施方式37-49中任一者的分離的RGN多肽、或實施方式172-213中任一者的系統對於製造有用於醫治個體的藥品的用途。
377. 如實施方式376的用途,其中該疾病與因果突變關聯,且有效量的該藥品校正該因果突變。
提供以下範例為示例而非為限制。 實驗範例 1. RNA 導引之核酸酶的辨別
在所關注的基因組中辨別與轉位酶具序列相似性的CRISPR關聯序列。CRISPR重複子在被設置為2的陣列中用最少數目的重複子藉由minCED(探勘環境資料集(Environmental Datasets)中的CRISPR重複子)被辨別。僅考慮對與同一個重疊群(contig)上的重複子共定位的推定RNA導引之核酸酶做進一步調查。使用重疊群上重複子與推定cas 基因之間距離的若干漸增的應急截斷(100kb、50kb、20kb、10kb)。選擇5 kb的最終過濾器。
於本文獻中,活性系統中的CRISPR重複子的長度介於27與47個核苷酸之間。該特徵被用於過濾且移除非CRISPR重複特徵。為對陣列擴展提供適宜的化學性質,CRISPR陣列中的新間隔體序列的一部分獲得需要重複子的第一核苷酸為G。作為此步驟的一部分,共有重複序列以及重複子-間隔體陣列的取向被預測。此過濾器被包括,以優先化可能的功能性RGN。陣列中所需重複子的最小數目被增加至3個。
一些蛋白質(主要是DNA結合蛋白質)在其主結構中具有重複胺基酸,其可能被錯誤地檢測為CRISPR基因座。自身重複特徵發生於蛋白質內部的推定RGN被棄去。僅考慮對基因間重複子做進一步分析。
為確定同源物的簇,蛋白質及共有重複序列被排列且基於它們的譜系(phylogeny)被分類為簇。重複子及蛋白在譜系上往往共簇,對同源物的簇的概念提供支持。蛋白質簇資訊亦顯示於表1中。使用cdhit,以95%的一致性,使蛋白質成簇。
品系關係(relatedness)可藉由比較它們的間隔體內容跟蹤。如果系統具有相同的重複序列及類似的蛋白質序列,則稱它們有關係,且它們的間隔體內容可提供有關於它們的共用歷史的資訊。相同的簇中的同源物往往共用保留的祖體間隔體。趨異品系(Divergent strain)彼此具有整體唯一的間隔體內容。殖株分離體(Clonal isolate)將完全共用完全相同的間隔體內容。自身重複序列被保留但自身間隔體內容在基因組之間不同的系統可促進更可能為活性的且此等被優先化。
辨識了109種相異的CRISPR關聯的RNA導引之核酸酶(RGN)被辨識並描述於下表1中。表1提供每一個RGN的名稱、其胺基酸序列、其被取得所自的來源、及經處理的crRNA及tracrRNA序列。
對圍繞每一個推定核酸酶的基因座搜索CRISPR免疫可能需要的潛在輔助基因。若干推定核酸酶出現於具潛在輔助基因的操縱子(operonic)結構中,但沒有基因座含有cas1cas2cas4 或其他已知cas 基因的同源物(圖1)。另外,若干系統含有對齊該核酸酶的末側且在CRISPR重複子的上游缺少期望的前導序列的重複子,這建議了一種CRISPR RNA表達的新穎機制。 1 RGN 系統資訊
RGN ID SEQ ID NO. 蛋白質簇 crRNA 重複序列 (SEQ ID NO.) tracrRNA (SEQ ID NO.) sgRNA (SEQ ID NO) 共有重複子 (SEQ ID NO.)
APG07339 1 芽孢桿菌屬 4 110 120 129 201
APG09624 2 芽孢桿菌屬 4 111 121 130 202
APG03003 3 芽孢桿菌屬 4 112 122 203
APG05405 4 芽孢桿菌屬 4 113 123 131 204
APG09777 5 芽孢桿菌屬 4 114 124 132 205
APG05680 6 芽孢桿菌屬 16 115 125 310 206
APG02119 7 芽孢桿菌屬 4 207
APG03285 8 芽孢桿菌屬 15 208
APG04998 9 芽孢桿菌屬 11 209
APG07078 10 芽孢桿菌屬 13 210
APG06369 11 戈登氏菌屬 0 116 211
APG03847 12 微球菌菌屬( Micrococcus sp. 2 117 126 133 212
APG05625 13 微球菌菌屬 2 118 127 134 213
APG03759 14 Paeniglutamicibacter 菌屬 5 214
APG05123 15 鏈黴菌屬 3 215
APG03524 16 微球菌菌屬 2 119 128 135 216
APG05361 17 芽孢桿菌屬 1 217
APG04303 18 芽孢桿菌屬 14 218
APG04291 19 芽孢桿菌屬 14 219
APG01006 20 芽孢桿菌屬 14 220
APG06547 21 芽孢桿菌屬 22 221
APG01699 22 芽孢桿菌屬 14 222
APG06155 23 芽孢桿菌屬 14 223
APG09116 24 芽孢桿菌屬 4 224
APG09403 25 芽孢桿菌屬 23 225
APG08954 26 芽孢桿菌屬 14 226
APG02589 27 芽孢桿菌屬 14 227
APG04061 28 芽孢桿菌屬 14 228
APG08773 29 芽孢桿菌屬 12 229
APG02836 30 芽孢桿菌屬 14 230
APG09123 31 芽孢桿菌屬 14 231
APG04288 32 芽孢桿菌屬 14 232
APG06873 33 芽孢桿菌屬 12 233
APG02381 34 芽孢桿菌屬 14 234
APG06947 35 芽孢桿菌屬 27 ND
APG04677 36 芽孢桿菌屬 14 236
APG07253 37 芽孢桿菌屬 14 237
APG08319 38 芽孢桿菌屬 24 ND
APG04362 39 芽孢桿菌屬 14 239
APG00992 40 芽孢桿菌屬 14 240
APG04193 41 芽孢桿菌屬 17 241
APG08201 42 芽孢桿菌屬 17 242
APG01031 43 芽孢桿菌屬 14 243
APG06773 44 芽孢桿菌屬 14 244
APG08945 45 芽孢桿菌屬 14 245
APG03214 46 芽孢桿菌屬 4 246
APG09942 47 芽孢桿菌屬 4 247
APG01836 48 芽孢桿菌屬 14 248
APG06336 49 芽孢桿菌屬 14 249
APG08839 50 芽孢桿菌屬 4 250
APG02684 51 芽孢桿菌屬 20 ND
APG05281 52 芽孢桿菌屬 14 252
APG01046 53 芽孢桿菌屬 14 253
APG01240 54 芽孢桿菌屬 14 254
APG05981 55 芽孢桿菌屬 14 255
APG04054 56 芽孢桿菌屬 14 256
APG07301 57 芽孢桿菌屬 14 257
APG07284 58 芽孢桿菌屬 14 258
APG06812 59 芽孢桿菌屬 14 259
APG08143 60 芽孢桿菌屬 14 260
APG08031 61 芽孢桿菌屬 14 261
APG03966 62 芽孢桿菌屬 14 262
APG05371 63 芽孢桿菌屬 14 263
APG04324 64 芽孢桿菌屬 14 264
APG01233 65 芽孢桿菌屬 14 265
APG00823 66 芽孢桿菌屬 14 266
APG06704 67 芽孢桿菌屬 14 267
APG02228 68 芽孢桿菌屬 14 268
APG08636 69 芽孢桿菌屬 6 269
APG02665 70 芽孢桿菌屬 6 270
APG01832 71 芽孢桿菌屬 6 271
APG03625 72 芽孢桿菌屬 14 272
APG07479 73 芽孢桿菌屬 14 273
APG02608 74 芽孢桿菌屬 14 274
APG04337 75 芽孢桿菌屬 12 275
APG01431 76 芽孢桿菌屬 14 276
APG05423 77 芽孢桿菌屬 14 277
APG01452 78 芽孢桿菌屬 14 278
APG05729 79 芽孢桿菌屬 19 279
APG01946 80 芽孢桿菌屬 14 280
APG02414 81 芽孢桿菌屬 14 281
APG01839 82 芽孢桿菌屬 14 282
APG00752 83 芽孢桿菌屬 14 283
APG02156 84 芽孢桿菌屬 14 284
APG08789 85 芽孢桿菌屬 10 285
APG07736 86 芽孢桿菌屬 26 286
APG01573 87 芽孢桿菌屬 14 287
APG07722 88 芽孢桿菌屬 18 288
APG08071 89 芽孢桿菌屬 8 289
APG01280 90 芽孢桿菌屬 14 290
APG07455 91 芽孢桿菌屬 14 291
APG05150 92 芽孢桿菌屬 7 292
APG09405 93 芽孢桿菌屬 14 293
APG09583 94 芽孢桿菌屬 4 294
APG09909 95 芽孢桿菌屬 14 295
APG07075 96 芽孢桿菌屬 14 296
APG05892 97 芽孢桿菌屬 14 297
APG09648 98 芽孢桿菌屬 25 298
APG02311 99 芽孢桿菌屬 21 299
APG03906 100 芽孢桿菌屬 14 300
APG01953 101 芽孢桿菌屬 9 301
APG00903 102 芽孢桿菌屬 14 302
APG01543 103 芽孢桿菌屬 22 303
APG07261 104 芽孢桿菌屬 15 ND
APG05635 105 芽孢桿菌屬 13 305
APG02962 106 芽孢桿菌屬 15 306
APG07448 107 芽孢桿菌屬 15 307
APG05378 108 芽孢桿菌屬 16 308
APG01852 109 芽孢桿菌屬 16 309
ND=未定範例 2 :蛋白質分析
藉由在interpro資料庫中搜索域,預測核酸酶域。使用建立於割裂RuvC域上的hmm核酸酶域概況自已知Cas蛋白預測割裂Ruvc核酸酶域。所預測的核酸酶殘基可見於表2中(ND=未定)。 2 :核酸酶殘基
RGN ID RuvC-I RuvC-II RuvC-III
APG07339 D297 E395 D477
APG09624 D297 E395 D477
APG03003 D297 E395 D477
APG05405 D297 E395 D477
APG09777 D297 E395 D477
APG05680 D232 E331 D407
APG02119 D297 E395 D477
APG03285 D232 E331 D407
APG04998 D281 E379 D456
APG07078 D233 E332 D408
APG06369 ND ND ND
APG03847 D282 E382 D463
APG05625 D282 E382 D463
APG03759 D257 E357 D438
APG05123 D248 E356 D437
APG03524 D282 E382 D463
APG05361 D244 D362 D443
APG04303 D233 E332 D408
APG04291 D233 E332 D408
APG01006 D233 E332 D408
APG06547 D183 E277 D359
APG01699 D233 E326 D402
APG06155 D233 E332 D408
APG09116 D297 E395 D477
APG09403 D183 E277 D359
APG08954 D233 E326 D402
APG02589 D236 E329 D405
APG04061 D233 E332 D408
APG08773 D267 E363 D440
APG02836 D233 E332 D408
APG09123 D233 E332 D408
APG04288 D233 E332 D408
APG06873 D267 E363 D440
APG02381 D233 E332 D408
APG06947 D2 E95 D184
APG04677 D233 E326 D402
APG07253 D233 E332 D408
APG08319 D183 E267 D350
APG04362 D233 E332 D408
APG00992 D233 E332 D408
APG04193 D232 E331 D407
APG08201 D232 E331 D407
APG01031 D226 E325 D401
APG06773 D233 E332 D408
APG08945 D233 E332 D408
APG03214 D297 E395 D477
APG09942 D297 E395 D477
APG01836 D233 E332 D408
APG06336 D233 E332 D408
APG08839 D297 E395 D477
APG02684 D221 E305 D387
APG05281 D34 E133 D209
APG01046 D233 E332 D408
APG01240 D233 E326 D402
APG05981 D233 E332 D408
APG04054 D233 E332 D408
APG07301 D233 E332 D408
APG07284 D233 E326 D402
APG06812 D233 E326 D402
APG08143 D233 E332 D408
APG08031 D233 E332 D408
APG03966 D233 E332 D408
APG05371 D233 E332 D408
APG04324 D233 E326 D402
APG01233 D233 E332 D408
APG00823 D233 E332 D408
APG06704 D233 E332 D408
APG02228 D233 E332 D408
APG08636 D267 E365 D442
APG02665 D267 E365 D442
APG01832 D267 E365 D442
APG03625 D233 E332 D408
APG07479 D233 E332 D408
APG02608 D233 E332 D408
APG04337 D267 E365 D442
APG01431 D233 E332 D408
APG05423 D233 E332 D408
APG01452 D233 E332 D408
APG05729 D231 E330 D409
APG01946 D233 E332 D408
APG02414 D226 E325 D401
APG01839 D236 E329 D405
APG00752 D226 E325 D401
APG02156 D236 E329 D405
APG08789 D280 E378 D455
APG07736 D52 E145 D221
APG01573 D226 E319 D395
APG07722 D232 E331 D407
APG08071 D281 E379 D456
APG01280 D233 E332 D408
APG07455 D233 E332 D408
APG05150 D267 E365 D442
APG09405 D233 E326 D402
APG09583 D297 E395 D477
APG09909 D233 E332 D408
APG07075 D233 E326 D402
APG05892 D226 E319 D395
APG09648 D86 E170 D253
APG02311 D221 E305 D387
APG03906 D233 E332 D408
APG01953 D281 E379 D456
APG00903 D233 E332 D408
APG01543 D183 E277 D359
APG07261 D232 E331 D407
APG05635 D233 E332 D408
APG02962 D232 E331 D407
APG07448 D232 E331 D407
APG05378 D232 E331 D407
APG01852 D232 E331 D407
範例 3 :導引 RNA 預測及確認
使天然表現了調查中的RNA導引之核酸酶系統的細菌培養物生長至對數中期(~0.600的OD600)、成粒狀物並快速冷凍。使用mirVANA miRNA分離套組(Life Technologies,Carlsbad,CA)從粒狀物中分離RNA,並使用NEBNext Small RNA Library Prep套組(NEB,Beverly,MA)從分離的RNA製備定序庫。將庫製備物在6%聚丙烯醯胺凝膠上分級,以捕獲小於200nt的RNA物種,從而分別檢測crRNA和tracrRNA。深度定序(75 bp配對末端)由服務提供者(MoGene,St.Louis,MO)在Next Seq 500(高輸出套組)上實行。使用Cutadapt對讀數進行品質修整,並使用Bowtie2將讀數映射到參考基因組。用python編寫定制RNAseq管線(pipeline)來檢測crRNA和tracrRNA轉錄本。藉由天然重複間隔體陣列的序列覆蓋來確定經處理的crRNA邊界。使用允許的BLASTn參數辨別tracrRNA的抗重複子部分。藉由辨別含有抗重複子的轉錄本,RNA定序深度確認經處理的tracrRNA的邊界。使用RNAfold(RNA摺疊軟體)進行的二次結構預測來實行RNA的手動施治(manual curation)。sgRNA卡匣是藉由DNA合成而被製備的,並且一般而言被如下設計(5'->3'):經處理的tracrRNA,在其3’末側可操作地聯結至4 bp非互補聯結子(AAAG;SEQ ID NO:136)、在其3’末側可操作地聯結至crRNA的經處理的重複子部分,在其3’末側可操作地聯結至20-30 bp間隔體序列。也可以使用其他4 bp非互補聯結子。
對於體外測定,藉由用TranscriptAid T7高產率轉錄套組(TranscriptAid T7 High Yield Transcription Kit)(ThermoFisher)之sgRNA卡匣的體外轉錄來合成sgRNA及一些tracrRNA。以合成方式產生sgRNA及一些tracrRNA。
對於蛋白質表達及純化,含有與C端His 10示跡物融合的推定RGN的質體被構建且被轉化到大腸桿菌的BL21(DE3)菌株中。使用補加了康黴素的Magic Media自誘導培養基實行表現。裂解以及澄清後,藉由固定化金屬親和層析法純化蛋白質。使用Heparin層析法,實行APG05405的進一步純化。
使用在tracrRNA的上游具T7啟動子的dsDNA模板,藉由體外轉錄(IVT)產生tracrRNA(SEQ ID NO:140、145、及147)的較長者。用於IVT的模板藉由PCR自合成gBlock模板(Integrated DNA Technologies)擴增。以合成方式產生較短的tracrRNA及crRNA。
RNA結合藉由差示掃描螢光測定法確認(Niesen, F.H., H. Berglund, and M. Vedadi. 2007. Nat. Protoc. 2: 2212–2221)。雙RNA複合物藉由在Annealing Buffer(Synthego, 60 mM KCl 6 mM HEPES pH 7)中使過量crRNA與tracrRNA混合來產生。在磷酸鹽緩衝鹽水(PBS, Thermo Fisher)中,以0.5 µM效應子蛋白及1 µM導引RNA的最終濃度,培育候選效應子蛋白及導引RNA(或雙RNA複合物或sgRNA。在室溫下,將它們培育20分鐘,且然後與已在PBS中被稀釋的Sypro Orange染劑溶液以1:1混合。溶解曲線藉由量測為溫度的函數的螢光強度(FI)來獲得,且計算該溶解曲線的一次導數(dFI/dT)。為推定RNP的溫度的函數的dFI/dT的曲線圖相對於原始核酸酶的位移指示RNA結合,且被用於評估推定導引RNA組合。在所辨別的原始導引組合中,對於RGN APG09624及APG05405,僅觀察到全長推定tracrRNA及crRNA誘發dFI/dT與溫度的函數顯著位移。對於其他蛋白質/RNA組合觀察到此函數的小位移,且相較於以前對功能性RNP形成觀察到的位移,該小位移的幅度較小,且不被解釋為功能性複合物的形成的指示。第1峰係指對於給定樣本與所觀察到的最高峰關聯的溫度。如果第二峰被觀察到,則其被指示於第2峰行中。關於複合物的形成的資料的解釋被指示於表3的「結合?」行中。「是」指示結合被觀察到。「N/A」指示沒有足夠的資料可用於確定結合是否發生。 3 RGN 與導引 RNA 的結合
RGN crRNA (SEQ ID NO.) tracrRNA (SEQ ID NO.) 1 (°C) 2 (°C) 結合 ?
APG03003 38 未觀察到 N/A
APG03003 139 140 38 未觀察到 N/A
APG03003 141 142 37 未觀察到 N/A
APG09777 39 未觀察到 N/A
APG09777 139 140 40 未觀察到 N/A
APG09777 141 142 39 未觀察到 N/A
APG07339 37 未觀察到 N/A
APG07339 143 144 37 未觀察到 N/A
APG07339 143 145 38 未觀察到 N/A
APG09624 38 未觀察到 N/A
APG09624 143 144 37 未觀察到 N/A
APG09624 143 145 39 44
APG05405 36 未觀察到 N/A
APG05405 143 144 37 未觀察到 N/A
APG05405 143 145 43 未觀察到
APG09777 38 未觀察到 N/A
APG09777 146 148 39 未觀察到 N/A
APG09777 146 147 39 未觀察到 N/A
範例 4 :導向 ssDNA 標的剪切
經純化的APG09624、APG05405及催化滅活(inactivated)的APG05405(如SEQ ID NO:173所示的dAPG05405)與單導引RNA(sgRNA)Gsg.2(如SEQ ID NO: 194所示的)在Cutsmart緩衝液(New England Biolabs B7204S)中在200 nM核酸酶及400 nM sgRNA的最終濃度下一起培育20分鐘。然後,以100 nM核酸酶的最終濃度將它們添加至以5' Cy5示蹤的ssDNA溶液中,該以5' Cy5示蹤的ssDNA在本文中被稱為以10 nM位於1.5X Cutsmart緩衝液(New England Biolabs B7204S)中的LE111(如SEQ ID NO:195所示)或LE113(如SEQ ID NO:196所示)。
樣本藉由分別以0.1 mg/mL及45 mM的最終濃度添加RNase及EDTA而被淬滅,且在以下時間點置於冰上:0、40、80、及120分鐘。淬滅全部樣本後,將它們在50°C下培育30分鐘,然後,在95°C下培育5分鐘。將五分之一體積的載入緩衝液(1x TBE、12%聚蔗糖(Ficoll)、7 M尿素)添加至每一個反應物中,且在95°C下培育15分鐘,且在15% TBE-尿素丙烯醯胺凝膠(Bio-Rad 3450092)上分析5 µl的每一個反應物。
隨時間、核酸酶及導引RNA的變化的剪切產物的定量顯示於下面的表4中。LE111(SEQ ID NO: 195)的序列用作陰性對照物,而LE113(SEQ ID NO: 196)的序列承載被裝載於核酸酶上的sgRNA的標的序列。 4 :標的寡核苷酸的剪切
核酸酶 標的寡核苷酸 時間 ( 分鐘 ) 剪切 %
dAPG05405 LE111 0 0
dAPG05405 LE111 0 0
dAPG05405 LE111 40 0
dAPG05405 LE111 40 0
dAPG05405 LE111 80 0
dAPG05405 LE111 80 0
dAPG05405 LE111 120 0
dAPG05405 LE111 120 0
dAPG05405 LE113 0 0
dAPG05405 LE113 0 0
dAPG05405 LE113 40 0
dAPG05405 LE113 40 0
dAPG05405 LE113 80 0
dAPG05405 LE113 80 0
dAPG05405 LE113 120 0
dAPG05405 LE113 120 0
APG09624 LE111 0 0
APG09624 LE111 0 0
APG09624 LE111 40 0
APG09624 LE111 40 0
APG09624 LE111 80 24
APG09624 LE111 80 24
APG09624 LE111 120 30
APG09624 LE111 120 26
APG09624 LE113 0 0
APG09624 LE113 0 0
APG09624 LE113 40 59
APG09624 LE113 40 65
APG09624 LE113 80 80
APG09624 LE113 80 84
APG09624 LE113 120 92
APG09624 LE113 120 93
APG05405 LE111 0 0
APG05405 LE111 0 0
APG05405 LE111 40 0
APG05405 LE111 40 0
APG05405 LE111 80 0
APG05405 LE111 80 0
APG05405 LE111 120 0
APG05405 LE111 120 0
APG05405 LE113 0 0
APG05405 LE113 0 0
APG05405 LE113 40 58
APG05405 LE113 40 49
APG05405 LE113 80 80
APG05405 LE113 80 85
APG05405 LE113 120 73
APG05405 LE113 120 88
凝膠分析披露主要位於樣本中藉由sgRNA靶向且具有催化活性核酸酶的剪切產物依時間的形成,其展示此等蛋白質的RNA導引之核酸酶活性,且提供關鍵催化殘基被正確界定的證據。當APG09624 RNP與LE111一起培育時,觀察到一些非專一性活性,這可能是因於該批次的dAPG05405及APG05405是藉由額外層析法步驟純化的,且由此,因於未完全去除由表現宿主取得的核酸酶,該批次的APG09624可具有某個層級的背景活性。範例 5 :可程式化的 DNA 結合及基因活化 RGN 基因活化及 gRNA 哺乳動物表現質體的構築
哺乳動物表現的核酸酶構築體被合成。在巨細胞病毒(CMV)啟動子(SEQ ID NO:152)的控制下具N端SV40(SEQ ID NO: 149)及C端核質素NLS序列(分別是,SEQ ID NO:149及150)、N端3xFLAG示跡物(SEQ ID NO: 151)、及C或N端VPR活化域(SEQ ID NO:154;Chavez等人2015,Nature Methods , 12(4): 326-328)的人類密碼子最佳化的APG05405被產生且被引入哺乳動物表現載體內。APG05405之推測具催化活性的及被催化滅活的(「dAPG5405」)版本二者被使用。編碼單gRNA的導引RNA表現構築體的每一個亦都在人類RNA聚合酶III U6啟動子(SEQ ID NO:153)的控制下被產生。核酸酶構築體指示於下面的表5中。 5 RGN 構築體
核酸酶構築體 SEQ ID NO.
APG05405 155
dAPG05405 156
APG05405-VPR 157
dAPG05405-VPR 158
VPR-APG05405 159
VPR-dAPG05405 160
哺乳動物細胞的轉染及表現
轉染前一天,將1x104 個HEK293T細胞(Sigma)鋪板(plated)於Dulbecco的改良Eagle培養基(DMEM)加10%(vol/vol)胎牛血清(Gibco)及1%青黴素-鏈黴素(Gibco)的96孔培養皿中。當細胞達到50-60%匯合率(confluency)時的第二天,按照製造商的說明,使用每孔0.3 μL的Lipofectamine 3000(Thermo Scientific)共轉染100 ng的RGN表現質體加100 ng的單gRNA表現質體。生長48小時後,使用Cells-to-Ct One Step套組(ThermoFisher)來收穫總RNA。標的基因表現的 Taqman 測定
挑選正常情況下在HEK細胞中具有低表現但在CRISPR活化時可被誘導的內源基因。出於此目的,挑選RHOXF2及CD2。TaqMan基因表現測定是作為正規化控制藉由對RHOXF2及CD2使用FAM示蹤探針且對ACTB使用VIC示蹤探針(全部探針都來自ThermoFisher)實行的。TaqMan測定是按照製造商的說明在BioRad CFX96 Real Time熱循環器中在Cells-to-CT™ One Step套組中實行的。在不存在gRNA的類似實驗中量測背景。基因表現相對於背景的倍數變化(fold change)是使用2- 𝞓𝞓 Ct 方法(Livak等人2001,Methods , 25(4):402-8)計算的,將表現正規化至ACTB轉錄本水準。 6 :標的基因表現的導引 RNA
核酸酶 基因 導引SEQ ID NO
APG05405-VPR RHOXF2 167
APG05405-VPR RHOXF2 168
APG05405-VPR RHOXF2 169
APG05405-VPR RHOXF2 170
APG05405-VPR RHOXF2 171
APG05405-VPR RHOXF2 172
dAPG05405-VPR RHOXF2 167
dAPG05405-VPR RHOXF2 168
dAPG05405-VPR RHOXF2 169
dAPG05405-VPR RHOXF2 170
dAPG05405-VPR RHOXF2 171
dAPG05405-VPR RHOXF2 172
VPR-APG05405 RHOXF2 167
VPR-APG05405 RHOXF2 168
VPR-APG05405 RHOXF2 169
VPR-APG05405 RHOXF2 170
VPR-APG05405 RHOXF2 171
VPR-APG05405 RHOXF2 172
VPR-dAPG05405 RHOXF2 167
VPR-dAPG05405 RHOXF2 168
VPR-dAPG05405 RHOXF2 169
VPR-dAPG05405 RHOXF2 170
VPR-dAPG05405 RHOXF2 171
VPR-dAPG05405 RHOXF2 172
APG05405-VPR CD2 161
APG05405-VPR CD2 162
APG05405-VPR CD2 163
APG05405-VPR CD2 164
APG05405-VPR CD2 165
APG05405-VPR CD2 166
dAPG05405-VPR CD2 161
dAPG05405-VPR CD2 162
dAPG05405-VPR CD2 163
dAPG05405-VPR CD2 164
dAPG05405-VPR CD2 165
dAPG05405-VPR CD2 166
VPR-APG05405 CD2 161
VPR-APG05405 CD2 162
VPR-APG05405 CD2 163
VPR-APG05405 CD2 164
VPR-APG05405 CD2 165
VPR-APG05405 CD2 166
VPR-dAPG05405 CD2 161
VPR-dAPG05405 CD2 162
VPR-dAPG05405 CD2 163
VPR-dAPG05405 CD2 164
VPR-dAPG05405 CD2 165
VPR-dAPG05405 CD2 166
範例 6 :可程式化 DNA 結合及鹼基編輯 寡核苷酸及 PCR
下面描述的全部PCR反應都是在包括0.5 uM的每一種引子的20 μL反應物中使用10 μL的2X Master Mix Phusion High-Fidelity DNA聚合酶(Thermo Scientific)實行的。首先,使用PCR#1引子,使用以下程式:98℃,1分鐘; [98℃,10秒;62℃,15秒;72℃,5分鐘] 的30個循環;72 ℃,5分鐘;12 ℃,永遠,來擴增涵蓋每一個標的基因的大基因組區域。然後,使用對每一個導引專一的引子(PCR#2引子),使用以下程式:98 ℃,1分鐘; [98 ℃,10秒;67 ℃,15秒;72 ℃,30秒] 的35個循環;72 ℃,5分鐘;12 ℃,永遠,來進一步擴增1微升的此PCR反應物。PCR#2的引子包括用於Illumina定序的Nextera Read 1和Read 2 轉位酶轉接子突出部序列。RGN 鹼基編輯及 gRNA 哺乳動物表現質體的構築
哺乳動物表現的核酸酶構築體被合成。在巨細胞病毒(CMV)啟動子(SEQ ID NO:152)的控制下具N端SV40(SEQ ID NO: 149)及C端核質素NLS序列(分別是,SEQ ID NO:149及150)、N端3xFLAG示跡物(SEQ ID NO: 151)、及N端脫胺酶(舉例而言,hAPOBEC3A;SEQ ID NO: 177)的人類密碼子最佳化的APG05405被產生且被引入哺乳動物表現載體內。使用催化去活性版本的APG05405(「dAPG5405」)。編碼單gRNA的導引RNA表現構築體的每一個亦都在人類RNA聚合酶III U6啟動子(SEQ ID NO:153)的控制下被產生。哺乳動物細胞的轉染及表現
轉染前一天,將1x105 個HEK293T細胞(Sigma)鋪板於Dulbecco的改良Eagle培養基(DMEM)加10%(vol/vol)胎牛血清(Gibco)及1%青黴素-鏈黴素(Gibco)中的24孔培養皿中。當細胞達到50-60%匯合率(confluency)時,按照製造商的說明,使用每孔1.5 μL的Lipofectamine 3000(Thermo Scientific)共轉染500 ng的APG05405表現質體加500 ng的單gRNA表現質體。生長48小時後,按照製造商的說明,使用基因組DNA分離套組(Machery-Nagel)來收穫總基因組DNA。下一代定序
來自含有Illumina突出端序列的PCR#2的產物遵循Illumina 16S環境基因體定序庫( Metagenomic Sequencing Library)操作流程進行庫製備。深度定序由服務提供者(MOGene)在Illumina Mi-Seq平臺上進行。通常情況下,每擴增子產生200,000個250 bp的配對末側讀數(2×100,000個讀數)。使用CRISPResso(Pinello等人,2016,Nature Biotech 34:695-697)分析讀數以計算鹼基編輯率。手動施治輸出對準,以確認鹼基編輯視窗以及辨別插入或刪除。橫跨該標的的每一個位置都被分析,以確定編輯率及在每一個位置發生的專一性核苷酸變化。範例 7 :反式 ssDNA 剪切 7.1 確定反式 DNA 剪切的測定條件
在Cutsmart緩衝液(New England Biolabs B7204S)中,將經純化的APG05405與單導引RNA (sgRNA)以或者50 nM的核酸酶及100 nM的sgRNA或者200 nM的核酸酶及400 nM的sgRNA的最終濃度一起培育10分鐘。將此等RNP溶液添加至在1.5X Cutsmart緩衝液(New England Biolabs B7204S)中ssDNA(標的或誤配陰性對照物ssDNA)的最終濃度為10 nM且報導子ssDNA探針的最終濃度為250 nM的溶液。報導子探針(如SEQ ID NO:197及198分別所示的TB0125及TB0089)在5’末側含有螢光染劑(56-FAM用於TB0125且Cy5用於TB0089),在3’末側含有淬滅劑(3IABkFQ用於TB0125且3IAbRQSp用於TB0089),並且視情況含有內部淬滅劑(內部淬滅劑ZEN僅存在於TB0125上)。報導子探針的剪切導致螢光染劑去淬滅,且由此導致螢光訊號增大。為監測螢光強度,在微量盤讀取機(microplate reader)(CLARIOstar Plus)中在30℃下在Corning的小體積384孔微量盤中培育10 µl的每一個反應物。
為對此測定確定適合的參數,探測很多條件。為確定是否有淬滅的探針設計或螢光團特性的效應,在每一個反應物中作為混合物包含兩個這種報導子(reporter)。在任何給定的反應物中,它們彼此在相同的濃度。在所有情況中,對照物或標的ssDNA的濃度(SEQ ID NO:199及200分別所示的LE201或LE205)為10 nM。RNP名稱示意了如下面的表7所指示的核酸酶及標的。 7. 核糖核蛋白複合物
核酸酶 sgRNA (SEQ ID NO) 預期標的 RNP 名稱
APG05405 Gsg.1 (193) LE201 APG05405.1
APG05405 Gsg.2 (194) LE205 APG05405.2
結果顯示於下面的表8中。 8. 反式 DNA 剪切測定結果
        斜率任意單位 / 分鐘
RNP [RNP] (nM) [ 報導子 ] (nM) 標的 Cy5 通道 FAM 通道
APG05405.1 25 nM 0 LE201 -0.60 -0.60
APG05405.1 25 nM 50 LE201 72.60 4.20
APG05405.1 25 nM 250 LE201 198.60 -1.20
APG05405.1 25 nM 500 LE201 294.00 -3.00
APG05405.1 25 nM 750 LE201 428.40 -16.80
APG05405.1 25 nM 1000 LE201 509.40 -19.80
APG05405.1 25 nM 0 LE205 -0.48 -0.42
APG05405.1 25 nM 50 LE205 6.60 -1.80
APG05405.1 25 nM 250 LE205 57.00 0.60
APG05405.1 25 nM 500 LE205 185.40 -6.60
APG05405.1 25 nM 750 LE205 318.60 -14.40
APG05405.1 25 nM 1000 LE205 483.60 3.60
APG05405.2 25 nM 0 LE201 0.00 -2.40
APG05405.2 25 nM 50 LE201 12.00 -3.00
APG05405.2 25 nM 250 LE201 81.00 3.60
APG05405.2 25 nM 500 LE201 232.20 7.80
APG05405.2 25 nM 750 LE201 423.60 7.80
APG05405.2 25 nM 1000 LE201 684.60 9.60
APG05405.2 25 nM 0 LE205 -0.60 -2.40
APG05405.2 25 nM 50 LE205 173.40 44.40
APG05405.2 25 nM 250 LE205 262.80 49.20
APG05405.2 25 nM 500 LE205 381.00 44.40
APG05405.2 25 nM 750 LE205 530.40 31.80
APG05405.2 25 nM 1000 LE205 678.00 21.00
APG05405.1 100 nM 0 LE201 0.36 -3.00
APG05405.1 100 nM 50 LE201 97.20 5.40
APG05405.1 100 nM 250 LE201 429.00 19.20
APG05405.1 100 nM 500 LE201 651.00 26.40
APG05405.1 100 nM 750 LE201 1176.00 29.40
APG05405.1 100 nM 1000 LE201 1601.40 29.40
APG05405.1 100 nM 0 LE205 -1.80 -0.36
APG05405.1 100 nM 50 LE205 24.00 0.24
APG05405.1 100 nM 250 LE205 142.20 3.60
APG05405.1 100 nM 500 LE205 331.80 5.40
APG05405.1 100 nM 750 LE205 590.40 10.80
APG05405.1 100 nM 1000 LE205 952.80 9.00
APG05405.2 100 nM 0 LE201 -0.36 -3.00
APG05405.2 100 nM 50 LE201 30.60 -4.20
APG05405.2 100 nM 250 LE201 213.60 4.80
APG05405.2 100 nM 500 LE201 499.20 6.00
APG05405.2 100 nM 750 LE201 1128.00 -1.80
APG05405.2 100 nM 1000 LE201 1682.40 7.20
APG05405.2 100 nM 0 LE205 0.06 -1.80
APG05405.2 100 nM 50 LE205 389.40 72.60
APG05405.2 100 nM 250 LE205 1123.80 197.40
APG05405.2 100 nM 500 LE205 1510.20 235.20
APG05405.2 100 nM 750 LE205 2048.40 256.20
APG05405.2 100 nM 1000 LE205 2393.40 234.00
由此實驗得出的結論是,相較於25 nM的RNP濃度,100 nM濃度的RNP一般而言導致較高的報導子探針剪切率。一般來說,最多到250 nM的報導子濃度,報導子寡核苷酸濃度越高,則報導子剪切率越高,幾乎沒有從報導子濃度的進一步升高觀察到什麼益處。顯然,對於TB0089報導子(在Cy5通道中檢測的),尤其是在報導子濃度高於250 nM時,存在干擾標的分化的顯著較高位准的背景活性。因此,得出結論,報導子濃度高於250 nM沒有益處,且一般來說,雙淬滅TB0125探針(在FAM通道檢測的)更適合未來的實驗,因為在寬報導子濃度範圍內,其對背景活性提供較高比率的專一性。7.2 APG09624 反式 DNA 剪切及純化對非專一性活性的效應
經純化的APG05405及APG09624與單導引RNA(sgRNA)如以下所示一起在37℃下在1X Cutsmart緩衝液(New England Biolabs B7204S)中以200 nM的核酸酶及400 nM的sgRNA的最終濃度培育10分鐘。 9. 核糖核蛋白複合物
核酸酶 核酸酶批次 sgRNA 預期標的 RNP 名稱
APG09624 N/A Gsg.2 LE113 APG09624.2
APG05405 A Gsg.2 LE113 APG05405.2A
APG05405 B Gsg.2 LE113 APG05405.2B
然後,將此等RNP溶液添加至在1.5X Cutsmart緩衝液(New England Biolabs B7204S)中ssDNA(標的或誤配陰性對照物ssDNA)的最終濃度為10 nM且報導子探針(TP0003;如SEQ ID NO:314所示)的最終濃度為250 nM的溶液中。報導子探針在5’末側含有螢光染劑,且在3’末側含有淬滅劑。報導子探針的剪切導致螢光染劑去淬滅,且由此導致螢光訊號增大。為監測螢光強度,在微量盤讀取機(CLARIOstar Plus)中在37℃下在Corning的小體積384孔微量盤中培育10 µl的每一個反應物。
相對於陰性對照物,與標的序列一起培育導致以時間為函數的螢光強度實質升高。剪切率被得當地概括為螢光對時間函數的線性部分的斜率,如表10所顯示。 10. 反式 DNA(trans DNA) 剪切測定結果
RNP ssDNA 標的序列 斜率任意單位 / 分鐘
APG09624.2 LE111 182
APG09624.2 LE113 561
APG05405.2A LE111 197
APG05405.2A LE113 1625
APG05405.2B LE111 73
APG05405.2B LE113 1054
此等資料顯示藉由APG05405及APG09624二者形成的RNP引起標的序列的分化。7.3 藉由 PCR 產物的反式 DNA 剪切活化
含有標的的退化性核苷酸5 '的寡核苷酸被PCR擴增,以產生標的序列。標的dsPCR2及dsPCR3在導引RNA編碼的標的的5'側含有分別如SEQ ID NO:311及312所示的標的序列ACTACAACAGCCACAACGTCTATATCATGG(dsPCR2)及TGGAATGGGAACTAAAGTAATGG(dsPCR3),其分別含有8 bp及5 bp的退化性區域。用恰當的引子,寡對被黏合且被PCR擴增。除此之外,ssDNA標的被包括於該實驗中-寡核苷酸含有上面描述的標的序列的逆補體CCATGATATAGACGTTGTGGCTGTTGTAGT(LE205; SEQ ID NO:200)及CCATTACTTTAGTTCCCATTCCA(LE501; SEQ ID NO:174)。
RNP溶液是藉由培育在1X NEBuffer 2(New England Biolabs)中分別為0.5 µM及1 µM的核酸酶及sgRNA形成的,且在室溫下被培育20分鐘。 11. 核糖核蛋白複合物
sgRNA 預期標的 RNP 名稱
Gsg.3 (SEQ ID NO: 175) dsPCR3, LE501 APG05405.3
Gsg.2 (SEQ ID NO: 194) dsPCR2, LE205 APG05405.2
在1.5X NEBuffer 2中與具有5’ TEX615示蹤物及3' Iowa Black FQ淬滅劑的1.5 µM報導子及100 nM的分別的PCR產物或ssDNA寡核苷酸LE501或LE205(分別如SEQ ID NO:174及200所示;LE501包含5’ FAM螢光團)進行剪切反應。報導子探針的剪切導致螢光染劑去淬滅(dequenching),且由此導致螢光訊號升高。為監測螢光強度,在微量盤讀取機(microplate reader)(CLARIOstar Plus)中在37℃下在Corning的小體積384孔微量盤中培育10 µl的每一個反應物。動力分析的結果顯示於表12中。 12. 反式 DNA 剪切測定的結果
標的 RNP 斜率任意單位 / 分鐘
dsPCR3 APG05405.3 780
APG05405.2 102
dsPCR2 APG05405.3 78
APG05405.2 768
LE501 APG05405.3 624
APG05405.2 120
LE205 APG05405.3 90
APG05405.2 1434
此等結果展示ssDNA的非序列專一性剪切的標的序列專一性活化。dsDNA PCR產物及標的ssDNA寡核苷酸二者能夠誘導此活性。7.4 藉由經誘導的非專一性 ssDNA 剪切的 PAM 確定
如果給定系統需要用於DNA結合、修飾或剪切的PAM,則含有DNA標的(包括PAM庫)的三元複合物與RNP的分離及由其回收的DNA的定序可用於辨別PAM序列。該複合物可藉由很多方法捕獲,諸如,免疫下拉(immuno-pulldown)、固定化金屬親和樹脂(諸如,Ni-NTA瓊脂糖)捕獲、或藉由粒徑篩析(size exclusion)層析法之分離。
作為另一種選擇,具與固定標的相鄰的相異PAM序列的DNA片段的平行庫被產生。含有推定核酸酶及適合導引RNA(靶向固定標的的單導引或雙RNA導引)的RNP與庫中的每一個片段一起培育,且使用DNA片段的電泳遷移率位移、粒徑篩析液層析法、或使用對任一組成親和的固體支撐物的共沉澱而被評估。7.5 使用平行質體 DNA 庫的 PAM 確定
產生含有前面為8 bp退化序列(如SEQ ID NO: 176所示的NNNNNNNN)的標的序列(ACTACAACAGCCACAACGTCTATATCATGG(如SEQ ID NO:313所示的))的質體庫。在轉化為健全細胞且鋪板於具選擇性培養基的瓊脂板上時,自此反應物的轉化得到的每一個菌落都原則上與殖株質體DNA序列對應,且由此來自自單菌落取得的培養物的質體DNA的製劑為自原始庫取樣的唯一質體製劑。自取樣96個菌落獲得質體製劑。對此等製劑個別地進行Sanger定序,以驗證它們的PAM序列。
在室溫下,在1X Cutsmart緩衝液(New England Biolabs B7204S)中,將經純化的APG05405與單導引RNA(sgRNA)Gsg.2(如SEQ ID NO: 194所示的)以200 nM的核酸酶及400 nM的sgRNA的最終濃度一起培育20分鐘。
將此等RNP溶液以100 nM的最終濃度添加至在1.5X Cutsmart緩衝液(New England Biolabs B7204S)中質體DNA及包含螢光團及淬滅劑的ssDNA報導子股為50 nM的溶液中。為監測作以時間為函數的螢光強度,在微量盤讀取機(CLARIOstar Plus)中在37℃下在Corning的小體積384孔微量盤中培育10 µl的每一個反應物。每一個孔對應於具專一性PAM序列的個別消化反應物。在資料收集完成時,將確定螢光的增加率。藉由分析與螢光增加率高的孔對應的序列,建立共有PAM序列。如果如果尚無定論,則可產生且評估額外庫。範例 8 :使用 ssDNA 剪切作為診斷
因於此等核酸酶在存在標的DNA序列的情況下產生光學可檢測訊號的能力,它們有希望將功用實施於檢測基因疾病的診斷裝置或諸如細菌、病毒或真菌的傳染性疾病的藥劑內。
診斷程序可包括對待測試的樣本中的核酸的分離或擴增。在不對核酸進行任何分離或純化的情況下,使用一些樣本亦可為適合的,因它們可以相當高的量存在於樣本中,在沒有擴增(諸如PCR)或在沒有干擾檢測或訊號產生的物料的情況下,足以被檢測。
然後,如其他範例中所描述而形成的RNP和報導子(諸如,前面之範例中使用的螢光團及淬滅劑修飾的ssDNA寡核苷酸,或當被剪切時產生可見的或以其他方式容易檢測的訊號的某個其他種類的ssDNA基質)一起被暴露於樣本(或前面的段落中描述的經處理的樣本)中。如果使用螢光團-淬滅劑綴合(conjugated)的DNA寡核苷酸(與前面描述之範例中相同),則使用在前面之範例中描述的螢光計可將其檢測。為簡化檢測,可進行終點測定,代替前面描述的動力測定,意味著該測定可相對於陽性及陰性對照物實行固定時間,且在此經過時間結束時讀出。
此等試劑亦可被整合於橫向流動測試裝置內,這樣允許利用非常小的儀器對引起給定疾病的藥劑或專一性核酸序列(諸如,個體中的患病對偶基因)進行檢測。在此測定中,ssDNA報導子會與複數適合抗體或親和試劑捕獲的諸如螢光素、生物素及/或毛地黃素的分子綴合(conjugated)。範例 8.1- COVID19 診斷測定
根據標準做法,在通用運輸培養基(UTM)中使用鼻咽拭子,自患者收集樣本,且萃取RNA。使用逆轉錄-環介導等溫擴增(RT-LAMP)來擴增基因材料,類似於Broughton等人2020(Nat. Biotechnol . 38: 870-874)。於一些實施方式中,藉由RT-LAMP產生的單股DNA(ssDNA)足可用於藉由本文揭露之RGN進行PAM獨立的檢測。於一些實施方式中,使用藉由僅位於標的股上的硫代磷酸脂引子的擴增,RT-LAMP產生ssDNA,這允許非標的股的T7核酸外切酶消化。
作為對樣品收集及製備的品質控制檢查,用恰當的引子實行RT-LAMP擴增,以擴增SARS-CoV2基因組的N基因及E基因以及人類RNase P,類似於Broughton等人2020。二個LAMP內部引子(常稱為FIP或BIP)中一者會含有硫代磷酸脂基團。在用T7核酸外切酶處置所完成的PCR反應物時,自硫代磷酸脂引子延伸的ssDNA為存在於溶液中的主要物種。關於專一性及有效活化,使用上面描述的螢光測定來評估針對此系列的導引。關於專一性,為確保沒有交叉反應性,可針對其他冠狀病毒中的同源基因測試該檢測方案,諸如,HCoV-OC43、HCoV-HKU1、HCoV-229E、HCoV-NL63、MERS-CoV、及/或SARS-CoV。藉由運用含有FAM及生物素的寡核苷酸,可將該測定轉換為橫向流動測定。
圖1顯示本發明之代表性RGN的細菌基因組基因座。
 
Figure 12_A0101_SEQ_0001
Figure 12_A0101_SEQ_0002
Figure 12_A0101_SEQ_0003
Figure 12_A0101_SEQ_0004
Figure 12_A0101_SEQ_0005
Figure 12_A0101_SEQ_0006
Figure 12_A0101_SEQ_0007
Figure 12_A0101_SEQ_0008
Figure 12_A0101_SEQ_0009
Figure 12_A0101_SEQ_0010
Figure 12_A0101_SEQ_0011
Figure 12_A0101_SEQ_0012
Figure 12_A0101_SEQ_0013
Figure 12_A0101_SEQ_0014
Figure 12_A0101_SEQ_0015
Figure 12_A0101_SEQ_0016
Figure 12_A0101_SEQ_0017
Figure 12_A0101_SEQ_0018
Figure 12_A0101_SEQ_0019
Figure 12_A0101_SEQ_0020
Figure 12_A0101_SEQ_0021
Figure 12_A0101_SEQ_0022
Figure 12_A0101_SEQ_0023
Figure 12_A0101_SEQ_0024
Figure 12_A0101_SEQ_0025
Figure 12_A0101_SEQ_0026
Figure 12_A0101_SEQ_0027
Figure 12_A0101_SEQ_0028
Figure 12_A0101_SEQ_0029
Figure 12_A0101_SEQ_0030
Figure 12_A0101_SEQ_0031
Figure 12_A0101_SEQ_0032
Figure 12_A0101_SEQ_0033
Figure 12_A0101_SEQ_0034
Figure 12_A0101_SEQ_0035
Figure 12_A0101_SEQ_0036
Figure 12_A0101_SEQ_0037
Figure 12_A0101_SEQ_0038
Figure 12_A0101_SEQ_0039
Figure 12_A0101_SEQ_0040
Figure 12_A0101_SEQ_0041
Figure 12_A0101_SEQ_0042
Figure 12_A0101_SEQ_0043
Figure 12_A0101_SEQ_0044
Figure 12_A0101_SEQ_0045
Figure 12_A0101_SEQ_0046
Figure 12_A0101_SEQ_0047
Figure 12_A0101_SEQ_0048
Figure 12_A0101_SEQ_0049
Figure 12_A0101_SEQ_0050
Figure 12_A0101_SEQ_0051
Figure 12_A0101_SEQ_0052
Figure 12_A0101_SEQ_0053
Figure 12_A0101_SEQ_0054
Figure 12_A0101_SEQ_0055
Figure 12_A0101_SEQ_0056
Figure 12_A0101_SEQ_0057
Figure 12_A0101_SEQ_0058
Figure 12_A0101_SEQ_0059
Figure 12_A0101_SEQ_0060
Figure 12_A0101_SEQ_0061
Figure 12_A0101_SEQ_0062
Figure 12_A0101_SEQ_0063
Figure 12_A0101_SEQ_0064
Figure 12_A0101_SEQ_0065
Figure 12_A0101_SEQ_0066
Figure 12_A0101_SEQ_0067
Figure 12_A0101_SEQ_0068
Figure 12_A0101_SEQ_0069
Figure 12_A0101_SEQ_0070
Figure 12_A0101_SEQ_0071
Figure 12_A0101_SEQ_0072
Figure 12_A0101_SEQ_0073
Figure 12_A0101_SEQ_0074
Figure 12_A0101_SEQ_0075
Figure 12_A0101_SEQ_0076
Figure 12_A0101_SEQ_0077
Figure 12_A0101_SEQ_0078
Figure 12_A0101_SEQ_0079
Figure 12_A0101_SEQ_0080
Figure 12_A0101_SEQ_0081
Figure 12_A0101_SEQ_0082
Figure 12_A0101_SEQ_0083
Figure 12_A0101_SEQ_0084
Figure 12_A0101_SEQ_0085
Figure 12_A0101_SEQ_0086
Figure 12_A0101_SEQ_0087
Figure 12_A0101_SEQ_0088
Figure 12_A0101_SEQ_0089
Figure 12_A0101_SEQ_0090
Figure 12_A0101_SEQ_0091
Figure 12_A0101_SEQ_0092
Figure 12_A0101_SEQ_0093
Figure 12_A0101_SEQ_0094
Figure 12_A0101_SEQ_0095
Figure 12_A0101_SEQ_0096
Figure 12_A0101_SEQ_0097
Figure 12_A0101_SEQ_0098
Figure 12_A0101_SEQ_0099
Figure 12_A0101_SEQ_0100
Figure 12_A0101_SEQ_0101
Figure 12_A0101_SEQ_0102
Figure 12_A0101_SEQ_0103
Figure 12_A0101_SEQ_0104
Figure 12_A0101_SEQ_0105
Figure 12_A0101_SEQ_0106
Figure 12_A0101_SEQ_0107
Figure 12_A0101_SEQ_0108
Figure 12_A0101_SEQ_0109
Figure 12_A0101_SEQ_0110
Figure 12_A0101_SEQ_0111
Figure 12_A0101_SEQ_0112
Figure 12_A0101_SEQ_0113
Figure 12_A0101_SEQ_0114
Figure 12_A0101_SEQ_0115
Figure 12_A0101_SEQ_0116
Figure 12_A0101_SEQ_0117
Figure 12_A0101_SEQ_0118
Figure 12_A0101_SEQ_0119
Figure 12_A0101_SEQ_0120
Figure 12_A0101_SEQ_0121
Figure 12_A0101_SEQ_0122
Figure 12_A0101_SEQ_0123
Figure 12_A0101_SEQ_0124
Figure 12_A0101_SEQ_0125
Figure 12_A0101_SEQ_0126
Figure 12_A0101_SEQ_0127
Figure 12_A0101_SEQ_0128
Figure 12_A0101_SEQ_0129
Figure 12_A0101_SEQ_0130
Figure 12_A0101_SEQ_0131
Figure 12_A0101_SEQ_0132
Figure 12_A0101_SEQ_0133
Figure 12_A0101_SEQ_0134
Figure 12_A0101_SEQ_0135
Figure 12_A0101_SEQ_0136
Figure 12_A0101_SEQ_0137
Figure 12_A0101_SEQ_0138
Figure 12_A0101_SEQ_0139
Figure 12_A0101_SEQ_0140
Figure 12_A0101_SEQ_0141
Figure 12_A0101_SEQ_0142
Figure 12_A0101_SEQ_0143
Figure 12_A0101_SEQ_0144
Figure 12_A0101_SEQ_0145
Figure 12_A0101_SEQ_0146
Figure 12_A0101_SEQ_0147
Figure 12_A0101_SEQ_0148
Figure 12_A0101_SEQ_0149
Figure 12_A0101_SEQ_0150
Figure 12_A0101_SEQ_0151
Figure 12_A0101_SEQ_0152
Figure 12_A0101_SEQ_0153
Figure 12_A0101_SEQ_0154
Figure 12_A0101_SEQ_0155
Figure 12_A0101_SEQ_0156
Figure 12_A0101_SEQ_0157
Figure 12_A0101_SEQ_0158
Figure 12_A0101_SEQ_0159
Figure 12_A0101_SEQ_0160
Figure 12_A0101_SEQ_0161
Figure 12_A0101_SEQ_0162
Figure 12_A0101_SEQ_0163
Figure 12_A0101_SEQ_0164
Figure 12_A0101_SEQ_0165
Figure 12_A0101_SEQ_0166
Figure 12_A0101_SEQ_0167
Figure 12_A0101_SEQ_0168
Figure 12_A0101_SEQ_0169
Figure 12_A0101_SEQ_0170
Figure 12_A0101_SEQ_0171
Figure 12_A0101_SEQ_0172
Figure 12_A0101_SEQ_0173
Figure 12_A0101_SEQ_0174
Figure 12_A0101_SEQ_0175
Figure 12_A0101_SEQ_0176
Figure 12_A0101_SEQ_0177
Figure 12_A0101_SEQ_0178
Figure 12_A0101_SEQ_0179
Figure 12_A0101_SEQ_0180
Figure 12_A0101_SEQ_0181
Figure 12_A0101_SEQ_0182
Figure 12_A0101_SEQ_0183
Figure 12_A0101_SEQ_0184
Figure 12_A0101_SEQ_0185
Figure 12_A0101_SEQ_0186
Figure 12_A0101_SEQ_0187
Figure 12_A0101_SEQ_0188
Figure 12_A0101_SEQ_0189
Figure 12_A0101_SEQ_0190
Figure 12_A0101_SEQ_0191
Figure 12_A0101_SEQ_0192
Figure 12_A0101_SEQ_0193
Figure 12_A0101_SEQ_0194
Figure 12_A0101_SEQ_0195
Figure 12_A0101_SEQ_0196
Figure 12_A0101_SEQ_0197
Figure 12_A0101_SEQ_0198
Figure 12_A0101_SEQ_0199
Figure 12_A0101_SEQ_0200
Figure 12_A0101_SEQ_0201
Figure 12_A0101_SEQ_0202
Figure 12_A0101_SEQ_0203
Figure 12_A0101_SEQ_0204
Figure 12_A0101_SEQ_0205
Figure 12_A0101_SEQ_0206
Figure 12_A0101_SEQ_0207
Figure 12_A0101_SEQ_0208
Figure 12_A0101_SEQ_0209
Figure 12_A0101_SEQ_0210
Figure 12_A0101_SEQ_0211
Figure 12_A0101_SEQ_0212
Figure 12_A0101_SEQ_0213
Figure 12_A0101_SEQ_0214
Figure 12_A0101_SEQ_0215
Figure 12_A0101_SEQ_0216
Figure 12_A0101_SEQ_0217
Figure 12_A0101_SEQ_0218
Figure 12_A0101_SEQ_0219
Figure 12_A0101_SEQ_0220
Figure 12_A0101_SEQ_0221
Figure 12_A0101_SEQ_0222
Figure 12_A0101_SEQ_0223
Figure 12_A0101_SEQ_0224
Figure 12_A0101_SEQ_0225
Figure 12_A0101_SEQ_0226
Figure 12_A0101_SEQ_0227
Figure 12_A0101_SEQ_0228
Figure 12_A0101_SEQ_0229
Figure 12_A0101_SEQ_0230
Figure 12_A0101_SEQ_0231
Figure 12_A0101_SEQ_0232
Figure 12_A0101_SEQ_0233
Figure 12_A0101_SEQ_0234
Figure 12_A0101_SEQ_0235
Figure 12_A0101_SEQ_0236
Figure 12_A0101_SEQ_0237
Figure 12_A0101_SEQ_0238
Figure 12_A0101_SEQ_0239
Figure 12_A0101_SEQ_0240
Figure 12_A0101_SEQ_0241
Figure 12_A0101_SEQ_0242
Figure 12_A0101_SEQ_0243
Figure 12_A0101_SEQ_0244
Figure 12_A0101_SEQ_0245
Figure 12_A0101_SEQ_0246
Figure 12_A0101_SEQ_0247
Figure 12_A0101_SEQ_0248
Figure 12_A0101_SEQ_0249
Figure 12_A0101_SEQ_0250
Figure 12_A0101_SEQ_0251
Figure 12_A0101_SEQ_0252
Figure 12_A0101_SEQ_0253
Figure 12_A0101_SEQ_0254
Figure 12_A0101_SEQ_0255
Figure 12_A0101_SEQ_0256
Figure 12_A0101_SEQ_0257
Figure 12_A0101_SEQ_0258
Figure 12_A0101_SEQ_0259
Figure 12_A0101_SEQ_0260
Figure 12_A0101_SEQ_0261
Figure 12_A0101_SEQ_0262
Figure 12_A0101_SEQ_0263
Figure 12_A0101_SEQ_0264
Figure 12_A0101_SEQ_0265
Figure 12_A0101_SEQ_0266
Figure 12_A0101_SEQ_0267
Figure 12_A0101_SEQ_0268
Figure 12_A0101_SEQ_0269
Figure 12_A0101_SEQ_0270
Figure 12_A0101_SEQ_0271
Figure 12_A0101_SEQ_0272
Figure 12_A0101_SEQ_0273
Figure 12_A0101_SEQ_0274
Figure 12_A0101_SEQ_0275
Figure 12_A0101_SEQ_0276
Figure 12_A0101_SEQ_0277
Figure 12_A0101_SEQ_0278
Figure 12_A0101_SEQ_0279
Figure 12_A0101_SEQ_0280
Figure 12_A0101_SEQ_0281
Figure 12_A0101_SEQ_0282
Figure 12_A0101_SEQ_0283
Figure 12_A0101_SEQ_0284
Figure 12_A0101_SEQ_0285
Figure 12_A0101_SEQ_0286
Figure 12_A0101_SEQ_0287
Figure 12_A0101_SEQ_0288
Figure 12_A0101_SEQ_0289
Figure 12_A0101_SEQ_0290
Figure 12_A0101_SEQ_0291
Figure 12_A0101_SEQ_0292
Figure 12_A0101_SEQ_0293
Figure 12_A0101_SEQ_0294
Figure 12_A0101_SEQ_0295
Figure 12_A0101_SEQ_0296
Figure 12_A0101_SEQ_0297
Figure 12_A0101_SEQ_0298
Figure 12_A0101_SEQ_0299
Figure 12_A0101_SEQ_0300
Figure 12_A0101_SEQ_0301
Figure 12_A0101_SEQ_0302
Figure 12_A0101_SEQ_0303
Figure 12_A0101_SEQ_0304
Figure 12_A0101_SEQ_0305
Figure 12_A0101_SEQ_0306
Figure 12_A0101_SEQ_0307
Figure 12_A0101_SEQ_0308
Figure 12_A0101_SEQ_0309
Figure 12_A0101_SEQ_0310
Figure 12_A0101_SEQ_0311
Figure 12_A0101_SEQ_0312
Figure 12_A0101_SEQ_0313
Figure 12_A0101_SEQ_0314
Figure 12_A0101_SEQ_0315
Figure 12_A0101_SEQ_0316
Figure 12_A0101_SEQ_0317
Figure 12_A0101_SEQ_0318
Figure 12_A0101_SEQ_0319
Figure 12_A0101_SEQ_0320
Figure 12_A0101_SEQ_0321
Figure 12_A0101_SEQ_0322
Figure 12_A0101_SEQ_0323
Figure 12_A0101_SEQ_0324
Figure 12_A0101_SEQ_0325
Figure 12_A0101_SEQ_0326
Figure 12_A0101_SEQ_0327
Figure 12_A0101_SEQ_0328
Figure 12_A0101_SEQ_0329
Figure 12_A0101_SEQ_0330
Figure 12_A0101_SEQ_0331
Figure 12_A0101_SEQ_0332
Figure 12_A0101_SEQ_0333
Figure 12_A0101_SEQ_0334
Figure 12_A0101_SEQ_0335
Figure 12_A0101_SEQ_0336
Figure 12_A0101_SEQ_0337
Figure 12_A0101_SEQ_0338
Figure 12_A0101_SEQ_0339
Figure 12_A0101_SEQ_0340
Figure 12_A0101_SEQ_0341
Figure 12_A0101_SEQ_0342
Figure 12_A0101_SEQ_0343
Figure 12_A0101_SEQ_0344
Figure 12_A0101_SEQ_0345
Figure 12_A0101_SEQ_0346
Figure 12_A0101_SEQ_0347
Figure 12_A0101_SEQ_0348
Figure 12_A0101_SEQ_0349
Figure 12_A0101_SEQ_0350
Figure 12_A0101_SEQ_0351
Figure 12_A0101_SEQ_0352
Figure 12_A0101_SEQ_0353
Figure 12_A0101_SEQ_0354
Figure 12_A0101_SEQ_0355
Figure 12_A0101_SEQ_0356
Figure 12_A0101_SEQ_0357
Figure 12_A0101_SEQ_0358
Figure 12_A0101_SEQ_0359
Figure 12_A0101_SEQ_0360

Claims (196)

  1. 一種核酸分子,包含編碼一RNA導引之核酸酶(RGN)多肽的一多核苷酸,其中該多核苷酸包含編碼一RGN多肽的一核苷酸序列,該RGN多肽包含與SEQ ID NO:2、4、1、3、及5至109中任一者具有至少90%序列一致性的一胺基酸序列; 其中當與能夠與該標的DNA序列雜合的一導引RNA(gRNA)結合時,該RGN多肽能夠以一RNA導引之序列專一性方式結合一DNA分子的一標的DNA序列,且 其中編碼一RGN多肽的該多核苷酸可操作地聯結至與該多核苷酸異源之一啟動子。
  2. 如請求項1所述的核酸分子,其中該RGN多肽包含與SEQ ID NO:2、4、1、3、及5至109中任一者具有至少95%序列一致性的一胺基酸序列。
  3. 如請求項1所述的核酸分子,其中該RGN多肽包含與SEQ ID NO:2、4、1、3、及5至109中任一者具有100%序列一致性的一胺基酸序列。
  4. 如請求項1至請求項3中任一項所述的核酸分子,其中該標的DNA序列位於為單股的該DNA分子的一區域內。
  5. 如請求項4所述的核酸分子,其中該RGN多肽能夠於結合時剪切該標的DNA序列。
  6. 如請求項1至請求項3中任一項所述的核酸分子,其中該標的DNA序列位於為雙股的該DNA分子的一區域內。
  7. 如請求項6所述的核酸分子,其中該RGN多肽能夠於結合時剪切該標的DNA序列。
  8. 如請求項7所述的核酸分子,其中藉由該RGN多肽之剪切產生一雙股斷裂。
  9. 如請求項7所述的核酸分子,其中藉由該RGN多肽之剪切產生一單股斷裂。
  10. 如請求項6至請求項9中任一項所述的核酸分子,其中該RGN多肽與一鹼基編輯多肽可操作地融合。
  11. 如請求項10所述的核酸分子,其中該鹼基編輯多肽為一脫胺酶。
  12. 如請求項6至請求項11中任一項所述的核酸分子,其中該標的DNA序列與原型間隔體相鄰模體(PAM)相鄰地被安置。
  13. 如請求項1至請求項12中任一項所述的核酸分子,其中該PGN多肽包含一或更多核定位訊號。
  14. 如請求項1至請求項13中任一項所述的核酸分子,其中該RGN多肽針對於一真核細胞中之表現而被密碼子最佳化。
  15. 一種包含如請求項1至請求項14中任一項所述的核酸分子的載體。
  16. 如請求項15所述的載體,進一步包含至少一個核苷酸序列,該至少一個核苷酸序列編碼能夠與該標的DNA序列雜合的該gRNA。
  17. 如請求項16所述的載體,其中該RGN多肽包含與SEQ ID NO:11具有至少90%序列一致性的一胺基酸序列,且該gRNA包含一CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:116具有至少90%序列一致性的一CRISPR重複序列。
  18. 如請求項16所述的載體,其中該RGN多肽包含與SEQ ID NO:11具有至少95%序列一致性的一胺基酸序列,且該gRNA包含一CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:116具有至少95%序列一致性的一CRISPR重複序列。
  19. 如請求項16所述的載體,其中該RGN多肽包含與SEQ ID NO:11具有100%序列一致性的一胺基酸序列,且該gRNA包含一CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:116具有100%序列一致性的一CRISPR重複序列。
  20. 如請求項16所述的載體,其中該gRNA包含一tracrRNA。
  21. 如請求項20所述的載體,其中該tracrRNA選自以下者組成之群組: a)與SEQ ID NO:120具有至少90%序列一致性的一tracrRNA,其中該gRNA進一步包含一CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:111具有至少90%序列一致性的一CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:2具有至少90%序列一致性的一胺基酸序列; b)與SEQ ID NO:123具有至少90%序列一致性的一tracrRNA,其中該gRNA進一步包含一CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:113具有至少90%序列一致性的一CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:4具有至少90%序列一致性的一胺基酸序列; c)與SEQ ID NO:120具有至少90%序列一致性的一tracrRNA,其中該gRNA進一步包含一CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:110具有至少90%序列一致性的一CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:1具有至少90%序列一致性的一胺基酸序列; d)與SEQ ID NO:122具有至少90%序列一致性的一tracrRNA,其中該gRNA進一步包含一CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:112具有至少90%序列一致性的一CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:3具有至少90%序列一致性的一胺基酸序列; e)與SEQ ID NO:124具有至少90%序列一致性的一tracrRNA,其中該gRNA進一步包含一CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:114具有至少90%序列一致性的一CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:5具有至少90%序列一致性的一胺基酸序列; f)與SEQ ID NO:125具有至少90%序列一致性的一tracrRNA,其中該gRNA進一步包含一CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:115具有至少90%序列一致性的一CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:6具有至少90%序列一致性的一胺基酸序列; g)與SEQ ID NO:126具有至少90%序列一致性的一tracrRNA,其中該gRNA進一步包含一CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:117具有至少90%序列一致性的一CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:12具有至少90%序列一致性的一胺基酸序列; h)與SEQ ID NO:127具有至少90%序列一致性的一tracrRNA,其中該gRNA進一步包含一CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:118具有至少90%序列一致性的一CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:13具有至少90%序列一致性的一胺基酸序列;及 i)與SEQ ID NO:128具有至少90%序列一致性的一tracrRNA,其中該gRNA進一步包含一CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:119具有至少90%序列一致性的一CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:16具有至少90%序列一致性的一胺基酸序列。
  22. 如請求項20所述的載體,其中該tracrRNA選自以下者組成之群組: a)與SEQ ID NO:121具有至少95%序列一致性的一tracrRNA,其中該gRNA進一步包含一CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:111具有至少95%序列一致性的一CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:2具有至少95%序列一致性的一胺基酸序列; b)與SEQ ID NO:123具有至少95%序列一致性的一tracrRNA,其中該gRNA進一步包含一CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:113具有至少95%序列一致性的一CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:4具有至少95%序列一致性的一胺基酸序列; c)與SEQ ID NO:120具有至少95%序列一致性的一tracrRNA,其中該gRNA進一步包含一CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:110具有至少95%序列一致性的一CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:1具有至少95%序列一致性的一胺基酸序列; d)與SEQ ID NO:122具有至少95%序列一致性的一tracrRNA,其中該gRNA進一步包含一CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:112具有至少95%序列一致性的一CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:3具有至少95%序列一致性的一胺基酸序列; e)與SEQ ID NO:124具有至少95%序列一致性的一tracrRNA,其中該gRNA進一步包含一CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:114具有至少95%序列一致性的一CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:5具有至少95%序列一致性的一胺基酸序列; f)與SEQ ID NO:125具有至少95%序列一致性的一tracrRNA,其中該gRNA進一步包含一CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:115具有至少95%序列一致性的一CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:6具有至少95%序列一致性的一胺基酸序列; g)與SEQ ID NO:126具有至少95%序列一致性的一tracrRNA,其中該gRNA進一步包含一CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:117具有至少95%序列一致性的CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:12具有至少95%序列一致性的一胺基酸序列; h)與SEQ ID NO:127具有至少95%序列一致性的一tracrRNA,其中該gRNA進一步包含一CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:118具有至少95%序列一致性的一CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:13具有至少95%序列一致性的一胺基酸序列;及 i)與SEQ ID NO:128具有至少95%序列一致性的一tracrRNA,其中該gRNA進一步包含一CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:119具有至少95%序列一致性的一CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:16具有至少95%序列一致性的一胺基酸序列。
  23. 如請求項20所述的載體,其中該tracrRNA選自以下者組成之群組: a)與SEQ ID NO:121具有100%序列一致性的一tracrRNA,其中該gRNA進一步包含一CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:111具有100%序列一致性的一CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:2具有100%序列一致性的一胺基酸序列; b)與SEQ ID NO:123具有100%序列一致性的一tracrRNA,其中該gRNA進一步包含一CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:113具有100%序列一致性的一CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:4具有100%序列一致性的一胺基酸序列; c)與SEQ ID NO:120具有100%序列一致性的一tracrRNA,其中該gRNA進一步包含一CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:110具有100%序列一致性的一CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:1具有100%序列一致性的一胺基酸序列; d)與SEQ ID NO:122具有100%序列一致性的一tracrRNA,其中該gRNA進一步包含一CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:112具有100%序列一致性的一CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:3具有100%序列一致性的一胺基酸序列; e)與SEQ ID NO:124具有100%序列一致性的一tracrRNA,其中該gRNA進一步包含一CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:114具有100%序列一致性的一CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:5具有100%序列一致性的一胺基酸序列; f)與SEQ ID NO:125具有100%序列一致性的一tracrRNA,其中該gRNA進一步包含一CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:115具有100%序列一致性的一CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:6具有100%序列一致性的一胺基酸序列; g)與SEQ ID NO:126具有100%序列一致性的一tracrRNA,其中該gRNA進一步包含一CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:117具有100%序列一致性的一CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:12具有100%序列一致性的一胺基酸序列; h)與SEQ ID NO:127具有100%序列一致性的一tracrRNA,其中該gRNA進一步包含一CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:118具有100%序列一致性的一CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:13具有100%序列一致性的一胺基酸序列;及 i)與SEQ ID NO:128具有100%序列一致性的一tracrRNA,其中該gRNA進一步包含一CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:119具有100%序列一致性的一CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:16具有100%序列一致性的一胺基酸序列。
  24. 如請求項20至請求項23中任一項所述的載體,其中該gRNA為一單導引RNA。
  25. 如請求項20至請求項23中任一項所述的載體,其中該gRNA為一雙導引RNA。
  26. 一種包含如請求項1至請求項14中任一項所述的核酸分子或如請求項15至請求項25中任一項所述的載體的細胞。
  27. 一種製作一RGN多肽的方法,包含在該RGN多肽被表現的條件下,培養如請求項26所述的細胞。
  28. 一種製作一RGN多肽的方法,包含將一異源核酸分子引入一細胞內,該異源核酸分子包含編碼一RNA導引之核酸酶(RGN)多肽的一核苷酸序列,該RNA導引之核酸酶(RGN)多肽包含與SEQ ID NO:2、4、1、3及5至109中任一者具有至少90%序列一致性的一胺基酸序列; 其中當與能夠與該標的DNA序列雜合的一導引RNA(gRNA)結合時,該RGN多肽以一RNA導引之序列專一性方式結合一DNA分子之一標的DNA序列; 且在該RGN多肽被表現的條件下,培養該細胞。
  29. 如請求項28所述的方法,其中該RGN多肽包含與SEQ ID NO:2、4、1、3及5至109中任一者具有至少95%序列一致性的一胺基酸序列。
  30. 如請求項28所述的方法,其中該RGN多肽包含與SEQ ID NO:2、4、1、3及5至109中任一者具有100%序列一致性的一胺基酸序列。
  31. 如請求項28至請求項30中任一項所述的方法,進一步包含純化該RGN多肽。
  32. 如請求項28至請求項30中任一項所述的方法,其中該細胞進一步表現一或更多導引RNA,其與該RGN多肽結合,以形成一RGN核糖核蛋白複合物。
  33. 如請求項32所述的方法,進一步包含純化該RGN核糖核蛋白複合物。
  34. 一種分離的RNA導引之核酸酶(RGN)多肽,其中該RGN多肽包含與SEQ ID NO:2、4、1、3及5至109中任一者具有至少90%序列一致性的一胺基酸序列;及 其中當與能夠與該標的DNA序列雜合的一導引RNA(gRNA)結合時,該RGN多肽能夠以一RNA導引之序列專一性方式結合一DNA分子之一標的DNA序列。
  35. 如請求項34所述的分離的RGN多肽,其中該RGN多肽包含與SEQ ID NO:2、4、1、3及5至109中任一者具有至少90%序列一致性的一胺基酸序列。
  36. 如請求項34所述的分離的RGN多肽,其中該RGN多肽包含與SEQ ID NO:2、4、1、3及5至109中任一者具有100%序列一致性的一胺基酸序列。
  37. 如請求項34至請求項36中任一項所述的分離的RGN多肽,其中該標的DNA序列位於為單股的該DNA分子的一區域內。
  38. 如請求項37所述的分離的RGN多肽,其中該RGN多肽能夠於結合時剪切該標的DNA序列。
  39. 如請求項34至請求項36中任一項所述的分離的RGN多肽,其中該標的DNA序列位於為雙股的該DNA分子的一區域內。
  40. 如請求項39所述的分離的RGN多肽,其中該RGN多肽能夠於結合時剪切該標的DNA序列。
  41. 如請求項40所述的分離的RGN多肽,其中藉由該RGN多肽之剪切產生一雙股斷裂。
  42. 如請求項40所述的分離的RGN多肽,其中藉由該RGN多肽之剪切產生一單股斷裂。
  43. 如請求項39至請求項42中任一項所述的分離的RGN多肽,其中該RGN多肽與一鹼基編輯多肽可操作地融合。
  44. 如請求項43所述的分離的RGN多肽,其中該鹼基編輯多肽為一脫胺酶。
  45. 如請求項34至請求項44中任一項所述的分離的RGN多肽,其中該標的DNA序列與一原型間隔體相鄰模體(PAM)相鄰地被安置。
  46. 如請求項34至請求項45中任一項所述的分離的RGN多肽,其中該RGN多肽包含一或更多核定位訊號。
  47. 一種用於結合一DNA分子之一標的DNA序列的系統,該系統包含: a)能夠與該標的DNA分子雜合的一或更多導引RNA,或包含編碼該一或更多導引RNA(gRNA)的一或更多核苷酸序列的一或更多多核苷酸;及 b)包含與SEQ ID NO:2、4、1、3及5至109中任一者具有至少90%序列一致性的一胺基酸序列的一RNA導引之核酸酶(RGN)多肽,或包含編碼該RGN多肽的一核苷酸序列的一多核苷酸; 其中編碼該一或更多導引RNA的至少一個該核苷酸序列及編碼該RGN多肽的該核苷酸序列可操作地聯結至與該核苷酸序列異源的一啟動子;且 其中該一或更多導引RNA能夠與該RGN多肽形成一複合物,以便將該RGN多肽導向至與該DNA分子之該標的DNA序列結合。
  48. 一種用於結合一DNA分子之一標的DNA序列的系統,該系統包含: a)能夠與該標的DNA分子雜合的一或更多導引RNA,或包含編碼該一或更多導引RNA(gRNA)的一或更多核苷酸序列的一或更多多核苷酸;及 b)包含與SEQ ID NO:2、4、1、3及5至109中任一者具有至少90%序列一致性的一胺基酸序列的一RNA導引之核酸酶(RGN)多肽; 其中該一或更多導引RNA能夠與該標的DNA序列雜合,且 其中該一或更多導引RNA能夠與該RGN多肽形成複合物,以便將該RGN多肽導向至與該DNA分子之該標的DNA序列結合。
  49. 如請求項48所述的系統,其中編碼該一或更多導引RNA的至少一個該核苷酸序列可操作地聯結至與該核苷酸序列異源的一啟動子。
  50. 如請求項47至請求項49中任一項所述的系統,其中該RGN多肽包含與SEQ ID NO:2、4、1、3及5至109中任一者具有至少95%序列一致性的一胺基酸序列。
  51. 如請求項47至請求項49中任一項所述的系統,其中該RGN多肽包含與SEQ ID NO:2、4、1、3及5至109中任一者具有100%序列一致性的一胺基酸序列。
  52. 如請求項47至請求項51中任一項所述的系統,其中未發現該RGN多肽與該一或更多導引RNA在本質上彼此複合。
  53. 如請求項47至請求項51中任一項所述的系統,其中該標的DNA序列為一真核標的DNA序列。
  54. 如請求項47至請求項53中任一項所述的系統,其中該RGN多肽包含與SEQ ID NO:11具有至少90%序列一致性的一胺基酸序列且該一或更多導引RNA包含一CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:116具有至少90%序列一致性的一CRISPR重複序列。
  55. 如請求項47至請求項53中任一項所述的系統,其中該RGN多肽包含與SEQ ID NO:11具有至少95%序列一致性的一胺基酸序列且該一或更多導引RNA包含一CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:116具有至少95%序列一致性的一CRISPR重複序列。
  56. 如請求項47至請求項53中任一項所述的系統,其中該RGN多肽包含與SEQ ID NO:11具有100%序列一致性的一胺基酸序列且該一或更多導引RNA包含一CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:116具有100%序列一致性的一CRISPR重複序列。
  57. 如請求項47至請求項53中任一項所述的系統,其中該一或更多導引RNA包含一tracrRNA。
  58. 如請求項57所述的系統,其中該tracrRNA選自以下者組成之群組: a)與SEQ ID NO:121具有至少90%序列一致性的一tracrRNA,其中該一或更多導引RNA進一步包含一CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:111具有至少90%序列一致性的一CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:2具有至少90%序列一致性的一胺基酸序列; b)與SEQ ID NO:123具有至少90%序列一致性的一tracrRNA,其中該一或更多導引RNA進一步包含一CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:113具有至少90%序列一致性的一CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:4具有至少90%序列一致性的一胺基酸序列; c)與SEQ ID NO:120具有至少90%序列一致性的一tracrRNA,其中該一或更多導引RNA進一步包含一CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:110具有至少90%序列一致性的一CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:1具有至少90%序列一致性的一胺基酸序列; d)與SEQ ID NO:122具有至少90%序列一致性的一tracrRNA,其中該一或更多導引RNA進一步包含一CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:112具有至少90%序列一致性的一CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:3具有至少90%序列一致性的一胺基酸序列; e)與SEQ ID NO:124具有至少90%序列一致性的一tracrRNA,其中該一或更多導引RNA進一步包含一CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:114具有至少90%序列一致性的一CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:5具有至少90%序列一致性的一胺基酸序列; f)與SEQ ID NO:125具有至少90%序列一致性的一tracrRNA,其中該一或更多導引RNA進一步包含一CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:115具有至少90%序列一致性的一CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:6具有至少90%序列一致性的一胺基酸序列; g)與SEQ ID NO:126具有至少90%序列一致性的一tracrRNA,其中該一或更多導引RNA進一步包含一CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:117具有至少90%序列一致性的一CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:12具有至少90%序列一致性的一胺基酸序列; h)與SEQ ID NO:127具有至少90%序列一致性的一tracrRNA,其中該一或更多導引RNA進一步包含一CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:118具有至少90%序列一致性的一CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:13具有至少90%序列一致性的一胺基酸序列;及 i)與SEQ ID NO:128具有至少90%序列一致性的一tracrRNA,其中該一或更多導引RNA進一步包含一CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:119具有至少90%序列一致性的一CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:16具有至少90%序列一致性的一胺基酸序列。
  59. 如請求項57所述的系統,其中該tracrRNA選自以下者組成之群組: a)與SEQ ID NO:121具有至少95%序列一致性的一tracrRNA,其中該一或更多導引RNA進一步包含一CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:111具有至少95%序列一致性的一CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:2具有至少95%序列一致性的一胺基酸序列; b)與SEQ ID NO:123具有至少95%序列一致性的一tracrRNA,其中該一或更多導引RNA進一步包含一CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:113具有至少95%序列一致性的一CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:4具有至少95%序列一致性的一胺基酸序列; c)與SEQ ID NO:120具有至少95%序列一致性的一tracrRNA,其中該一或更多導引RNA進一步包含一CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:110具有至少95%序列一致性的一CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:1具有至少95%序列一致性的一胺基酸序列; d)與SEQ ID NO:122具有至少95%序列一致性的一tracrRNA,其中該一或更多導引RNA進一步包含一CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:112具有至少95%序列一致性的一CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:3具有至少95%序列一致性的一胺基酸序列; e)與SEQ ID NO:124具有至少95%序列一致性的一tracrRNA,其中該一或更多導引RNA進一步包含一CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:114具有至少95%序列一致性的一CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:5具有至少95%序列一致性的一胺基酸序列; f)與SEQ ID NO:125具有至少95%序列一致性的一tracrRNA,其中該一或更多導引RNA進一步包含一CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:115具有至少95%序列一致性的一CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:6具有至少95%序列一致性的一胺基酸序列; g)與SEQ ID NO:126具有至少95%序列一致性的一tracrRNA,其中該一或更多導引RNA進一步包含一CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:117具有至少95%序列一致性的一CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:12具有至少95%序列一致性的一胺基酸序列; h)與SEQ ID NO:127具有至少95%序列一致性的一tracrRNA,其中該一或更多導引RNA進一步包含一CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:118具有至少95%序列一致性的一CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:13具有至少95%序列一致性的一胺基酸序列;及 i)與SEQ ID NO:128具有至少95%序列一致性的一tracrRNA,其中該一或更多導引RNA進一步包含一CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:119具有至少95%序列一致性的一CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:16具有至少95%序列一致性的一胺基酸序列。
  60. 如請求項57所述的系統,其中該tracrRNA選自以下者組成之群組: a)與SEQ ID NO:121具有100%序列一致性的一tracrRNA,其中該一或更多導引RNA進一步包含一CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:111具有100%序列一致性的一CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:2具有100%序列一致性的一胺基酸序列; b)與SEQ ID NO:123具有100%序列一致性的一tracrRNA,其中該一或更多導引RNA進一步包含一CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:113具有100%序列一致性的一CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:4具有100%序列一致性的一胺基酸序列; c)與SEQ ID NO:120具有100%序列一致性的一tracrRNA,其中該一或更多導引RNA進一步包含一CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:110具有100%序列一致性的一CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:1具有100%序列一致性的一胺基酸序列; d)與SEQ ID NO:122具有100%序列一致性的一tracrRNA,其中該一或更多導引RNA進一步包含一CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:112具有100%序列一致性的一CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:3具有100%序列一致性的一胺基酸序列; e)與SEQ ID NO:124具有100%序列一致性的一tracrRNA,其中該一或更多導引RNA進一步包含一CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:114具有100%序列一致性的一CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:5具有100%序列一致性的一胺基酸序列; f)與SEQ ID NO:125具有100%序列一致性的一tracrRNA,其中該一或更多導引RNA進一步包含一CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:115具有100%序列一致性的一CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:6具有100%序列一致性的一胺基酸序列; g)與SEQ ID NO:126具有100%序列一致性的一tracrRNA,其中該一或更多導引RNA進一步包含一CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:117具有100%序列一致性的一CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:12具有100%序列一致性的一胺基酸序列; h)與SEQ ID NO:127具有100%序列一致性的一tracrRNA,其中該一或更多導引RNA進一步包含一CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:118具有100%序列一致性的一CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:13具有100%序列一致性的一胺基酸序列;及 i)與SEQ ID NO:128具有100%序列一致性的一tracrRNA,其中該一或更多導引RNA進一步包含一CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:119具有100%序列一致性的一CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:16具有100%序列一致性的一胺基酸序列。
  61. 如請求項57至請求項60中任一項所述的系統,其中該一或更多導引RNA為一單導引RNA(sgRNA)。
  62. 如請求項57至請求項60中任一項所述的系統,其中該一或更多導引RNA為一雙導引RNA。
  63. 如請求項47至請求項62中任一項所述的系統,其中該標的DNA序列位於一細胞內。
  64. 如請求項63所述的系統,其中該細胞為一真核細胞。
  65. 如請求項64所述的系統,其中該真核細胞為一植物細胞。
  66. 如請求項64所述的系統,其中該真核細胞為一哺乳動物細胞。
  67. 如請求項64所述的系統,其中該真核細胞為一昆蟲細胞。
  68. 如請求項63所述的系統,其中該細胞為一原核細胞。
  69. 如請求項47至請求項68中任一項所述的系統,其中該標的DNA序列位於為單股的該DNA分子的一區域內。
  70. 如請求項69所述的系統,其中當被轉錄時,該一或更多導引RNA能夠與該標的DNA序列雜合,且該導引RNA能夠與該RGN多肽形成一複合物,以導向該標的DNA序列的剪切。
  71. 如請求項47至請求項68中任一項所述的系統,其中該標的DNA序列位於為雙股的該DNA分子的一區域內。
  72. 如請求項71所述的系統,其中當被轉錄時,該一或更多導引RNA能夠與該標的DNA序列雜合,且該導引RNA能夠與該RGN多肽形成一複合物,以導向該標的DNA序列的剪切。
  73. 如請求項72所述的系統,其中該RGN多肽能夠產生一雙股斷裂。
  74. 如請求項72所述的系統,其中該RGN多肽能夠產生一單股斷裂。
  75. 如請求項71至請求項74中任一項所述的系統,其中該RGN多肽可操作地聯結至一鹼基編輯多肽。
  76. 如請求項75所述的系統,其中該鹼基編輯多肽為一脫胺酶。
  77. 如請求項71至請求項76中任一項所述的系統,其中該標的DNA序列與一原型間隔體相鄰模體(PAM)相鄰地被安置。
  78. 如請求項47至請求項77中任一項所述的系統,其中該RGN多肽包含一或更多核定位訊號。
  79. 如請求項47至請求項78中任一項所述的系統,其中該RGN多肽針對於一真核細胞中之表現而被密碼子最佳化。
  80. 如請求項47至請求項79中任一項所述的系統,其中包含編碼該一或更多導引RNA的該核苷酸序列的多核苷酸及包含編碼一RGN多肽的該核苷酸序列的該多核苷酸被安置於一個載體上。
  81. 如請求項47至請求項80中任一項所述的系統,其中該系統進一步包含一或更多供體多核苷酸或包含編碼該一或更多供體多核苷酸的一或更多核苷酸序列的一或更多多核苷酸。
  82. 一種醫藥組合物,包含如請求項1至請求項14中任一項所述的核酸分子、如請求項15至請求項25中任一項所述的載體、如請求項26所述的細胞、如請求項34至請求項46中任一項所述的分離的RGN多肽、或如請求項47至請求項81中任一項所述的系統、及一醫藥學上可接受之載劑。
  83. 一種結合一DNA分子之一標的DNA序列的方法,包含將如請求項47至請求項81中任一項所述的一系統遞送至該標的DNA序列或包含該標的DNA序列的一細胞。
  84. 如請求項83所述的方法,其中該RGN多肽或該導引RNA進一步包含一可檢測示蹤物,從而允許對該標的DNA序列的檢測。
  85. 如請求項83所述的方法,其中該導引RNA或該RGN多肽進一步包含一表現調控子,從而調控該標的DNA序列的或受該標的DNA序列的轉錄控制下的一基因的表現。
  86. 一種剪切一DNA分子之一標的DNA序列的方法,包含將如請求項47至請求項81中任一項所述的一系統遞送至該標的DNA序列或包含該標的DNA序列的一細胞。
  87. 如請求項86所述的方法,其中該經修飾的標的DNA序列包含異源DNA於該標的DNA序列內的插入。
  88. 如請求項86所述的方法,其中該經修飾的標的DNA序列包含至少一個核苷酸自該標的DNA序列的刪除。
  89. 如請求項86所述的方法,其中該經修飾的標的DNA序列包含該標的DNA序列中的至少一個核苷酸的突變。
  90. 一種用於結合一DNA分子之一標的DNA序列的方法,該方法包含: a)藉由組合以下者,以在體外將一RNA導引之核酸酶(RGN)核糖核苷酸複合物在適合形成該RGN核糖核苷酸複合物的條件下進行組裝: i)能夠與該標的DNA序列雜合的一或更多導引RNA;及 ii)一RGN多肽,該RGN多肽包含與SEQ ID NO:2、4、1、3及5至109中任一者具有至少90%序列一致性的一胺基酸序列;及 b)使該標的DNA序列或包含該標的DNA序列的一細胞與該在體外組裝的RGN核糖核苷酸複合物接觸; 其中該一或更多導引RNA與該標的DNA序列雜合,從而將該RGN多肽導向至與該標的DNA序列結合。
  91. 如請求項90所述的方法,其中該標的DNA序列位於為單股的該DNA分子的一區域內。
  92. 如請求項90所述的方法,其中該標的DNA序列位於為雙股的該DNA分子的一區域內。
  93. 如請求項92所述的方法, 其中該標的DNA序列與一原型間隔體相鄰模體(PAM)相鄰地被安置。
  94. 如請求項90至請求項93中任一項所述的方法, 其中該RGN多肽或該導引RNA進一步包含一可檢測示蹤物,從而允許對該標的DNA序列的檢測。
  95. 如請求項90至請求項93中任一項所述的方法, 其中該導引RNA或該RGN多肽進一步包含一表現調控子,從而允許對該標的DNA序列的表現的該調控。
  96. 一種用於剪切及/或修飾一DNA分子之一標的DNA序列的方法,包含使該DNA分子與以下者接觸: a)一RNA導引之核酸酶(RGN)多肽,其中該RGN包含與SEQ ID NO:2、4、1、3及5至109中任一者具有至少90%序列一致性的一胺基酸序列;及 b)能夠將(a)的該RGN靶向至該標的DNA序列的一或更多導引RNA; 其中該一或更多導引RNA與該標的DNA序列雜合,從而將該RGN多肽導向至與該標的DNA序列結合,並且發生該標的DNA序列的剪切及/或修飾。
  97. 如請求項96所述的方法,其中該標的DNA序列位於為單股的該DNA分子的一區域內。
  98. 如請求項96所述的方法,其中該標的DNA序列位於為雙股的該DNA分子的一區域內。
  99. 如請求項98所述的方法,其中藉由該RGN多肽之剪切產生一雙股斷裂。
  100. 如請求項98所述的方法,其中藉由該RGN多肽之剪切產生一單股斷裂。
  101. 如請求項98至請求項100中任一項所述的方法,其中該RGN多肽可操作地聯結至一鹼基編輯多肽。
  102. 如請求項101所述的方法,其中該鹼基編輯多肽為一脫胺酶。
  103. 如請求項98至請求項102中任一項所述的方法,其中該標的DNA序列與一原型間隔體相鄰模體(PAM)相鄰地被安置。
  104. 如請求項96至請求項103中任一項所述的方法,其中該經修飾的標的DNA序列包含異源DNA於該標的DNA序列內的插入。
  105. 如請求項96至請求項103中任一項所述的方法,其中該經修飾的標的DNA序列包含至少一個核苷酸自該標的DNA序列的刪除。
  106. 如請求項96至請求項103中任一項所述的方法,其中該經修飾的標的DNA序列包含該標的DNA序列中的至少一個核苷酸的突變。
  107. 如請求項90至請求項106中任一項所述的方法,其中該RGN包含與SEQ ID NO:2、4、1、3及5至109任一者具有至少95%序列一致性的一胺基酸序列。
  108. 如請求項90至請求項106中任一項所述的方法,其中該RGN包含與SEQ ID NO:2、4、1、3及5至109中任一者具有100%序列一致性的一胺基酸序列。
  109. 如請求項90至請求項108中任一項所述的方法,其中未發現該RGN多肽與該一或更多導引RNA在本質上彼此複合。
  110. 如請求項90至請求項109中任一項所述的方法,其中該標的DNA序列為一真核標的DNA序列。
  111. 如請求項90至請求項110中任一項所述的方法,其中該RGN多肽包含與SEQ ID NO:11具有至少90%序列一致性的一胺基酸序列且該一或更多導引RNA包含一CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:116具有至少90%序列一致性的一CRISPR重複序列。
  112. 如請求項90至請求項110中任一項所述的方法,其中該RGN多肽包含與SEQ ID NO:11具有至少95%序列一致性的一胺基酸序列且該一或更多導引RNA包含一CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:116具有至少95%序列一致性的一CRISPR重複序列。
  113. 如請求項90至請求項110中任一項所述的方法,其中該RGN多肽包含與SEQ ID NO:11具有100%序列一致性的一胺基酸序列且該一或更多導引RNA包含一CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:116具有100%序列一致性的一CRISPR重複序列。
  114. 如請求項90至請求項110中任一項所述的方法,其中該一或更多導引RNA包含一tracrRNA。
  115. 如請求項114所述的方法,其中該tracrRNA選自以下者組成之群組: a)與SEQ ID NO:121具有至少90%序列一致性的一tracrRNA,其中該一或更多導引RNA進一步包含一CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:111具有至少90%序列一致性的一CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:2具有至少90%序列一致性的一胺基酸序列; b)與SEQ ID NO:123具有至少90%序列一致性的一tracrRNA,其中該一或更多導引RNA進一步包含一CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:113具有至少90%序列一致性的一CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:4具有至少90%序列一致性的一胺基酸序列; c)與SEQ ID NO:120具有至少90%序列一致性的一tracrRNA,其中該一或更多導引RNA進一步包含一CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:110具有至少90%序列一致性的一CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:1具有至少90%序列一致性的一胺基酸序列; d)與SEQ ID NO:122具有至少90%序列一致性的一tracrRNA,其中該一或更多導引RNA進一步包含一CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:112具有至少90%序列一致性的一CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:3具有至少90%序列一致性的一胺基酸序列; e)與SEQ ID NO:124具有至少90%序列一致性的一tracrRNA,其中該一或更多導引RNA進一步包含一CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:114具有至少90%序列一致性的一CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:5具有至少90%序列一致性的一胺基酸序列; f)與SEQ ID NO:125具有至少90%序列一致性的一tracrRNA,其中該一或更多導引RNA進一步包含一CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:115具有至少90%序列一致性的一CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:6具有至少90%序列一致性的一胺基酸序列; g)與SEQ ID NO:126具有至少90%序列一致性的一tracrRNA,其中該一或更多導引RNA進一步包含一CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:117具有至少90%序列一致性的一CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:12具有至少90%序列一致性的一胺基酸序列; h)與SEQ ID NO:127具有至少90%序列一致性的一tracrRNA,其中該一或更多導引RNA進一步包含一CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:118具有至少90%序列一致性的一CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:13具有至少90%序列一致性的一胺基酸序列;及 i)與SEQ ID NO:128具有至少90%序列一致性的一tracrRNA,其中該一或更多導引RNA進一步包含一CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:119具有至少90%序列一致性的一CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:16具有至少90%序列一致性的一胺基酸序列。
  116. 如請求項114所述的方法,其中該tracrRNA選自以下者組成之群組: a)與SEQ ID NO:121具有至少95%序列一致性的一tracrRNA,其中該一或更多導引RNA進一步包含一CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:111具有至少95%序列一致性的一CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:2具有至少95%序列一致性的一胺基酸序列; b)與SEQ ID NO:123具有至少95%序列一致性的一tracrRNA,其中該一或更多導引RNA進一步包含一CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:113具有至少95%序列一致性的一CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:4具有至少95%序列一致性的一胺基酸序列; c)與SEQ ID NO:120具有至少95%序列一致性的一tracrRNA,其中該一或更多導引RNA進一步包含一CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:110具有至少95%序列一致性的一CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:1具有至少95%序列一致性的一胺基酸序列; d)與SEQ ID NO:122具有至少95%序列一致性的一tracrRNA,其中該一或更多導引RNA進一步包含一CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:112具有至少95%序列一致性的一CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:3具有至少95%序列一致性的一胺基酸序列; e)與SEQ ID NO:124具有至少95%序列一致性的一tracrRNA,其中該一或更多導引RNA進一步包含一CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:114具有至少95%序列一致性的一CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:5具有至少95%序列一致性的一胺基酸序列; f)與SEQ ID NO:125具有至少95%序列一致性的一tracrRNA,其中該一或更多導引RNA進一步包含一CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:115具有至少95%序列一致性的一CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:6具有至少95%序列一致性的一胺基酸序列; g)與SEQ ID NO:126具有至少95%序列一致性的一tracrRNA,其中該一或更多導引RNA進一步包含一CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:117具有至少95%序列一致性的一CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:12具有至少95%序列一致性的一胺基酸序列; h)與SEQ ID NO:127具有至少95%序列一致性的一tracrRNA,其中該一或更多導引RNA進一步包含一CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:118具有至少95%序列一致性的一CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:13具有至少95%序列一致性的一胺基酸序列;及 i)與SEQ ID NO:128具有至少95%序列一致性的一tracrRNA,其中該一或更多導引RNA進一步包含一CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:119具有至少95%序列一致性的一CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:16具有至少95%序列一致性的一胺基酸序列。
  117. 如請求項114所述的方法,其中該tracrRNA選自以下者組成之群組: a)與SEQ ID NO:121具有100%序列一致性的一tracrRNA,其中該一或更多導引RNA進一步包含一CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:111具有100%序列一致性的一CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:2具有100%序列一致性的一胺基酸序列; b)與SEQ ID NO:123具有100%序列一致性的一tracrRNA,其中該一或更多導引RNA進一步包含一CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:113具有100%序列一致性的一CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:4具有100%序列一致性的一胺基酸序列; c)與SEQ ID NO:120具有100%序列一致性的一tracrRNA,其中該一或更多導引RNA進一步包含一CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:110具有100%序列一致性的一CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:1具有100%序列一致性的一胺基酸序列; d)與SEQ ID NO:122具有100%序列一致性的一tracrRNA,其中該一或更多導引RNA進一步包含一CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:112具有100%序列一致性的一CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:3具有100%序列一致性的一胺基酸序列; e)與SEQ ID NO:124具有100%序列一致性的一tracrRNA,其中該一或更多導引RNA進一步包含一CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:114具有100%序列一致性的一CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:5具有100%序列一致性的一胺基酸序列; f)與SEQ ID NO:125具有100%序列一致性的一tracrRNA,其中該一或更多導引RNA進一步包含一CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:115具有100%序列一致性的一CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:6具有100%序列一致性的一胺基酸序列; g)與SEQ ID NO:126具有100%序列一致性的一tracrRNA,其中該一或更多導引RNA進一步包含一CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:117具有100%序列一致性的一CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:12具有100%序列一致性的一胺基酸序列; h)與SEQ ID NO:127具有100%序列一致性的一tracrRNA,其中該一或更多導引RNA進一步包含一CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:118具有100%序列一致性的一CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:13具有100%序列一致性的一胺基酸序列;及 i)與SEQ ID NO:128具有100%序列一致性的一tracrRNA,其中該一或更多導引RNA進一步包含一CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:119具有100%序列一致性的一CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:16具有100%序列一致性的一胺基酸序列。
  118. 如請求項114至請求項117中任一項所述的方法,其中該一或更多導引RNA為一單導引RNA(sgRNA)。
  119. 如請求項114至請求項117中任一項所述的方法,其中該一或更多導引RNA為一雙導引RNA。
  120. 如請求項83至請求項119中任一項所述的方法,其中該標的DNA序列位於一細胞內。
  121. 如請求項120所述的方法,其中該細胞為一真核細胞。
  122. 如請求項121所述的方法,其中該真核細胞為一植物細胞。
  123. 如請求項121所述的方法,其中該真核細胞為一哺乳動物細胞。
  124. 如請求項121所述的方法,其中該真核細胞為一昆蟲細胞。
  125. 如請求項120所述的方法,其中該細胞為一原核細胞。
  126. 一種如請求項96至請求項119中任一項所述的方法包含一經修飾的標的DNA序列的細胞。
  127. 如請求項126所述的細胞,其中該細胞為一真核細胞。
  128. 如請求項127所述的細胞,其中該真核細胞為一植物細胞。
  129. 一種包含如請求項128所述的細胞的植物。
  130. 一種包含如請求項128所述的細胞的種子。
  131. 如請求項127所述的細胞,其中該真核細胞為一哺乳動物細胞。
  132. 如請求項131所述的細胞,其中該哺乳動物細胞為一人類細胞。
  133. 如請求項132所述的細胞,其中該人類細胞為一免疫細胞。
  134. 如請求項133所述的細胞,其中該人類細胞為一幹細胞。
  135. 如請求項134所述的細胞,其中該幹細胞為一經誘導之多能幹細胞。
  136. 如請求項127所述的細胞,其中該真核細胞為一昆蟲細胞。
  137. 如請求項126所述的細胞,其中該細胞為一原核細胞。
  138. 一種包含實施方式127及131-135中任一項所述的細胞的醫藥組合物、及一醫藥學上可接受之載劑。
  139. 一種用於檢測一樣本中的一DNA分子的一標的DNA序列的套組,該套組包含: a)包含與SEQ ID NO:2、4、1、3及5至109中任一者具有至少90%序列一致性的一胺基酸序列的一RNA導引之核酸酶(RGN)多肽或包含編碼該RGN多肽的一核苷酸序列的一多核苷酸,其中當與能夠與該標的DNA序列雜合的一導引RNA結合時,該RGN多肽能夠以一RNA導引之序列專一性方式結合及剪切一DNA分子的該標的DNA序列; b)該導引RNA或包含編碼該導引RNA的一核苷酸序列的一多核苷酸;及 c)不與該導引RNA雜合的一檢測單股DNA(ssDNA)。
  140. 如請求項139所述的套組,其中該RGN多肽包含與SEQ ID NO:2、4、1、3及5至109中任一者具有至少95%序列一致性的一胺基酸序列。
  141. 如請求項139所述的套組,其中該RGN多肽包含與SEQ ID NO:2、4、1、3及5至109中任一者具有100%序列一致性的一胺基酸序列。
  142. 如請求項139至請求項141中任一項所述的套組,其中編碼該導引RNA的至少一個該核苷酸序列及編碼該RGN多肽的該核苷酸序列可操作地聯結至與該核苷酸序列異源的一啟動子。
  143. 如請求項139至請求項142中任一項所述的套組,其中未發現該RGN多肽與該一或更多導引RNA在本質上彼此複合。
  144. 如請求項139至請求項142中任一項所述的套組,其中該標的DNA序列為一真核標的DNA序列。
  145. 如請求項139至請求項144中任一項所述的套組,其中該檢測ssDNA包含一螢光團/淬滅劑對。
  146. 如請求項139至請求項144中任一項所述的套組,其中該檢測ssDNA包含一螢光共振能量轉移(FRET)對。
  147. 如請求項139至請求項146中任一項所述的套組,其中該RGN多肽包含與SEQ ID NO:11具有至少90%序列一致性的一胺基酸序列,且該一或更多導引RNA包含一CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:116具有至少90%序列一致性的一CRISPR重複序列。
  148. 如請求項139至請求項146中任一項所述的套組,其中該RGN多肽包含與SEQ ID NO:11具有至少95%序列一致性的一胺基酸序列,且該一或更多導引RNA包含一CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:116具有至少95%序列一致性的一CRISPR重複序列。
  149. 如請求項139至請求項146中任一項所述的套組,其中該RGN多肽包含與SEQ ID NO:11具有100%序列一致性的一胺基酸序列,且該一或更多導引RNA包含一CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:116具有100%序列一致性的一CRISPR重複序列。
  150. 如請求項139至請求項146中任一項所述的套組,其中該一或更多導引gRNA包含一tracrRNA。
  151. 如請求項150所述的套組,其中該tracrRNA選自以下者組成之群組: a)與SEQ ID NO:121具有至少90%序列一致性的一tracrRNA,其中該一或更多導引RNA進一步包含一CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:111具有至少90%序列一致性的一CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:2具有至少90%序列一致性的一胺基酸序列; b)與SEQ ID NO:123具有至少90%序列一致性的一tracrRNA,其中該一或更多導引RNA進一步包含一CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:113具有至少90%序列一致性的一CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:4具有至少90%序列一致性的一胺基酸序列; c)與SEQ ID NO:120具有至少90%序列一致性的一tracrRNA,其中該一或更多導引RNA進一步包含一CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:110具有至少90%序列一致性的一CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:1具有至少90%序列一致性的一胺基酸序列; d)與SEQ ID NO:122具有至少90%序列一致性的一tracrRNA,其中該一或更多導引RNA進一步包含一CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:112具有至少90%序列一致性的一CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:3具有至少90%序列一致性的一胺基酸序列; e)與SEQ ID NO:124具有至少90%序列一致性的一tracrRNA,其中該一或更多導引RNA進一步包含一CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:114具有至少90%序列一致性的一CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:5具有至少90%序列一致性的一胺基酸序列; f)與SEQ ID NO:125具有至少90%序列一致性的一tracrRNA,其中該一或更多導引RNA進一步包含一CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:115具有至少90%序列一致性的一CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:6具有至少90%序列一致性的一胺基酸序列; g)與SEQ ID NO:126具有至少90%序列一致性的一tracrRNA,其中該一或更多導引RNA進一步包含一CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:117具有至少90%序列一致性的一CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:12具有至少90%序列一致性的一胺基酸序列; h)與SEQ ID NO:127具有至少90%序列一致性的一tracrRNA,其中該一或更多導引RNA進一步包含一CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:118具有至少90%序列一致性的一CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:13具有至少90%序列一致性的一胺基酸序列;及 i)與SEQ ID NO:128具有至少90%序列一致性的一tracrRNA,其中該一或更多導引RNA進一步包含一CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:119具有至少90%序列一致性的一CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:16具有至少90%序列一致性的一胺基酸序列。
  152. 如請求項150所述的套組,其中該tracrRNA選自以下者組成之群組: a)與SEQ ID NO:121具有至少95%序列一致性的一tracrRNA,其中該一或更多導引RNA進一步包含一CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:111具有至少95%序列一致性的一CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:2具有至少95%序列一致性的一胺基酸序列; b)與SEQ ID NO:123具有至少95%序列一致性的一tracrRNA,其中該一或更多導引RNA進一步包含一CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:113具有至少95%序列一致性的一CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:4具有至少95%序列一致性的一胺基酸序列; c)與SEQ ID NO:120具有至少95%序列一致性的一tracrRNA,其中該一或更多導引RNA進一步包含一CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:110具有至少95%序列一致性的一CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:1具有至少95%序列一致性的一胺基酸序列; d)與SEQ ID NO:122具有至少95%序列一致性的一tracrRNA,其中該一或更多導引RNA進一步包含一CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:112具有至少95%序列一致性的一CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:3具有至少95%序列一致性的一胺基酸序列; e)與SEQ ID NO:124具有至少95%序列一致性的一tracrRNA,其中該一或更多導引RNA進一步包含一CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:114具有至少95%序列一致性的一CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:5具有至少95%序列一致性的一胺基酸序列; f)與SEQ ID NO:125具有至少95%序列一致性的一tracrRNA,其中該一或更多導引RNA進一步包含一CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:115具有至少95%序列一致性的一CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:6具有至少95%序列一致性的一胺基酸序列; g)與SEQ ID NO:126具有至少95%序列一致性的一tracrRNA,其中該一或更多導引RNA進一步包含一CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:117具有至少95%序列一致性的一CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:12具有至少95%序列一致性的一胺基酸序列; h)與SEQ ID NO:127具有至少95%序列一致性的一tracrRNA,其中該一或更多導引RNA進一步包含一CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:118具有至少95%序列一致性的一CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:13具有至少95%序列一致性的一胺基酸序列;及 i)與SEQ ID NO:128具有至少95%序列一致性的一tracrRNA,其中該一或更多導引RNA進一步包含一CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:119具有至少95%序列一致性的一CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:16具有至少95%序列一致性的一胺基酸序列。
  153. 如請求項150所述的套組,其中該tracrRNA選自以下者組成之群組: a)與SEQ ID NO:121具有100%序列一致性的一tracrRNA,其中該一或更多導引RNA進一步包含一CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:111具有100%序列一致性的一CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:2具有100%序列一致性的一胺基酸序列; b)與SEQ ID NO:123具有100%序列一致性的一tracrRNA,其中該一或更多導引RNA進一步包含一CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:113具有100%序列一致性的一CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:4具有100%序列一致性的一胺基酸序列; c)與SEQ ID NO:120具有100%序列一致性的一tracrRNA,其中該一或更多導引RNA進一步包含一CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:110具有100%序列一致性的一CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:1具有100%序列一致性的一胺基酸序列; d)與SEQ ID NO:122具有100%序列一致性的一tracrRNA,其中該一或更多導引RNA進一步包含一CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:112具有100%序列一致性的一CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:3具有100%序列一致性的一胺基酸序列; e)與SEQ ID NO:124具有100%序列一致性的一tracrRNA,其中該一或更多導引RNA進一步包含一CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:114具有100%序列一致性的一CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:5具有100%序列一致性的一胺基酸序列; f)與SEQ ID NO:125具有100%序列一致性的一tracrRNA,其中該一或更多導引RNA進一步包含一CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:115具有100%序列一致性的一CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:6具有100%序列一致性的一胺基酸序列; g)與SEQ ID NO:126具有100%序列一致性的一tracrRNA,其中該一或更多導引RNA進一步包含一CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:117具有100%序列一致性的一CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:12具有100%序列一致性的一胺基酸序列; h)與SEQ ID NO:127具有100%序列一致性的一tracrRNA,其中該一或更多導引RNA進一步包含一CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:118具有100%序列一致性的一CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:13具有100%序列一致性的一胺基酸序列;及 i)與SEQ ID NO:128具有100%序列一致性的一tracrRNA,其中該一或更多導引RNA進一步包含一CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:119具有100%序列一致性的一CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:16具有100%序列一致性的一胺基酸序列。
  154. 如請求項150至請求項153中任一項所述的套組,其中該一或更多導引RNA為一單導引RNA(sgRNA)。
  155. 如請求項150至請求項153中任一項所述的套組,其中該一或更多導引RNA為一雙導引RNA。
  156. 如請求項139至請求項155中任一項所述的套組,其中該標的DNA序列位於為單股的該DNA分子的一區域內。
  157. 如請求項139至請求項155中任一項所述的套組,其中該標的DNA序列位於為雙股的該DNA分子的一區域內。
  158. 如請求項157所述的套組,其中藉由該RGN多肽之剪切產生一雙股斷裂。
  159. 如請求項157所述的套組,其中藉由該RGN多肽之剪切產生一單股斷裂。
  160. 如請求項157至請求項159中任一項所述的套組,其中該標的DNA序列與一原型間隔體相鄰模體(PAM)相鄰地被安置。
  161. 一種檢測一樣本中的一DNA分子的一標的DNA序列的方法,該方法包含: a)使該樣本與以下者接觸: i)包含與SEQ ID NO:2、4、1、3及5至109中任一者具有至少90%序列一致性的一胺基酸序列的一RNA導引之核酸酶(RGN)多肽,其中當與能夠與該標的DNA序列雜合的一導引RNA結合時,該RGN多肽能夠以一RNA導引之序列專一性方式結合及剪切一DNA分子的該標的DNA序列; ii)該導引RNA;及 iii)不與該導引RNA雜合的一檢測單股DNA(ssDNA);及 b)量測藉由該RGN剪切該檢測ssDNA產生的一可檢測訊號,從而檢測該標的DNA序列。
  162. 如請求項161所述的方法,其中該RGN多肽包含與SEQ ID NO:2、4、1、3及5至109中任一者具有至少95%序列一致性的一胺基酸序列。
  163. 如請求項161所述的方法,其中該RGN多肽包含與SEQ ID NO:2、4、1、3及5至109中任一者具有100%序列一致性的一胺基酸序列。
  164. 如請求項161至請求項163中任一項所述的方法,其中該樣本包含來自一細胞溶胞產物的DNA分子。
  165. 如請求項161至請求項163中任一項所述的方法,其中該樣本包含細胞。
  166. 如請求項165所述的方法,其中該細胞為真核細胞。
  167. 如請求項161至請求項163中任一項所述的方法,其中包含該標的DNA序列的該DNA分子藉由存在於包含RNA的一樣本中的一RNA模板分子的逆轉錄產生。
  168. 如請求項167所述的方法,其中該RNA模板分子為一RNA病毒。
  169. 如請求項168所述的方法,其中該RNA病毒為一冠狀病毒。
  170. 如請求項169所述的方法,其中該冠狀病毒為一bat SARS類冠狀病毒、SARS-CoV或SARS-CoV-2。
  171. 如請求項167至請求項170中任一項所述的方法,其中包括RNA的一樣本為自包含細胞的一樣本取得的。
  172. 如請求項161至請求項171中任一項所述的方法,其中該檢測ssDNA包含一螢光團/淬滅劑對。
  173. 如請求項161至請求項171中任一項所述的方法,其中該檢測ssDNA包括一螢光共振能量轉移(FRET)對。
  174. 如請求項161至請求項173中任一項所述的方法,其中該方法進一步包含於步驟a)的接觸之前或與步驟a)的接觸一起擴增該樣本中的核酸。
  175. 一種剪切單股DNA(ssDNA)的方法,該方法包含使核酸之一族群與以下者接觸,其中該族群包含一DNA分子,該DNA分子包含一標的DNA序列及複數個非標的ssDNA: a)包含與SEQ ID NO:2、4、1、3及5至109中任一者具有至少90%序列一致性的一胺基酸序列的一RNA導引之核酸酶(RGN)多肽,其中當與能夠與該標的DNA序列雜合的一導引RNA結合時,該RGN多肽能夠以一RNA導引之序列專一性方式結合及剪切該標的DNA序列;及 b)該導引RNA; 其中該RGN多肽剪切該複數個的非標的ssDNA。
  176. 如請求項175所述的方法,其中該RGN多肽包含與SEQ ID NO:2、4、1、3及5至109中任一者具有至少95%序列一致性的一胺基酸序列。
  177. 如請求項175所述的方法,其中該RGN多肽包含與SEQ ID NO:2、4、1、3及5至109中任一者具有100%序列一致性的一胺基酸序列。
  178. 如請求項175至請求項177中任一項所述的方法,其中該核酸族群在一細胞溶胞產物內。
  179. 如請求項175至請求項178中任一項所述的方法,其中包含該標的DNA序列的該DNA分子藉由一RNA模板分子的逆轉錄產生。
  180. 如請求項161至請求項179中任一項所述的方法,其中未發現該RGN多肽與該導引RNA在本質上彼此複合。
  181. 如請求項161至請求項180中任一項所述的方法,其中該RGN多肽包含與SEQ ID NO:11具有至少90%序列一致性的一胺基酸序列且該導引RNA包含一CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:116具有至少90%序列一致性的一CRISPR重複序列。
  182. 如請求項161至請求項180中任一項所述的方法,其中該RGN多肽包含與SEQ ID NO:11具有至少95%序列一致性的一胺基酸序列且該導引RNA包含一CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:116具有至少95%序列一致性的一CRISPR重複序列。
  183. 如請求項161至請求項180中任一項所述的方法,其中該RGN多肽包含與SEQ ID NO:11具有100%序列一致性的一胺基酸序列且該導引RNA包含一CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:116具有100%序列一致性的一CRISPR重複序列。
  184. 如請求項161至請求項180中任一項所述的方法,其中該導引RNA包含一tracrRNA。
  185. 如請求項184所述的方法,其中該tracrRNA選自以下者組成之群組: a)與SEQ ID NO:121具有至少90%序列一致性的一tracrRNA,其中該導引RNA進一步包含一CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:111具有至少90%序列一致性的一CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:2具有至少90%序列一致性的一胺基酸序列; b)與SEQ ID NO:123具有至少90%序列一致性的一tracrRNA,其中該導引RNA進一步包含一CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:113具有至少90%序列一致性的一CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:4具有至少90%序列一致性的一胺基酸序列; c)與SEQ ID NO:120具有至少90%序列一致性的一tracrRNA,其中該導引RNA進一步包含一CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:110具有至少90%序列一致性的一CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:1具有至少90%序列一致性的一胺基酸序列; d)與SEQ ID NO:122具有至少90%序列一致性的一tracrRNA,其中該導引RNA進一步包含一CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:112具有至少90%序列一致性的一CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:3具有至少90%序列一致性的一胺基酸序列; e)與SEQ ID NO:124具有至少90%序列一致性的一tracrRNA,其中該導引RNA進一步包含一CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:114具有至少90%序列一致性的一CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:5具有至少90%序列一致性的一胺基酸序列; f)與SEQ ID NO:125具有至少90%序列一致性的一tracrRNA,其中該導引RNA進一步包含一CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:115具有至少90%序列一致性的一CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:6具有至少90%序列一致性的一胺基酸序列; g)與SEQ ID NO:126具有至少90%序列一致性的一tracrRNA,其中該導引RNA進一步包含一CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:117具有至少90%序列一致性的一CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:12具有至少90%序列一致性的一胺基酸序列; h)與SEQ ID NO:127具有至少90%序列一致性的一tracrRNA,其中該導引RNA進一步包含一CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:118具有至少90%序列一致性的一CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:13具有至少90%序列一致性的一胺基酸序列;及 i)與SEQ ID NO:128具有至少90%序列一致性的一tracrRNA,其中該導引RNA進一步包含一CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:119具有至少90%序列一致性的一CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:16具有至少90%序列一致性的一胺基酸序列。
  186. 如請求項184所述的方法,其中該tracrRNA選自以下者組成之群組: a)與SEQ ID NO:121具有至少95%序列一致性的一tracrRNA,其中該導引RNA進一步包含一CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:111具有至少95%序列一致性的一CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:2具有至少95%序列一致性的一胺基酸序列; b)與SEQ ID NO:123具有至少95%序列一致性的一tracrRNA,其中該導引RNA進一步包含一CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:113具有至少95%序列一致性的一CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:4具有至少95%序列一致性的一胺基酸序列; c)與SEQ ID NO:120具有至少95%序列一致性的一tracrRNA,其中該導引RNA進一步包含一CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:110具有至少95%序列一致性的一CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:1具有至少95%序列一致性的一胺基酸序列; d)與SEQ ID NO:122具有至少95%序列一致性的一tracrRNA,其中該導引RNA進一步包含一CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:112具有至少95%序列一致性的一CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:3具有至少95%序列一致性的一胺基酸序列; e)與SEQ ID NO:124具有至少95%序列一致性的一tracrRNA,其中該導引RNA進一步包含一CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:114具有至少95%序列一致性的一CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:5具有至少95%序列一致性的一胺基酸序列; f)與SEQ ID NO:125具有至少95%序列一致性的一tracrRNA,其中該導引RNA進一步包含一CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:115具有至少95%序列一致性的一CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:6具有至少95%序列一致性的一胺基酸序列; g)與SEQ ID NO:126具有至少95%序列一致性的一tracrRNA,其中該導引RNA進一步包含一CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:117具有至少95%序列一致性的一CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:12具有至少95%序列一致性的一胺基酸序列; h)與SEQ ID NO:127具有至少95%序列一致性的一tracrRNA,其中該導引RNA進一步包含一CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:118具有至少95%序列一致性的一CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:13具有至少95%序列一致性的一胺基酸序列;及 i)與SEQ ID NO:128具有至少95%序列一致性的一tracrRNA,其中該導引RNA進一步包含一CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:119具有至少95%序列一致性的一CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:16具有至少95%序列一致性的一胺基酸序列。
  187. 如請求項184所述的方法,其中該tracrRNA選自以下者組成之群組: a)與SEQ ID NO:121具有100%序列一致性的一tracrRNA,其中該導引RNA進一步包含一CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:111具有100%序列一致性的一CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:2具有100%序列一致性的一胺基酸序列; b)與SEQ ID NO:123具有100%序列一致性的一tracrRNA,其中該導引RNA進一步包含一CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:113具有100%序列一致性的一CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:4具有100%序列一致性的一胺基酸序列; c)與SEQ ID NO:120具有100%序列一致性的一tracrRNA,其中該導引RNA進一步包含一CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:110具有100%序列一致性的一CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:1具有100%序列一致性的一胺基酸序列; d)與SEQ ID NO:122具有100%序列一致性的一tracrRNA,其中該導引RNA進一步包含一CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:112具有100%序列一致性的一CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:3具有100%序列一致性的一胺基酸序列; e)與SEQ ID NO:124具有100%序列一致性的一tracrRNA,其中該導引RNA進一步包含一CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:114具有100%序列一致性的一CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:5具有100%序列一致性的一胺基酸序列; f)與SEQ ID NO:125具有100%序列一致性的一tracrRNA,其中該導引RNA進一步包含一CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:115具有100%序列一致性的一CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:6具有100%序列一致性的一胺基酸序列; g)與SEQ ID NO:126具有100%序列一致性的一tracrRNA,其中該導引RNA進一步包含一CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:117具有100%序列一致性的一CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:12具有100%序列一致性的一胺基酸序列; h)與SEQ ID NO:127具有100%序列一致性的一tracrRNA,其中該導引RNA進一步包含一CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:118具有100%序列一致性的一CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:13具有100%序列一致性的一胺基酸序列;及 i)與SEQ ID NO:128具有100%序列一致性的一tracrRNA,其中該導引RNA進一步包含一CRISPR RNA,該CRISPR RNA包含與SEQ ID NO:119具有100%序列一致性的一CRISPR重複序列,且其中該RGN多肽包含與SEQ ID NO:16具有100%序列一致性的一胺基酸序列。
  188. 如請求項184至請求項187中任一項所述的方法,其中該導引RNA為一單導引RNA(sgRNA)。
  189. 如請求項184至請求項187中任一項所述的方法,其中該導引RNA為一雙導引RNA。
  190. 如請求項161至請求項189中任一項所述的方法,其中該標的DNA序列位於為單股的該DNA分子的一區域內。
  191. 如請求項161至請求項189中任一項所述的方法,其中該標的DNA序列位於為雙股的該DNA分子的一區域內。
  192. 如請求項191所述的方法,其中該標的DNA序列藉由該RGN多肽的剪切產生一雙股斷裂。
  193. 如請求項191所述的方法,其中該標的DNA序列藉由該RGN多肽的剪切產生一單股斷裂。
  194. 如請求項191至請求項193中任一項所述的方法,其中該標的DNA序列與一原型間隔體相鄰模體(PAM)相鄰地被安置。
  195. 一種醫治一疾病的方法,該方法包含對需要醫治的一個體投予一有效量的實施方式82或138的一醫藥組合物。
  196. 如請求項195所述的方法,其中該疾病與一因果突變關聯,且該有效量的該醫藥組合物校正該因果突變。
TW109146714A 2019-12-30 2020-12-29 Rna導引之核酸酶及其活性片段與變體以及使用方法 TW202134439A (zh)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US201962955014P 2019-12-30 2019-12-30
US62/955,014 2019-12-30
US202063058169P 2020-07-29 2020-07-29
US63/058,169 2020-07-29

Publications (1)

Publication Number Publication Date
TW202134439A true TW202134439A (zh) 2021-09-16

Family

ID=74285554

Family Applications (1)

Application Number Title Priority Date Filing Date
TW109146714A TW202134439A (zh) 2019-12-30 2020-12-29 Rna導引之核酸酶及其活性片段與變體以及使用方法

Country Status (8)

Country Link
US (1) US20230203463A1 (zh)
EP (1) EP4085133A1 (zh)
JP (1) JP2023508731A (zh)
CN (1) CN115190912A (zh)
AU (1) AU2020417760A1 (zh)
CA (1) CA3163285A1 (zh)
TW (1) TW202134439A (zh)
WO (1) WO2021138247A1 (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA3173949A1 (en) 2020-07-15 2022-01-20 LifeEDIT Therapeutics, Inc. Uracil stabilizing proteins and active fragments and variants thereof and methods of use
WO2023118068A1 (en) 2021-12-23 2023-06-29 Bayer Aktiengesellschaft Novel small type v rna programmable endonuclease systems
WO2024095245A2 (en) 2022-11-04 2024-05-10 LifeEDIT Therapeutics, Inc. Evolved adenine deaminases and rna-guided nuclease fusion proteins with internal insertion sites and methods of use

Family Cites Families (65)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US699A (en) 1838-04-21 stone
US9840A (en) 1853-07-12 Improvement in tanning
US4217344A (en) 1976-06-23 1980-08-12 L'oreal Compositions containing aqueous dispersions of lipid spheres
US4196265A (en) 1977-06-15 1980-04-01 The Wistar Institute Method of producing antibodies
US4235871A (en) 1978-02-24 1980-11-25 Papahadjopoulos Demetrios P Method of encapsulating biologically active materials in lipid vesicles
US4186183A (en) 1978-03-29 1980-01-29 The United States Of America As Represented By The Secretary Of The Army Liposome carriers in chemotherapy of leishmaniasis
US4261975A (en) 1979-09-19 1981-04-14 Merck & Co., Inc. Viral liposome particle
US4485054A (en) 1982-10-04 1984-11-27 Lipoderm Pharmaceuticals Limited Method of encapsulating biologically active materials in multilamellar lipid vesicles (MLV)
US4501728A (en) 1983-01-06 1985-02-26 Technology Unlimited, Inc. Masking of liposomes from RES recognition
US5380831A (en) 1986-04-04 1995-01-10 Mycogen Plant Science, Inc. Synthetic insecticidal crystal protein gene
US5049386A (en) 1985-01-07 1991-09-17 Syntex (U.S.A.) Inc. N-ω,(ω-1)-dialkyloxy)- and N-(ω,(ω-1)-dialkenyloxy)Alk-1-YL-N,N,N-tetrasubstituted ammonium lipids and uses therefor
US4897355A (en) 1985-01-07 1990-01-30 Syntex (U.S.A.) Inc. N[ω,(ω-1)-dialkyloxy]- and N-[ω,(ω-1)-dialkenyloxy]-alk-1-yl-N,N,N-tetrasubstituted ammonium lipids and uses therefor
US4946787A (en) 1985-01-07 1990-08-07 Syntex (U.S.A.) Inc. N-(ω,(ω-1)-dialkyloxy)- and N-(ω,(ω-1)-dialkenyloxy)-alk-1-yl-N,N,N-tetrasubstituted ammonium lipids and uses therefor
US4797368A (en) 1985-03-15 1989-01-10 The United States Of America As Represented By The Department Of Health And Human Services Adeno-associated virus as eukaryotic expression vector
US5569597A (en) 1985-05-13 1996-10-29 Ciba Geigy Corp. Methods of inserting viral DNA into plant material
US4774085A (en) 1985-07-09 1988-09-27 501 Board of Regents, Univ. of Texas Pharmaceutical administration systems containing a mixture of immunomodulators
US4853331A (en) 1985-08-16 1989-08-01 Mycogen Corporation Cloning and expression of Bacillus thuringiensis toxin gene toxic to beetles of the order Coleoptera
US5268463A (en) 1986-11-11 1993-12-07 Jefferson Richard A Plant promoter α-glucuronidase gene construct
US5608142A (en) 1986-12-03 1997-03-04 Agracetus, Inc. Insecticidal cotton plants
US4837028A (en) 1986-12-24 1989-06-06 Liposome Technology, Inc. Liposomes with enhanced circulation time
US5039523A (en) 1988-10-27 1991-08-13 Mycogen Corporation Novel Bacillus thuringiensis isolate denoted B.t. PS81F, active against lepidopteran pests, and a gene encoding a lepidopteran-active toxin
JP3046063B2 (ja) 1989-03-17 2000-05-29 イー・アイ・デユポン・ドウ・ヌムール・アンド・カンパニー 遺伝子の発現の外部の調節
ATE225853T1 (de) 1990-04-12 2002-10-15 Syngenta Participations Ag Gewebe-spezifische promotoren
US5264618A (en) 1990-04-19 1993-11-23 Vical, Inc. Cationic lipids for intracellular delivery of biologically active molecules
WO1991017424A1 (en) 1990-05-03 1991-11-14 Vical, Inc. Intracellular delivery of biologically active substances by means of self-assembling lipid complexes
US5498830A (en) 1990-06-18 1996-03-12 Monsanto Company Decreased oil content in plant seeds
CA2051562C (en) 1990-10-12 2003-12-02 Jewel M. Payne Bacillus thuringiensis isolates active against dipteran pests
US5173414A (en) 1990-10-30 1992-12-22 Applied Immune Sciences, Inc. Production of recombinant adeno-associated virus vectors
US5399680A (en) 1991-05-22 1995-03-21 The Salk Institute For Biological Studies Rice chitinase promoter
WO1993004177A1 (en) 1991-08-27 1993-03-04 Agricultural Genetics Company Limited Proteins with insecticidal properties against homopteran insects and their use in plant protection
TW261517B (zh) 1991-11-29 1995-11-01 Mitsubishi Shozi Kk
US5587308A (en) 1992-06-02 1996-12-24 The United States Of America As Represented By The Department Of Health & Human Services Modified adeno-associated virus vector capable of expression from a novel promoter
US5814618A (en) 1993-06-14 1998-09-29 Basf Aktiengesellschaft Methods for regulating gene expression
US5789156A (en) 1993-06-14 1998-08-04 Basf Ag Tetracycline-regulated transcriptional inhibitors
US5837458A (en) 1994-02-17 1998-11-17 Maxygen, Inc. Methods and compositions for cellular and metabolic engineering
US5605793A (en) 1994-02-17 1997-02-25 Affymax Technologies N.V. Methods for in vitro recombination
US5608144A (en) 1994-08-12 1997-03-04 Dna Plant Technology Corp. Plant group 2 promoters and uses thereof
US5659026A (en) 1995-03-24 1997-08-19 Pioneer Hi-Bred International ALS3 promoter
US6072050A (en) 1996-06-11 2000-06-06 Pioneer Hi-Bred International, Inc. Synthetic promoters
AU762993C (en) 1998-02-26 2004-06-10 Pioneer Hi-Bred International, Inc. Constitutive maize promoters
US6534261B1 (en) 1999-01-12 2003-03-18 Sangamo Biosciences, Inc. Regulation of endogenous gene expression in cells using zinc finger proteins
CN1360632A (zh) 1999-05-04 2002-07-24 孟山都技术有限公司 鞘翅目毒性多肽组合物和抗虫转基因植物
CA2384967A1 (en) 1999-09-15 2001-03-22 Monsanto Technology Llc Lepidopteran-active bacillus thuringiensis .delta.-endotoxin compositions and methods of use
US20050183161A1 (en) 2003-10-14 2005-08-18 Athenix Corporation AXMI-010, a delta-endotoxin gene and methods for its use
US7629504B2 (en) 2003-12-22 2009-12-08 Pioneer Hi-Bred International, Inc. Bacillus thuringiensis cry9 nucleic acids
ES2397118T3 (es) 2006-06-14 2013-03-04 Athenix Corporation AXMI-031, AXMI-039 ,AXMI-040 y AXMI-049, una familia de genes de endotoxina delta y métodos para su uso
PT2334794T (pt) 2008-09-15 2017-02-15 Harvard College Modulação de bcl11a para tratamento de hemoglobinopatias
WO2011002992A1 (en) 2009-07-02 2011-01-06 Athenix Corp. Axmi-205 pesticidal gene and methods for its use
WO2011084324A2 (en) 2009-12-21 2011-07-14 Pioneer Hi-Bred International, Inc. Novel bacillus thuringiensis gene with lepidopteran activity
CN103154247A (zh) 2010-08-19 2013-06-12 先锋国际良种公司 对鳞翅目昆虫具有活性的新苏云金杆菌基因
US9405700B2 (en) 2010-11-04 2016-08-02 Sonics, Inc. Methods and apparatus for virtualization in an integrated circuit
HUE030799T2 (en) 2012-07-11 2017-06-28 Sangamo Biosciences Inc Methods and preparations for the treatment of lysosomal storage diseases
BR112016000571B1 (pt) * 2013-07-10 2023-12-26 President And Fellows Of Harvard College Métodos in vitro para modular a expressão e para alterar um ou mais ácidos nucleicos alvo em uma célula simultaneamente com a regulação da expressão de um ou mais ácidos nucleicos alvo em uma célula, bem como célula de levedura ou bactéria compreendendo ácidos nucleicos
US20150166982A1 (en) 2013-12-12 2015-06-18 President And Fellows Of Harvard College Methods for correcting pi3k point mutations
WO2016033298A1 (en) 2014-08-28 2016-03-03 North Carolina State University Novel cas9 proteins and guiding features for dna targeting and genome editing
AU2016263026A1 (en) * 2015-05-15 2017-11-09 Pioneer Hi-Bred International, Inc. Guide RNA/Cas endonuclease systems
US9790490B2 (en) * 2015-06-18 2017-10-17 The Broad Institute Inc. CRISPR enzymes and systems
IL294014B1 (en) 2015-10-23 2024-03-01 Harvard College Nucleobase editors and their uses
EP4159848A1 (en) * 2015-12-29 2023-04-05 Monsanto Technology LLC Novel crispr-associated transposases and uses thereof
AU2017306676B2 (en) 2016-08-03 2024-02-22 President And Fellows Of Harvard College Adenosine nucleobase editors and uses thereof
WO2019046703A1 (en) * 2017-09-01 2019-03-07 Novozymes A/S METHODS OF ENHANCING GENOME EDITION IN FUNGI
US20200354419A1 (en) * 2017-11-03 2020-11-12 Hunterian Medicine Llc Compositions and methods of use thereof for the treatment of duchenne muscular dystrophy
US20210172008A1 (en) * 2018-04-04 2021-06-10 Lifeedit, Inc. Methods and compositions to identify novel crispr systems
WO2020028729A1 (en) 2018-08-01 2020-02-06 Mammoth Biosciences, Inc. Programmable nuclease compositions and methods of use thereof
US20220096543A1 (en) 2018-12-24 2022-03-31 Virgina Tech Intellectual Properties, Inc. Tollip deficient neutrophils and uses thereof

Also Published As

Publication number Publication date
AU2020417760A1 (en) 2022-08-04
CA3163285A1 (en) 2021-07-08
CN115190912A (zh) 2022-10-14
US20230203463A1 (en) 2023-06-29
JP2023508731A (ja) 2023-03-03
EP4085133A1 (en) 2022-11-09
WO2021138247A1 (en) 2021-07-08

Similar Documents

Publication Publication Date Title
US11926843B2 (en) RNA-guided nucleases and active fragments and variants thereof and methods of use
EP3902911B1 (en) Polypeptides useful for gene editing and methods of use
US11859181B2 (en) RNA-guided nucleases and active fragments and variants thereof and methods of use
TW202134439A (zh) Rna導引之核酸酶及其活性片段與變體以及使用方法
TW202120688A (zh) Rna導引之核酸酶及其活性片段及變體以及使用方法
TW202227624A (zh) Dna修飾酶及活性片段,及其變異體與使用方法
KR20230049100A (ko) 우라실 안정화 단백질 및 그의 활성 단편 및 변이체 및 사용 방법
TW202346583A (zh) Rna引導核酸酶、其活性片段與變體,及使用方法
TW202300649A (zh) Dna修飾酶及活性片段及其變體及使用方法
WO2021231437A1 (en) Rna-guided nucleic acid binding proteins and active fragments and variants thereof and methods of use