TW202346580A - Dna酶及其應用 - Google Patents

Dna酶及其應用 Download PDF

Info

Publication number
TW202346580A
TW202346580A TW112111548A TW112111548A TW202346580A TW 202346580 A TW202346580 A TW 202346580A TW 112111548 A TW112111548 A TW 112111548A TW 112111548 A TW112111548 A TW 112111548A TW 202346580 A TW202346580 A TW 202346580A
Authority
TW
Taiwan
Prior art keywords
nucleic acid
domain
catalytic
product
binding
Prior art date
Application number
TW112111548A
Other languages
English (en)
Inventor
顧宏周
張俏
夏凱
李富友
Original Assignee
復旦大學
大陸商上海五體生物科技有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 復旦大學, 大陸商上海五體生物科技有限公司 filed Critical 復旦大學
Publication of TW202346580A publication Critical patent/TW202346580A/zh

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/70Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving virus or bacteriophage
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/12Type of nucleic acid catalytic nucleic acids, e.g. ribozymes
    • C12N2310/127DNAzymes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P19/00Preparation of compounds containing saccharide radicals
    • C12P19/26Preparation of nitrogen-containing carbohydrates
    • C12P19/28N-glycosides
    • C12P19/30Nucleotides
    • C12P19/34Polynucleotides, e.g. nucleic acids, oligoribonucleotides

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Immunology (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Biophysics (AREA)
  • Analytical Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Virology (AREA)
  • Biotechnology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Immobilizing And Processing Of Enzymes And Microorganisms (AREA)
  • Saccharide Compounds (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本揭露提供了一種DNA酶及其應用。本揭露還提供了一種系統,該系統包含一個或多個催化結構域和一個或多個受質結構域。

Description

DNA酶及其應用
本揭露涉及生物醫藥領域,具體地涉及一種用於製備長單鏈DNA的DNA酶。
目前,DNA奈米技術在諸如植入等生物醫學研究領域對單鏈DNA(ssDNA)、特別是對於長單鏈DNA(>100個鹼基)有著廣泛的需求。然而,由於化學合成方法的限制,很難合成長單鏈DNA。此外,在實際應用中,本領域已知的方法都存在收率低、成本高等問題。
本揭露提供了一種用於製備長單鏈DNA的DNA酶系統。該系統能夠穩健地生成具有可定制的5'和/或3'末端的切割產物。本揭露的產物在切除一系列不同長度的寡核苷酸時能夠顯示出穩健的效果,具有較高的產率和準確性。
一方面,本揭露提供了一種系統,該系統包含一個或多個催化結構域和一個或多個受質結構域,其中該催化結構域包含13PD催化結 構域序列,該催化結構域在切割位點處切割該受質結構域,並且該受質結構域包含選自該切割位點的3'側的A、C和G的鹼基。
一方面,本揭露提供了一種核酸,該核酸包含一個或多個催化結構域和一個或多個受質結構域,其中該催化結構域包含13PD催化結構域序列,該催化結構域在該切割位點處切割該受質結構域,並且該受質結構域包含選自該切割位點的3'側的A、C和G的鹼基。
一方面,本揭露提供了一種載體,該載體包含本揭露的系統和/或本揭露的核酸。
一方面,本揭露提供了一種細胞,該細胞包含本揭露的系統、本揭露的核酸和/或本揭露的載體。
一方面,本揭露提供了一種組成物,該組成物包含本揭露的系統、本揭露的核酸、本揭露的載體和/或本揭露的細胞。
一方面,本揭露提供了一種試劑盒,該試劑盒包含本揭露的系統、本揭露的核酸、本揭露的載體、本揭露的細胞、和/或本揭露的組成物。
一方面,本揭露提供了一種產物的製備方法,該方法包括提供本揭露的系統、本揭露的核酸、本揭露的載體、本揭露的細胞、本揭露的組成物和/或本揭露的試劑盒。
一方面,本揭露提供了一種根據本揭露的方法製備的產物。
一方面,本揭露提供了一種組合,該組合包括提供包含約1mM至2mM Zn2+及約5mM至20mM Mn2+的條件。
一方面,本揭露提供了一種產物的製備方法,該方法包括提供本揭露的組合和提供的5'核酸切刀和3'核酸切刀。
一方面,本揭露提供了一種根據本揭露的方法製備的產物。
一方面,本揭露提供了一種核酸檢測方法,該方法包括提供本揭露的產物。
一方面,本揭露提供了一種測序方法,該方法包括提供本揭露的產物。
一方面,本揭露提供了一種基因工程方法,該方法包括提供本揭露的產物。
一方面,本揭露提供了一種數據存儲方法,該方法包括提供本揭露的產物。
根據以下具體實施方式,所屬技術領域具有通常知識者將顯而易知本揭露的其他方面和優勢,在具體實施方式中僅示出和描述本揭露的說明性實施方案。將認識到,本揭露能夠具有其它不同實施方案,其若干細節可以在各種明顯的方面進行修改,但均不脫離本申請。因此,圖式和說明書在本質上均被視為是示例性的而非限制性的。
藉由引用併入
在本說明書中提及的所有出版物、專利和專利申請均藉由引用併入本文,其引用程度如同各個單獨的出版物、專利或專利申請被具體地並且分別地指出以引用的方式併入一樣。
本發明的新穎特徵在所附申請專利範圍中詳細闡述。藉由參考闡述使用本發明原理的示例性實施方案的以下具體實施方式以及圖式,將更好地理解本發明的特徵和優勢,在圖式(在本文中也稱為“圖(figure)”和“圖(FIG.)”)中:
圖1示出了PECAN,其是一種借助利用DNA酶的配對式末端切割來製備任意DNA序列的生物技術方法。a,PECAN方案示意圖。b,先前報導的DNA酶13PD1的序列和二級結構。篩選後,選擇該DNA酶作為DNA酶1。它的切割位點用剪刀突出顯示。c,另一種先前報導的DNA酶II-R1及其藉由這項工作中的重選鑑定的突變體II-R2&R3的序列和二級結構。對突變的核苷酸進行標記。II-R2和II-R3可選擇性地用作DNA酶2。d,藉由變性PAGE(dPAGE)分析對5'和3'自切刀進行的動力學表徵。實心箭頭和空心箭頭分別是指未切割的DNA和切割的DNA。e,13PD1及其突變體的DNA切割部分的時間關係圖。從d中的凝膠中提取數據。k obs和1小時產率值表明,切割位點的3'(13PD1中默認T)處的單核苷酸身份對切割速度產生中等程度影響,但不影響1小時切割產率(T,A,G和C為>85%)。f,II-R1、R2和R3的DNA切割部分的時間關係圖。從d和圖8和9中的凝膠中提取數據。匯總的k obs和1小時產率值表明II-R2&R3比II-R1更穩健。對於II-R2,在1小時內獲得了超過85%的產率,因為切割位點的5'處的單核苷酸身份是G,A或C,而不是T(63±3%產率)。藉由用II-R3取代II-R2,解決了II-R2的T對產率有效性較小的問題,II-R3直接在T之後切割,1小時產率為88±2%。e和f的產率的標準 偏差(SD)是從三次重複測定中產生的。複選標記表示適合PECAN的每種DNA酶。
圖2示出了PECAN寡核苷酸與CS寡核苷酸的比較。a,藉由dPAGE分析比較代表性的71nt DNA。標記物1和2:分別為20nt梯狀條帶和50nt梯狀條帶。b,藉由單同位素光譜比較71nt DNA。CS 71mer(21667.9Da)和PECAN 71mer(21668.2Da)的觀測分子量(MW)與計算值(21667.5Da)良好匹配。除了主要質量峰值外,CS 71mer的主要質量峰值周圍還出現了許多弱峰(用虛線圈出)。c,藉由dPAGE分析比較代表性的65nt和69nt寡核苷酸。d,三種代表性寡核苷酸的序列和二級結構信息以及全長純度。CS和PECAN之間的比較基於每次讀數>1000000的NGS。e,使用PLP DNA進行RNA原位成像的工作流程。f,藉由CS和PECAN PLP檢測MCF-7中的HER2表達和SK-BR-3細胞中的CCNB1表達。檢測到的mRNA顯示為點。採用DAPI染色的細胞核顯示為藍色。g,藉由CS和PECAN PLP檢測到的HER2CCNB1的每個細胞RCP的統計圖。雙尾配對學生t檢驗P值指示具有統計學意義(****P<0.0001)。h,藉由CS和PECAN PLP檢測HER2陽性乳腺癌FFPE組織切片中的多mRNA表達。合併檢測HER2MKI67ESR1PGR的表達。每個組織切片的右側顯示了放大視圖(方框區域)。比例尺:100μm。i,藉由CS和PECAN PLP檢測組織切片中每個細胞的HER2MKI67ESR1PGR的RCP統計圖。
圖3示出了藉由PECAN生成LASSO探針用於分析RNA剪接變體。aS100PCYP24A1在97L和NL細胞中的替代剪接模式。b, 使用LASSO探針捕獲單個靶標的示意圖。LASSO 1和2是分別為S100PCYP24A1 tv1專門設計的。c,藉由PECAN生成的LASSO探針的質量檢查。M3:200NT梯狀條帶。LASSO 1:335nt。LASSO 2:550nt。d、靶向擴增產物捕獲後的凝膠分析。LASSO 1和2被編程為分別在S100PCYP24A1 tv1轉錄物中捕獲401bp和749bp片段。非預期條帶使用*指代。NL樣品用作陰性對照。M4:100bp梯狀條帶。e,捕獲的靶標的測序。證實了S100PCYP24A1 tv1在97L中的轉錄物。在97L中還發現了CYP24A1的另一種亞型,名為CYP24A1 tvX1,其在外顯子11和12之間含有172bp的插入。f,用PECAN LASSO 2篩選CYP24A1剪接亞型的一系列肝癌細胞系。
圖4示出了藉由PECAN生成基因大小的HDRT進行精確且高效的基因組編輯。a,HDR引導的植入示意圖。使用CRISPR/Cas9系統在基因組DNA的特定位點處形成dsDNA斷裂。在HDR過程中,dsDNA或具有同源臂的ssDNA都可以用作模板(HDRT)將外源序列插入到基因組DNA中。b,藉由dPAGE分析比較商業化鏈酶試劑盒(Kit)和PECAN產生的兩個1570nt DNA。+和-分別指有義鏈和反義鏈。M3:200NT梯狀條帶。c,Hek293T細胞中內源性螢光共聚焦顯微鏡成像,使用dsDNA,Kit ssDNA和PECAN ssDNA的HDRT進行KI。融合蛋白標簽包括TUBA1B(微管蛋白α1b)上的mEGFP、CLTA(網格蛋白輕鏈A)上的mCherry、FBL(原纖維蛋白)上的mEGFP、和RAB11A(Rab蛋白11A)上的BFP。藉由箭頭指出明顯脫靶。d,代表性流式細胞術圖顯示了Hek293T細胞中dsDNA、Kit+和PECAN+ HDRT的脫靶效率。該實驗使用Cas9進行,未使用sgRNA。 e,Hek293T和H9細胞中dsDNA、Kit+和PECAN+ HDRT的表觀KI效率比較。f,Hek293T細胞中內源性螢光共聚焦顯微鏡成像,KI採用dsDNA和PECAN+ HDRT雙標簽。在每個面板中,可視化的mEGFP和mCherry標簽分別顯示在右上角和右下角,並且合併視圖顯示在左側。g,重建的3D圖像(i)顯示了TDN與微管在Hek293T細胞中的共定位。藉由3D光學切片(ii-iv)確定TDN-Cy5的位置。h,Hek293T細胞中TDNs-Cy5在細胞週期不同階段的三色共聚焦顯微鏡共定位。比例尺:10μm。
圖5示出了藉由PECAN生成~7000mer寡核苷酸進行數據存儲a,基於PECAN寡核苷酸的數據存儲系統的示意圖。b,當前基於DNA的存儲系統的特徵比較。
圖6示出了I-R3作為不完善的DNA酶1用於PECAN。a,I-R3的序列和二級結構、先前報導的DNA酶和用於PECAN的潛在的DNA酶1。它的切割位點用剪刀突出顯示。b,藉由dPAGE分析I-R3’用於兩種核苷酸在^AG-3'處的所有16種組合的切割活性。c,藉由dPAGE分析I-R3'用於^AG-3'到^N-3'突變的切割活性。d,重新檢查I-R3用於^NG-3'的序列的切割位點。對所有凝膠進行染色以進行條帶分析。產率和SD由三次重複測定產生。
圖7示出了13PD1及其突變體在^N-3'下游莖中的第一個核苷酸的可編程性a-d,13PD1、13PD1-A(^A-3')、13PD1-G(^G-3')和13PD1-C(^C-3')的協變、以及相應切割活性的dPAGE分析的示意圖。對所有凝膠進行染色以進行條帶分析。產率和SD由三次重複測定產生。
圖8示出了II-R1上的重選。a,藉由dPAGE對II-R1(5'-G^)及其突變體II-R1-A(5'-A^)、II-R1-T(5'-T^)和II-R1-C(5'-C^)進行的動力學表徵。b,用於II-R1重選的簡併DNA文庫的創建示意圖。基於重選,我們構建了用於II類DNA酶的共有序列和二級結構模型。灰色、黑色和紅色的核苷酸分別表示至少75%、90%和97%的保守性。保守程度較低的核苷酸用圓圈表示。綠色陰影表示協變支持的鹼基對。R是指嘌呤。c,II-R1與可以更快地切割的II-R2和IIR3突變體的序列。點表示相同的核苷酸。灰色陰影表示形成P1和P2莖的序列。箭頭指向切割部位。並且II-R2與II-R3切割位點的5'核苷酸被突出顯示。
圖9示出了II-R2與II-R3的表徵。a,藉由dPAGE分析對II-R2-T(5'-T^)進行動力學表徵。b-e,II-R2-G(5'-G^)、II-R2-A(5'-A^)、II-R2-C(5'-C^)和II-R3(5'-T^)的協變、以及對相應切割活性的dPAGE分析的示意圖。對b-e中的凝膠進行染色以進行條帶分析。產率和SD由三次重複測定產生。
圖10示出了對II-R2/3和13PD1的穩健共水解的最佳金屬離子條件的鑑定。a,在含有不同濃度的Zn2+和Mn2+的緩衝液(23℃時pH 7.0)中測試II-R2-G和13PD1的活性。僅對於II-R2-G,默認金屬要求為2mM Zn2+;對於13PD1,最佳金屬條件為1mM Zn2+和20mM Mn2+。經過測試和分析,最終選擇1mM Zn2+和5mM Mn2+作為一個鍋中用於兩種酶的最佳金屬離子濃度,以便穩健地切割每個自身。使用1mM Zn2+和5mM Mn2+,為確保兩種酶的切割收率超過90%,建議在37℃下孵育2小時。 b,證實1mM Zn2+和5mM Mn2+作用於II-R2-A、II-R2-C、II-R3和13PD1-A/G/C的最佳條件。
圖11示出了將DNA酶序列編程為用於PECAN生成的定制的寡核苷酸的示例。a,將13PD1與II-R2-C配對以產生71mer寡核苷酸。b,將13PD1與II-R3配對以產生1390mer寡核苷酸。
圖12示出了收集ss-噬菌粒前體用於PECAN生成定制的寡核苷酸的示例。a,在培養皿中聚集噬菌粒前體。從上到下,前體攜帶71nt、1390nt和6790nt的定制序列。樣品凍乾後稱重。b,變性凝膠顯示PECAN處理後靶標寡核苷酸幾乎從重組噬菌粒前體中完全釋放出來。請注意,a中只有一小部分DNA樣品進行PECAN處理並在b中展示。
圖13示出了CS和PECAN寡核苷酸的差錯分佈。a-c,CS和PECAN 65mer,69mer和71mer寡核苷酸之間的比較。基於NGS數據進行分析。突變(缺失突變)x是指具有x個突變(插入或刪除)的核苷酸的寡核苷酸序列。
圖14示出了藉由PECAN生成的PLP的質量檢查。a,用於細胞中RNA成像的PLP的dPAGE分析。M1:20NT梯狀條帶。b,用於組織樣品中RNA成像的PLP的dPAGE分析。c,本研究中使用的所有PLP的序列。
圖15示出了HER2陽性乳腺癌FFPE組織切片中多mRNA表達的檢測。a,藉由CS PLP進行的檢測。b,藉由PECAN PLP進行的檢測。HER2:紅色;MKI67:青色;ESR1:黃色;PGR:綠色。採用DAPI 染色的細胞核顯示為藍色。圖2h示出了四個RNA的合併視圖和放大視圖(方框區域)。比例尺:100μm。
圖16示出了對捕獲的片段的測序數據的分析。a,藉由PECAN LASSO 1從97L捕獲的序列。b和c,藉由PECAN LASSO 2從97L捕獲的序列。
圖17示出了藉由dPAGE對PECAN和Kit HDRT進行的質量檢查。M3:20NT梯狀條帶。箭頭指向推測的高度結構化和不可變性的DNA。
圖18示出了PECAN HDRT與dsDNA HDRT的細胞活力的關係。a,與PECAN HDRT相比,使用dsDNA HDRT電穿孔後顯微鏡下的活細胞數顯著減少。b,使用dsDNA HDRT、PECAN+ HDRT和PECAN- HDRT進行KI時細胞活力與DNA用量的關係圖。該實驗在Hek293T細胞中進行。
圖19示出了藉由ddPCR測定對TUBA1B基因座處的在靶GFP頻率的測量。a、測量策略示意圖。選擇RPP30作為參考基因來測試ddPCR條件。b,ddPCR擴增產物的一維螢光幅度圖。產生接近背景信號的液滴用灰色點表示。c,藉由ddPCR檢測到的基因片段的濃度計算值(拷貝/μl)。d,PECAN和Kit HDRT的mEGFP到TUBA1B的在靶整合估計值。
雖然本文已展示和描述本發明的各種實施方案,但對所屬技術領域具有通常知識者顯而易見的是,這些實施方案僅僅藉由示例的方式提供。在不脫離本發明的情況下,所屬技術領域具有通常知識者可以想到許多變型、改變和替代方案。應當理解,可以採用本文所述的本發明實施方案的各種替代方式。
此處使用的術語互補通常是指在核酸之間形成鹼基對。寡核苷酸及其類似物藉由互補鹼基之間的氫鍵結合進行雜交,該氫鍵結合包括Watson-Crick氫鍵結合,Hoogsteen氫鍵結合或反向Hoogsteen氫鍵結合。通常,核酸分子由含氮鹼基組成,這些鹼基或是嘧啶(胞嘧啶(C)、尿嘧啶(U)和胸腺嘧啶(T))或是嘌呤(腺嘌呤(A)和鳥嘌呤(G))。這些含氮鹼基在嘧啶和嘌呤之間形成氫鍵,並且嘧啶與嘌呤的鍵合稱為“鹼基配對”。更具體地,A將與T或U發生氫鍵結合,G將與C鍵合。可涉及人工或自然改性的含氮鹼基。例如,假異胞嘧啶(J)或5-甲基胞嘧啶(5mC)將與G發生氫鍵結合。“互補”是指在兩個不同的核酸之間或在同一核酸的兩個不同區域之間發生的鹼基配對。“可特異性雜交”和“特異性互補”是指示互補性程度足以使得核酸(或其類似物)與另一個核酸靶標(例如,DNA或RNA)之間發生穩定和特異性的結合的術語。核酸或類似物可以(但不需要)與其靶序列100%互補,以便可特異性雜交。例如,如果足夠數量的核酸分子形成鹼基對或與其靶核酸分子雜交以允許對該結合進行檢測(諸如至少90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%互補),則核酸分子與另一個核酸分子特異性結合。
此處使用的術語催化核酸通常是指能夠催化特定化學反應(諸如氧化切割或水解切割,例如磷酸二酯水解切割、核苷切除、磷酸化(或去磷酸化)、接合或其它反應)的核酸分子。催化核酸包括核酶(催化RNA或核糖核酸酶)。
此處使用的術語脫氧核酶(DNA酶)通常是指能夠催化特定化學反應的DNA分子。DNA酶可催化核酸切割(諸如氧化切割或水解切割,例如磷酸二酯水解切割)、核苷切除、磷酸化(或去磷酸化)、接合或其他反應。DNA酶在含氮鹼基和/或其主鏈上可具有或者可不具有一種或多種非天然的化學修飾。DNA酶(催化DNA或脫氧核酶)以及其他天然或非天然、經修飾或未修飾的核酸分子。
此處使用的術語單鏈核酸通常是指僅包括單聚合物鏈的核酸(例如,核酸聚合物鏈不與另一種核酸聚合物形成非共價鍵),諸如單鏈DNA(ssDNA)。核酸分子可以是全部單鏈(例如,藉由熔解雙鏈DNA分子形成的ssDNA)或部分單鏈(例如,藉由損傷和/或酶活性形成的ssDNA區域)。
此處使用的術語載體通常是指被引入到宿主細胞中從而產生轉化、轉染或轉導的宿主細胞的核酸分子。載體可包含允許其在宿主細胞中複製的核酸序列,諸如複製原點。
一方面,本申請提供了一種系統,該系統包含一個或多個催化結構域和一個或多個受質結構域,其中該催化結構域包含13PD催化結構域序列,該催化結構域在切割位點處切割該受質結構域,並且該受質結構域在該切割位點的3'側包含選自A、C和G的鹼基。
例如,該催化結構域可以是DNA酶的催化結構域。該受質結構域可以是待製備的核酸產物,或者受質結構域可以是待製備的核酸產物的一部分,或者受質結構域可以是待製備的核酸產物的5'部分。並非所有DNA酶都可以生成受質結構域或核酸產物的任何用戶定義的5'末端。例如,預期改變受質結構域的5'末端將導致DNA酶的催化結構域失去其切割能力。原因可能是受質結構域的5'末端具有保守的核苷酸,並且該保守的核苷酸可能是核酸產物上的“疤痕”。令人驚訝地發現,作為諸多DNA酶之一的13PD能夠產生具有為A,C或G而不是T的5'末端的受質結構域或核酸產物。
例如,該系統可包含一個或多個催化核酸,並且該催化核酸包含一個或多個該催化結構域。例如,其中該系統可包含一個或多個受質核酸,並且該受質核酸包含一個或多個該受質結構域。
例如,一個或多個該催化核酸與一個或多個該受質核酸是分離和/或綴合的。例如,其中一個或多個該催化核酸與一個或多個該受質核酸經由含有任何種類的鹼基的一個或多個核苷酸連接。
例如,該系統還包含一個或多個結合結構域,並且該結合結構域位於該催化結構域和/或該受質結構域的兩側和/或內部。
例如,該催化核酸包含一個或多個結合結構域A,該受質核酸包含一個或多個結合結構域B,並且該結合結構域A能夠與該結合結構域B結合。
例如,該催化核酸包含位於該催化結構域的5'側的結合結構域A-5和位於該催化結構域的3'側的結合結構域A-3,該受質核酸包含位 於該受質結構域的5'側的結合結構域B-5和位於該受質結構域的3'側的結合結構域B-3,並且該結合結構域A-5與該結合結構域B-3互補和/或該結合結構域A-3與該結合結構域B-5互補。
例如,該13PD包括13PD1、13PD2、13PD3、13PD4和/或它們的突變體。例如,該催化結構域包含SEQ ID NO:17的序列。例如,該催化結構域包含核酸水解活性。此外,催化結構域可藉由體外選擇進行工程設計,以實現高序列識別特異性、單鹼基水平反應位點特異性、可定制性、穩定性和/或低成本。
例如,該受質結構域包含SEQ ID NO:18的序列。
例如,該受質結構域在3'端包含A、C或G。例如,位於該受質結構域的3’端的是A、C或G。例如,該受質結構域的3’端不是T。
一方面,本申請提供了一種核酸,該核酸包含一個或多個催化結構域和一個或多個受質結構域,其中該催化結構域包含13PD催化結構域序列,該催化結構域在該切割位點處切割該受質結構域,並且該受質結構域在該切割位點的3'側包含選自A、C和G的鹼基。
例如,該核酸還可包含一個或多個結合結構域,並且該結合結構域位於該催化結構域和/或該受質結構域的兩側和/或內部。
例如,該核酸包含位於該催化結構域兩側的一個或多個結合結構域A,該核酸包含位於該受質結構域兩側的一個或多個結合結構域B,並且該結合結構域A能夠與該結合結構域B結合。
例如,該核酸包含位於該催化結構域的5'側的結合結構域A-5和位於該催化結構域的3'側的結合結構域A-3,該核酸包含位於該受質 結構域的5'側的結合結構域B-5和位於該受質結構域的3'側的結合結構域B-3,並且該結合結構域A-5與該結合結構域B-3互補和/或該結合結構域A-3與該結合結構域B-5互補。
例如,該13PD包括13PD1、13PD2、13PD3、13PD4和/或它們的突變體。例如,該催化結構域包含SEQ ID NO:17的序列。例如,該催化結構域包含核酸水解活性。例如,該受質結構域包含SEQ ID NO:18的序列。
例如,該受質結構域包含位於該受質結構域的3'端的A、C或G。例如,該受質結構域的3'端不是T。
一方面,本申請提供了一種載體,該載體包含本申請的系統和/或本申請的核酸。
一方面,本申請提供了一種細胞,該細胞包含申請的系統、本申請的核酸和/或申請的載體。
一方面,本申請提供了一種組成物,該組成物包含申請的系統、本申請的核酸、本申請的載體和/或申請所述的細胞。
一方面,本申請提供了一種試劑盒,該試劑盒包含本申請的系統、本申請的核酸、本申請的載體、本申請的細胞、和/或本申請的組成物。
一方面,本申請提供了一種產物製備方法,該方法包括提供本申請的系統、本申請的核酸、本申請的載體、本申請的細胞、本申請的組成物和/或本申請的試劑盒。
一方面,本申請提供了一種根據本申請的方法製備的產物。例如,該待製備的產物可包含核酸。例如,該待製備的產物可包含DNA。RNA和/或PNA。
例如,該產物可包含核酸。例如,該產物可包含至少5、6、7、8、9、10、11、12、13、14、15、20、25、30、35、40、或45、50、100、1000、10000、100000或1000000個核苷酸。例如,k-mer可以是生物序列中含有的長度為k的子鏈。AGAT序列將具有4個單體(A、G、A和T)、3個2-mer(AG、GA、AT)、2個3-mer(AGA、GAT)和1個4-mer(AGAT)。
一方面,本申請提供了一種組合,該組合包括提供包含約1mM至2mM Zn2+和約5mM至20mM Mn2+的條件。
例如,該組合可包括提供包含約1mM Zn2+和約5mM Mn2+的條件。
例如,該組合可包含約1mM Zn2+和約5mM Mn2+。例如,該組合可包含約1mM Zn2+和約5mM Mn2+,並且該組合的pH可以是約6-8。例如,該組合可包含約1mM Zn2+和約5mM Mn2+,並且該組合的pH可以是約7。進一步地,在一些示例中,溫度可包括至少約4℃、10℃、15℃、20℃、25℃、30℃ 32℃、36℃、37℃、38℃、40℃、41℃、42℃、45℃、50℃、55℃、60℃、65℃、70℃、75℃、80℃、90℃或95℃或,約4-90℃、15-50℃、20-40℃、32℃-42℃、36℃-42℃、38℃-42℃、41℃-42℃、37℃-95℃、37℃-60℃、或40℃-60℃。進一步地,在一些示例中,反應時間可包括至少約15min(諸如至少15min、18min、20min、25min、30min、40min、60min、1.5hr、2hr、4hr、6hr、8hr、10hr、12hr、18hr、 或整夜或約15min-整夜、20min-整夜、40min-整夜、2hr-整夜、20min-18hr、40min-18hr、2hr-18hr、6hr-18hr、或8hr-12hr約20min或2hr)。
一方面,本申請提供了一種產物製備方法,該方法包括提供本申請的組合和提供5'核酸切刀和3'核酸切刀。例如,該5'核酸切刀和3'核酸切刀可同時組合使用。例如,該5'核酸切刀和3'核酸切刀可同時切割該組合中的每個自身。
例如,該5'核酸切刀可包含能夠生成3'切割產物的DNA酶I。
例如,該5'核酸切刀位於該產物的5'側。例如,該5'核酸切刀和該產物是分離的和/或綴合的。例如,該5'核酸切刀與該產物位於同一鏈上。
例如,該5'核酸切刀可包含13PD及其突變體。例如,該5'核酸切刀可包含13PD1、13PB2、I-R3以及它們的突變體。
例如,該3'核酸切刀可包含能夠生成5'切割產物的DNA酶II。
例如,該3'核酸切刀位於該產物的3'側。例如,該3'核酸切刀和該產物是分離的和/或綴合的。例如,該3'核酸切刀與該產物位於同一核酸上。
例如,該3'核酸切刀可包含II-R1及其突變體。
例如,該3'核酸切刀可包含II-R1a、II-R1b、II-R1c、II-R1d以及它們的突變體。
進一步地,該一個或多個5'核酸切刀和該一個或多個3'核酸切刀可以各種比率使用,諸如至少1:1、1:2、1:3、1:4、1:5或1:10,或約1:1-1:5或1:1-1:2或約1:2的5'核酸切刀與3'核酸切刀。
一方面,本申請提供了一種根據本申請的方法製備的產物。
例如,該產物可包含核酸。
一方面,本申請提供了一種核酸檢測方法,該方法包括提供本申請的產物。
例如,本申請的產物可用作掛鎖探針(PLP)。例如,PLP與滾圓擴增(RCA)相結合,可在保存的組織和細胞中產生高密度的選殖擴增的滾環產物(RCP),以用於檢測。
例如,本申請的方法在體外、離體、體內和/或纖維素中進行。
一方面,本申請提供了一種測序方法,該方法包括提供本申請的產物。
例如,本申請的產物可用作長掛鎖或長適配子單鏈寡核苷酸(LASSO)探針。例如,樣品的基因組信息可藉由靶向測序進行分析。
例如,本申請的方法在體外、離體、體內和/或纖維素中進行。
一方面,本申請提供了一種基因工程方法,該方法包括提供本申請的產物。
例如,本申請的產物可用作HDR模板。例如,序列插入可使用外源DNA供體作為同源定向修復(HDR)的模板。
例如,本申請的方法在體外、離體、體內和/或纖維素中進行。
一方面,本申請提供了一種數據存儲方法,該方法包括提供本申請的產物。
例如,本申請的產物可用於基於DNA和/或RNA的儲存。
例如,本申請的方法在體外、離體、體內和/或纖維素中進行。
實施例
闡述以下實施例是為了向所屬技術領域具有通常知識者提供如何製造和使用本發明的完整揭露和描述,並非旨在限制本發明人認為是其發明的範圍,也並非旨在表示下面的實驗是所有或唯一進行的實驗。已努力確保所用數字(例如,數量、溫度等)的準確性,但應該考慮一定的實驗誤差和偏差。除非另有說明,否則份數是重量份,分子量是重均分子量,溫度是攝氏度,壓力為大氣壓或接近大氣壓。可以使用標準縮寫,例如bp:一個或多個鹼基對;kb:一千或數千鹼基;pl:一或數皮升;s或sec:一或數秒;min:一或數分鐘;h或hr:一或數小時;aa:一個或多個胺基酸;nt:一個或多個核苷酸;i.m.:肌內(地);i.p.:腹膜內(地);s.c.:皮下(地);等等。
方法
重新選擇II-R1用於3'自切刀。基於II-R1序列,我們合成了數個簡併DNA文庫(IDT),包括
Figure 112111548-A0202-12-0019-1
Figure 112111548-A0202-12-0019-2
(SEQ ID NO:1)
Figure 112111548-A0202-12-0020-3
Figure 112111548-A0202-12-0020-7
(SEQ ID NO:2)
Figure 112111548-A0202-12-0020-4
Figure 112111548-A0202-12-0020-8
(SEQ ID NO:3)
Figure 112111548-A0202-12-0020-5
Figure 112111548-A0202-12-0020-9
(SEQ ID NO:4)和
Figure 112111548-A0202-12-0020-6
Figure 112111548-A0202-12-0020-10
(SEQ ID NO:1)
每個帶下劃線的核苷酸(總共41-46nt)的簡併性為0.18。這產生了含有DNA分子的初始(G0)DNA池,這些DNA分子相對於完整的II-R1前體具有平均7到8個突變。我們還設計了一對引子1(5'-pGAGTGCTACGAACGT(SEQ ID NO:5))和2(5'-AAAAAAAAAAAAAAA(SEQ ID NO:6)/spacerC18/GAGTCCTACGAACGT(SEQ ID NO:7))用於選擇性擴增。引子2中包含間隔子修飾(spacerC18),以阻斷聚合酶在其A15尾部上的延伸,使得可藉由dPAGE按長度區分PCR產物的有義鏈和反義鏈。
對於每個文庫,為了開始重新選擇,我們在含有1X CircLigase反應緩衝液、50μM ATP和2.5mM MnCl2的200μL混合物中,將200pmol的G0群與CircLigase(200單位,EpiCentre)在60℃下接合2小時。我們用100%乙醇使反應產物沉澱,並且使用10% dPAGE純化單體DNA環。然後,我們在含有50mM HEPES(23℃時pH 7.0)、100mM NaCl、10mM MgCl2和2mM ZnCl2的100μL選擇緩衝液中,將回收的環狀DNA在37℃下孵育30分鐘。我們藉由10% dPAGE,將經切割的DNA(線性)與未切割的DNA(環狀)分離。在含有1X CircLigase反應緩衝液,50μM ATP和2.5mM MnCl2的30μL混合物中,將回收的線性DNA與CircLigase(30單位,EpiCentre)重新接合。藉由10% dPAGE,我們然後分離出環狀DNA。使用它們作為模板,我們用引子1和2各100pmol進行PCR擴增。根據長度差,我們在10% dPAGE上將PCR產物的有義鏈(91nt)與反義鏈(106nt)分離。我們回收有義DNA,以重建DNA池供下一輪選擇使用。
為了選擇在切割DNA方面具有穩健活性的II-R1突變體,我們將使用選擇緩衝液的DNA池的孵育時間從30分鐘(G0-G3)縮短到5分鐘(G4-G5),然後縮短到1分鐘(G6-G7)。我們選取G3池並且使用NGS對其進行深度測序。根據5個文庫的G3測序數據,我們重建II類Zn2+依賴性脫氧核酶的共有序列和二級結構模型。此外,我們從G7收集~100個株(TOPO TA選殖試劑盒,Invitrogen)並單獨對其進行測序。這產生了38個單一序列,對這些序列進行篩選以鑑定II-R1的突變體(II-R2-G、II-R2-A、 II-R2-C和II-R3),這些突變體在切割位點的5'具有所需的活性和序列通用型(四個突變體組合使用以實現通用性)。
DNA酶切割測定。我們設計了單分子或雙分子形式的DNA酶用於切割測定。將DNA酶在對應的反應緩衝液中孵育,即50mM HEPES(23℃時pH 7.0)、100mM NaCl、10mM MgCl2、20mM MnCl2和1mM ZnCl2的緩衝液用於13PD1及其變體,以及50mM HEPES(23℃時pH 7.0)、100mM NaCl、10mM MgCl2和2mM ZnCl2的緩衝液用於II-R1、II-R2和II-R3。根據測定的目的,在37℃下孵育數分鐘至數小時。為了繪製DNA酶的切割位點,將樣品孵育1小時,然後與(v/v:1/1)上樣緩衝液(90%甲醯胺、30mM EDTA、0.025%溴酚藍、0.025%二甲苯青)混合,停止反應。為了表徵DNA酶的動力學,將樣品移液並與(v/v:1/1)上樣緩衝液混合,以在不同時間點(0秒、20秒、40秒、1分鐘、2分鐘、5分鐘、10分鐘、20分鐘、40分鐘、和1小時)停止反應。
然後,我們使用變性PAGE來分析切割情況。對於在雙分子構建體上進行的動力學測定,我們用5' FAM標記受質DNA鏈,並且藉由Typhoon FLA9500掃描儀對dPAGE凝膠上的螢光信號進行檢測。我們從凝膠中提取出切割部分的時間關係信息,以計算每個DNA酶的k obs和產率。使用以下公式建立k obs的值:切割部分=FC max(1-e-kt),其中k=k obs並且FC max=切割部分的最大值。對於映射測定,我們用SYBR Gold對凝膠進行染色,用Bio-rad ChemiDoc MP成像系統對其進行掃描,並且使用ImageQuant軟體分析數據。
PECAN方案。
定制ssDNA假基因的設計。我們藉由設計DNA構建體來啟動該方案,該構建體在定制ssDNA的5'端和3'端攜帶一對自切割DNA酶,以用於噬菌粒重組。定制序列的5'端和3'端的核苷酸身份決定了所選擇的對應的DNA酶。5'DNA酶的規則是13PD1用於5' T,13PD1-A用於5' A,13PD1-G用於5' G,並且13PD1-C用於5' C。
粗體鹼基部分為催化結構域和受質結構域,並且序列是保守的;
帶下劃線的鹼基部分為鹼基互補配對區,並且順序可更改;
標簽|斜體鹼基為切割位點
(1)脫氧核酶催化結構域和受質結構域分離並且以兩條DNA鏈的形式起作用:
13PD1催化序列:
5’GTCGCCATCTCTTC TATACCGGGCAACTATTGCCTCGTCATCGCTATTTTCTGCG ATAGTGAGTCGTATTA-3'(SEQ ID NO:8)
13PD1受質序列:
5'-TAATACGACTCACTAT ACTGC | T GAAGAGATGGCGAC-3’(SEQ ID NO:9)
13PD1-A催化序列:
5’GTCGCCATCTCTTC TATACCGGGCAACTATTGCCTCGTCATCGCTATTTTCTGCG ATAGTGAGTCGTATTA-3'(SEQ ID NO:8)
13PD1-A受質序列:
5'-TAATACGACTCACTAT ACTGC| A GAAGAGATGGCGAC-3’(SEQ ID NO:10)
13PD1-C催化序列:
5’GTCGCCATCTCTTC TATACCGGGCAACTATTGCCTCGTCATCGCTATTTTCTGCG ATAGTGAGTCGTATTA-3’(SEQ ID NO:8)
13PD1-C受質序列:
5'-TAATACGACTCACTAT ACTGC| C GAAGAGATGGCGAC-3’(SEQ ID NO:11)
13PD1-G催化序列:
5’GTCGCCATCTCTTC TATACCGGGCAACTATTGCCTCGTCATCGCTATTTTCTGCG ATAGTGAGTCGTATTA-3'(SEQ ID NO:8)
13PD1-G受質序列:
5'-TAATACGACTCACTAT ACTGC | G GAAGAGATGGCGAC-3’(SEQ ID NO:12)
(2)脫氧核酶催化結構域和受質結構域位於一條DNA鏈上,並且以一條DNA鏈的形式起作用:
13PD1:
Figure 112111548-A0202-12-0024-12
Figure 112111548-A0202-12-0024-13
(SEQ ID NO:13)
13PD1-A:
Figure 112111548-A0202-12-0025-14
Figure 112111548-A0202-12-0025-15
(SEQ ID NO:14)
13PD1-C:
Figure 112111548-A0202-12-0025-16
Figure 112111548-A0202-12-0025-17
(SEQ ID NO:15)
13PD1-G:
Figure 112111548-A0202-12-0025-18
Figure 112111548-A0202-12-0025-19
(SEQ ID NO:16)
3'DNA酶的選擇是II-R2-G用於3' G,II-R2-A用於3' A,II-R3用於3' T,II-R2-C用於3' C。一旦確定了DNA酶對,我們就將它們的序列補充到定制ssDNA的兩端,使得補充物可藉由募集定制ssDNA的末端序列作為其結構的一部分,自折疊到對應DNA酶的二級結構中。這是藉由以下方式實現的:編程~15nt的補充序列以與定制ssDNA的~15nt的末端序列互補,從而形成DNA酶的關鍵支撐莖(實施例和詳細信息參見圖11)。對DNA酶序列的補充將定制DNA的長度擴展到200nt以上。我們將此類長DNA構建體視為用於基因合成的雙鏈假基因片段。
定制ssDNA假基因的合成。在本研究中,我們設計的假基因的長度範圍為~230bp至~7000bp。藉由在簡單的轉化事件(Gibson組裝)中將一系列重疊的合成ssDNA(長度為~100-150nt)與線性化質粒載體一步組 裝,可在酵母中對此類大DNA片段進行高效組裝。26該技術已被許多公司商業化以合成“基因片段”。在本文中,我們要求一家當地公司(上海捷瑞生物工程有限公司)在轉化過程中將我們的假基因片段與p3024噬菌粒載體(而不是普通的質粒載體)組裝起來。產品以插入假基因的重組p3024噬菌粒(~5μg)的形式交付於我們。之後,在輔助噬菌體的幫助下,可使用重組p3024產生攜帶ssDNA噬菌粒的噬菌粒顆粒。
ssDNA噬菌粒顆粒的產生。對於每次噬菌粒擴增,我們在冰上解凍100μL的JM109感受態細胞(生工生物工程(上海)有限公司),並將細胞與1-10ng重組p3024噬菌粒混合,在冰上孵育30分鐘。然後,我們將樣品在42℃水浴中熱脈衝45秒,並且再次在冰上孵育2-3分鐘。我們向樣品中加入900μL LB培養基,並且在37℃下以220r/min的速度將其振盪1小時。然後,以5000r/min將樣品離心5分鐘。我們除去900μL上清液,將細胞重新懸浮於剩餘培養基中,並且將培養基鋪板於含有胺苄青黴素(100μg/ml)的預熱(37℃)LB瓊脂平板上。我們將平板倒置並且在37℃下孵育12小時。第二天,我們選取單菌落(通常為2至4個),並且藉由測序篩選出具有正確轉化的重組p3024的菌落。
對於典型培養,在含有胺苄青黴素(100μg/ml)的15mL LB培養基中,我們使重組p3024轉化的單菌落在37℃下生長過夜。然後,我們為四瓶300ml 2x YT培養基(16.0g/l胰蛋白腖,10.0g/l酵母提取物,5.0g/l NaCl,5mM MgCl2,pH 7.0)中的每一瓶接種3ml過夜培養物,並且在37℃下以250r/min的速度對其進行振盪。我們每隔30分鐘監測一次培養物的OD600。當OD600值達到~0.4-0.5時,我們將VCSM13輔助噬菌體添加到 MOI為20(噬菌體與細胞的比率,50μL的3x 1010個噬菌體/μL VCSM13噬菌體原液與300ml細胞培養物的OD600值為~0.5(2.5 x 108個細胞/ml))的培養物中。30分鐘後,我們將卡那黴素(終濃度為70μg/ml)添加到培養物中,以選擇受感染細胞。我們繼續振盪培養物4.5小時,然後收集培養物,在4℃下以4000r/min離心15分鐘。我們將上清液轉移到乾淨的瓶子中,並補充PEG 8000(40g/l)和氯化鈉(30g/l)。在劇烈攪動(攪拌)來溶解粉末後,我們將混合物在冰上孵育30分鐘,然後在4℃下以5000rcf離心30分鐘。我們丟棄上清液並且將噬菌粒沉澱重新懸浮於10ml Tris(10mM,pH 8.5)中,將其在4℃下以16000rcf進一步離心10分鐘,除去任何細菌殘留物。我們收集含有純重組p3024噬菌粒顆粒的所得上清液。
ssDNA噬菌粒的提取。藉由剝離蛋白質衣殼,從噬菌粒顆粒中提取ssDNA噬菌粒。我們藉由旋動將2倍體積(相對於噬菌粒顆粒收集物體積)的NaOH(0.2M,含1% SDS)與噬菌粒收集物混合。我們將混合物在室溫下孵育3分鐘,然後藉由倒置將1.5倍體積的KOAc(3M,用冰醋酸滴定至pH 5.5)與樣品輕輕混合。然後,我們將樣品進一步在冰水浴中孵育10分鐘,並且在4℃下以16000rcf離心30分鐘。我們收集上清液,將其與2倍體積的100%乙醇混合,並且在冰水浴中孵育30分鐘。我們在4℃下以16000rcf再次旋轉混合物30分鐘,收集沉澱(重組p3024 ssDNA),並且用75%乙醇洗滌,除去其他鹽類。我們將沉澱置於空氣中乾燥10分鐘,然後將其凍乾以進行稱重和儲存。通常,我們從搖瓶中製備的1.2L培養物中獲得~3-8mg重組p3024 ssDNA。當我們在10L實驗室發酵罐中進行培養時,我們常規地獲得了~0.4-1g重組p3024 ssDNA。
藉由誘導DNA酶切割釋放定制的ssDNA。經由p3024載體擴增定制的ssDNA。為了將其從載體中釋放出來,我們誘導位於定制ssDNA兩側的編程的DNA酶進行自切割。我們將重組p3024 ssDNA(終濃度為100nM)溶解在含有50mM HEPES(22℃時pH 7.0)、100mM NaCl和10mM MgCl2的緩衝液中。然後,我們執行退火方案,90℃退火3min,75℃退火5min,60℃退火5min,45℃退火續5min,並且22℃退火5min。我們向樣品中加入含有50mM HEPES(23℃時pH 7.0)、100mM NaCl、10mM MgCl2、10mM MnCl2和2mM ZnCl2的等體積的第二緩衝液,並且在37℃下孵育,以進行DNA酶催化的DNA處理數小時(2-4h)。我們將反應產物與3倍體積的100%乙醇(在4℃下預冷)劇烈混合,並且在4℃下以16000rcf離心混合物30分鐘。我們收集沉澱,用75%乙醇(在4℃下預冷)將其洗滌以除去殘留的鹽,在4℃下再次以16000rcf離心樣品7分鐘,然後將沉澱重新懸浮於1×變性上樣緩衝液(40mM Tris、40mM硼酸鹽、6M尿素、0.5mM EDTA,pH 7.2,10%(w/v)蔗糖、0.05% SDS、0.01%(w/v)溴酚藍、0.01%(w/v)二甲苯藍)。對於長度小於1000nt的定制ssDNA,我們選擇變性PAGE對其進行純化;對於超過1000nt的定制ssDNA,我們藉由變性瓊脂糖凝膠對其進行純化(示例見圖12)。可替代地,我們使用陰離子交換色譜方案對ssDNA進行大規模(mg-g)純化。
RNA原位檢測。對於在載玻片上生長的細胞樣品,我們使用0.1M HCl來透化細胞。然後,用0.05%(v/v)吐溫-20於1×焦碳酸二乙酯處理的磷酸鹽緩衝鹽水(DEPC-PBS)中洗滌樣品2分鐘。對於從中國福建醫科大學附屬泉州第一醫院病理科獲得的人乳腺癌福爾馬林固定石蠟包埋 (FFPE)組織切片,我們將其在60℃的烤箱中孵育30分鐘,然後用ddH2O連續洗滌兩次,一次15分鐘,一次10分鐘。用一系列濃度遞減的乙醇(100%、95%、70%)將載玻片再水化兩次,每次2分鐘,用焦碳酸二乙酯處理的H2O(DEPC-H2O)處理5分鐘並且用1×DEPC-PBS處理2分鐘,隨後使用4%多聚甲醛固定10分鐘。用1×DEPC-PBS洗滌樣品2分鐘。在含有0.1mg/ml胃蛋白酶的0.1M HCl溶液中在37℃下透化進行30分鐘。然後以70%、85%和100%的乙醇梯度進行脫水,每次1分鐘。人體組織材料的使用符合華僑大學倫理委員會的要求。
預處理後,使用安全密封雜交室(Thermo Scientific)或ImmEdge筆(Sigma-Aldrich)劃定反應區。我們將0.1μM掛鎖探針(用5'磷酸化化學合成或由PECAN製備)於雜交緩衝液(6×鹽水檸檬酸鈉(SSC,Sigma-Aldrich),10%甲醯胺)中加入到反應區,在37℃孵育2小時。然後,用補充有20%甲醯胺的2×SSC洗滌樣品三次,並且用DEPC-PBS洗滌三次。接下來,我們用含有0.5U/μL SplintR連接酶、1×SplintR連接酶反應緩衝液(New England Biolabs)、50%(v/v)甘油、1U/μL RiboLock RNase抑制劑和0.2μg/μL BSA於DEPC-H2O中的反應混合物,將樣品在37℃下孵育1小時。用DEPC-PBS洗滌三次後,我們將1μM引子DNA於滾動環擴增(RCA)緩衝液中加入到樣品中,並且在37℃下孵育30分鐘,隨後用DEPC-PBS洗滌三次。然後,在1U/μL phi29 DNA聚合酶、1×phi29 DNA聚合酶反應緩衝液、1mM dNTP、5%(v/v)甘油和0.2μg/μL BSA於DEPC-H2O中的混合物中,在30℃下進行RCA反應過夜。樣品用1×DEPC-PBS、2×SSC和20%甲醯胺的混合物洗滌三次。之後,我們將0.1μM檢測探針 應用於樣品,並且將其在22℃下保持30分鐘。用DEPC-PBS洗滌三次除去多餘的探針。然後,在成像之前,用0.5μg/mL DAPI於SlowFade Gold抗淬滅封片劑(Thermofisher)中對樣品進行染色。為了分析螢光顯微鏡拍攝的圖片,我們使用Ilastik(https://www.ilastik.org)鑑定細胞核,並且使用CellProfiler(https://www.cellprofiler.org/)鑑定RCP點。
RNA剪接分析。
LASSO探針的設計和構造。根據已知的轉錄物信息,我們在感興趣的轉錄物上選擇適當的位點(25-35nt),以將轉錄物中捕獲的序列的長度設置為~400-800nt來跨越兩到三個外顯子的方式,藉由LASSO探針進行特異性識別。然後,藉由在與識別位點結合的一對引子之間填充~300-500個加擾核苷酸作為長適配子,以倒置分子探針的方式共價連接這對引子。所得的LASSO探針經過PECAN方案以產生ssDNA。
cDNA的製備。根據隨附的用戶指南,我們藉由使用TRIzol試劑(Invitrogen)從每個樣品~107個細胞中分離出總RNA。為了合成cDNA,我們從2μg總RNA作為商業化試劑盒(PrimeScriptTM RT試劑盒與gDNA Eraser,寶生物)逆轉錄的模板開始。收集的cDNA藉由NanoDrop分光光度計(Thermo Scientific)進行定量。
藉由LASSO探針進行的捕獲。我們將1-10fmol的LASSO探針與100ng cDNA於20μL 1×擴增酶緩衝液(EpiCentre)中混合。為了確保LASSO探針與cDNA的雜交,我們將混合物加熱至98℃5分鐘,並且以每分鐘1℃的速度緩慢冷卻至56℃。對於探針延伸和接合,向混合物中加入0.6U Phusion聚合酶、5U擴增酶(EpiCentre)和3pmold NTP。樣品進 一步在56℃孵育60分鐘,72℃孵育20分鐘,95℃孵育3分鐘,然後在冰上冷卻。為了消除混合物中的線性cDNA,我們用0.5μL核酸外切酶I(20單位/μL)和0.5μL核酸外切酶III(100單位/μL)在37℃下將反應產物酶切30分鐘。之後,藉由在90℃孵育10分鐘滅活樣品中的核酸外切酶。
捕獲的產物的檢測和測序。對於每個捕獲的產物,我們使用靶向於探針適配子區的一對引子來擴增捕獲的序列(見圖3b)。使用約5μL捕獲的產物作為擴增模板,並且進行30個PCR循環。PCR產物進行瓊脂糖凝膠電泳分析,並且在凝膠純化後進行測序。
基因植入。
細胞培養。在補充有10%胎牛血清(FBS,Gibco)、100單位/ml青黴素和100g/ml鏈黴素(Beyotime)的DMEM(Hyclone)穀胺醯胺(glutamax)培養基中,維持HEK 293T細胞。在mTeSRTM加含10% FBS的基礎培養基(Stemcell Technologies)中,在基質膠包被板(Gibco)上培養H9 hESCs。所有細胞保存在37℃的5% CO2的潮濕氣氛中。
sgRNA的體外轉錄和純化。用於sgRNA的DNA模板購自上海捷瑞生物工程(中國)有限公司訂購。轉錄在補充有2mM NTP、80pmol DNA模板和10U T7 RNA聚合酶的1×轉錄緩衝液(40mM Tris pH 8.0、20mM MgCl2、5mM DTT和2mM亞精胺)中進行。樣品在37℃下孵育3小時。sgRNA產物之後用8%變性PAGE凝膠純化,等分並且儲存在-80℃。
Cas9的表達和純化。重組化膿性鏈球菌(S.pyogenes)Cas9(pMJ915)構建體購自Addgene(質粒編號:69090),並且轉化到大腸桿菌(E.coli)BL21(DE3)感受態細胞進行Cas9表達。pMJ915轉 化的單菌落在含100μg/ml胺苄青黴素的10ml LB培養基中在37℃下生長,並且以250rpm的速度振盪過夜。然後,將細胞接種到1 l 2×YT培養基中,在37℃下培養至OD600達到~0.4-0.5。培養物冷卻至15℃,保溫2小時。藉由0.1mM異丙基β-D-1-硫代半乳糖吡喃糖苷(IPTG)補充物誘導蛋白質表達。在15℃下培養16小時後,藉由在4℃下以5000rpm離心15分鐘來沉澱細胞。去除上清液後,將細胞重新懸浮於300mM NaCl、30mM Tris-HCl(pH 8.0)和0.01%β-巰基乙醇的裂解緩衝液中,並且使用高壓均質器(EmulsiFlex-C3,Avestin)進行裂解。收集細胞裂解物並且在4℃下以16000rpm離心30分鐘。然後,將收集的上清液與Ni瓊脂糖TM 6快速流動珠(GE Healthcare)在4℃下孵育1小時。我們使用含有500mM NaCl、30mM Tris-HCl(pH 8.0)、0.01% β-巰基乙醇和40mM咪唑的緩衝液,洗滌微珠,去除非特異性結合的蛋白質。洗滌後,用150mM NaCl、30mM Tris-HCl(pH 8.0)、0.01%β-巰基乙醇和220mM咪唑的緩衝液沖提Cas9蛋白。使用SS5(AKTA純化系統,GE Healthcare)陽離子交換色譜法進一步純化沖提物。使用BCA蛋白測定試劑盒(Abcam)對所得到的Cas9蛋白進行定量,並且在-80℃下儲存在25mM HEPES(pH 7.4)、30mM NaCl、3mM DTT和20%甘油的緩衝液中。
dsDNA HDRT的製備。所有dsDNA HDRT均使用相應的質粒作為模板藉由PCR擴增製備(序列參見補充表1和2)。擴增在25μL 2×Phanta Flash Master Mix(諾唯贊生物)、2μL每種引子(10μM),1μL質粒模板(10ng/μL)和20μL ddH2O混合的50μL溶液中進行。產物使用TaKaRa MiniBEST DNA片段純化試劑盒4.0版本(寶生物工程有限公司) 進行純化。將DNA樣品重新懸浮於ddH2O中,並且藉由1%瓊脂糖凝膠電泳進行質量檢查。藉由Nanodrop(Thermo Fisher)測定每種dsDNA HDRT的濃度。
Figure 112111548-A0202-12-0033-20
Figure 112111548-A0202-12-0033-21
藉由核酸外切酶消化製備ssDNA HDRT(Kit)。我們在製備dsDNA HDRT中使用相同的方案來首先獲得dsDNA HDRT。在PCR擴增過程中,我們使用5'磷酸化引子生成dsDNA,因此其中一條鏈可以在之後消化。根據製造商的建議,我們使用Guide-itTM Long ssDNA生產系統(寶生物工程有限公司)處理純化的dsDNA HDRT。具體地,由Strandase Mix A&B消化具有5'磷酸鹽的DNA鏈。酶消化後,使用NucleoSpin凝膠和PCR淨化試劑盒(Macherey-Nagel)純化剩餘的ssDNA產物。使用該策略,我們製備了有義和反義ssDNA HDRT。ssDNA樣品藉由1%瓊脂糖凝膠電泳進行質量檢查。藉由Nanodrop對每種ssDNA HDRT的濃度進行定量。
細胞電穿孔。根據製造商的建議,使用Neon轉染系統10μL試劑盒(Thermo Fisher)轉染HEK 293T細胞和H9 hESCs細胞。對於每次同源重組測定,將1.5μg Cas9蛋白和360ng sgRNA加入到重新懸浮緩衝液R中,最終體積為2μL。樣品在23℃下孵育10分鐘,以允許對Cas9 RNP進行預組裝。將2.5μg HDR供體DNA(dsDNA/PECAN ssDNA或Kit ssDNA)溶解在8μL緩衝液R中,然後補充RNP。將總共10μL樣品與含有1.8×105個HEK 293T細胞或5×105個H9 hESCs細胞的2μL緩衝液R混合。使用經優化的程序立即對細胞進行電穿孔。對於HEK 293T細胞,將程序設置為1200V,2次脈衝,脈衝寬度為20ms。電轉染後,在24孔板上,將HEK 293T細胞接種於500μL預熱DMEM培養基中。對於H9 hESC,首先使用AccutaseTM(Gibco)將細胞解離成單細胞懸液。隨後的電泳程序設置為1100V,2次脈衝,脈衝寬度為20ms。電轉染後,在Matrigel包被的24孔板上,將H9 hESCs細胞接種於500μL預熱mTeSRTM Plus培養基中。將電穿孔的細胞培養2-3天,然後解離成單個細胞進行FACS分析。
流式細胞術和分析。為了確定mEGFP陽性、mCherry陽性或mBFP陽性細胞的百分比,在電穿孔和培養後,在BD LSRFortessa流式細胞儀上對HEK 293T細胞和H9 hESC細胞進行單獨分析。在Moflo Astrios EQ 4上進行細胞分選。使用FlowJo軟體(FlowJo LLC)分析流式細胞術數據和製作圖表。
細胞成像。對於共聚焦顯微鏡成像,在電穿孔或細胞分選後,使HEK 293T細胞和H9 hESCs細胞單獨生長於35mM玻璃培養皿(Cellvis)中。活細胞在TCS SP8 STED 3X顯微鏡(Leica)上以63×和63×3放大倍率成像
實施例1DNA酶用於PECAN開發。
儘管在選擇和優化方面做出了許多努力,但對於DNA酶引導的DNA特異性切割,仍未解決缺乏廣泛的序列通用性的問題。考慮到這一點,我們設法規避而不是克服這一通用性問題來構思PECAN。藉由將不同的DNA酶1和2分別編程為目標寡核苷酸的5'和3'自切刀,我們預期減弱每種酶用於無疤痕寡核苷酸生產時所需的對序列通用性的嚴格性(圖1a)。可以想像,藉由此類計劃,我們只需要能夠耐受3'序列的DNA酶1和能夠在其對應的切割位點耐受5'序列的DNA酶2。
藉由搜索已知DNA切割DNA酶池,我們很快將13PD1和I-R3確定為DNA酶1的潛在候選物,因為兩者均被報導對DNA進行位點特異性水解,並且在切割位點(以下稱為^)的3'處僅具有一個(對於13PD1,圖1b)或兩個(對於I-R3,圖6a)保守的核苷酸(nt)。在37℃下,兩種酶的穩健性反映為觀察到的速率常數(k obs)值為~1min-1並且5分鐘內的產率>90%。
點突變實驗證實了較佳^T>A>G>C-3'用於13PD1,如k obs從^T到^C的10倍減少所示(圖1d及圖1e)。然而,此類催化速度的損失可 簡單地藉由適度延長反應時間(例如,從5分鐘延長到1小時)來補償,以在13PD1的^A、^G或^C突變體的DNA切割中實現幾乎無損的產率(>85%)(圖1d及圖1e)。相反,I-R3在保守^AG-3'處表現出較差的序列耐受性,大多數突變體的切割產率不可挽回(圖6b至圖6d)。
根據所報導的該酶的二級結構模型(圖1b),13PD1中^T-3'下游的核苷酸被埋在表觀莖內。一般,它們可被編程為任何身份,只要維持莖中鹼基互補即可。^T-3'下游第一個鹼基對的全面協變一致揭示,13PD1及^A、^G、^C突變體的產率未改變(1小時內>85%)(圖7)。總的來說,我們確定13PD1可用作DNA酶1來有效地產生具有可定制的5'末端的3'切割產物(^NN-3',N指任何核苷酸)。
接下來,我們轉向DNA酶2並且認為II-R1是候選物,因為II-R1在5'莖後立即水解DNA(圖1c)。然而,測試顯示,該酶也具有核苷酸偏好(5'-G>A/T/C^),並且即使對於較佳的5'-G^,II-R1也僅在k obs值為0.013min-1或在1小時內以60%的產率進行切割(圖1f,圖8a)。為了同時提高II-R1的5'序列耐受性和水解活性,我們將5'核苷酸預設為G、A、T或C並且創建了相應的簡併且DNA文庫,以便重新選擇可更快進行切割的突變體(參見方法,圖8b)。
重選後分析揭示了一個名為II-R2的突變體和名為II-R3的第二個突變體,II-R2對5'-G/A/C^的1小時切割產率超過85%,但對5'-T^的1小時產率不足(63%),而II-R3對5'-T^的1小時產率達到~88%(圖1c及圖1d和f,圖8c和圖9a)。綜合協變實驗證實,對於II-R2,5'-G/A/C^的上游莖中的核苷酸是可編程,對於II-R3,5'-T^的上游莖中的核苷酸是 可編程的(圖9b至圖9e)。因此,將II-R2和II-R3組合使用為DNA酶2可穩健地生成具有可定制的3'末端的5'切割產物(5'-NN^)。
因此,將II-R2/3與13PD1配對用於雙切割應當生成具有定制的5'至3'序列的DNA片段(5'-NN...NN-3')(圖1a)。考慮到這些酶的金屬離子依賴性不同,我們鑑定出一種相容的緩衝液條件(50mM HEPES,pH 7.0,1mM Zn2+和5mM Mn2+),其中每種DNA酶可在37℃下2小時內自切割超過85%(圖10),從而可在一鍋反應中同時切割兩種酶。基於這些發現,我們能夠編程出一對正確的DNA酶1和2來位於靶標寡核苷酸的任意序列兩側(圖11),將整體合成為假基因片段,並且經由p3024噬菌粒載體(pBluescript變體)對其進行擴增,以生成PECAN寡核苷酸(參見方法,圖1a)。請注意,因為這對DNA酶精確地切割了3'磷酸酯鍵,所以PECAN寡核苷酸天生具有5'磷酸鹽和3'羥基末端。
實施例2 PECAN寡核苷酸的長度、數量、純度和序列可定制性。
攜帶極長DNA插入的重組噬菌體在體內複製時容易產生片段化的副產物。我們的實驗揭示,在插入<7000個鹼基對(bp)的情況下,重組p3024可在大腸桿菌(Escherichia coli)中高效擴增,一致地產生無副產物的單鏈噬菌粒。藉由使用搖瓶培養物,我們常規收集數毫克的單鏈噬菌粒。使用10升實驗室發酵罐(圖12a),可將數量進一步提高到克級,與之前關於噬菌體生成的報告一致。在擴增後自動處理過程中,II-R2/3和13PD1的配對使用在切除一系列不同長度(~70mer到6750mer的範圍)的寡核苷酸時顯示出穩健的效果,用於收集的單鏈噬菌粒前體的產率為>85%(圖12b)。
PECAN募集細菌複製機制和自催化DNA酶,以便大規模地高效生成DNA寡核苷酸。前者的高保真度和後者的高特異性也應在原則上保證寡核苷酸產物的純度。為了驗證這一點,我們將PECAN與化學合成(CS)所生成的寡核苷酸進行了比較(圖2a至圖2d)。選定的代表包括65mer、69mer和71mer,GC含量分別為74%、51%和46%。當進行變性聚丙烯醯胺凝膠電泳(dPAGE)時,三種PECAN寡核苷酸都在凝膠上表現出乾淨且清晰的條帶,而CS寡核苷酸(經PAGE純化)均產生模糊條帶,這表明後者存在不可忽視的雜質(圖2a和圖2c)。這些結果與單同位素(精確質量)光譜的數據一致,其中PECAN 71mer顯示了全長寡核苷酸的單個質量峰,而CS 71mer在主要全長寡核苷酸周圍存在許多峰(圖2b)。使用下一代測序(NGS),我們對這些樣品的組成進行了徹底分析。對於CS,隨著長度從65mer增加到71mer,無差錯全長寡核苷酸的比例從64.1%下降到49.7%,而69mer端粒序列的全長純度僅顯著降低6.1%,這可能是由於其存在G-四聯體(G4)強二級結構(圖2d)。在CS寡核苷酸的差錯中,單鹼基插入缺失(插入或缺失)和突變占大多數,並且在寡核苷酸末端發生的頻率較高(圖13)。相反,在PECAN 65mer和71mer的分子中,無差錯全長寡核苷酸占>98%,無論其長度和GC含量差異如何。即使是極易出錯的69mer G4序列,PECAN也能確保>90%的純度(圖2d)。因此,PECAN可達到寡核苷酸生產的單鹼基精度。
除了這三種代表物之外,藉由PECAN,我們成功生產出具有不同序列身份(尤其是在末端(圖14))並且具有不同的序列長度(從數十個到 數百到數千個核苷酸(圖3c,4a))的多種DNA寡核苷酸,這證明了PECAN的良好可定制性。
實施例3在RNA原位檢測中的應用。
60-100mer DNA寡核苷酸可被設計為單分子螢光原位雜交中廣泛使用的掛鎖探針(PLP),這是一種研究單細胞基因表達的強大技術。與滾圓擴增(RCA)相結合,PLP可在保存的組織和細胞中產生高密度的選殖擴增滾動圈產物(RCP),用於單個RNA分子的原位檢測(圖2e)、基因分型和測序。目前,CS寡核苷酸是PLP的主要來源,但很少有人知道與RNA分辨率呈正相關的檢測效率是否受到寡核苷酸的質量的影響。使用更純淨的PECAN寡核苷酸(圖2a至圖2d),我們對此進行了初步探索。
根據人類蛋白質圖譜數據庫(www.proteinatlas.org),在乳腺癌細胞系MCF-7中,據報導HER2 mRNA的表達水平較低(nTPM=4.8)。利用CS PLP,我們記錄了每個MCF-7細胞的平均RCP數量為9.3(n=283)。改為PECAN PLP(圖14),檢測到的數量增加到18.8(n=316),這相當於檢測效率提高了102%(圖2f及圖2g)。類似地,在CCNB1表達較低的第二細胞系SK-BR-3中,檢測到的每個細胞的平均RCP數量從CS PLP的3.7(n=787)增加到PECAN PLP的5.3(n=639),其中效率增加了43%(圖2f及圖2g)。
為了進一步研究常規臨床樣品多路原位RNA檢測期間的效率,我們轉向福爾馬林固定石蠟包埋(FFPE)的乳腺癌組織切片(該切片在診斷實驗室中被免疫組織化學(IHC)歸類為HER2陽性),並且同時在兩張連續的載玻片上檢查了四個轉錄物,一個載玻片為CS PLP,另一個載玻片為 PECAN PLP(圖2h及圖2i)。這些RNA包括HER2MKI67ESR1PGRR,分別對應於常規IHC測試的乳腺癌生物標誌物Her-2、Ki-67、ER和PR。兩種PLP在組織切片中都檢測到HER2 RNA的表達相對較高,其中PECAN PLP顯示出的效率比CS PLP高62%(圖2h及圖2i)。與此同時,如所預期的,兩種PLP在HER2陽性組織切片中都檢測到MKI67ESR1PGR的表達非常低(圖15)。然而,對於這三種RNA,PECAN PLP的檢測效率比CS PLP提高了>100%,統計分析清楚地表明瞭這一點(P<0.0001)(圖2i)。
綜上所述,我們的初步研究證實,作為探針,PECAN寡核苷酸可穩定提高組織和細胞中的RNA檢測效率。結果與常規PECAN寡核苷酸和CS寡核苷酸之間的>98%和<65%的純度一致(圖2d)。
實施例4在用於靶向測序的大片段捕獲中的應用。
特異性捕獲多外顯子大小(~200-1000bp)的長基因組區可準確地保存樣品的基因組信息,以便藉由靶向測序對基因產物和調控元件進行功能分析。為此,開發出長掛鎖或長適配子單鏈寡核苷酸(LASSO)探針(長度通常為300-500mer)作為下一代分子倒置探針,以克服長dsDNA在捕獲過程中的持續長度(剛度)的問題(圖3b)。然而,目前的合成方法無法高效產生如此長的低聚物,從而阻礙了我們對大片段捕獲產生的高質量序列中基因的功能意義的理解。
我們相信,PECAN為LASSO探針提供了終極解決方案。作為初步的概念驗證,我們藉由PECAN生成LASSO探針,以分析不同細胞系中的可變剪接。基因S100P在肝癌97L(但非正常肝(NL))細胞中轉錄為 單一亞型(NCBI登錄號:NM_005980.3),並且CYP24A1具有兩種經過驗證的剪接變體,tv1(NCBI登錄號:NM_000782.5)和tv2(NCBI登錄號:NM_001128915.2),前者僅在97L中表達,而後者在兩者中均表達(圖3a)。為了準確顯示這些轉錄差異,我們設計了LASSO探針1(335mer)和探針2(550mer),分別特異性靶向於S100PCYP24A1 tv1。在間隙填充和接合後,應捕獲到S100P中的401bp片段和CYP24A1 tv1中的749bp片段,以進行靶向擴增和測序(圖3b)。
藉由dPAGE,我們首先證實了PECAN LASSO 1和2的純度和長度(圖3c)。擴增後,在瓊脂糖凝膠上揭示,藉由PECAN LASSO 1從97L而非NL中捕獲到預期長度的片段(圖3d)。該片段之後藉由測序被證實來自S100P(圖3e,圖16a)。有趣的是,對於由PECAN LASSO 2進行的捕獲,除了預期的片段之外,還從97L中顯露出第二個大小為~200bp以上的片段(由*表示),但沒有從NL顯露出(圖3d)。經測序數據驗證,預期的片段屬CYP24A1 tv1,而非預期的片段實際上來自CYP24A1 tvX1(NCBI登錄號:XM_005260304.5)(圖3e,圖16b及圖16c),這是CYP24A1的另一種亞型,已被生物信息學預測,但尚未在97L中進行實驗驗證。CYP24A1 tvX1CYP24A1的區別僅在於外顯子11和12之間的172bp插入,因此能夠被最初設計用於與外顯子10和12雜交來特異性捕獲CYP24A1 tv1的PECAN LASSO 2所捕獲(圖3b)。藉由使用PECAN LASSO 2,我們進一步篩選了一系列肝癌細胞系來探索CYP24A1的剪接亞型,並且發現CYP24A1 tv1tvX1在97L、97H、LM3和HepG2中均有表達,但在Hu7細胞中沒有表達,這證明了PECAN寡核苷酸的可行性。
實施例5在同源定向基因組編輯中的應用。
基因組編輯技術、特別是CRISPR/Cas9系統的快速發展,藉由容易出錯的非同源末端連接,能夠高效生成敲除(KO)細胞和小鼠模型。然而,藉由使用外源性DNA供體作為同源定向修復(HDR)的模板,精確插入序列(例如,報告基因或重組酶的植入(KI))和精確取代序列(例如,用LoxP位點在兩側的外顯子條件性敲除等位基因)的效率非常差,這為生物醫學研究中最有用的基因工程模型製造了障礙。最近的研究揭示,長的千鹼基ssDNA可用作其等效dsDNA HDR模板(HDRT)的有吸引力的替代方案,從而系統地提高基因組編輯的效率,但缺乏一種穩健的合成方法來生成此類大小的寡核苷酸。我們推測,能夠合成高達7000mer的任意寡核苷酸的PECAN可以解決具有挑戰性的HDRT ssDNA的來源問題。
為了驗證我們的推測,我們對具有等效序列但形式不同的長DNA供體(包括藉由PCR擴增製備的dsDNA和藉由試劑盒或PECAN製備的ssDNA)進行了比較分析,以便將螢光報告基因引入到人類細胞系中(圖4)。我們選擇Guide-itTM長ssDNA鏈酶試劑盒,對用於Kit ssDNA的生成的dsDNA中的兩條鏈之一進行選擇性降解。基於之前的報告,我們設計了具有~400mer同源臂的HDRT來最大限度地提高KI效率,結果製備出一系列~1500bp或~1500nt HDRT,以便將螢光標簽(~700nt)融合到Hek293T細胞中的管家基因TUBA1B、CLTA、FBL或RAB11A。
dPAGE分析證實,PECAN的所有~1500mer HDRT的寡核苷酸產物的純度比Kit的產物的純度高得多(圖4b,圖17)。當電穿孔到Hek293T細胞中時,PECAN HDRT導致活力損失可忽略不計(圖18)。在 螢光活化的細胞分選後,活細胞成像顯示藉由dsDNA HDRT進行的所有KI都明顯脫靶,藉由Kit HDRT進行KI在FBL基因座處明顯脫靶,與此相反,藉由PECAN HDRT進行的所有KI未見脫靶,這表明PECAN HDRT是三者中最具特異性的KI供體(圖4c)。這些結果與藉由省略CRISPR系統中的單嚮導RNA(sgRNA)進行的定量脫靶測量一致,其中在包括FBL基因座在內的所有基因座,PECAN HDRT導致的脫靶整合度<1%,而在該基因座上,利用Kit HDRT和dsDNA HDRT進行的KI中檢測到脫靶分別為>5%和>95%(圖4d)。我們推斷,PECAN HDRT的低脫靶率得益於這些DNA的高質量,特別是與Kit HDRT和dsDNA HDRT相比,寡核苷酸產物中沒有dsDNA片段,因為dsDNA供體可藉由隨機雙鏈斷裂時dsDNA的潛在非同源整合導致高速率的非特異性KI。
接下來,我們選擇在所有三種類型的HDRT中顯示<1%脫靶的TUBA1B基因(圖4d)來評估表觀KI效率(GFP陽性細胞的百分比)。在Hek293T細胞中,我們檢測到PECAN HDRT導致~28-41%的GFP KI,比Kit HDRT的效率高>2倍並且超過了dsDNA HDRT的效率,無論是對有義鏈還是反義鏈而言(圖4e)。在不易KI的H9細胞中,我們使用PECAN HDRT達到了14.5%的表觀效率,並且效率從PECAN HDRT到Kit HDRT再到dsDNA HDRT逐漸降低,最佳和最小之間呈3倍波動(圖4e)。藉由數字液滴PCR測定,我們進一步表徵了,在GFP陽性Hek293T細胞中,TUBA1B基因座處的在靶GFP頻率(特異性)在使用PECAN HDRT時達到98.46%,而使用Kit HDRT為84.91%(圖19)。
PECAN供體的高KI效率和特異性使我們能夠輕鬆構建出攜帶螢光報告基因雙KI的高質量細胞模型(圖4f)。利用這些免染細胞模型,我們對哺乳動物細胞四面體DNA奈米結構(TDN)內化進行了初步研究,該四面體DNA奈米結構已作為藥物遞送的載體廣泛用於DNA奈米技術中。在共聚焦顯微鏡下,我們觀察到花青5(Cy5)貼標的TDN與GFP標記的微管(圖4g)共定位,為細胞中TDN的微管依賴性運輸提供了支持。有趣的是,我們還發現Cy5-TDN在細胞週期的不同階段與RFP標記的網格蛋白重疊(圖4h),這意味著除了所報導的小窩蛋白的攝取外,網格蛋白還可能藉由網格蛋白-微管途徑參與了TDN的內吞作用。由於需要進一步的工作來完全揭示TDN的內化機制,毫無疑問,藉由每個報告融合蛋白的不同亞細胞定位(圖4h)所揭示的用PECAN HDRT進行的報告基因的精確KI,可以為高質量細胞成像提供乾淨且清晰的內源性參考。
實施例6在基於DNA的數據存儲中的應用。
卓越的密度、耐用性、壽命和能源效率使DNA也成為我們大數據時代存儲數字信息的有趣介質。已經使用可藉由化學合成或酶合成實現的<300mer寡核苷酸池,建立了數種基於DNA的存儲架構和平臺。但是,在更大的數據有效載荷上的糾錯、子段重新組裝等方面的累積成本,使當前基於DNA的存儲系統與現有的閃存技術相比缺乏競爭力。然而,隨著PECAN的出現,此類現狀可能會改變,藉由PECAN,可以提供極長(~7000mer)的高質量寡核苷酸作為巨大的構建塊,以降低基於DNA的存儲系統中的方案開銷。
作為概念驗證,我們選擇6.75KB的“牛奶皇冠”JPG圖像用於超長PECAN寡核苷酸的存儲(圖5a)。基於所報告的編碼策略,我們將該圖像文件轉換為81000位比特流,該比特流可以藉由40500nt DNA序列進行編碼。此類編碼提供了1.33bit/nt的淨信息密度,這與大多數現有策略相當(圖5b)。然後,我們將40500nt序列分割成六個6790nt寡核苷酸,每個寡核苷酸包含一個6750nt碼字結構域和一個唯一的、鏈特定的40nt地址用於索引。在PECAN生成和寡核苷酸質量檢查之後,每條6790mer鏈使用一個物理地址單獨存方(圖5a)。為了檢索圖像文件,我們對每個單獨的寡核苷酸進行採樣,並且創建了一個寡核苷酸混合物用於Oxford PromethION Nanopore測序儀的測序。測序數據在幾分鐘內被生成和解碼,結果以100%的準確率恢復了圖像。
可以看到PECAN寡核苷酸輔助存儲系統具有數個優點(圖5b)。首先,PECAN寡核苷酸上主要的長有效載荷區藉由將開銷冗餘(非有效載荷代碼的百分比)降低到0.6%(比大多數已知的基於DNA的存儲系統的開銷冗餘低近20-60倍),確保了系統的編碼效率。其次,PECAN寡核苷酸可以高保真度(得自如實的體內複製)大量生產(藉由實驗室發酵罐實現的克級,圖12),因此支持實用且經濟的寫入和讀取模式,即以每個數據副本更低的成本和更低的錯誤率一次寫入,產生大量數據副本,並且以獨立於PCR的方式讀取多次。再次,與寡核苷酸文庫合成相比,儘管藉由PECAN單獨合成寡核苷酸最初會增加生產成本,但由此獲得的每個寡核苷酸的物理地址為隨機訪問提供了便利,使得能夠獨立於PCR進行選擇性數據讀取,這一優勢必然會使成本得到分攤。最後但同樣重要的,~7000mer 超長PECAN寡核苷酸允許我們充分利用最先進的奈米拋光平臺來降低測序成本。
雖然本文已展示和描述本發明的較佳實施方案,但所屬技術領域具有通常知識者將顯而易見的是,這些實施方案僅僅藉由示例的方式提供。本發明不受說明書中提供的具體實施例的限制。雖然已參考前述說明書對本發明進行描述,但本文中對實施方案的描述和說明並非是限制性。在不脫離本發明的情況下,所屬技術領域具有通常知識者將會想到許多變型、變化和替代方案。此外,應當理解,本發明的所有方面均不限於本文所闡述的具體敘述、配置或相對比例,這些取決於各種條件和變量。應理解的是,可以採用本文所描述的本發明實施方案的各種替代方式來實踐本發明。因此,設想本發明應同樣涵蓋任何此類替代方式、修改、變型或等效物。隨附申請專利範圍旨在限定本發明的範圍,並且借此涵蓋這些申請專利範圍的範圍內的方法和結構及其等效物。
TW202346580A_112111548_SEQL.xml

Claims (45)

  1. 一種系統,其包含一個或多個催化結構域和一個或多個受質結構域,其中該催化結構域包含13PD催化結構域序列,該催化結構域在切割位點處切割該受質結構域,並且該受質結構域包含選自該切割位點的3'側的A、C和G的鹼基。
  2. 如請求項1所述的系統,其中該系統包含一個或多個催化核酸,並且該催化核酸包含一個或多個該催化結構域。
  3. 如請求項2所述的系統,其中該系統包含一個或多個受質核酸,並且該受質核酸包含一個或多個該受質結構域。
  4. 如請求項2或3所述的系統,其中一個或多個該催化核酸與一個或多個該受質核酸是分離和/或綴合的。
  5. 如請求項1至4中任一項所述的系統,其中該系統還包含一個或多個結合結構域,並且該結合結構域位於該催化結構域和/或該受質結構域的兩側和/或內部。
  6. 如請求項5所述的系統,其中該催化核酸包含一個或多個結合結構域A,該受質核酸包含一個或多個結合結構域B,並且該結合結構域A能夠與該結合結構域B結合。
  7. 如請求項5或6所述的系統,其中該催化核酸包含該催化結構域的5'側的結合結構域A-5和該催化結構域的3'側的結合結構域A-3,該受質核酸包含該受質結構域的5'側的結合結構域B-5和該受質結構域的3'側的結合結構域B-3,並且該結合結構域A-5與該結合結構域B-3互補和/或該結合結構域A-3與該結合結構域B-5互補。
  8. 如請求項1至7中任一項所述的系統,其中該13PD包含13PD1、13PD2、13PD3、13PD4和/或它們的突變體。
  9. 如請求項1至8中任一項所述的系統,其中該催化結構域包含SEQ ID NO:17的序列。
  10. 如請求項1至9中任一項所述的系統,其中該催化結構域包含核酸水解活性。
  11. 如請求項1至10中任一項所述的系統,其中該受質結構域包含SEQ ID NO:18的序列。
  12. 如請求項1至11中任一項所述的系統,其中該受質結構域包含該受質結構域的3'端的A、C或G。
  13. 一種核酸,其包含一個或多個催化結構域和一個或多個受質結構域,其中該催化結構域包含13PD催化結構域序列,該催化結構域在該切割位點處切割該受質結構域,並且該受質結構域包含選自該切割位點的3'側的A、C和G的鹼基。
  14. 如請求項13所述的核酸,其中該核酸還包含一個或多個結合結構域,並且該結合結構域位於該催化結構域和/或該受質結構域的兩側和/或內部。
  15. 如請求項14所述的核酸,其中該核酸包含位於該催化結構域兩側的一個或多個結合結構域A,該核酸包含位於該受質結構域兩側的一個或多個結合結構域B,並且該結合結構域A能夠與該結合結構域B結合。
  16. 如請求項14或15所述的核酸,其中該核酸包含該催化結構域的5'側的結合結構域A-5和該催化結構域的3'側的結合結構域A-3,該核酸包含該受質結構域的5'側的結合結構域B-5和該受質結構域的3'側的結合結構域B-3,並且該結合結構域A-5與該結合結構域B-3互補和/或該結合結構域A-3與該結合結構域B-5互補。
  17. 如請求項13至16中任一項所述的核酸,其中該13PD包含13PD1、13PD2、13PD3、13PD4和/或它們的突變體。
  18. 如請求項13至17中任一項所述的核酸,其中該催化結構域包含SEQ ID NO:17的序列。
  19. 如請求項13至18中任一項所述的核酸,其中該催化結構域包含核酸水解活性。
  20. 如請求項13至19中任一項所述的核酸,其中該受質結構域包含SEQ ID NO:18的序列。
  21. 如請求項13至20中任一項所述的核酸,其中該受質結構域包含所述受質結構域的3'端的A、C或G。
  22. 一種載體,其包含如請求項1至12中任一項所述的系統,和/或如請求項13至21中任一項所述的核酸。
  23. 一種細胞,其包含如請求項1至12中任一項所述的系統、如請求項13至21中任一項所述的核酸和/或如請求項22所述的載體。
  24. 一種組成物,其包含如請求項1至12中任一項所述的系統、如請求項13至21中任一項所述的核酸、如請求項22所述的載體和/或如請求項23所述的細胞。
  25. 一種試劑盒,其包含如請求項1至12中任一項所述的系統、如請求項13至21中任一項所述的核酸、如請求項22所述的載體、如請求項23所述的細胞和/或如請求項24所述的組成物。
  26. 一種產物的製備方法,其包括提供如請求項1至12中任一項所述的系統、如請求項13至21中任一項所述的核酸、如請求項22所述的載體、如請求項23所述的細胞、如請求項24所述的組成物和/或如請求項25所述的試劑盒。
  27. 一種如請求項26所述的方法製備的產物。
  28. 如請求項27所述的產物,其中該產物包含核酸。
  29. 一種組合,其包括提供包含約1mM至2mM Zn2+和約5mM至20mM Mn2+的條件。
  30. 如請求項29所述的組合,其中該組合包括提供包含約1mM Zn2+和約5mM Mn2+的條件。
  31. 如請求項29或30所述的組合,其中該組合包含約1mM Zn2+和約5mM Mn2+
  32. 一種產物的製備方法,該方法包括提供如請求項29至31中任一項所述的組合和提供5'核酸切刀和3'核酸切刀。
  33. 如請求項32所述的方法,其中該5'核酸切刀包含能夠生成3'切割產物的DNA酶I。
  34. 如請求項32或33所述的方法,其中該5'核酸切刀位於所述產物的5'側。
  35. 如請求項32至34中任一項所述的方法,其中該5'核酸切刀包含13PD及其突變體。
  36. 如請求項32至35中任一項所述的方法,其中該3'核酸切刀包含能夠生成5'切刀產物的DNA酶II。
  37. 如請求項32至36中任一項所述的方法,其中該3'核酸切刀位於所述產物的3'側。
  38. 如請求項32至37中任一項所述的方法,其中該3'核酸切刀包含II-R1及其突變體。
  39. 如請求項32至38中任一項所述的方法,其中該3'核酸切刀包含II-R1a、II-R1b、II-R1c、II-R1d以及它們的突變體。
  40. 一種如請求項32至39中任一項所述的方法製備的產物。
  41. 如請求項40所述的產物,其中該產物包含核酸。
  42. 一種核酸檢測方法,該方法包括提供如請求項27至28和40至41中任一項所述的產物。
  43. 一種測序方法,該方法包括提供如請求項27至28和40至41中任一項所述的產物。
  44. 一種基因工程方法,該方法包括提供如請求項27至28和40至41中任一項所述的產物。
  45. 一種數據存儲方法,該方法包括提供如請求項27至28和40至41中任一項所述的產物。
TW112111548A 2022-04-08 2023-03-27 Dna酶及其應用 TW202346580A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN2022085696 2022-04-08
WOPCT/CN2022/085696 2022-04-08

Publications (1)

Publication Number Publication Date
TW202346580A true TW202346580A (zh) 2023-12-01

Family

ID=88244105

Family Applications (1)

Application Number Title Priority Date Filing Date
TW112111548A TW202346580A (zh) 2022-04-08 2023-03-27 Dna酶及其應用

Country Status (2)

Country Link
TW (1) TW202346580A (zh)
WO (1) WO2023193781A1 (zh)

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AUPQ201499A0 (en) * 1999-08-04 1999-08-26 Unisearch Limited Treatment of inflammatory and malignant diseases
CN110643606B (zh) * 2019-10-17 2023-06-13 复旦大学附属肿瘤医院 能快速水解dna的ii类脱氧核酶突变体
CN110699407B (zh) * 2019-10-17 2023-08-01 复旦大学附属肿瘤医院 一种长单链dna的制备方法
CN112301020B (zh) * 2020-10-19 2024-04-12 复旦大学附属肿瘤医院 Iii类脱氧核酶突变体及其制备方法与应用
CN112175954B (zh) * 2020-10-19 2022-09-09 复旦大学附属肿瘤医院 Iv类脱氧核酶突变体及其制备方法与应用

Also Published As

Publication number Publication date
WO2023193781A1 (en) 2023-10-12

Similar Documents

Publication Publication Date Title
JP7431891B2 (ja) 化学的に修飾されたガイドrnaを使用する高特異性ゲノム編集
JP7038079B2 (ja) Crisprハイブリッドdna/rnaポリヌクレオチドおよび使用方法
US20210395710A1 (en) Cas9-cas9 fusion proteins
US20220033858A1 (en) Crispr oligoncleotides and gene editing
US20200325471A1 (en) Compositions and methods for detecting nucleic acid regions
US20210324382A1 (en) Chimeric DNA:RNA Guide for High Accuracy Cas9 Genome Editing
EP3234192B1 (en) Unbiased identification of double-strand breaks and genomic rearrangement by genome-wide insert capture sequencing
EP2971041B1 (en) Using rna-guided foki nucleases (rfns) to increase specificity for rna-guided genome editing
KR20220004674A (ko) Rna를 편집하기 위한 방법 및 조성물
CA3064601A1 (en) Crispr/cas-adenine deaminase based compositions, systems, and methods for targeted nucleic acid editing
WO2017181107A2 (en) Modified cpf1 mrna, modified guide rna, and uses thereof
WO2017040511A1 (en) Compounds and methods for crispr/cas-based genome editing by homologous recombination
US20190390229A1 (en) Gene editing reagents with reduced toxicity
GB2617658A (en) Class II, type V CRISPR systems
KR20160048992A (ko) Rna-염색질 상호작용 분석용 조성물 및 이의 용도
CN116209755A (zh) 可编程核酸酶和使用方法
EP4159853A1 (en) Genome editing system and method
JP2024504981A (ja) 新規の操作されたヌクレアーゼおよびキメラヌクレアーゼ
JP2020191879A (ja) 細胞の有する二本鎖dnaの標的部位を改変する方法
WO2023009526A2 (en) Improved crispr-cas technologies
TW202346580A (zh) Dna酶及其應用
JP2024518100A (ja) ゲノム組込みのための方法および組成物
Bennett et al. 12 Detection of Insertion/Deletion (Indel) Events after Genome Targeting: Pros and Cons of the Available Methods
JP2024518413A (ja) 修飾ヌクレアーゼ
WO2024138131A1 (en) Expanding applications of zgtc alphabet in protein expression and gene editing