TW201621048A

TW201621048A - 用於改善插入序列傾向及增加ｄｎａ輸入耐受度之經修飾的轉位酶

Info

Publication number: TW201621048A
Application number: TW104112180A
Authority: TW
Inventors: 克利斯丁克勒克納; 阿米拉利奇拉; 厄尼波瑪堤; 莫里赫; 海音里格呂嫩瓦爾德; 史考特克爾史丹; 崔妮法耶歐薩斯普拉羅普; 達林哈斯金; 喬許華柏各司; 安努帕瑪肯納; 丹尼爾施林曼; 拉梅什瓦伊德亞納坦
Original assignee: 伊路米納有限公司
Priority date: 2014-04-15
Filing date: 2015-04-15
Publication date: 2016-06-16
Also published as: EP3845640A3; US10035992B2; EP3845640A2; WO2015160895A2; AU2021236488A1; TWI682997B; WO2015160895A3; US10385323B2; CN106507677B; EP3132029A2; US20190359955A1; CN106507677A; US20180171311A1; US20150291942A1; JP6490710B2; SG11201608585RA; CA2946046A1; JP2017513479A; US10544403B2; AU2015247779B2

Abstract

本文呈現用於改善核酸樣品之片段化及標記之轉位酶及反應條件，特定言之展現改善之插入序列傾向之經改變轉位酶及反應條件，以及使用其之方法及套組。

Description

用於改善插入序列傾向及增加DNA輸入耐受度之經修飾的轉位

【相關申請案】

本申請案主張2014年4月15日申請之美國臨時申請案第61/979,871號；2014年10月9日申請之第62/062,006號；2014年11月17日申請之第62/080,882號之優先權，該申請案以全文引用的方式併入本文中。

轉位酶適用於試管內轉位系統。其允許基因體DNA之大規模片段化及標記且適用於自用於核酸分析方法，諸如下一代定序及擴增方法之目標DNA製造標記DNA片段之庫(library)。仍需要具有改善特性且產生定性及定量代表產生其之樣品中之目標核酸之標記DNA片段之經修飾的轉位酶。

【序列表】

本申請案與電子格式之序列表一起提出申請。序列表以2015年4月13日創建的名稱為IP-1198-TW_Sequencelisting.txt之文件形式提供，其大小為106Kb。電子格式之序列表中之資訊以全文引用之方式併入本文中。

本文呈現用於改善核酸樣品之片段化及標記之轉位酶。本發明人已出人意料地鑑別某些展現改善的插入序列傾向且具有多種其他相關優勢之經改變轉位酶。

本文呈現相對於野生型Tn5轉位酶經修飾之突變Tn5轉位酶。在一些具體實例中，突變轉位酶可包含位置Asp248處之突變。在某些態樣中，位置Asp248處之突變為取代突變。在某些態樣中，位置Asp248處之取代突變可包含變成選自由以下組成之群的殘基之突變：Tyr、Thr、Lys、Ser、Leu、Ala、Trp、Pro、Gln、Arg、Phe及His。

在某些態樣中，位置Asp248處之突變為位置Asp248之後的插入突變。在某些態樣中，插入突變可包含在位置Asp248之後插入疏水性殘基。在某些態樣中，插入突變可包含在位置Asp248之後插入纈胺酸殘基。

本文亦呈現相對於野生型Tn5轉位酶經修飾之突變Tn5轉位酶，該突變轉位酶包含位置Asp119處之突變。在某些態樣中，位置Asp119處之突變為取代突變。在某些態樣中，位置Asp119處之取代突變可包含變成疏水性殘基之突變。在某些態樣中，Asp119位置處之取代突變可包含變成親水性殘基之突變。在某些態樣中，位置Asp119處之取代突變可包含變成選自由以下組成之群的殘基之突變：Leu、Met、Ser、Ala及Val。

本文亦呈現相對於野生型Tn5轉位酶經修飾之突變Tn5轉位酶，該突變轉位酶包含位置Trp125處之突變。在某些態樣中，位置Trp125 處之突變為取代突變。在某些態樣中，位置Trp125處之取代突變可包含變成甲硫胺酸殘基之突變。

本文亦呈現相對於野生型Tn5轉位酶經修飾之突變Tn5轉位酶，該突變轉位酶包含位置Lys120處之突變。在某些態樣中，位置Lys120處之突變為取代突變。在某些態樣中，位置Lys120處之取代突變可包含變成大型芳族殘基之突變。在某些態樣中，位置Lys120處之取代突變可包含變成選自由以下組成之群的殘基之突變：Tyr、Phe、Trp及Glu。

本文亦呈現相對於野生型Tn5轉位酶經修飾之突變Tn5轉位酶，該突變轉位酶包含位置Lys212及/或Pro214及/或Ala338處之突變。在某些態樣中，位置Lys212及/或Pro214及/或Ala338處之一或多個突變為取代突變。在某些態樣中，位置Lys212處之取代突變包含變成精胺酸之突變。在某些態樣中，位置Pro214處之取代突變包含變成精胺酸之突變。在某些態樣中，位置Ala338處之取代突變包含變成纈胺酸之突變。在一些具體實例中，轉位酶可另外包含Gly251處之取代突變。在某些態樣中，位置Gly251處之取代突變包含變成精胺酸之突變。

本文亦呈現相對於野生型Tn5轉位酶經修飾之突變Tn5轉位酶，該突變轉位酶包含位置Glu146及/或Glu190及/或Gly251處之突變。在某些態樣中，位置Glu146及/或Glu190及/或Gly251處之一或多個突變為取代突變。在某些態樣中，位置Glu146處之取代突變可包含變成麩醯胺酸之突變。在某些態樣中，位置Glu190處之取代突變可包含變成甘胺酸之突變。在某些態樣中，位置Gly251處之取代突變可包含變成精胺酸之突變。

亦提供包含對含有SEQ ID NO：21之胺基酸序列之半保守域之取代突變的經改變轉位酶，其中該取代突變包含在位置2處變成除Trp、Asn、Val或Lys以外的任何殘基之突變。在某些具體實例中，突變包含在位置2處變成Met之取代。

在上述具體實例中之任一者中，突變Tn5轉位酶可另外包含功能上等效於Tn5轉位酶胺基酸序列中之Glu54及/或Met56及/或Leu372之位置處之取代突變。在某些具體實例中，轉位酶包含與Tn5轉位酶胺基酸序列中之Glu54Lys及/或Met56Ala及/或Leu372Pro同源之取代突變。

本文亦呈現包含SEQ ID NO：2-10及12-20中之任一者之胺基酸序列之突變Tn5轉位酶。

本文亦呈現包含融合至額外多肽的如任何以上具體實例中所定義之突變Tn5轉位酶之融合蛋白。在一些具體實例中，融合至轉位酶之多肽域可包含純化標籤、表現標籤、溶解度標籤或其組合。在一些具體實例中，融合至轉位酶之多肽域可包含例如麥芽糖結合蛋白(MBP)。在一些具體實例中，融合至轉位酶之多肽域可包含例如延伸因子Ts(Tsf)。

本文亦呈現編碼如任何以上具體實例中所定義之突變Tn5轉位酶之核酸分子。本文亦呈現包含上文所述之核酸分子之表現載體。本文亦呈現包含上文所述之載體之宿主細胞。

本文亦呈現試管內轉位之方法，其包含：允許以下組分相互作用：(i)包含如上文描述之任一具體實例之突變Tn5轉位酶之轉位體(transposome)複合物，及(ii)目標DNA。

本文亦呈現使用上文描述之Tn5轉位酶定序目標DNA之方法。在一些具體實例中，該方法可包含(a)在藉以使得目標DNA經片段化，且第一聚核苷酸之3'轉位子末端序列轉移至片段之5'末端之條件下藉由包含(1)如上文描述之具體實例中之任一者之突變Tn5轉位酶；及(2)包含(i)包含轉位子末端序列之3'部分，及(ii)包含第一定序標籤域之第一標籤之轉位體複合物培育目標DNA，進而產生雙股片段，其中5'末端經第一標籤標記，且在5'標記股之3'末端處存在單股間隙；(b)藉由核酸修飾酶在藉以使得第二標籤附接至5'標記股之3'末端之條件下培育片段，(c)視情況藉由提供聚合酶及對應於第一聚核苷酸之一部分的擴增引子來擴增片段，進而產生在5'末端處具有第一標籤且在3'末端處具有第二標籤之代表性二標記片段庫；(d)提供包含對應於第一定序標籤域之部分的第一定序引子；及(e)並行地擴展第一定序引子及偵測鄰接於二標記片段之代表性庫之第一定序標籤域之核苷酸之身分。

本文中亦呈現用於進行試管內轉位反應之套組。在一些具體實例中，套組可包含轉位體複合物，其包含(1)如上文描述之具體實例中之任一者之突變Tn5轉位酶；及(2)包含有含轉位子末端序列之3'部分的聚核苷酸。

一或多個具體實例之細節闡述於以下隨附圖式及實施方式中。其他特徵、目標及優勢將自實施方式及附圖以及申請專利範圍顯而易見。

【詳細描述】

在用於DNA定序之一些樣品製備方法中，各模板在插入物之任一末端處含有接附子且通常需要多個步驟以修飾DNA或RNA及純化修飾反應之所需產物。此等步驟典型地在將經調適片段添加至流動細胞之前在溶液中進行，該片段在流動細胞中藉由將雜交片段複製至共價連接於表面之引子之末端上之引子延長反應偶合至表面。此等『接種』模板隨後經由若干擴增循環產生複製模板之單株叢集。然而，如美國2010/0120098(其含量全文併入本文中)中揭示，將DNA轉化為準備用於叢集形成及定序之溶液中之接附子經修飾模板所需的步驟數可藉由使用在本文中稱為標籤化之轉位酶介導片段化及標記最小化。舉例而言，標籤化可用於對DNA片段化，例如如用於Nextera^TMDNA樣品製備套組(Illumina公司)之工作流中例示，其中基因體DNA可藉由同時將輸入DNA片段化及標記之工程改造轉位體片段化，進而產生一群在片段末端包含獨特接附子序列之片段化核酸分子。然而，需要展現改善之插入傾向之轉位酶。

因此，本文呈現用於改善核酸樣品之片段化及標記之轉位酶。本發明人已出人意料地鑑別某些展現改善的插入序列傾向且具有多種其他相關優勢之經改變轉位酶。本文中呈現之經改變轉位酶之一個具體實例為展現改善之插入傾向之轉位酶。

如本文中所使用，術語「標準化轉位體活性」係指在50μl反應物中產生以下生物分析儀片段尺寸分佈的關於25ng gDNA輸入量之轉位體之最小濃度：總曲線下面積：100-300bp=20%-30%；301-600bp=30%-40%；601-7,000bp=30%-40%：100-7,000bp90%。此最小濃度稱為1×。

如在整個本申請案中所使用，轉位體之濃度與標準化活性可互換使用。另外，如在整個本申請案中所使用，轉位體之濃度與轉位酶之濃度可互換使用。

如本文中所使用，術語「插入傾向」係指轉位酶對插入位點之序列偏好。舉例而言，若聚核苷酸樣品中之A/T/C/G之背景頻率同等分佈(25% A、25% T、25% C、25% G)，則在轉位酶結合位點或裂解位點對一種核苷酸超過其他三種核苷酸之任何過度表現反映彼位點處之插入傾向。插入傾向可使用此項技術中已知之多種方法中之任一者量測。舉例而言，如在下文實施例1中一般闡述，可定序插入位點且可比較任何特定核苷酸在插入位點中之各位置處之相對豐度。

「插入傾向之改善」指示特定鹼基在經改變轉位酶之結合位點之一或多個位置處之頻率減少或增加以較接近聚核苷酸樣品中之該鹼基之背景頻率。改善可為相對於未改變轉位酶中之彼位置之頻率的彼位置處之頻率之增加。或者，改善可為相對於未改變轉位酶中之彼位置之頻率的彼位置處之頻率之減少。因此，舉例而言，若聚核苷酸樣品中之T核苷酸之背景頻率為0.25，且經改變轉位酶將轉位酶結合位點中之指定位置處之T核苷酸之頻率自高於0.25之頻率減少至較接近0.25之頻率，則經改變轉位酶具有插入傾向之改善。類似地，舉例而言，若聚核苷酸樣品中之T核苷酸之背景頻率為0.25，且經改變轉位酶將轉位酶結合位點中之指定位置處之T核苷酸之頻率自低於0.25之頻率增加至較接近0.25之頻率，則經改變轉位酶具有插入傾向之改善。

一種量測插入傾向之方法為藉由插入位點之大規模定序及量測相對於插入位點的結合位點中之各位置處之鹼基之頻率，如例如在Green等人Mobile DNA(2012)3：3中所述，該文獻以全文引用之方式併入本文中。顯示各位置處之豐度之典型工具為強度相對於循環分佈曲線圖，例如如圖2中所示。如在下文實施例1中所述，藉由轉位子介導標記及片段化產生之片段末端可以大規模定序，且可量測在插入位點之各位置處之鹼基之分佈頻率以偵測在插入位點之一或多個位置處之傾向。因此，舉例而言，如在圖2中指示，就『G』核苷酸而言之0.55及就『A』核苷酸而言之0.16之位置(1)處之鹼基分佈頻率反映在彼位置處對G之強烈偏好及遠離A之傾向。作為另一實例，且相比之下，如圖3中所示，位置(20)處之鹼基分佈對於四種鹼基中之每一者基本上為0.25，反映在彼位置處之極小或無序列傾向。

在本文呈現之一些具體實例中，經改變轉位酶在位於插入位點上游或下游1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20或20個以上鹼基處之一或多個位點處提供插入傾向之減小。在一些具體實例中，經改變轉位酶在位於插入位點下游1至15個鹼基處之一或多個位點處提供插入傾向之減小。在一些具體實例中，經改變轉位酶在位於插入位點上游1至15個鹼基處之一或多個位點處提供插入傾向之減小。

如在下文中更詳細地描述，本發明人已出人意料地發現在轉位酶胺基酸序列之某些位置對殘基之一或多個突變導致在轉位事件期間的經改善序列插入傾向。此等經改變轉位酶在高及低相異性核酸樣品之標籤化中給出經改善效能，導致定序之各區域之較大覆蓋度均一性及較少丟失。

如本文中所使用，術語「DNA輸入耐受度」係指轉位酶產生針對一定範圍之輸入DNA量之均一DNA片段尺寸之能力。

如本文所使用，延伸因子之記法TS可與Tsf互換使用。

在一些具體實例中，輸入DNA為基因體DNA。在一些具體實例中，輸入DNA之範圍可為0.001μg至1mg、1ng至1mg、1ng至900ng、1ng至500ng、1ng至300ng、1ng至250ng、1ng至100ng、5ng至250ng或5ng至100ng且轉位酶之濃度在5nM與500nM之間。在一些具體實例中，就輸入DNA之上述範圍而言之轉位酶之濃度為約25nM、30nM、35nM、40nM、50nM、60nM、65nM、70nM、75nM、80nM、90nM、95nM、100nM、125nM、130nM、140nM、150nM、175nM、180nM、190nM、200nM、210nM、225nM、230nM、240nM、250nM、260nM、275nM、280nM、290nM、300nM、325nM、350nM、360nM、375nM、380nM、390nM、400nM、425nM、450nM、475nM或500nM。在一些具體實例中，就輸入DNA之上述範圍而言之標準化濃度之轉位酶或標準化轉位體之濃度係選自約0.1×至10×、1×至10×、3×至8×、4×至7×之範圍。在一些具體實例中，就輸入DNA之上述範圍而言之轉位酶或標準化轉位體之標準化濃度為約0.1×、0.2×、0.3×、0.4×、0.5×、0.6×、0.7×、0.8×、0.9×、1×、1.1×、1.2×、1.3×、1.4×、1.5×、1.6×、1.7×、1.8×、1.9×、2×、2.1×、2.2×、2.3×、2.4×、2.5×、2.6×、2.7×、2.8×、2.9×、3×、3.1×、3.2×、3.3×、3.4×、3.5×、3.6×、3.7×、3.8×、3.9×、4×、4.1×、4.2×、4.3×、4.4×、4.5×、4.6×、4.7×、4.8×、4.9×、5×、5.1×、5.2×、5.3×、5.4×、5.5×、5.6×、5.7×、5.8×、5.9×、6×、6.1×、6.2×、6.3×、6.4×、6.5×、6.6×、6.7×、6.8×、6.9×、7×或7.5×、8×、8.5×、9×、9.5×、10×。

在一些具體實例中，輸入DNA之量為1ng、2ng、3ng、4ng、5ng、6ng、7ng、8ng、9ng、10ng、11ng、12ng、13ng、15ng、20ng、25ng、30ng、35ng、40ng、45ng、50ng、55ng、60ng、65ng、70ng、75ng、80ng、85ng、90ng、95ng、100ng、110ng、115ng、120ng、125ng、130ng、135ng、140ng、150ng、155ng、160ng、165ng、170ng、180ng、185ng、190ng、195ng、200ng、210ng、220ng、225ng、230ng、235ng、240ng、245ng、250ng、260ng、270ng、280ng、290ng、300ng、325ng、350ng、375ng、400ng、425ng、450ng、475ng、500ng、525ng、550ng、600ng、650ng、700ng、750ng、800ng、850ng或900ng。在一些具體實例中，就輸入DNA之上述量而言之轉位酶之濃度為約25nM、30nM、35nM、40nM、50nM、60nM、65nM、70nM、75nM、80nM、90nM、95nM、100nM、125nM、130nM、140nM、150nM、175nM、180nM、190nM、200nM、210nM、225nM、230nM、240nM、250nM、260nM、275nM、280nM、290nM、300nM、325nM、350nM、360nM、375nM、380nM、390nM、400nM、425nM、450nM、475nM或500nM。在一些具體實例中，就輸入DNA之上述量而言之標準化濃度之轉位酶或標準化轉位體之濃度係選自約0.1×至10×、1×至10×、3×至8×、4×至7×之範圍。在一些具體實例中，就輸入DNA之上述量而言之轉位酶或標準化轉位體之標準化濃度為約0.1×、0.2×、0.3×、0.4×、0.5×、0.6×、0.7×、0.8×、0.9×、1×、1.1×、1.2×、1.3×、1.4×、1.5×、1.6×、1.7×、1.8×、1.9×、2×、2.1×、2.2×、2.3×、2.4×、2.5×、2.6×、2.7×、2.8×、2.9×、3×、3.1×、3.2×、3.3×、3.4×、3.5×、3.6×、3.7×、3.8×、3.9×、4×、4.1×、4.2×、4.3×、4.4×、4.5×、4.6×、4.7×、4.8×、4.9×、5×、5.1×、5.2×、5.3×、5.4×、5.5×、5.6×、 5.7×、5.8×、5.9×、6×、6.1×、6.2×、6.3×、6.4×、6.5×、6.6×、6.7×、6.8×、6.9×、7×或7.5×、8×、8.5×、9×、9.5×、10×。

在一些具體實例中，轉位酶之nM濃度與輸入DNA之ng量之比為約0.5至5、1至5、2至5、2.1至3或2.1至2.5。

如本文中所使用，術語「基因體DNA」係指存在於包含一或多個編碼細胞之各種蛋白之基因之細胞中的核酸。在一些具體實例中，基因體DNA來自原核生物體，例如細菌及古菌。在一些具體實例中，基因體DNA來自真核生物體，例如人類、植物、真菌、阿米巴原蟲。

如本文所用之術語「突變」或「經修飾」係指在相比於野生型基因或基因產物時，在序列及或功能特性中顯示改變(亦即經改變特徵)之基因或基因產物。「突變」或「經修飾」亦指位於一或多個特定核苷酸位置之序列，或位於一或多個特定密碼子位置之序列，或位於一或多個特定胺基酸位置之序列，其在相比於野生型基因或基因產物時，在序列及或功能特性中顯示改變(亦即經改變特徵)。

如本文所用之「包括」與術語包含具有相同含義。

如本文所用之「約」在數量上意謂加上或減去10%。

如在下文中更詳細地敍述，本發明人已出人意料地發現在轉位酶胺基酸序列之某些位置處對殘基之一或多個突變導致DNA輸入耐受度增加，使得突變轉位酶相比於野生型轉位酶，針對一定範圍之輸入DNA量產生均一DNA片段尺寸。在一個具體實例中，TS-Tn5059轉位酶展現相比於其他轉位酶，例如TS-Tn5及Tn5型式1(TDE1)增加之DNA輸入耐受度。

在一些具體實例中，TS-Tn5059展現相比於其他轉位酶增加之DNA輸入耐受度，其中輸入DNA之範圍在1ng至200ng基因體DNA之間且TS-Tn5059之濃度在100-300nM之間。在TS-Tn5059展現相比於其他轉位酶增加之DNA輸入耐受度之一些具體實例中，輸入DNA之範圍在5ng至200ng基因體DNA之間且TS-Tn5059之濃度在100-250nM之間。在TS-Tn5059展現相比於其他轉位酶增加之DNA輸入耐受度之一些具體實例中，輸入DNA之範圍在5ng至100ng基因體DNA之間且TS-Tn5059之濃度在240nM與250nM之間。

改善之插入傾向連同增加之DNA輸入耐受度提供比當前Nextera®快速捕獲方案(Illumina公司)更快及更靈活之樣品製備及外顯子組富集方案。

如本文中所使用，術語「標籤化」係指藉由與包含轉位子末端序列之接附子複合之包含轉位酶之轉位體複合物的DNA修飾。標籤化導致同時的DNA片段化及接附子接合至雙螺旋片段之兩條股之5'末端。

如本文所使用，「轉位體複合物」或「轉位體」包含至少轉位酶及轉位酶識別位點。在一些此類系統中，轉位酶可與轉位子識別位點形成能夠催化轉位反應之功能複合物。轉位酶可在本文中稱為標籤化之方法中結合至轉位酶識別位點且將轉位酶識別位點插入至目標核酸中。在一些此類插入事件中，轉位酶識別位點之一條股可轉移至目標核酸中。

本文中呈現之經改變轉位酶可形成轉位體複合物的一部分。例示性轉位複合物包括(但不限於)超高活性Tn5轉位酶及Tn5型轉位酶識別位點。超高活性Tn5轉位酶可包括美國專利第5,925,545號、美國專利第5,965,443號、美國專利第7,083,980號及美國專利第7,608,434號以及Goryshin及Reznikoff,J.Biol.Chem.,273：7367(1998)之揭示內容中所述之彼等轉位酶，該文獻中之每一者之內容以全文引用之方式併入本文中。然而，應瞭解，本文中呈現之經改變轉位酶可用於任何能夠將轉位子末端在足夠效率之情況下以隨機或幾乎隨機方式插入至標籤目標核酸之轉位系統，因為其預期目的可用於提供之方法中。

舉例而言，呈現之經改變轉位酶可包括包含至少一個在功能上等效於Tn5胺基酸序列中之位點之一或多個位置處之胺基酸取代突變。於Tn5具有同源性之區域闡述於本文中，如圖1中所例示且允許鑑別其他轉位酶，例如Hermes轉位酶、HIV整合酶、Mu轉位酶及Mos1轉位酶中之功能等效位點。同樣，其他轉位酶或整合酶中之功能等效位點將為一般熟習此項技術者顯而易見，例如藉由進行Tn5胺基酸序列之序列比對及鑑別保守或半保守殘基或域。因此，應瞭解，可在本文提供之某些具體實例之情況下使用之轉位系統包括任何具有與Tn5之位點功能等效之位點的已知轉位酶。舉例而言，此類系統可包括MuA轉位酶及Mu轉位酶識別位點，其包含R1及R2末端序列(Mizuuchi,K.,Cell,35：785,1983；Savilahti,H等人，EMBO J.,14：4893,1995)。

包含於本文提供之某些具體實例中之轉位系統之更多實例包括金黃色葡萄球菌Tn552(Colegio等人，J.Bacteriol.,183：2384-8,2001；Kirby C等人，Mol.Microbiol.,43：173-86,2002)、Ty1(Devine及Boeke,Nucleic Acids Res.,22：3765-72,1994及國際公開案WO 95/23875)、轉位子Tn7(Craig,N L,Science.271：1512,1996；Craig,N L,Review in：Curr Top Microbiol Immunol., 204：27-48,1996)、Tn/O及IS10(Kleckner N等人，Curr Top Microbiol Immunol.,204：49-82,1996)、Mariner轉位酶(Lampe D J等人，EMBO J.,15：5470-9,1996)、Tc1(Plasterk R H,Curr.Topics Microbiol.Immunol.,204：125-43,1996)、P Element(Gloor,G B,Methods Mol.Biol.,260：97-114,2004)、Tn3(Ichikawa及Ohtsubo,J Biol.Chem.265：18829-32,1990)、細菌插入序列(Ohtsubo及Sekine,Curr.Top.Microbiol.Immunol.204：1-26,1996)、反轉錄病毒(Brown等人，Proc Natl Acad Sci USA,86：2525-9,1989)及酵母菌之反轉錄轉位子(Boeke及Corces,Annu Rev Microbiol.43：403-34,1989)。更多實例包括IS5、Tn10、Tn903、IS911及轉位酶家族酶之工程改造形式(Zhang等人，(2009)PLoS Genet.5：e1000689.電子版2009年10月16日；Wilson C.等人(2007)J.Microbiol.Methods 71：332-5)。上文所引用之參考文獻以全文引用的方式併入本文中。

簡言之，「轉位反應」為其中一或多個轉位子插入至隨機位點或幾乎隨機位點處之目標核酸中的反應。轉位反應中之必需組分為轉位酶及展現轉位子之核苷酸序列之DNA寡核苷酸，包括經轉移轉位子序列及其補體(亦即非轉移轉位子末端序列)以及形成功能轉位或轉位體複合物所需的其他組分。DNA寡核苷酸可按需要或所需另外包含其他序列(例如接附子或引子序列)。

添加至核酸之5'及/或3'末端之接附子可包含通用序列。通用序列為兩個或兩個以上核酸分子共同，亦即共用之核苷酸序列區域。視情況，兩個或兩個以上核酸分子亦具有序列差異之區域。因此，舉例而言，5'接附子可包含一致或通用核酸序列且3'接附子可包含一致或通用序列。可存在於複數個核酸分子之不同成員中之通用序列可允許使用與通用序列互補之單一通用引子複製或擴增多個不同序列。

轉位酶突變體

因此，本文呈現相對於野生型轉位酶經修飾之突變轉位酶。經改變轉位酶可包含至少一個在功能上等效於下表1中所闡述之彼等殘基之一或多個位置處之胺基酸取代突變。表1闡述已顯示導致改善之插入傾向的轉位酶殘基處之取代突變。如表1中所闡述，本文中呈現之取代突變可在任何功能轉位酶主鏈中，諸如在本文中例示為SEQ ID NO：1之野生型Tn5轉位酶，或具有對於其他位點之其他突變之轉位酶，包括發現與稱為超高活性Tn5轉位酶之轉位酶序列中之彼等突變，諸如美國專利第5,925,545號、美國專利第5,965,443號、美國專利第7,083,980號及美國專利第7,608,434號之併入材料中所闡述之一或多個突變，及如在本文中例示為SEQ ID NO：11。

如在此項技術中所理解，上表中所列之參考編號係指野生型Tn5序列(SEQ ID NO：1)之胺基酸位置。一般熟習此項技術者應理解，編號可由於N末端截斷、插入或融合而變化。以上列出之胺基酸之功能位置將保持相同，儘管位置編號可能已改變。舉例而言，SEQ ID NO：25中闡述之序列之第一組285個胺基酸殘基包含大腸桿菌TS之N末端融合，接著為SEQ ID NO：11之胺基酸殘基2-476。因此，舉例而言，SEQ ID NO：25之Pro 656功能上對應於SEQ ID NO：11之Pro 372。

因此，在某些具體實例中，本文中呈現之經改變轉位酶包含功能上等效於例如Tn5轉位酶胺基酸序列中之Asp248、Asp119、Trp125、Lys120、Lys212、Pro214、Gly251、Ala338、Glu146及/或Glu190之一或多個位置處相對於野生型轉位酶之至少一個胺基酸取代突變。

在一些具體實例中，突變轉位酶可包含位置Asp248處之突變。位置Asp248處之突變可例如為取代突變或插入突變。在某些具體實例中，突變為變成除Asp以外之任何殘基之取代突變。在某些具體實例中，位置Asp248處之取代突變包括變成選自由以下組成之群的殘基之突變：Tyr、Thr、Lys、Ser、Leu、Ala、Trp、Pro、Gln、Arg、Phe及His。

在某些具體實例中，位置Asp248處之突變為位置Asp248之後的插入突變。在某些態樣中，插入突變可包含在Asp248之後插入任何殘基。在某些態樣中，插入突變可包含在位置Asp248之後插入疏水性殘基。疏水性殘基為熟習此項技術者已知且包括例如Val、Leu、Ile、Phe、Trp、Met、Ala、及Cys。在某些態樣中，插入突變可包含在位置Asp248之後插入纈胺酸殘基。

本文中呈現之一些具體實例包括相對於野生型Tn5轉位酶經修飾之突變Tn5轉位酶，該突變轉位酶包含位置Asp119處之突變。在某些態樣中，位置Asp119處之突變為取代突變。在某些態樣中，位置Asp119處之取代突變可包含變成疏水性殘基之突變。疏水性殘基為熟習此項技術者已知且包括例如Val、Leu、Ile、Phe、Trp、Met、Ala、Tyr及Cys。在某些態樣中，Asp119位置處之取代突變可包含變成親水性殘基之突變。親水性殘基為熟習此項技術者已知且包括例如Arg、Lys、Asn、His、Pro、Asp 及Glu。在某些態樣中，位置Asp119處之取代突變可包含變成選自由以下組成之群的殘基之突變：Leu、Met、Ser、Ala及Val。

本文中呈現之一些具體實例包括相對於野生型Tn5轉位酶經修飾之突變Tn5轉位酶，該突變轉位酶包含位置Trp125處之突變。在某些態樣中，位置Trp125處之突變為取代突變。在某些態樣中，位置Trp125處之取代突變可包含變成甲硫胺酸殘基之突變。

本文中呈現之一些具體實例包括相對於野生型Tn5轉位酶經修飾之突變Tn5轉位酶，該突變轉位酶包含位置Lys120處之突變。在某些態樣中，位置Lys120處之突變為取代突變。在某些態樣中，位置Lys120處之取代突變可包含變成大型芳族殘基之突變。特性化為大型芳族殘基之殘基為熟習此項技術者已知且包括例如Phe、Tyr及Trp。在某些態樣中，位置Lys120處之取代突變可包含變成選自由以下組成之群的殘基之突變：Tyr、Phe、Trp及Glu。

本文中呈現之一些具體實例包括相對於野生型Tn5轉位酶經修飾之突變Tn5轉位酶，該突變轉位酶包含位置Lys212及/或Pro214及/或Ala338處之突變。在某些態樣中，位置Lys212及/或Pro214及/或Ala338處之一或多個突變為取代突變。在某些態樣中，位置Lys212處之取代突變包含變成精胺酸之突變。在某些態樣中，位置Pro214處之取代突變包含變成精胺酸之突變。在某些態樣中，位置Ala338處之取代突變包含變成纈胺酸之突變。在一些具體實例中，轉位酶可另外包含Gly251處之取代突變。在某些態樣中，位置Gly251處之取代突變包含變成精胺酸之突變。

本文中呈現之一些具體實例包括相對於野生型Tn5轉位酶經修飾之突變Tn5轉位酶，該突變轉位酶包含位置Glu146及/或Glu190及/或Gly251處之突變。在某些態樣中，位置Glu146及/或Glu190及/或Gly251處之一或多個突變為取代突變。在某些態樣中，位置Glu146處之取代突變可包含變成麩醯胺酸之突變。在某些態樣中，位置Glu190處之取代突變可包含變成甘胺酸之突變。在某些態樣中，位置Gly251處之取代突變可包含變成精胺酸之突變。

本文中呈現之一些具體實例包括突變Tn5轉位酶，其包含SEQ ID NO：2-10及12-20中之任一者之胺基酸序列。

本文中亦呈現包含對半保守域之取代突變之經改變轉位酶。如本文中所使用，術語「半保守域」係指在各種轉位酶中及/或在各種物質中完全保守，或至少部分保守之轉位酶的一部分。半保守域包含滯留於轉位酶之催化核心域中之胺基酸殘基。已出人意料地發現半保守域中之一或多個殘基之突變影響轉位酶活性，導致插入傾向之改善。

在一些具體實例中，半保守域包含具有SEQ ID NO：21中闡述之序列之胺基酸。SEQ ID NO：21對應於在本文中闡述為SEQ ID NO：1之Tn5轉位酶胺基酸序列之殘基124-133。顯示半保守域中之各種轉位酶中之保守之結構比對闡述於圖1中。圖1中顯示之轉位酶序列包括Tn5轉位酶(1MUH)、Hermes轉位酶(2BW3)、HIV整合酶(1ITG)、Mu轉位酶(1BCM) 及Mos1轉位酶(3HOS)之催化核心域。

已出人意料地發現半保守域中之一或多個殘基之突變導致插入傾向之改善。舉例而言，在本文中呈現之經改變轉位酶之一些具體實例中，取代突變包含在SEQ ID NO：21之位置2處變成除Trp以外之任何殘基的突變。在某些具體實例中，經改變轉位酶包含在SEQ ID NO：21之位置2處變成Met之突變。

「功能上等效」意謂對照轉位酶在使用完全不同轉位酶之研究的情況下將含有認為出現於在酶中具有相同功能作用之其他轉位酶中之胺基酸位置處之胺基酸取代。舉例而言，Mu轉位酶中之位置288處離胺酸至甲硫胺酸之突變(K288M)將功能上等效於Tn5轉位酶中之位置125處色胺酸至甲硫胺酸之取代(W125M)。

一般而言，兩種或兩種以上不同轉位酶中之功能上等效取代突變出現於轉位酶之胺基酸序列中之同源胺基酸位置處。因此，本文中使用之術語「功能上等效」亦涵蓋與給定突變「位置上等效」或「同源」之突變，無論突變胺基酸之特定功能是否已知。有可能基於序列比對及/或分子模擬鑑別兩種或兩種以上不同轉位酶之胺基酸序列中之位置上等效或同源胺基酸殘基。鑑別位置上等效及/或功能上等效殘基之序列比對及分子模擬之實例闡述於圖1中。因此，舉例而言，如圖1中所示，半保守域中之殘基鑑別為Tn5轉位酶胺基酸序列之位置124-133。Hermes轉位酶、HIV整合酶、Mu轉位酶及Mos1轉位酶中之對應殘基在圖中鑑別為垂直排列型的且是為位置上等效於以及功能上等效於Tn5轉位酶胺基酸序列中之對應殘基。

上文描述之經改變轉位酶可包含已知增強轉位酶活性之一或多個態樣之其他取代突變。舉例而言，在一些具體實例中，除以上突變中之任一者以外，經改變Tn5轉位酶可另外包含功能上等效於Tn5轉位酶胺基酸序列中之Glu54及/或Met56及/或Leu372之位置處之取代突變。功能上等效於導致活性改善之Tn5轉位酶胺基酸序列中之Glu54及/或Met56及/或Leu372之位置處之一或多個位置處之多種取代突變中之任一者可如此項技術中已知且藉由美國專利第5,925,545號、美國專利第5,965,443號、美國專利第7,083,980號及美國專利第7,608,434號之揭示內容以及Goryshin及Reznikoff,J.Biol.Chem.,273：7367(1998)之揭示內容例示進行，該文獻中之每一者以全文引用之方式併入本文中。具體實例，轉位酶包含與Tn5轉位酶胺基酸序列中之Glu54Lys及/或Met56Ala及/或Leu372Pro同源之取代突變。舉例而言，取代突變可包含與Tn5轉位酶胺基酸序列中之Glu54Lys及/或Met56Ala及/或Leu372Pro同源之取代突變。

突變轉位酶

各種類型之突變誘發視情況用於本發明中，例如用以修飾轉位酶以產生變異體，例如根據如上文所論述之轉位酶模型及模型預測，或使用隨機或半隨機突變方法。一般而言，任何可用的突變誘發程序可用於製造轉位酶突變體。此類突變誘發程序視情況包括關於一或多個相關活性(例如改善之插入傾向)選擇突變核酸及多肽。可使用之程序包括(但不限於)：定點突變誘發、隨機點突變誘發、試管內或活體內同源重組(DNA改組及組合重疊PCR)、使用含有模板之尿嘧啶之突變誘發、寡核苷酸定向突變誘發、硫代磷酸酯修飾DNA突變誘發、使用有間隙的雙螺旋DNA之突變誘發、點失配修復、使用修復缺陷宿主菌株、限制選擇及限制純化之突變誘發、缺失突變誘發、藉由總基因合成之突變誘發、簡併PCR、雙股斷裂修復及熟習此項技術者已知之許多其他程序。用於突變之起始轉位酶可為本文中所指出之彼等轉位酶中之任一者，包括可用的轉位酶突變體，諸如美國專利第5,925,545號、美國專利第5,965,443號、美國專利第7,083,980號及美國專利第7,608,434號以及Goryshin及Reznikoff,J.Biol.Chem.,273：7367(1998)之揭示內容中鑑別之彼等者，該文獻中之每一者以全文引用的方式併入本文中。

視需要，突變誘發可藉由來自天然存在的轉位酶分子或已知經改變或突變轉位酶(例如使用如前述參考文獻所指出之現有突變轉位酶)之已知資訊，例如如上文所論述的序列、序列比較、物理特性、晶體結構及/或其類似者引導。然而，在另一類具體實例中，修飾可基本上為隨機的(例如在經典或「家族」DNA改組中，參見例如Crameri等人(1998)「DNA shuffling of a family of genes from diverse species accelerates directed evolution」Nature 391：288-291)。

突變形式之額外資訊發現於Sambrook等人，Molecular Cloning--A Laboratory Manual(第3版)，第1-3卷，Cold Spring Harbor Laboratory,Cold Spring Harbor,N.Y.,2000(「Sambrook」)；Current Protocols in Molecular Biology,F.M.Ausubel等人編，Current Protocols,Greene Publishing Associates公司與John Wiley & Sons公司之合資企業(2011年補充)(「Ausubel」))及PCR Protocols A Guide to Methods and Applications(Innis等人編)Academic Press公司San Diego,Calif.(1990)(「Innis」)中。本文中所引用之以下出版物及參考文獻提供突變形式之其他細節：Arnold,Protein engineering for unusual environments,Current Opinion in Biotechnology 4：450-455(1993)；Bass等人，Mutant Trp repressors with new DNA-binding specificities,Science 242：240-245(1988)；Bordo及Argos(1991)Suggestions for "Safe" Residue Substitutions in Site-directed Mutagenesis 217：721-729；Botstein及Shortle,Strategies and applications of in vitro mutagenesis,Science 229：1193-1201(1985)；Carter等人Improved oligonucleotide site-directed mutagenesis using M13 vectors,Nucl.Acids Res.13：4431-4443(1985)；Carter,Site-directed mutagenesis,Biochem.J.237：1-7(1986)；Carter,Improved oligonucleotide-directed mutagenesis using M13 vectors,Methods in Enzymol.154：382-403(1987)；Dale等人，Oligonucleotide-directed random mutagenesis using the phosphorothioate method,Methods Mol.Biol.57：369-374(1996)；Eghtedarzadeh及Henikoff,Use of oligonucleotides to generate large deletions,Nucl.Acids Res.14：5115(1986)；Fritz等人，Oligonucleotide-directed construction of mutations：a gapped duplex DNA procedure without enzymatic reactions in vitro,Nucl.Acids Res.16：6987-6999(1988)；Grundstrom等人，Oligonucleotide-directed mutagenesis by microscale‵shot-gun‵gene synthesis,Nucl.Acids Res.13：3305-3316(1985)；Hayes(2002)Combining Computational and Experimental Screening for rapid Optimization of Protein Properties PNAS 99(25)15926-15931；Kunkel,The efficiency of oligonucleotide directed mutagenesis,Nucleic Acids & Molecular Biology(Eckstein,F.及Lilley,D.M.J.編，Springer Verlag,Berlin))(1987)；Kunkel,Rapid and efficient site-specific mutagenesis without phenotypic selection,Proc.Natl.Acad.Sci.USA 82：488-492 (1985)；Kunkel等人，Rapid and efficient site-specific mutagenesis without phenotypic selection,Methods in Enzymol.154,367-382(1987)；Kramer等人，The gapped duplex DNA approach to oligonucleotide-directed mutation construction,Nucl.Acids Res.12：9441-9456(1984)；Kramer及Fritz Oligonucleotide-directed construction of mutations via gapped duplex DNA,Methods in Enzymol.154：350-367(1987)；Kramer等人，Point Mismatch Repair,Cell 38：879-887(1984)；Kramer等人，Improved enzymatic in vitro reactions in the gapped duplex DNA approach to oligonucleotide-directed construction of mutations,Nucl.Acids Res.16：7207(1988)；Ling等人，Approaches to DNA mutagenesis：an overview,Anal Biochem.254(2)：157-178(1997)；Lorimer及Pastan Nucleic Acids Res.23,3067-8(1995)；Mandecki,Oligonucleotide-directed double-strand break repair in plasmids of Escherichia coli：a method for site-specific mutagenesis,Proc.Natl.Acad.Sci.USA,83：7177-7181(1986)；Nakamaye及Eckstein,Inhibition of restriction endonuclease Nci I cleavage by phosphorothioate groups and its application to oligonucleotide-directed mutagenesis,Nucl.Acids Res.14：9679-9698(1986)；Nambiar等人，Total synthesis and cloning of a gene coding for the ribonuclease S protein,Science 223：1299-1301(1984)；Sakamar及Khorana,Total synthesis and expression of a gene for the a-subunit of bovine rod outer segment guanine nucleotide-binding protein(transducin),Nucl.Acids Res.14：6361-6372(1988)；Sayers等人，Y-T Exonucleases in phosphorothioate-based oligonucleotide-directed mutagenesis,Nucl.Acids Res.16：791-802(1988)；Sayers等人，Strand specific cleavage of phosphorothioate-containing DNA by reaction with restriction endonucleases in the presence of ethidium bromide,(1988)Nucl.Acids Res.16：803-814；Sieber等人，Nature Biotechnology,19：456-460(2001)；Smith,In vitro mutagenesis,Ann.Rev.Genet.19：423-462(1985)；Methods in Enzymol.100：468-500(1983)；Methods in Enzymol.154：329-350(1987)；Stemmer,Nature 370,389-91(1994)；Taylor等人，The use of phosphorothioate-modified DNA in restriction enzyme reactions to prepare nicked DNA,Nucl.Acids Res.13：8749-8764(1985)；Taylor等人，The rapid generation of oligonucleotide-directed mutations at high frequency using phosphorothioate-modified DNA,Nucl.Acids Res.13：8765-8787(1985)；Wells等人，Importance of hydrogen-bond formation in stabilizing the transition state of subtilisin,Phil.Trans.R.Soc.Lond.A 317：415-423(1986)；Wells等人，Cassette mutagenesis：an efficient method for generation of multiple mutations at defined sites,Gene 34：315-323(1985)；Zoller及Smith,Oligonucleotide-directed mutagenesis using M 13-derived vectors：an efficient and general procedure for the production of point mutations in any DNA fragment,Nucleic Acids Res.10：6487-6500(1982)；Zoller及Smith,Oligonucleotide-directed mutagenesis of DNA fragments cloned into M13 vectors,Methods in Enzymol.100：468-500(1983)；Zoller及Smith,Oligonucleotide-directed mutagenesis：a simple method using two oligonucleotide primers and a single-stranded DNA template,Methods in Enzymol.154：329-350(1987)；Clackson等人(1991)「Making antibody fragments using phage display libraries」Nature 352：624-628；Gibbs等人(2001)「Degenerate oligonucleotide gene shuffling(DOGS)：a method for enhancing the frequency of recombination with family shuffling」Gene 271：13-20；及Hiraga及Arnold(2003)「General method for sequence-independent site-directed chimeragenesis：J.Mol.Biol.330：287-296。許多以上方法之其他細節可發現於Methods in Enzymology第154卷中，其亦描述藉由各種突變誘發方法有用地控制解決難題的問題。

製造及分離重組轉位酶

一般而言，如本文中呈現之編碼轉位酶之核酸可藉由選殖、重組、試管內合成、試管內擴增及/或其他可用方法製得。多種重組方法可用於表現編碼如本文中呈現之轉位酶之表現載體。製造重組核酸、表現及分離所表現產物之方法已為所熟知且描述於此項技術中。多種例示性突變及突變組合，以及設計所需突變之策略描述於本文中。製造及選擇轉位酶之催化域中之突變之方法發現於本文中且例示於美國專利第5,925,545號、美國專利第5,965,443號、美國專利第7,083,980號及美國專利第7,608,434號中，該專利以全文引用的方式併入。

關於突變、重組及試管內操縱方法(包括選殖、表現、PCR及其類似者)之其他有用參考文獻包括Berger及Kimmel,Guide to Molecular Cloning Techniques,Methods in Enzymology第152卷Academic Press公司，San Diego,Calif.(Berger)；Kaufman等人(2003)Handbook of Molecular and Cellular Methods in Biology and Medicine第二版Ceske(編)CRC Press(Kaufman)；及The Nucleic Acid Protocols Handbook Ralph Rapley(編)(2000)Cold Spring Harbor,Humana Press公司(Rapley)；Chen等人(編)PCR Cloning Protocols，第二版(Methods in Molecular Biology，第192卷)Humana Pres；及Viljoen等人(2005)Molecular Diagnostic PCR Handbook Springer,ISBN 1402034032。

另外，用於自細胞純化質粒或其他相關核酸之過多套組為市售的(參見例如EasyPrep^TM、FlexiPrep^TM，二者均購自Pharmacia Biotech；StrataClean^TM，購自Stratagene；及QIAprep^TM，購自Qiagen)。任何分離及/或純化之核酸可另外經操縱以生產其他核酸、用於轉染細胞、併入相關載體中以感染有機體以用於表現及/或其類似者。典型的選殖載體含有轉錄及轉譯終止子、轉錄及轉譯起始序列及適用於調節特定目標核酸之表現之啟動子。載體視情況包含通用表現卡匣，該表現卡匣含有至少一個獨立的終止子序列、允許在真核細胞或原核生物或二者中複製卡匣之序列(例如，穿梭載體)及選擇標記，其用於原核及真核系統二者。載體適合於在原核細胞、真核細胞或二者中之複製及整合。

在一些具體實例中，本文中呈現之轉位酶表現為融合蛋白。融合蛋白可增強諸如轉位酶之溶解度、表現及/或純化的特徵。如本文所使用，術語「融合蛋白」係指具有至少兩個通常不存在於單一天然多肽中之多肽域之單一多肽鏈。因此，如本文所用，天然存在的蛋白及其點突變體不為「融合蛋白」。較佳地，相關多肽與至少一個多肽域經由肽鍵融合且融合蛋白亦可包括來源於獨立蛋白之胺基酸部分之間的胺基酸之連接區。融合至相關多肽之多肽域可增強相關多肽之溶解度及/或表現且亦可提供純化標籤以允許純化來自宿主細胞或培養上清液或二者之重組融合蛋白。增加表現、純化及/或儲存期間之溶解度之多肽域已在此項技術中為所熟知且包括例如麥芽糖結合蛋白(MBP)及延伸因子Ts(Tsf)，其如Fox,J.D.及Waugh D.S.,E.coli Gene Expression Protocols Methods in Molecular Biology,(2003)205：99-117及Han等人FEMS Microbiol.Lett.(2007)274：132-138所例示，該文獻中之每一者以全文引用的方式併入本文中。融合至相關多肽之多肽域可融合於相關多肽之N端或C端。術語「重組」係指人工組合兩個否則分離之序列片段，例如藉由化學合成或藉由基因工程改造技術操縱胺基酸或核酸之分離片段。

在一個具體實例中，本發明提供包含經修飾之Tn5轉位酶及延伸因子Ts(Tsf)之轉位酶融合蛋白。Tsf-Tn5融合蛋白可組裝成包含融合轉位酶及自由轉位子末端之功能二聚轉位體複合物。Tsf-Tn5融合蛋白具有相比於未融合Tn5蛋白增加之溶解度及熱穩定性。

在另一具體實例中，本發明提供包含經修飾之Tn5轉位酶及識別5-甲基胞嘧啶之蛋白域之轉位酶融合蛋白。5-甲基胞嘧啶-Tn5融合蛋白可組裝成包含融合轉位酶及自由轉位子末端之功能二聚轉位體複合物。5-甲基胞嘧啶結合蛋白域可例如用於將Tn5轉位體複合物靶向基因體之甲基化區。

在另一具體實例中，本發明提供包含經修飾之Tn5轉位酶及蛋白A抗體結合域之轉位酶融合蛋白。蛋白A-Tn5融合蛋白可組裝成包含融合轉位酶及自由轉位子末端之功能二聚轉位體複合物。蛋白A之抗體結合域可例如用於將Tn5轉位體複合物靶向基因體之抗體結合區。

本發明提供包含經修飾之Tn5轉位酶及所有或部分延伸因子TS(Tsf)之轉位酶融合蛋白。Tsf為可用於增強表現於細菌表現系統，例如大腸桿菌表現系統中之異源蛋白之溶解度的蛋白標籤。Tsf增加異源蛋白之溶解度之能力可歸因於Tsf蛋白之內在高摺疊效率。在蛋白純化實驗(資料未示出)中，Tsf以與蛋白Tu之複合物形式純化。為了使Tu結合於複合物中，Tsf需要恰當摺疊。Tsf-Tu複合物之純化表明Tsf經恰當摺疊。大腸桿菌延伸因子TS之例示性核酸及對應胺基酸序列分別顯示為SEQ ID NO：22及23。

在一實例中，藉由將TS融合至超高活性Tn5轉位酶之N端構建TS-Tn5融合蛋白。與突變Tn5轉位酶蛋白之TS融合之例示性胺基酸序列分別顯示為SEQ ID NO：25及26。SEQ ID NO：24對應於編碼SEQ ID NO：25之TS突變蛋白融合物之核酸序列。

儘管所有或部分TS可融合於N端或C端，熟習此項技術者應瞭解，可在TS序列與轉位酶之N端或C端之間插入連接序列。在一些具體實例中，連接序列之長度可為1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50或50個以上的胺基酸。在一些具體實例中，融合蛋白之轉位酶部分之一或多個胺基酸可缺失或經連接序列置換。在一些具體實例中，融合蛋白之轉位酶部分之第一甲硫胺酸可經兩個胺基酸，例如如SEQ ID NO：25及26中所指示之Gly-Thr置換。

TS-Tn5融合構築體表現於大腸桿菌中且關於表現、溶解度及熱穩定性進行評估。TS融合至Tn5之N端增加Tn5之溶解度。溶解度之增加可與轉位體複合物之增加之穩固性及蛋白聚集之減少相關。TS-Tn5轉位體之熱穩定性相比於未融合Tn5轉位體之熱穩定性實質上經改善。在一實例中，相比於未融合Tn5對照物，Tn5之誘導性聚集在Tsf-Tn5融合構築體中實質上減少。

在一個應用中，TS-Tn5融合蛋白用於構築定向RNA-seq庫(例如TotalScript^TM RNA-Seq套組，Illumina)以在下一代定序平台(例如Illumina GA或HiSeq平台)上定序。

在另一應用中，TS-Tn5融合蛋白可用於標準化方法中。在另一應用中，TS溶解標籤可用於其他經修飾(突變)Tn5轉位酶之表現及純化。

對TS融合標籤具有特異性之抗體可用於下拉方法中以捕獲轉位體標記之序列。在一實例中，TS融合標籤抗體為家兔多株抗體。

在另一應用中，TS-Tn5轉位體及抗-TS抗體可用於混合轉位體方法中。舉例而言，使用Tsf-Tn5轉位體及Tn5轉位體(亦即未經TS標記)進行轉位體反應。抗-TS抗體尤其用於下拉Tsf-Tn5轉位體標記之序列。

本發明提供一種包含經修飾Tn5轉位酶及識別5-甲基胞嘧啶之蛋白域之轉位酶融合蛋白。5-甲基胞嘧啶結合蛋白域可例如用於將Tn5轉位體複合物靶向基因體之甲基化區。在一個應用中，5-甲基胞嘧啶結合域-Tn5轉位體複合物可用於產生用於甲基化分析之甲基富集片段化及標記(標籤化)庫。

在一些具體實例中，融合至轉位酶之多肽域包含蛋白A之抗體結合域。蛋白A為具有穩固摺疊特徵之相對較小、緻密分子。蛋白A之抗體結合域可例如用於將Tn5轉位體複合物靶向基因體之抗體結合區。舉例而言，對5-甲基胞嘧啶具有特異性之抗體可用於結合至基因體之甲基化區且對其進行鑑別。基因體之抗體結合區可隨後使用蛋白A-Tn5融合轉位體複合物經靶向以用於片段化及標記(亦即標籤化)。

在一些具體實例中，融合至轉位酶之多肽域包含純化標籤。如本文所用之術語「純化標籤」係指任何適合於純化或鑑別多肽之肽序列。純化標籤特異性結合至對於純化標籤具有親和力之另一部分。特異性結合至純化標籤之此類部分通常附接至基質或樹脂，諸如瓊脂糖珠粒。特異性結合至純化標籤之部分包括抗體、其他蛋白(例如蛋白A或抗生蛋白鏈菌素)、鎳或鈷離子或樹脂、生物素、直鏈澱粉、麥芽糖及環糊精。例示性純化標籤包括組胺酸(HIS)標籤(諸如六組胺酸肽)，其將結合至金屬離子，諸如鎳或鈷離子。其他例示性純化標籤為myc標籤(EQKLISEEDL)、Strep標籤(WSHPQFEK)、Flag標籤(DYKDDDDK)及V5標籤( )。術語「純化標籤」亦包括「抗原決定基標籤」，亦即藉由抗體特定識別之肽序列。例示性抗原決定基標籤包括FLAG標籤，其藉由單株抗-FLAG抗體特定識別。藉由抗-FLAG抗體識別之肽序列由序列DYKDDDDK或其實質上一致的變異體組成。在一些具體實例中，融合至轉位酶之多肽域包含兩種或兩種以上標籤，諸如SUMO標籤及STREP標籤，如下文實施例1中所例示。術語「純化標籤」亦包括純化標籤之實質上一致的變異體。如本文所用之「實質上一致的變異體」係指純化標籤之衍生物或片段，其相比於初始純化標籤經修飾(例如經由胺基酸取代、缺失或插入)，但保留特異性結合至特定識別純化標籤之部分的純化標籤特性。

在一些具體實例中，融合至轉位酶之多肽域包含表現標籤。如本文所用之術語「表現標籤」係指可附接至第二多肽且應支持相關重組多肽之溶解度、穩定性及/或表現之任何肽或多肽。例示性表現標籤包括Fc標籤及SUMO標籤。大體上，任何肽、多肽或蛋白可用作表現標籤。

其他有用參考文獻(例如關於細胞分離及培養(例如用於後續核酸分離))包括Freshney(1994)Culture of Animal Cells,a Manual of Basic Technique，第三版，Wiley-Liss,New York及其中所引用之參考文獻；Payne等人(1992)Plant Cell and Tissue Culture in Liquid Systems John Wiley & Sons公司New York,N.Y.；Gamborg and Phillips(編)(1995)Plant Cell,Tissue and Organ Culture；Fundamental Methods Springer Lab Manual,Springer-Verlag(Berlin Heidelberg New York)及Atlas及Parks(編)The Handbook of Microbiological Media(1993)CRC Press,Boca Raton,Fla。

編碼本文揭示之重組轉位酶之核酸亦為本文中呈現之具體實例之特徵。特定胺基酸可藉由多個密碼子編碼，且某些轉譯系統(例如原核或真核細胞)通常展現密碼子傾向，例如不同有機體通常偏好編碼相同胺基酸之若干同義密碼子中之一者。因此，本文中呈現之核酸視情況經「密碼子最佳化」，意謂核酸經合成以包括對於用於表現轉位酶之特定轉譯系統較佳之密碼子。舉例而言，當需要表現細菌細胞(或甚至特定細菌菌株)中之轉位酶時，核酸可經合成以包括最頻繁地發現於彼細菌細胞之基因體中之密碼子以有效表現轉位酶。當需要表現真核細胞中之轉位酶時，可採用類似策略，例如核酸可包括對於彼真核細胞較佳之密碼子。

多種蛋白分離及偵測方法為已知的且可用於分離轉位酶，例如自表現本文中呈現之重組轉位酶之細胞之重組培養物。多種蛋白分離及偵測方法已在此項技術中為所熟知，包括例如以下文獻中所闡述之彼等方法：R.Scopes,Protein Purification,Springer-Verlag,N.Y.(1982)；Deutscher,Methods in Enzymology第182卷：Guide to Protein Purification,Academic Press 公司N.Y.(1990)；Sandana(1997)Bioseparation of Proteins,Academic Press公司；Bollag等人(1996)Protein Methods，第2增補本Wiley-Liss,NY；Walker(1996)The Protein Protocols Handbook Humana Press,NJ，Harris及Angal(1990)Protein Purification Applications：A Practical Approach IRL Press at Oxford,Oxford,England；Harris及Angal Protein Purification Methods：A Practical Approach IRL Press at Oxford,Oxford,England；Scopes(1993)Protein Purification：Principles and Practice第3增補本Springer Verlag,NY；Janson及Ryden(1998)Protein Purification：Principles,High Resolution Methods and Applications，第二版Wiley-VCH,NY；及Walker(1998)Protein Protocols on CD-ROM Humana Press,NJ；及其中所引用之參考文獻。關於蛋白純化及偵測方法之其他細節可發現於Satinder Ahuja編，Handbook of Bioseparations,Academic Press(2000)中。

使用方法

本文中呈現之經改變轉位酶可用於定序程序，諸如試管內轉位技術。簡言之，試管內轉位可藉由使轉位體複合物與目標DNA接觸起始。可易於適用於本發明之轉位酶之例示性轉位程序及系統描述於例如WO 10/048605；US 2012/0301925；US 2013/0143774中，該專利中之每一者以全文引用之方式併入本文中。

舉例而言，在一些具體實例中，本文中呈現之轉位酶可用於自包含任何相關dsDNA之目標DNA產生標記DNA片段之庫(例如用作下一代定序或擴增模板)之方法中，該方法包含：藉由至少一個轉位酶及轉位子末端組成物在試管內轉位反應中培育目標DNA，轉位酶藉由該轉位子末端組成物形成轉位複合物，該轉位子末端組成物包含(i)展現經轉移轉位子末端序列及視情況存在之經轉移轉位子末端序列之另一序列5'之轉移股，及(ii)在其中出現多個插入至目標DNA中之插入之條件下且持續究其而言足夠之時間展現與經轉移轉位子末端序列互補之序列之轉移股，該插入中之每一者導致包含轉移股或由其組成之第一標籤接合至目標DNA中之核苷酸之5'末端，進而將目標DNA片段化且產生經退火5'標記之DNA片段之群，其中之每一者在5'末端上具有第一標籤；且隨後將5'標記之DNA片段之3'末端接合至第一標籤或第二標籤，進而產生標記DNA片段之庫(例如包含標記圓形ssDNA片段或5'及3'標記之DNA片段(或「二標記DNA片段」))。

在一些具體實例中，轉位酶及轉位子末端組成物或用於試管內轉位反應中之轉位體組成物之量在每50微升反應物每50奈克目標DNA約1皮莫耳與約25皮莫耳之間。在任一本發明之方法之一些較佳具體實例中，轉位酶及轉位子末端組成物或用於試管內轉位反應中之轉位體組成物之量在每50微升反應物每50奈克目標DNA約5皮莫耳與約50皮莫耳之間。在任一本發明之方法之一些較佳具體實例中，其中轉位酶為超高活性Tn5轉位酶且轉位子末端組成物包含MEDS轉位子末端組成物或其中轉位體組成物包含該超高活性Tn5轉位酶及包含MEDS轉位子末端之轉位子末端組成物，該轉位酶及轉位子末端組成物或用於試管內轉位反應中之該轉位體組成物之量在每50微升反應物每50奈克目標DNA約5皮莫耳與約25皮莫耳之間。在任一本發明之方法之一些較佳具體實例中，其中轉位酶為超高活性Tn5轉位酶或MuA轉位酶，轉位酶及轉位子末端組成物或用於試管內轉位反應中之轉位體組成物之最終濃度為至少250nM；在一些其他具體實例中，超高活性Tn5轉位酶或MuA轉位酶及其各別轉位子末端組成物或轉位體組成物之最終濃度為至少500nM。

在一些具體實例中，本發明提供一種製備及富集基因體DNA庫以用於外顯子組定序之方法。在各種具體實例中，本發明方法使用經改變Tn5轉位酶，例如TS-Tn5059以用於製備基因體庫。在一個具體實例中，本發明方法提供製備具有減少的藉由經改變轉位酶(例如TS-TN5059)之減少之插入型序列傾向驅動之傾向之基因體庫。使用TS-Tn5059之基因體DNA之標籤化提供跨越寬GC/AT範圍之基因體之更完整覆蓋度。

在另一具體實例中，本發明提供一種使用具有增加之DNA輸入耐受度之經改變轉位酶製備基因體庫之方法。使用TS-Tn5059之基因體DNA之標籤化提供針對一定範圍之DNA輸入量的均一插入尺寸。在一些具體實例中，本發明提供一種外顯子組定序之方法。

標籤化反應條件

此處呈現用於標籤化反應之反應條件及緩衝劑。在一些具體實例中，二價陽離子包含於標籤化反應緩衝劑中。在特定具體實例中，二價陽離子可例如為Co²⁺、Mn²⁺、Mg²⁺、Cd²⁺或Ca²⁺。二價陽離子可以任何適合之鹽，諸如氯化物鹽，例如CoCl₂、MnCl₂、MgCl₂、乙酸鎂、CdCl₂或CaCl₂之形式包含。在特定具體實例中，標籤化緩衝劑包含CoCl₂，如在下文實施例中所例示。如藉由實施例5中之實驗證據所表明，在標籤化緩衝劑調配物中添加CoCl₂出人意料地改善標籤化期間的序列傾向。

在某些具體實例中，標籤化緩衝劑可具有約0.01mM、0.02mM、0.05mM、0.1mM、0.2mM、0.5mM、1mM、2mM、5mM、8mM、 10mM、12mM、15mM、20mM、30mM、40mM、50mM、60mM、70mM、80mM、90mM、100mM或大於其之二價陽離子濃度，或在此等值中之任一者之間的範圍內，例如0.01mM至0.05mM、0.02mM至0.5mM、8mM至12mM等之二價陽離子濃度。在一些具體實例中，標籤化緩衝劑可具有約0.01mM、0.02mM、0.05mM、0.1mM、0.2mM、0.5mM、1mM、2mM、5mM、8mM、10mM、12mM、15mM、20mM、30mM、40mM、50mM、60mM、70mM、80mM、90mM、100mM或大於其之CoCl₂濃度或在此等值中之任一者之間的範圍內，例如0.01mM至0.05mM、0.02mM至0.5mM、8mM至12mM等之二價陽離子濃度。在一些具體實例中，標籤化緩衝劑可具有約0.01mM、0.02mM、0.05mM、0.1mM、0.2mM、0.5mM、1mM、2mM、5mM、8mM、10mM、12mM、15mM、20mM、30mM、40mM、50mM、60mM、70mM、80mM、90mM、100mM或大於其之MnCl₂濃度或在此等值中之任一者之間的範圍內，例如0.01mM至0.05mM、0.02mM至0.5mM、8mM至12mM等之二價陽離子濃度。在一些具體實例中。標籤化緩衝劑可具有約0.01mM、0.02mM、0.05mM、0.1mM、0.2mM、0.5mM、1mM、2mM、5mM、8mM、10mM、12mM、15mM、20mM、30mM、40mM、50mM、60mM、70mM、80mM、90mM、100mM或大於其之MgCl₂濃度或在此等值中之任一者之間的範圍內，例如0.01mM至0.05mM、0.02mM至0.5mM、8mM至12mM等之二價陽離子濃度。在一些具體實例中。標籤化緩衝劑可具有約0.01mM、0.02mM、0.05mM、0.1mM、0.2mM、0.5mM、1mM、2mM、5mM、8mM、10mM、12mM、15mM、20mM、30mM、40mM、50mM、60mM、70mM、80mM、90mM、100mM或大於其之CdCl₂ 濃度或在此等值中之任一者之間的範圍內，例如0.01mM至0.05mM、0.02mM至0.5mM、8mM至12mM等之二價陽離子濃度。在一些具體實例中，標籤化緩衝劑可具有約0.01mM、0.02mM、0.05mM、0.1mM、0.2mM、0.5mM、1mM、2mM、5mM、8mM、10mM、12mM、15mM、20mM、30mM、40mM、50mM、60mM、70mM、80mM、90mM、100mM或大於其之CaCl₂濃度或在此等值中之任一者之間的範圍內，例如0.01mM至0.05mM、0.02mM至0.5mM、8mM至12mM等之二價陽離子濃度。

在一些具體實例中，基因體DNA藉由轉位酶之片段化或標籤化反應可在25℃至70℃、37℃至65℃、50℃至65℃或50℃至60℃之溫度的範圍內進行。在一些具體實例中，基因體DNA藉由轉位酶之片段化或標籤化反應可在37℃、40℃、45℃、50℃、51℃、52℃、53℃、54℃、55℃、56℃、57℃、58℃、59℃、60℃、61℃、62℃、63℃、64℃或65℃下進行。

編碼經改變轉位酶之核酸

本文進一步呈現編碼本文中呈現之經改變轉位酶之核酸分子。對於作為胺基酸序列已知且編碼轉位酶之野生型核苷酸序列較佳亦已知之轉位酶之突變型式之任何給定經改變轉位酶，可根據分子生物學之基本原理獲得編碼該突變體之核苷酸序列。舉例而言，倘若編碼Tn5轉位酶之野生型核苷酸序列已知，可使用標準基因密碼推斷編碼具有一或多個胺基酸取代之Tn5之任何給定突變型式之核苷酸序列。類似地，對於其他轉位酶之突變形式，可容易推導出核苷酸序列。具有所需核苷酸序列之核酸分子可接著使用此項技術中已知之標準分子生物學技術構築。

根據本文中呈現之具體實例，指定之核酸不僅包括一致核酸，且亦包括任何較小鹼基變異，尤其包括在由於保守胺基酸取代中之簡併密碼產生同義密碼子(指定相同胺基酸殘基之不同密碼子)之情況下之取代。術語「核酸序列」亦包括關於鹼基變異給定之任何單股序列之互補序列。

本文所述之核酸分子亦可有利地包括於適合之表現載體中以在適合之宿主中表現自其編碼之轉位酶蛋白。將選殖DNA併入至適合之表現載體中以用於該細胞之後續轉化及經轉化細胞之後續選擇為熟習此項技術者熟知，如Sambrook等人(1989),Molecular cloning：A Laboratory Manual,Cold Spring Harbor Laboratory中所提供，該文獻以全文引用的方式併入本文中。

該種表現載體包括具有根據本文中呈現之具體實例之核酸可操作地連接於能夠影響該DNA片段之表現之調節序列(諸如啟動子區)的載體。術語「可操作地連接」係指所描述之組分呈准許其以其預期方式起作用的關係的並接。此類載體可轉化至適合之宿主細胞中以提供根據本文中呈現之具體實例之蛋白之表現。

核酸分子可編碼成熟蛋白或具有前序列之蛋白，包括編碼前蛋白上之前導序列，該前蛋白隨後由宿主細胞裂解以形成成熟蛋白。載體可例如為質體、病毒或噬菌體載體，其配備有複製起點，及視情況存在之用於表現該核苷酸之啟動子及視情況存在之啟動子之調節子。載體可含有一或多個選擇性標記物，諸如抗生素抗性基因。

表現所需的調節元件包括啟動子序列以結合RNA聚合酶及導引適當水準之轉錄起始以及轉譯起始序列以用於核糖體結合。舉例而言，細菌表現載體可包括啟動子(諸如lac啟動子)以及用於轉譯起始的Shine-Dalgarno序列及起始密碼子AUG。類似地，真核表現載體可包括用於RNA聚合酶II之異源或同源啟動子、下游聚腺苷酸化信號、起始密碼子AUG及用於分離核糖體之終止密碼子。此類載體可商業上獲得或自所述序列藉由此項技術中熟知之方法組裝。

藉由高級真核生物轉錄編碼轉位酶之DNA可藉由在載體中包括增強子序列而最佳化。增強子為作用於啟動子以增加轉錄水準之DNA之順式作用元件。除包括選擇性標記物以外，載體亦將一般包括複製起點。

實施例1 一般分析方法及條件

以下段落描述用於下文中呈現之實施例中之一般分析條件。

使用TN5進行WGS對人類gDNA進行標籤化

此部分描述用於下文實施例中之標籤化分析，用於監測轉位酶之插入傾向。簡言之，在55℃下將50ng人類基因體DNA與5μL TDE1一起在10mM Tris-乙酸鹽(pH 7.6)、25mM乙酸鎂中培育5分鐘。隨後添加1/5反應體積之125mM HEPES(pH 7.5)、1M NaCl、50mM MgCl₂，接著添加Tn5轉位體至100nM且在30℃下培育60分鐘。隨後清除反應物且如Illumina's Nextera方案中所述擴增且遞交用於使用HiSeq 2000儀器定序。

Tn5轉位體組裝

將Tn5與經黏接至20μM之轉位子在室溫下在25mM HEPES(pH 7.6)、125mM KCl、18.75mM NaCl、0.375mM EDTA、31.75% 甘油中培育30分鐘。

轉位子組裝

藉由將反應物加熱至94℃且將其緩慢冷卻至室溫而在10mM TrisHCl(pH 7.5)、50mM NaCl、1mM EDTA中將轉位子分開黏接至40μM。對於Tn5-ME-A，Tn5嵌合末端序列(Mosaic End Sequence)A14(Tn5MEA)經黏接至Tn5非轉移序列(NTS)，且對於Tn5-ME-B，Tn5嵌合末端序列B15(Tn5MEB)經黏接至Tn5非轉移序列(NTS)。此等序列如下所指示：

Tn5MEA：5'-TCGTCGGCAGCGTCAGATGTGTATAAGAGACAG-3'

Tn5MEB：5'-GTCTCGTGGGCTCGGAGATGTGTATAAGAGACAG-3'

Tn5 NTS：5'-CTGTCTCTTATACACATCT-3'

2. 轉位酶之選殖及表現

此部分描述用於選殖及表現用於以下實施例中之各種轉位酶突變體之方法。

使用標準定點突變誘發方法對編碼轉位酶之主鏈基因序列之基因進行突變誘發。對於進行之各突變，藉由定序選殖基因序列確認突變基因之恰當序列。

將Tn5轉位酶基因選殖至經修飾pET11a質體中。經修飾質體含有來源於pASK5plus之純化標籤StrepTag-II及來源於pET-SUMO之SUMO。使用BL21(DE3)pLysY感受態細胞(New England Biolabs)進行表現。細胞在25℃下生長至0.5之OD_600nm，接著使用100μM IPTG誘導。在18℃下進行表現持續19h。使用微流化劑將細胞集結粒在蛋白酶抑制劑存在下溶解於100mM TrisHCl(pH 8.0)、1M NaCl、1mM EDTA中。在溶解之後，將細胞溶解物與去氧膽酸鹽一起培育30分鐘至0.1%之最終濃度。添加聚乙二亞胺至0.5%，隨後在30,000 xg下離心20分鐘。收集上清液且與相等體積之飽和硫酸銨溶液混合，接著在冰上攪拌至少1h。隨後將溶液在30,000 xg下離心20分鐘且將集結粒再懸浮於100mM Tris(pH 8.0)、1M NaCl、1mM EDTA及1mM DTT中。隨後使用AKTA純化系統將再懸浮且過濾之溶液施加至Streptactin管柱。使用100mM Tris(pH 8.0)、1mM EDTA、1mM DTT、4M NaCl，接著用100mM Tris(pH 7.5)、1mM EDTA、1mM DTT、100mM NaCl洗滌管柱。使用100mM Tris(pH 7.5)、1mM EDTA、1mM DTT、100mM NaCl及5mM去硫生物素進行洗提。使用100mM Tris(pH 7.5)、100mM NaCl、0.2mM EDTA及2mM DTT將洗提液加載至肝素捕獲管柱上。在使用相同緩衝劑洗滌之後，使用100mM Tris(pH 7.5)、1M NaCl、0.2mM EDTA及2mM DTT以鹽梯度洗提Tn5變異體。將洗提份收集、合併、濃縮且添加甘油以產生50%最終濃度，隨後長期儲存於-20℃下。

3. 大腸桿菌基因體DNA中之插入傾向之IVC分析

使用IVC曲線資料(強度相對於循環)進行插入序列傾向之分析。在定序使用各別DNA轉位酶創建之DNA庫之後產生此可用資料。簡言之，如上文所述進行突變誘發及表現。將轉位酶與上文所述之轉位子A及B一起培育，且與大腸桿菌基因體DNA一起培育以產生DNA庫。在運作MiSeq Fast化學方法之Illumina基因體分析儀系統(Illumina公司，San Diego,CA)上根據製造商說明書對各庫定序至少35個循環。Illumina RTA軟體用於在各循環產生鹼基響應及強度值。為了產生IVC曲線，將定序讀數與大腸桿菌參考基因體比對且將各循環之四種鹼基中之每一者之強度(出現率) 標繪為所有比對定序讀數之所有強度值之分數。

實施例2 鑑別Tn5轉位酶突變體之插入傾向

此實施例描述使用IVC曲線資料(強度相對於循環)分析插入序列傾向。此資料在定序使用各別DNA轉位酶創建之DNA庫之後可用。此分析僅需要一些定序讀數(20k-40k)以得到穩定結果且可在用於表現各別Tn5轉位酶變異體之大腸桿菌細胞溶解物中進行，且適合於HTS(高通量篩選)目的。

各種單一胺基酸取代Tn5變異體之代表性結果闡述於圖2-7中。舉例而言，顯示之變異體表明藉由位置248處之取代之對稱性損失(圖2)、藉由位置119處之取代之扁平IVC曲線(圖3)、藉由位置125處之取代或位置248之後的插入之IVC曲線之後半部中之IVC減少(圖4-5)及藉由在位置K120處使用不同芳族胺基酸的9bp至10bp之複製增加(圖6，顯示自1及第9至1及第10bp之對稱性變化)。此等結果表明指定突變相比於wt對照組提供改善之插入傾向。

實施例3 細菌性gDNA之全基因體定序

進行此等實驗以關於a)估計之庫大小/多樣性及b)AT/GC丟失比較各種轉位酶突變體。藉由經純化及活性標準化Tn5轉位酶變異體進行此等實驗。此等實驗需要500k-1M定序讀數/實驗。

藉由使用指定純化Tn5轉位酶變異體對蠟狀芽孢桿菌(B.cereus)gDNA進行標籤化獲得結果。酶根據活性標準化且設定成匹配與 Nextera^TM套組一起銷售之商業TDE1酶之活性。

指定為Tn5001之突變體與SEQ ID NO：11具有相同胺基酸序列且充當「wt」對照組。如上表中所示，指定為Tn5058、Tn5059及Tn5061之突變體分別與SEQ ID NO：18、19及20具有相同胺基酸序列。一式三份地進行實驗，資料顯示收集之資料之平均值及標準差。「估計之庫大小」在不使用光學重複的情況下計算，提供可再現結果。

如圖8A中所示，相比於Tn5001，Tn5058及Tn5059存在AT丟失之顯著減少，同時保持GC丟失較低。類似地，如圖8B中所示，存在庫尺寸的1.7×(Tn5058)及2.2×(Tn5059)之顯著增加。此等結果表明相比於野生型轉位酶，突變體Tn5058及Tn5059極大地改善序列插入傾向，導致在下文實施例4中所述之其他實驗。

實施例4 人類gDNA之Nextera快速捕獲富集實驗

在與上文實施例3中所述相同之純化及活性標準化Tn5轉位酶變異體之情況下進行以下實驗。此等實驗通常需要40M-100M定序讀數/實驗，且分析定序資料以比較a)多樣性、b)富集、c)覆蓋度、d)覆蓋度均一性、e)罰分。

根據製造商說明書使用Nextera快速捕獲外顯子組(Illumina^TM)CEX集區捕獲探針一式三份地進行捕獲。如圖9A中所示，相比於wt對照Tn5001，指定突變體產生覆蓋度均一性之顯著改善。另外，如圖9B中指示，藉由目標覆蓋度之10×及20×之測試突變體產生統計顯著改善，儘管平均目標覆蓋度較低。

如圖10A中所示，指定突變體產生獨特讀數數目及混合選擇庫大小之增加。同樣，如圖10B中所示，突變體產生相比於Tn5001較低之罰分，其為達到10×、20×或30×深度之覆蓋度所需的倍數較大定序。此等結果表明測試突變體相比於對照組提供更大插入傾向及更均一覆蓋度。

實施例5 標籤化緩衝劑組成對Tn5活性之影響

進行以下實驗以特性化Tn5標籤化緩衝劑組成及反應條件對庫輸出及定序度量值之影響。

為了評估標籤化緩衝劑組成及反應條件對庫輸出及定序度量值之影響，使用蠟狀芽孢桿菌基因體DNA構築Tn5標籤化DNA庫。兩種不同Tn5轉位酶用於構築標籤化庫，亦即突變Tn5(「TS-Tn5059」)及對照超高活性Tn5(「TS-Tn5」)。TS為用於純化Tn5及Tn5059蛋白之融合標籤。Tn5059具有4個就超高活性Tn5胺基酸序列(SEQ ID NO：11)而言之額外突變體K212R、P214R、G251R及A338V。TS-Tn5059在Tn5059之N端包含TS標籤。在一些具體實例中，TS-標籤之C端可藉由連接子融合至Tn5059之N端，其替代第一甲硫胺酸殘基。在一些具體實例中，連接子為Gly-Thr。

TS-Tn5059以10、40及80nM之最終濃度使用。TS-Tn5以4、15及30nM之最終濃度使用。TS-Tn5059及TS-Tn5之酶濃度經標準化(使用標準緩衝劑調配物)以提供大致相同之標籤化活性位準，亦即10、40及80nM處之TS-Tn5059分別與4、15及30nM處之Tn5具有大致相同活性位準。使用25ng輸入量之蠟狀芽孢桿菌基因體DNA製備各標籤化庫。蠟狀芽孢桿菌之基因體含量為約40% GC及約60% AT。

標籤化緩衝劑製備為2×調配物。2×調配物為如下：標準緩衝劑(TD；20mM Tris乙酸鹽，pH 7.6、10mM乙酸鎂及20%二甲基甲醯胺(DMF)；鈷緩衝劑(Co；20mM Tris乙酸鹽，pH 7.6及20mM CoCl₂)；鈷+DMSO緩衝劑(Co-DMSO；20mM Tris乙酸鹽，pH 7.6、20mM CoCl₂及20%二甲亞碸(DMSO))；高分子量緩衝劑(HMW；20mM Tris乙酸鹽，pH 7.6及10mM乙酸鎂)；NF2緩衝劑(NF2；20mM Tris乙酸鹽，pH 7.6、20mM CoCl₂及20% DMF)。每日製備新的包括CoCl₂之標籤化緩衝劑。對於各庫，藉由以50μL之總反應體積混合20μL蠟狀芽孢桿菌基因體DNA(25ng)、25μL 2×標籤化緩衝劑及5μL酶(10×Ts-Tn5059或10×Ts-Tn5)進行標籤化反應。在55℃下培育反應物5分鐘。在標籤化反應之後，根據標準Nextera^TM樣品製備方案加工樣品。使用Illumina's SBS(合成定序法)化學方法在MiSeq裝置上對庫定序。定序操作為使用V2 MiSeq套組之2×71循環。在生物分析儀上評估各庫中之片段尺寸分佈。

圖11顯示使用不同標籤化緩衝劑製備之TS-Tn5059及TS-Tn5標籤化DNA庫中之獨特分子數之柱狀圖100。庫中之獨特分子數為庫之多樣性(複雜度)之示度。圖上之各條表示標籤化庫。重複實驗三次(n=3)。藉由「酶-酶濃度-DNA輸入」指示對照庫(亦即使用標準標籤化緩衝劑製備之庫)。舉例而言，柱狀圖100中之第一條標記為「TS-Tn5059-10nM-25ng」且表示使用標準緩衝劑調配物中10nM之最終濃度之TS-Tn5059及25ng之輸入DNA製備之對照庫。使用經修飾標籤化緩衝劑調配物製備之庫由「酶-酶濃度-緩衝劑添加劑-DNA輸入」指示。舉例而言，柱狀圖100中之第四條標記為「TS-Tn5059-10nM-Co-25ng」且表示使用包括10mM CoCl₂之經修飾標籤化緩衝劑中10nM之最終濃度之TS-Tn5059製備之庫。資料顯示使用包括10mM CoCl₂之標籤化緩衝劑(亦即Co、Co-DMSO及NF2緩衝劑)製備之TS-Tn5059及TS-Tn5標籤化庫具有相比於不添加CoCl₂之緩衝劑(亦即標準緩衝劑或HMW)中製備之庫較高之平均多樣性。

圖12顯示使用不同標籤化緩衝劑製備之TS-Tn5059及TS-Tn5標籤化DNA庫中之GC丟失%之柱狀圖200。如圖11中所述來表示使用經修飾標籤化緩衝劑製備之對照庫及庫。GC丟失可定義為基因體中自標籤化庫除去(不存在)之GC富集區之百分比。資料顯示對於使用標準標籤化緩衝劑製備之對照TS-Tn5059及TS-Tn5庫，GC丟失之百分比相對較低。資料亦顯示使用包括10mM CoCl₂之標籤化緩衝劑(亦即Co、Co-DMSO及NF2緩衝劑)製備之TS-Tn5059及TS-Tn5標籤化庫具有相比於在不添加CoCl₂之緩衝劑(亦即標準緩衝劑或HMW)中製備之庫較高之GC丟失%(亦即達至約6%)。使用含Co緩衝劑製備之庫中之GC丟失之增加藉由增加TS-Tn5059及TS-Tn5之濃度改善。舉例而言，TS-Tn5059-10nm-Co-25ng庫中之GC丟失%相比於TS-Tn5059-10nm-25ng對照庫相對較高。隨著TS-Tn5059之濃度增加至40nM(亦即TS-Tn5059-40nm-Co-25ng)及80nM(亦即TS-Tn5059-80nm-Co-25ng)，GC丟失%減小。

圖13顯示使用不同標籤化緩衝劑製備之TS-Tn5059及TS-Tn5標籤化DNA庫中之AT丟失%之柱狀圖300。如圖11中所述來表示使用經修飾標籤化緩衝劑製備之對照庫及庫。AT丟失可定義為基因體中自標籤化庫除去(不存在)之AT富集區之百分比。資料顯示對於使用標準標籤化緩衝劑製備之對照TS-Tn5059及TS-Tn5庫，觀測到一定量(亦即分別地，約1%至約3%及約7%至約3%)之AT丟失。資料亦顯示使用低酶濃度(亦即10nM)及包括10mM CoCl₂之標籤化緩衝劑(亦即Co、Co-DMSO及NF2緩衝劑)製備之TS-Tn5059標籤化庫相比於在不添加CoCl₂之緩衝劑(亦即標準緩衝劑或HMW)中製備之庫具有較低AT丟失%。類似地，使用包括10mM CoCl₂之標籤化緩衝劑(亦即Co、Co-DMSO及NF2緩衝劑)製備之TS-Tn5庫具有相比於在不添加CoCl₂之緩衝劑(亦即標準緩衝劑或HMW)中製備之庫較低之AT丟失%。

現參看圖12及13，在標籤化緩衝劑(亦即Co、Co-DMSO及NF2緩衝劑)中添加CoCl₂(10nM)可「翻轉」標籤化庫中之GC及AT丟失%。舉例而言，TS-Tn5059-10nm-Co-25ng庫中之GC丟失%(圖12)相比於TS-Tn5059-10nm-25ng對照庫相對較高；而TS-Tn5059-10nm-Co-25ng庫中之AT丟失%(圖13)相比於TS-Tn5059-10nm-25ng對照庫相對較低(或無)。

圖14顯示使用標準緩衝劑(TD)及鈷緩衝劑(Co)調配物製備之TS-Tn5059庫中之片段尺寸分佈之生物分析儀跡線之曲線圖400。曲線圖400顯示為Ts-Tn5059-10nM-Co-25ng庫中之片段尺寸分佈之曲線的曲線410、為Ts-Tn5059-40nM-Co-25ng庫中之片段尺寸分佈之曲線的曲線415、為Ts-Tn5059-80nM-Co-25ng庫中之片段尺寸分佈之曲線的曲線420、為Ts-Tn5059-10nM-TD-25ng庫中之片段尺寸分佈之曲線的曲線425、為Ts-Tn5059-10nM-TD-25ng庫中之片段尺寸分佈之曲線的曲線430及為 Ts-Tn5059-80nM-TD-25ng庫中之片段尺寸分佈之曲線的曲線435。曲線圖400亦顯示為鹼基對(bp)中之DNA片段尺寸之標準梯的曲線440。梯中之片段尺寸(從左向右)顯示於表2中。

資料顯示將用於標籤化反應中之TS-Tn5059之濃度自10nM增加至40nM及80nM將片段尺寸分佈移位至較小片段尺寸。片段尺寸分佈之移位在使用標準緩衝劑(TD)調配物製備之庫中更明顯。舉例而言，在使用鈷緩衝劑(Co)調配物製備之庫中之片段尺寸分佈在使用10nM TS-Tn5059製備之庫中為約3,000bp(曲線410)且在使用40及80nM TS-Tn5059製備之庫中為約1,000至約2,000bp(分別地，曲線415及420)。對於使用標準緩衝劑(TD)調配物及80nM TS-Tn5059(曲線435)製備之庫，片段尺寸分佈為約200bp至約1,000bp。

圖15顯示使用鈷-DMSO(Co-DMSO)、NF2及HMW緩衝劑調配物製備之TS-Tn5059庫中之片段尺寸分佈之生物分析儀跡線之曲線圖 500。曲線圖500顯示為Ts-Tn5059-10nM-Co-DMSO-25ng庫中之片段尺寸分佈之曲線的曲線510、為Ts-Tn5059-10nM-NF2-25ng庫中之片段尺寸分佈之曲線的曲線515、為Ts-Tn5059-10nM-HMW-25ng庫中之片段尺寸分佈之曲線的曲線520、為Ts-Tn5059-40nM-Co-DMSO-25ng庫中之片段尺寸分佈之曲線的曲線525、為Ts-Tn5059-40nM-NF2-25ng庫中之片段尺寸分佈之曲線的曲線530、為Ts-Tn5059-40nM-HMW-25ng庫中之片段尺寸分佈之曲線的曲線535、為Ts-Tn5059-80nM-Co-DMSO-25ng庫中之片段尺寸分佈之曲線的曲線540、為Ts-Tn5059-80nM-NF2-25ng庫中之片段尺寸分佈之曲線的曲線545及為Ts-Tn5059-80nM-HMW-25ng庫中之片段尺寸分佈之曲線的曲線550。曲線圖500亦顯示圖14之曲線圖400之曲線440，其為鹼基對(bp)中之DNA片段尺寸之標準梯。

資料顯示一般而言，將用於標籤化反應中之TS-Tn5059之濃度自10nM增加至40nM及80nM將片段尺寸分佈移位至較小片段尺寸。相比於使用Co-DMSO製備之庫(例如曲線510及525)，片段尺寸分佈之移位在使用不包括CoCl₂之HMW緩衝劑製備之庫(例如曲線520及535)中更明顯。

圖16顯示使用標準緩衝劑調配物(TD)及鈷緩衝劑(Co)製備之TS-Tn5庫中之片段尺寸分佈之生物分析儀跡線之曲線圖600。曲線圖600顯示為Ts-Tn5-4nM-Co-25ng庫中之片段尺寸分佈之曲線的曲線610、為Ts-Tn5-15nM-Co-25ng庫中之片段尺寸分佈之曲線的曲線615、為Ts-Tn5-30nM-Co-25ng庫中之片段尺寸分佈之曲線的曲線620、為Ts-Tn5-4nM-TD-25ng庫中之片段尺寸分佈之曲線的曲線625、為 Ts-Tn5-15nM-TD-25ng庫中之片段尺寸分佈之曲線的曲線630及為Ts-Tn5-30nM-TD-25ng庫中之片段尺寸分佈之曲線的曲線635。曲線圖600亦顯示圖14之曲線圖400之曲線440，其為鹼基對(bp)中之DNA片段尺寸之標準梯。

資料顯示將用於標籤化反應中之TS-Tn5之濃度自4nM增加至15nM及30nM將片段尺寸分佈移位至較小片段尺寸。片段尺寸分佈之移位在使用標準緩衝劑(TD)調配物製備之庫中更明顯。此觀測結果與圖14之TS-Tn5059庫中之片段尺寸分佈類似。

圖17顯示使用鈷-DMSO(Co-DMSO)、NF2及HMW緩衝劑調配物製備之TS-Tn5庫中之片段尺寸分佈之生物分析儀跡線之曲線圖700。曲線圖700顯示為Ts-Tn5-4nM-Co-DMSO-25ng庫中之片段尺寸分佈之曲線的曲線710、為Ts-Tn5-4nM-NF2-25ng庫中之片段尺寸分佈之曲線的曲線715、為Ts-Tn5-4nM-HMW-25ng庫中之片段尺寸分佈之曲線的曲線720、為Ts-Tn5-15nM-Co-DMSO-25ng庫中之片段尺寸分佈之曲線的曲線725、為Ts-Tn5-15nM-NF2-25ng庫中之片段尺寸分佈之曲線的曲線730、為Ts-Tn5-15nM-HMW-25ng庫中之片段尺寸分佈之曲線的曲線735、為Ts-Tn5-30nM-Co-DMSO-25ng庫中之片段尺寸分佈之曲線的曲線740、為Ts-Tn5-30nM-NF2-25ng庫中之片段尺寸分佈之曲線的曲線745及為Ts-Tn5-30nM-HMW-25ng庫中之片段尺寸分佈之曲線的曲線750。曲線圖700亦顯示圖14之曲線圖400之曲線440，其為鹼基對(bp)中之DNA片段尺寸之標準梯。

資料顯示將用於標籤化反應中之TS-Tn5之濃度自4nM增加至15nM及30nM將片段尺寸分佈移位至較小片段尺寸。片段尺寸分佈之移位在使用標準緩衝劑(TD)調配物製備之庫中更明顯。此觀測結果與圖15之TS-Tn5059庫中之片段尺寸分佈類似。

一般而言，現參看圖14至17，使用包括10nM CoCl₂之標籤化緩衝劑(例如Co、Co-DMSO及NF2緩衝劑)製備之TS-Tn5059及TS-Tn5庫中之片段尺寸大於使用無CoCl₂之標籤化緩衝劑(亦即TD及HMW緩衝劑)製備之TS-Tn5059及TS-Tn5庫中之片段尺寸。

圖18A、18B、18C及18D分別顯示TS-Tn5庫中之序列含量之傾向圖800、TS-TN5-Co庫中之序列含量之傾向圖830、TS-Tn5-Co-DMSO庫中之序列含量之傾向圖840及TS-Tn5-NF2庫中之序列含量之傾向圖850。傾向圖(或強度相對於循環數(IVC)圖)描繪觀測之鹼基(A、C、G或T)隨SBS循環數變化之比且顯示在標籤化期間Tn5具有之較佳序列環境。

傾向圖800、830、840及850各顯示為依據循環數之A含量之曲線的曲線810、依據循環數之C含量之曲線的曲線815、為依據循環數之G含量之曲線的曲線820及為依據循環數之T含量之曲線的曲線825。舉例而言，在圖18A之TS-TN5庫中，表示鹼基G之曲線820顯示約38%在第1循環觀測之鹼基為G；表示鹼基T之曲線825顯示約15%在第1循環觀測之鹼基為T等。

參看圖18A，資料顯示經TS-Tn5庫中之SBS之約首先15個循環觀測到Tn5序列傾向，該庫使用標準標籤化緩衝劑調配物製備。在約15個循環之後，序列傾向逐漸減小且A、T、C及G含量反映預期基因體組成。對於蠟狀芽孢桿菌，基因體為約40% GC及約60% AT，其表示於傾向圖中之約第16或17循環至第35循環，其中曲線810(亦即A)及曲線825(亦即T)會合於約30%處(A+T約60%)；且曲線815(亦即C)曲線820(亦即G)會合於約20%處(C+G約40%)。

參看圖18B、18C及18D，資料亦顯示經TS-Tn5-Co、TS-Tn5-Co-DMSO及Ts-Tn5-NF2庫中之SBS之約首先15個循環觀測到Tn5序列傾向，該庫為使用包括CoCl₂之標籤化緩衝劑製備之庫。同樣，在約15循環之後，序列傾向逐漸減小且A、T、C及G含量反映如參看圖18A所描述之預期基因體組成。然而，在TS-Tn5-Co、TS-Tn5-Co-DMSO及Ts-Tn5-NF2庫中，曲線810(亦即A)及曲線825(亦即T)在約第10循環至第15循環開始朝向預期基因體組成移位；且曲線815(亦即C)及曲線820(亦即G)在約第10循環至第15循環開始朝向預期基因體組成移位。另外，當相比於圖18A時，循環2-8之間的傾向減小。資料顯示在標籤化緩衝劑調配物中添加CoCl₂改善標籤化期間的Tn5序列傾向。

圖19A、19B、19C及19D分別顯示TS-Tn5059庫中之序列含量之傾向圖900、TS-TN5059-Co庫中之序列含量之傾向圖930、TS-Tn5059-Co-DMSO庫中之序列含量之傾向圖940及TS-Tn5059-NF2庫中之序列含量之傾向圖950。傾向圖900、930、940及950各顯示為依據循環數之A含量之曲線的曲線910、依據循環數之C含量之曲線的曲線915、為依據循環數之G含量之曲線的曲線920及為依據循環數之T含量之曲線的曲線925。

參看圖19A，資料顯示經TS-Tn5059標籤化庫中之SBS之約首先15個循環觀測到Tn5059序列傾向。在約15循環之後，序列傾向減小且A、T、C及G含量反映如參看圖18A所描述之預期基因體組成。然而，突變體Tn5059顯示相比於圖18A中顯示之Tn5序列傾向減小之序列傾向。在TS-Tn5059庫中，曲線910(亦即A)及曲線925(亦即T)在約第10循環至第15循環開始朝向預期基因體組成移位；且曲線915(亦即C)及曲線920(亦即G)在約第10循環至第15循環開始朝向預期基因體組成移位。

參看圖19B、19C及19D，資料亦顯示經TS-Tn5059-Co、TS-Tn5059-Co-DMSO及Ts-Tn5059-NF2庫中之SBS之約首先15個循環觀測到Tn5059序列傾向，該庫為使用包括CoCl₂之標籤化緩衝劑製備之庫。同樣，在約15循環之後，序列傾向逐漸減小且A、T、C及G含量反映如參看圖18A描述之預期基因體組成。然而，在TS-Tn5059-Co庫中，曲線910(亦即A)及曲線925(亦即T)在約第5循環開始朝向預期基因體組成移位；且曲線915(亦即C)及曲線920(亦即G)在約第5循環開始朝向預期基因體組成移位。在TS-Tn5059-Co-DMSO及Ts-Tn5059-NF2庫中，曲線910(亦即A)及曲線925(亦即T)在第5循環之前開始朝向預期基因體組成移位；且曲線915(亦即C)及曲線920(亦即G)在第5循環之前開始朝向預期基因體組成移位。

實施例6 標籤化緩衝劑組成物對Mos1活性之影響

使用蠟狀芽孢桿菌基因體DNA構築Mos1標籤化DNA庫。用於構築標籤化庫之Mos1轉位酶為MBP-Mos1融合蛋白。麥芽糖結合蛋白 (MBP)為用於純化Mos1蛋白之融合標籤。MBP-Mos1以100μM之最終濃度使用。使用50ng輸入量之蠟狀芽孢桿菌基因體DNA製備各標籤化庫。

標籤化緩衝劑製備為2×調配物。2×調配物為如下：標準緩衝劑(TD；20mM Tris乙酸鹽，pH 7.6、10mM乙酸鎂及20%二甲基甲醯胺(DMF)；TD+NaCl(TD-NaCl；20mM Tris乙酸鹽，pH 7.6、10mM乙酸鎂、20% DMF及200mM NaCl)；高分子量緩衝劑(HMW；20mM Tris乙酸鹽，pH 7.6及10mM乙酸鎂)；HEPES(50mM HEPES，pH 7.6、10mM乙酸鎂、20% DMF)；HEPES-DMSO(50mM HEPES pH 7.6、10mM乙酸鎂及20% DMSO)；HEPES-DMSO-Co(50mM HEPES，pH 7.6、20% DMSO及20mM CoCl₂)及HEPES-DMSO-Mn(50mM HEPES，pH 7.6、20% DMSO及20mM錳(Mn))。每日製備新的包括CoCl₂之標籤化緩衝劑。

對於各庫，藉由以50μL之總反應體積混合20μL蠟狀芽孢桿菌基因體DNA(50ng)、25μL 2×標籤化緩衝劑及5μL酶(10×MBP-Mos1)進行標籤化反應。在30℃下培育反應物60分鐘。在標籤化反應之後，根據標準Nextera^TM樣品製備方案加工樣品。使用Illumina's SBS(合成定序法)化學方法在MiSeq裝置上對庫定序。定序操作為2×71循環。

圖20顯示在使用不同標籤化緩衝劑製備之MBP-Mos1標籤化庫中之平均讀數總數及平均多樣性之柱狀圖1000。讀數總數為來自流動細胞之讀數的總數。多樣性為庫中之獨特分子數且用作庫複雜度之示度。圖上之每一對條表示標籤化庫。重複實驗三次(n=3)。首先兩個圖條EZTn5-std-bcereus及NexteraV2-30C分別為使用Tn5及標準緩衝劑調配物在55℃及30℃下製備之比較庫。用於標籤化反應的使用MBP-Mos1製備之庫藉由「酶-酶濃度-緩衝劑」指示。舉例而言，第三對圖條標記為「MBPMos1-100μM-TD」且指示使用標準標籤化緩衝劑(TD)中100μM之最終濃度下之MBP-Mos1製備之庫。資料顯示不同緩衝劑對藉由Mos1標籤化在相對相同數目或定序讀數下製備之庫之多樣性的影響。特定言之，HEPES-DMSO-Mn緩衝劑幫助增加庫之多樣性。

圖21顯示MBP-Mos1標籤化庫中之GC及AT丟失之柱狀圖1100。GC及AT丟失可分別定義為基因體中自標籤化庫除去(不存在)之GC富集區及AT富集區之百分比。庫如圖20中所述來表示。資料顯示使用EZTn5及NexteraV2(亦即Tn5轉位酶)製備之庫基本上無GC丟失，但分別自標籤化庫除去約7%及約5% AT富集區。使用MBP-Mos1及標準標籤化緩衝劑(MBPMos1-100μM-TD)製備之庫基本上無AT丟失，但自標籤化庫除去約2%或2%以下之GC富集區。MBP-Mos1標籤化庫中之GC丟失%由標籤化緩衝劑之組成實現。GC丟失%在使用HMW、HEPES、HEPES-DMSO、HEPES-DMSO-Co及HEPES-DMSO-Mn緩衝劑製備之MBP-Mos1標籤化庫中增加。

圖22A、22B、22C及22D分別顯示Mos1-HEPES庫中之序列含量之傾向圖1200、Mos1-HEPES-DMSO庫中之序列含量之傾向圖1230、Mos1-HEPES-DMSO-Co庫中之序列含量之傾向圖1240及Mos1-HEPES-DMSO-Mn庫中之序列含量之傾向圖1250。傾向圖1200、1230、1240及1250各顯示為依據循環數之A含量之曲線的曲線1210、依據循環數之C含量之曲線的曲線1215、為依據循環數之G含量之曲線的曲線1220及為依據循環數之T含量之曲線的曲線1225。

參看圖22A及22B，資料顯示經Mos1-HEPES及Mos1-HEPES-DMSO標籤化庫中之SBS之首先少數循環觀測到Mos1序列傾向。在第一SBS循環中，偵測之T在整個流動細胞中為約100%。在第二SBS循環中，偵測之A在整個流動細胞中為約100%。在約4個循環之後，序列傾向減小且A、T、C及G含量反映預期基因體組成。

參看圖22C及22D，資料亦顯示經Mos1-HEPES-DMSO-Co及Mos1-HEPES-DMSO-Mn標籤化庫中之SBS之首先少數循環觀測到Mos1序列傾向，該庫為使用分別藉由鈷(Co)或錳(Mn)置換鎂(Mg)之標籤化緩衝劑製備之庫。同樣，在約4個循環之後，序列傾向減小且A、T、C及G含量反映預期基因體組成。然而，在Mos1-HEPES-DMSO-Co及Mos1-HEPES-DMSO-Mn庫中，曲線1210(亦即A)及曲線1225(亦即T)在第1循環及第2循環觀測到朝向預期基因體組成之移位。朝向預期基因體組成之移位在Mos1-HEPES-DMSO-Mn庫中更明顯。

實施例7 TS-Tn5059庫製備及外顯子組富集方案

在一個具體實例中，本發明方法提供一種製備及富集基於Tn5轉位體之外顯子組庫之流線型工作流。

圖23說明製備及富集用於外顯子組定序之基因體DNA庫之方法1260之實施例之流程圖。方法1260使用TS-Tn5059轉位體及對於當前Nextera®快速捕獲方案之某些方法步驟之修改以提供針對一定範圍之DNA輸入量及定序度量值的經改善庫產率。舉例而言，方法1260使用「雙面」固相可逆固定(SPRI)方案(Agencourt AMPure XP珠粒；Beckman Coulter 公司)以純化標籤化DNA且在PCR擴增之前提供第一DNA片段尺寸選擇步驟及第二DNA片段尺寸選擇步驟。在另一實施例中，預濃縮方法用於在外顯子組富集之前濃縮標籤化DNA庫。方法1260包括(但不限於)以下步驟。

在步驟1270中，基因體DNA藉由轉位體標籤化(標記及片段化)。轉位體同時將基因體DNA片段化且將接附子序列添加至末端，允許藉由PCR之後續擴增。在一個實施例中，轉位體為TS-Tn5059。在完成標籤化反應時，將標籤化終止緩衝劑添加至反應中。標籤化終止緩衝劑可經修飾以確保TS-Tn5059轉位體複合物自標籤化DNA之足夠變性(例如終止緩衝劑中之SDS之濃度自0.1%增加至1.0%SDS以及高熱量。

在步驟1275中，進行第一清除以純化來自轉位體之標籤化DNA且提供第一DNA片段尺寸選擇步驟。DNA片段尺寸可藉由改變SPRI珠粒與DNA之體積比(例如1×SPRI=1：1體積SPRI：DNA)選擇。舉例而言，在第一尺寸選擇中，選擇SRPI珠粒與DNA之體積比以結合大於某一尺寸之DNA片段(亦即自樣品移除較大DNA片段)，同時將小於某一尺寸之DNA片段保持於上清液中。將其中具有尺寸選擇DNA片段之上清液轉移至清潔反應容器中以用於後續處理。可丟棄在上面具有較大DNA片段之SPRI珠粒。在一個具體實例中，SPRI珠粒之濃度可在0.8×至1.5×之範圍內變化。在一個具體實例中，SPRI珠粒之濃度為0.8×。

在步驟1280中，進行第二清除以進一步選擇某一尺寸範圍內之DNA片段。舉例而言，選擇SPRI珠粒與DNA之體積比以結合大於某一尺寸之DNA片段(亦即所需尺寸範圍內之DNA片段結合至SPRI珠粒)。較小DNA片段保持於上清液中且丟棄。隨後自SPRI珠粒洗提結合DNA片段以用於後續處理。

在視情況存在之步驟1285中，測定DNA片段尺寸分佈。DNA片段尺寸分佈例如使用生物分析儀測定。

在步驟1290中，純化標籤化DNA經由有限循環PCR程式擴增。PCR步驟亦添加指數1(i7)及指數2(i5)及定序，以及後續叢集產生及定序所需的常用接附子(P5及P7)。由於雙面SPRI方法(亦即步驟1275及1280)用於選擇所需DNA片段尺寸範圍，僅所需尺寸範圍內之標籤化DNA片段可用於PCR擴增。因此，庫產率顯著增加且後續定序度量值(例如讀數富集%)經提高。

在步驟1295中，使用基於珠粒之純化方法純化擴增標籤化DNA庫。

在視情況存在之步驟1300中，測定PCR後的DNA片段尺寸分佈。DNA片段尺寸分佈例如使用生物分析儀測定。

在步驟1310中，標籤化DNA庫在用於外顯子組富集之後續雜交之前預濃縮。舉例而言，標籤化DNA庫自約50μl預濃縮至約10μL。由於標籤化DNA庫經預濃縮，雜交動力學較快且雜交時間減少。

在步驟1320中，進行用於外顯子組富集之第一雜交。舉例而言，DNA庫與靶向關注區之生物素標記捕獲探針混合。DNA庫在約95℃下變性約10分鐘且在約58℃下持續約30分鐘雜交至探針，總反應時間為約40分鐘。

在步驟1325中，抗生蛋白鏈菌素珠粒用於捕獲雜交至靶向關注區之生物素標記探針。兩個加熱洗滌程序用於自珠粒移除非特異性結合DNA。隨後自珠粒洗提富集庫且準備用於第二輪雜交。

在步驟1330中，使用與第一雜交相同之探針及阻斷劑進行用於外顯子組富集之第二雜交。舉例而言，來自步驟155之經洗提DNA庫在約95℃下變性約10分鐘且在約58℃下持續約30分鐘雜交，總反應時間為約40分鐘。第二雜交用於確保捕獲區之高特異性。

在步驟1335中，抗生蛋白鏈菌素珠粒用於捕獲雜交至靶向關注區之生物素標記探針。兩個加熱洗滌程序用於自珠粒移除非特異性結合DNA。隨後自珠粒洗提外顯子組富集庫且藉由為定序做準備之十個循環的PCR擴增。

在步驟1340中，使用基於珠粒之純化方案純化外顯子組富集捕獲樣品(亦即外顯子組富集DNA庫)。

在步驟1345中，外顯子組富集DNA庫經PCR擴增以用於定序。

在步驟1350中，使用基於珠粒之純化方案視情況純化擴增富集DNA庫。舉例而言，1×SPRI珠粒方案用於移除可能干擾後續叢集擴增及定序之非所需產物(例如過量引子)。

方法100提供在約11小時內之庫製備及外顯子組富集。若省去視情況存在之步驟1285及1300，則方法1260提供在約9小時內之庫製備及外顯子組富集。

實施例8 TS-Tn5059插入傾向

轉位酶可在標籤化反應中具有某一插入位點(DNA序列)傾向。DNA序列傾向可造成基因體之某些區(例如GC rich或AT富集區)自標籤化庫丟失。舉例而言，Tn5轉位酶具有對於基因體之GC富集區之某一傾向；因此，基因體之AT區可在Tn5標籤化庫中丟失。為提供基因體之更完整覆蓋度，需要最小序列傾向。

為評估TS-Tn5059轉位體對庫輸出及定序度量值之影響，使用用於全基因體定序及蠟狀芽孢桿菌基因體DNA之標準Nextera^TM DNA庫製備套組製備TS-Tn5059標籤化DNA庫。以40nM之最終濃度使用TS-Tn5059。使用25nM NexteraV2轉位體之標準反應條件製備參考對照庫。藉由合成定序法(SBS)評估庫。

圖24A顯示使用TS-Tn5059轉位體製備之標籤化蠟狀芽孢桿菌基因體DNA庫中之覆蓋度之曲線圖1400。隨著GC含量增加，TS-Tn5059轉位體變得對增加之傾向水準具抗性。圖24B顯示使用NexteraV2轉位體製備之標籤化蠟狀芽孢桿菌基因體DNA庫中之覆蓋度之曲線圖1450。圖24B表明隨著GC含量增加，GC富集區之Nextera V2覆蓋度變得偏斜，具有增加傾向。資料顯示相比於使用NexteraV2製備之標籤化庫，使用TS-Tn5059製備之標籤化DNA庫具有跨越寬GC/AT範圍之經改善及更均勻覆蓋度以及更低插入傾向。

圖25A顯示使用TS-Tn5059轉位體製備之標籤化蠟狀芽孢桿菌基因體DNA庫中之間隙位置及間隙長度之曲線圖1500。圖25B顯示使用NexteraV2轉位體製備之標籤化蠟狀芽孢桿菌基因體標籤化DNA庫中之間隙位置及間隙長度之曲線圖。TS-Tn5059標籤化庫中之間隙數目為27。 NexteraV2標籤化庫中之間隙數目為208。資料顯示相比於使用NexteraV2轉位體製備之標籤化庫，使用TS-Tn5059轉位體製備之標籤化DNA庫具有更均勻覆蓋度以及更少間隙。

實施例8 TS-Tn5059 DNA輸入耐受度

製備標籤化DNA庫使用酶促DNA片段化步驟(例如轉位體介導標籤化)且因此，相比於例如機械片段化方法，可對DNA輸入較敏感。在一個實例中，當前Nextera®快速捕獲富集方案已關於輸入50ng之總基因體DNA最佳化。基因體DNA之較高質量輸入可導致不完全標籤化及較大插入尺寸，其可影響後續富集效能。標籤化反應中之基因體DNA之較低質量輸入或低品質基因體DNA可產生小於預期之插入尺寸。較小插入物可在後續清除步驟期間損失且導致較低庫多樣性。

為評估不同DNA輸入量對片段(插入)尺寸分佈之影響，使用各種酶濃度下之各種量之輸入基因體DNA製備TS-Tn5059標籤化DNA庫且將片段尺寸相比於關於其他轉位酶獲得之片段尺寸，該轉位酶之活性標準化為40nM TS-Tn5059及25ng基因體DNA輸入之活性。

如圖26及27中所示，藉由40nM TS-Tn5059、標準化TDE1(Tn5型式-1)及標準化TS-Tn5及使用25ng人類基因體DNA產生之片段之尺寸分佈類似。

然而，TS-Tn5059顯示DNA輸入耐受度在較高酶濃度及經廣泛範圍之輸入DNA量增加。圖28顯示使用一系列DNA輸入量製備之標籤化基因體DNA庫中之片段尺寸分佈之生物分析儀跡線之圖1600。藉由標籤化、1.8×SPRI清除繼之以生物分析儀追蹤製備240nM之TS-Tn5059標籤化庫。使用當前Nextera®快速捕獲套組(「Nextera」)及Agilent QXT套組(「Agilent QXT」)製備參考對照庫。使用25、50、75及100ng之蠟狀芽孢桿菌基因體DNA製備標籤化庫。資料顯示相比於使用Nextera或Agilent QXT轉位體製備之庫，使用TS-Tn5059轉位體製備之標籤化DNA庫具有跨越25至100ng DNA輸入範圍更一致之片段尺寸分佈。隨著DNA輸入量自25ng增加至100ng，TS-Tn5059標籤化庫中之標籤化DNA之產率增加，同時片段尺寸分佈保持實質上相同。相比之下，在75ng及100ng DNA輸入量下，Nextera及Agilent QXT標籤化庫顯示DNA片段尺寸分佈實質上移位至較大片段尺寸。

圖29A顯示藉由第一使用者使用5ng至100ng之改變輸入量之人類Coriel DNA製備之TS-Tn5059標籤化庫中之片段尺寸分佈之生物分析儀跡線之曲線圖1700。圖29B顯示藉由第二使用者製備之TS-Tn5059標籤化庫中之片段尺寸分佈之生物分析儀跡線之曲線圖1750。使用5、10、25、50、75及100ng之蠟狀芽孢桿菌基因體DNA製備標籤化庫。圖29A之曲線圖1700及圖29B之曲線圖1750均顯示使用5ng之DNA輸入量製備之標籤化庫中之片段尺寸分佈之線1710、使用10ng之DNA輸入量製備之標籤化庫中之片段尺寸分佈之線1715、使用25ng之DNA輸入量製備之標籤化庫中之片段尺寸分佈之線1720、使用50ng之DNA輸入量製備之標籤化庫中之片段尺寸分佈之線1725、使用75ng之DNA輸入量製備之標籤化庫中之片段尺寸分佈之線1730及使用100ng之DNA輸入量製備之標籤化庫中之片段尺寸分佈之線1735。資料顯示TS-Tn5059標籤化DNA庫中之片段尺寸分佈在5至100ng的範圍內之DNA輸入量中一致。對於不同使用者觀測到片段尺寸分佈之一致性。

在另一實施例中，表3顯示跨越5至200ng之範圍之DNA輸入量的TS-Tn5059標籤化DNA庫中之中值庫插入尺寸。

在另一實施例中，表4顯示使用25、50、75及100ng DNA輸入量製備之TS-Tn5059標籤化DNA庫之庫插入尺寸及外顯子組富集定序度量值。資料顯示讀數富集百分比(%)為約80%。使用當前Nextera®快速捕獲富集方案製備之標籤化庫之讀數富集%為約60%(資料未示出)。資料亦顯示跨越15ng至100ng之DNA輸入範圍之一致插入尺寸。

在另一實施例中，表5顯示TS-Tn5059標籤化庫中跨越25ng至100ng之DNA輸入範圍之預富集庫產率。

在另一實施例中，表6顯示TS-Tn5059標籤化DNA庫之外顯子組富集定序度量值。開始於50ng之輸入DNA，使用500ng、625ng及750ng輸入量之用於外顯子組富集之庫DNA製備庫。資料顯示外顯子組富集度量值跨越預富集庫輸入量之範圍(亦即500ng至750ng)一致。

在另一實施例中，表7顯示使用當前Nextera®快速捕獲富集雜交方案(「NRC」)及圖23之方法1260之富集步驟1310至1350製備之標籤化DNA庫之外顯子組富集定序度量值。資料顯示相比於使用當前Nextera®快速捕獲富集方案(「NRC」)中之雜交方案製備之庫，外顯子組富集度量值在使用圖23之方法1260製備之TS-Tn5059標籤化庫中經提高及/或得以維持。

在獨立實驗中，TS-Tn5059表明相比於標準化至相同濃度之Tn5型式-1及TS-Tn5轉位酶在較高濃度(標準化至6×濃度)下增加之DNA輸入耐受度。結果顯示於圖30-33中。6×「標準化」濃度下之Tn5型式1(圖 30)及TS-Tn5(圖31)均在gDNA輸入量在25-100ng之間改變之情況下顯示片段尺寸分佈移位。相比之下，6×標準化濃度下之TS-Tn5059在10-100ng之間的DNA輸入量下未顯示顯著尺寸移位(圖32)。片段尺寸分佈在將gDNA輸入增加至200-500ng時開始移位(圖33)。TS-Tn5059之增加之DNA輸入耐受度之結果概述於下表8中。

因此，對於2.4之比率(nM TS-Tn5059：ng輸入DNA)下之TS-Tn5059，不存在表明DNA輸入耐受度增加之尺寸移位。

在整個本申請案中，已參考各種公開案、專利及/或專利申請案。此等公開案之揭示內容特此以全文引用之方式併入本申請案中。

術語包含在本文中意欲為開放的，不僅包括所述要素，且另外包涵任何其他要素。

已描述多個具體實例。儘管如此，應瞭解，可進行各種修改。因此，其他具體實例在以下申請專利範圍之範疇內。

圖1A為顯示Tn5轉位酶(1MUH)、Hermes轉位酶(2BW3)、HIV整合酶(1ITG)、Mu轉位酶(1BCM)及Mos1轉位酶(3HOS)之催化核心域之結構比對的示意圖。顯示之編號表示Tn5轉位酶中之胺基酸殘基之編號。

圖1B為顯示Tn5轉位酶(1MUH，粉紅色)、Hermes轉位酶(2BW3，黑色)、HIV整合酶(1ITG，茶色)、Mu轉位酶(1BCM)及Mos1轉位酶(3HOS，黃色)之催化核心域之結構比對的示意圖。Tn5轉位酶W125位置以棒狀圖示顯示。

圖2為顯示D248Y突變Tn5轉位酶相比於Tn5對照組之經改變序列插入傾向之IVC曲線圖。

圖3為顯示D119L突變Tn5轉位酶相比於Tn5對照組之經改變序列插入傾向之IVC曲線圖。

圖4為顯示W125M突變Tn5轉位酶相比於Tn5對照組之經改變序列插入傾向之IVC曲線圖。

圖5為顯示ia248V插入突變Tn5轉位酶相比於Tn5對照組之經改變序列插入傾向之IVC曲線圖。

圖6為顯示K120Y、K120F及K120W Tn5轉位酶插入突變體相比於Tn5對照組之經改變序列插入傾向之IVC曲線圖。

圖7為顯示三種突變Tn5轉位酶相比於Tn5對照組之經改變序列插入傾向之IVC曲線圖。

圖8A為顯示相比於Tn5對照組的藉由三種突變Tn5轉位酶產生之蠟狀芽孢桿菌庫中之AT/GC丟失之圖。圖8B為顯示相比於Tn5對照的藉由三種突變Tn5轉位酶測試之蠟狀芽孢桿菌庫之估計之庫大小之圖。

圖9A為顯示相比於Tn5對照組的藉由兩種突變Tn5轉位酶測試之庫中之快速捕獲富集實驗中之覆蓋度均一性之圖。圖9B為顯示相比於Tn5對照組的藉由兩種突變Tn5轉位酶產生之庫中之快速捕獲富集實驗中之10×及20×目標覆蓋度及平均目標覆蓋度之圖。

圖10A為顯示相比於Tn5對照組的藉由兩種突變Tn5轉位酶產生之庫中之快速捕獲富集實驗中之通過獨特讀數之過濾的%及混合選擇庫尺寸之圖。圖10B為顯示相比於Tn5對照組的藉由兩個突變Tn5轉位酶產生之庫中之快速捕獲富集實驗中達到10×、20×及30×覆蓋度之罰分之圖。

圖11顯示使用不同標籤化(tagmentation)緩衝劑製備之TS-Tn5059及TS-Tn5標籤化DNA庫中之獨特分子數之柱狀圖。

圖12顯示使用不同標籤化緩衝劑製備之TS-Tn5059及TS-Tn5標籤化DNA庫中之GC丟失%之柱狀圖。

圖13顯示使用不同標籤化緩衝劑製備之TS-Tn5059及TS-Tn5標籤化DNA庫中之AT丟失%之柱狀圖。

圖14顯示使用標準緩衝劑(TD)及鈷緩衝劑(Co)調配物製備之TS-Tn5059庫中之片段尺寸分佈之生物分析儀跡線之曲線圖。

圖15顯示使用鈷-DMSO(Co-DMSO)NF2及HMW緩衝劑調配物製備之TS-Tn5059庫中之片段尺寸分佈之生物分析儀跡線之曲線圖。

圖16顯示使用標準緩衝劑調配物(TD)及鈷緩衝劑(Co)製備之TS-Tn5庫中之片段尺寸分佈之生物分析儀跡線之曲線圖。

圖17顯示使用鈷-DMSO(Co-DMSO)、NF2及HMW緩衝劑調配物製備之TS-Tn5庫中之片段尺寸分佈之生物分析儀跡線之曲線圖。

圖18A、18B、18C及18D分別顯示TS-Tn5庫中之序列含量之傾向圖、TS-TN5-Co庫中之序列含量之傾向圖、TS-Tn5-Co-DMSO庫中之序列含量之傾向圖及TS-Tn5-NF2庫中之序列含量之傾向圖。

圖19A、19B、19C及19D分別顯示TS-Tn5059庫中之序列含量之傾向圖、TS-TN5059-Co庫中之序列含量之傾向圖、TS-Tn5059-Co-DMSO庫中之序列含量之傾向圖及TS-Tn5059-NF2庫中之序列含量之傾向圖。

圖20顯示在使用不同標籤化緩衝劑製備之MBP-Mos1標籤化庫中之平均讀數總數及平均多樣性之柱狀圖。

圖21顯示MBP-Mos1標籤化庫中之GC及AT丟失之柱狀圖。

圖22A、22B、22C及22D分別顯示Mos1-HEPES庫中之序列含量之傾向圖、Mos1-HEPES-DMSO庫中之序列含量之傾向圖、Mos1-HEPES-DMSO-Co庫中之序列含量之傾向圖及Mos1-HEPES-DMSO-Mn庫中之序列含量之傾向圖。

圖23說明製備及富集用於外顯子組定序之基因體DNA庫之方法之實施例之流程圖。

圖24A顯示使用TS-Tn5059轉位體製備之標籤化蠟狀芽孢桿菌基因體DNA庫中之覆蓋度之曲線圖。

圖24B顯示使用NexteraV2轉位體製備之標籤化蠟狀芽孢桿菌基因體DNA庫中之覆蓋度之曲線圖。

圖25A顯示使用TS-Tn5059轉位體製備之標籤化蠟狀芽孢桿菌基因體DNA庫中之間隙位置及間隙長度之曲線圖。

圖25B顯示使用NexteraV2轉位體製備之標籤化蠟狀芽孢桿菌基因體標籤化DNA庫中之間隙位置及間隙長度之曲線圖。

圖26顯示對於25ng人類gDNA使用針對在40nM(1×標準化濃度)下之TS-Tn5059標準化之TDE1(Tn5型式-1)及TS-Tn5製備之標籤化基因體DNA庫中之片段尺寸分佈之生物分析儀跡線之圖。

圖27顯示使用25ng人類gDNA使用針對在40nM(1×標準化濃度)下之TS-Tn5059標準化之TDE1(Tn5型式-1)及TS-Tn5製備之標籤化基因體DNA庫中之尺寸分佈之分析。

圖28顯示使用一系列DNA輸入量製備之標籤化基因體DNA庫中之片段尺寸分佈之生物分析儀跡線之圖。

圖29A顯示藉由第一使用者；及使用Coriel人類DNA製備之TS-Tn5059標籤化庫中之片段尺寸分佈之生物分析儀跡線之曲線圖。

圖29B顯示藉由第二使用者及使用Coriel人類DNA製備之TS-Tn5059標籤化庫中之片段尺寸分佈之生物分析儀跡線之曲線圖。

圖30顯示藉由使用25ng-100ng gDNA之6×「標準化」濃度下之TDE1製備之Tn5型式1(TDE1)標籤化庫中之片段尺寸分佈之生物分析儀跡線之曲線圖。

圖31顯示藉由使用25ng-100ng gDNA之6×「標準化」濃度下之TS-Tn5製備之TS-Tn5標籤化庫中之片段尺寸分佈之生物分析儀跡線之曲線圖。

圖32顯示藉由使用10ng-100ng gDNA之6×「標準化」濃度下之TS-Tn5059製備之TS-Tn5059標籤化庫中之片段尺寸分佈之生物分析儀跡線之曲線圖。

圖33顯示藉由使用更寬範圍之gDNA(5ng-500ng)之6×「標準化」濃度下之TS-Tn5059製備之TS-Tn5059標籤化庫中之片段尺寸分佈之生物分析儀痕量之曲線圖。

<110> 伊路米納有限公司

<120> 用於改善插入序列傾向之經修飾的轉位酶

<130> IP-1198-TW

<160> 26

<170> PatentIn 3.5版

<210> 1

<211> 476

<212> PRT

<213> 未知

<220>

<223> 轉位酶Tn5

<400> 1

<210> 2

<211> 476

<212> PRT

<213> 未知

<220>

<223> 轉位酶Tn5

<220>

<221> 變異體

<222> (248)..(248)

<223> X=Y,T,K,S,L,A,W,P,G,R,F,H

<400> 2

<210> 3

<211> 476

<212> PRT

<213> 未知

<220>

<223> 轉位酶Tn5

<220>

<221> 變異體

<222> (119)..(119)

<223> X=L,M,S,A,V

<400> 3

<210> 4

<211> 476

<212> PRT

<213> 未知

<220>

<223> 轉位酶Tn5

<400> 4

<210> 5

<211> 477

<212> PRT

<213> 未知

<220>

<223> 轉位酶Tn5

<400> 5

<210> 6

<211> 476

<212> PRT

<213> 未知

<220>

<223> 轉位酶Tn5

<220>

<221> 變異體

<222> (120)..(120)

<223> X=Y,F,W,E

<400> 6

<210> 7

<211> 476

<212> PRT

<213> 未知

<220>

<223> 轉位酶Tn5

<220>

<221> 變異體

<222> (119)..(119)

<223> X=L,M,S,A,V

<220>

<221> 變異體

<222> (120)..(120)

<223> X=Y,F,W,E

<220>

<221> 變異體

<222> (248)..(248)

<223> X=Y,T,K,S,L,A,W,P,G,R,F,H

<400> 7

<210> 8

<211> 476

<212> PRT

<213> 未知

<220>

<223> 轉位酶Tn5

<400> 8

<210> 9

<211> 476

<212> PRT

<213> 未知

<220>

<223> 轉位酶Tn5

<400> 9

<210> 10

<211> 476

<212> PRT

<213> 未知

<220>

<223> 轉位酶Tn5

<400> 10

<210> 11

<211> 476

<212> PRT

<213> 未知

<220>

<223> 轉位酶Tn5

<400> 11

<210> 12

<211> 476

<212> PRT

<213> 未知

<220>

<223> 轉位酶Tn5

<220>

<221> 變異體

<222> (248)..(248)

<223> X=Y,T,K,S,L,A,W,P,G,R,F,H

<400> 12

<210> 13

<211> 476

<212> PRT

<213> 未知

<220>

<223> 轉位酶Tn5

<220>

<221> 變異體

<222> (119)..(119)

<223> X=L,M,S,A,V

<400> 13

<210> 14

<211> 476

<212> PRT

<213> 未知

<220>

<223> 轉位酶Tn5

<400> 14

<210> 15

<211> 477

<212> PRT

<213> 未知

<220>

<223> 轉位酶Tn5

<400> 15

<210> 16

<211> 476

<212> PRT

<213> 未知

<220>

<223> 轉位酶Tn5

<220>

<221> 變異體

<222> (120)..(120)

<223> X=Y,F,W,E

<400> 16

<210> 17

<211> 476

<212> PRT

<213> 未知

<220>

<223> 轉位酶Tn5

<220>

<221> 變異體

<222> (119)..(119)

<223> X=L,M,S,A,V

<220>

<221> 變異體

<222> (120)..(120)

<223> X=Y,F,W,E

<220>

<221> 變異體

<222> (248)..(248)

<223> X=Y,T,K,S,L,A,W,P,G,R,F,H

<400> 17

<210> 18

<211> 476

<212> PRT

<213> 未知

<220>

<223> 轉位酶Tn5

<400> 18

<210> 19

<211> 476

<212> PRT

<213> 未知

<220>

<223> 轉位酶Tn5

<400> 19

<210> 20

<211> 476

<212> PRT

<213> 未知

<220>

<223> 轉位酶Tn5

<400> 20

<210> 21

<211> 10

<212> PRT

<213> 未知

<220>

<223> 轉位酶Tn5

<220>

<221> 變異體

<222> (1)..(1)

<223> x=W,R,K,P,T

<220>

<221> 變異體

<222> (2)..(2)

<223> x=W,N,V,K,M

<220>

<221> 變異體

<222> (3)..(3)

<223> x=V,F,I,T,L

<220>

<221> 變異體

<222> (4)..(4)

<223> x=H,L,W,C

<220>

<221> 變異體

<222> (5)..(5)

<223> x=S,G,V,F

<220>

<221> 變異體

<222> (6)..(6)

<223> x=V,A,W

<220>

<221> 變異體

<222> (7)..(7)

<223> x=L,T,V,Q,W

<220>

<221> 變異體

<222> (8)..(8)

<223> x=L,H,D

<220>

<221> 變異體

<222> (9)..(9)

<223> x=L,H,V

<220>

<221> 變異體

<222> (10)..(10)

<223> x=E,Y,A,K,Q

<400> 21

<210> 22

<211> 852

<212> DNA

<213> 大腸桿菌

<400> 22

<210> 23

<211> 283

<212> PRT

<213> 大腸桿菌

<400> 23

<210> 24

<211> 2283

<212> DNA

<213> 未知

<220>

<223> TS-Tn5核酸序列

<400> 24

<210> 25

<211> 760

<212> PRT

<213> 未知

<220>

<223> TS-Tn5融合蛋白胺基酸序列

<400> 25

<210> 26

<211> 760

<212> PRT

<213> 未知

<220>

<223> TS-Tn突變蛋白

<400> 26

Claims

一種相對於野生型Tn5轉位酶經修飾之突變Tn5轉位酶，該突變轉位酶包含位置Asp248處之突變。
如申請專利範圍第1項之轉位酶，其中位置Asp248處之該突變為取代突變。
如申請專利範圍第2項之轉位酶，其中位置Asp248處之該取代突變包含變成選自由以下組成之群的殘基之突變：Tyr、Thr、Lys、Ser、Leu、Ala、Trp、Pro、Gln、Arg、Phe及His。
如申請專利範圍第1項之轉位酶，其中位置Asp248處之該突變為位置Asp248之後的插入突變。
如申請專利範圍第4項之轉位酶，其中該插入突變包含在位置Asp248之後插入疏水性殘基。
如專利申請範圍第5項之轉位酶，其中該插入突變包含在位置Asp248之後插入纈胺酸殘基。
如申請專利範圍第1項至第6項中任一項之轉位酶，其中該轉位酶進一步包含功能上等效於該Tn5轉位酶胺基酸序列中之Glu54及/或Met56及/或Leu372之位置處之取代突變。
如申請專利範圍第7項之轉位酶，其中該轉位酶包含與該Tn5轉位酶胺基酸序列中之Glu54Lys及/或Met56Ala及/或Leu372Pro同源之取代突變。
一種相對於野生型Tn5轉位酶經修飾之突變Tn5轉位酶，該突變轉位酶包含位置Asp119處之突變。
如申請專利範圍第9項之轉位酶，其中位置Asp119處之該突變為取代突變。
如申請專利範圍第10項之轉位酶，其中位置Asp119處之該取代突變包含變成疏水性殘基之突變。
如申請專利範圍第10項之轉位酶，其中位置Asp119處之該取代突變包含變成親水性殘基之突變。
如申請專利範圍第10項之轉位酶，其中位置Asp119處之該取代突變包含變成選自由以下組成之群的殘基之突變：Leu、Met、Ser、Ala及Val。
如申請專利範圍第9項至第13項中任一項之轉位酶，其中該轉位酶進一步包含功能上等效於該Tn5轉位酶胺基酸序列中之Glu54及/或Met56及/或Leu372之位置處之取代突變。
如申請專利範圍第14項之轉位酶，其中該轉位酶包含與該Tn5轉位酶胺基酸序列中之Glu54Lys及/或Met56Ala及/或Leu372Pro同源之取代突變。
一種相對於野生型Tn5轉位酶經修飾之突變Tn5轉位酶，該突變轉位酶包含位置Trp125處之突變。
如申請專利範圍第16項之轉位酶，其中位置Trp125處之該突變為取代突變。
如申請專利範圍第17項之轉位酶，其中位置Trp125處之該取代突變包含變成甲硫胺酸殘基之突變。
如申請專利範圍第16項至第18項中任一項之轉位酶，其中該轉位酶進一步包含功能上等效於該Tn5轉位酶胺基酸序列中之Glu54及/或Met56 及/或Leu372之位置處之取代突變。
如申請專利範圍第19項之轉位酶，其中該轉位酶包含與該Tn5轉位酶胺基酸序列中之Glu54Lys及/或Met56Ala及/或Leu372Pro同源之取代突變。
一種相對於野生型Tn5轉位酶經修飾之突變Tn5轉位酶，該突變轉位酶包含位置Lys120處之突變。
如申請專利範圍第21項之轉位酶，其中位置Lys120處之該突變為取代突變。
如申請專利範圍第22項之轉位酶，其中位置Lys120處之該取代突變包含變成大型芳族殘基之突變。
如申請專利範圍第22項之轉位酶，其中位置Lys120處之該取代突變包含變成選自由以下組成之群的殘基之突變：Tyr、Phe、Trp及Glu。
如申請專利範圍第21項至第24項中任一項之轉位酶，其中該轉位酶進一步包含功能上等效於該Tn5轉位酶胺基酸序列中之Glu54及/或Met56及/或Leu372之位置處之取代突變。
如申請專利範圍第25項之轉位酶，其中該轉位酶包含與該Tn5轉位酶胺基酸序列中之Glu54Lys及/或Met56Ala及/或Leu372Pro同源之取代突變。
一種相對於野生型Tn5轉位酶經修飾之突變Tn5轉位酶，該突變轉位酶包含位置Lys212及/或Pro214及/或Ala338處之突變。
如申請專利範圍第27項之轉位酶，其中位置Lys212及/或Pro214及/或Ala338處之該一或多個突變為取代突變。
如申請專利範圍第28項之轉位酶，其中位置Lys212處之該取代突變包含變成精胺酸之突變。
如申請專利範圍第28項之轉位酶，其中位置Pro214處之該取代突變包含變成精胺酸之突變。
如申請專利範圍第28項之轉位酶，其中位置Ala338處之該取代突變包含變成纈胺酸之突變。
如申請專利範圍第27項至第31項中任一項之轉位酶，其中該轉位酶進一步包含Gly251處之取代突變。
如申請專利範圍第32項之轉位酶，其中位置Gly251處之該取代突變包含變成精胺酸之突變。
如申請專利範圍第27項至第33項中任一項之轉位酶，其中該轉位酶進一步包含功能上等效於該Tn5轉位酶胺基酸序列中之Glu54及/或Met56及/或Leu372之位置處之取代突變。
如申請專利範圍第34項之轉位酶，其中該轉位酶包含與該Tn5轉位酶胺基酸序列中之Glu54Lys及/或Met56Ala及/或Leu372Pro同源之取代突變。
一種相對於野生型Tn5轉位酶經修飾之突變Tn5轉位酶，該突變轉位酶包含位置Glu146及/或Glu190及/或Gly251處之突變。
如申請專利範圍第36項之轉位酶，其中位置Glu146及/或Glu190及/或Gly251處之該一或多個突變為取代突變。
如申請專利範圍第37項之轉位酶，其中位置Glu146處之該取代突變包含變成麩醯胺酸之突變。
如申請專利範圍第37項之轉位酶，其中位置Glu190處之該取代突變包含變成甘胺酸之突變。
如申請專利範圍第37項之轉位酶，其中位置Gly251處之該取代突變包含變成精胺酸之突變。
如申請專利範圍第36項至第40項中任一項之轉位酶，其中該轉位酶進一步包含功能上等效於該Tn5轉位酶胺基酸序列中之Glu54及/或Met56及/或Leu372之位置處之取代突變。
如申請專利範圍第41項之轉位酶，其中該轉位酶包含與該Tn5轉位酶胺基酸序列中之Glu54Lys及/或Met56Ala及/或Leu372Pro同源之取代突變。
一種突變Tn5轉位酶，其包含SEQ ID NO：2-10、12-20及25-26中之任一者之胺基酸序列。
一種經修飾轉位酶，其包含融合至多肽融合域之野生型或突變轉位酶。
如申請專利範圍第44項之經修飾轉位酶，其中該多肽融合域融合至該轉位酶之N端。
如申請專利範圍第44項之經修飾轉位酶，其中該多肽融合域融合至該轉位酶之C端。
如申請專利範圍第44項之經修飾轉位酶，其中該多肽融合域包含純化標籤。
如申請專利範圍第44項之經修飾轉位酶，其中該多肽融合域包含增加溶解度之標籤。
如申請專利範圍第44項之經修飾轉位酶，其中該多肽融合域包含選自以下之域：麥芽糖結合蛋白(MBP)、延伸因子Ts(Tsf)、5-甲基胞嘧啶結合域及蛋白A。
一種核酸分子，其編碼如申請專利範圍第1項至第49項中任一項之突變Tn5轉位酶。
一種表現載體，其包含如申請專利範圍第50項之核酸分子。
一種宿主細胞，其包含如申請專利範圍第51項之載體。
一種用於試管內轉位之方法，其包含允許以下組分相互作用：(i)包含如申請專利範圍第1項至第49項中任一項之突變Tn5轉位酶之轉位體(transposome)複合物，及(ii)目標DNA。
一種定序目標DNA之方法，其包含：(a)使該目標DNA與包含以下之轉位體複合物一起培育：(1)如申請專利範圍第1項至第49項中任一項之突變Tn5轉位酶；及(2)包含以下之第一聚核苷酸：(i)包含轉位子末端序列之3'部分，及(ii)包含第一定序標籤域之第一標籤，該培育係在藉以使得該目標DNA經片段化，且該第一聚核苷酸之3'轉位子末端序列轉移至該片段之5'末端之條件下，進而產生雙股片段，其中5'末端經該第一標籤標記，且在該5'標記股之3'末端處存在單股間隙；(b)使該片段與核酸修飾酶一起在藉以使得第二標籤附接至該5'標記股之3'末端之條件下培育，(c)視情況藉由提供聚合酶及對應於該第一聚核苷酸之一部分的擴增引子來擴增該片段，進而產生在5'末端處具有該第一標籤且在3'末端處具有第二標籤之代表性二標記片段庫；(d)提供包含對應於該第一定序標籤域之部分的第一定序引子；及(e)並行地擴展該第一定序引子及偵測與該代表性二標記片段庫之第一定序標籤域鄰接之核苷酸之身分(identity)。
一種用於進行試管內轉位反應之套組，其包含有含以下者之轉位體複合物：(1)如申請專利範圍第1項至第49項中任一項之突變Tn5轉位酶；及(2)包含含有轉位子末端序列之3'部分之聚核苷酸。
一種經改變轉位酶，其包含對包含SEQ ID NO：21之胺基酸序列之半保守域之取代突變，其中該取代突變包含在位置2處變成除Trp、Asn、Val或Lys以外的任何殘基之突變。
如申請專利範圍第56項之經改變轉位酶，其中該突變包含變成Met之取代。
一種標籤化反應緩衝劑，其包含轉位酶及相比於在包含Mg²⁺之緩衝劑中之相同酶足以減小GC傾向之有效濃度的Co²⁺。
如申請專利範圍第58項之標籤化反應緩衝劑，其中該Co²⁺之濃度在約5mM至約40mM的範圍內。
如申請專利範圍第58項之標籤化反應緩衝劑，其中該Co²⁺之濃度在約5mM至約20mM的範圍內。
如申請專利範圍第58項之標籤化反應緩衝劑，其中該Co²⁺之濃度在約8mM至約12mM的範圍內。
如申請專利範圍第58項之標籤化反應緩衝劑，其中該Co²⁺之濃度為約10mM。
一種用於試管內轉位之方法，其包含允許以下組分相互作用：(i)包含轉位酶之轉位體複合物，(ii)目標DNA；及(iii)包含相比於在包含Mg²⁺之緩衝劑中之相同酶足以減少GC傾向之有效濃度之Co²⁺的反應緩衝劑。
如申請專利範圍第63項之方法，其中該Co²⁺之濃度在約5mM至約40mM的範圍內。
如申請專利範圍第63項之方法，其中該Co²⁺之濃度在約5mM至約20mM的範圍內。
如申請專利範圍第63項之方法，其中該Co²⁺之濃度在約8mM至約12mM的範圍內。
如申請專利範圍第63項之方法，其中該轉位酶包含如申請專利範圍第1項至第49項中任一項之突變Tn5轉位酶。
如申請專利範圍第63項之方法，其中該轉位酶包含Mos-1轉位酶。
如申請專利範圍第63項之方法，其中該轉位酶包含超高活性(hyperactive)Tn5轉位酶。
一種突變Tn5轉位酶，其中該突變Tn5轉位酶展現相比於野生型Tn5轉位酶增加之DNA輸入耐受度。
如申請專利範圍第70項之突變Tn5轉位酶，其中該突變轉位酶包含SEQ ID NO：19之胺基酸序列。
如申請專利範圍第71項之突變Tn5轉位酶，其中該突變Tn5轉位酶在 2.4之nM突變Tn5轉位酶：ng輸入DNA之比率下展現增加之DNA輸入耐受度。
一種針對目標DNA輸入量的範圍產生均一片段尺寸之方法，其包含：(a)提供目標DNA；其中目標DNA之量選自目標DNA量的範圍，且(b)使該目標DNA與轉位酶一起培育，其中該轉位酶之胺基酸序列包含SEQ ID NO：19之自C端起至少最後400個胺基酸，且其中該轉位酶使該目標DNA片段化以產生均一片段尺寸。
如申請專利範圍第73項之方法，其中該目標DNA為基因體DNA。
如申請專利範圍第74項之方法，其中該基因體DNA為原核DNA。
如申請專利範圍第75項之方法，其中該原核DNA為細菌DNA。
如申請專利範圍第74項之方法，其中該基因體DNA為真核基因體DNA。
如申請專利範圍第77項之方法，其中該真核基因體DNA為人類基因體DNA。
如申請專利範圍第73項至第78項中任一項之方法，其中目標DNA之量在約1ng至200ng的範圍內。
一種針對目標DNA輸入量的範圍定序目標DNA之方法，其包含：(a)使該目標DNA與包含以下之轉位體複合物一起培育：(1)包含SEQ ID NO：19之胺基酸序列之突變Tn5轉位酶；及(2)包含以下之第一聚核苷酸：(i)包含轉位子末端序列之3'部分，及(ii)包含第一定序標籤域之第一標籤，其中目標DNA之量選自目標DNA量的範圍，該培育係在藉以使得該目標DNA經片段化，且該第一聚核苷酸之3'轉位子末端序列轉移至該片段之5'末端之條件下，進而產生雙股片段，其中5'末端經該第一標籤標記，且在該5'標記股之3'末端處存在單股間隙；(b)使該片段與核酸修飾酶一起在藉以使得第二標籤附接至該5'標記股之3'末端之條件下培育，(c)視情況藉由提供聚合酶及對應於該第一聚核苷酸之一部分的擴增引子來擴增該片段，進而產生在5'末端處具有該第一標籤且在3'末端處具有第二標籤之代表性二標記片段庫；(d)提供包含對應於該第一定序標籤域之部分的第一定序引子；及(e)並行地擴展該第一定序引子及偵測與該代表性二標記片段庫之第一定序標籤域鄰接之核苷酸之身分。
如80之方法，其中目標DNA之量在約1ng至200ng的範圍內。
如申請專利範圍第81項之方法，其中nM突變Tn5轉位酶：ng輸入DNA之比率為2.4。
如申請專利範圍第73項之方法，其中該方法用於外顯子體(exome)富集。
如申請專利範圍第70項之突變Tn5轉位酶，其中該突變轉位酶具有SEQ ID NO：26之胺基酸序列。
一種突變Tn5轉位酶，其包含SEQ ID NO：2-10、12-20及25-26中之任一者之至少400個胺基酸序列之胺基酸序列。