TW202411431A

TW202411431A - 準確地平行定量變體核酸的高靈敏度方法

Info

Publication number: TW202411431A
Application number: TW112132634A
Authority: TW
Inventors: 尤哈–佩卡普西海莫; 塔圖希爾沃寧; 安東尼科爾基亞科斯基; 馬努塔米寧
Original assignee: 芬蘭商基諾米爾健康公司
Priority date: 2022-08-31
Filing date: 2023-08-29
Publication date: 2024-03-16
Also published as: US20240068010A1; KR20240032631A; CN117625763A; JP2024035110A; EP4332235A1; CA3208896A1

Abstract

本發明的揭示內容是關於次世代DNA定序方法和用途，用於對一個或多個核酸標靶（例如在大量的未純化的樣品材料中）進行準確且大規模平行定量。更具體地，本發明涉及包括用於檢測和定量複雜樣品中的基因標靶的探針的方法和試劑盒。本發明包括每個每一基因標靶、和橋寡核苷酸或橋寡核苷酸複合體至少多個標靶特異性核酸探針（第一探針、第二探針和標靶特異性探針）。

Description

準確地平行定量變體核酸的高靈敏度方法

本發明的揭示內容是關於經改良的次世代DNA定序方法，用於對一個或多個核酸標靶進行準確且大規模平行定量。更具體地，本發明是關於包括用於檢測和定量複雜DNA池中基因標靶的探針的方法和試劑盒，主要用於基因標靶和變體檢測。

隨著研究基因變異技術的進步，在植物和動物中檢測基因變異並不麻煩。然而，儘管定序成本下降，但檢測和準確定量基因變異（諸如突變），特別是在信號較弱的樣品中，目前仍然是麻煩、費力和昂貴的。各種問題可更準確地表述為例如用以在共同背景下檢測基因信號的特異性、用以檢測弱基因信號的靈敏度、用以準確定量經檢測的信號的準確性、當平行測定多個樣品時用以確定測定成本之每次測定的經標靶定向基因標靶的通量數量、每次測定的成本、規模大小、及用以確定從採樣到取得結果的所需時間長度的周轉量（turn-over）。

目前，液體活組織檢查和概念上類似的測定（諸如抗生素抗性基因檢測）的典型定量方法包括定量PCR（qPCR）、陣列qPCR、數字PCR、多重連接依賴式探針擴增（MLPA）或來自次世代DNA定序數據的定量。雖然定量方法是穩健和成熟的方法，但每個方法都與下面更詳細討論的具體問題有關係：

定量PCR：定量PCR（qPCR）是一種包括在PCR過程中（即實時）擴增經標靶定向的DNA分子的技術。實時PCR可以定量使用（定量實時PCR），以及也可以半定量使用，即高於/低於一定量的DNA分子（半定量實時PCR）。定量PCR（qPCR）是基因標靶定量的金標準。目前，qPCR反應的實驗室成本約為2$。然而，考慮到設置反應所需的大量實際操作時間（人工成本）、標準曲線的需要以及每個經定量標靶的重複，實際成本要高得多。由於每個基因標靶都需要單獨的定量實驗，因此實際操作時間會隨著樣品數量的增加而急劇增加。

陣列PCR：PCR陣列是分析相關通路-或疾病聚焦基板的基因表達的最可靠工具。每個96孔板、384孔板或100孔盤PCR陣列都包括SYBR Green優化的引子測定，用於對一組聚焦基因進行徹底研究。qPCR技術的一個新的迭代是陣列qPCR，其將單個qPCR反應小型化。陣列PCR降低了單個qPCR反應的成本，並提高了該方法對多個標靶和樣品的可擴展性。然而，該方法目前侷限於讀出基礎設施的巨大資金成本及以每晶片數千美元的成本自12個樣品分析出384種標靶（或者相反地，自384個樣品分析出12個標靶）。因此，使用上述設置剖析數千個樣品仍然非常昂貴。

數字PCR：數字聚合酶鏈式反應（Digital PCR，DigitalPCR，dPCR，dePCR）是一種通過微滴微流體和熒光檢測來提供標靶絕對定量的方法。這種方法相對成本有效（每個樣品一個標靶成本約為3$），但每個樣品中每個標靶的準備、設置和運行單獨實驗的實際時間使得難以擴展至數千個樣品。

多重連接依賴式探針擴增（MLPA）提供了一種簡化單個樣品中多個基因標靶檢測的方法。然而，MLPA只提供標靶的相對定量，並需要對每個樣品進行單獨的檢測實驗。最近，MLPA的一個變型引入了DNA條形碼的概念。與傳統的MLPA工作流程相比，該概念允許更好的定量分辨率和樣品複用。

基於次世代定序的方法：次世代定序（NGS），也稱為高通量定序，使得基於序列的基因表達分析成為模擬技術的“數字”替代物。隨著DNA定序成本的不斷降低，從次世代DNA定序數據中進行標靶計數正變得越來越有吸引力，並且目前正用於例如無創產前測試篩選。然而，目前的方法存在定序資料庫製備成本高和定序工作浪費在非相關基因標靶定序上的問題。例如，在癌症相關液體活組織檢查中，非標靶定向方法導致腫瘤學的非相關基因座定序工作的浪費。在胎兒診斷學中，基因座的非標靶定向採樣極大地限制了解釋數據的統計選擇。Guardant Health Inc.提供了更有標靶定向性的定序方法，其中一系列RNA捕獲探針豐富了次世代DNA定序的標靶。

Akhras et al. (2007) PLoS ONE 2(2):e223公開了一種涉及條形碼化標靶特異性探針、標靶環化和定序的多重病原體檢測測定。還公開了使用橋寡核苷酸來連接標靶特異性探針。

WO2018109206描述了使用掛鎖探針和滾環擴增來檢測樣品中分析物的方法。沒有描述使用橋寡核苷酸。

WO2019038372（通過引用併入）描述了次世代定序方法，其中通過體外轉錄從含有T7聚合酶啟動子的連接複合體中選擇性地擴增感興趣的靶序列，然後進行cDNA合成和定序。雖然這種方法可以對樣品中的許多標靶序列進行準確和平行的檢測和定量，但對於更複雜、大體積、稀釋和/或不純的樣品仍具有挑戰性。

因此，根據前述討論，需要通過對核酸標靶的準確和大規模平行定量來克服前述缺點，諸如但不限於特異性、靈敏度、準確性、通量、成本、規模化（scaling）和周轉。

本發明提供了一種使用次世代定序技術在大體積樣品（高達數十毫升）和/或稀釋和/或未純化的樣品材料中進行高靈敏度、可規模化且準確的靶定量的方法。而且，避免了諸如WO2019038372中描述的RNA擴增步驟，使該方法更加簡單。此外，本發明的方法包括標靶序列擴增步驟，其中使用額外的標靶特異性探針或多個額外的標靶特異性探針來特異性擴增，且因此特異性富集特定序列，諸如罕見序列。這使得能夠在含有過量的相關但不相同序列的樣品中檢測這種罕見序列。例如，該方法可用於在含有過量的其他等位基因的樣品中檢測基因的罕見等位基因。

在第一個主要方面，本發明涉及一種檢測樣品中一個或多個標靶核苷酸序列的方法，所述方法包括以下步驟：

（i）為所述樣品中的每個標靶核苷酸序列提供：第一探針、第二探針，和橋寡核苷酸或能夠彼此黏合(annealing)以形成橋寡核苷酸複合體的多個寡核苷酸，

其中，所述第一探針自分子的5'端起包括第一橋寡核苷酸特異性序列、可選的第一序列條形碼，和位於所述第一探針的3'端的第一標靶特異性部分；

其中，所述第二探針自分子的5'端起包括第二標靶特異性部分、可選的第二序列條形碼，和位於所述第二探針的3'端的第二橋寡核苷酸特異性序列；

其中，所述橋寡核苷酸或橋寡核苷酸複合體包括與所述第一探針中的第一橋寡核苷酸特異性序列和所述第二探針中的第二橋寡核苷酸特異性序列互補的序列，和可選的第三條形碼；

其中，所述第一序列條形碼或者所述第二序列條形碼或者所述第三條形碼中的至少一者分別存在於所述第一探針或者所述第二探針或者所述橋寡核苷酸或橋寡核苷酸複合體中；

並且其中，可選地，所述第一探針或者所述第二探針或者所述橋寡核苷酸或所述橋寡核苷酸複合體中的至少一者包括核酸內切酶的識別序列；

（ii）對於所述一個或多個標靶核苷酸序列中的每一種，使所述第一探針和第二探針與所述橋寡核苷酸或能夠彼此黏合以形成橋寡核苷酸複合體的多個寡核苷酸接觸並允許自黏合為多個連接複合體；

（iii）使存在於待測試所述標靶核苷酸序列的所述樣品中的核酸與所述連接複合體接觸；

（iv）允許所述第一探針的第一標靶特異性部分和所述第二探針的第二標靶特異性部分與標靶序列上基本相鄰的區段雜交，從而形成雜交複合體；

（v）將所述雜交複合體中的探針連接起來，以提供經連接的連接複合體；

（vi）使所述經連接的連接複合體與所述標靶核苷酸序列解離；

（vii）加入標靶特異性探針，所述標靶特異性探針包括與所述標靶核苷酸序列對應的序列，其中所述標靶特異性探針能夠與所述經連接的連接複合體黏合，並允許所述標靶特異性探針與所述經連接的連接複合體黏合，從而形成擴增模板；

（viii）用鏈置換聚合酶通過滾環擴增從擴增模板來擴增核酸，從而獲得單鏈的多聯體（concatemeric）序列；

（ix）可選地，在存在步驟（i）中指定的識別序列的條件下，進行通過以下方式獲得核酸片段的步驟：

（a）切割在步驟（vii）中獲得的所述單鏈的多聯體序列，或

（b）使在步驟（viii）中獲得的經擴增的一個或多個單鏈的多聯體序列與包含核酸內切酶的識別序列的特異性寡核苷酸黏合，其中所述寡核苷酸與步驟（i）中指定的所述識別序列黏合，從而獲得所述核酸內切酶的識別位點；以及，用所述核酸內切酶切割經黏合的複合體；

（x）使步驟（viii）中獲得的多聯體序列或步驟（ix）中獲得的核酸片段經受定序技術以確定條形碼序列；以及

（xi）通過確定所述第一標靶特異性部分和/或第二標靶特異性部分的至少一部分，和/或所述第一條形碼和/或所述第二條形碼的至少一部分，和/或所述第三條形碼的至少一部分，來鑑定所述樣品中標靶核苷酸序列的存在和/或數量。

定義：

標靶核苷酸序列：術語“標靶核苷酸序列”可以是需要檢測的任何感興趣的核苷酸序列。應當理解，給出的術語是指連續核苷酸序列以及具有互補序列的核酸分子。在一些實施方式，標靶序列是代表多態性或與多態性相關的核苷酸序列。

多態性：術語“多態性”是指在群體中出現兩種或更多種基因決定的替代序列或等位基因。多態性標誌物或位點是發生序列差異的基因座。多態性基因座（polymorphic locus）可以小到一個鹼基對。

樣品：術語“樣品”在本文中用於含有兩種或更多種標靶序列的兩個或更多個樣品。根據本發明方法提供的樣品可已製備好，以便至少提取標靶核酸，並使那些核酸可被本發明中使用的探針接近。特別地，在一些實施方式中，每個樣品包含至少兩種不同的標靶序列，優選至少100種，更優選至少250種，更優選至少500種，最優選至少2000種或更多。術語“樣品”可以指但不限於從人體/動物體獲得的兩個或更多個樣品，包括尿液、活組織檢查樣品、唾液和其他分泌物、呼出的水分提取物、組織、血漿（液體活組織檢查樣品）；或從環境獲得的兩個或更多個樣品，包括水、廢水、土壤、植物；或含病毒或細菌等的兩個或更多個樣品。在一個實施方式中，多個樣品包括血液樣品、唾液樣品、尿液樣品或糞便樣品、另一體液的樣品或身體材料的提取物，例如頭髮或皮屑。

探針：術語“探針”是可變長度（通常50至1000個鹼基長，優選50至200個鹼基長）的DNA或RNA片段，其可用於DNA或RNA樣品以檢測與探針中序列互補的核苷酸序列（DNA或RNA標靶）的存在。寡核苷酸探針與標靶序列互補的區段被設計成使得對於樣品中的每個標靶序列，提供一對第一探針和第二探針，由此每個探針在其末端含有與標靶序列的一部分互補的區段。此外，本公開還描述了用於接合第一探針和第二探針的橋寡核苷酸或橋寡核苷酸複合體。此外，使用額外的標靶特異性探針或增強探針，其包括與部分靶序列對應的序列。

通用（Universal）：當用於描述擴增過程時，術語“通用”是指能夠使用單個引子或一組引子進行多個擴增反應的序列。這種引子的使用極大地簡化了多重化，因為只需要兩個引子來擴增多個選定的核酸序列。當用於描述引發位點時，術語“通用”是通用引子將雜交的位點。還應該注意的是，可以使用通用引發序列/引子的“組”。

雜交：術語“雜交（或雜化）”描述DNA或RNA分子黏合成互補DNA或RNA的過程。DNA或RNA複製以及DNA轉錄成RNA都依賴於核苷酸雜交。

連接（Ligation）：術語“連接”是通過酶的作用接合兩個核酸片段。DNA連接酶是能夠催化在互補鏈上相鄰位點結合的兩條多核苷酸鏈（的端部）之間形成磷酸二酯鍵的酶。在一個實施方式中，連接也可以化學方式進行，特別地如果多核苷酸的兩個相鄰的端部都被修飾以使得能夠化學連接。

擴增：本文使用的術語“擴增”指的是使用DNA聚合酶來增加核苷酸序列混合物中具體核苷酸序列的濃度。“PCR”或“聚合酶鏈式反應”是體外酶促擴增特定DNA/RNA片段的快速程序。待擴增的DNA/RNA可通過加熱樣品而變性。術語“引子”是RNA或DNA的鏈（通常約18至22個鹼基），其作為DNA合成的起點。這是複製DNA所必需的，因為催化這一過程的酶，DNA聚合酶，只能在現有的DNA鏈上添加新的核苷酸。

聚合酶：聚合酶是一種合成長鏈核酸或核酸聚合物的酶。DNA聚合酶和RNA聚合酶分別用於通過鹼基配對相互作用複製DNA或RNA模板鏈來組裝DNA和RNA分子。

高通量：術語“高通量”指的是同時處理和篩選大量DNA樣品的能力；以及在單個DNA樣品中同時篩選大量不同的基因座的能力。高通量定序或篩選，通常縮寫為HTS，是一種特別適用於同時有效篩選大量樣品的科學實驗方法。

核酸內切酶：核酸內切酶是一種在隨機或特定位置使DNA雙鏈或單鏈裂解的酶。

條形碼：本發明中使用的探針和寡核苷酸可包括由核苷酸序列組成的一個或多個條形碼。條形碼序列可包括用於標靶列舉（target enumeration）的標靶核苷酸序列標識符序列、樣品標識符序列和/或分子條形碼（也稱為獨特分子標識符）。條形碼序列可包括隨機序列。

如上文所述，本公開涉及一種利用連接依賴性測定法在非常多的樣品中高通量檢測標靶核苷酸序列的方法。本公開提供了一種使用次世代定序允許的技術確定複雜核酸池中基因標靶序列的方法。本公開還提供了一種通過利用連接依賴性測定法在多個樣品中（優選在非常多的樣品中），對多種基因標靶進行剖析的方法。本公開提供了一種多重連接依賴性探針擴增的方法，其使得能夠查詢多個樣品中的不同標靶核酸。本發明的方法使得能夠對多個樣品中的一個或多個標靶核苷酸序列進行定序，為不同的標靶核酸提供多個不同的探針組。在處理定序數據時，獨特序列標識符用於鑑定基因標靶和對樣品池中的單個樣品進行絕對定量。

（i）為所述樣品中的每個標靶核苷酸序列提供：第一探針、第二探針，和橋寡核苷酸或能夠彼此黏合以形成橋寡核苷酸複合體的多個寡核苷酸，

（viii）用鏈置換聚合酶通過滾環擴增從擴增模板來擴增核酸，從而獲得單鏈的多聯體序列；

（a）切割在步驟（vii）中獲得的所述單鏈的多聯體序列，或

在一個實施方式中，所述方法用於高通量檢測多個樣品中的一個或多個靶核苷酸序列，其中提供多個樣品，並且其中優選地，在單獨的管中對每個樣品進行步驟（ii）。在一個實施方式中，在步驟（viii）之前，彙集多個所述樣品。

圖1提供了本發明方法實施方式的非限制性說明。

本發明的方法利用四種或更多種的核酸分子，其中三種標靶特異性的核酸探針（第一探針、第二探針和標靶特異性探針）對基因標靶具有特異性，並且一個或多個核酸探針通常是通用的（橋寡核苷酸或橋寡核苷酸複合體）。第一探針和第二探針與橋寡核苷酸或橋寡核苷酸複合體雜交形成連接複合體。使樣品DNA或RNA上具有標靶鑑定位點的連接複合體（含有一個或多個條形碼序列）與查詢樣品的互補標靶序列進行雜交。雜交後，第一探針和第二探針被化學連接或通過DNA連接酶酶法連接，形成經連接的連接複合體。在本發明中，在待分析的多個樣品的樣品分析過程中，將會形成多個這樣的經連接的連接複合體。

術語“多個樣品”可以指但不限於從人體或動物體獲得的兩個或更多個樣品，包括活組織檢查樣品、唾液和其他分泌物、呼出的水分提取物、組織、血漿（液體活組織檢查樣品）；從環境獲得的兩個或更多個樣品，包括水、廢水、土壤、植物；或者含病毒或細菌的兩個或更多個樣品等。在一個實施方式中，使用的樣品不需要事先進行核酸的純化或濃縮。在另一個實施方式中，可以對樣品進行預處理，例如裂解細胞以暴露核酸。

標靶序列可包括需要檢測的任何感興趣的核苷酸序列。本公開的標靶核苷酸序列可從患者血液中的一部分DNA或母體血液中的一部分DNA獲得，但不限於此。患者血液中的一部分DNA可例如從凋亡/壞死的癌細胞中獲得，或者母體血液中的一部分DNA可以是胎兒或和/或母體來源的。進一步地，分析結果用於，例如評估個體患上給定類型癌症的風險，確定給定治療對給定癌症的療效，腫瘤中耐藥性相關突變的發展，或胎兒攜帶基因疾病（諸如常見的三染色體性唐氏綜合征、帕圖綜合征和愛德華茲綜合征）的風險。在某些實施方式中，該方法包括為每個標靶核苷酸序列提供多個不同的探針組。

如本文所使用的，術語“探針組”包括第一探針、第二探針以及一個或多個橋寡核苷酸。

在某些實施方式中，第一探針自分子的5’端起包括可選的5’磷酸、第一橋寡核苷酸特異性序列、可選的第一通用序列、可選的第一序列條形碼，和在其3’端的第一標靶特異性部分。

在某些實施方式中，第二探針自分子的5’端起包括可選的5’磷酸、第二標靶特異性部分、可選的第二序列條形碼、可選的第二通用序列，和在其3’端的第二橋寡核苷酸特異性序列。

在一些實施方式中，第一探針或第二探針包括第一序列條形碼或第二序列條形碼中的至少一者。第一序列條形碼或第二序列條形碼或者這兩者可以是隨機序列，或者可以包括標靶核苷酸序列標識符序列、樣品標識符序列和/或分子條形碼，用於標靶列舉。

橋寡核苷酸或多個橋寡核苷酸包括與所述第一探針中的第一橋寡核苷酸特異性序列和所述第二探針中的第二橋寡核苷酸特異性序列互補的序列，可選的通用序列，和/或，或者可包含第三條形碼，該第三條形碼可以是隨機序列或可包含樣品或序列標識符序列。在這方面，第三條形碼不一定意味著已經存在第一條形碼和第二條形碼。如前所述，在經連接的連接複合體中應該存在至少一個條形碼，這使得能夠在所有測試樣品的所有連接複合體中獨特地定義該複合體。

可選地，第一探針、第二探針、一個或多個橋寡核苷酸或者標靶特異性探針中的至少一者包括核酸內切酶的識別序列。核酸內切酶識別序列能夠使多聯體序列裂解。在一個實施方式中，識別序列是限制性核酸內切酶（諸如EcoRI）的識別序列。在另一個實施方式中，識別序列是歸巢核酸內切酶（諸如I-CeuI）的識別序列。在另一個實施方式中，識別序列是嚮導DNAaseI或CRISPR-Cas類切割體系的識別序列。在另一個實施方式中，識別序列是缺口核酸內切酶的識別序列。

可選地，第一探針或者第二探針或者一個或多個橋寡核苷酸中的至少一者包括第一捕獲部。在本文在使用時，“第一捕獲部”是指使得探針、連接複合體或雜交複合體被連接至固體支持物的第二捕獲部所捕獲（即與之結合）的部分，諸如化學基團。本領域內已知的任何合適的捕獲部都可用於此目的。眾所周知的合適例子是使用包被有鏈黴親和素的磁珠捕獲生物素化的分子。因此，在一個實施方式中，第一捕獲部是生物素部，它可以與連接到固體支持物（諸如磁珠）上的鏈黴親和素或親和素部（第二捕獲部）相互作用。其他選擇包括生物素衍生物，諸如雙生物素、脫硫生物素或可光解的生物素，它們可用於與鏈黴親和素/親和素綴合。進一步的選擇包括使用硫醇和丙烯醯胺（acrydite）基團進行丙烯醯胺（acrydite）/丙烯醯胺（acrylamide）綴合，使用炔基和疊氮基進行點擊化學，和使用地高辛用於與抗地高辛抗體綴合。綴合配偶體（conjugation partner）可以設置在任何固體表面上，諸如珠子（磁性或其他）或固體支持物。因此，在本發明方法的一個實施方式中，所述第一探針、第二探針、條形碼環狀寡核苷酸，或者一個或多個橋寡核苷酸中的至少一者包括第一捕獲部，並且，在步驟（iv）和步驟（v）之間進行包括以下的中間步驟（iv）（a）：使雜交複合體與含第二捕獲部的固體支持物接觸，允許所述第一捕獲部與第二捕獲部相互作用，從而使得所述雜交複合體與所述固體支持物相連；以及使與固體支持物相連的雜交複合體與樣品中未與所述固體支持物相連的組分分離。

優選地，第一標靶特異性部分、第二標靶特異性部分、第一橋寡核苷酸特異性序列、和/或第二橋寡核苷酸特異性序列彼此獨立地包含至少一個經化學修飾的核苷酸以增加探針結合。增加探針結合的化學修飾包括但不限於核糖核酸、肽核酸和鎖定核酸（例如，如WO2019038372的圖3所示，該文件通過引用併入本文）。在一個實施方式中，第一探針或第二探針、或者這兩者包括經化學修飾的鹼基，以允許改善與橋寡核苷酸或橋寡核苷酸複合體的結合。在另一實施方式中，第一標靶特異性部分、第二標靶特異性部分、第一橋寡核苷酸特異性序列、和/或第二橋寡核苷酸特異性序列彼此獨立地包含一個或多個經化學修飾的核苷酸。在某些實施方式中，化學修飾允許相鄰探針的化學連接。

上文描述的探針與相鄰的遺傳基因座，即標靶核苷酸序列的相鄰區段結合。然而，上述區段並不完全相鄰，而是相距至少15個鹼基對，諸如至少20、至少25或至少30個鹼基對。在優選的實施方式中，相鄰區段相距不超過500個鹼基對，例如相距不超過200個鹼基對，諸如相距不超過100個或相距不超過50個鹼基對。

在一些實施方式中，第一探針、第二探針、一個或多個橋寡核苷酸，或者標靶特異性探針可包括用於DNA定序平臺諸如（但不限於）Illumina MiSeq、NextSeq或NovaSeq的接頭序列。這些接頭序列允許得到的定序資料庫與定序設備的檢測部件（諸如Illumina流動池）結合。

此外，在一些實施方式中，橋寡核苷酸或者形成橋寡核苷酸複合體的多個橋寡核苷酸包括：

（i）一至五個3'突出的鹼基（即，不與第二探針形成雙螺旋的額外鹼基），和/或

（ii）3’磷酸，和/或

（iii）從3'端起的三個位置內的一個或多個硫代磷酸酯修飾。

在本發明方法的一個實施方式中，所述方法包括使用能夠相互黏合以形成橋寡核苷酸複合體的多個寡核苷酸，並且所述多個寡核苷酸包括條形碼環狀寡核苷酸，

其中所述條形碼環狀寡核苷酸自分子的5'端起包括第三橋寡核苷酸特異性序列、條形碼環狀序列和第四橋寡核苷酸特異性序列，並且

其中一個或多個其他橋寡核苷酸包括與所述條形碼環狀寡核苷酸中的第三橋寡核苷酸特異性序列和第四橋寡核苷酸特異性序列互補的序列。

因此，所述條形碼環狀寡核苷酸包含側翼為兩個區段的環狀區段，這兩個區段可與一個或多個橋寡核苷酸雜交以形成橋寡核苷酸複合體。環狀區段不與一個或多個橋寡核苷酸或橋寡核苷酸複合體雜交，並且包括條形碼。在一個實施方式中，條形碼環狀序列包括第三條形碼。

優選對於在單獨的管中的每個樣品，在探針與含標靶序列的樣品接觸之前，使第一探針和第二探針與橋寡核苷酸或能夠形成橋寡核苷酸複合體的多個寡核苷酸接觸，並允許自黏合成連接複合體（步驟（ii））。在其中橋不是一個寡核苷酸而是能夠與彼此黏合形成橋寡核苷酸複合體的多個寡核苷酸（諸如三個或五個寡核苷酸）的實施方式（本文中在圖2B中示出）中，該多個寡核苷酸可以在與第一和第二探針黏合前，是經預黏合的，或者所有的黏合步驟可以一次完成。

優選地，每個連接複合體對第一標靶特異性序列、第二標靶特異性序列和一個或多個條形碼序列的組合是獨特的。這使得能夠在擴增後對標靶序列進行列舉，並對結果進行分析。

此後，使多個樣品中的一個或多個標靶核苷酸序列與多個連接複合體接觸（步驟（iii））。第一探針的第一標靶特異性部分和第二探針的第二標靶特異性部分與標靶序列上基本相鄰的區段雜交，從而形成雜交複合體（步驟（iv））。如上文所提及的，標靶序列上相鄰的區段通常相距15至500個鹼基對。

在一些實施方式中，樣品的體積超過100微升，例如超過1 ml。在又一實施方式中，樣品的核酸濃度低於5 pmol，諸如低於1 pmol，例如低於200 fmol。在一個實施方式中，多個樣品包括一個或多個血液樣品、一個或多個唾液樣品、一個或多個尿液樣品，或者一個或多個糞便樣品。

隨後，在一些實施方式中，如果第一探針或者第二探針或者橋寡核苷酸或者形成橋寡核苷酸複合體的寡核苷酸中的至少一者包含第一捕獲部，則使雜交複合體與含第二捕獲部的固體支持物接觸，並允許第一捕獲部與第二捕獲部相互作用，使雜交複合體與固體支持物相連（可選步驟（iv）（a））。此後，使與固體支持物相連的雜交複合體與樣品中未與固體支持物相連的組分分離。如果固體支持物是磁珠，則可以用磁鐵將磁珠固定住，並可去除剩餘的液體樣品。可選地，在繼續進行之前進行洗滌步驟。

步驟（iv）（a）帶來核酸的純化和富集，使得特別是對於高度不純的樣品具有改善的結果。在一個實施方式中，本發明的方法在步驟（iv）（a）之前不包括富集核酸的步驟。因此，在一個實施方式中，本方法在步驟（v）之前不包含將原始樣品中的核酸濃縮大於2倍、大於10倍或大於100倍的步驟。在另一個實施方式中，本發明的方法在步驟（vi）的連接之後不包括純化步驟。

隨後，以酶法或化學法進行所形成的雜交複合體中探針的連接，以提供經連接的連接複合體（步驟（v））。可選地，作為步驟（v）的一部分，第一探針與第二探針之間的間隙（如果存在）可以通過引入聚合酶和一個或多個核苷酸來填補。聚合酶添加（a）與橋寡核苷酸序列互補和/或（b）與條形碼序列互補的核苷酸，從而填補第一探針和第二探針之間的兩個間隙，使第一探針和第二探針連接起來並將通用序列和/或第三條形碼序列納入橋互補鏈中。橋寡核苷酸或橋寡核苷酸複合體從5'位點或3'位點延伸與連接的探針互補，從而使存在於第一探針或第二探針中的標靶序列識別序列整合到橋寡核苷酸或橋寡核苷酸複合體中。優選地，使用不破壞雙鏈DNA的聚合酶，例如Taq聚合酶，以便在第一探針和第二探針與標靶序列黏合時均不干擾第一探針與第二探針的連接。在一個實施方式中，所述橋寡核苷酸，或所述多個橋寡核苷酸的一個或多個寡核苷酸，在與所述第一探針或第二探針不互補的區域中，包括多個通用鹼基類似物，以允許引入適合用作標靶列舉的分子條形碼的隨機序列。這些隨機序列可因此成為第三條形碼。在這樣的實施方式中，作為步驟（v）的一部分，使用聚合酶和核苷酸進行間隙填補步驟，以生成這樣的隨機序列。在實施方式中，多個通用鹼基類似物是多個5-硝基吲哚或脫氧肌苷。

在步驟（v）之前或之後，可選地，從一個或多個標靶樣品中彙集經連接的連接複合體。

隨後，使經連接的連接複合體與靶核苷酸序列解離（步驟（vi）），加入靶特異性探針，並允許其與經連接的連接複合體黏合，從而形成擴增模板（步驟（vii））。標靶特異性探針包含與標靶核苷酸序列相應的序列，因此特異性黏合至與該序列匹配的經連接的連接複合體上。標靶特異性探針可選地包括捕獲部（諸如生物素）和/或核苷酸修飾（包括但不限於硫代磷酸酯、LNA和PNA修飾），其增強與標靶的結合或保護其免受核酸外切酶活性的影響。納入步驟（vi）和（vii）允許選擇性擴增樣品中的變體序列，例如罕見突變。如圖3所示，如果選擇標靶特異性探針序列，使得其與待檢測的變體序列（例如，罕見突變）匹配，但不與非變體序列（例如，大量基因組野生型序列）匹配，這將促進後續步驟中變體序列的選擇性擴增，從而有利於後續檢測。通常，在步驟（vii）中，相對於標靶序列的量，加入大量過量的標靶特異性探針，使得擴增模板的形成優於經連接的連接複合體與標靶序列的再黏合。

接下來，從擴增模板擴增核酸（步驟（viii））。如圖3所示，擴增可以從橋寡核苷酸和/或從標靶特異性探針啟動。從經黏合的標靶特異性探針的擴增使得含有標靶特異性探針序列的變體靶序列的選擇性擴增（“匹配”）超過不含標靶特異性探針序列的非變體標靶序列（“錯配”）。使用鏈置換聚合酶，諸如phi29聚合酶（UniProtKB - P03680；DPOL_BPPH2）或Bst聚合酶（P52026；DPO1_GEOSE）通過滾環擴增來進行擴增。

步驟（viii）的結果是獲得單鏈的多聯體序列。

可選地，在存在步驟（i）中指定的識別序列的情況下，步驟（ix）通過以下來進行以獲得核酸片段：

（a）切割在步驟（viii）中獲得的單鏈的多聯體序列，或

（b）使在步驟（viii）中獲得的經擴增的一個或多個單鏈的多聯體序列與包含核酸內切酶的識別序列的特異性寡核苷酸黏合，其中所述寡核苷酸與步驟（i）中指定的所述識別序列黏合，從而獲得所述核酸內切酶的識別位點；以及，用所述核酸內切酶切割經黏合的複合體。

可選地，擴增後，去除固體支持物（如果存在），並且將上清液用於後續處理。例如，如果固體支持物是磁性顆粒，可使用磁鐵將它們去除。在本發明方法的其他一些實施方式中，在步驟（v）之後、步驟（vi）之後或步驟（vii）之後，立即破壞第一捕獲部與第二捕獲部之間的相互作用。例如，如果第一捕獲部是生物素且第二捕獲部是鏈黴親和素，則可通過加入過量的可溶性生物素來破壞相互作用。如果鏈黴親和素與磁性顆粒結合，則可隨後用磁鐵將其去除。

接下來，在步驟（x）中，使步驟（viii）中獲得的多聯體序列，或者如果進行了步驟（ix），則使步驟（ix）中獲得的核酸片段經受高通量定序技術以確定條形碼序列。

可選地，緊鄰步驟（x）且在步驟（x）之前，使用與所述第一探針和第二探針的通用部分結合的引子進行PCR擴增，其中所述引子可選地包括用於後續步驟（x）中的定序的接頭序列。

在另一個實施方式中，步驟（x）中的定序是使用納米孔定序進行的，其中可選地使用轉座複合體對步驟（viii）中獲得的多聯體序列進行片段化。Wang等人（2021 Nat Biotechnol 39(11):1348）對用於納米孔定序的合適技術進行了綜述。

可以通過高通量定序技術（步驟（x）和步驟（xi））確定第一和/或第二標靶特異性部分的至少一部分、第一和/或第二條形碼的至少一部分、和/或第三條形碼的至少一部分來鑑定多個樣品中標靶核苷酸序列的存在和/或數量，例如使用次世代定序平臺，包括但不限於Illumina iSeq、MiSeq、HiSeq、NextSeq或NovaSeq。優選地，通過對每個標靶和每個樣品的分子條形碼的數量進行計數來允許對基因標靶進行列舉（enumeration）。樣品從序列數據中分離出來（去卷積），並且在DNA定序後在silico中對序列標靶進行定量。

與傳統的核酸定序技術相比，本發明的優點包括但不限於低成本、高簡單性、高特異性、高靈敏度、高準確性、高通量、高可擴展性和高周轉的定量測定。本發明的另一個方面是，本發明的方法使得能夠對包括人類和動物群體在內並且包括大體積的未純化樣品材料在內的多個樣品中的多種核酸標靶進行精確和大規模平行定量。如所提及的，在優選的實施方式中，使用的樣品，諸如尿液樣品，不需要事先進行核酸的純化或濃縮。在另一個實施方式中，可以對樣品進行預處理，例如裂解細胞以暴露核酸。本發明的一個特別的優點是能夠使用獨特的探針設計（即探針三聯體），來檢測和擴增感興趣的標靶序列。探針設計有特殊定位的經修飾的核苷酸，可提高黏合和結合效率。結合特性的改善引起更高的測定特異性、靈敏度和準確性。本發明的方法同樣適用于研究基因變體並在診斷和預後中找到應用，包括但不限於對一個或多個序列和/或多態性（諸如SNP和/或插入缺失）、癌症診斷或來自母體血液的胎兒染色體疾病的樣品進行基因分型。在優選的實施方式中，對於兩個或更多個樣品或者對於兩個或更多個基因座/等位基因組合，使用條形碼序列來對樣品中的一個或多個序列和/或多態性（諸如SNP和/或插入缺失）進行基因分型。

在另一方面，本發明提供了含多個容器的成套的試劑盒（a kit of parts），其中，至少一個容器容納一組或多組的第一探針和第二探針，並且至少一個容器容納一個或多個橋寡核苷或者能夠形成橋寡核苷酸複合體的多個橋寡核苷酸，

其中，所述第一探針自分子的5'端起包括第一橋寡核苷酸特異性序列、可選的第一序列條形碼，和位於第一探針的3'端的第一標靶特異性部分；

其中，所述第二探針自分子的5'端起包括第二標靶特異性部分、可選的第二序列條形碼，和位於第二探針的3'端的第二橋寡核苷酸特異性序列；

其中，所述橋寡核苷酸或橋寡核苷酸複合體包含與所述第一探針中的第一橋寡核苷酸特異性序列和所述第二探針中的第二橋寡核苷酸特異性序列互補的序列，以及可選的第三條形碼；

其中，所述試劑盒進一步包括標靶特異性探針，所述標靶特異性探針包括與所述標靶核苷酸序列對應的序列，其中所述標靶特異性探針能夠與所述經連接的連接複合體黏合；

並且其中，可選地，所述第一探針或者所述第二探針或者所述橋寡核苷酸或者所述橋寡核苷酸複合體中的至少一者包括核酸內切酶的識別序列；

並且其中，可選地，所述成套的試劑盒進一步包括能夠與所述識別序列黏合的寡核苷酸，從而獲得所述核酸內切酶的識別位點。

優選地，對所述多個第一探針的3'端或所述多個第二探針的5'端，或這兩者進行修飾以允許所述多個第一探針與所述多個第二探針的化學連接。

優選地，橋寡核苷酸或多個橋寡核苷酸中的寡核苷酸在與第一探針序列互補的序列，或與第二探針序列互補的序列，或這兩者中包括一個或多個經化學修飾的核苷酸。

優選地，對所述第一探針的3'端或所述第二探針的5'端，或這兩者進行修飾以允許所述第一探針與所述第二探針的化學連接。

優選地，所述第一探針或第二探針的橋接部分，或這兩者，或所述橋寡核苷酸或所述多個橋寡核苷酸中的寡核苷酸包括經化學修飾的鹼基，以改進與所述橋寡核苷酸或橋寡核苷酸複合體的結合。

在一個具體實施方式中，容納第一和第二探針組的至少一個容器和容納橋寡核苷酸或能夠彼此黏合以形成橋寡核苷酸複合體的多個寡核苷酸的至少一個容器是同一容器。在這種情況下，探針可以預先黏合並形成連接的複合體。

本發明的一個特別的優點是能夠使用獨特的探針設計，來檢測和擴增感興趣的標靶序列。探針被設計為具有引起更高的測定特異性、靈敏度和準確性的改善的結合特性。本發明應用于分子生物學、進化生物學、元基因組學、基因分型領域，更具體地說，但不限於癌症診斷或胎兒染色體疾病，包括但不限於對樣品的一個或多個序列和/或多態性（諸如SNP和/或插入缺失）進行基因分型。

在一個尤其優選的實施方式中，橋寡核苷酸或橋寡核苷酸複合體包括用於鑑定樣品的信息，並包括獨特的條形碼。在這種情況下，第一和第二探針普遍適用於所有樣品（並且僅包含用於鑑定標靶的信息）。因此，在一個優選的實施方式中，提供了根據本發明的方法或試劑盒，其中橋寡核苷酸或橋寡核苷酸複合體包括含獨特序列的條形碼，該獨特序列使得能夠列舉每個樣品的標靶序列。＜實施例＞方法 1、探針複合體的形成

探針複合體包含基因組標靶定向、樣品索引和構建Illumina定序資料庫所需的序列。

能夠形成包括以下的三部分探針複合體（如圖2所示）：

（a）第一探針，從分子的5'端起具有第一橋寡核苷酸特異性序列，和位於第一探針的3'端的第一標靶特異性部分；

（b）第二探針，從分子的5'端起具有第二標靶特異性部分、第二序列條形碼和位於第二探針的3'端的第二橋寡核苷酸特異性序列；

和（c）橋寡核苷酸，其具有與第一探針中的第一橋寡核苷酸特異性序列和第二探針中的第二橋寡核苷酸特異性序列互補的序列。

通過在黏合反應中使所有三部分（橋、第一臂和第二臂）以等摩爾量結合來構建探針複合體。反應在熱循環儀中進行（黏合程序見表 1）。

表1

步驟	溫度	時間
1	+95°C	5 min
2	+95°C	1 min
-1°C/1 min，到 2 40x
3	+55°C	10 min
4	+55°C	1 min
-1°C/1 min，到 4 35x
5	+4°C	保持

2、標靶捕獲

標靶定向含有感興趣突變的特定基因組區域。經純化的DNA（例如來自組織、血漿、尿液或唾液）可以用作樣品，或者樣品可以是未純化的，只是經過預處理，例如煮沸和/或離心。

使探針複合體通過鹼基序列互補作用與標靶區域雜交。為了啟動標靶捕獲，反應探針和標靶DNA混合並在熱循環儀中孵育（標靶捕獲和間隙填補程序見表2）。

表2

步驟	溫度	時間	過程
1	+85°C	4 min	變性
2	+75°C	2.5 min
3	+65°C	2.5 min
4	+55°C	120 min	標靶捕獲
5	+50°C	10 min	間隙填補
6	+45°C	45 min
7	+4°C	保持

3、間隙填補（GapFill）反應

標靶捕獲後，通過加入Phusion DNA聚合酶、核苷酸和Ampligase DNA連接酶，並在+45°C下孵育45分鐘來延伸和連接探針複合體。 4、核酸外切酶處理

間隙填補後，通過加入1µl的不耐熱的核酸外切酶1（NEB，#M0568L）和1µl的RecJF 核酸外切酶（NEB，#M0264L），並在+37℃下孵育30分鐘，來去除線性分子。核酸外切酶通過在+92°C下孵育12分鐘來失活。 5、滾環擴增

延伸和連接後，使環形探針分子與標靶特異性探針對齊，並進行滾環擴增（RCA）。對於RCA反應中，將標靶捕獲反應與增強寡核苷酸（boost oligoes）混合並短暫變性。該反應隨後與含EquipPhi29（Thermo Scientific）聚合酶的RCA反應混合物混合。反應在+42°C下孵育30 min至2小時。RCA反應後，通過用Qubit熒光儀測量單鏈DNA（ssDNA）濃度來分析反應效率。 6、酶消化

RCA反應產生長的多聯體ssDNA分子，其具有多個標靶資料庫複製。每個完整的標靶資料庫由EcoRI限制性酶識別序列分隔。該序列通過與含EcoRI限制性酶識別序列的特異性寡核苷酸黏合，能夠對長的多聯體進行序列特異性切割，並釋放出準備好的標靶資料庫。這些資料庫經過簡單的純化步驟後，可用於進一步的分析。RCA產物在+37°C下用EcoRI消化1小時。 7、資料庫PCR

經消化的RCA產物在PCR反應中延伸到定序資料庫中，其中存在於右探針中的截短定序接頭延伸到流式細胞兼容的全長定序接頭中。 8、資料庫純化

資料庫PCR後，通過電泳後從瓊脂糖凝膠中提取資料庫分子或使用粒徑選擇珠（諸如Macherey Nagel NucleoMag）純化資料庫分子。 9、定序

可使用最先進的定序儀器對經純化的MiSeq或iSeq100兼容資料庫進行序列分析。重要的是，這些資料庫可以通過簡單的寡核苷酸修飾轉換成適合任何現有定序平臺的資料庫。結合使用Unix命令行工具以及Python和R編程語言來處理定序數據。簡而言之，序列處理的原理是鑑定每個讀長中的探針序列，對它們之間的基因組區域進行定序，並對與每個基因標靶相關的分子條形碼的數量進行計數。實驗1

在第一個實驗中，探針混合物是帶來四個重複反應的四種不同索引探針的集合。它們標靶定向圖5中列出的12個基因融合體。標靶寡核苷酸具有獨特的識別序列，允許鑑定每個標靶。

作為樣品，將兩種類型的合成標靶寡核苷酸以相等的濃度混合用於12種基因融合體中的每一種。如上所述進行標靶捕獲、延伸和連接反應、滾環擴增以及隨後的EcoRI消化。圖4是得到的定序資料庫的例子。

用iSeq100儀器對準備好的資料庫進行定序，通過匹配每個讀長中的探針序列、鑑定探針序列之間的基因組序列區域以及對分子條形碼進行計數來檢定序列數據中的標靶區域。計數數據準確地反映了各個基因融合體標靶的增強狀態（圖5）。在圖5中，與未增強相關的數據在圖中用字母“N”標記。沒有標記的條形柱與增強相關。圖1、圖2和圖3的詳細說明

圖1示出了所描述發明的一個實施方式的工作流程。在步驟1中，使樣品（102）中的核酸（DNA或RNA）與一組連接複合體（104）接觸。連接複合體在標靶核酸（106）上黏合。在步驟2中，從樣品材料可選地捕獲結合標靶的連接複合體，留下樣品雜質（103）。在步驟3中，使經黏合的連接複合體進行連接，得到經連接的連接複合體。在步驟4中，將來自多個樣品（110）的經連接的連接複合體彙集在一起（112）。在步驟5中，允許經連接的連接複合體與標靶核酸序列解離，加入標靶特異性探針，該標靶特異性探針包含與標靶核酸序列相應的序列，並且該標靶特異性探針與經連接的連接複合物黏合。標靶特異性探針特異性地與所選的罕見突變（114）黏合，並可選地包含修飾（包括但不限於硫代磷酸修飾），這些修飾增強了它們與標靶的結合或保護它們免受核酸外切酶活性的影響。在步驟6中，使用phi29聚合酶或其他鏈置換聚合酶通過滾環擴增來擴增探針序列，得到探針的長的多聯體複製。罕見突變的擴增以額外的效率增強（116）。在步驟7中，使用限制性內切酶（諸如EcoRI）或歸巢核酸酶（諸如I-CeuI）將多聯體探針複製可選地切割為單體單元，並可選地使用PCR或乳液PCR進一步擴增（117）。在步驟8中，使用次世代DNA定序對經擴增的DNA進行定序。在步驟9中，使用生物信息學管線將DNA定序結果轉換為標靶計數。

圖2A示出了根據本文實施方式的第一探針和第二探針之間的間隙填補。此處，橋寡核苷酸包含在橋序列1（228）和橋序列2（224）之間的Gap1。Gap2形成在在探針1和2（208和216）的標靶結合部分之間。通過引入聚合酶和一個或多個核苷酸來填補這些間隙。在此過程中，可使用Stoffel片段、Taq聚合酶或Phusion聚合酶，和DNA連接酶（諸如Ampligase）的混合物。聚合酶添加（a）與通用橋寡核苷酸序列互補和（b）與標靶序列互補的核苷酸，從而填補第一探針和第二探針之間的兩個間隙，即間隙1和間隙2，DNA連接酶的後續作用使得與橋寡核苷酸和標靶序列互補的第一探針和第二探針連接成環形複合體。

圖2B示出了根據本文實施方式的具有多個探針實體的探測五件套的原理結構。多個探針實體包括第一探針、第二探針和由三個寡核苷酸組成的橋。此處，探針複合體包含第一探針和第二橋（228和236）之間、第二橋和第二探針（240和222）之間、第一和第三橋寡核苷酸（238和242）之間以及第一和第二探針（208和216）之間的間隙。通過引入聚合酶和一個或多個核苷酸來填補這些間隙。在此過程中，可以使用Stoffel片段、Taq聚合酶或Phusion聚合酶和DNA連接酶（諸如Ampligase）的混合物。聚合酶填補這些間隙，並且DNA連接酶的後續作用使得探針和橋寡核苷酸連接成環形複合體。

第一探針的15-25個鹼基包括橋結合序列1（228），該序列可選地包括經化學修飾的鹼基，用於有效橋接寡核苷酸結合，被稱為橋序列1。第一探針進一步可選地自5'端包括後續10-20個鹼基，其包括用於資料庫索引的通用序列（204）。第一探針進一步可選地自5'端包括後續10-20個鹼基，其包括隨機核苷酸的片段（206），其形成被稱為條形碼1的分子特異性條形碼或樣品特異性條形碼。第一個探針的最後一個鹼基（210）可選地包括用於酶連接的磷酸部分或允許化學連接到相鄰探針的5’端的修飾（被稱為修飾1）。

第二探針的第一個鹼基（214）可選地包括用於酶連接的磷酸部或允許化學連接到相鄰探針的5'端的修飾（被稱為修飾2）。第二探針自5'端的15-30個鹼基（216）包括第二探針與基因標靶結合的部分。第二探針自5'端的後續10-20個鹼基可選地包括隨機核苷酸的片段（218），其形成被稱為條形碼2的分子特異性條形碼或樣品特異性條形碼。第二探針自5'端的後續10-20個鹼基（220）可選地包括通用序列。第二探針的最後15-25個鹼基（222）被稱為橋序列8，與第三橋寡核苷酸（224）的橋序列7反向互補。208、216、222或228的一些或全部核苷酸可包括化學修飾，以增加探針對標靶或橋寡核苷酸的親和力。

第一橋寡核苷酸自5'端起的前15-25個鹼基被稱為橋序列3（226），與第二探針的橋序列1（228）反向互補，並且可選地包括經化學修飾的核苷酸以增加結合。第一橋寡核苷酸的最後15-25個鹼基，被稱為橋序列2（238），與第二橋寡核苷酸的橋序列4（236）反向互補，並且可選地包括經化學修飾的核苷酸以增加結合。第一橋寡核苷酸的5'端可選地包括用於捕獲連接複合體的捕獲部（230）。

第二橋寡核苷酸自5'端起的前15-25個鹼基被稱為橋序列5（240），與第三橋寡核苷酸的橋序列6（242）反向互補，並且可選地包括經化學修飾的核苷酸以增加結合。第二橋寡核苷酸的最後15-25個鹼基，被稱為橋序列4（236），與第一橋寡核苷酸的橋序列2（238）反向互補，並且可選地包括經化學修飾的核苷酸以增加結合。

第三橋寡核苷酸自5'端起的前15-25個鹼基被稱為橋序列6（242），與第二橋寡核苷酸的橋序列5（240）反向互補，並且可選地包括經化學修飾的核苷酸以增加結合。第一橋寡核苷酸的最後15-25個鹼基，被稱為橋序列7（224），與第二探針的橋序列8（222）序列反向互補，並且可選地包括經化學修飾的核苷酸以增加結合。第三橋寡核苷酸的3'端可選地包括磷酸（或其它可裂解的）部（234），以防止間隙填補期間的延伸。

圖2C示出了包括使用條形碼環狀寡核苷酸的實施方式。此處，多個探針實體包括第一探針（202）、第二探針（201）、橋寡核苷酸（200）和條形碼環狀寡核苷酸（217）。此處，探針複合體包含第一探針和條形碼環狀寡核苷酸（210和213）之間的間隙、第二探針和條形碼環狀寡核苷酸（207和215）之間的間隙以及第一和第二探針（203和204）之間的間隙。通過引入聚合酶和一個或多個核苷酸來填補這些間隙。在此過程中，可以使用Stoffel片段、Taq聚合酶或Phusion聚合酶和DNA連接酶（諸如Ampligase）的混合物。聚合酶填補這些間隙，並且DNA連接酶的後續作用使得探針、橋和條形碼環狀寡核苷酸連接成環形複合體。

第一探針的15-25個鹼基包括橋結合序列（210），其可選地包括經化學修飾的鹼基，用於有效橋寡核苷酸結合。第一探針進一步包括自5'端起于基因標靶結合的後續15-30個鹼基（203）。210的一些或全部核苷酸可包括化學修飾，以增加探針對標靶或橋（209）的親和力。第一探針的最後一個鹼基可選地包括用於酶連接的磷酸部或允許化學連接到相鄰探針的5'端的修飾（205）。

第二探針的第一個鹼基可選地包括用於酶連接的磷酸部或允許化學連接到相鄰探針的5'端的修飾（206）。第二探針的5'端的15-30個鹼基包括第二探針與基因標靶結合的部分（204）。第二探針的最後15-25個鹼基（207）與橋寡核苷酸（208）反向互補。203、204、207或210的一些或全部核苷酸可包括化學修飾，以增加探針對標靶或橋寡核苷酸的親和力。

橋寡核苷酸的5'端的前15-25個鹼基（209）與第一探針的橋寡核苷酸特異性序列（210）反向互補，並可選地包括經化學修飾的核苷酸以增加結合。橋寡核苷酸的最後15-25個鹼基（208）與第二探針的序列（207）反向互補，並可選地包括經化學修飾的核苷酸以增加結合。橋寡核苷酸的5'端可選地包括用於捕獲連接複合體的捕獲部（211）。此外，橋寡核苷酸包括與條形碼環狀寡核苷酸的序列213和215互補的序列214和216。橋寡核苷酸的3'端可選地包括磷酸（或其他可裂解的）部（212），以防止在間隙填補過程中延伸。

條形碼環狀寡核苷酸的5'端的前15-25個鹼基（215）與橋寡核苷酸序列216反向互補。條形碼環狀寡核苷酸包括含條形碼（218）的環狀區域。條形碼環狀寡核苷酸的最後15-25個鹼基（213）與橋寡核苷酸序列214反向互補。

圖2D示出了根據本發明實施方式的探針四件套的原理結構。多個探針實體包括第一探針（202）、第二探針（201）、橋寡核苷酸（200）和條形碼環狀寡核苷酸（217）。此處，探針複合體包含第一探針與條形碼環狀寡核苷酸（210和213）之間、第二探針與條形碼環狀寡核苷酸（207和215）之間以及第一探針與第二探針（203和204）之間的間隙。通過引入聚合酶和一個或多個核苷酸來填補這些間隙。在此過程中，可使用Stoffel片段、Taq聚合酶或Phusion聚合酶和DNA連接酶（諸如Ampligase）的混合物。聚合酶填補這些間隙，並且DNA連接酶的後續作用使探針、橋和條形碼環狀寡核苷酸連接成環形複合體。

第一探針的15-25個鹼基包括橋結合序列（210），該序列可選地包括經化學修飾的鹼基，用於有效橋接寡核苷酸結合。第一探針進一步包括用於擴增引子的結合位點（221）和條形碼序列（222），以及自5'端起15-30個鹼基的與遺傳標靶結合的序列（203）。210的一些或全部核苷酸可包括化學修飾，以增加探針對標靶或橋（209）的親和力。第一探針的最後一個鹼基可選地包括用於酶連接的磷酸部或允許化學連接到相鄰探針的5'端的修飾（205）。

第二探針的第一個鹼基可選地包括用於酶連接的磷酸部或允許化學連接到相鄰探針的5'端的修飾（206）。第二探針的5'端的15-30個鹼基包括第二探針與基因標靶結合的部分（204）。第二探針進一步包括擴增引子的結合位點（223）、定序接頭序列（224）、限制性核酸內切酶（諸如EcoRI）的識別位點（225）和另一個定序接頭序列（207）。第二探針的最後15-25個鹼基（207）與橋寡核苷酸（208）反向互補。203、204、207或210的一些或全部核苷酸可包括化學修飾，以增加探針對標靶或橋寡核苷酸的親和力。

橋寡核苷酸的5'端的前15-25個鹼基（209）與第一探針的橋寡核苷酸特異性序列（210）反向互補，並可選地包括經化學修飾的核苷酸以增加結合。橋寡核苷酸的最後15-25個鹼基（208）與第二探針的序列（207）反向互補，並可選地包括經化學修飾的核苷酸以增加結合。橋寡核苷酸與條形碼環狀寡核苷酸（220）兩端不反向互補的部分可選地包含限制性核酸內切酶的識別位點。橋寡核苷酸的5'端可選地包括用於捕獲連接複合體的捕獲部（211）。此外，橋寡核苷酸包括與條形碼環狀寡核苷酸的序列213和215互補的序列214和216。橋寡核苷酸的3'端可選地包括磷酸（或其他可裂解的）部（212），以防止在間隙填補過程中延伸。

圖3示出了所描述發明的一個實施方式的工作流程如何增強樣品中罕見突變的檢測，其中所述樣品還包含不含突變的大量基因組。在步驟1中，結合標靶的連接複合體經受間隙填補和連接。在步驟2中，使經連接的連接複合體與標靶核苷酸序列解離，加入標靶特異性探針，所述標靶特異性探針包括與標靶核苷酸序列對應的序列，並且所述標靶特異性探針黏合至經連接的連接複合體。在步驟3和4中，使用phi29聚合酶或其他鏈置換聚合酶通過滾環擴增來擴增探針序列，產生探針的長的多聯體複製。只有當標靶特異性探針與標靶序列匹配時，始於標靶特異性探針的擴增才會發生。如果存在錯配，將只發生從橋寡核苷酸開始的擴增。

102:樣品 103:雜質 104:複合體 106:標靶核酸 110:樣品 112:彙集在一起 114:罕見突變 116:多聯體複製 117:擴增 200:核苷酸 201:第二探針 202:第一探針 203:核苷酸 204:核苷酸 205:探針 206:探針 207:核苷酸 208:核苷酸 209:核苷酸 210:核苷酸 211:捕獲部 212:部 213:序列 214:序列 215:序列、核苷酸 216:序列 217:核苷酸 218:條形碼 220:核苷酸 221:結合位點 222:序列 223:結合位點 224:序列 225:識別位點 226:橋序列3 228:橋序列1 230:捕獲部 234:部 236:橋序列4 238:橋序列2 240:橋序列5 242:橋序列6 3':端 5':端

圖1示出了根據本發明實施方式的多重連接測定（Multiplexed Ligation Assay，MLA）的流程圖。圖2A、圖2B、圖2C和圖2D示出了根據本發明實施方式的探針的原理組合。圖3示出了使用根據本發明實施方式的標靶特異性探針來檢測罕見突變。圖4示出了具有兩種不同標靶濃度的兩個增強的定序資料庫。圖5示出了一組12個基因融合體標靶上增強的效果。

TW202411431A_112132634_SEQL.xml

Claims

一種檢測樣品中一個或多個標靶核苷酸序列的方法，所述方法包括以下步驟：（i）為所述樣品中的每個標靶核苷酸序列提供：第一探針、第二探針，和橋寡核苷酸或能夠彼此黏合(annealing)以形成橋寡核苷酸複合體的多個寡核苷酸，其中，所述第一探針自分子的5'端起包括第一橋寡核苷酸特異性序列、可選的第一序列條形碼，和位於所述第一探針的3'端的第一標靶特異性部分；其中，所述第二探針自分子的5'端起包括第二標靶特異性部分、可選的第二序列條形碼，和位於所述第二探針的3'端的第二橋寡核苷酸特異性序列；其中，所述橋寡核苷酸或橋寡核苷酸複合體包括與所述第一探針中的第一橋寡核苷酸特異性序列和所述第二探針中的第二橋寡核苷酸特異性序列互補的序列，和可選的第三條形碼；其中，所述第一序列條形碼或者所述第二序列條形碼或者所述第三條形碼中的至少一者分別存在於所述第一探針或者所述第二探針或者所述橋寡核苷酸或橋寡核苷酸複合體中；並且其中，可選地，所述第一探針或者所述第二探針或者所述橋寡核苷酸或所述橋寡核苷酸複合體中的至少一者包括核酸內切酶的識別序列；（ii）對於所述一個或多個標靶核苷酸序列中的每一種，使所述第一探針和第二探針與所述橋寡核苷酸或能夠彼此黏合以形成橋寡核苷酸複合體的多個寡核苷酸接觸並允許自黏合為多個連接複合體；（iii）使存在於待測試所述標靶核苷酸序列的所述樣品中的核酸與所述連接複合體接觸；（iv）允許所述第一探針的第一標靶特異性部分和所述第二探針的第二標靶特異性部分與標靶序列上基本相鄰的區段雜交，從而形成雜交複合體；（v）將所述雜交複合體中的探針連接起來，以提供經連接的連接複合體；（vi）使所述經連接的連接複合體與所述標靶核苷酸序列解離；（vii）加入標靶特異性探針，所述標靶特異性探針包括與所述標靶核苷酸序列對應的序列，其中所述標靶特異性探針能夠與所述經連接的連接複合體黏合，並允許所述標靶特異性探針黏合至所述經連接的連接複合體，從而形成擴增模板；（viii）用鏈置換聚合酶通過滾環擴增從擴增模板來擴增核酸，從而獲得單鏈的多聯體序列；（ix）可選地，在存在步驟（i）中指定的識別序列的條件下，進行通過以下方式獲得核酸片段的步驟：（a）切割在步驟（viii）中獲得的所述單鏈的多聯體序列，或（b）使在步驟（viii）中獲得的經擴增的一個或多個單鏈的多聯體序列與包含核酸內切酶的識別序列的特異性寡核苷酸黏合，其中所述寡核苷酸與步驟（i）中指定的所述識別序列黏合，從而獲得所述核酸內切酶的識別位點；以及，用所述核酸內切酶切割經黏合的複合體；（x）使步驟（viii）中獲得的多聯體序列或步驟（ix）中獲得的核酸片段經受定序技術以確定條形碼序列；以及（xi）通過確定所述第一標靶特異性部分和/或第二標靶特異性部分的至少一部分，和/或所述第一條形碼和/或所述第二條形碼的至少一部分，和/或所述第三條形碼的至少一部分，來鑑定所述樣品中標靶核苷酸序列的存在和/或數量。
如請求項1所述的方法，其中，所述方法用於高通量檢測多個樣品中的一個或多個標靶核苷酸序列，其中提供多個樣品，並且其中優選地，在單獨的管中對每個樣品進行步驟（ii）。
如請求項2所述的方法，其中，在步驟（viii）之前，彙集多個所述樣品。
如前述請求項中任一項所述的方法，其中，所述第一探針、所述第二探針、所述橋寡核苷酸或者多個橋寡核苷酸的寡核苷酸中的至少一者包括第一捕獲部，並且其中，在步驟（iv）和步驟（v）之間進行中間步驟（iv）（a），所述中間步驟（iv）（a）包括：使所述雜交複合體與含第二捕獲部的固體支持物接觸，允許所述第一捕獲部與所述第二捕獲部相互作用，從而使得所述雜交複合體與所述固體支持物相連；以及使與所述固體支持物相連的雜交複合體與所述樣品中未與所述固體支持物相連的組分分離。
如請求項4所述的方法，其中，所述方法在步驟（iv）（a）之前，不包括富集核酸的步驟。
如請求項4或5所述的方法，其中，所述第一捕獲部是生物素部，且第二捕獲部是鏈黴親和素部或親和素部。
如前述請求項中任一項所述的方法，其中，所述樣品或所述多個樣品包括血液樣品、唾液樣品、尿液樣品或糞便樣品。
如前述請求項中任一項所述的方法，其中，所述橋寡核苷酸，或者所述多個橋寡核苷酸中的一個或多個寡核苷酸，在與所述第一探針或所述第二探針不互補的區域中，包括多個通用鹼基類似物，以允許引入適合用作標靶列舉的分子條形碼的隨機序列，並且其中，在步驟（v）之前，使用聚合酶和核苷酸進行間隙填補步驟，以生成這種隨機序列。
如請求項8所述的方法，其中，所述多個通用鹼基類似物是多個5-硝基吲哚。
如前述請求項中任一項所述的方法，其中，所述方法包括使用能夠彼此黏合以形成橋寡核苷酸複合體的多個寡核苷酸，並且其中所述多個寡核苷酸包括條形碼環狀寡核苷酸，其中，所述條形碼環狀寡核苷酸自分子的5'端起包括第三橋寡核苷酸特異性序列、條形碼環狀序列和第四橋寡核苷酸特異性序列，其中所述條形碼環狀序列可以可選地包括所述第三條形碼，並且其中，一個或多個其他橋寡核苷酸包括與所述條形碼環狀寡核苷酸中的第三橋寡核苷酸特異性序列和第四橋寡核苷酸特異性序列互補的序列。
如前述請求項中任一項所述的方法，其中，所述橋寡核苷酸或者所述橋寡核苷酸複合體包括：（i）一至五個3'突出的鹼基，和/或（ii）3’磷酸，和/或（iii）從3'端起的三個位置內的一個或多個硫代磷酸酯修飾。
如前述請求項中任一項所述的方法，其中，對所述第一探針的3'端或所述第二探針的5'端，或者所述第一探針的3'端和所述第二探針的5'端進行修飾以允許所述第一探針與所述第二探針的化學連接。
如前述請求項中任一項所述的方法，其中，所述第一探針或所述第二探針的橋接部分，或者所述第一探針的橋接部分和所述第二探針的橋接部分，或者所述橋寡核苷酸，或者所述多個橋寡核苷酸中的寡核苷酸包括經化學修飾的鹼基以改進與所述橋寡核苷酸或橋寡核苷酸複合體的結合。
如前述請求項中任一項所述的方法，其中，所述第一標靶特異性部分、第二標靶特異性部分、第一橋寡核苷酸特異性序列和/或第二橋寡核苷酸特異性序列，彼此獨立地包含一個或多個經化學修飾的核苷酸。
如前述請求項中任一項所述的方法，其中，所述橋寡核苷酸或者所述多個橋寡核苷酸的寡核苷酸，包括一個或多個經化學修飾的核苷酸。
如前述請求項中任一項所述的方法，其中，使用phi29聚合酶或Bst聚合酶進行步驟（viii）。
如前述請求項中任一項所述的方法，其中，緊鄰步驟（x）且在步驟（x）之前，使用與所述第一探針和所述第二探針的通用部分結合的引子進行PCR擴增，其中所述引子可選地包括用於步驟（x）中的後續定序的接頭。
如前述請求項中任一項所述的方法，其中，使用納米孔定序進行步驟（x）中的定序，其中可選地使用轉座複合體對步驟（viii）中獲得的多聯體序列進行片段化。
如前述請求項中任一項所述的方法，其中，通過對每個標靶和每個樣品的分子條形碼的數量進行計數來允許對基因標靶進行列舉。
如前述請求項中任一項所述的方法，其中，對於兩個或更多個樣品或者對於兩個或更多個基因座/等位組合，使用條形碼序列來對樣品的一個或多個序列和/或多態性，諸如SNP和/或插入缺失，進行基因分型。
一種包括多個容器的成套的試劑盒，其中，至少一個容器容納一組或多組的第一探針和第二探針，並且至少一個容器容納一個或多個橋寡核苷或者能夠形成橋寡核苷酸複合體的多個寡核苷酸，其中所述第一探針自分子的5'端起包括第一橋寡核苷酸特異性序列、可選的第一序列條形碼，和位於第一探針的3'端的第一標靶特異性部分；所述第二探針自分子的5'端起包括第二標靶特異性部分、可選的第二序列條形碼，和位於第二探針的3'端的第二橋寡核苷酸特異性序列；所述橋寡核苷酸或橋寡核苷酸複合體包括與所述第一探針中的第一橋寡核苷酸特異性序列和所述第二探針中的第二橋寡核苷酸特異性序列互補的序列，以及可選的第三條形碼；所述第一序列條形碼或者所述第二序列條形碼或者所述第三條形碼中的至少一者分別存在於所述第一探針或者所述第二探針或者所述橋寡核苷酸或橋寡核苷酸複合體中；所述試劑盒進一步包括標靶特異性探針，所述標靶特異性探針包括與所述標靶核苷酸序列對應的序列，其中所述標靶特異性探針能夠與經連接的連接複合體黏合；並且可選地，所述第一探針或者所述第二探針或者所述橋寡核苷酸或橋寡核苷酸複合體中的至少一者包括核酸內切酶的識別序列；可選地，所述成套的試劑盒進一步包括能夠與所述識別序列黏合的寡核苷酸，從而獲得所述核酸內切酶的識別位點。