TW202302861A - 用於準確的平行定量稀釋或未純化樣品中的核酸的方法 - Google Patents

用於準確的平行定量稀釋或未純化樣品中的核酸的方法 Download PDF

Info

Publication number
TW202302861A
TW202302861A TW111109835A TW111109835A TW202302861A TW 202302861 A TW202302861 A TW 202302861A TW 111109835 A TW111109835 A TW 111109835A TW 111109835 A TW111109835 A TW 111109835A TW 202302861 A TW202302861 A TW 202302861A
Authority
TW
Taiwan
Prior art keywords
probe
sequence
target
oligonucleotide
specific
Prior art date
Application number
TW111109835A
Other languages
English (en)
Inventor
尤哈–佩卡 普西海莫
塔圖 希爾沃寧
馬努 塔米寧
安東尼 科爾基亞科斯基
Original Assignee
芬蘭商基諾米爾健康公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 芬蘭商基諾米爾健康公司 filed Critical 芬蘭商基諾米爾健康公司
Publication of TW202302861A publication Critical patent/TW202302861A/zh

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/6865Promoter-based amplification, e.g. nucleic acid sequence amplification [NASBA], self-sustained sequence replication [3SR] or transcription-based amplification system [TAS]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6834Enzymatic or biochemical coupling of nucleic acids to a solid phase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6834Enzymatic or biochemical coupling of nucleic acids to a solid phase
    • C12Q1/6837Enzymatic or biochemical coupling of nucleic acids to a solid phase using probe arrays or probe chips
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/6853Nucleic acid amplification reactions using modified primers or templates
    • C12Q1/6855Ligating adaptors
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2535/00Reactions characterised by the assay type for determining the identity of a nucleotide base or a sequence of oligonucleotides
    • C12Q2535/122Massive parallel sequencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2545/00Reactions characterised by their quantitative nature
    • C12Q2545/10Reactions characterised by their quantitative nature the purpose being quantitative analysis

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Analytical Chemistry (AREA)
  • Biophysics (AREA)
  • Immunology (AREA)
  • Microbiology (AREA)
  • Molecular Biology (AREA)
  • Biotechnology (AREA)
  • Physics & Mathematics (AREA)
  • Biochemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本發明公開內容係關於下一代DNA測序方法,以及用於例如在大體積的未純化的樣品材料中,準確和大規模平行定量一種或多種核酸靶的用途。更具體地,本發明係關於包含用於檢測且定量複雜樣品中的遺傳靶的探針的方法和試劑盒。本發明包括橋寡核苷酸或橋寡核苷酸複合物和每種遺傳靶的一種或多種靶特異性核酸探針。

Description

用於準確的平行定量稀釋或未純化樣品中的核酸的方法
本發明公開內容係關於改進的下一代DNA測序方法,用於一種或多種核酸靶的準確且大規模的平行定量。更具體地,本公開內容係關於包含用於檢測且定量複雜DNA池中的遺傳靶的探針的方法和試劑盒,所述複雜DNA池主要用於遺傳靶和變體檢測。本發明特別適用於檢測高度不純樣品例如從人體或動物體中獲得的樣品中的致病遺傳改變,所述樣品包括但不限於尿、活組織檢查、唾液和其它分泌物、呼出的水分提取物、組織、血漿(液體活組織檢查)等等。本發明使用橋寡核苷酸或橋寡核苷酸複合物和每種遺傳靶的一種或多種靶特異性核酸探針(左探針和右探針)。
隨著研究遺傳變異的技術的進步,在植物和動物中對其檢測並不複雜。然而,儘管測序成本降低,但特別是在具有弱信號的樣品中檢測且準確定量遺傳變異如突變目前仍是複雜、費力且昂貴的。可以更準確地表述各種問題,例如為了針對一致背景檢測遺傳信號的特異性、為了檢測微弱遺傳信號的靈敏度、用於準確定量檢測信號的準確度、靶向遺傳靶/測定的通量數目、成本/測定,確定當平行測定多重樣品時的測定成本規模的縮放,以及確定從取樣到結果的時間多長的周轉。
目前,用於液體活組織檢查和概念上相似的測定(如抗生素抗性基因檢測)的典型定量方法包括定量PCR(qPCR)、陣列qPCR、數字PCR、多重連接依賴性探針擴增(MLPA)或來自下一代DNA測序數據的定量。雖然定量方法是穩固且充分確定的方法,但每種方法都與下文更詳細地討論的具體問題相關:
定量PCR:定量PCR(qPCR)是包括在PCR期間(即實時)擴增靶向DNA分子的技術。實時PCR可以定量(定量實時PCR)和半定量,即高於/低於一定量的DNA分子(半定量實時PCR)使用。定量PCR(qPCR)是遺傳靶定量的黃金標準。目前,qPCR反應的實驗室成本為大約$2。然而,將用於建立反應的大量動手時間(勞動力成本)、關於標準曲線的需要連同關於每個定量靶的重複計算在內,實際成本事實上要高得多。由於對於每種遺傳靶都需要分開的定量實驗,因此隨著樣品數目增加,動手時間的量急劇增加。
陣列PCR:PCR陣列是用於分析專注於相關通路或疾病的基因實驗對象組表達的最可靠工具。每個96孔板、384孔板或100孔盤PCR陣列都包括SYBR Green優化的引物測定,用於充分研究集中的基因實驗對象組的的實驗對象組。qPCR技術的較新迭代是使各個qPCR反應小型化的陣列qPCR。陣列PCR降低了各個qPCR反應的成本,並且改善了該方法對多重靶和樣品的可縮放性。然而,該方法目前限於對來自12個樣品的384種靶(或相反地來自384個樣品的12種靶)進行概況分析,以數千美元/芯片的成本加上讀出基礎設施的大量資本成本。因此,使用前述設置對數千個樣品進行概況分析仍然是非常昂貴的。
數字PCR:數字聚合酶鏈反應(數字PCR、DigitalPCR、dPCR或dePCR)是通過液滴-微流體和熒光檢測提供靶的絕對定量的方法。該方法是相對成本效益的(一種靶/樣品花費$3左右),但是對於每個樣品中的每種靶製備、設置和運行各個實驗的動手時間很難擴展到數千個樣品。
多重連接依賴性探針擴增(MLPA)提供了簡化各個樣品中的多重遺傳靶檢測的方法。然而,MLPA僅提供靶的相對定量,並且需要對於每個樣品分開的檢測實驗。最近以來,MLPA的變體引入來自DNA條形碼的概念。與傳統的MLPA工作流相比,該概念允許更好的定量分辨率和樣品多重化。
基於下一代測序的方法:下一代測序(NGS),也稱為高通量測序,其使得基於序列的基因表達分析成為模擬技術的“數字”替代方案。隨著DNA測序的成本不斷下降,來自下一代DNA測序數據的靶計數變得越來越有吸引力,並且目前用於例如NIPT篩查中。然而,目前的方法具有高測序文庫製備成本和浪費在測序無關遺傳靶上的測序工作的缺點。例如,在癌症相關的液體活組織檢查中,非靶向方法導致對腫瘤學無關基因座的測序努力的浪費。在胎兒診斷中,基因座的非靶向取樣相當大地限制了用於解釋數據的統計選項。Guardant Health Inc提供了更靶向的測序方法,其中RNA捕獲探針的陣列富集了用於下一代DNA測序的靶。
Akhras等人(2007)PLoS ONE 2(2):e223公開了多重病原體檢測測定,其涉及加上條形碼的靶特異性探針、靶環化和測序。還公開了使用橋接寡核苷酸來連接靶特異性探針。
WO2019038372描述了下一代測序方法,其中目的靶序列被選擇性地擴增且測序。雖然這種方法允許樣品中的許多靶序列的準確和平行的檢測和定量,但更複雜、大體積和/或不純的樣品仍然是挑戰性的。
因此,鑒於前文討論,需要通過核酸靶的準確和大規模平行定量來克服上述缺點,例如但不限於特異性、靈敏度、準確度、通量、成本、縮放和周轉。
本發明提供了使用下一代測序,用於例如來自大體積樣品(高達數十毫升)和/或稀釋和/或未純化的樣品材料的高度可縮放和準確靶定量的方法。
在第一個主要方面,本發明涉及用於高通量檢測多個樣品中的一種或多種靶核苷酸序列的方法,所述方法包括以下步驟:
(i)對於每個樣品中的每種靶核苷酸序列提供:
第一探針、第二探針和橋寡核苷酸或能夠彼此退火以形成橋寡核苷酸複合物的多個寡核苷酸,
其中所述第一探針從分子的5'端開始包含第一橋寡核苷酸特異性序列、任選的第一序列條形碼,以及在第一探針的3'端處的第一靶特異性部分;
並且其中所述第二探針從分子的5’端開始包含第二靶特異性部分、任選的第二序列條形碼,以及在第二探針的3'端處的第二橋寡核苷酸特異性序列;
並且其中所述橋寡核苷酸或橋寡核苷酸複合物含有分別與第一探針和第二探針中的第一橋寡核苷酸特異性序列和第二橋寡核苷酸特異性序列互補的序列,以及任選的第三條形碼;
並且其中所述第一序列條形碼或第二序列條形碼或第三條形碼中的至少一種分別存在於第一探針或者第二探針或者橋寡核苷酸或橋寡核苷酸複合物中;
並且其中所述第一探針或者第二探針或者橋寡核苷酸或橋寡核苷酸複合物中的至少一種包含第一捕獲部分,
(ii)對於一種或多種靶核苷酸序列中的每種,優選地對於分開管中的每個樣品,使第一探針和第二探針與橋寡核苷酸或能夠形成橋寡核苷酸複合物的多個寡核苷酸接觸,並且允許自退火成多個連接複合物;
(iii)使待測試靶核苷酸序列的每個樣品中存在的核酸與連接複合物接觸;
(iv)允許第一探針和第二探針分別的第一靶特異性部分和第二靶特異性部分與靶序列上的基本上相鄰的區段雜交,從而形成雜交複合物;
(v)使雜交複合物與包含第二捕獲部分的固體支持物接觸,並且允許第一捕獲部分和第二捕獲部分相互作用,使得雜交複合物變得與固體支持物連接;
(vi)將連接有固體支持物的雜交複合物與未連接到固體支持物的樣品組分分開;
(vii)連接雜交複合物中的探針,以提供經連接的連接複合物;
(viii)合併來自多個樣品的經連接的連接複合物;
(ix)由一種或多種經連接的連接複合物擴增核酸;
(x)使步驟(ix)中獲得的核酸經受高通量測序技術,以確定條形碼序列;和
(xi)通過確定第一靶特異性部分和/或第二靶特異性部分的至少一部分、和/或第一條形碼和/或第二條形碼的至少一部分,和/或第三條形碼的至少一部分,來鑒定多個樣品中的靶核苷酸序列的存在和/或數目,
其中步驟(vii)和(viii)可以以任何次序執行。
在第二個主要方面,本發明涉及用於高通量檢測多個樣品中的一種或多種靶核苷酸序列的方法,所述方法包括以下步驟:
(i)對於每個樣品中的每種靶核苷酸序列提供:
●單個探針,其從分子的5’端開始包含第一靶特異性部分、包含條形碼的間隔子部分,以及在所述單個探針的3'端處的第二靶特異性部分,和
●橋寡核苷酸,其中所述橋寡核苷酸含有與單個探針的間隔子部分或間隔子部分的一部分互補的序列;
其中所述單個探針或橋寡核苷酸包含第一捕獲部分,
(ii)對於一種或多種靶核苷酸序列中的每種,優選地對於分開管中的每個樣品,使單個探針與橋寡核苷酸接觸,並且允許自退火;
(iii)使待測試靶核苷酸序列的多個樣品中存在的核酸與單個探針接觸,所述單個探針對橋寡核苷酸退火;
(iv)允許單個探針的第一靶特異性部分和第二靶特異性部分與靶序列上的基本上相鄰的區段雜交,從而形成雜交複合物;
(v)使雜交複合物與包含第二捕獲部分的固體支持物接觸,並且允許第一捕獲部分和第二捕獲部分相互作用,使得雜交複合物變得與固體支持物連接;
(vi)將連接有固體支持物的雜交複合物與未連接到固體支持物的樣品組分分開;
(vii)連接單個探針的5'端和3'端,以提供連經接的連接複合物,
(viii)任選地合併來自多個樣品的經連接的連接複合物,
(ix)由一種或多種經連接的連接複合物擴增核酸;
(x)使步驟(ix)中獲得的核酸經受高通量測序技術,以確定條形碼序列;和
(xi)通過確定第一靶特異性部分和/或第二靶特異性部分的至少一部分,和/或第一條形碼和/或第二條形碼的至少一部分,和/或第三條形碼的至少一部分,來鑒定多個樣品中的靶核苷酸序列的存在和/或數目,
其中步驟(vii)和(viii)可以以任何次序執行。
定義:
靶核苷酸序列:術語靶核苷酸序列可以是需要檢測其的任何目的核苷酸序列。應理解,所給出的術語指鄰接核苷酸的序列以及具有互補序列的核酸分子。在一些實施例中,靶序列是代表多態性或與多態性相關的核苷酸序列。
多態性:術語多態性指在群體中出現兩個或更多個遺傳上確定的替代序列或等位基因。多態性標記物或位點是在其處出現序列分歧的基因座。多態性基因座可以小至一個鹼基對。
樣品:術語樣品在本文中用於含有兩種或更多種靶序列的兩個或更多個樣品。可以製備如根據本發明的方法中提供的樣品,以便至少提取靶核酸並且使得這些靶核酸可由如本發明中使用的探針接近。特別地,在一些實施例中,樣品各自包含至少兩種不同的靶序列,優選至少100種,更優選至少250種,更優選至少500種,最優選至少2000種或更多種。術語樣品可以指但不限於從人體/動物體中獲得的兩個或更多個樣品,包括尿、活組織檢查、唾液和其它分泌物、呼出的水分提取物、組織、血漿(液體活組織檢查),或者從環境中獲得的兩個或更多個樣品,包括水、廢水、土壤、植物、含有病毒或細菌的樣品等等。在一個實施例中,多個樣品包括血液樣品、唾液樣品、尿樣品或糞便樣品、另一種體液樣品或來自身體材料的提取物例如毛髮或皮膚薄片。
探針:術語探針是可變長度(通常為50-1000個鹼基長,優選50-200個鹼基長)的DNA或RNA片段,其可以用於DNA或RNA樣品中,以檢測與探針中的序列互補的核苷酸序列(DNA或RNA靶)的存在。這樣設計與靶序列互補的寡核苷酸探針的區段,使得對於樣品中的每種靶序列,提供一對左探針和右探針,其中所述探針各自含有在其末端處的與靶序列的一部分互補的區段。可替代地,提供單個探針,其含有通過間隔區段分開的與靶序列的一部分互補的兩個區段。此外,本公開內容描述了橋寡核苷酸或橋寡核苷酸複合物,其用於連接左探針和右探針或用於與單個探針的間隔區段雜交。
通用:當用於描述擴增程序時,術語通用指使得能夠將單個引物或引物組用於多個擴增反應的序列。此類引物的使用極大地簡化了多重化,因為只需要兩個引物來擴增多個選定的核酸序列。當用於描述引發位點時,術語通用是通用引物將與之雜交的位點。還應注意,可以使用通用引發序列/引物“組”。
雜交:術語雜交(hybridization)(或雜交(hybridisation))描述了脫氧核糖核酸(DNA)或核糖核酸(RNA)分子對互補DNA或RNA退火的過程。DNA或RNA複製和DNA轉錄成RNA兩者均依賴核苷酸雜交。
連接:術語連接是通過酶的作用連接兩個核酸片段。DNA連接酶是能夠催化在互補鏈上的相鄰位點處結合的兩條多核苷酸鏈(的端部)之間形成磷酸二酯鍵的酶。在一個實施例中,連接也可以用化學方法執行,特別是如果多核苷酸的兩個相鄰端部進行修飾以允許化學連接。
擴增:如本文使用的術語擴增表示使用基於聚合酶的反應,來增加核苷酸序列的混合物內的特定核苷酸序列的濃度。“PCR”或“聚合酶鏈反應”是用於特異性DNA/RNA區段的體外酶促擴增的快速程序。待擴增的DNA/RNA可以通過加熱樣品來變性。術語引物是RNA或DNA的短鏈(一般約18-22個鹼基),其充當DNA合成的起點。它是DNA複製所必需的,因為催化這一過程的酶,DNA聚合酶,只能將新的核苷酸加入現有的DNA鏈中。T7 RNA聚合酶能夠將單個DNA分子轉錄且擴增成多重RNA拷貝,其可以轉換回cDNA。
聚合酶:聚合酶是合成核酸長鏈或聚合物的酶。DNA聚合酶和RNA聚合酶分別通過使用鹼基配對相互作用來拷貝DNA或RNA模板鏈,用於組裝DNA和RNA分子。本文使用的具體聚合酶,T7 RNA聚合酶,是來自T7細菌噬菌體的RNA聚合酶,其在5'→3'方向上催化RNA的形成。T7 RNA聚合酶需要部分雙鏈的DNA模板和Mg2+離子作為輔因子用於RNA的合成。T7 RNA聚合酶能夠將單個DNA分子轉錄且擴增成多重RNA拷貝。本文使用的另一種具體聚合酶,phi29聚合酶是來自細菌噬菌體phi29的鏈置換DNA聚合酶。Phi29聚合酶是高度進行性的,並且因此是用於環狀DNA模板的滾環擴增的理想聚合酶,以產生長的多聯體(concatemeric)序列。
高通量:術語高通量表示同時加工且篩選大量DNA樣品的能力;以及同時篩選單個DNA樣品內的大量不同遺傳基因座的能力。高通量測序或篩選,經常縮寫為HTS,是用於尤其與同時有效篩選大量樣品有關的科學實驗的方法。
尿嘧啶特異性切除試劑(USER):允許通過在脫氧尿苷核苷酸存在的地方切割,使環狀DNA分子線性化的試劑。
如上所述,本公開內容涉及通過利用連接依賴性測定,在非常大量的樣品中高通量檢測靶核苷酸序列檢測的方法。本公開內容提供了使用由下一代測序所允許的技術,用於確定複雜核酸池中的遺傳靶序列的方法。本公開內容還提供了通過利用連接依賴性測定,對大量樣品,優選非常大量的樣品中的多重遺傳靶進行概況分析的方法。本公開內容進一步提供了用於多重連接依賴性探針擴增的方法,使得能夠查詢多個樣品中的不同靶核酸。本發明的方法對於不同的靶核酸提供多個不同的探針組,允許多個樣品中的一種或多種靶核苷酸序列的測序。在處理測序數據時,獨特的序列標識符(identifiers)用於遺傳靶的鑒定和來自樣品池的各個樣品的絕對定量。
在第一個主要方面,本發明涉及用於高通量檢測多個樣品中的一種或多種靶核苷酸序列的方法,所述方法包括以下步驟:
(i)對於每個樣品中的每種靶核苷酸序列提供:
第一探針、第二探針和橋寡核苷酸或能夠形成橋寡核苷酸複合物的多個寡核苷酸,
其中所述第一探針從分子的5'端開始包含第一橋寡核苷酸特異性序列、任選的第一序列條形碼,以及在第一探針的3'端處的第一靶特異性部分;
並且其中所述第二探針從分子的5’端開始包含第二靶特異性部分、任選的第二序列條形碼,以及在第二探針的3'端處的第二橋寡核苷酸特異性序列;
並且其中所述橋寡核苷酸或橋寡核苷酸複合物含有分別與第一探針和第二探針中的第一橋寡核苷酸特異性序列和第二橋寡核苷酸特異性序列互補的序列,以及任選的第三條形碼;
並且其中所述第一序列條形碼或第二序列條形碼或第三條形碼中的至少一種分別存在於第一探針或者第二探針或者橋寡核苷酸或橋寡核苷酸複合物中;
並且其中所述第一探針或者第二探針或者橋寡核苷酸或橋寡核苷酸複合物中的至少一種包含第一捕獲部分,
(ii)對於一種或多種靶核苷酸序列中的每種,優選地對於分開管中的每個樣品,使第一探針和第二探針與橋寡核苷酸或能夠形成橋寡核苷酸複合物的多個寡核苷酸接觸,並且允許自退火成多個連接複合物;
(iii)使待測試靶核苷酸序列的每個樣品中存在的核酸與連接複合物接觸;
(iv)允許第一探針和第二探針分別的第一靶特異性部分和第二靶特異性部分與靶序列上的基本上相鄰的區段雜交,從而形成雜交複合物;
(v)使雜交複合物與包含第二捕獲部分的固體支持物接觸,並且允許第一捕獲部分和第二捕獲部分相互作用,使得雜交複合物變得與固體支持物連接;
(vi)將連接有固體支持物的雜交複合物與未連接到固體支持物的樣品組分分開;
(vii)連接雜交複合物中的探針,以提供經連接的連接複合物;
(viii)合併來自多個樣品的經連接的連接複合物;
(ix)由一種或多種經連接的連接複合物擴增核酸;
(x)使步驟(ix)中獲得的核酸經受高通量測序技術,以確定條形碼序列;和
(xi)通過確定第一靶特異性部分和/或第二靶特異性部分的至少一部分,和/或第一條形碼和/或第二條形碼的至少一部分,和/或第三條形碼的至少一部分,來鑒定多個樣品中的靶核苷酸序列的存在和/或數目,
其中步驟(vii)和(viii)可以以任何次序執行。
圖1提供了本發明的方法的一個實施例的非限制性圖示。
本發明的方法利用三種或更多種核酸探針,其中兩種靶特異性核酸探針(左探針和右探針)對於遺傳靶是特異性的,並且一種核酸探針或複合物通常是通用的(橋寡核苷酸或橋寡核苷酸複合物)。左探針和右探針與橋探針或橋寡核苷酸複合物雜交,形成連接複合物。在樣品DNA或RNA上具有靶鑒定位點的連接複合物(含有一個或多個條形碼序列)被允許針對查詢樣品的互補靶序列雜交。在雜交後,左探針和右探針用化學方法進行連接或通過DNA連接酶進行酶促連接,以形成連接的連接複合物。在本發明中,在待分析的多個樣品中的樣品分析期間,將形成多個此類經連接的連接複合物。
在一個實施例中,“多個樣品”可以指但不限於從人體或動物體中獲得的兩個或更多個樣品,包括活組織檢查、唾液和其它分泌物、呼出的水分提取物、組織、血漿(液體活組織檢查),從環境中獲得的兩個或更多個樣品,包括水、廢水、土壤、植物、含有病毒或細菌的樣品等等。
在一個優選的實施例中,樣品無需任何事先核酸純化或濃縮而使用。在另一個實施例中,樣品可以進行預處理,例如使細胞裂解以暴露核酸。
靶序列可以包括需要針對其檢測的任何感興趣的核苷酸序列。本公開內容的靶核苷酸序列可以得自(但不限於)患者的血液中的DNA級分或母體血液中的DNA級分。患者的血液中的DNA級分可能得自凋亡/壞死的癌細胞,或者來自胎兒和/或母體起源的母體血液中的DNA級分。進一步地,分析結果用於例如評價個體患給定類型癌症的風險,確定給定治療針對給定癌症的功效,在腫瘤中的藥物抗性有關突變的發展,或胎兒攜帶遺傳病症例如常見的三體綜合征唐氏綜合征、帕陶綜合征(Patau)和愛德華綜合征的風險。在某些實施例中,該方法包括對於每種靶核苷酸序列提供多個不同的探針組。
如本文使用的,術語探針組包括第一探針、第二探針和橋寡核苷酸(或橋寡核苷酸複合物),或:單個探針和橋寡核苷酸(或橋寡核苷酸複合物)。
在某些實施例中,第一探針從分子的5'端開始包括任選的5'磷酸鹽、第一橋寡核苷酸特異性序列、任選的第一通用序列、任選的第一序列條形碼,以及在其3'端處的第一靶特異性部分。在某些實施例中,第二探針從分子的5’端開始包括任選的5'磷酸鹽、第二靶特異性部分、任選的第二序列條形碼、任選的第二通用序列,以及在其3'端處的第二橋寡核苷酸特異性序列。
在一個優選的實施例中,第一探針或第二探針含有第一序列條形碼或第二序列條形碼中的至少一種。第一序列條形碼或第二序列條形碼或兩者,可以是隨機序列或者可以含有靶核苷酸序列標識符序列、樣品標識符序列和/或用於靶計數的分子條形碼。
在優選的實施例中,橋寡核苷酸或橋寡核苷酸複合物含有分別與第一探針和第二探針中的第一橋寡核苷酸特異性序列和第二橋寡核苷酸特異性序列互補的序列,任選的通用序列,和/或可以含有第三條形碼,其可以是隨機序列或者可以含有樣品或序列標識符序列。在這方面,第三條形碼並不一定意味著已經存在第一條形碼和第二條形碼。如較早描述的,經連接的連接複合物中應該存在至少一種條形碼,其使得能夠獨特地定義在測試的所有樣品中的所有連接複合物內的該複合物。
此外,第一探針或者第二探針或者橋寡核苷酸或橋寡核苷酸複合物中的至少一種包含第一捕獲部分。當在本文中使用時,第一捕獲部分指允許探針、連接複合物或雜交複合物由連接到固體支持物的第二捕獲部分捕獲,即與之結合的部分,例如化學基團。本領域已知的任何合適的捕獲部分都可以用於此目的。眾所周知的合適例子是使用鏈霉親和素包被的磁珠捕獲生物素化的分子。因此,在一個實施例中,第一捕獲部分是生物素部分,其可以與連接到固體支持物(如磁珠)的鏈霉親和素或親和素部分(第二捕獲部分)相互作用。其它選項包括可以用於與鏈霉親和素/親和素綴合的生物素衍生物,例如雙生物素、脫硫生物素或光可切割生物素。進一步的選項包括使用硫醇和丙烯酸酯基團用於丙烯酸酯/丙烯醯胺綴合,使用炔烴和疊氮基用於點擊化學,以及使用地高辛配基用於抗地高辛配基抗體綴合。綴合配偶體可以在任何固體表面例如珠(磁性或其它方式)或固體支持物上提供。
在一些實施例中,第一探針、第二探針或者橋探針或橋寡核苷酸複合物含有關於T7 RNA聚合酶的啟動子序列。啟動子序列允許在步驟(ix)中使用T7 RNA聚合酶擴增所連接的連接複合物。優選的是T7 RNA聚合酶的啟動子序列存在於橋寡核苷酸或橋寡核苷酸複合物中,但代替存在於橋寡核苷酸或橋寡核苷酸複合物中的啟動子,它也可以存在於第一探針或第二探針中。然而,在此類情況下,探針和寡核苷酸的設計必須是這樣的,使得T7 RNA聚合酶能夠轉錄對於樣品和靶的鑒定以及靶序列的計數所需的所有序列。
第一靶特異性部分、第二靶特異性部分、第一橋寡核苷酸特異性序列和/或第二橋寡核苷酸特異性序列,優選彼此獨立地含有至少一種化學修飾的核苷酸以增加探針結合。增加探針結合的化學修飾包括但不限於核糖核酸、肽核酸和鎖核酸(例如,如通過引用併入本文的WO2019038372的圖3中所示)。在一個實施例中,第一探針或第二探針或兩者的橋接部分包含化學修飾的鹼基,以改善與橋寡核苷酸或橋寡核苷酸複合物的結合。在另一個實施例中,第一靶特異性部分、第二靶特異性部分、第一橋寡核苷酸特異性序列和/或第二橋寡核苷酸特異性序列,彼此獨立地含有一種或多種化學修飾的核苷酸。在某些實施例中,化學修飾允許相鄰探針的化學連接。在一些實施例中,前述探針結合完全相鄰的遺傳基因座或相隔至多500個鹼基對,例如相隔至多200個鹼基對,例如相隔至多50個鹼基對,優選相隔至多40個鹼基對,更優選相隔至多30個鹼基對,更優選相隔至多20個鹼基對,更優選相隔至多10個鹼基對,最優選相隔至多5個鹼基對。
在使探針與包含靶序列的樣品接觸之前,優選地對於分開管中的每個樣品,使第一探針和第二探針與橋寡核苷酸或能夠形成橋寡核苷酸複合物的多個寡核苷酸接觸,並且允許自退火成連接複合物(步驟(ii))。在其中橋不是一個寡核苷酸,而是能夠彼此退火以形成橋寡核苷酸複合物的多個寡核苷酸,例如三個或五個寡核苷酸(本文在圖2C中示出)的一個實施例中,多個寡核苷酸可以在與第一探針和第二探針退火之前進行預退火,或所有退火步驟可以一次完成。
優選地,每種連接複合物對於第一靶特異性序列、第二靶特異性序列和一種或多種條形碼序列的組合是獨特的。這使得能夠在擴增和分析結果後計數靶序列。
此後,使多個樣品中的一種或多種靶核苷酸序列與多個連接複合物接觸(步驟(iii))。第一探針和第二探針分別的第一靶特異性部分和第二靶特異性部分與靶序列上的基本上相鄰的區段雜交,從而形成雜交複合物(步驟(iv))。在一些實施例中,樣品具有多於100微升,例如多於1 ml的體積。在一個進一步的實施例中,樣品具有低於5 pmol,例如低於1 pmol,例如低於200 fmol的核酸濃度。
隨後,使雜交複合物與包含第二捕獲部分的固體支持物接觸,並且允許第一捕獲部分和第二捕獲部分相互作用,使得雜交複合物變得與固體支持物連接(步驟(v))。此後,將連接有固體支持物的雜交複合物與未連接到固體支持物的樣品組分分開(步驟(vi))。如果固體支持物是磁珠,則可以使用磁體來固定珠,並且可以去除剩餘的液體樣品。任選地,在進行至步驟(vii)之前執行洗滌步驟。
步驟(v)和(vi)引起核酸的純化和富集,改善特別是對於高度不純的樣品的結果。在一個實施例中,本發明的方法並不包括在步驟(vi)之前富集核酸的步驟。因此,在一個實施例中,該方法在步驟(vi)之前並不含有其中原始樣品中的核酸被濃縮超過2倍、超過10倍或超過100倍的步驟。在另一個實施例中,本發明的方法並不包括在步驟(vii)中的連接之後的純化步驟。
隨後,用酶促或化學方法進行所形成的雜交複合物中的探針連接,以提供經連接的連接複合物(步驟(vii))。任選地,作為步驟(vii)的一部分,在第一探針和第二探針之間的間隙(如果存在的話)可以通過引入聚合酶和一種或多種核苷酸進行填充。聚合酶添加(a)與通用橋寡核苷酸序列或橋寡核苷酸複合物互補的核苷酸和/或(b)與條形碼序列互補的核苷酸,從而填充第一探針和第二探針之間的兩個間隙,引起連接的左探針和右探針以及通用序列和/或第三條形碼序列包括到橋互補鏈內。橋寡核苷酸從與連接探針互補的5'位點或3'位點延伸,使得存在於第一探針或第二探針中的靶序列標識符序列整合到橋寡核苷酸內。優選地,使用不破壞雙鏈DNA的聚合酶,例如Taq聚合酶,以便在第一探針和第二探針兩者對靶序列退火時,不干擾第一探針與第二探針的連接。
然後合併來自一個或多個靶樣品的經連接的連接複合物(步驟(viii))。步驟(vii)和(viii)可以以指定的次序執行,或可替代地以相反的次序執行。
接下來,由一種或多種經連接的連接複合物擴增核酸(步驟(ix))。
在一個實施例中,通過PCR使用與第一探針和第二探針的通用部分結合的引物來執行步驟(ix)中的擴增。
在另一個實施例中,第一探針或者第二探針或者橋寡核苷酸或橋寡核苷酸複合物中的至少一種包含關於核酸內切酶的識別序列,並且步驟(ix)通過以下執行:
(a)使用具有鏈置換聚合酶的滾環擴增,由一種或多種經連接的連接複合物擴增核酸,
(b)任選地使所獲得的擴增的一種或多種單鏈多聯體序列經受與含有所述識別序列的特異性寡核苷酸的退火,其中所述特異性寡核苷酸與所述識別序列退火,使得獲得關於所述核酸內切酶的識別位點,和
(c)任選地用所述核酸內切酶切割所獲得的單鏈多聯體序列或所獲得的退火複合物。合適的鏈置換聚合酶包括phi29聚合酶或Bst聚合酶。含有識別序列的特異性寡核苷酸通常含有在識別序列周圍的一些另外的特異性序列,以便允許形成穩定的雙螺旋用於切割。
在一些實施例中,並不進行切割,並且對多聯體序列執行隨後的高通量測序步驟(x)。
在另一個實施例中,步驟(ix)中的擴增使用T7 RNA聚合酶執行,所述T7 RNA聚合酶結合在經連接的連接複合物的寡核苷酸序列上的雙鏈T7 RNA聚合酶啟動子位點上,並且轉錄下游的RNA。例如通過使用乳液逆轉錄酶(RT)-PCR或T7 RNA聚合酶,可以進行從一種或多種經連接的連接複合物擴增合成的RNA。在通過T7 RNA聚合酶的RNA合成之後,但在cDNA合成或RT-PCR之前,通過將DNA特異性核酸外切酶和核酸內切酶加入合併的擴增反應中,可以進行游離樣品和探針核酸的去除。在一個實施例中,探針或者橋寡核苷酸或橋寡核苷酸複合物中的任一種含有脫氧尿苷部分,其允許通過使用尿嘧啶特異性切除試劑(USER)的切割來線性化。這使得能夠使用T7 RNA聚合酶從線性化的經連接的連接複合物轉錄RNA,所述T7 RNA聚合酶從嵌入橋寡核苷酸或橋寡核苷酸複合物或者第一探針或第二探針中的T7 RNA聚合酶啟動子開始RNA合成。T7 RNA聚合酶啟動子序列和脫氧尿苷部分應該這樣放置,以使得T7 RNA聚合酶能夠轉錄對於不同樣品中的不同靶計數所需的所有信息。在T7 RNA聚合酶和脫氧尿苷部分之間應該出現下述序列:使得能夠鑒定靶的至少一個序列、使得能夠鑒定樣品的至少一個序列,以及使得能夠確定該樣品中的靶序列拷貝數的至少一個獨特的條形碼序列。任選地,使用與通用位點反向互補的DNA-寡核苷酸分子,從RNA分子製備cDNA。RNA分子任選地被轉換為cDNA,並且任選地通過PCR或乳液PCR,使用與探針的通用部分結合的引物進行擴增。可替代地,可以使用RT-PCR或乳液RT-PCR。
任選地,在擴增後,去除固體支持物並且將上清液用於後續加工。例如,如果固體支持物是磁性顆粒,則這些磁性顆粒可以使用磁體去除。
在本發明的方法的另一個實施例中,第一捕獲部分和第二捕獲部分之間的相互作用在步驟(vi)之後、在步驟(vii)之後或在步驟(viii)之後立即被破壞。例如,如果第一捕獲部分是生物素,而第二捕獲部分是鏈霉親和素,則可以通過添加過量的可溶性生物素來破壞相互作用。如果鏈霉親和素與磁性顆粒結合,則它隨後可以使用磁體去除。
不管步驟(ix)中的擴增方法如何,在一些實施例中,用第一引物和第二引物對核苷酸分子(RNA分子、DNA分子或cDNA分子)進行(進一步)擴增,以提供擴增產物。優選地,使用通用第一引物和通用第二引物,它們與連接複合物中存在的第一通用序列或第二通用序列反向互補。
例如使用包括但不限於Illumina iSeq、MiSeq、HiSeq、NextSeq或NovaSeq的下一代測序平臺,通過高通量測序技術,通過確定第一靶特異性部分和/或第二靶特異性部分的至少一部分、第一條形碼和/或第二條形碼的至少一部分和/或第三條形碼的至少一部分,可以執行多個樣品中的靶核苷酸序列的存在和/或數目的鑒定(步驟(x)和(xi))。優選地,通過計數每種靶和每個樣品的分子條形碼數目來允許遺傳靶計數。樣品從序列數據中分離(解卷積),並且在DNA測序後在計算機芯片上(in silico)定量序列靶。
如上所述,在第二個主要方面,本發明涉及用於高通量檢測多個樣品中的一種或多種靶核苷酸序列的方法,所述方法包括以下步驟:
(i)對於每個樣品中的每種靶核苷酸序列提供:
●單個探針,其從分子的5’端開始包含第一靶特異性部分、包含條形碼的間隔子部分,以及在所述單個探針的3'端處的第二靶特異性部分,和
●橋寡核苷酸,其中所述橋寡核苷酸含有與單個探針的間隔子部分或間隔子部分的一部分互補的序列;
其中所述單個探針或橋寡核苷酸包含第一捕獲部分,
(ii)對於一種或多種靶核苷酸序列中的每種,優選地對於分開管中的每個樣品,使單個探針與橋寡核苷酸接觸,並且允許自退火;
(iii)使待測試靶核苷酸序列的多個樣品中存在的核酸與單個探針接觸,所述單個探針對橋寡核苷酸退火;
(iv)允許單個探針的第一靶特異性部分和第二靶特異性部分與靶序列上的基本上相鄰的區段雜交,從而形成雜交複合物;
(v)使雜交複合物與包含第二捕獲部分的固體支持物接觸,並且允許第一捕獲部分和第二捕獲部分相互作用,使得雜交複合物變得與固體支持物連接;
(vi)將連接有固體支持物的雜交複合物與未連接到固體支持物的樣品組分分開;
(vii)連接單個探針的5'端和3'端,以提供經連接的連接複合物,
(viii)任選地合併來自多個樣品的經連接的連接複合物,
(ix)由一種或多種經連接的連接複合物擴增核酸;
(x)使步驟(ix)中獲得的核酸經受高通量測序技術,以確定條形碼序列;和
(xi)通過確定第一靶特異性部分和/或第二靶特異性部分的至少一部分,和/或第一條形碼和/或第二條形碼的至少一部分,和/或第三條形碼的至少一部分,來鑒定多個樣品中的靶核苷酸序列的存在和/或數目,
其中步驟(vii)和(viii)可以以任何次序執行。
用於本發明的第一個方面的上述實施例作必要的修正應用於本發明的該第二個方面。
在一個實施例中,單個探針包含已化學連接的兩種或更多種寡核苷酸。
在一個實施例中,間隔子部分包含多於25個鹼基,例如多於50個鹼基,例如多於75個或多於100個鹼基,例如20至1000個鹼基,例如50至1000個鹼基。
本發明的兩個方面的優點包括但不限於:與傳統核酸測序技術相比,具有低成本、高簡單性、高特異性、高靈敏度、高準確度、高通量、高可縮放性和高周轉的定量測定。本發明的另一個方面是本發明的方法允許多重樣品包括人和動物群體,並且包括大體積的未純化的樣品材料中的多個核酸靶的準確和大規模平行定量。如提到的,在一個優選的實施例中,樣品例如尿樣品無需任何事先純化或核酸濃縮而使用。在另一個實施例中,樣品可以進行預處理,例如使細胞裂解以暴露核酸。本發明的一個特別優點在於使得能夠使用獨特的探針設計,即探針三聯體來檢測和擴增感興趣的靶序列。探針被設計為具有特別放置的經修飾核苷酸,其改善了退火和結合效率。結合性質的改善帶來更高的測定特異性、靈敏度和準確度。本發明的方法同樣適用於研究遺傳變體且可應用於診斷和預後,包括但不限於關於一種或多種序列和/或多態性例如SNP和/或插入缺失、癌症診斷或來自母體血液的胎兒染色體病症,對樣品進行基因分型。在一個優選的實施例中,對於兩個或更多個樣品或者兩個或更多個基因座/等位基因組合,條形碼序列用於關於一種或多種序列和/或多態性例如SNP和/或插入缺失,對樣品進行基因分型。
在另一本發明提供了用於本發明的方法中的試劑盒。在一個實施例中,多部分試劑盒(kit of parts)包括多個容器,其中至少一個容器包含一組或多組的第一探針和第二探針,並且至少一個容器包含一種或多種橋寡核苷酸或能夠形成橋寡核苷酸複合物的多個寡核苷酸,
其中所述第一探針從分子的5'端開始包含第一橋寡核苷酸特異性序列、任選的第一序列條形碼,以及在第一探針的3'端處的第一靶特異性部分;
其中所述第二探針從分子的5’端開始包含第二靶特異性部分、任選的第二序列條形碼,以及在第二探針的3'端處的第二橋寡核苷酸特異性序列;
其中所述橋寡核苷酸或橋寡核苷酸複合物含有分別與第一探針和第二探針中的第一橋寡核苷酸特異性序列和第二橋寡核苷酸特異性序列互補的序列,以及任選的第三條形碼;
並且其中所述第一序列條形碼或第二序列條形碼或第三條形碼中的至少一種分別存在於第一探針或者第二探針或者橋寡核苷酸或橋寡核苷酸複合物中;
並且其中所述第一探針或者第二探針或者橋寡核苷酸或橋寡核苷酸複合物中的至少一種包含能夠連接至第二捕獲部分的第一捕獲部分,所述第二捕獲部分與固體支持物連接。
優選地,第一探針的3'端或第二探針的5'端或兩者進行了修飾,以允許第一探針與第二探針的化學連接。
優選地,橋寡核苷酸或橋寡核苷酸複合物在與第一探針的序列互補的序列中或在與第二探針的序列互補的序列中或兩者中包含一種或多種化學修飾的核苷酸。
任選地,第一探針、第二探針或者橋寡核苷酸或橋寡核苷酸複合物包含允許通過使用尿嘧啶特異性切除試劑的切割的線性化的脫氧尿苷部分。
優選地,第一探針的3'端或第二探針的5'端或兩者進行了修飾,以允許第一探針與第二探針的化學連接。
優選地,第一探針或第二探針或兩者的橋接部分包含化學修飾的鹼基,以允許改善與橋寡核苷酸或橋寡核苷酸複合物的結合。
在一個具體實施例中,包含第一探針和第二探針組的至少一個容器,以及包含橋寡核苷酸或能夠形成橋寡核苷酸複合物的多個寡核苷酸的至少一個容器是同一個容器。在此類情況下,三種或更多種探針可以預先退火並且已形成連接複合物。
本發明的一個特別優點在於使得能夠使用獨特的探針設計,即探針三聯體來檢測和擴增感興趣的靶序列。探針被設計為具有改善的結合性質,帶來更高的測定特異性、靈敏度和準確度。本發明可應用於分子生物學、進化生物學、宏基因組學、基因分型領域,並且更具體而言(但不限於)癌症診斷或胎兒染色體病症,包括但不限於關於一種或多種序列和/或多態性例如SNP和/或插入缺失,對樣品進行基因分型。
在一個特別優選的實施例中,橋寡核苷酸或橋寡核苷酸複合物包含鑒定樣品的信息並且包括獨特標識符。在此類情況下,第一探針和第二探針通用地適用於所有樣品(並且僅包含鑒定靶的信息)。因此,在一個優選的實施例中,提供了根據本發明的方法或試劑盒,其中所述橋寡核苷酸或橋寡核苷酸複合物包含條形碼,其包含使得能夠計數每個樣品的靶序列的獨特序列。
在一個進一步方面,本發明涉及包括多個容器的多部分試劑盒,其中至少一個容器包含一種或多種單個探針,並且至少一個容器包含一種或多種橋寡核苷酸,
其中所述單個探針從分子的5’端開始包含第一靶特異性部分、包含條形碼的間隔子部分,以及在所述單個探針的3'端處的第二靶特異性部分,
其中所述橋寡核苷酸含有與單個探針的間隔子部分或間隔子部分的一部分互補的序列;
並且其中所述單個探針或橋寡核苷酸包含能夠連接至第二捕獲部分的第一捕獲部分,所述第二捕獲部分與固體支持物連接。
此外,本發明涉及:
實施例1:一種用於高通量檢測多個樣品中的一種或多種靶核苷酸序列的方法,所述方法包括以下步驟:
(i)對於每個樣品中的每種靶核苷酸序列提供:
第一探針、第二探針和橋寡核苷酸,
其中所述第一探針從分子的5'端開始包含第一橋寡核苷酸特異性序列、任選的第一序列條形碼,以及在第一探針的3'端處的第一靶特異性部分;
並且其中所述第二探針從分子的5’端開始包含第二靶特異性部分、任選的第二序列條形碼,以及在第二探針的3'端處的第二橋寡核苷酸特異性序列;
並且其中所述橋寡核苷酸含有分別與第一探針和第二探針中的第一橋寡核苷酸特異性序列和第二橋寡核苷酸特異性序列互補的序列,以及任選的第三條形碼;
並且其中所述第一序列條形碼或第二序列條形碼或第三條形碼中的至少一種分別存在於第一探針或第二探針或橋寡核苷酸中;
並且其中所述第一探針或第二探針或橋寡核苷酸中的至少一種包含第一捕獲部分,
(ii)對於一種或多種靶核苷酸序列中的每種,優選地對於分開管中的每個樣品,使第一探針和第二探針與橋寡核苷酸接觸,並且允許自退火成多個連接複合物;
(iii)使待測試靶核苷酸序列的每個樣品中存在的核酸與連接複合物接觸;
(iv)允許第一探針和第二探針分別的第一靶特異性部分和第二靶特異性部分與靶序列上的基本上相鄰的區段雜交,從而形成雜交複合物;
(v)使雜交複合物與包含第二捕獲部分的固體支持物接觸,並且允許第一捕獲部分和第二捕獲部分相互作用,使得雜交複合物變得與固體支持物連接;
(vi)將連接有固體支持物的雜交複合物與未連接到固體支持物的樣品組分分開;
(vii)連接雜交複合物中的探針,以提供經連接的連接複合物;
(viii)合併來自多個樣品的經連接的連接複合物;
(ix)由一種或多種經連接的連接複合物擴增核酸;
(x)使步驟(ix)中獲得的核酸經受高通量測序技術,以確定條形碼序列;和
(xi)通過確定第一靶特異性部分和/或第二靶特異性部分的至少一部分,和/或第一條形碼和/或第二條形碼的至少一部分,和/或第三條形碼的至少一部分,來鑒定多個樣品中的靶核苷酸序列的存在和/或數目,
其中步驟(vii)和(viii)可以以任何次序執行。
實施例2:根據實施例1的方法,其中所述多個樣品包括血液樣品、唾液樣品、尿樣品或糞便樣品。
實施例3:根據實施例1或2的方法,其中所述第一捕獲部分是生物素部分,並且所述第二捕獲部分是鏈霉親和素部分或親和素部分。
實施例4:根據實施例1-3中任一項的方法,其中在步驟(vi)和(vii)之間執行洗滌步驟。
實施例5:根據實施例1-4中任一項的方法,其中所述測序借助於下一代DNA或RNA測序來進行。
實施例6:根據實施例1-5中任一項的方法,其中第一探針的3'端或第二探針的5'端或兩者進行了修飾,以允許第一探針與第二探針的化學連接。
實施例7:根據實施例1-6中任一項的方法,其中所述第一探針或第二探針或兩者的橋接部分包含化學修飾的鹼基,以允許改善與橋寡核苷酸的結合。
實施例8:根據實施例1-7中任一項的方法,其中所述第一靶特異性部分、第二靶特異性部分、第一橋寡核苷酸特異性序列和/或第二橋寡核苷酸特異性序列,彼此獨立地含有一種或多種化學修飾的核苷酸。
實施例9:根據實施例1-8中任一項的方法,其中關於T7 RNA聚合酶的啟動子序列存在於第一探針、第二探針或橋寡核苷酸中,並且其中步驟(ix)中的擴增包括使用T7 RNA聚合酶從一種或多種經連接的連接複合物的RNA合成,所述T7 RNA聚合酶從嵌入經連接的連接複合物中的T7 RNA聚合酶啟動子開始RNA合成。
實施例10:根據實施例9的方法,其中所述第一探針、第二探針或橋寡核苷酸包含脫氧尿苷部分,所述脫氧尿苷部分允許通過使用尿嘧啶特異性切除試劑進行切割來線性化。
實施例11:根據實施例9的方法,其中在步驟(x)之前,使用DNA-寡核苷酸分子從RNA分子製備cDNA,所述DNA-寡核苷酸分子與第一探針或第二探針或橋寡核苷酸中存在的通用位點反向互補。
實施例12:根據實施例1-8中任一項的方法,其中所述第一探針或第二探針或橋寡核苷酸中的至少一種包含關於核酸內切酶的識別序列,並且其中(a)使用鏈置換聚合酶通過滾環擴增來執行從步驟(ix)中的一種或多種經連接的連接複合物擴增核酸,隨後為(b)任選地使所獲得的經擴增的一種或多種單鏈多聯體序列經受與含有所述識別序列的特異性寡核苷酸的退火,其中所述特異性寡核苷酸與識別序列退火,使得獲得關於所述核酸內切酶的識別位點,並且(c)用所述核酸內切酶切割所獲得的經擴增的一種或多種單鏈多聯體序列或所獲得的經退火複合物。
實施例13:根據實施例1-8中任一項的方法,其中使用與第一探針和第二探針的通用部分結合的引物通過PCR來執行步驟(ix)中的擴增。
實施例14:根據實施例1-13中任一項的方法,其中通過計算每種靶和每個樣品的分子條形碼數目來允許遺傳靶計數。
實施例15:根據實施例9-14中任一項的方法,其中用第一引物和第二引物擴增所述核苷酸分子,以提供擴增產物。
實施例16:包括多個容器的多部分試劑盒,其中至少一個容器包含一組或多組的第一探針和第二探針,並且至少一個容器包含一種或多種橋寡核苷酸,
其中所述第一探針從分子的5'端開始包含第一橋寡核苷酸特異性序列、任選的第一序列條形碼,以及在第一探針的3'端處的第一靶特異性部分;
其中所述第二探針從分子的5’端開始包含第二靶特異性部分、任選的第二序列條形碼,以及在第二探針的3'端處的第二橋寡核苷酸特異性序列;
其中所述橋寡核苷酸包含含有與第一探針和第二探針中的第一橋寡核苷酸特異性序列和第二橋寡核苷酸特異性序列互補的序列,以及任選的第三條形碼;
並且其中所述第一序列條形碼或第二序列條形碼或第三條形碼中的至少一種分別存在於第一探針或第二探針或橋寡核苷酸中;
並且其中所述第一探針或第二探針或橋寡核苷酸中的至少一種包含能夠連接至第二捕獲部分的第一捕獲部分,所述第二捕獲部分與固體支持物連接。
實例
方法
在一個實例中,原材料是5 ml尿。該過程開始於通過將樣品加熱至+95℃共15分鐘,使樣品材料中的蛋白質變性。然後將樣品材料以18 000 x g離心10分鐘,以去除沉澱的蛋白質和其它碎片,並且收集上清液用於後續步驟。
允許形成三部分探針複合物(如圖2中所示),其包含:
(a)第一探針,其從分子的5'端開始具有第一橋寡核苷酸特異性序列以及在第一探針的3'端處的第一靶特異性部分;
(b)第二探針,其從分子的5'端開始具有第二靶特異性部分、第二序列條形碼,以及在第二探針的3'端處的第二橋寡核苷酸特異性序列;
以及(c)橋寡核苷酸,其具有分別與所述第一探針和第二探針中的第一橋寡核苷酸特異性序列和第二橋寡核苷酸特異性序列互補的序列,以及5'生物素。
將三部分探針複合物以飛摩爾濃度加入樣品上清液內且退火(如圖1,步驟1中所示)。
然後將Dynabeads MyOne鏈霉親和素C1磁性顆粒加入反應內,並且在室溫下溫育1小時,以允許生物素和鏈霉親和素相互作用,使得雜交複合物變得與顆粒連接。然後使用磁體收穫顆粒,並且使用含有Tween 20的TE緩衝液洗滌顆粒,因此去除樣品雜質。
在洗滌步驟後,通過添加DreamTaq DNA聚合酶和Ampligase DNA連接酶的組合,並且在+45℃下溫育1小時,使珠結合的探針複合物延伸(間隙填充)(圖2B)並連接。通過添加靶向左側探針中的尿嘧啶部分的尿嘧啶特異性酶混合物(New England Biolabs,根據製造商的說明書使用),切割所得到的經延伸且連接的產物。
在延伸、連接和切割後,用T7反應緩衝液洗滌珠結合的分子,並且通過添加T7 RNA聚合酶和RiboLock RNase抑制劑的組合,並且在+37℃下溫育1小時,進行RNA合成。然後使用磁體去除磁性顆粒,並且保留上清液用於後續加工。
通過添加互補寡核苷酸並在+75℃下溫育5分鐘,使上清液中的RNA引發用於cDNA合成。然後將RiboLock RNase抑制劑和M-MLV逆轉錄酶加入反應內,並且在+37℃下溫育1小時。
隨後,使用索引PCR引物以及通過Phusion Hot Start II DNA聚合酶的PCR擴增,將cDNA製備成Illumina相容的DNA測序文庫。
最後,使用Illumina MiSeq或iSeq對文庫進行測序,並且使用Unix命令行工具以及Python和R編程語言的組合來處理測序數據。簡言之,關於序列處理的基本原理是鑒定每個讀數內的探針序列,對它們之間的基因組區域進行測序,並且計數與每種遺傳靶相關的分子條形碼數目。
實驗
在第一個實驗中,尿樣品用飛摩爾濃度的合成寡核苷酸進行摻料,所述合成寡核苷酸類似於基因如AKT1、CD74-ROS1、CHEK2、EGFR、EML4-ALK、KRAS、PIK3CA和TP53中的典型致癌突變。加入含有生物素的三部分探針以靶向這些基因。第一探針、第二探針和橋探針的長度分別為61、85和50 nt。
摻料樣品根據上述方法進行處理。通過凝膠電泳分析產物。典型結果的例子顯示於圖3中。
通過匹配每個讀數內的探針序列,鑒定探針序列之間的基因組序列區域並計數分子條形碼,在序列數據內檢測靶基因。計數數據準確地反映了摻料模板分子的數目,並且應答跨越四個數量級呈線性(圖4)。檢測到的信號對於靶分子的存在/不存在是高度特異性的(圖5)。
在另一個實例中,原材料是1 ml唾液。該過程類似地進行,除了在執行測定之前將樣品煮沸並離心之外。同樣對於這些樣品,檢測到的信號對於靶分子的存在/不存在是高度特異性的。
圖1和圖2的詳細描述
圖1示出了本發明的一個實施例的工作流,其中T7 RNA聚合酶用於擴增。如所述的,替代的擴增方法也是可能的。在步驟1中,使樣品(102)內的核酸(DNA或RNA)與一組連接複合物(104)接觸。連接複合物在靶核酸(106)上退火。在步驟2中,從樣品材料中捕獲靶結合的連接複合物,留下樣品雜質(103)。在步驟3中,將退火的連接複合物連接,得到經連接的連接複合物。在步驟4中,將來自多重樣品(110)的經連接的連接複合物合併在一起(112)。在步驟5中,使用T7 RNA聚合酶,由經連接的連接複合物合成RNA。任選地使用核酸內切酶和核酸外切酶的混合物去除探針和樣品DNA。將擴增的RNA轉換成cDNA(116),並且任選地使用PCR或乳液PCR進行擴增。在步驟6中,使用下一代DNA測序對擴增的DNA進行測序。在步驟7中,使用生物信息學管道,將DNA測序結果轉換成靶計數。
圖2A示出了根據本文的一個實施例,具有多個探針實體的探針三聯體的原理結構。多個探針實體包括在樣品退火之前組裝的左探針、右探針和橋寡核苷酸。左探針的第一個鹼基任選地包括用於酶促連接的磷酸鹽部分或允許化學連接到相鄰探針的5'端的修飾,稱為修飾1(202)。左探針的15-25個鹼基包括橋結合序列1(204),其可以進一步包括用於有效橋寡核苷酸結合的化學修飾鹼基,稱為橋位點1。前述區段還任選地包括T7 RNA聚合酶啟動子的反向互補序列。如先前所述的,該啟動子序列可以存在於第一探針或第二探針中,而不是存在於橋寡核苷酸中,條件是這樣設計寡核苷酸和探針,使得T7 RNA聚合酶能夠轉錄用於計數不同樣品中的靶序列的所有必要信息。左探針的隨後15-30個鹼基任選地包括用於PCR引物的通用結合位點,在本文中稱為通用位點1,(206)。左探針進一步任選地包括自5'端的隨後10-20個鹼基,其包括形成分子特異性條形碼或樣品特異性條形碼的隨機核苷酸區段,稱為條形碼1(208)。左探針進一步包括自5'端的與遺傳靶結合的隨後15-30個鹼基(210)。204或210的一些或全部核苷酸可以包括增加探針對靶或橋寡核苷酸(226)的親和力的化學修飾。左探針的最後一個鹼基任選地包括用於酶促連接的磷酸鹽部分或允許化學連接到相鄰探針的5'端的修飾,稱為修飾1(212)。
右探針的第一個鹼基任選地包括用於酶促連接的磷酸鹽部分或允許化學連接到相鄰探針的5’端的修飾,稱為修飾2(214)。自右探針的5’端的15-30個鹼基包括與遺傳靶結合的右探針的一部分(216)。自右探針的5'端的隨後10-20個鹼基任選地包括隨機核苷酸區段,其形成分子特異性條形碼或樣品特異性條形碼,稱為條形碼2(218)。自右探針的5'端的隨後15-30個鹼基任選地包括用於PCR引物的通用結合位點,稱為通用位點2(220)。右探針的最後15-25個鹼基包括用於有效橋寡核苷酸結合的序列,稱為橋序列2(222)。前述區段還任選地包括T7 RNA聚合酶啟動子的反向互補序列。如先前所述的,該啟動子序列可以存在於第一探針或第二探針中,而不是存在於橋寡核苷酸中,條件是這樣設計寡核苷酸和探針,使得T7 RNA聚合酶能夠轉錄用於計數不同樣品中的靶序列的所有必要信息。216或222的一些或全部核苷酸可以包括增加探針對靶或橋寡核苷酸(224)的親和力的化學修飾。右探針的最後一個鹼基任選地包括用於酶促連接的磷酸鹽部分或允許化學連接到相鄰探針的5'端的修飾,稱為修飾2。
自橋寡核苷酸的5’端的前15-25個鹼基,稱為橋序列3(226),與左探針的橋序列1(204)反向互補,並且任選地包括化學修飾的核苷酸用於增加結合。橋的隨後15-25個鹼基,稱為橋序列4(224),與右探針的橋序列2(222)序列反向互補,並且任選地包括化學修飾的核苷酸用於增加結合。橋序列3(226)或橋序列4(224)任選地包括T7 RNA聚合酶啟動子的序列。橋寡核苷酸的5'端包括用於捕獲連接複合物的第一捕獲部分(228)。
圖2B示出了根據本文的一個實施例,填充於第一探針和第二探針之間的間隙。此處,橋寡核苷酸含有在橋序列3(226)和橋序列4(224)之間的間隙序列1(230)。間隙序列(230)可以任選地包括T7 RNA聚合酶啟動子的序列。通過引入聚合酶和一種或多種核苷酸來填充左探針和右探針之間的間隙。對於這個過程,可以使用Stoffel片段、Taq聚合酶或Phusion聚合酶。聚合酶添加(a)與通用橋寡核苷酸序列互補的核苷酸和(b)與靶序列互補的核苷酸,從而填充兩個間隙,即第一探針和第二探針之間的間隙1和間隙2,使得與橋寡核苷酸互補的左探針和右探針的連接。以這種方式,如果條形碼存在於位置230中的橋寡核苷酸中,則該條形碼被整合到互補序列中。任選地,橋寡核苷酸探針224從與經連接的探針互補的5'位點或3'位點延伸,使得如果條形碼存在於探針1或探針2和/或靶序列210和216中,則該條形碼被整合到橋寡核苷酸內,從而形成連接的連接複合物。然而,應注意聚合酶的作用並不干擾在靶序列的位點處的探針連接。例如,使用在它到達雙鏈DNA部分時停止其作用的聚合酶是可能的,如例如存在於與靶序列雜交的第一探針和第二探針的部分處。T7 RNA聚合酶啟動子序列可以嵌入連接複合物內的橋寡核苷酸的位置226、230或224內。脫氧尿苷部分可以嵌入位置204和206之間,或左探針中的206內。
圖2C示出了根據本文的一個實施例,具有多個探針實體的探針五聯體(quintet)的原理結構。多個探針實體包括左探針、右探針以及由三個寡核苷酸組成的橋。此處,探針複合物含有在左探針和第二橋(228和236)之間、在第二橋和右探針(240和222)之間、在第一橋寡核苷酸和第三橋寡核苷酸(238和242)之間,以及在左探針和右探針(208和216)之間的間隙。通過引入聚合酶和一種或多種核苷酸來填充這些間隙。對於這個過程,可以使用Stoffel片段、Taq聚合酶或Phusion聚合酶以及DNA連接酶(例如Ampligase)的混合物。聚合酶填充這些間隙,並且DNA連接酶的後續作用使得探針和橋寡核苷酸連接成環狀複合物。
左探針的15-25個鹼基包括橋結合序列1(228),其任選地包括用於有效橋寡核苷酸結合的化學修飾鹼基,稱為橋序列1。左探針進一步任選地包括自5'端的隨後10-20個鹼基,其包括用於文庫索引的通用序列(204)。左探針進一步任選地包括自5'端的隨後10-20個鹼基,其包括形成分子特異性條形碼或樣品特異性條形碼的隨機核苷酸區段,稱為條形碼1(206)。左探針進一步包括自5'端的與遺傳靶結合的隨後15-30個鹼基(208)。228的一些或全部核苷酸可以包括增加探針對靶或橋(226)的親和力的化學修飾。左探針的最後一個鹼基任選地包括用於酶促連接的磷酸鹽部分或允許化學連接到相鄰探針的5'端的修飾,稱為修飾1(210)。
右探針的第一個鹼基任選地包括用於酶促連接的磷酸鹽部分或允許化學連接到相鄰探針的5’端的修飾,稱為修飾2(214)。自右探針的5’端的15-30個鹼基包括與遺傳靶結合的右探針的一部分(216)。自右探針的5'端的隨後10-20個鹼基任選地包括隨機核苷酸區段,其形成分子特異性條形碼或樣品特異性條形碼,稱為條形碼2(218)。從右探針的5'端開始的隨後10-20個鹼基任選地包括通用序列(220)。右探針的最後15-25個鹼基,稱為橋序列8(222),與第三橋寡核苷酸(224)的橋序列7反向互補。208、216、222或228的一些或全部核苷酸可以包括增加探針對靶或橋寡核苷酸的親和力的化學修飾。
自第一橋寡核苷酸的5’端的前15-25個鹼基,稱為橋序列3(226),與左探針的橋序列1(228)反向互補,並且任選地包括化學修飾的核苷酸用於增加結合。第一橋寡核苷酸的最後15-25個鹼基,稱為橋序列2(238),與第二橋寡核苷酸的橋序列4(236)序列反向互補,並且任選地包括化學修飾的核苷酸用於增加結合。第一橋寡核苷酸的5'端任選地包括用於捕獲連接複合物的捕獲部分(230)。
自第二橋寡核苷酸的5'端的前15-25個鹼基,稱為橋序列5(240),與第三橋寡核苷酸的橋序列6(242)反向互補,並且任選地包括化學修飾的核苷酸用於增加結合。第二橋寡核苷酸的最後15-25個鹼基,稱為橋序列4(236),與第一橋寡核苷酸的橋序列2(238)序列反向互補,並且任選地包括化學修飾的核苷酸用於增加結合。
自5'端開始的第三橋寡核苷酸的前15-25個鹼基,稱為橋序列6(242),與第二橋寡核苷酸的橋序列5(240)序列反向互補,並且任選地包括化學修飾的核苷酸用於增加結合。第三橋寡核苷酸的最後15-25個鹼基,稱為橋序列7(224),與右探針的橋序列8(222)序列反向互補,並且任選地包括化學修飾的核苷酸用於增加結合。第三橋寡核苷酸的3'端任選地包括磷酸鹽(或其它可切割的)部分(234),以防止在間隙填充期間的延伸。
T7 RNA聚合酶啟動子序列可以嵌入連接複合物內的橋寡核苷酸的位置226、238或242或224內。脫氧尿苷部分可以嵌入位置204和228之間,或左探針中的206內。
204:橋結合序列1 206:條形碼1 210:修飾1 216:部分 220:橋序列2 224:橋序列2 226:識別位點 230:捕獲部分 3’:端處 5’:端
圖1示出了根據本文的一個實施例的多重連接測定(MLA)的流程圖; 圖2A示出了根據本文的一個實施例,具有多個探針實體的探針三聯體的原理結構; 圖2B示出了根據本文的一個實施例,填充於第一探針和第二探針之間的間隙。 圖2C示出了根據本文的一個實施例,填充於第一探針和第二探針與橋複合物之間的間隙。 圖3使用實例中描述的工作流製備的兩個DNA測序文庫(泳道6-7),以及其中對於探針提供不正確的寡核苷酸靶的兩個陰性對照實驗(泳道8-9)的凝膠電泳。 圖4檢測到的分子計數準確地反映了摻料合成寡核苷酸靶的量。每行代表指定突變的三個摻料濃度。應答跨越四個數量級呈線性。 圖5檢測到的信號對於探針及其寡核苷酸靶的存在/不存在是高度特異性的。對於PIK3CA,測試了兩種不同的致癌變體。
Figure 12_A0101_SEQ_0001
Figure 12_A0101_SEQ_0002
Figure 12_A0101_SEQ_0003
Figure 12_A0101_SEQ_0004
Figure 12_A0101_SEQ_0005
Figure 12_A0101_SEQ_0006
Figure 12_A0101_SEQ_0007
Figure 12_A0101_SEQ_0008
Figure 12_A0101_SEQ_0009
Figure 12_A0101_SEQ_0010
Figure 12_A0101_SEQ_0011
Figure 12_A0101_SEQ_0012
204:橋結合序列1
206:條形碼1
210:修飾1
216:部分
220:橋序列2
224:橋序列2
226:識別位點
230:捕獲部分
3’:端處
5’:端

Claims (20)

  1. 一種用於高通量檢測多個樣品中的一種或多種靶核苷酸序列的方法,所述方法包括以下步驟: (i)對於每個樣品中的每種靶核苷酸序列提供: 第一探針、第二探針和橋寡核苷酸或能夠彼此退火以形成橋寡核苷酸複合物的多個寡核苷酸, 其中所述第一探針從分子的5'端開始包含第一橋寡核苷酸特異性序列、任選的第一序列條形碼,以及在第一探針的3'端處的第一靶特異性部分; 並且其中所述第二探針從分子的5’端開始包含第二靶特異性部分、任選的第二序列條形碼,以及在第二探針的3'端處的第二橋寡核苷酸特異性序列; 並且其中所述橋寡核苷酸或橋寡核苷酸複合物含有分別與所述第一探針和第二探針中的第一橋寡核苷酸特異性序列和第二橋寡核苷酸特異性序列互補的序列,以及任選的第三條形碼; 並且其中所述第一序列條形碼或第二序列條形碼或第三條形碼中的至少一種分別存在於所述第一探針或者第二探針或者橋寡核苷酸或橋寡核苷酸複合物中; 並且其中所述第一探針或者第二探針或者橋寡核苷酸或橋寡核苷酸複合物中的至少一種包含第一捕獲部分, (ii)對於一種或多種靶核苷酸序列中的每種,優選地對於分開管中的每個樣品,使所述第一探針和第二探針與所述橋寡核苷酸或能夠形成橋寡核苷酸複合物的多個寡核苷酸接觸,並且允許自退火成多個連接複合物; (iii)使待測試靶核苷酸序列的每個樣品中存在的核酸與所述連接複合物接觸; (iv)允許第一探針和第二探針分別的第一靶特異性部分和第二靶特異性部分與靶序列上的基本上相鄰的區段雜交,從而形成雜交複合物; (v)使所述雜交複合物與包含第二捕獲部分的固體支持物接觸,並且允許所述第一捕獲部分和第二捕獲部分相互作用,使得所述雜交複合物變得與固體支持物連接; (vi)將連接有固體支持物的雜交複合物與未連接到固體支持物的樣品組分分開; (vii)連接所述雜交複合物中的探針,以提供經連接的連接複合物; (viii)任選地合併來自多個樣品的經連接的連接複合物; (ix)由一種或多種經連接的連接複合物擴增核酸; (x)使步驟(ix)中獲得的核酸經受高通量測序技術,以確定條形碼序列;和 (xi)通過確定所述第一靶特異性部分和/或第二靶特異性部分的至少一部分,和/或所述第一條形碼和/或第二條形碼的至少一部分,和/或所述第三條形碼的至少一部分,來鑒定多個樣品中的靶核苷酸序列的存在和/或數目, 其中步驟(vii)和(viii)可以以任何次序執行。
  2. 如請求項1所述的方法,其中所述多個樣品包括血液樣品、唾液樣品、尿樣品、糞便樣品、另一種體液樣品或來自身體材料的提取物。
  3. 如請求項1或2所述的方法,其中所述第一捕獲部分是生物素部分,並且所述第二捕獲部分是鏈霉親和素部分或親和素部分。
  4. 如請求項1至3中任一項所述的方法,其中在步驟(vi)和(vii)之間執行洗滌步驟。
  5. 如請求項1至4中任一項所述的方法,其中所述測序借助於下一代DNA或RNA測序來進行。
  6. 如請求項1至5中任一項所述的方法,其中所述第一探針的3'端或所述第二探針的5'端或兩者進行了修飾,以允許所述第一探針與所述第二探針的化學連接。
  7. 如請求項1至6中任一項所述的方法,其中所述第一探針或所述第二探針或兩者的橋接部分包含化學修飾的鹼基,以允許改善與所述橋寡核苷酸或橋寡核苷酸複合物的結合。
  8. 如請求項1至7中任一項所述的方法,其中所述第一靶特異性部分、所述第二靶特異性部分、所述第一橋寡核苷酸特異性序列和/或所述第二橋寡核苷酸特異性序列,彼此獨立地含有一種或多種化學修飾的核苷酸。
  9. 如請求項1至8中任一項所述的方法,其中關於T7 RNA聚合酶的啟動子序列存在於所述第一探針、所述第二探針或者所述橋寡核苷酸或橋寡核苷酸複合物中,並且其中步驟(ix)中的擴增包括使用T7 RNA聚合酶從一種或多種經連接的連接複合物進行RNA合成,所述T7 RNA聚合酶從嵌入經連接的連接複合物中的T7 RNA聚合酶啟動子開始RNA合成。
  10. 如請求項9所述的方法,其中所述第一探針、所述第二探針或者所述橋寡核苷酸或橋寡核苷酸複合物包含脫氧尿苷部分,所述脫氧尿苷部分允許通過使用尿嘧啶特異性切除試劑進行切割來線性化。
  11. 如請求項9所述的方法,其中在步驟(x)之前,使用DNA-寡核苷酸分子從RNA分子製備cDNA,所述DNA-寡核苷酸分子與所述第一探針或者第二探針或者所述橋寡核苷酸或橋寡核苷酸複合物中存在的通用位點反向互補。
  12. 如請求項1至8中任一項所述的方法,其中所述第一探針或者第二探針或者橋寡核苷酸或橋寡核苷酸複合物中的至少一種包含核酸內切酶的識別序列,並且其中(a)使用鏈置換聚合酶通過滾環擴增來執行由步驟(ix)中的一種或多種經連接的連接複合物擴增核酸,隨後為(b)任選地使所獲得的經擴增的一種或多種單鏈多聯體序列經受與含有所述識別序列的特異性寡核苷酸的退火,其中所述特異性寡核苷酸與所述識別序列退火,使得獲得關於所述核酸內切酶的識別位點,以及(c)任選地用所述核酸內切酶切割所獲得的經擴增的一種或多種單鏈多聯體序列或所獲得的經退火複合物。
  13. 如請求項1至8中任一項所述的方法,其中使用與所述第一探針和第二探針的通用部分結合的引物通過PCR來執行步驟(ix)中的擴增。
  14. 如請求項1至13中任一項所述的方法,其中通過計算每種靶和每個樣品的分子條形碼數目來允許遺傳靶計數。
  15. 根據權利要求9-14中任一項所述的方法,其中用第一引物和第二引物擴增所述核苷酸分子,以提供擴增產物。
  16. 包括多個容器的多部分試劑盒,其中至少一個容器包含一組或多組的第一探針和第二探針,並且至少一個容器包含一種或多種橋寡核苷酸或能夠形成橋寡核苷酸複合物的多個寡核苷酸, 其中所述第一探針從分子的5'端開始包含第一橋寡核苷酸特異性序列、任選的第一序列條形碼,以及在第一探針的3'端處的第一靶特異性部分; 其中所述第二探針從分子的5’端開始包含第二靶特異性部分、任選的第二序列條形碼,以及在第二探針的3'端處的第二橋寡核苷酸特異性序列; 其中所述橋寡核苷酸或橋寡核苷酸複合物含有分別與所述第一探針和第二探針中的第一橋寡核苷酸特異性序列和第二橋寡核苷酸特異性序列互補的序列,以及任選的第三條形碼; 並且其中所述第一序列條形碼或第二序列條形碼或第三條形碼中的至少一種分別存在於所述第一探針或者第二探針或者橋寡核苷酸或橋寡核苷酸複合物中; 並且其中所述第一探針或者第二探針或者橋寡核苷酸或橋寡核苷酸複合物中的至少一種包含能夠連接至第二捕獲部分的第一捕獲部分,所述第二捕獲部分與固體支持物連接。
  17. 一種用於高通量檢測多個樣品中的一種或多種靶核苷酸序列的方法,所述方法包括以下步驟: (i)對於每個樣品中的每種靶核苷酸序列提供: ●單個探針,其從分子的5’端開始包含第一靶特異性部分、包含條形碼的間隔子部分,以及在所述單個探針的3'端處的第二靶特異性部分,和 ●橋寡核苷酸,其中所述橋寡核苷酸含有與所述單個探針的間隔子部分或間隔子部分的一部分互補的序列; 其中所述單個探針或橋寡核苷酸包含第一捕獲部分, (ii)對於一種或多種靶核苷酸序列中的每種,優選地對於分開管中的每個樣品,使所述單個探針與所述橋寡核苷酸接觸,並且允許自退火; (iii)使待測試靶核苷酸序列的多個樣品中存在的核酸與所述單個探針接觸,所述單個探針對所述橋寡核苷酸退火; (iv)允許所述單個探針的第一靶特異性部分和第二靶特異性部分與靶序列上的基本上相鄰的區段雜交,從而形成雜交複合物; (v)使所述雜交複合物與包含第二捕獲部分的固體支持物接觸,並且允許所述第一捕獲部分和第二捕獲部分相互作用,使得所述雜交複合物變得與固體支持物連接; (vi)將連接有固體支持物的雜交複合物與未連接到固體支持物的樣品組分分開; (vii)連接所述單個探針的5'端和3'端,以提供經連接的連接複合物, (viii)任選地合併來自多個樣品的經連接的連接複合物, (ix)由一種或多種經連接的連接複合物擴增核酸; (x)使步驟(ix)中獲得的核酸經受高通量測序技術,以確定條形碼序列;和 (xi)通過確定所述第一靶特異性部分和/或第二靶特異性部分的至少一部分,和/或所述第一條形碼和/或第二條形碼的至少一部分,和/或所述第三條形碼的至少一部分,來鑒定多個樣品中的靶核苷酸序列的存在和/或數目, 其中步驟(vii)和(viii)可以以任何次序執行。
  18. 如請求項17所述的方法,其中所述單個探針包含已化學連接的兩種或更多種寡核苷酸。
  19. 如請求項17或18所述的方法,其進一步包括權利要求2至15中任一項的特徵。
  20. 包括多個容器的多部分試劑盒,其中至少一個容器包含一種或多種單個探針,並且至少一個容器包含一種或多種橋寡核苷酸, 其中所述單個探針從分子的5’端開始包含第一靶特異性部分、含條形碼的間隔子部分,以及在所述單個探針的3'端處的第二靶特異性部分, 其中所述橋寡核苷酸含有與所述單個探針的間隔子部分或間隔子部分的一部分互補的序列; 並且其中所述單個探針或橋寡核苷酸包含能夠連接至第二捕獲部分的第一捕獲部分,所述第二捕獲部分與固體支持物連接。
TW111109835A 2021-03-18 2022-03-17 用於準確的平行定量稀釋或未純化樣品中的核酸的方法 TW202302861A (zh)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
EP21163299.7A EP4060049B1 (en) 2021-03-18 2021-03-18 Methods for accurate parallel quantification of nucleic acids in dilute or non-purified samples
EP21163299.7 2021-03-18
EP22152614.8 2022-01-21
EP22152614.8A EP4060052A1 (en) 2021-03-18 2022-01-21 Methods for accurate parallel quantification of nucleic acids in dilute or non-purified samples

Publications (1)

Publication Number Publication Date
TW202302861A true TW202302861A (zh) 2023-01-16

Family

ID=75108124

Family Applications (1)

Application Number Title Priority Date Filing Date
TW111109835A TW202302861A (zh) 2021-03-18 2022-03-17 用於準確的平行定量稀釋或未純化樣品中的核酸的方法

Country Status (8)

Country Link
US (1) US11898202B2 (zh)
EP (2) EP4060049B1 (zh)
JP (1) JP2022145605A (zh)
KR (1) KR20220130591A (zh)
CN (1) CN115109846A (zh)
CA (1) CA3149035A1 (zh)
ES (1) ES2960777T3 (zh)
TW (1) TW202302861A (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP4326898B1 (en) * 2021-08-16 2024-07-31 10X Genomics, Inc. Probes comprising a split barcode region and methods of use
US20240068010A1 (en) * 2022-08-31 2024-02-29 Genomill Health Oy Highly sensitive methods for accurate parallel quantification of variant nucleic acids

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007145612A1 (en) * 2005-06-06 2007-12-21 454 Life Sciences Corporation Paired end sequencing
CN106661631B (zh) * 2014-06-06 2021-04-02 康奈尔大学 从血液特异性靶向捕获人类基因组和转录组区域的方法
US9856521B2 (en) * 2015-01-27 2018-01-02 BioSpyder Technologies, Inc. Ligation assays in liquid phase
GB2570412A (en) * 2016-08-31 2019-07-24 Harvard College Methods of generating libraries of nucleic acid sequences for detection via fluorescent in situ sequencing
GB201621514D0 (en) * 2016-12-16 2017-02-01 Q-Linea Ab Padlock probe detection method
EP3447152A1 (en) 2017-08-25 2019-02-27 Eawag, Swiss Federal Institute of Aquatic Science and Technology Accurate and massively parallel quantification of nucleic acid
CN114901818A (zh) * 2018-11-21 2022-08-12 艾维达生物医学公司 靶向核酸文库形成的方法

Also Published As

Publication number Publication date
EP4060049B1 (en) 2023-08-23
EP4060052A1 (en) 2022-09-21
EP4060049C0 (en) 2023-08-23
CN115109846A (zh) 2022-09-27
EP4060049A1 (en) 2022-09-21
CA3149035A1 (en) 2022-09-18
JP2022145605A (ja) 2022-10-04
US20220298566A1 (en) 2022-09-22
ES2960777T3 (es) 2024-03-06
US11898202B2 (en) 2024-02-13
KR20220130591A (ko) 2022-09-27

Similar Documents

Publication Publication Date Title
US20230340564A1 (en) Accurate and massively parallel quantification of nucleic acid
US9745614B2 (en) Reduced representation bisulfite sequencing with diversity adaptors
US11486003B2 (en) Highly sensitive methods for accurate parallel quantification of nucleic acids
US11898202B2 (en) Methods for accurate parallel quantification of nucleic acids in dilute or non-purified samples
EP4215619A1 (en) Methods for sensitive and accurate parallel quantification of nucleic acids
US11970736B2 (en) Methods for accurate parallel detection and quantification of nucleic acids
EP4332235A1 (en) Highly sensitive methods for accurate parallel quantification of variant nucleic acids