TW202242130A - 循環轉錄因子分析 - Google Patents

循環轉錄因子分析 Download PDF

Info

Publication number
TW202242130A
TW202242130A TW110149064A TW110149064A TW202242130A TW 202242130 A TW202242130 A TW 202242130A TW 110149064 A TW110149064 A TW 110149064A TW 110149064 A TW110149064 A TW 110149064A TW 202242130 A TW202242130 A TW 202242130A
Authority
TW
Taiwan
Prior art keywords
dna
transcription factor
sample
fragments
subject
Prior art date
Application number
TW110149064A
Other languages
English (en)
Inventor
雅各 文森 米考夫
馬克 愛德華 愛寇斯頓
多利安 弗南德 法蘭索瓦 帕馬特
Original Assignee
比利時商比利時意志有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 比利時商比利時意志有限公司 filed Critical 比利時商比利時意志有限公司
Publication of TW202242130A publication Critical patent/TW202242130A/zh

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6804Nucleic acid analysis using immunogens
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2535/00Reactions characterised by the assay type for determining the identity of a nucleotide base or a sequence of oligonucleotides
    • C12Q2535/122Massive parallel sequencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2545/00Reactions characterised by their quantitative nature
    • C12Q2545/10Reactions characterised by their quantitative nature the purpose being quantitative analysis
    • C12Q2545/114Reactions characterised by their quantitative nature the purpose being quantitative analysis involving a quantitation step
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2563/00Nucleic acid detection characterized by the use of physical, structural and functional properties
    • C12Q2563/131Nucleic acid detection characterized by the use of physical, structural and functional properties the label being a member of a cognate binding pair, i.e. extends to antibodies, haptens, avidin

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Analytical Chemistry (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Engineering & Computer Science (AREA)
  • Immunology (AREA)
  • Genetics & Genomics (AREA)
  • Molecular Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Biochemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Microbiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Pathology (AREA)
  • Hospice & Palliative Care (AREA)
  • Oncology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Analysing Materials By The Use Of Radiation (AREA)
  • Investigating Or Analysing Biological Materials (AREA)

Abstract

本發明涉及透過微創體液測試檢測一主體中疾病的方法,該方法用於檢測循環染色質片段,該染色質片段包括轉錄因子和相連的DNA序列,作為主體中疾病存在的指標。

Description

循環轉錄因子分析
本發明涉及一種透過微創體液測試檢測主體中疾病的方法。本發明還涉及循環染色質片段的測量或檢測,該染色質片段包括作為主體中疾病存在指標的轉錄因子。
癌症是一種死亡率很高的常見疾病。該疾病的生物學被理解為涉及從癌前狀態到第I、II、III期和最終第IV期癌症的進展。對於大多數癌症疾病,死亡率差異很大,這取決於疾病是在早期局部階段、有效治療方案可用時發現,還是在疾病可能已經擴散到受影響器官內或之外、更難治療時的晚期階段發現。晚期癌症有各式各樣的症狀,包括可見的便血、尿血、咳嗽排出的血液、陰道排出的血液、不明原因的體重減輕、持續不明原因的腫塊(例如在乳房中)、消化不良、吞嚥困難、變化疣或痣以及許多其他可能的症狀,具體取決於癌症類型。然而,由於這些症狀而診斷出的大多數癌症已經處於晚期並且難以治療。大多數癌症在早期時無症狀或出現無助於診斷的非特異性症狀。因此,理想情況下,應使用癌症檢測及早發現癌症。
為了滿足對簡單的常規癌症血液檢測的需求,許多血源性蛋白質已被研究為潛在的癌症生物標記物,包括用於CRC的癌胚抗原(CEA)、用於肝癌的甲型胎兒蛋白(AFP)、用於卵巢癌的CA125、用於胰腺癌的CA19-9、用於乳癌的CA15-3、用於前列腺癌的PSA。然而,它們的臨床準確性對於常規診斷使用來說太低了,它們被認為更適合用於監測患者。
最近,該領域的工作人員研究了循環腫瘤DNA(ctDNA)作為癌症檢測的血液生物標記物。無細胞DNA(cfDNA)作為染色質片段在血液中循環,這些片段被認為源於每天大量細胞的細胞死亡(主要是細胞凋亡)。在細胞凋亡過程中,染色質斷裂成單核小體和寡核小體,其中一些從細胞中釋放出來,以游離核小體的形式循環。每個循環無細胞核小體都與長度小於200 個鹼基對(bp)的小DNA片段相關聯。類似地,已從片段組學(fragmentomics)分析中推斷出循環中由DNA結合的轉錄因子或其他非組蛋白染色質蛋白組成的無細胞染色質片段。在健康主體中,循環染色質片段被認為是造血來源的,並且含量很低。在患有多種疾病(包括許多癌症、自身免疫疾病、發炎性疾病、中風和心肌梗塞)的主體中發現循環核小體含量的升高因此cfDNA片段含量的升高(Holdenrieder & Stieber, 2009)。
癌症患者血液中的至少一些cfDNA被認為源自正在死亡或死亡的癌細胞將核小體和其他染色質片段釋放到循環中(即,cfDNA包括一些ctDNA)。對於癌症患者匹配的血液和組織樣品的研究表明,癌症相關突變存在於患者的腫瘤中(但不存在於他/她的健康細胞中),且亦存在於取自同一患者的血液樣品中的cfDNA中(Newman et al, 2014)。類似地,癌細胞中差異甲基化(透過胞嘧啶殘基的甲基化而產生表觀遺傳上的改變)的DNA序列亦可在循環中的cfDNA中檢測為甲基化序列。此外,由ctDNA組成的循環cfDNA的比例與腫瘤負荷有關,因此可以透過ctDNA存在的比例定量地監測疾病進展,以及透過其遺傳和/或表觀遺傳組成定性地監測疾病進展。對ctDNA的分析可以產生非常有用和臨床上準確的數據,這些數據與源自腫瘤內所有或許多不同群落(tumor clone)的DNA相關,因此在空間上整合了腫瘤群落。此外,與例如重複組織活檢比較,隨著時間的推移重複採血是更實用和經濟的選擇。ctDNA分析有可能徹底改變腫瘤的檢測和監測,以及透過研究腫瘤DNA在早期檢測復發和獲得性耐藥性以選擇腫瘤治療,而無需進行侵入性組織活檢程序。此ctDNA檢測可用於調查所有類型的癌症相關DNA異常(例如點突變、核苷酸修飾狀態、易位、基因複製數、微衛星異常和DNA鏈完整性),並可適用於常規癌症篩查、定期和更頻繁地監測和定期檢查最佳治療方案(Zhou et al, 2017)。
血漿通常用作ctDNA檢測的底物。從血漿中萃取cfDNA片段(包括任何ctDNA)(因此從與核小體、轉錄因子或其他蛋白質的結合中去除),並且分析核苷酸鹼基序列。可以採用任何DNA分析方法,但通常透過使用次世代定序儀器(Next Generation Sequencer)的深度定序進行分析。
由於DNA異常是所有癌症疾病的特徵,並且ctDNA已在所有已研究的癌症疾病中觀察到,因此ctDNA測試適用於所有癌症疾病。研究的癌症包括但不限於膀胱癌、乳癌、結腸直腸癌、黑色素瘤、卵巢癌、前列腺癌、肺肝癌、子宮內膜癌、卵巢癌、淋巴瘤、口腔癌、白血病、頭頸癌和骨肉瘤(Crowley et al,2013; Zhou et al, 2017; Jung et al, 2010)。
一種cfDNA分析的示例性方法涉及辨識一主體的cfDNA片段的組織或細胞來源。這種方法的基礎是循環中存在的所有cfDNA片段在細胞死亡或循環中都避免了核酸酶的消化,因為它們透過核小體內的蛋白質結合而免受核酸酶的作用。該方法涉及取自主體的血液樣品中 cfDNA的核小體片段化模式的確定,並在參考基因組中定位cfDNA片段的基因組位置。不同細胞類型的片段化模式不同,可用於識別主體的cfDNA的來源細胞。
這種方法涉及從血漿樣品中萃取cfDNA(包括任何ctDNA),並對DNA進行全基因組定序,以檢測cfDNA片段呈現的核小體結合DNA模式。透過使用生訊息學的電腦分析,cfDNA 片段的端點序列根據它們在一個或多個參考基因組中的基因組位置而定位。參考基因組內 cfDNA 端點的基因組位置提供了基因組的核小體保護的cfDNA涵蓋範圍圖譜。
透過如WO2017012592所述的使用生物訊息學的電腦分析,比較主體的核小體片段化模式與包含來自不同細胞來源的已知相對豐度的cfDNA的校準樣品,亦可確定不同細胞類型或組織對主體cfDNA的比例貢獻。
與含有核小體的染色質片段相連的cfDNA片段的長度通常為120-200bp。然而,cfDNA 的蛋白質結合和保護並不侷限於核小體中cfDNA的組蛋白結合。其他cfDNA片段(包括活性基因啟動子序列)在有核小體或在沒有任何核小體的情況下,還與轉錄因子、輔因子或其他非組蛋白染色質蛋白結合。在沒有核小體的情況下,這些蛋白質通常結合並保護35-80bp範圍內的較短cfDNA片段。然而,若所使用的DNA片段文庫製備方法(DNA fragment library preparation method)是適合長度小於100個鹼基對的短DNA片段的分離、擴增和定序,則只能透過實驗觀察到這些較短的cfDNA片段(Snyder et al, 2016)。
由於不同的DNA序列(包括不同的啟動子序列和基因序列)在不同的細胞中具有活性,因此活細胞中DNA在基因組中的蛋白質結合模式因細胞類型而異。任何細胞類型中DNA的蛋白質結合模式可以透過核酸酶可及位點(Nuclease Accessible Site)作圖確定,方法是用核酸酶消化從細胞中萃取的染色質,並對所得蛋白質保護的染色質片段中未消化的DNA進行定序。因此,如果將血液中的cfDNA片段視為體內核酸酶消化的產物,則發現的cfDNA序列應該對應於cfDNA起源的細胞中的蛋白質結合DNA序列。因此,原則上,血液中cfDNA片段序列的模式應該與由核酸酶可及位點作圖產生的原始細胞的染色質片段序列模式相似。因此,可以使用生物訊息學方法將從血液樣品確定的cfDNA序列的片段化模式與已知組織或癌症類型的細胞的核酸酶可及位點分析產生的已知DNA片段化模式進行比較,以確定cfDNA的來源組織。從健康主體採集的樣品中的結果表明,cfDNA來源的細胞是造血細胞。這種方法在取自癌症患者的樣品中的結果表明,cfDNA和 ctDNA源自包括造血細胞和其他細胞在內的細胞混合物。在許多情況下,所指的非造血細胞類型與患者癌症疾病的組織相關(Snyder et al, 2016)。
其他工作人員使用了類似的cfDNA片段端點分析方法,該方法涉及全基因組cfDNA定序(包括任何ctDNA),但將生物訊息學電腦分析重點放在轉錄因子結合位點(TFBS)序列上。這種方法的目的是確定TFBS的可接近性,並在取自癌症患者的血漿樣品中識別具有改變的可接近性的TFBS DNA序列(Ulz et al, 2019)。在這種方法中,從主體採集血漿樣品,並使用適用於長度小於100bp的小DNA片段的DNA文庫製備方法萃取和擴增cfDNA。使用次世代定序方法對DNA文庫進行定序。定序資料用於使用生物訊息學方法識別TFBS附近基因組區域中的cfDNA片段化模式。該分析涉及確定cfDNA片段在TFBS上的核小體定位譜及其在基因啟動子序列中的側翼序列(flanking sequence),以確定TFBS是否與含有cfDNA的染色質片段中的轉錄因子結合。該方法很複雜,但可以總結如下:
如果在橫跨TFBS和基因組側翼序列的DNA序列中觀察到的cfDNA片段化模式顯示出大約200bp的周期性,則這與降解中DNA的更強的蛋白質結合保護(在核小體結合位置的中心)以及更弱的蛋白質結合保護(在DNA未結合和未受保護的核小體之間)的交替有關。在這種情況下,TFBS和側翼序列被推測為覆蓋在染色質片段中的核小體,其包含血漿樣品中的 cfDNA。
如果存在的cfDNA片段化模式額外呈現TFBS及其側翼序列的蛋白質結合保護(但沒有(或減弱的)核小體相關週期性),則這與TFBS及其側翼序列的轉錄調控蛋白結合有關。在這種情況下,TFBS被推測已與血漿樣品中包含cfDNA的染色質片段中的一或多種轉錄因子和/或其他調控蛋白結合。
在健康主體中,發現的cfDNA片段化模式通常與造血細胞的核酸酶可及位點實驗獲得的模式相關。因此,在cfDNA中與轉錄因子結合或被核小體覆蓋的TFBS序列與在造血細胞中表現或不表現的轉錄因子相關。在癌症患者中,該模式涉及細胞類型的混合,其中,TFBS可能是在癌細胞類型中與轉錄因子結合和在造血細胞類型中與核小體結合。由於大多數cfDNA來自於造血細胞,只有少量來自於癌細胞,因此與造血訊號相比,癌症衍生的片段組學訊號很小。然而,已經開發了片段組學生物訊息學方法,以將 ctDNA中存在的小轉錄因子保護的TFBS片段訊號與造血來源的cfDNA成分中存在的更大的疊加的核小體週期性訊號分開。片段組學分析指出,混合的模式包括 cfDNA TFBS序列,這些序列是與不在造血細胞中表現但由癌組織表現的轉錄因子結合的轉錄因子。
染色質免疫沉澱(Chromatin Immunoprecipitation)後對染色質相連的DNA進行定序(ChIP-Seq)是一種用於定位細胞染色質蛋白的基因組位置的分析技術。一種典型的方法包括從細胞中萃取染色質,然後透過物理破壞(例如,超音波震盪)或使用切割DNA的核酸酶(例如,DNase或Micrococcal Nuclease)將染色質消化成單核小體或其他染色質片段。然後將片段化的染色質暴露於塗有抗體的固相支持物,該抗體旨在結合特定的感興趣的染色質蛋白,例如特定的經修飾組蛋白。包含特定結構的染色質片段被吸附(免疫沉澱)到固相上。然後從固相中萃取與吸附的染色質相連的DNA,並透過聚合酶連鎖反應(PCR)方法進行擴增。對擴增的DNA片段文庫進行定序以確定基因組內感興趣的染色質蛋白結合的位置。使用針對轉錄因子的抗體的ChIP方法也用於辨識特定轉錄因子的轉錄因子結合位點(TFBS)的基因組位置,或者在不同細胞類型中特定TFBS是否被特定轉錄因子佔據。
我們之前已經描述了針對含有特定表觀遺傳訊號的循環無細胞核小體的免疫測定測試,包括用於檢測癌症和其他疾病的特定轉譯後修飾、組蛋白同功異形體、修飾的核苷酸和非組蛋白染色質蛋白(如WO2005019826、WO2013030577、WO2013030579和WO2013084002中所述)。我們還描述了染色質片段的免疫測定測試,包括用於檢測癌症的轉錄因子結合 DNA(如 WO2017162755 中所述)。
我們現在報告具有卓越分析和臨床特異性和靈敏性的方法,用於分離和直接分析和測量含有一或多種轉錄因子以及相連的DNA片段的循環無細胞染色質片段。從很多的核小體片段中分離轉錄因子-DNA複合物簡化了分析,並消除了將轉錄因子覆蓋的TFBS訊號與主要核小體週期性訊號分離的需要。這些方法可用於血液樣品中作為非侵入性或微創血液檢測,用於包括癌症、自身免疫性疾病和發炎性疾病在內的疾病。
根據本發明的第一態樣,提供了一種檢測從一人類或動物主體獲得的一體液樣品中包含轉錄因子和DNA片段的一無細胞染色質片段之方法,包括步驟: (i)使該體液樣品接觸與該轉錄因子結合的一結合劑; (ii)檢測或測量與該轉錄因子相連的DNA 片段;和 (iii)使用該DNA片段的存在或量作為樣品中包含該轉錄因子的該無細胞染色質片段的含量的一量度。
根據本發明的另一態樣,提供了一種檢測一人類或動物主體中一疾病之方法,包括步驟: (i)使獲自該人類或動物主體的一體液樣品接觸與一轉錄因子結合的一結合劑; (ii)檢測或測量與該轉錄因子相連的DNA;和 (iii)使用DNA的存在或數量作為主體中存在該疾病的指標。
根據本發明的另一態樣,提供了一種檢測一人類或動物主體中受一疾病影響的組織之方法,包括步驟: (i)使獲自該人類或動物主體的一體液樣品接觸與一轉錄因子結合的一結合劑; (ii)對與轉錄因子相連的 DNA 進行定序;和 (iii)使用該轉錄因子的存在和相連的DNA 的序列作為一組合生物標記物以確定該主體中受該疾病影響的組織。
根據本發明的另一態樣,提供了一種評估一動物或人類主體是否適合進行醫學治療之方法,包括步驟: (i)檢測、測量或定序與從該主體獲得的一體液樣品中包含一轉錄因子的無細胞染色質片段相連的DNA;和 (ii)使用在步驟(i)中檢測到的相連的 DNA含量和/或序列作為替該主體選擇適當治療的一參數。
根據本發明的另一態樣,提供了一種監測一動物或人類主體治療之方法,包括步驟: (i)檢測、測量或定序與從主體獲得的體液樣品中包含一轉錄因子的無細胞染色質片段相連的 DNA; (ii)在一或多種時機下重複檢測、測量或定序與從該主體獲得的體液樣品中包含該轉錄因子的無細胞染色質片段相連的DNA;和 (iii)使用比較了步驟(i)和步驟(ii)之後所測得的相連的DNA含量和/或DNA序列的任何變化作為該主體病況任何變化的參數。
根據本發明的另一態樣,提供了一種試劑盒,用於檢測包含作為組合生物標記物的一轉錄因子和DNA 片段的無細胞染色質片段,該試劑盒包含:用於該轉錄因子的一配體或結合劑,可選擇性地加上用於擴增和/或定序與該轉錄因子相連的DNA的試劑、和/或用於核小體的一配體或結合劑、和/或基於如請求項1至22中任一項所述之方法使用該試劑盒的說明書。
根據本發明的另一態樣,提供了一種在所需主體中治療癌症的方法,其中,該方法包括以下步驟: (a)使獲自人類或動物主體的一體液樣品接觸與一轉錄因子結合之的一結合劑; (b)檢測、測量或定序與該轉錄因子相連的DNA片段;和 (c)使用DNA片段的存在、數量或序列作為該主體中癌症存在的指標;和 (d)如果在步驟(c)中確定該主體患有癌症,則給予治療。
一種檢測人類或動物胎兒中一疾病之方法,包括步驟: (i)從懷孕的人類或動物主體獲取一體液樣品; (ii)使該體液樣品接觸與一轉錄因子結合的一結合劑; (iii)檢測、測量或定序與該轉錄因子相連的DNA;和 (iv) 使用該DNA的存在、序列或數量作為胎兒中該疾病存在的指標。
轉錄因子與癌症有關,約佔所有已知癌基因的20%(Lambert et al, 2018)。我們之前已經描述了使用含有組織特異性轉錄因子的染色質片段作為血清中的生物標記物來檢測或診斷主體的癌症。轉錄因子的組織特異性可用於指示癌症起源的組織。例如,據報導轉錄因子TTF-1在甲狀腺和肺組織中表現,而不在其他組織中表現。因此,含有TTF-1的循環染色質片段的存在表示起源組織是肺或甲狀腺。我們還描述了用於測量含有轉錄因子的循環無細胞染色質片段的免疫測定方法。這種免疫測定涉及雙抗體(或其他結合劑)方法,其中一種抗體與轉錄因子結合,而另一種抗體結合到與轉錄因子相連的DNA或結合到包含在染色質片段中的核小體成分。在所描述的一個實施例中,將靶向結合轉錄因子的結合劑固定在固相上以分離含有轉錄因子的染色質片段(即免疫沉澱染色質片段)。然後使用與DNA結合的第二種結合劑檢測分離的染色質片段。這種免疫測定方法簡單、成本低且非侵入性的。
ChIP-Seq是一種通常應用於細胞染色質萃取物的方法,其在核酸酶消化或超音波處理進行片段化之後。有一些關於ChIP-Seq方法在EDTA血漿中應用的報導。由於血漿中的染色質已經片段化,因此不需要對樣品進行核酸酶消化或超音波處理。據報導,血漿中ChIP-Seq涉及使用抗組蛋白抗體從 EDTA 血漿中分離組蛋白,然後對組蛋白相連的DNA片段進行萃取、擴增和定序(Deligezer et al, 2008, Mansson et al, 2021, Sadeh et al, 2021, Vad-Nielsen et al, 2020)。
據作者所知,文獻中沒有描述用於直接分離、分析或定位完整循環轉錄因子-DNA染色質片段和相連TFBS DNA序列的ChIP-Seq方法。反而,該領域的工作人員已經開發出基於 DNA片段分析的間接方法。
片段組學就是這樣一種間接方法,其中透過生物訊息學方法分析從EDTA血漿中萃取的cfDNA的深度定序,以識別在原始樣品中作為轉錄因子-DNA結合的指標的DNA片段模式(Snyder et al, 2016, Ulz et al, 2019)。這是一種間接方法,因為片段組學的第一步是萃取所研究樣品中的所有DNA,這必然涉及破壞存在的所有轉錄因子-DNA複合物。這會破壞連接任何DNA片段或序列至任何轉錄因子或其他染色質蛋白質的所有訊息。TFBS的佔據是根據所萃取的DNA文庫中適當序列的短cfDNA片段 (35-80bp)的存在來推斷的。然而,無法知道附著在DNA片段上的染色質蛋白的身份(在DNA萃取之前),特別是因為許多蛋白質可能結合在感興趣的位點附近,如圖1和2所示。因此,片段組學方法的一個缺點是可以推斷但無法確定任何特定轉錄因子在任何特定TFBS的結合。
最近的另一種間接方法涉及EDTA血漿中的核小體ChIP-Seq,直接定位無細胞核小體位置,並使用核小體定位資料間接推斷轉錄因子位置(Sadeh et al, 2021)。
尚未報導用於轉錄因子-DNA複合物的直接ChIP方法是因為存在著到目前為止尚未解決的重大技術困難或障礙。這些技術困難包括(i)認識到一些轉錄因子-DNA複合物在血漿中穩定結合,而其他在體內動態結合的轉錄因子-DNA複合物將在血液或其他體液中解離,(ii) 認識到最常見的一類轉錄因子-DNA複合物在EDTA血漿中解離,但這是可以避免的,(iii) 細胞或組織材料的核萃取物是相對純的染色質製備物,可以以µg或mg的量獲得。相較之下,血液、血清或血漿含有極低含量的極不純染色質,其被高含量的其他循環蛋白質「污染」,(iv) 至少有數百種轉錄因子,任何特定的轉錄因子-DNA複合物將只是血漿中存在的數千種不同轉錄因子-DNA複合物中的一種。反過來說,cfDNA的總轉錄因子-DNA部分是總cfDNA 的一小部分(其中大部分包含核小體片段),而源自癌細胞的cfDNA比例是總cfDNA的一小部分。因此,包括任何特定轉錄因子的轉錄因子-DNA複合物只是一小部分中的一小部分中的一小部分,被高含量的其他蛋白質和其他物質污染。這樣做的一個後果是,血漿轉錄因子-DNA ChIP-Seq 方法中產生的特定訊號將很小(小於背景訊號),從而使有效的數據分析存在問題。
我們現在報告了檢測含有轉錄因子-DNA複合物的循環無細胞染色質片段的方法,具有卓越的分析靈敏度和卓越的組織特異性。這些方法還擴大了適用轉錄因子的使用範圍,以包括大多數或所有轉錄因子。
我們還報告了組合生物標記物的用途,該組合生物標記物由含有轉錄因子的染色質片段和與所述轉錄因子相連的DNA片段的序列組成,用於檢測疾病。這種組合生物標記物還具有非常高的組織特異性,可用作癌症的生物標記物。
分析靈敏度對於含有轉錄因子的循環無細胞和小體片段很重要,這些轉錄因子以低含量出現,接近或低於免疫測定的檢測極限。免疫分析檢測的分析極限隨分析設計和所用結合劑(通常是抗體)的親和力而變化,但可能在皮摩爾(picomolar)濃度範圍內。然而,DNA的聚合酶連鎖反應(PCR)檢測的分析靈敏度低了幾個數量級。數位PCR可檢測到每個樣品中低至幾個單一分子的濃度。因此,使用PCR擴增方法檢測與轉錄因子相連的DNA,而不是使用直接與 DNA(或核小體表位)結合的抗體,可以在極低含量下檢測含有轉錄因子的循環染色質片段。
除了透過使用PCR進行檢測來提高靈敏度外,基於其相連DNA含量的含有轉錄因子的染色質片段的分析亦導致了高分析靈敏度,其係透過處理不含相連核小體的大量轉錄因子。
因此,根據本發明的第一態樣,提供了一種檢測從人或動物主體獲得的體液樣品中包含轉錄因子和DNA片段的無細胞染色質片段的方法,包括以下步驟的: (i) 使體液樣品接觸與轉錄因子結合的結合劑; (ii) 檢測或測量與轉錄因子相連的DNA片段;和 (iii) 使用DNA片段的存在或含量作為樣品中包含轉錄因子的無細胞染色質片段的含量的量度。
在一實施例中,步驟(i)中使用的轉錄因子的抗體或其他結合劑被固定在固相上以從樣品中分離轉錄因子。
在一實施例中,該方法包括在檢測相連的DNA片段之前分離步驟(i)中結合的轉錄因子,即從剩餘的體液樣品中分離。例如,可以將洗滌緩衝液應用於在步驟(i)樣品中的與(固相)結合劑結合的轉錄因子,以去除未與結合劑結合的剩餘樣品。
在一實施例中,從轉錄因子中萃取與轉錄因子相連的DNA片段,以在步驟(ii)中檢測、測量或定序DNA片段。
在一實施例中,使用通用DNA結合劑例如抗DNA抗體或DNA螯合劑或嵌入劑,例如溴化乙錠,和花青染料,例如SYBR綠和SYBR金。
在一實施例中,步驟(ii)包括對與轉錄因子相連的DNA片段進行定序。定序方法在本領域中是眾所周知的。
根據一些實施例,在步驟(ii)中檢測或測量DNA片段是透過DNA片段的擴增來進行的,例如使用定量PCR方法來確定DNA片段的存在和/或含量。因此,根據本發明的另一態樣,提供了一種在人或動物主體中檢測包含轉錄因子和DNA片段的無細胞染色質片段的方法,包括步驟: (i) 使獲自人類或動物主體的體液樣品接觸與轉錄因子結合的結合劑; (ii) 分離與轉錄因子相連的DNA; (iii) 擴增DNA;和 (iv) 使用DNA片段的存在或含量作為樣品中包含轉錄因子的無細胞染色質片段的存在或含量的量度。
在一實施例中,使用DNA雜交方法檢測或測量擴增的DNA。
在另一實施例中,在轉接子寡核苷酸與DNA片段連接之後,進行轉錄因子結合的DNA片段的擴增。轉接子寡核苷酸可包括引子序列以利藉由PCR擴增DNA片段,或者可隨後添加引子序列。涉及轉接子寡核苷酸的方法在本領域中是眾所周知的並且通常用於製備用於次世代定序的文庫。因此,在本發明的一實施例中,提供了一種在人類或動物主體中檢測包含轉錄因子和DNA片段的無細胞染色質片段的方法,該方法包括步驟: (i) 使獲自人類或動物主體的體液樣品接觸與轉錄因子結合的結合劑; (ii) 分離與轉錄因子相連的 DNA; (iii) 將轉接子寡核苷酸連接到分離的DNA上; (iv) 擴增 DNA;和 (v) 使用DNA片段的存在或含量作為樣品中包含轉錄因子的無細胞染色質片段的含量的量度。
在一實施例中,使用設計用於擴增含有特定序列的DNA片段的特定序列PCR引子寡核苷酸,進行轉錄因子結合的DNA片段的擴增。該實施例有助於擴增選定的DNA片段,包含TFBS序列和/或側翼序列。該實施例亦為快速、低成本、易於自動化以實現高通量的,可在任何PCR實驗室中進行,並且另外透過將轉錄因子表現的聯合組織特異性與鑑定特異性結合進一步增加了健康或患病cfDNA組織的起源特異性,透過分析TFBS序列和/或染色質片段中相連DNA的側翼序列來確定其在基因組中的結合位置。因此,在本發明的一實施例中,提供了一種在人類或動物主體中檢測包含轉錄因子和DNA片段的無細胞染色質片段的方法,該方法包括步驟: (i) 使獲自人類或動物主體的體液樣品接觸與轉錄因子結合的結合劑; (ii) 分離與轉錄因子相連的DNA; (iii) 使用序列特異性PCR引子寡核苷酸來擴增DNA;和 (iv) 使用DNA片段的存在或含量作為樣品中包含轉錄因子的無細胞染色質片段的含量的量度。
在一實施例中,該方法包括萃取與轉錄因子相連的DNA片段。在另一實施例中,該方法包括擴增萃取的DNA片段。因此,根據本發明的另一態樣,提供了一種檢測從人類或動物主體獲得的體液樣品中包含轉錄因子和DNA片段的無細胞染色質片段的方法,該方法包括以下步驟: (i) 使樣品接觸與轉錄因子結合的結合劑; (ii) 分離結合的轉錄因子; (iii) 萃取與轉錄因子相連的 DNA; (iv) 擴增萃取的DNA; (v) 檢測擴增的萃取DNA;和 (vi) 使用DNA的存在或含量作為樣品中包含轉錄因子的無細胞染色質片段的含量的量度。
在較佳實施例中,透過PCR進行轉錄因子相連DNA的擴增。本領域已知許多PCR方法,包括但不限於:定量PCR、實時PCR、逆轉錄酶PCR、巢式PCR、數位PCR、多重PCR、隨機引子PCR、冷PCR(在較低變性溫度下的共擴增-PCR )。在一些實施例中,擴增方法包括DNA定量。
根據本發明的另一態樣,提供了一種檢測人類或動物主體疾病的方法,其包括步驟: (i) 使獲自人類或動物主體的體液樣品接觸與轉錄因子結合的結合劑; (ii) 檢測或測量與轉錄因子相連的DNA;和 (iii) 使用DNA的存在或含量作為主體中存在疾病的指標。
在本發明的另一態樣,提供了一種檢測人類或動物主體疾病的方法,其包括步驟: (i) 使獲自人類或動物主體的體液樣品接觸與轉錄因子結合的結合劑; (ii) 分離與轉錄因子相連的 DNA; (iii) 使DNA接觸DNA結合劑; (iv) 檢測DNA結合劑;和 (v) 使用DNA結合劑的存在或量作為主體中疾病的存在和/或性質的指標。
任何DNA結合劑都可以適用於本發明,包括抗體。DNA結合劑可直接或間接地(例如,透過諸如生物素/抗生物素蛋白或麩胺基硫的連接子系統)用可檢測的部分(例如螢光、酶或放射性部分)進行標記。
在本發明的另一態樣,提供了一種確定特定轉錄因子佔據的結合的基因組TFBS位置(以及因而還有哪些基因受到了調控),其是透過檢測包含轉錄因子和DNA的相連片段的無細胞染色質,其中,定序該與轉錄因子相連的DNA片段以確定該轉錄因子結合的基因組位置。因此,在本發明的另一態樣中,提供了一種用於確定轉錄因子結合的基因組位置的方法,包括步驟: (i) 使樣品接觸與轉錄因子結合的結合劑; (ii) 分離結合的轉錄因子; (iii) 萃取與轉錄因子相連的DNA; (iv) 擴增萃取的DNA; (v) 對擴增的萃取的DNA進行定序;和 (vi) 使用萃取的DNA的序列來確定TFBS的基因組位置。
本發明發現用於分析與轉錄因子結合的小DNA片段的特別用途,通常大小在35-80bp範圍內。因此,在一實施例中,被定序的萃取的DNA涉及小DNA片段,例如包含小於約100bp(例如小於約80bp,特別是小於約60bp)的DNA片段。應注意的是,這些DNA片段大小與沒有/在轉接子連接之前的DNA片段有關。在一實施例中,被定序的萃取的DNA包含大小範圍低於100bp的DNA片段,例如35-80bp(沒有/在轉接子連接之前)。在一實施例中,被定序的萃取的DNA包含多個DNA大小範圍,然後進行比較,例如,如圖10和11所示。
在較佳實施例中,樣品是體液樣品。在另一實施例中,體液樣品是血液、血清或血漿樣品。
在較佳實施例中,使用的結合劑是結合特定轉錄因子的抗體。因此,在一實施例中,與轉錄因子結合的結合劑是抗體或其片段(即一結合片段)。
在較佳實施例中,將抗體固定在固相上以利抗體結合的轉錄因子-DNA複合物或染色質片段的分離。
在循環染色質片段中,轉錄因子和已知與體內轉錄因子一致的序列的相連DNA片段的存在進一步證實了轉錄因子和DNA片段的身分。這種轉錄因子與相連DNA片段序列的組合是用於診斷或評估多種疾病狀況的強大生物標記物組合。此外,存在於健康主體中的許多轉錄因子與不同組織中的一組不同的TFBS結合,因此透過存在的相連DNA識別由轉錄因子結合的TFBS位置,可以識別染色質片段的起源組織。此外,這同樣適用於疾病狀況。因此,可以從與通常表現的轉錄因子結合的一組TFBS中識別疾病狀況的存在(即使轉錄因子本身在許多或所有組織中表現)。例如,通常表現的轉錄因子CTCF與永生癌細胞中的一千多個特定基因組位置結合,但在其他非癌細胞中不結合(Wang et al, 2012, Liu et al, 2017)。因此,鑑定循環CTCF-DNA複合物的存在,其中,定序相連DNA片段並觀察到其序列與 CTCF的其中一個癌症特異性TFBS位置一致,這指示了獲得樣品的主體中癌症疾病。因此,在本發明的一個高度較佳的實施例中,提供了一種用於檢測主體疾病狀態的方法,該方法透過檢測含有轉錄因子和DNA片段的無細胞染色質片段,他們共同形成一組合生物標記物,其鑑定出轉錄因子在從人類或動物主體獲得的體液樣品中,與疾病狀況或特定組織一致的基因組中轉錄因子佔據的TFBS位置,該方法包括以下步驟: (i) 使樣品接觸與轉錄因子結合的結合劑; (ii) 分離結合的轉錄因子; (iii) 萃取與轉錄因子相連DNA; (iv) 擴增萃取的DNA; (v) 定序擴增的萃取DNA;和 (vi) 使用相連DNA片段的序列作為染色質片段起源組織或主體疾病狀態的指標。
主體疾病狀態的確定可以包括,例如,疾病的或針對疾病的檢測、診斷、治療選擇、監測或預後。
在一實施例中,該方法包括使用轉錄因子和相連DNA的序列作為組合生物標記物,用於指示主體中疾病的存在。術語「生物標記物」是指過程、事件或狀態獨特的生物學或生物學衍生指標。生物標記物可用於診斷方法,例如臨床篩檢、預後評估和監測治療結果,確定最有可能對特定治療、藥物篩選和開發產生反應的主體。
這類生物標記物包括例如與轉錄因子相連DNA的存在(例如,序列)、含量、濃度或數量。本文所提及之「組合生物標記物」是涉及多於一種生物指標或生物性衍生指標(例如轉錄因子和相連DNA,特別是與DNA的一或多個特定序列相連的轉錄因子的含量、濃度或數量)的生物標記物。
組織特異性是重要的,因為大多數轉錄因子不具有完美的(單細胞類型)表現特異性。用於含有轉錄因子的循環染色質片段之免疫測定的組織特異性,受到所用抗體的分析特異性、以及所用轉錄因子或所用轉錄因子套組的組織特異性所限制。因此,可以透過組合特定的轉錄因子部分以及其結合的cfDNA片段的序列來提高組織特異性。
其原因是轉錄因子在不同細胞中的基因組中與不同DNA序列結合。基因表現透過轉錄因子與短TFBS DNA序列的特異性結合來調控,也稱為反應單元或結合模序(binding motif)。 TFBS通常但不一定位於受調控基因轉錄起始位點附近的基因啟動子區域。轉錄因子透過 DNA結合域(DNA Binding Domain,DBD)以序列特異性方式與TFBS結合。通常,TFBS序列在其靶基因的啟動子內長度為5-15bp,轉錄因子蛋白通常可以以不同程度的結合親和力與一組相似的DNA序列結合。與含有轉錄因子的循環染色質片段相連的DNA片段的長度將根據該片段是否還包括由其他轉錄因子、輔因子、核小體或其他染色質蛋白結合的其他DNA保護序列而變化。據報導,許多此類染色質片段出現在35-80bp範圍內(Snyder et al, 2016)。此外,我們注意到這與從癌症患者細胞中萃取的染色質用核酸酶消化產生的染色質片段的大小範圍一致,並且這個大約35-80bp的小片段範圍包含比核小體結合片段更高比例的總染色質片段(Corces et al, 2018)。我們得出結論,這些相連的DNA片段比典型的DNA反應單元長,因此包括側翼DNA序列。然而,與核小體相連的DNA片段大小通常超過100bp DNA。因此,我們得出結論,35-80bp DNA 片段範圍不包括完整的核小體DNA片段。
轉錄因子的響應單元或TFBS序列可能在基因組內的許多位置重複出現,並且對於某些轉錄因子出現在數千個位置。因此,相同的轉錄因子有可能結合在細胞染色質內的許多位置。這意味著,原則上,單個細胞的死亡可能會產生大量含有相同轉錄因子的循環染色質片段。
此外,轉錄因子往往不會單獨起作用,而是與調控特定基因所需的其他轉錄因子或輔因子或其他部分協同作用。因此,轉錄因子可以與大量不同基因的啟動子中的反應單元結合,每個基因都與不同的轉錄因子協同工作。因此,圍繞相同TFBS序列或相同轉錄因子的反應單元的DNA側翼序列在不同基因的啟動子中有所不同,因為其包含不同轉錄因子組合的結合模序。這適用於所有或大多數轉錄因子。
此外,反應單元本身的結合序列可以是簡併的(degenerate),因此轉錄因子可以結合多種不同的模序序列。例如,轉錄因子TTF-1在健康肺和健康甲狀腺組織中以組織特異性方式表現。在肺中,兩種蛋白質TTF-1因子結合至肺特異性表面活性劑蛋白B (Surfactant Protein B,SPB)基因的啟動子區域。SPB啟動子中TTF-1的DNA結合序列或結合模序是 GCNCTNNAG (SEQ ID NO: 1)(其中 A、C、G 和T分別表示DNA鹼基腺嘌呤、胞嘧啶、鳥嘌呤和胸腺嘧啶,N表示任何該些鹼基)。圍繞TTF-1結合的更廣泛的共有啟動子DNA序列是(‑118)GATCAAGCACCTGGAGGGCTCTTCAGAGCAAAGACAAACACTGAGGTCGCTGCCA(-64) (SEQ ID NO: 2),其中,(-64)表示距SPB轉錄起始位點的鹼基對距離。在肺組織的 SPB啟動子中,TTF-1與轉錄因子肝細胞核因子3(Hepatocyte Nuclear Factor 3,HNF3) 結合,如圖 1 所示(Matys et al, 2006和Bohinski et al, 1994)。
在甲狀腺中,TTF-1調控許多基因,包括甲狀腺球蛋白(thyroglobulin)、促甲狀腺激素受體(thyroid stimulating hormone receptor)和甲狀腺過氧化物酶(thyroperoxidase)。甲狀腺球蛋白基因啟動子區TTF-1的共有結合序列與肺中的不同,且據報為TGGCCACACGAGTGCCCTCA (SEQ ID NO: 3)。在甲狀腺球蛋白基因的啟動子中,TTF-1與TTF-2、PAX8以及Runx2轉錄因子協同結合,以及在5'和3'末端的包含50bp側翼序列的更寬序列是 CCCACCCCGTTCTGTTCCCCCACAGTTTAGACAAGATCCTCATGCTCCACTGGCCACACGAGTGCCCTCAGGAGGAGTAGACACAGGTGGAGGGAGCTCCTTTTGACCAGCAGAGAAAAC (SEQ ID NO: 4)。類似地,TTF-1還與促甲狀腺激素受體和甲狀腺過氧化物酶基因的啟動子區域結合,在各情況下與不同的協同轉錄因子協同作用。因此,不僅甲狀腺或肺組織中受調控的基因啟動子序列中的TTF-1結合位點周圍的DNA序列不同,且與TTF-1相連的輔因子也不同,並且因此周圍的DNA序列在同一組織中與不同基因的結合也不同,如圖 1 所示(Matys et al, 2006和Maenhaut et al, 2015)。因此,這表示含有TTF-1的循環染色質片段連同與染色質片段相連的DNA序列的知識,足以確定染色質片段的起源是肺還是甲狀腺。
大約有1000-3000個人類轉錄因子,每個轉錄因子結合基因組中的特定位置,導致動態轉錄變化,驅動大量細胞過程。我們以TTF-1為例說明了本發明的原理。然而,原則上可以在本發明的方法中使用任何轉錄因子。甚至,在許多細胞類型中普遍表現並結合離散DNA 序列(discreet DNA)的轉錄因子(例如Hox蛋白轉錄因子)與輔因子協同結合以獨特地結合不同序列以調控不同組織中的不同基因(Merabet and Mann, 2016, Mann et al, 2009)。這意味著所有或大多數轉錄因子連同它們的TFBS序列(任選地包括側翼序列)可以用作本發明方法的組合生物標記物。例如,雌激素受體-α(estrogen receptor-α,ERα) 轉錄因子結合至人類基因組中的一千多個結合位點或雌激素反應單元(ERE),與不同基因組位置的至少60種其他轉錄因子的組合一致(Lin et al, 2007)。類似地,雄激素受體(androgen receptor,AR)結合至與數千個基因相連的雄激素反應單元(ARE),與數千個不同序列位點的其他合作轉錄因子一致。因此,即使這些轉錄因子在多個組織中表現,本發明的方法也可以透過相連DNA的序列鑑定含有ERα或AR的染色質片段的組織來源。
此外,轉錄因子與DNA基因座的全基因組結合在癌症中被重新編碼,並且在癌細胞中表現的轉錄因子和它們結合的TFBS與在同一組織的健康細胞中結合的轉錄因子不同,因此鑑定循環中含有轉錄因子的染色質片段、以及相連DNA片段的序列資料相結合,能夠識別患有癌症的主體以及癌症類型,例如前列腺癌或肺癌等(Pomerantz et al, 2015)。這是因為染色質在腫瘤發生過程中被重構,並且這種重構涉及透過癌細胞中重構的轉錄因子結合模式以上調腫瘤相關蛋白。正因如此,許多轉錄因子的表現在癌細胞中上調。這是一個廣泛的現象,但可以透過一些非限制性示例來舉例說明。例如,眾所周知的癌症相關轉錄因子c-Myc 和p53在大多數癌症中上調。由AR結合的結合位點序列在前列腺癌中發生了很大變化(Pomerantz et al2015)。類似地,與轉移作用和抗治療性相關的癌細胞中的上皮間質轉化(EMT),涉及轉錄因子Jun/Fos家族的上調,包括Fosll、Fosb、Fos和Junb。亦發現轉錄因子ETS(E26轉化特異性)家族以及Runxl、Tead和Nfkb轉錄因子在腫瘤細胞的開放染色質中高度富集。此外, p63、Klf、Grhl和Cepba據報導在腫瘤細胞中被上調,並且它們的結合位點在開放染色質區域富集。Klf5和p63轉錄因子與癌症相關,並在肺癌和頭頸癌中充當驅動因子。與EMT相關的其他轉錄因子包括bHLH、Runx、Nfat、Tbx1、Tcf7I1和 Smad2(Latil et al, 2017)
真核基因轉錄的調控涉及與多個調控DNA序列結合的多個調控蛋白,這些調控蛋白位於轉錄複合物中基因組的轉錄起始位點(TSS)附近和基因組中TSS的遠端,例如,如圖2所示。DNA中的遠端調控序列可能位於距TSS幾百到一百萬個鹼基的位置,或者可能更遠。轉錄複合物通常涉及DNA環,其可能涉及DNA彎曲蛋白,其中更遠端的調控序列以及與其結合的調控蛋白接觸到與較靠近TSS的調控序列結合的蛋白,例如,也如圖2所示。之所以如此命名TATA盒(TATA box),是因為它包含與轉錄所需的一般轉錄因子結合的重複胸腺嘧啶/腺嘌呤核苷酸序列。特定基因的表現還需要其他基因特異性轉錄因子(例如,表現表面張力蛋白B、甲狀腺球蛋白、甲狀腺過氧化物酶和TSH受體基因所需的轉錄因子,如圖1所示)。此外,多種其他蛋白質是必需的,包括例如但不限於:輔因子、中介因子、活化子、共活化子、抑制子、共抑制子、染色質重塑蛋白、DNA彎曲蛋白、絕緣子、RNA聚合酶部分、延伸因子、染色質重塑因子、STAT部分或細胞因子或與STAT部分結合的細胞因子相連因子、上游結合因子(UBF)或與此類基因調控或轉錄複合物相連的任何其他部分。這種複合物還可以包括一定長度的核小體保護的DNA。轉錄複合物可以穩定以利大量轉錄。因此,健康和/或疾病來源的循環染色質片段可能包括含有多種蛋白質的大蛋白質/DNA複合物,其可能對核酸酶活性具有抗性。如圖2所示,一些涉及近端和遠端調控序列的大型轉錄複合物被稱為超級增強子。超級增強子是具有高含量轉錄因子結合的大團簇,是驅動牽涉控制細胞特性的基因表現的核心。超級增強子也是癌症中刺激致癌基因轉錄的核心。癌細胞獲得超級增強子,而癌變表型依賴於由超級增強子驅動的異常轉錄。因此,透過本文所述的方法檢測染色質片段的存在,包括全部或部分超級增強子複合物和/或對應於超級增強子的近端和遠端調控序列的cfDNA片段序列的組合,提供了一種鑑定染色質片段的細胞來源的方法,包括來源的癌細胞。我們還推斷,就其性質而言,超級增強子複合物可能包含穩定結合的轉錄因子,而不是短暫結合的轉錄因子。
源自轉錄複合物的這類染色質片段中的DNA環原則上可為完整的,也可能在一或多個位置被消化,導致(i) 對應於近端和遠端調控序列的兩個循環染色質片段;或(ii) 包含兩個DNA片段的大染色質片段。因此,cfDNA可能包括與基因的近端和遠端調控序列相對應的小 DNA 片段。
根據本發明的另一態樣,提供了一種檢測人類或動物主體疾病的方法,包括步驟: (i) 使獲自人類或動物主體的體液樣品接觸與轉錄因子結合的結合劑; (ii) 確定與轉錄因子相連的一或多個DNA片段的序列;和 (iii)使用轉錄因子的存在和相連DNA的序列作為組合生物標記物來確定主體中疾病的存在和/或性質。
應當理解的是,任何與DNA結合且其cfDNA結合模式在健康和患病主體中不同的非組蛋白染色質蛋白都將適用於本發明的方法,包括轉錄因子以及其他非組蛋白,非組蛋白包括染色質修飾蛋白、遺傳和表觀遺傳讀取、寫入和刪除蛋白質、參與RNA轉錄的蛋白質(例如RNA聚合酶分子)和建築(architectural)或結構(structural)染色質蛋白質(例如DNA彎曲蛋白)。
因此,根據本發明的另一態樣,提供了一種檢測人類或動物主體疾病的方法,其包括以下步驟: (i) 使獲自人類或動物主體的體液樣品接觸與非組蛋白染色質蛋白結合的結合劑; (ii) 確定與非組蛋白染色質相連的一或多個DNA片段的序列;和 (iii) 使用非組蛋白染色質蛋白的存在和相連DNA的序列作為組合生物標記物來確定主體中疾病的存在和/或性質。
於一較佳實施例中,非組蛋白染色質蛋白是RNA聚合酶,特別是RNA聚合酶II。RNA 聚合酶II是一種DNA結合酶,負責轉錄基因的DNA序列以產生RNA副本。RNA副本可能是導致核糖體產生相應蛋白質的信使RNA (mRNA) 分子,或者可能是未轉譯成蛋白質的非編碼RNA(non-coding RNA,ncRNA)分子。因此,循環染色質片段中RNA聚合酶II的存在表示該片段源自在其起源的細胞中具有活性的基因。因此,源自與RNA聚合酶II相連的染色質片段的DNA片段序列文庫提供了樣品中存在的活性動態基因(active dynamic gene)文庫。在健康人中,這個文庫主要對應於造血組織中存在的活性基因。在患病的人中,該文庫還包括在受疾病影響的組織中具有活性的基因。這可能是受疾病影響的任何組織。例如,在肝或腎細胞中具有活性的基因可能存在於從肝或腎病患者採集的樣品中產生的RNA聚合酶II文庫中,而這些基因不存在於健康人體的文庫中。類似地,癌症中上調的基因可能存在於從癌症患者的樣品中產生的RNA聚合酶II文庫中,而此類基因不存在於健康人體的文庫中。在本發明的這個態樣中使用RNA聚合酶II允許鑑定樣品中代表的活性動態基因。這允許癌症疾病的檢測以及受癌症影響組織的確定。
因此,根據本發明的另一態樣,提供了一種檢測人類或動物主體疾病的方法,包括步驟: (i) 使獲自人類或動物主體的體液樣品接觸與RNA聚合酶結合的結合劑; (ii) 確定一或多個與RNA聚合酶相連的DNA片段的序列;和 (iii) 使用RNA聚合酶相連DNA片段的序列作為生物標記物來確定主體中疾病的存在和/或性質。
於一實施例中,所述疾病選自癌症、自身免疫性疾病或炎性疾病。於另一實施例中,所述疾病是癌症。於另一實施例中,自身免疫性疾病選自:系統性紅斑狼瘡(SLE)和類風濕性關節炎。於另一實施例中,炎性疾病選自:克羅恩氏病(Crohn’s disease)、結腸炎、子宮內膜異位症和慢性阻塞性肺病(COPD)。
於較佳實施例中,所述疾病是癌症。於另一實施例中,癌症選自:乳癌、膀胱癌、結腸直腸癌、皮膚癌(例如黑色素瘤)、卵巢癌、前列腺癌、肺癌、胰臟癌、腸癌、肝癌、子宮內膜癌、淋巴瘤、口腔癌、頭頸癌、白血病和骨肉瘤。
於另一實施例中,所述疾病是胎兒疾病或病症。本領域眾所周知的是,胎兒來源的染色質片段(例如含有來自(XY)男性胎兒的Y染色體DNA序列)在懷孕動物和人類(XX)母親的血液中循環。據報導,在懷孕主體中循環的cfDNA既包括預期長度為核小體保護的DNA片段(約 160bp)的cfDNA片段,也包括50bp以上範圍內的較短cfDNA片段。此外,據報導,長度小於140bp的母體cfDNA片段富含胎兒來源的cfDNA(Hu et al; 2019)。因此,本發明的方法不僅適用於採集樣品的主體的疾病狀態,而且適用於母體血液樣品中的產前調查或胎兒狀況的測試。
因此,根據本發明的另一態樣,提供了一種檢測人類或動物胎兒疾病的方法,包括步驟: (i) 從懷孕的人類或動物主體獲取體液樣品; (ii) 使體液樣品接觸與轉錄因子結合的結合劑; (iii) 檢測、測量或定序與轉錄因子相連的DNA;和 (iv) 使用DNA的存在、序列或數量作為胎兒疾病存在的指標。
根據本發明的另一態樣,提供了一種檢測人類或動物主體中受疾病影響的組織的方法,包括步驟: (i) 使獲自人類或動物主體的體液樣品接觸與轉錄因子結合的結合劑; (ii) 確定與轉錄因子或染色質片段相連的DNA的DNA鹼基序列;和 (iii)使用組合的轉錄因子/DNA序列生物標記物作為主體中受疾病影響的組織的指標。
於一較佳實施例中,所述疾病是癌症。於另一實施例中,受疾病影響的組織是起源器官,例如癌症的起源器官。
於本發明另一態樣中,提供了一種檢測人類或動物主體疾病的方法,包括步驟: (i) 使獲自人類或動物主體的體液樣品接觸與轉錄因子結合的結合劑; (ii) 分離與轉錄因子相連的 DNA; (iii) 透過PCR方法擴增分離的DNA; (iv) 確定擴增DNA的序列;和 (v) 使用轉錄因子的存在和相連DNA的序列作為組合生物標記物來確定主體中疾病的存在和/或性質。
本領域技術人員也將清楚的是,可獲得對應於特定轉錄因子結合的各種基因座的多種序列,並且可以整合關於各種序列的數據以確定疾病的性質和/或受疾病影響的組織。
於本發明另一態樣中,提供了一種檢測人類或動物主體疾病的方法,包括步驟: (i) 使獲自人類或動物主體的體液樣品接觸與轉錄因子結合的結合劑; (ii) 分離與轉錄因子相連的DNA; (iii) 透過PCR方法擴增分離的DNA,例如使用序列特異性引子; (iv) 檢測擴增的DNA;和 (v) 使用擴增DNA的存在、數量和/或序列作為主體中疾病的存在和/或性質的指標。
於一實施例中,分離的轉錄因子結合的DNA片段的擴增是在轉接子寡核苷酸與DNA片段連接之後進行的。因此,於本發明一實施例中,提供了一種檢測人類或動物主體疾病的方法,包括步驟: (i) 使獲自人類或動物主體的體液樣品接觸與轉錄因子結合的結合劑; (ii) 分離與轉錄因子相連的DNA; (iii) 將轉接子寡核苷酸連接到分離的DNA上; (iv) 擴增DNA;和 (v) 使用DNA片段的存在、數量和/或序列作為主體中疾病的存在和/或性質的指標。
於本發明另一態樣中,提供了一種檢測人類或動物主體疾病的方法,包括步驟: (i) 使獲自人類或動物主體的體液樣品接觸與轉錄因子結合的結合劑; (ii) 分離與轉錄因子相連的DNA; (iii) 使用序列特異性引子寡核苷酸以擴增分離的DNA; (iv) 檢測擴增的DNA;和 (v) 使用擴增DNA的存在、數量和/或序列作為主體中疾病的存在和/或性質的指標。
此態樣利用本發明的組合轉錄因子/DNA序列生物標記物的組織特異性,同時透過PCR擴增選擇的DNA片段(包括用於生物標記物目的的TFBS序列和/或側翼序列)避免DNA片段轉接子文庫製備和次世代DNA定序。所述方法係快速、低成本、易於自動化以實現高通量,並可在任何PCR實驗室進行。
在步驟(i)或(ii)中分離的DNA序列可以透過本領域已知的任何方法進行擴增。於一些實施例中,使用PCR方法擴增分離的DNA,該PCR方法採用與DNA片段連接的轉接子。於其他實施例中,PCR引子用於DNA擴增。可以設計引子以擴增在步驟(i)或(ii)中分離的所有DNA序列,或者可以設計用於擴增與轉錄因子的反應單元序列相連的特定DNA序列,選擇性地還包括側翼區。
於本發明另一態樣中,提供了一種檢測人類或動物主體疾病的方法,包括步驟: (i) 使獲自人類或動物主體的體液樣品接觸與轉錄因子結合的結合劑; (ii) 分離(和選擇性地擴增)與轉錄因子相連的DNA; (iii) 用雜交法檢測DNA;和 (iv) 使用雜交的DNA的存在、數量和/或序列作為主體中疾病的存在和/或性質的指標。
此態樣利用本發明的組合轉錄因子/DNA序列生物標記物的組織特異性,同時透過DNA片段(包括TFBS序列和/或側翼序列)的選擇性DNA雜交避免昂貴的次世代DNA定序。該方法成本低且可在任何PCR實驗室進行。
於較佳實施例中,在雜交之前擴增分離的DNA。於較佳實施例中,雜交方法是DNA微陣列方法(也稱為DNA晶片方法)。
本發明的方法還可用於測量轉錄因子和序列相連的DNA的組合生物標記物。
轉錄因子的選擇
真核生物中基因轉錄的調控非常複雜,可能涉及DNA的彎曲和成環,以將被多個調控蛋白結合的多個調控DNA序列匯集到一個調控轉錄複合物中,如圖2所示。因此,本文所用術語「轉錄因子」是指直接或間接結合基因組中的基因調控序列以調控基因轉錄的調控蛋白,包括但不限於:一般轉錄因子和與特定基因調控相連的特定轉錄因子以及增強子、共增強子、抑制子、共抑制子、中介因子、活化子、共活化子、抑制子、共抑制子、染色質重塑蛋白、DNA彎曲蛋白、絕緣子、RNA聚合酶部分、延伸因子、STAT部分、與STAT部分結合的細胞因子或細胞因子相關因子、UBF或與這種基因調控或轉錄複合物相連的任何其他部分。類似地,本文所用術語「轉錄因子結合位點」(TFBS)是指與基因的轉錄調控相連的調控蛋白的DNA結合位點,包括但不限於遠端或近端增強子和抑制子序列,如圖2所示。
眾所周知的是,轉錄因子的表現在疾病中發生了改變。因此,本發明的方法可能涉及轉錄因子,其表現在疾病中被上調和/或在疾病組織(例如癌組織中)不當地表現,而在所述(健康)組織中通常不高度表現。因此,體液樣品中存在的轉錄因子含量可用作疾病的生物標記物。
亦眾所周知的是,轉錄因子對TFBS的佔據率(occupancy)在不同的細胞類型和疾病中會發生改變(Wang et al, 2012)。因此,體液樣品中存在的轉錄因子對TFBS 的佔據率可以用作疾病的生物標記物。
存在於健康主體循環中的染色質片段主要是造血來源的。因此,本發明的方法還涉及檢測包含轉錄因子以及相連DNA的染色質片段的不適當存在,其通常不在造血組織中表現(但可以在非造血組織中表現)。
舉例而言,許多癌症疾病源自上皮組織。上皮GRHL2轉錄因子在許多上皮組織以及許多上皮組織衍生的癌症疾病中表現,但在造血組織中不表現。循環中GRHL2的存在表明存在上皮來源的癌症,例如結腸直腸癌、前列腺癌、肺癌或乳癌。因此,本發明的方法可用於檢測癌症本身的存在,以及使用譜系特異性轉錄因子和/或轉錄因子與相連DNA序列的譜系特異性組合來鑑定癌症的起源器官。因此,任何轉錄因子都可用於本發明的方法。於較佳實施例中,包含所選轉錄因子的染色質片段的含量在患病主體的體液中升高(超過在其他主體中發現的水平),部分或全部具有組織和/或疾病特異性,和/或在基因組中具有多種反應單元。
因此,於一實施例中,轉錄因子是疾病特異性的(即,在疾病中包含轉錄因子的循環染色質片段的含量被上調)。於一實施例中,轉錄因子是組織特異性的。於一實施例中,轉錄因子結合基因組中多於一個位置,例如基因組中多於5個、多於10個、多於100個、多於1000個或多於10,000個位置。在某些組織類型中一些轉錄因子結合位置被佔據,但在其他組織類型中沒被佔據。在患病細胞中一些轉錄因子的結合位置被佔據,但在同組織的健康細胞中沒被佔據。
轉錄因子可以透過結合域分類(例如參見Vaquerizas et al, 2009,其透過引用併入本文)。於一實施例中,轉錄因子包含選自以下的DNA結合結構域:同源域(homeodomain)、HLH、bZip、NHR、Forkhead、P53、HMG、ETS、aIPT/TIG、POU、MAD、a SAND、IRF、TDP、DM、Heat shock、STAT、CP2、RFX、AP2或鋅指(例如鋅指C 2H 2或鋅指GATA)結合域。於一實施例中,轉錄因子包含非鋅指DNA結合域。
可以透過實驗確定合適的轉錄因子,例如使用經典的核酸酶可及位點作圖方法來鑑定感興趣的組織中的感興趣的轉錄因子。在典型的實驗中,從感興趣的細胞(例如癌細胞、相同組織的健康細胞、和造血細胞)中萃取染色質,並使用合適的核酸酶進行消化。將透過消化產生的染色質片段暴露於與轉錄因子結合的抗體,分離與抗體結合的DNA片段並定序以鑑定與轉錄因子結合的TFBS序列(選擇性地包括側翼序列)。結果可用於選擇用於本發明的轉錄因子。例如,在患病細胞中升高但在造血細胞中降低或不存在的轉錄因子和轉錄因子/TFBS(選擇性地包括側翼序列)組合可用於本發明的方法。經典的核酸酶可及性方法最近得到了改進,該技術現在包括例如CUT&RUN之方法和其他方法,這些方法更易於執行並提供改良的結果(Skene and Henikoff, 2017)。任何此類方法都適用於鑑定用於本發明的合適轉錄因子。
已經進行了許多這樣的實驗和類似的實驗,因此合適的轉錄因子在本領域中是可用的。文獻中有許多關於轉錄因子和癌症的刊物列出了可用於本發明方法的轉錄因子。例如,Lambert et al, 2018列出了294種已知的致癌轉錄因子和調控因子。Gurel et al, 2010描述轉錄因子NKX3.1為前列腺癌的標記物。Darnell, 2002列出了許多致癌轉錄因子,包括 STAT3、5、STAT-STAT、GR、IRF、TCF/LEF、β-鏈蛋白(β-catenin)、NF-ĸB、NOTCH (NICD)、GLI、c-JUN、bZip 蛋白(包括c-JUN、JUNB、JUND、c-FOS、FRA、ATF和 CREB-CREM家族)、cEBP家族、ETS蛋白和MAD-box家族。Vaquerizas et al, 2009描述了許多可用於本發明方法的組織特異性轉錄因子。Ulz et al, 2019描述了轉錄因子,例如上皮轉錄因子GRHL2(其存在於許多癌症類型中,但不存在於血液組織)以及AR(雄激素受體)、NKX3-1和HOXB13中。Corces et al, 2018描述了許多癌症特異性和組織特異性轉錄因子,包括NR5A1、TP63、GRHL1、FOXA1、GATA3、NFIC、CDX2、RFX2、ASCL1、PAX2、HNF1A、NKX2.A、PHOX2B、DRGX、HOXB13、AR、MITF、HNF4和POU5F1。使用ChIP-Seq,Wang et al, 2012確定了19 種不同細胞類型(包括7種永生癌細胞株和12種正常細胞類型)中轉錄因子CTCF 的77,811個不同結合位點。在這77,811 個CTCF TFBS 中,發現有1236個位點在癌細胞中被差異性佔據。發現195個位點的佔據發生在正常細胞類型中,但不在癌細胞中。發現1041個位點的佔據發生在癌細胞中,但在正常細胞類型中沒有(Liu et al, 2017)。透過ChIP-Seq發現與體液中對應於癌症特異性TFBS的CTCF相連的cfDNA片段是被研究主體中癌症疾病存在的指標,並且可以以這種方式用作為生物標記物。所述參考文獻透過引用併入本文。
亦可使用各種轉錄因子、癌症和基因組資料庫來選擇與本發明的方法一起使用的合適的轉錄因子,例如:為包括人類在內的許多物種提供註釋基因組序列的ENSEMBL資料庫、 DNA元素百科全書或(ENCODE)資料庫(https://www.encodeproject.org)、轉錄因子 (TRANSFAC) 資料庫(Matys et al, 2006)、基因轉錄調控資料庫(GTRD)18.01版(http://gtrd.biouml.org)、人類轉錄因子資料庫1.01版(http://humantfs.ccbr.utoronto.ca)、NIH基因組學資料共享資料庫(https://gdc.cancer.gov)、癌症基因組圖譜(TCGA) (https://www.cancer.gov/about-nci/organization/ccg/research/structural-genomics/tcga)、UCSC Xena Browser(https://atcseq.xenahubs.net)和人類蛋白質圖譜資料庫 (https://www.proteinatlas.org),提供有關表現轉錄因子的健康組織及其在癌症疾病中的表現的資料,以及其他資料庫。
這些資料庫的用途(用於本發明方法的轉錄因子以及相連的TFBS序列和側翼序列的特徵化)可以參考這些資料庫中的其中一些以作為示例來說明。TRANSFAC資料庫提供了數以千計的人類和其他真核轉錄因子的資料。為每個轉錄因子提供的詳細訊息包括其在基因組中結合的TFBS的數量、其調控轉錄的基因列表、與每個受調控基因相連的TFBS的序列和基因組位置、以合作方式與其一起調控轉錄的其他轉錄因子的詳細訊息、共有TFBS DNA序列、DBD細節以及癌症關聯。出於說明之目的,本發明上下文中資料的使用在下文中針對轉錄因子CDX2和c-JUN舉例說明。TRANSFAC資料庫列出了調控26個特定基因的48個人類CDX2 TFBS。提供了 CDX2 TFBS序列以及它們的基因組位置和受每個序列調控的基因。每個CDX2 TFBS的側翼序列可以透過參考ENSEMBL人類基因組資料庫來確定每個基因組位置的序列。還提供了共有CDX2 TFBS序列。類似地,TRANSFAC資料庫列出了265個人類c-JUN TFBS,其調控166個特定基因。提供了c-JUN TFBS序列以及它們的基因組位置和受每個序列調控的基因。每個c-JUN TFBS的側翼序列可以透過參考ENSEMBL人類基因組資料庫來確定每個基因組位置的序列。還提供了共有c-JUN TFBS序列。
因此,可以透過實驗或從文獻和/或資料庫(例如人類蛋白質圖譜資料庫)中選擇轉錄因子和/或TFBS以用於本發明的方法。轉錄因子可能就以下幾點被特徵化(i)它在健康和患病組織中的表現,(ii)在那些細胞或組織中受調控的基因,(iii)它在那些組織中結合的TFBS序列(選擇性地包含側翼序列),以及(iv)透過在TFBS上共同結合以進行轉錄調控的其他因子。透過本文描述的方法,該特徵化可用於鑑定體液樣品中染色質片段和/或轉錄因子相連cfDNA片段的健康或患病組織或細胞來源。
類似地,與體液樣品中的染色質片段和/或cfDNA序列相關的實驗資料可以使用這些資料庫來解釋,以識別包含在cfDNA片段中全部或部分的TFBS序列(選擇性地包括側翼序列)。然後,該資料可用於識別cfDNA片段的組織或細胞來源。
目前被認為在癌症中特別重要的轉錄因子主要分為三組。第一組是核激素受體組,包括雌激素受體、雄激素受體、孕激素受體、糖皮質激素受體、甲狀腺受體和視黃酸受體。轉錄因子的核激素受體組是細胞表面受體,可被認為是無活性或潛伏的轉錄因子,可以透過配體結合而活化。例如,雌激素受體通過與雌激素結合而被活化。配體結合導致核激素受體遷移到細胞核,在此它與目標DNA序列結合(例如,雌激素受體與雌激素反應單元結合)並上調或下調與 DNA目標序列相關的基因(例如,受雌激素調控的基因)。
已知在癌症的發生和發展中很重要的第二組轉錄因子是轉錄訊息傳遞及活化子(STAT)。這些是潛在的細胞質轉錄因子,可以被細胞質和/或細胞表面的多種分子觸發物活化。STAT 活化通常涉及細胞質中的級聯(cascade)生化事件,例如激酶反應、蛋白水解反應和蛋白質-蛋白質交互作用,這些反應導致蛋白質或蛋白質複合物進入細胞核,從而調控目標基因的轉錄。導致轉錄活化的生化級聯通常由配體在細胞表面的受體結合觸發,包括例如細胞因子受體與細胞因子部分的結合、或生長因子(例如表皮生長因子或血小板衍生的生長因子)與生長因子受體的結合、或胜肽或蛋白與G蛋白偶聯受體的結合。
在癌症中重要的第三組轉錄因子是常駐核蛋白,其轉錄作用通常由涉及絲胺酸激酶反應的級聯生化事件活化。有數百個絲胺酸激酶部分和數百個核蛋白是絲胺酸激酶的靶標。
本領域技術人員將清楚的是,無細胞染色質片段包括(即包含或含有)參與癌症的起始、發展或維持的任何轉錄因子(例如上述三組中的轉錄因子),將會在本發明的方法中有用。一些在癌症中具有已知作用或已知在癌症疾病中升高的轉錄因子或轉錄因子家族包括例如(但不限於):STAT,特別是STAT3、STAT5和STAT-STAT二聚體部分、NF-ƙB、β-鏈蛋白、γ-鏈蛋白、Notch和Notch胞內結構域(NICD)、GLI、c-JUN、JUNB、JUND、c-FOS、FRA、ATF、CREB-CREM、cEBP、ETS、MYC、N-MYC、MAX、E2F、干擾素調控因子(IRF)、T細胞因子(TCF)、淋巴細胞增強因子 (LEF)、EN2、GATA3、CDX2、PAX8、WT1、NKX3.1、P63 (TP63)或P40、以及螺旋-環-螺旋蛋白(Darnell, 2002)。所有這些轉錄因子都將在本發明的方法中有用。
已經發現許多轉錄因子是譜系特異性(lineage specific)的並且與特定組織相關,因此可以被認為是組織特異性轉錄因子,即總是或通常在某些組織或癌症中表現而很少或從不表現在其他組織或癌症中的轉錄因子。本發明的方法可以與組織特異性轉錄因子一起使用,其中相連DNA的組合檢測提供增強的特異性和/或敏感性。
甲狀腺轉錄因子1(TTF-1)在胚胎發育過程中在甲狀腺、間腦和呼吸道上皮細胞中選擇性表現。TTF-1在取自神經內分泌和非神經內分泌肺癌的組織樣本中表現,但其表達頻率在不同組織型態之間顯著不同。因此,本發明的方法還可用於透過測量含有轉錄因子及其相連DNA序列的染色質片段來鑑定癌症類型和亞型。
PAX8是參與甲狀腺、腎臟和苗勒氏系統胚胎發育的轉錄因子。PAX8在取自非黏蛋白卵巢癌、漿液性癌、子宮內膜癌、透明細胞癌和移行細胞癌的組織樣品中顯示出大量表現。PAX8也在子宮內膜樣癌、子宮漿液性癌、子宮內膜透明細胞癌以及導管和小葉乳癌組織中表現。
CDX2是一種譜系特異性轉錄因子,在控制腸上皮細胞的增殖和分化中起關鍵作用,並且在幾乎所有結直腸腺癌組織樣品中都有表現。
NKX3.1是正常前列腺發育所必需的,並且是在幾乎所有前列腺癌中表現的已知標記物。
GATA3早在人類妊娠的第四周就在轉錄中活躍。GATA3在取自乳癌的組織樣品中高度表現,特別是雌激素受體陽性的乳癌組織樣品,以及尿路上皮癌和移行細胞癌。
WT1在胚胎發育中起重要作用。WT1是卵巢癌組織的良好標記物,並且在非常有限的健康成人組織中表現。
EN2在胚胎發育中發揮作用,並在一系列癌症中表現,但在極少數成人健康組織中表現。尿液中EN2的存在已被用作檢測前列腺癌的尿液檢測的基礎。
其他轉錄因子可用於本發明的方法。例如,UBF是一種轉錄因子,它與核糖體RNA基因啟動子結合且活化由RNA聚合酶I介導的轉錄。已知在某些癌症的組織中的UBF表現升高。許多其他這樣的例子無疑存在並且是適合用於本發明方法的轉錄因子。此外,RNA聚合酶I和RNA聚合酶III在癌症中也會升高。這些部分負責tRNA和核糖體RNA基因的轉錄,以提供提升高的和快速的蛋白質生產、生長以及癌細胞和組織的細胞複製特徵所需的細胞機制。於本發明另一實施例中,提供了一種用於檢測或測量包括UBF、RNA聚合酶I或RNA聚合酶III的無細胞染色質片段的方法。
於替代性實施例中,轉錄因子不是組織特異性轉錄因子。本發明的方法還能夠檢測普遍表現的轉錄因子,即在超過5、超過10、超過15、超過20或超過30種組織類型中表現的轉錄因子。透過將檢測與相連的DNA序列相組合(即相組合的生物標記物),本發明的方法可以檢測普遍表現的轉錄因子以提供臨床有用的結果。核激素受體轉錄因子就是示例。如上所述,CTCF也是本文進一步研究的示例。
轉錄因子與其DNA目標序列以高度協同的方式與許多其他因子結合,包括其他轉錄因子、輔因子、共活化子、共抑制子、RNA聚合酶部分、延伸因子、染色質重塑因子、中介因子、STAT部分、UBF和其他。這意味著本發明檢測到的循環轉錄因子可以包括其他部分作為更大基因調控複合物的一部分,包括:任何或所有與DNA相連的核小體、核激素受體、類固醇或與核激素結合的其他激素受體、其他轉錄因子、輔因子、共活化子、共抑制子、RNA聚合酶部分、延伸因子、染色質重塑因子、中介因子、STAT部分或與STAT部分結合的細胞因子或細胞因子相關因子、上游結合因子(UBF)或與在無細胞染色質片段中出現的這種基因調控或轉錄複合物相連的任何其他部分。
含有轉錄因子部分的無細胞染色質片段可能或可能不包含複合物中完整核小體或任何組蛋白的存在。所有這些無細胞染色質複合物都將用於本發明並且包括在本發明中。
於一較佳實施例中,轉錄因子選自:STAT、NF-ƙB、β-鏈蛋白、γ-鏈蛋白、Notch、notch胞內結構域(NICD)、GLI、c-JUN、JUNB、JUND、c-FOS、FRA、ATF、CREB-CREM、cEBP、ETS、MYC、MAX、E2F、干擾素調控因子(IRF)、T細胞因子(TCF)、淋巴細胞增強因子(LEF)和螺旋-環-螺旋蛋白、HOX蛋白、EN2、GATA3、CDX2、TTF-1、PAX8、WT1、NKX3.1、P63(或TP63)、P40或CTCF。於另一實施例中,轉錄因子選自:EN2、CDX2或TTF-1。於另一實施例中,轉錄因子是CTCF。
這些轉錄因子中的大多數不是100%組織特異性的,但可能在一些癌症以及一些成人組織類型中表現。透過使用檢測相連DNA片段的分析敏感方法增強了對血液中含有轉錄因子的染色質片段的檢測。該方法的疾病和/或組織特異性透過將轉錄因子的身份和與其相連的特定DNA序列相結合而得到增強。
於一實施例中,取自主體的體液樣品與一或多種轉錄因子結合劑接觸,所述轉錄因子結合劑被選為在多重測定中測試一或多種疾病狀況。例如,檢測多種轉錄因子,每個轉錄因子對一或多種癌症疾病有特異性,選擇性地除了在許多癌症中表現的轉錄因子之外,除了在單次血液檢測中識別癌症組織外,還可以檢測多種不同的癌症疾病。用於多重測試的方法在本領域中是眾所周知的,例如但不限於,Luminex Corporation的多重珠子系統(multiplex beads system)可用於在單個樣品中進行大量多重測定(Dunbar,2006)。
根據本發明另一態樣,提供了一種檢測人類或動物主體疾病的方法,包括步驟: (i) 使獲自人類或動物主體的體液樣品接觸與多個轉錄因子結合的多個結合劑; (ii) 分析與不同轉錄因子相連的 DNA;和 (iii) 使用與多個轉錄因子結合的DNA的存在和/或數量和/或模式來確定主體中疾病的存在和/或性質。
根據本發明另一態樣,提供了一種檢測人類或動物主體疾病的方法,包括步驟: (i ) 使從人或動物主體獲得的體液樣品接觸二或以上個(例如多個)結合劑接觸,該結合劑與二或以上個(例如多個)轉錄因子結合; (ii) 確定在步驟(i)中結合的與轉錄因子相連的DNA序列;和 (iii) 使用與轉錄因子結合的DNA的存在和/或數量和/或模式和/或序列來確定主體中疾病的存在和/或性質。
於一實施例中,多個轉錄因子中的每一個都連接到單獨的固相支持物上,從而可以分離各轉錄因子以對其相連的DNA片段進行分析或定序。例如,Luminex多重珠子系統由多種珠子類型組成,每種珠子都可以塗覆不同的轉錄因子結合劑,這些結合劑可暴露於單個樣品並隨後相互分離以獨立進行(個別的)與各轉錄因子相連的DNA的 定序。
轉錄因子-DNA染色質片段
循環中存在的染色質片段來自各種來源。一種來源是通過細胞死亡後染色質釋放到循環中,其可能包括患病細胞,例如癌細胞。在某些情況下,染色質可能會主動釋放到循環中。
循環中染色質片段的主要來源來自嗜中性白血球,透過稱為NETosis的過程產生嗜中性白血球胞外陷阱(NET)。在此過程中,嗜中性白血球將染色質物質(NET)噴射到細胞外基質中,以將病原體捕獲並中和到感染部位。NET及其代謝物主要由寡核小體和單核小體組成,其DNA片段大小≥150bp。
從血液中萃取的cfDNA的大小分析表明,cfDNA的主要成分是單核小體,其大小分佈峰值在160-170bp左右,範圍在130-200bp左右,對應於具有不同長度的相連連接子DNA的單核小體。可能存在對應於各種大小的寡核小體的進一步峰值,包括例如二核小體(約340bp)、三核小體(510bp)等。在受NETosis影響的樣品中,也可能存在與長度可達數千鹼基的大染色質片段相關的寬峰。
轉錄因子與短DNA序列結合,轉錄因子-DNA複合物包含35-80bp範圍內的較短DNA片段(Snyder et al, 2016)。在雙股血漿cfDNA文庫的典型大小分佈圖中,很少或沒有見到相對應於長度<100bp的cfDNA片段長度的物質。然而,單股文庫製劑包含更多35-80bp範圍內的cfDNA片段(Snyder et al, 2016)。這種蛋白質結合的35-80bp cfDNA成分是總循環染色質片段的次要成分。
本發明文中轉錄因子-DNA結合的另一個重要態樣涉及轉錄因子-DNA結合的動力學穩定性。一些轉錄因子在體內與TFBS處的DNA穩定結合。其他轉錄因子在體內在 TFBS瞬時結合,其中它們以動態方式結合、解離和重新結合。在使用基於細胞和組織的底物的 ChIP-Seq方法中,這不是問題,因為兩者都可以使用交聯技術進行檢測。動態結合的轉錄因子在結合形式和自由形式之間自然交替,但當交聯時,它們會「陷入」在結合形式。因此,使用短交聯時間會導致對穩定結合的轉錄因子的高檢測,但對動態結合的轉錄因子的檢測較少。相比之下,使用更長的交聯時間會導致動態結合的轉錄因子的檢測增加,因為隨著時間的推移,更多動態結合的轉錄因子透過交連會「陷入」在結合形式(Poorey et al, 2013)。
然而,基於動力學考慮,我們推斷動態結合的轉錄因子不太可能存在於血液循環或其他體液中。在體內,染色質和轉錄因子的核濃度相對較高,允許動態結合的轉錄因子-DNA複合物的結合、解離和重新結合。然而,體液中轉錄因子-DNA複合物的含量被高度稀釋並以如此低的濃度存在,以至於一旦解離,任何瞬時或動態結合的轉錄因子和DNA成分都不太可能重新結合。我們推斷,血漿中的交聯因而僅與穩定結合的轉錄因子相關,因此總是快速的(因為較慢的交聯瞬時結合的轉錄因子將被分離並且可以忽略)。因此,於本發明一實施例中,提供了一種檢測人類或動物主體疾病的方法,包括步驟: (i) 使獲自人類或動物主體的體液樣品接觸與動力學穩定的轉錄因子-DNA複合物結合的結合劑; (ii) 確定與該動力學穩定的轉錄因子-DNA複合物中的轉錄因子相連的一或多DNA片段的序列;和 (iii) 使用轉錄因子的存在和相連DNA的序列作為組合生物標記物來確定主體中疾病的存在和/或性質。
轉錄因子DNA結合域
轉錄因子可根據其DNA結合域(DBD)進行分類。Vaquerizas et al, 2009研究了1391 個已知轉錄因子,並根據DBD確定了超過24種不同類型的轉錄因子。鑑定出的最常見的轉錄因子是具有鋅指DBD的轉錄因子,這些轉錄因子幾乎佔所有轉錄因子的一半(48.5%)。
用於分析cfDNA、ctDNA或核小體的較佳樣品類型是EDTA血漿。血漿採血管中的 EDTA或檸檬酸鹽的作用是螯合和隔離血液中的鈣離子以防止凝血(血液中的凝血級聯反應需要鈣離子的存在)。試管的離心將血液的細胞成分從血漿上清液中分離出來,其可被去除並用作為許多臨床診斷目的的樣品基質。
鋅指轉錄因子與其DNA TFBS的結合取決於鋅離子的存在。然而,血漿採血管中使用的鈣螯合劑也會螯合鋅離子。鋅指轉錄因子的鋅離子螯合和去除可能導致轉錄因子與DNA 結合的喪失(Ralston, 2008)。鋅螯合劑和鋅指轉錄因子的相互作用意味著這個轉錄因子家族在EDTA血漿中的行為不同於透過其他DBD類型結合DNA的轉錄因子。
尚未直接證明血液中存在鋅指轉錄因子-DNA複合物。我們推斷,雖然存在此類複合物,但它們並未被分離出來,因為它們是血液中循環染色質小片段成分的一小部分(絕大多數循環染色質片段是核小體),此外,它們在血漿樣品中被分離並被本領域工作者使用。如本文所述,我們已經解決了這兩個問題並證明了CTCF的血漿ChIP-Seq,其為一種鋅指轉錄因子。
轉錄因子結合劑
較佳的轉錄因子結合劑包含與轉錄因子結合的抗體,或寡核苷酸,例如TFBS的DNA序列(選擇性地包含側翼序列)。較佳的結合劑對轉錄因子具有高親和力,從而在低轉錄因子濃度下會發生結合,以及對轉錄因子結合的高特異性,從而使其他蛋白質的非特異性結合最小化。
將結合劑可以塗佈在固相支持物上,例如瓊脂糖凝膠、葡聚糖凝膠、塑膠或磁珠。於一實施例中,所述固相支持物包括多孔材料。在另一實施例中,將結合劑衍生以包括標籤或連接子,該標籤或連接子可用於將結合劑連接到合適的支持物上,其已被衍生化為與該標籤結合。許多這類的標籤和支撐物是本領域已知的(例如,Sortag、Click Chemistry、生物素/鏈黴親和素、his-標籤/鎳或鈷、GST-標籤/GSH、抗體/表位標籤等等)。然後可以在結合劑與轉錄因子反應之前、同時或之後進行結合劑的分離。為了便於使用,可以將塗覆的支持物包含在一裝置中,例如微流體裝置。多種固相結合劑可以用於多重測定形式中,以在單一體液樣品中同時測定含有不同轉錄因子的多重染色質片段的存在。
於其他實施例中,將結合劑添加到溶液中並透過交聯和沉澱結合的核小體來分離,其係透過沉澱劑(例如聚乙二醇(PEG))進行。然後沉澱的沉澱物可被分離為分離相(separate phase),例如透過離心或過濾。許多免疫沉澱方法是本領域已知的,並且任何此類方法都可用於本發明的方法。
於一些實施例中,與轉錄因子相連的DNA被DNA結合劑結合。DNA結合劑可附著在固相上(例如塑性顆粒、磁性顆粒、瓊脂糖或許多其他物質)。DNA結合劑可以直接或間接地(例如,透過生物素/抗生物素蛋白或麩胱甘胺酸等連接子系統)附著在固相上。
我們使用了與轉錄因子結合的市售抗體。對於ChIP-Seq,我們將抗體固定在市售磁性聚苯乙烯顆粒上。因此,於本發明一較佳實施例中,轉錄因子結合劑是固定在磁性聚苯乙烯顆粒上的固相抗轉錄因子抗體(或其一部分)。
DNA文庫製備
本發明的一些實施例包括染色質片段中與轉錄因子相連的cfDNA片段的文庫的製備。可以使用PCR方法擴增文庫以便於檢測和定序。原則上,任何文庫製備方法都可以適用於本發明的方法。
DNA片段文庫製備方法在本領域中是眾所周知的並且通常涉及轉接子寡核苷酸與DNA片段的連接。通常藉由PCR進行轉接子連接的DNA片段文庫的擴增。亦可將PCR引子用於DNA擴增,並且可被簡併以擴增存在於文庫中的所有序列,或者可以使用本領域已知的軟體設計引子以擴增與轉錄因子的反應單元的序列相連的特定DNA序列,選擇性地還包括側翼區域。
文庫製備方法可能涉及cfDNA片段的單股或雙股轉接子的連接。較佳的文庫製備方法涉及單股cfDNA轉接子的連接。較佳的文庫製備方法對於長度小於100bp的小DNA片段的擴增和分離效率很高。許多此類文庫製備方法在本領域中是已知的,例如,(i) 根據廠商的實驗流程使用TruSeq DNA Sample preparation Kit (Illumina),對於5-10ng的載入DNA進行20-25個 PCR循環(Ulz et al, 2019),(ii)使用MagMAX cfDNA Isolation Kit(Applied Biosystems),然後使用NEBNext Ultra II DNA Library Prep Kit(New England Biolabs)進行文庫製備(Ulz et al, 2019)或(iii)Qiagen QIAamp DSP DNA Blood Mini Kit血液和體液的實驗流程的使用以及使用Life technologies Ion Plus Fragment Library Kit進行PCR擴增(Hu et al, 2019)。其他方法包括Sanchez et al, 2018、Skene and Henikoff, 2017、Snyder et al, 2016以及 Liu etal, 2019。於本文提供的實施例中,我們使用了市售的單股DNA文庫製備試劑盒(Claret Bio SRSLY NGS Library Prep Kit)。
本領域技術人員將清楚的是,對於本發明的實施例,(僅)進行轉錄因子相連DNA的PCR擴增以增加轉錄因子檢測或定量的靈敏性,然後反應單元序列獨自(沒有側翼序列)擴增就足夠。
轉錄因子-DNA複合物的免疫沉澱
免疫沉澱原則上是一個簡單的過程。在一種典型的方法中,將與目標蛋白質特異性結合的抗體塗覆在固相支持物上並暴露於含有該蛋白質的生物樣品。目標蛋白質與抗體結合,因而吸附在固相表面,而其他蛋白質和其他物質則保留在溶液中。從樣品中分離固相並洗滌,留下附著在固相支持物上的感興趣蛋白質的純樣品。
在本領域中對於基於細胞和組織的ChIP-Seq方法有很好的記載。通常使用20-30 µg 的經消化或超聲處理的染色質作為底物,其是從組織或培養細胞中萃取的。由於染色質由大約40%的DNA組成,這代表了大約8-24 µg的底物DNA。然而,循環cfDNA的濃度很低,在健康人類主體中測量為30±14 ng/ml,在胃癌患者中測量為71±55 ng/ml(Park et al, 2012)。因此,1ml血漿樣品將產生比在ChIP-Seq正常使用的染色質材料減少大約200-500倍。
由於大多數循環無細胞染色質由核小體組成,因此可用的循環無細胞轉錄因子-DNA染色質片段材料非常少。此外,可用的循環無細胞轉錄因子-DNA染色質片段材料將包括數以千計的轉錄因子。因此,由單一轉錄因子代表的用於本發明方法分析的可用底物材料將是循環中存在的少量循環無細胞轉錄因子-DNA材料的一小部分。
此外,來自細胞的染色質萃取物是相對純的染色質材料。相比之下,體液(例如血液、血清或血漿)含有少量染色質,但含有較高濃度的大量蛋白質和其他化合物,其​​中的任何一種都可能透過與固相轉錄因子抗體或其他所用之結合劑的非特異性附著,而干擾本發明方法。從血液、血清或血漿中免疫沉澱的循環轉錄因子DNA複合物的一個其他複雜因素是,和固相支持物上與特定結合劑結合的少量目標轉錄因子相比,背景非特異性結合因此較高,並且可能會掩蓋其檢測。
由於所有這些困難,關於ChIP-Seq在血漿或其他血液樣品基質中的文獻報導很少。血漿中的ChIP-Seq已被描述為用於核小體和核小體組蛋白,因為它們的含量很高(相對於單一轉錄因子的含量)。
透過適合的固相支持物與使用含有高濃度的強烈洗滌劑溶液對固相嚴格的洗滌,我們使用高親和力抗體,並且透過將固相支持物上其他蛋白質的非特異性結合減少到極低含量。
因此,在萃取與轉錄因子相連的DNA之前,可以用強(例如,至少1%的濃度(例如1.2%))洗滌劑或洗滌劑混合物來洗滌結合抗體的轉錄因子-DNA複合物。於一實施例中,在檢測相連的DNA片段之前,用含有至少1%濃度洗滌劑的緩衝溶液來洗滌步驟(i)中由結合劑結合的轉錄因子。有很多清潔劑可用於此目的。一些常見的例子包括但不限於Triton洗滌劑(例如Triton X-100)、Tween 洗滌劑(例如Tween 20和Tween 80)、去氧膽酸鈉、十二烷基硫酸鈉、辛基苯基聚乙二醇(IGEPAL CA-630)、二十二碳乙二醇十二烷基醚(Brij)、正十二烷基-β-麥芽糖苷、辛基-β-葡萄糖苷、辛硫基葡萄糖苷、3-((3-膽醯胺丙基)二甲基銨)-1-丙磺酸鹽 (CHAPS) 等等。
我們使用磁性聚苯乙烯微珠並用含有1%辛基苯基聚乙二醇、0.1%去氧膽酸鈉和0.1% 十二烷基硫酸鈉混合物的洗滌溶液反覆洗滌(洗滌5 次)。
於本發明一較佳實施例中,固相載體是聚苯乙烯顆粒,例如磁性聚苯乙烯顆粒。所用的抗體(或轉錄因子的其他結合劑)可以直接或間接連接到支持物上。
於本發明一較佳實施例中,用含有至少0.25%、或至少0.5%或至少1%洗滌劑或界面活性劑洗滌分離在固相支持物上的固相結合的轉錄因子-DNA複合物。所用的洗滌劑可以由單一洗滌劑或如本文所述的洗滌劑混合物組成。
於本發明一實施例中,所使用的固相轉錄因子結合劑支持物包括複合系統(multiplexed system),例如複合珠系統(例如由Luminex Corporation提供的系統)。在這個固相支持系統中可根據螢光區分的多個珠子,每個珠子都可以塗覆針對不同轉錄因子的不同特異性結合劑,且可以被同時使用以研究單一樣品中的多個轉錄因子-DNA複合物(Dunbar, 2006)。
DNA定序
本領域已知有許多分析、量化或鑑定DNA序列的方法,並且任何DNA分析方法都可用於本發明的方法,包括但不限於:次世代定序方法、等溫DNA擴增、冷PCR(在較低變性溫度下進行共擴增PCR)、MAP(MIDI-活化焦磷酸解)、PARE(個人化重組分析)、DNA 雜交方法(包括基因晶片方法和原位雜交方法)。此外,還可以透過表觀遺傳DNA定序分析來分析基因序列的表觀遺傳改變的DNA序列(例如,對於含有 5-甲基胞嘧啶的序列,使用亞硫酸氫鹽將未修飾的胞嘧啶轉化為尿嘧啶)。因此,於一實施例中,使用DNA定序分析相連的DNA,例如選自:次世代定序(靶向或全基因組)和甲基化DNA定序分析、BEAMing、PCR包括數位PCR和冷PCR(在較低變性溫度下進行共擴增-PCR)、等溫擴增、雜交、MIDI-活化焦磷酸分解 (MAP) 或個人化重組分析(PARE)。
本文所述的實施例使用了Illumina NovaSeq定序。因此,於本發明一較佳實施例中,從分離的轉錄因子中萃取的DNA透過次世代定序進行分析。
樣品製備
樣品可為任何能檢測到染色質片段的體液。已知染色質片段存在於血液、糞便、尿液和腦脊液中。我們還在痰液中檢測到染色質片段。於較佳實施例中,體液樣品是血液、血清或血漿樣品。這些樣品可用於測量和分析含有轉錄因子和DNA片段的循環無細胞染色質片段。
當血液樣品用於本發明的方法時,其可為全血、血清樣品或血漿樣品。全血或血清樣品可用作底物,用於分析任何(穩定結合的)轉錄因子-DNA染色質片段(包括具有任何DBD 類型的轉錄因子)。
血漿樣品,例如EDTA血漿樣品也可以用於本發明的方法中。在典型的血漿樣品採集方法中,將全血採集到檸檬酸鹽或EDTA血液採集管中,並在2小時內進行離心。得到的上清血漿可現用或冷凍直至分析。然而,鈣離子螯合劑用作血液採集管的添加劑以產生血漿,會導致循環鋅指轉錄因子-DNA複合物的解離。如上所述,最常見的一類轉錄因子是鋅指轉錄因子。
有許多方法可以克服這一困難,包括但不限於:(i) 避免使用鋅指轉錄因子並使用具有其他DBD類型的轉錄因子,(ii) 使用血清樣品,(iii) 使用肝素血漿或其他不涉及鈣螯合的血漿樣品類型或(iv)防止轉錄因子-DNA複合物的解離,例如透過交聯血液樣品中染色質片段中的蛋白質和/或DNA。
於一實施例中,體液樣品是血清樣品。血清被認為含有源自白血球(例如 NETs)的污染染色質材料。這種污染會干擾cfDNA的分析,因此血漿是最常用於ctDNA方法的樣品基質。然而,在DNA分析之前從其他染色質材料中分離出含有轉錄因子的染色質片段可以消除這種干擾。此外,血清中染色質材料的汙染是因為血液樣品中的嗜中性白血球由凝血因子(一種已知的NETosis誘導劑)觸發而形成嗜中性白血球胞外陷阱(NET)的結果。如果及時處理含有全血的血清樣品收集管,例如靜脈穿刺後15-60分鐘,污染的NET材料將是大染色質而不是小染色質片段,並且不會干擾小轉錄因子-DNA 複合物的分析。因此,本發明方法的另一個優點是擴大了可以使用的樣品類型。
透過向血清採血管中添加NETosis抑制劑,可以進一步減少或消除血清中污染性 NET的存在。這可以防止NETosis,從而最大限度地減少血清樣品中存在的背景染色質含量。許多NETosis抑制劑是本領域已知的。較佳的抑制劑包括蒽環類藥物,特別是阿黴素(doxorubicin)。因此,於本發明一實施例中,提供了一種檢測從人或動物主體獲得的血清樣品中包含轉錄因子和DNA片段的無細胞染色質片段的方法,包括步驟: (i) 從主體的血清採血管中獲取全血樣品; (ii) 使全血樣品接觸NETosis 抑制劑; (iii) 從全血樣品中分離血清樣品; (iv) 使血清樣品接觸與轉錄因子結合的結合劑; (v) 檢測或測量與轉錄因子相連的DNA片段;和 (vi)使用DNA片段的存在或數量或序列作為血清樣品中包含轉錄因子的無細胞染色質片段的含量的量度。
應當理解的是,本發明此實施例也可以用於提供訊息作為主體疾病狀態的指標,如本文先前所述。
於一實施例中,體液樣品是任何血漿樣品,包含使用鈣螯合劑產生的血漿樣品,例如EDTA血漿或檸檬酸鹽血漿,其中血漿樣品是透過使全血樣品接觸交聯劑而獲得。交聯劑可在以下過程中的第一步中接觸全血,所述過程包括:(1) 使全血樣品接觸交聯劑;(2)使交聯後的樣品接觸鈣離子螯合劑;(3)從樣品中分離出血漿。
交聯是本領域眾所周知的技術。最常用的交聯劑是甲醛,其可使蛋白質分子彼此結合並且與DNA結合。然而,過度的交聯可能導致轉錄因子中抗體結合表位的結構發生變化(並因此導致抗體結合的喪失),甚至是轉錄因子與分離的蛋白質分子或複合物的交聯。為了防止這種情況,交聯通常在添加甲醛後幾秒鐘或幾分鐘停止,例如透過添加過量的甘胺酸或三(羥甲基胺基)甲烷(TRIS)以停止進一步的交聯。因此,於本發明一態樣中,提供了一種檢測、分析或測量取自人或動物主體的血液樣品中含有轉錄因子和相連DNA片段的染色質片段的方法,包括步驟: (i) 使從主體獲得的血液樣品接觸交聯劑; (ii)選擇性地添加淬熄劑(quenching agent)以停止進一步交聯; (iii) 使樣品接觸鈣離子螯合劑; (iv) 從樣品中分離血漿; (v)使血漿樣品與結合轉錄因子的結合劑接觸; (vi) 分離含有轉錄因子的結合的染色質片段;和 (vii)分析分離的染色質片段(例如透過本文所述的方法)。
於本發明另一態樣中,提供了一種檢測人類或動物主體疾病的方法,包括以下步驟: (i) 使取自主體的血液樣品接觸交聯劑; (ii)選擇性地添加淬熄劑以停止進一步交聯; (iii) 使樣品接觸鈣離子螯合劑; (iv) 從樣品中分離血漿; (v)使血漿樣品接觸與轉錄因子結合的結合劑; (vi) 分離與轉錄因子相連的DNA; (vii)選擇性地透過PCR方法擴增分離的DNA; (viii) 確定DNA的數量和/或序列;和 (ix)使用轉錄因子的存在和/或相連的DNA的序列作為檢測主體疾病狀態的生物標記物。
於一較佳實施例中,使用甲醛或甲醛釋放劑作為交聯劑。於一實施例中,使用EDTA作為鈣離子的螯合劑以防止凝結。於較佳實施例中,在採集全血樣品後立即將甲醛添加到全血中,例如透過將全血樣品添加到已經含有甲醛的試管中。將試管放置足夠的時間以進行交聯反應,然後通過添加淬熄劑來停止反應以防止血漿成分的過度交聯。淬熄劑通常是胺化合物,例如與甲醛反應的甘胺酸或TRIS。淬熄劑可以與EDTA一起添加,例如透過在TRIS緩衝液中添加甘胺酸和EDTA的溶液。然後將全血樣品離心並分離含有交聯的轉錄因子結合的DNA複合物的血漿,用於本發明方法所進行的分析。
於本發明另一態樣中,提供了一種檢測人類或動物主體疾病的方法,包括步驟: (i) 使取自人類或動物主體的血液樣品接觸交聯劑; (ii) 使全血樣品接觸淬熄劑和鈣離子螯合劑; (iii) 分離由步驟(ii)中的樣品產生的血漿; (iv)使血漿樣品接觸與轉錄因子結合的結合劑; (v) 分離與轉錄因子相連的DNA; (vi) 選擇性地擴增分離的DNA; (vii) 確定DNA的數量和/或序列;和 (viii)使用轉錄因子的存在和/或相連DNA的序列作為生物標記物來檢測主體中疾病的存在和/或性質。
如上所述,循環中存在的轉錄因子很可能是那些與DNA穩定結合的轉錄因子,而不是那些與DNA瞬時結合並且以動態方式解離的轉錄因子。對於最穩定結合的包括轉錄因子的DNA循環染色質片段,在整個培養的細胞或組織樣品中很快與甲醛交聯,只需不到1或2分鐘。我們推斷,雖然甲醛擴散和進入細胞可能需要1或2分鐘,然後進入細胞核,接著染色質交聯,但在染色質的全血環境中,這一時間可能會減少,因為染色質片段在溶液中是游離的並且可以立即進行交聯。所使用的交聯劑可以是甲醛或甲醛釋放劑(formaldehyde releasing agent)(也稱為甲醛釋放者、甲醛供體或甲醛釋放防腐劑)。甲醛釋放劑是緩慢釋放甲醛的部分(moiety)。許多甲醛釋放劑在本領域中是已知的並且通常用作為化妝品產業中的抗微生物防腐劑,例如在皮膚護理和頭髮護理產品中,由於毒性而避免高含量的甲醛但透過釋放保持低保護水準。因此,於一實施例中,交聯劑是甲醛釋放劑。
我們推斷,全血(與細胞或組織相反)中無細胞循環轉錄因子-DNA複合物的交聯是快速的,並且可能比鋅指蛋白的鋅消耗更快發生。因此,於本發明一實施例中,交聯劑可以與鈣離子螯合劑同時加入。含有EDTA和甲醛釋放劑的採血管(BCT)可購買獲得,例如可從 Streck Inc.獲得無細胞DNA採血管(BCT)。添加到此類管中的全血同時暴露於EDTA和交聯劑。
我們使用不同的EDTA樣品製備方法進行了許多實驗。舉例而言,雌激素受體(ER)是一種鋅指轉錄因子。我們使用ELISA方法測量了(常規)EDTA血漿樣品中存在的ER含量。如圖5所示,ER是可測得的。我們從EDTA血漿樣品中免疫沉澱ER,萃取與固相結合的DNA並擴增萃取物中存在的DNA。然而,在擴增的樣品中沒有觀察到DNA。我們推斷這是因為ER-DNA複合物(ER-DNA complexe)在EDTA血漿中分離。
CTCF(亦稱為CCCTC-結合因子)是一種進化上保守的鋅指轉錄因子,其透過11個鋅指的組合與基因組中的大量位點結合,在基因組功能中起關鍵作用。對人類基因組中CTCF結合位點的研究鑑定了19種不同細胞類型的77,811個不同的結合位點(Wang et al, 2012)。在所研究的所有19種細胞類型中,發現77,811個結合位點中有27,662個被佔據。其餘50,149個結合位點的CTCF結合表現出組織特異性。研究的19種細胞類型包括12種正常細胞類型和7種癌症或EBV-永生化細胞株,代表結腸直腸癌(Caco-2)、子宮頸癌 (HeLa-S3)、肝細胞癌(HepG2)、神經母細胞瘤(SK-N-SH_RA)、視網膜母細胞瘤(WERI-RB-1)和EBV-轉化的淋巴質體(GM06990)。發現CTCF在1,236個結合位點的結合對癌細胞株具有特異性,並且這些結合位點的佔據將永生細胞株和癌細胞株從正常細胞(包括上皮細胞、成纖維細胞和內皮細胞)區分開來(Liu et al, 2017)。
我們使用小鼠抗-CTCF抗體對從18名被診斷患有癌症的主體收集的4個匯集的交聯EDTA血漿樣品(收集在Streck cfDNA BCT中)進行免疫沉澱CTCF-DNA。我們對固相支持物上透過ChIP分離的蛋白質進行了西方墨點法分析。圖7中的結果顯示,在所有4個匯集的樣品中都存在對應於分子量約為140kD的CTCF的蛋白質條帶(但並不存在於使用非特異性小鼠IgG代替抗-CTCF抗體的對照實驗中)。大約50kD的條帶是對應於標記的抗-小鼠IgG抗體(用於西方墨點法)與小鼠抗-CTCF抗體(用於ChIP)的重鏈的結合。
然後,我們使用從診斷為患有乳癌的主體收集的交聯EDTA血漿樣品(在Streck cfDNA BCT中收集)來重複ChIP方法以進行免疫沉澱CTCF-DNA複合物。我們從固相支持物中萃取cfDNA片段,將萃取的DNA片段連接到轉接子寡核苷酸,並且擴增存在的cfDNA。透過電泳分析擴增的cfDNA文庫,得到的電泳圖(圖8)顯示文庫包含35-80bp範圍內的小片段(對應於x軸上175-220bp之間的峰,以說明轉接子連接的片段)。在長度大約50bp處觀察到轉接子連接的cfDNA片段的主峰(這對應於x軸上190bp 處的峰,以說明轉接子連接的片段長度)。雖然擴增的cfDNA文庫包含35-80bp範圍內的小片段,但並非所有這些片段都與樣品中的CTCF結合,因為從塗有非特異性小鼠IgG的固相支持物的擴增萃取物中也獲得了小DNA片段。然而,用特異性抗-CTCF抗體ChIP(1000螢光單位(FU))獲得的特異性峰高於非特異性IgG峰(80 FU)。
透過次世代定序方法對使用抗-CTCF免疫沉澱分離的擴增cfDNA文庫進行定序。圖9顯示了,從診斷為CRC的患者收集的交聯EDTA血漿樣品(收集在Streck cfDNA BCT中)製備的擴增文庫的結果。我們觀察到9780個已發表的CTCF TFBS序列與小cfDNA片段結合的富集(Kelly et al, 2012)。相較之下,用於結合至非特異性小鼠IgG的cfDNA 文庫並沒有顯示富集。參考輸入的非特異性對照,cfDNA片段序列的峰調用(peak calling)導致CTCF作為具有最多TFBS序列片段的轉錄因子。我們得出結論,本發明的方法對於血漿中轉錄因子的ChIP-Seq是成功的。
雄激素受體(AR)是前列腺癌中感興趣的鋅指轉錄因子。為了顯示本發明的方法可以應用於比CTCF更不豐富的轉錄因子,我們將相同的方法應用於AR。我們使用小鼠抗-AR抗體,對從8名被診斷患有前列腺癌的主體得到的交聯EDTA血漿樣品(收集於 Streck cfDNA BCT)進行免疫沉澱AR。我們使用來自LnCAP前列腺癌細胞株細胞的AR作為陽性對照組,對固相支持物上透過ChIP分離的蛋白質進行了西方墨點法分析。圖11中的結果顯示,在所有8個樣品中都存在對應於分子量約為10kD的AR的蛋白質條帶,並且在2個樣品中特別深(圖11的道次2和道次3)。大約50kD的條帶對應於標記的抗小鼠IgG抗體與用於 ChIP的小鼠抗-AR抗體重鏈的結合。然後,我們從固相支持物中萃取DNA,將萃取的DNA片段連接到轉接子寡核苷酸並擴增存在的DNA。圖12中的結果顯示,擴增的cfDNA文庫包含35-80bp範圍內的小片段(如上,轉接子連接的片段的峰值顯示於175-220bp)。雖然擴增的cfDNA文庫包含35-80bp範圍內的小片段,但並非所有這些片段都與樣品中的AR結合,因為從塗有非特異性小鼠IgG的固相支持物的擴增萃取物中也獲得了小DNA 片段。然後,對於藉由西方墨點法觀察到的具有最高AR含量的2個樣品所獲得的擴增的cfDNA 文庫,使用次世代定序進行定序。
分離的轉錄因子-DNA複合物
本發明的前述態樣是檢測、測量或特徵化染色質片段的方法,所述染色質片段包括直接或間接結合至DNA的轉錄因子。於本發明一實施例中,存在一種用於檢測取自主體的體液樣品中未結合DNA的轉錄因子(即游離或未結合的轉錄因子)的方法。游離轉錄因子的檢測可以藉由使用包括轉錄因子的TFBS DNA序列、選擇性地包括側翼序列的寡核苷酸作為游離轉錄因子的結合劑來進行。然後可以檢測寡核苷酸結合的游離轉錄因子,例如使用標記的抗-轉錄因子抗體(例如參見Active Motif, 2006)。轉錄因子最初可以以非活性形式產生,隨後可以透過例如磷酸化被轉譯後活化。活性轉錄因子形式與包含其TFBS序列的寡核苷酸結合。非活性轉錄因子形式不與包括其TFBS序列的寡核苷酸結合(Lee et al, 2007)。因此,可以使用涉及游離轉錄因子與寡核苷酸結合的測定法檢測體液樣品中的活性游離轉錄因子,所述寡核苷酸包括轉錄因子結合的DNA序列,例如轉錄因子的TFBS序列,隨後添加第二轉錄因子結合劑,例如抗-轉錄因子抗體,其針對轉錄因子特異性結合並使用抗體結合的存在或程度作為活性游離轉錄因子存在於樣品中的存在或數量的度量。因此,於本發明一實施例中,提供了一種檢測人或動物主體中游離轉錄因子的方法,包括步驟: (i) 使獲自人類或動物主體的體液樣品接觸針對轉錄因子結合的寡核苷酸; (ii) 分離寡核苷酸結合的轉錄因子; (iii)使分離的轉錄因子接觸與轉錄因子結合的第二結合劑;和 (iv)使用轉錄因子的第二結合劑的存在或程度作為樣品中無細胞轉錄因子的含量的量度。
於較佳實施例中,用於結合游離轉錄因子的寡核苷酸包括TFBS序列。於較佳實施例中,用於結合游離轉錄因子的寡核苷酸連接到固相支持物上。於較佳實施例中,第二結合劑是抗體。於較佳實施例中,第二結合劑被標記,使得其與固相寡核苷酸結合的轉錄因子的結合可以容易地被檢測和/或量化。
於一實施例中,將鋅離子添加到樣品中以促進寡核苷酸與鋅指轉錄因子的結合。鋅離子可與步驟(i)中在添加寡核苷酸同時添加,或在步驟(i)之前添加。
於本發明另一態樣中,提供了一種檢測人類或動物主體疾病的方法,包括步驟: (i) 使獲自人類或動物主體的體液樣品接觸與轉錄因子結合的寡核苷酸; (ii) 分離寡核苷酸結合的轉錄因子; (iii)使分離的轉錄因子接觸與轉錄因子結合的第二結合劑;和 (iv)使用第二結合劑與轉錄因子的結合的存在或結合程度作為主體中疾病的存在和/或性質的指標。
於一實施例中,使取自主體的體液樣品與一或多的寡核苷酸(例如,與一或多個轉錄因子特異性結合的TFBS序列)接觸以鑑定疾病的存在和/或性質。於另一實施例中,該方法使用多重測定(即包含多於一種寡核苷酸,較佳地,其中每種寡核苷酸對不同的轉錄因子有特異性)進行以測試一或多種疾病。舉例而言,對一或多種癌症疾病特異的多重轉錄因子的檢測(選擇性地除了在許多癌症中表現的轉錄因子之外),除了鑑定癌症的組織外,還能夠在單一血液樣品中檢測許多不同的癌症疾病。用於多重測試的方法是本領域眾所周知的,例如但不限於DNA微陣列方法或Luminex Corporation的多重珠子系統,其可用於在單一樣品中進行大量多重測定(Dunbar, 2006)。
於較佳實施例中,疾病是癌症。於另一實施例中,疾病的性質是受癌症影響的組織。
雌激素受體(ER)是一種配體活化的核激素受體鋅指轉錄因子。我們推斷血液中的循環染色質片段(包括鋅指轉錄因子和DNA片段)可能在EDTA血漿樣品中被破壞。我們在取自涉及雌激素受體過度表現的婦科癌症患者以及患有ER-陰性乳癌的患者的血血漿樣品中,進行酶聯免疫吸附測定(ELISA)以測量雌激素受體α(ERα)。ER參與大量基因轉錄的調控,在女性生殖組織和生殖癌組織中高度表現。ER在造血細胞中低度表現,但在ER-陽性乳癌和卵巢癌細胞中高度表現。ER-陽性癌細胞具有雌激素受體,對雌激素敏感,其生長受雌激素刺激。ER-陰性癌細胞沒有雌激素受體,對雌激素不敏感。大約80%的卵巢癌和乳癌是ER-陽性的。與ER-陰性癌症相比,ER-陽性癌症的預後更好。由於ER-陽性癌症響應雌激素而生長,因此它們可以接受激素治療,包括泰莫西芬(tamoxifen)和芳香酶抑制劑,它們通過與雌激素結合來抑制雌激素受體的活化,從而防止癌症生長。
癌症的ER-陽性或陰性狀態是由手術切除的癌症組織的免疫組織化學測試而確定。通常,與ER結合的標記抗體與癌細胞/組織一起培養,觀察到的抗體染色程度決定了狀態。 ER-陽性癌症被給予一個ER分數。測量激素受體檢測為陽性的癌細胞比例強度。結合這兩個參數,以從0到8的等級對樣品進行評分。具有更多受體且顯示為更高強度的樣品得分更高。
由於核激素受體是細胞蛋白,因此預期ER不會出現在循環中。我們假設血漿中存在的任何游離ERα必須源自循環染色質片段(其中包含ERα),但在添加EDTA以製造血漿時,它們會從DNA結合中解離以釋放游離ERα。我們預計此類染色質片段的含量會非常低,因此預計會發現血漿中游離ERα的含量無法藉由ELISA方法檢測到,並且低於所用ELISA的最低靈敏性(0.8pg/ml)。令人驚訝的是,我們發現血漿中的游離ERα含量高達20pg/ml(圖 5)。為了說明這一點,介白素6和腫瘤壞死因子是通常測量的血液生物標記物,其正常範圍分別約為5-15pg/ml且高達8pg/ml。此外,在卵巢癌和ER-陽性乳癌中ERα的測量含量高於ER-陰性乳癌,顯示ERα的腫瘤起源。
因此,於本發明另一態樣中,提供了一種用於檢測生物樣品中鋅指轉錄因子的存在或測量其含量的方法,包括步驟: (i) 使樣品接觸鋅離子螯合劑;和 (ii) 分析樣品中置換的鋅指轉錄因子的存在或含量。
於一實施例中,生物樣品是體液樣品,例如血液、血清或血漿。於另一實施例中,鋅離子螯合劑是EDTA。可以將EDTA添加到體液樣品中以破壞鋅指與DNA的結合。
於一較佳實施例中,生物樣品是全血樣品並且鋅離子螯合劑是EDTA,其被添加到全血樣品中以破壞鋅指-DNA結合,以及防止血液凝固,因此產生含有游離鋅指轉錄因子的血漿樣品。任何方法都可以用於分析樣品的轉錄因子。於一較佳實施例中,所採用的分析方法是免疫測定,特別是2位點「三明治型」免疫測定。因此,在本發明的一個較佳實施例中,提供了一種用於檢測從主體採集的全血樣品中含有鋅指轉錄因子的循環染色質片段的存在或含量的方法,包括步驟: (i) 使全血樣品接觸EDTA以產生血漿樣品;和 (ii) 使用免疫測定法分析血漿樣品中鋅指轉錄因子的存在或含量。
鋅指轉錄因子家族是最豐富的轉錄因子家族。因此,本發明的此態樣可用於檢測大多數感興趣的轉錄因子。術語「鋅指轉錄因子」是指任何含有鋅指結合結構域的轉錄因子。
循環鋅指轉錄因子可用作檢測疾病的生物標記物,例如婦科癌症的檢測、診斷、治療選擇、監測或預後。因此,於本發明一實施例中,提供了一種用於確定主體的疾病狀態的方法,例如用於在主體中檢測、診斷、治療選擇、監測或預後或針對該疾病的方法,包括步驟: (i) 使取自主體的血液樣品接觸鋅螯合劑接觸以產生血漿樣品; (ii) 分析血漿樣品中鋅指轉錄因子的存在或含量;和 (iii)使用樣品中鋅指轉錄因子的存在或含量作為主體疾病狀態的指標。
本發明的這個方面也適用於細胞培養方法。用於轉錄因子的染色質免疫沉澱 (ChIP) 方法是複雜、困難、耗時且不可靠的。典型的ChIP方法包括從細胞中萃取染色質材料、透過 DNA消化或使用物理方法(例如超音波處理)將染色質片段化、使用抗體分離染色質片段、萃取與抗體相連的DNA並確定所萃取DNA的DNA序列。使用本發明的方法,鋅指轉錄因子的存在或含量可以透過將染色質材料從細胞中萃取到含有EDTA(或其他鋅螯合劑)的流體中並測量游離鋅指轉錄因子(例如透過ELISA)。
任何方法可用於分析樣品中鋅指轉錄因子的存在或含量,包括但不限於質譜法和任何免疫化學方法。於較佳實施例中,用於分析樣品中鋅指轉錄因子的存在或含量的方法是免疫測定法。
正如我們發現的那樣,將鋅離子螯合劑添加到含有包括鋅指轉錄因子在內的染色質片段的樣品中,會導致這些染色質片段被破壞以產生游離的鋅指轉錄因子,而EDTA是鋅(以及鈣)離子的強螯合劑,很明顯的是,不能使用涉及用抗體(或其他轉錄因子結合劑)分離轉錄因子的方法在 EDTA 血漿樣品中研究鋅指轉錄因子結合的 DNA,且也不能分析與轉錄因子相連的DNA,因為DNA將不再與轉錄因子相連。
應當理解的是,破壞與DNA結合的鋅指轉錄因子將導致游離鋅指轉錄因子和游離DNA片段,包括基因組中TFBS的序列和側翼DNA序列。因此,於本發明另一態樣鐘,提供了一種用於鑑定主體中是否存在含有鋅指轉錄因子的循環染色質片段或與鋅指轉錄因子結合的DNA片段序列的方法,包括步驟: (i) 使取自主體的血液樣品接觸鋅螯合劑以產生血漿樣品;和 (ii)分析血漿樣品中游離DNA片段的存在或含量,該DNA片段包含轉錄因子結合位點序列或鋅指轉錄因子結合位點的側翼序列。
含有轉錄因子和相連TFBS的染色質片段的存在可用於臨床目的,包括用於檢測、監測、預後或治療選擇或用於如本文所述之疾病。因此,於本發明一態樣中,提供了一種用於確定主體的疾病狀態的方法,例如用於檢測、監測、預後或治療選擇或疾病的治療,包括步驟: (i) 使取自主體的血液樣品接觸鋅螯合劑以產生血漿樣品; (ii) 分析血漿樣品中游離DNA片段的存在或含量,其中游離DNA片段包含轉錄因子結合位點序列或鋅指轉錄因子結合位點側翼序列的DNA序列;和 (iii)使用樣品中DNA片段的存在和/或含量和/或序列作為主體疾病狀態的指標。
可透過多種方法確定血漿或其他樣品中的核小體或其他蛋白質結合的DNA片段中游離DNA片段的存在和/或序列,包括使用互補DNA序列結合樣品中的DNA 片段。這可透過例如便於同時探測樣品的多個序列DNA晶片達到。本發明另一實施例涉及使用外源鋅指轉錄因子作為特異性DNA結合劑。在這方法中,去除鋅螯合劑以促進鋅指轉錄因子與DNA的結合。其可透過緩衝液交換來進行,例如透過透析或透過使用粒徑排阻層析法(size exclusion chromatography),例如使用葡聚糖凝膠粒徑排阻層析法。可以分離含有鋅指轉錄因子的TFBS的DNA片段,例如透過使用固相結合的轉錄因子作為含有TFBS的游離DNA的結合劑。可以分析分離的DNA的序列和/或DNA片段長度。重組轉錄因子蛋白可用於本發明之目的。重組鋅指轉錄因子蛋白可連接至固相支持物或可含有連接子部分,並且轉錄因子可以液體形式使用並透過連接系統分離。本領域已知許多這類的連接樣品,例如鋅指轉錄因子可以被生物素化並使用固相鏈黴親和素分離。因此,於本發明一實施例中,提供了一種用於鑑定主體中是否存在含有鋅指轉錄因子的循環染色質片段和/或與鋅指轉錄因子結合的DNA片段序列的方法,其包括以下步驟: (i) 使取自主體的血液樣品接觸鋅螯合劑以產生血漿樣品; (ii) 從樣品中去除鋅螯合劑; (iii) 使樣品接觸外源鋅指轉錄因子;和 (iv) 分析與外源轉錄因子結合的 DNA 片段。
可選地或另外地,鋅螯合劑可以輕易在樣品中失活。於本發明一實施例中,在與外源轉錄因子接觸之前,透過添加過量離子(較佳為鋅離子)使鋅螯合劑失活。因此,於本發明一實施例中,提供了一種用於鑑定主體中含有鋅指轉錄因子和/或與鋅指轉錄因子結合的DNA片段之方法,包括步驟: (i) 使取自主體的血液樣品接觸鋅螯合劑以產生血漿樣品; (ii) 透過添加過量的鋅或其他離子使樣品中的鋅螯合劑失活; (iii) 使樣品接觸外源鋅指轉錄因子接觸;和 (iv) 分析與外源轉錄因子結合的DNA片段。
含有轉錄因子和相連TFBS的染色質片段的存在可用於臨床目的,包括用於檢測、監測、預後或治療選擇或用於如本文所述的疾病。因此,於本發明一態樣中,提供了一種用於確定主體的疾病狀態的方法,例如用於檢測、監測、預後或治療選擇或疾病的治療,包括步驟: (i) 使取自主體的血液樣品接觸鋅螯合劑以產生血漿樣品; (ii) 去除或滅活樣品中的鋅螯合劑; (iii) 使樣品接觸外源鋅指轉錄因子; (iv) 分析與外源轉錄因子結合的DNA片段,以及 (v) 使用樣品中DNA片段的存在和/或含量和/或序列作為主體疾病狀態的指標。
無細胞核小體的去除
樣品的製備還可以選擇性地包括預純化步驟以在分析之前從樣品中去除大部分核小體和核小體結合的DNA。這降低了背景訊號,提高了與轉錄因子結合的感興趣的DNA片段的分離和擴增效率,並且可以提高本發明方法的分析和臨床敏感性。因此,於一實施例中,該方法另外包括從體液樣品中去除無細胞核小體。在使用本文所述的本發明方法之前,可以從樣品中去除包含核小體的染色質片段(選擇性地個別分析)。該製備步驟的目的是從樣品中去除大量DNA片段,以降低它們在分析中可能產生的任何背景訊號。這可以透過例如但不限於使樣品接觸與核小體結合的結合劑來完成,例如固相抗-核小體結合劑,包括例如抗體或核小體結合蛋白,例如WO2021038010所述之蛋白質。抗體可選擇性地與組蛋白結合,例如核心組蛋白(如H2A、H2B、H3或H4,或連接子組蛋白例如H1)。對組蛋白的引用包括組蛋白轉譯後修飾和組蛋白變體或同功異形體。核小體結合蛋白可選自:與連接子DNA結合的染色質結合蛋白或與核小體相連的連接子DNA結合的蛋白質。舉例而言,與連接子DNA 結合的染色質結合蛋白可選自:染色質解旋酶DNA結合 (Chromodomain Helicase DNA Binding,CHD) 蛋白;DNA (胞嘧啶-5)-甲基轉移酶(DNMT) 蛋白;高遷移率族蛋白 (HMGB) 蛋白;聚[ADP-核糖]聚合酶(PARP)蛋白;或甲基-CpG結合域(MBD)蛋白,例如MBD1、MBD2、MBD3、MBD4或甲基CpG結合蛋白2(MECP2)。與核小體相連的連接子DNA結合的蛋白質可選自組蛋白H1、macroH2A(mH2A)或其片段或工程類似物。
樣品中存在的所有或大部分核小體材料可能被吸附(例如吸附到固相上)並因此從樣品中去除。因此,於一實施例中,該方法包括使體液樣品接觸與核小體或其組分結合的結合劑,並在使樣品與轉錄因子結合劑接觸之前除去與結合劑結合的樣品。
據報導,血漿中一大部分或大部分長度小於100bp的短cfDNA片段並非源自包括調控蛋白在內的染色質片段,而是源自核小體相連的DNA,該DNA的一股或兩股是裂開的或斷掉的。在這種情況下,短cfDNA片段可代表例如與核小體相連的150bp DNA片段,該片段在一或多個位置被切割以產生二或多個更小的cfDNA片段(例如兩個75bp的片段),而不是單個150bp cfDNA片段(Sanchez et al, 2018)。因此,在將樣品暴露於轉錄因子結合劑之前將核小體從樣品中去除具有附加的優點,該優點是去除源自核小體相連的切口性DNA的小於100bp的短cfDNA片段。例如,與透過凝膠分離方法對萃取的cfDNA片段進行尺寸分離相比,這進一步降低了樣品中核小體相連cfDNA的背景。
我們已經證明了使用抗-H3抗體從人血漿樣品中定量去除含有核小體的染色質片段。
於一較佳實施例中,磁珠用作固相支持物,但是任何合適的材料都可被使用。類似地,可以使用在WO2016067029、WO2017068371和WO2021038010中描述的任何核小體結合方法,作為去除核小體的方法。因此,於一實施例中,用於本發明方法的樣品不包含核小體。於另一實施例中,透過本發明的方法檢測的無細胞染色質片段由轉錄因子和DNA片段組成。
於本發明一實施例中,提供了一種檢測人類或動物主體疾病的方法,包括步驟: (i) 從人或動物主體獲得的體液樣品中去除無細胞核小體; (ii) 使樣品接觸與轉錄因子結合的結合劑; (iii) 分離與轉錄因子相連 DNA; (iv)透過PCR方法擴增分離的DNA; (v) 確定擴增的DNA序列;和 (vi)使用轉錄因子的存在和相連DNA的序列作為組合生物標記物來確定主體中疾病的存在和/或性質。
於本發明一些實施例中,可以在不分離DNA的情況下確定與無細胞轉錄因子或染色質片段相連的DNA片段的存在或序列。這可以透過多種方法完成,包括但不限於不需要DNA分離的擴增方法。
如本文所用之術語「結合劑」係指配體或結合劑,例如天然存在的或化學合成的化合物,其能夠特異性結合生物標記物(即特異性轉錄因子)。根據本發明的配體或結合劑可包含能夠特異性結合生物標記物的胜肽、抗體或其片段、或合成的配體(例如塑性抗體)、或適體或寡核苷酸、或分子拓印表面或裝置。抗體可為能夠特異性結合目標的單株抗體或其片段。可用可檢測的標記物以標記本發明的配體或結合劑,所述標記物例如:發光、螢光、酶或放射性標記物;可選地或另外地,可用親和標籤以標記根據本發明的配體,所述親和標籤例如:生物素、抗生物素蛋白、鏈黴親和素、his(例如hexa-His)標籤。於一實施例中,結合劑係選自:抗體、抗體片段或適體。於另一實施例中,使用的結合劑是抗體。術語「抗體」、「結合劑(binding agent)」或「結合劑(binder)」在本文中可互換使用。
於一實施例中,樣品是生物液體(其與本文中的術語「體液」可互換使用)。任何體液樣品類型均可用於本發明,包括但不限於:血液、血漿、經血、子宮內膜液、糞便、尿液、唾液、黏液、精液和呼吸(breath)(例如冷凝呼吸),或其萃取物或純化物,或稀釋物。生物樣品還包括來自活體或屍檢的樣品。樣品舉例可在適當稀釋或濃縮的情況下製備,並以常規方式儲存。於一較佳實施例中,生物液體樣品係選自:血液或血清或血漿。本領域技術人員將清楚的是,體液中染色質片段的檢測具有不需要活檢的微創方法的優點。
於一實施例中,主體為哺乳動物主體。於另一實施例中,主體選自人或動物(例如伴侶動物或小鼠)主體。於再一實施例中,主體是人類主體。於一實施例中,人主體是非胚胎主體(即處於除了胚胎以外任何發育階段的人)。於一實施例中,人類主體是成年主體,即大於16歲或年齡,例如大於18、21或25歲。於一替代性實施例中,主體是動物主體。於另一實施例中,動物主體選自囓齒動物(例如小鼠、大鼠、倉鼠、沙鼠或花栗鼠)、貓科動物(即貓)、犬科動物(即狗)、馬科動物(即馬)、豬(即豬)或牛(即牛)主體。
應當理解的是,本發明的用途和方法可在體外或離體進行。
根據本發明另一態樣,提供了一種用於檢測或診斷動物或人類主體癌症的方法,包括步驟: (i) 檢測或測量取自該主體之體液樣品中與包括轉錄因子的無細胞染色質片段相連的DNA;和 (ii) 使用在步驟(i)中檢測到的相連DNA含量和/或DNA序列來鑑定主體的疾病狀態。
根據本發明另一態樣,提供了一種用於檢測或診斷動物或人類主體的炎性疾病的方法,包括步驟: (i) 檢測或測量取自該主體之體液樣品中與包括轉錄因子的無細胞染色質片段相連的DNA;和 (ii) 使用在步驟(i)中檢測到的相連DNA含量和/或DNA序列來鑑定主體的炎性疾病狀態。
於本發明一實施例中,樣品中包括轉錄因子和DNA片段的無細胞染色質片段的存在用於確定需要這種治療的主體的最佳治療方案。
根據本發明另一態樣,提供了一種評估動物或人類主體是否適合進行醫學治療的方法,包括步驟: (i) 檢測、測量或定序取自該主體之體液樣品中與包括轉錄因子的無細胞染色質片段相連的DNA;和 (ii) 使用在步驟 (i) 中檢測到的相連DNA含量和/或DNA序列作為為主體選擇合適治療的參數。
根據本發明另一態樣,提供了一種用於監測動物或人類主體的治療的方法,包括步驟: (i) 檢測、測量或定序取自該主體之體液樣品中與包括轉錄因子的無細胞染色質片段相連的DNA; (ii) 在一或多種時機下重複檢測、測量或定序與從該主體獲得的體液樣品中包含轉錄因子的無細胞染色質片段相連的DNA;和 (iii) 使用步驟(i)相較於步驟(ii)所測得的相連DNA含量和/或DNA序列的任何變化作為該主體病況任何變化的參數。
在測試樣品中檢測到的與含有轉錄因子的無細胞染色質片段相連的DNA含量和/或DNA序列,與先前在同一個測試主體中獲得的先前測試樣品中所測得的含量或序列相比,所得之變化可作為有益效果的指標,例如所述治療對病症或疑似病症的穩定或改善。此外,一旦治療完成,可以定期重複本發明的方法以監測疾病的複發。
應當理解的是,本發明的這些態樣可以與本文揭露的方法結合使用,例如步驟(i)包括使體液樣品接觸與轉錄因子結合的結合劑,然後檢測或測量與所述轉錄因子相連的DNA。
於一實施例中,檢測或測量包括轉錄因子和DNA片段(即與包括轉錄因子的無細胞染色質片段相連的DNA)的無細胞染色質片段作為套組測量之一。例如,與其他無細胞染色質轉錄因子標記物或與任何其他生物標記物組合。
根據本發明另一態樣,提供了一種用於檢測、測量或定序包括轉錄因子和DNA片段的無細胞染色質片段的方法,單獨或作為套組測量的一部分,用於確定或評估動物或人類主體是否適合醫學治療、或用於監測動物或人類主體的治療之目的,用於患有實際或疑似癌症或良性腫瘤的主體。
應當理解的是,透過本發明方法進行的測量或測定可包括使用參考材料作為校準物或陽性對照,以提供一個標準,測定的結果可被比較或校準和/或確認或監測該測定的化學物質的正確功能。合適的參考材料可以包括生物來源的含有轉錄因子的染色質片段或重組染色質片段,包括但不限於重組轉錄因子-DNA複合物。
如本文所用之術語「檢測」或「診斷」涵蓋疾病狀態的鑑定、確認及/或表徵。根據本發明的檢測、監測和診斷方法可用於確認疾病的存在、透過評估發作及進程來監測疾病的發展、或評估疾病的改善或消退。檢測、監測和診斷方法也可用於評估臨床篩檢、預後、治療的選擇、評估治療效益的方法,即用於藥物篩選及藥物開發。
應當理解的是,檢測和測量包括定序。如本文所用之術語「定序」包括確定全部或部分DNA片段的核苷酸鹼基序列(通常為腺嘌呤、鳥嘌呤、胸腺嘧啶和胞嘧啶鹼基序列)。
有效的診斷和監測方法為改善預後提供了非常強大的「患者解決方案」,透過建立正確的診斷,可快速辨別最適合的治療(從而減少暴露於不必要的有害藥物副作用)並降低復發率。
應當理解的是,鑑定和/或定量可透過適合鑑定來自患者的生物樣品或生物樣品的純化物或萃取物或稀釋液中特定蛋白質或DNA片段序列的存在和/或含量的任何方法來進行。在本發明方法中,可以透過定序或透過測量樣品中生物標記物的濃度來進行量化。可用本發明的方法測試的生物樣品包括如上文所定義的那些。樣品舉例可在適當稀釋或濃縮的情況下製備,並以常規方式儲存。
可透過生物標記物或其片段的檢測來進行生物標記物的鑑定和/或定量,例如具有C端截短或N端截短的片段。片段長度較佳為大於4個胺基酸,例如長度為5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20個胺基酸。
可以直接檢測生物標記物,例如通過 SELDI 或 MALDI-TOF。或者,可以通過與一種或多種配體相互作用直接或間接檢測生物標記物,例如抗體或其生物標記物結合片段,或其他肽,或配體,例如肽。能夠特異性結合生物標記物的適體或寡核苷酸。配體或結合劑可具有可檢測標記,例如發光、螢光或放射性標記,和/或親和標籤。
舉例而言,檢測和/或定量可透過一或多種方法進行,其係選自由:SELDI(-TOF)、MALDI(-TOF)、一維電泳分析(1-D gel-based analysis)、二維電泳分析(2-D gel-based analysis)、質譜(MS)、逆相(RP)LC、尺寸滲透(凝膠過濾)、離子交換、親和力、HPLC、UPLC和其他基於LC或LC MS的技術所組成的群組。適合的LC MS技術包括ICAT® (Applied Biosystems, CA, USA)或iTRAQ® (Applied Biosystems, CA, USA)。也可以使用液相層析(例如高壓液相層析(HPLC)或低壓液相層析(LPLC))、薄層層析、NMR(核磁共振)光譜。
應當理解的是,檢測和/或測量DNA可包括例如本文所述的雜交或定序。
根據本發明的診斷或監測方法可以包括透過SELDI TOF或MALDI TOF分析樣品以檢測生物標記的存在或含量。這些方法也適用於臨床篩查、預後、監測治療結果、鑑定最有可能對特定治療方法有反應的患者、藥物篩選和開發以及鑑定藥物治療的新靶標。
可以使用免疫學方法來鑑定和/或量化分析物生物標記物,包括能夠特異性結合生物標記物的抗體或其片段。
根據本發明另一態樣,提供了一種用於鑑定包含轉錄因子和DNA片段的無細胞染色質片段作為用於檢測或診斷動物或人類主體疾病的組合生物標記物的方法,包括步驟: (i) 檢測和/或測量和/或定序患病主體之體液樣品中包括轉錄因子和DNA片段組合生物標記物的無細胞染色質片段; (ii) 檢測和/或測量和/或定序健康主體之體液樣品中包括轉錄因子和DNA片段組合生物標記物的無細胞染色質片段; (iii) 使用在患病和健康或對照主體中檢測到的含量和/或DNA序列之間的差異,以鑑定包含轉錄因子和DNA片段組合生物標記物的無細胞染色質片段是否可用作為疾病狀態的生物標記物。
應當理解的是,本發明此態樣可與本文所述之方法結合,即,步驟(i)和/或(ii)可以使用本文定義的方法進行。
根據本發明另一態樣,提供了透過本文所述方法鑑定出的生物標記物或組合生物標記物。
本文提供了用於實施本發明方法的診斷或監測試劑盒。用於檢測和/或定量生物標記物或組合生物標記物的這類試劑盒將適當地包含括用於轉錄因子的配體或結合劑,以及選擇性地包括用於擴增的試劑和/或定序與所述轉錄因子相連的DNA以及選擇性地包括用於核小體的配體或結合劑,選擇性地還有使用試劑盒的說明書。生物標記物監測方法、生物感測器和試劑盒作為患者監測工具也是至關重要的,使醫生能夠確定復發是否是因為疾病的惡化。若藥物治療經評估後為不適當的,則可以恢復或增加治療;如果合適的話可以改變治療方法。由於生物標記物對疾病狀態敏感,它們提供了藥物治療影響的指標。
根據本發明另一態樣,提供了用於檢測無細胞染色質片段的試劑盒,該試劑盒包含作為組合生物標記物的轉錄因子和DNA片段,其包括轉錄因子的配體或結合劑,選擇性地包括用於擴增和/或定序與所述轉錄因子相連的DNA,以及選擇性地包括用於核小體的配體或結合劑,選擇性地還有根據本文所述之方法使用試劑盒的說明書。
本發明另一態樣是用於檢測疾病狀態存在的試劑盒,包括能夠檢測和/或量化本文定義的一或多種生物標記物的生物感測器。
根據另一態樣,提供了本文定義的試劑盒用於診斷癌症的用途。根據另一態樣,提供了本文定義的試劑盒用於診斷炎性疾病的用途。根據另一態樣,提供了本文定義的試劑盒用於診斷產前疾病的用途。
根據另一態樣,提供了一種在所需主體中治療疾病的方法,其中所述方法包括以下步驟: (a) 使取自人類或動物主體的體液樣品接觸與轉錄因子結合的結合劑; (b) 檢測、測量或定序與轉錄因子相連的DNA片段;和 (c) 使用DNA片段的存在、數量或序列作為主體中疾病存在的指標;和 (d) 如果在步驟(c)中確定主體患有疾病,則給予治療。
於一實施例中,該疾病是癌症。於一替代性實施例中,該疾病是炎性疾病。根據另一態樣,提供了本文定義的試劑盒用於診斷懷孕主體的胎兒的產前疾病的用途。
於一實施例中,所施用的治療選自:手術、放射療法、化學療法、免疫療法、激素療法和生物療法。
根據本發明另一態樣,提供了一種所需主體中治療癌症的方法,其中所述方法包括以下步驟: (a)根據本文所述的方法檢測或診斷主體的癌症;接著 (b) 對所述個體進行抗癌療法、手術或藥物。
於一實施例中,該主體是人或動物主體。
我們現在用以下實施例說明本發明。
實施例
實施例1
將一種特異性結合至轉錄因子TTF-1(也稱為NKX2-1)的抗體塗佈到用於生物磁分離的磁珠(例如,市售的Dynabeads)上。 TTF-1是同源異形匣螺旋-轉角-螺旋轉錄因子(homeobox helix-turn-helix transcription factor)。
將抗-TTF-1抗體塗佈的磁珠添加到從診斷為第IV期肺癌、第IV期甲狀腺癌的人類主體和健康主體收集的EDTA血漿樣品中。培養後(輕輕旋轉以保持磁性顆粒的懸浮),從血漿樣品中去除磁性顆粒並用測定緩衝液洗滌。使用Qiagen QiaAMP Circulating Nucleic Acids 試劑盒從磁性固相中分離TTF-1相連的DNA片段。透過Snyder et al, 2016描述的文庫方法(以引用的方式併入本文),將轉接子寡核苷酸連接到分離的DNA片段,以產生每個血漿樣品中與TTF-1相連的DNA序列的單股DNA文庫。
透過即時定量PCR(real-time quantitative PCR)為每個主體產生的片段文庫進行擴增。使用次世代定序方法對擴增的文庫進行定序,並比較每個文庫中DNA的含量和相連的序列。在健康樣品中,35-80bp範圍內的小cfDNA片段對TTF-1 TFBS基因座的覆蓋度很低,因為健康樣品中TTF-1相連的DNA的含量很低或無法檢測到。相較之下,癌症樣品中35-80bp範圍內的小cfDNA片段對TTF-1 TFBS基因座的覆蓋度很高,因為在第IV期肺癌患者或第IV期甲狀腺癌中TTF-1相連的DNA含量較高。在甲狀腺癌樣品中確定的相連TTF-1 DNA序列將與甲狀腺細胞中TTF-1調控的基因啟動子的已知序列相關。類似地,在肺癌樣品中確定的相連TTF-1 DNA序列將與甲狀腺細胞中TTF-1調控的基因啟動子的已知序列相關。在此基礎上,可以從實驗產生的數據中辨別出大部分或所有的健康樣品、甲狀腺癌樣品和肺癌樣品。
實施例2
重複實施例1中所述之實驗,但在與塗有抗-TTF1抗體的磁性顆粒培養之前,將塗有抗-核小體抗體的磁珠添加到血漿樣品中,以預清除核小體和結合的核小體DNA片段的樣品。培養後(輕輕旋轉以保持磁性顆粒的懸浮),從血漿樣品中去除磁性顆粒。然後如實施例1中所述使用剩餘樣品完成實驗,除了在健康樣品中發現的DNA的背景含量將低於實施例1所述以外,結果相似。
實施例3
將塗有抗-TTF-1抗體的磁珠添加到從患有第IV期肺癌、第IV期甲狀腺癌的人類主體和健康主體收集的EDTA血漿樣品中。培養後(輕輕旋轉以保持磁性顆粒的懸浮),從血漿樣品中去除磁性顆粒並用測定緩衝液洗滌。使用Qiagen QiaAMP Circulating Nucleic Acids試劑盒從磁性固相中萃取TTF-1相連的DNA片段。使用本領域已知的用於引子設計的典型軟體來設計特定序列引子,以擴增與人基因組加上側翼DNA的SPB、促甲狀腺激素受體和甲狀腺過氧化物酶基因啟動子區域相關的特定序列的DNA片段。引子係用於透過即時定量PCR擴增DNA片段。測量每個血漿樣品中每個序列的DNA含量。從健康主體採集的樣品的結果將很低或無法檢測到。大多數取自肺癌患者的樣品都含有可檢測量的SPB基因啟動子序列DNA片段。大多數取自甲狀腺癌患者的樣品將含有可檢測量的促甲狀腺激素受體和/或甲狀腺過氧化物酶基因啟動子序列DNA片段。在此基礎上,可以從實驗產生的數據中辨別出大部分或所有的健康樣品、甲狀腺癌樣品和肺癌樣品。
實施例4
重複實施例3所述之實驗,但在與塗有抗-TTF-1抗體的磁性顆粒培養之前,將塗有抗-核小體抗體的磁珠添加到血漿樣品中,以預清除核小體樣品和核小體結合的DNA片段。培養後(輕輕旋轉以保持磁性顆粒的懸浮),從血漿樣品中去除磁性顆粒。然後如實施例3所述使用剩餘樣品完成實驗,除了在健康樣品中發現的DNA的背景含量將比實施例3中描述的更低之外,結果相似。
實施例5
對於螺旋-轉折-螺旋轉錄因子NKX3.1,重複與上述實施例中描述的那些相似實驗,其測試從健康男性和診斷為第IV期前列腺癌的男性採集的血漿樣品。從健康主體採集的樣品的結果將很低或無法檢測到。大多數取自前列腺癌患者的樣品將包含可檢測量的35-80bp大小範圍內的NKX3.1基因啟動子序列DNA片段。在此基礎上,可從實驗產生的數據中辨別出大部分或所有的健康樣品和前列腺癌樣品。
實施例6
對鋅指轉錄因子WT1重複上述實施例所述相似實驗,其測試從健康女性和診斷為第IV期卵巢癌的女性收集的血清樣品。從健康主體採集的樣品的結果是,健康主體中35-80bp大小範圍的WT1相連的cfDNA片段的WT1 TFBS基因座覆蓋度低或無法檢測到。大多數取自卵巢癌患者的樣品顯示出35-80bp大小範圍的WT1相連的cfDNA片段對WT1 TFBS基因座的覆蓋度更高,因為它們包含可檢測量的WT1基因啟動子序列35-80bp cfDNA片段。在此基礎上,可以從實驗產生的數據中辨別出大部分或所有的健康樣品和卵巢癌樣品。
實施例7
我們用一種抗體塗佈Dynabeads M280 Tosyl活化性磁珠,該抗體旨在結合位於胺基酸位置30-33的組蛋白H3表位。該抗體選自許多測試的抗體,因為觀察到它與含有完整組蛋白尾的核小體和具有截短的組蛋白尾的核小體皆結合。
我們將抗-H3抗體塗佈的磁珠(1mg)添加到含有從Active Motif購買的一系列濃度的重組單核小體(0.5ml)的溶液中。在室溫下將珠子與核小體一起培養1小時,同時輕輕滾動試管以保持珠子處於懸浮狀態。磁珠被磁性分離並洗滌。然後透過洗脫去除吸附到珠子上的核小體並且透過西方墨點法分析。結果顯示,磁珠以劑量依賴性方式從溶液中吸附核小體,如圖3所示。
實施例8
如實施例7中所述製備和使用抗-H3抗體塗佈的磁珠。我們將抗-H3抗體塗佈的磁珠以及未塗佈的珠子添加到8個人類EDTA血漿樣品以及包含一系列濃度的重組單核小體。選擇重組單核小體濃度範圍以包含通常在人類臨床樣品中觀察到的含量。
我們使用具有光密度(OD)讀數的核小體的ELISA測試了在與磁珠培養後溶液中剩餘核小體的存在。結果如圖4所示,在用抗-H3抗體塗佈的磁珠吸附後,溶液中剩餘的重組單核小體的含量是無法檢測到的(與不含核小體的對照溶液具有相似的OD),而用未塗佈的磁珠培養的溶液不受影響,產生正常的ELISA劑量反應曲線。類似地,在用抗-H3抗體塗佈的磁珠吸附後,測試的8個人類血漿樣品溶液中剩餘的核小體含量也很低或無法檢測到,但不受使用未塗佈的磁珠培養所影響。這些結果表示從人血漿樣品中定量去除核小體。
實施例9
根據製造商的實驗流程,將與轉錄因子TTF-1、NKX3.1、GATA-3、CDX-2和GRHL2結合的抗體塗至不同顏色的Luminex 珠子上。使取自健康主體和診斷患有多種癌症的主體的血漿樣品接觸所有珠子的混合物。透過PCR 方法或次世代定序,測量cfDNA在35-80bp範圍內的數量或覆蓋度,其覆蓋與各珠子結合的轉錄因子的相應轉錄因子TFBS。結果顯示,在取自前列腺癌患者的樣品中,與塗佈有結合NKX3.1和GRHL2的抗體的珠子結合的35-80bp cfDNA對NKX3.1和GRHL2 TFBS的覆蓋度升高,而與其他珠子(塗有抗-TTF-1、GATA-3或CDX-2抗體)結合的轉錄因子少。類似地,在取自肺癌患者的樣品中,與塗佈有結合TTF-1和GRHL2的抗體的珠子結合的35-80bp cfDNA片段的數量會升高,而與其他珠子(塗有抗-NKX3.1、GATA-3或CDX-2抗體)結合的轉錄因子少。類似地,在取自乳癌患者的樣品中,與塗佈有結合GATA-3和GRHL2的抗體的珠子結合的 35-80bp cfDNA片段的數量會升高,而與其他珠子(塗有抗-TTF-1、NKX3.1或CDX-2抗體)的結合少。相較之下,在取自健康主體的樣品中,35-80bp cfDNA短片段與所有珠子的結合是少的。
實施例10
根據製造商的實驗流程,磁珠塗有與RNA聚合酶II結合的抗體。使取自健康主體和診斷患有多種癌症的主體的血漿樣品接觸珠子。洗滌珠子以去除未結合的染色質片段。
萃取與珠子結合的DNA,與轉接子寡核苷酸連接,並對文庫進行定序,以找到主體樣品中存在的一組活性基因。結果顯示,取自健康主體的樣品中存在的活性基因代表了造血細胞中的活性基因。取自癌症患者的樣品中也存在相同的序列,但發現這些樣品還含有 RNA 聚合酶 II 相連的DNA序列,這些DNA序列代表在造血細胞中不活躍但在疾病組織細胞中活躍的基因,包括通常在相關組織的(健康或患病)細胞中活化和/或在癌細胞中上調。
實施例11
根據製造商的實驗流程,磁珠塗有與RNA聚合酶II結合的抗體。使取自健康主體和診斷患有多種癌症的主體的血漿樣品接觸珠子。洗滌珠子以去除未結合的染色質片段。
使用PCR引子擴增序列,分析與珠子結合的DNA是否存在特定的DNA序列。選擇要分析的序列與結腸直腸癌特異性相關。結果顯示該序列存在於取自結腸直腸癌主體的樣品中,但不存在於取自健康主體或患有其他癌症的主體的樣品中。
實施例12
EDTA血漿樣品係採集自:診斷為患有卵巢癌的6名女性、診斷患有ER-陰性乳癌的2名女性和診斷為ER-陽性乳癌的8 名女性,其中4名女性的ER評分為7分以及4名女性的ER評分為8分。使用市售ERα ELISA試劑盒,對EDTA血漿樣品進行ERα分析。所用ELISA試劑盒的定量檢測範圍為3-200pg/ml,ERα的檢測下限為0.8pg/ml。
ER-陰性主體的ERα平均測得含量較低,而診斷患有卵巢癌或ER-陽性乳癌的主體的平均測得含量較高。此外,對於診斷患有ER-陽性乳癌的主體所測得的平均含量,以那些具有較高ER分數的女性為較高(圖5)。我們得出結論,從取自女性的全血樣品製備的EDTA血漿樣品中ERα的存在可用作包括婦科癌症在內的婦科疾病的生物標記物。
實施例13
乳癌的孕激素受體狀態為 PR-陽性或PR-陰性在婦科癌症的診斷和治療中同樣重要。我們進一步得出結論,取自女性的全血樣品所製備的EDTA血漿樣品中的孕酮受體(PR)含量的測量同樣可用作為婦科疾病(包括婦科癌症)的生物標記物。
實施例14
前列腺癌的雄激素受體狀態在前列腺癌的診斷和治療中同樣重要。我們進一步得出結論,取自男性的全血樣品所製備的EDTA血漿樣品中雄激素受體(AR)含量的測量可用作為前列腺疾病(包括前列腺癌)的生物標記物。
實施例15
藉由使用考馬斯藍染色劑(Coomassie blue stain)的西方墨點法,對從血漿樣品中非特異性吸附到塗有(非特異性)小鼠IgG的磁性顆粒上的蛋白質的背景含量進行評估。使用含有0.1% Tween 20洗滌劑的典型免疫化學洗滌緩衝液或含有高含量的1.2%洗滌劑混合物的洗滌緩衝液洗滌5次後評估背景,該洗滌劑混合物包括1% 乙基苯基聚乙二醇洗滌劑、0.1% 去氧膽酸鈉和0.1% 十二烷基硫酸鈉。結果(圖 6)顯示,使用強洗滌劑可大幅減少背景染色。
相同的實驗應用於特異性吸附到小鼠抗-聚ADP抗體(其與任何大小的聚苯二甲酸化蛋白質結合)的蛋白質。在這種情況下,染色受到的影響較小,顯示出洗滌去除了非特異性結合的蛋白質但對於附著在抗體上的特異性結合的蛋白質沒有影響(或影響較小)。
實施例16
我們使用標準方法在磁珠(MyOne TosylActivated DynabeadsT​​M)上塗佈一種單株抗體,該抗體與轉錄因子CTCF特異性結合。簡而言之,將0.86mg單株抗體與29mg 磁珠(30μg 抗體/mg磁珠)培養在含有1M硫酸銨的2.9ml 0.1M硼酸鹽緩衝液(pH9.5)中培養18小時,在37°C下培養在滾動瓶中以保持磁珠懸浮。沉澱珠子並傾析上清液。將珠子重新懸浮並培養在2.9mL的磷酸鹽緩衝鹽水pH7.4 (PBS)封閉緩衝液(含有0.1% Tween 20和1% 牛血清白蛋白(BSA))中在37°C下1小時。然後將珠子沉澱,用含有0.1% Tween 20和1% BSA的3mL PBS洗滌兩次,並儲存在含有0.1% Tween 20、1% BSA和防腐劑的2.9mL PBS中。非特異性小鼠IgG被類似地塗佈到磁珠上作為非特異性對照試劑。
在從癌症患者獲得的4個匯集的交聯EDTA血漿樣品(在 Streck 無細胞 DNA BCT 中收集的 1.6mL)中進行CTCF-DNA片段的染色質免疫沉澱(ChIP)。用0.4mL市售的放射免疫沉澱測定緩衝液稀釋每個匯集的樣品,並加入1mg的塗有抗-CTCF的磁性顆粒。將混合物在室溫下培養1小時,滾動以保持珠子的懸浮。然後將珠子沉澱,並且使用強洗滌劑洗滌5次,該強洗滌劑含有1% Triton X-100洗滌劑、0.1% 去氧膽酸鈉和0.1% 十二烷基硫酸鈉的混合物,並儲存在0.1mL的緩衝液中。同時,透過將1.6mL的各匯集的血漿樣品與非特異性小鼠IgG塗佈的磁珠一起培養來進行對照實驗。
將磁性顆粒與匯集的血漿樣品一起培養後,將磁性顆粒結合蛋白懸浮在變性1% 十二烷基硫酸鈉(SDS)緩衝液中,並使用抗-CTCF抗體以及用於檢測的標記抗-小鼠抗體透過西方墨點法進行分析。在西方墨點法實驗中,CTCF的存在由130-140kD條帶的存在表示(Klenova et al, 1997)。西方墨點法分析的結果如圖7所示。簡而言之,當暴露於塗有抗-CTCF抗體 (Anti CTCF) 的磁性顆粒時,4個樣品全都可見約140kD的蛋白質條帶,對應CTCF轉錄因子的存在。相比之下,對於暴露於塗有非特異性小鼠IgG(NS-IgG)的磁性顆粒的4個樣品中的任何一個,都沒有可見條帶。這表示所採用的ChIP方法能夠從所有4個測試的匯集的樣品中選擇性地分離循環轉錄因子CTCF。其亦展示了所採用的洗滌方案產生的乾淨背景。
實施例17
CTCF是一種鋅指轉錄因子。CTCF-DNA片段的染色質免疫沉澱(ChIP)是在從診斷患有乳癌的主體獲得的交聯EDTA血漿樣品(2.4mL,收集在Streck 無細胞DNA BCT中)中進行。如上文實施例16所述進行ChIP,不同的是使用0.6mL放射免疫沉澱測定緩衝液來稀釋2.4mL樣品並添加1.5mg抗-CTCF塗覆的磁性顆粒。在平行對照實驗中,將2.4mL的交聯EDTA血漿樣品與塗有非特異性小鼠IgG的磁珠一起培養。將磁珠分成兩部分。一部分用於西方墨點法分析,其使用來自MCF7乳癌細胞的片段化染色質作為陽性對照,證實了CTCF蛋白在珠子上的存在。
將(測試和對照)珠子的第二部分用於DNA萃取和分析。透過在95°C加熱15分鐘來逆轉與磁珠相連的染色質片段的相連DNA的交聯。然後根據製造商的說明書,使用市售的DNA萃取試劑盒((Qiagen QIAamp DSP circulating NA試劑盒)萃取與磁珠相連的DNA。
根據製造商的說明書使用16個擴增循環,使用市售試劑盒(Claret Bio SRSLY NGS Library Prep Kit)對萃取的cfDNA進行擴增以產生用於定序的單股文庫。使用Bioanalyzer儀器通過電泳以分析擴增的測試和非特異性cfDNA片段文庫。結果(圖8)顯示,從特異性抗-CTCF塗覆的磁性顆粒獲得的擴增cfDNA文庫含有35-80bp範圍內的小片段。須注意的是,電泳圖中大約140bp處的尖峰代表轉接子二聚體,因此175-220bp的轉接子連接的片段代表35-80bp的cfDNA片段。在大約190bp處觀察到轉接子連接的cfDNA片段的主峰,
其對應於長度約為50bp的cfDNA片段。儘管擴增的cfDNA文庫包含35-80bp範圍內的小片段,但並非所有這些片段都與樣品中的CTCF結合,因為從塗有非特異性小鼠IgG的固相支持物的擴增萃取物中也獲得了小DNA片段。然而,用特異性抗-CTCF抗體ChIP(1000 個螢光單位[FU])獲得的特異性峰高於非特異性IgG峰(80 FU)。該樣品被送去定序。
實施例18
透過如上文實施例17中所述的抗-CTCF免疫沉澱,從診斷患有結腸直腸癌(CRC)的患者收集的交聯EDTA血漿樣品(收集在Streck cfDNA BCT中)製備擴增的cfDNA文庫。透過Next Generation Illumina NovaSeq定序,對使用抗-CTCF免疫沉澱分離的擴增cfDNA文庫進行定序。
使用Illumina DRAGEN Bioinformatic管道(https://emea.illumina.com/products/by-type/informatics-products/dragen-bio-it-platform.html),將每個代表cfDNA片段的定序讀數與人類參考基因組 GRCh38/hg38進行比對。捨棄任何未對到的讀數。得到的比對BAM文件係用於創建不同片段大小(35-80bp、135-155bp和156-180bp)的子集,其係使用Sequence Alignment/Map SAMtools (Li et al, 2009)。使用1bp的分箱(bin)大小(可能的最高解析率)計算讀取覆蓋度(發現到的覆蓋特定基因位點的片段數)。使用deepTools bamCoverage將讀取覆蓋度標準化為使用RPGC(每個基因組覆蓋的讀取)映射到人類基因組的讀取總數。使用deepTools plotProfile(Ramírez et al, 2016) 為每個片段大小生成覆蓋度分佈圖(圖9和10)。
比較與CTCF相連的35-80bp短片段在9780個已發表的CTCF結合位點的基因座(Kelly et al, 2012)的覆蓋度以及與循環單核小體相連的預期大小一致的較長cfDNA片段(135 -155bp 和 156-180bp)的覆蓋度的結果係如圖9(a)所示。顯示了覆蓋度在5000bp範圍內,包括CTCF結合位點位置上游和下游的2500個鹼基。我們在Kelly etal, 2012報導的CTCF TFBS基因座的基因組位置上觀察到小35-80bp cfDNA片段結合的強覆蓋峰。因為定序的文庫是在低背景值之下直接從抗-CTCF塗覆的磁珠上分離出的連接到CTCF蛋白的cfDNA產生的,cfDNA文庫包含少量核小體且和小體定位訊號低。此特徵可產生清楚的35-80bp信號,無需對混合樣品(例如,含有源自造血組織和癌組織的混合cfDNA片段的樣品)中的競爭信號進行反摺積。相比之下,與非特異性小鼠IgG結合獲得的cfDNA文庫在CTCF TFBS基因座處沒有顯示出峰(圖 9(b))。
大量蛋白質可以結合或接近TFBS,包括轉錄因子、或多種協同結合的轉錄因子、轉錄增強子、抑制子或其他調控蛋白的任何組合。本發明方法的一個主要優點是已知CTCF TFBS基因座的小cfDNA片段覆蓋僅和與CTCF相連的cfDNA片段有關。與本領域的對照方法相比(例如Snyder et al, 2016和Ulz et al, 2019的片段組學方法),繪製從EDTA血漿中萃取的所有大小的cfDNA片段,並推斷蛋白質結合在任何特定基因組位置上發生或未發生。無法知道哪種蛋白質有參與,因為所有這類方法的第一步是cfDNA的萃取,這需要樣品中所有核蛋白染色質片段(包含核小體和轉錄因子-DNA複合物)的解離,因而破壞連接任何特定cfDNA序列至任何特定轉錄因子或其他蛋白質的直接訊息。
cfDNA片段序列的峰調用參考輸入的非特異性對照導致CTCF作為具有最多TFBS序列片段的轉錄因子。使用MACS2(Zhang et al, 2008)窄峰對BAM文件執行峰調用。峰值文件被用於檢測轉錄因子結合位點,所述檢測是透過使用來自Homer Software包裹的findMotifGenome工具(Heinz et al, 2010)。
然後,我們重複分析在永生化癌細胞中佔據的1041個CTCF TFBS的富集(Liu et al, 2017)。圖10(a)所示的結果顯示,與1041個癌症特異性CTCF TFBS序列結合的35-80bp CTCF相連的cfDNA片段有一個明顯的峰值。與片段組學不同,有助於分析的 cfDNA 片段僅來自 CTCF-DNA 複合物,若不包含CTCF則不會源自其他轉錄因子-DNA或輔因子-DNA複合物。這表示CTCF佔據了癌症特異性基因座,因此也表明了這些cfDNA片段和它們衍生的 CTCF-DNA複合物的腫瘤細胞來源。較長(核小體大小)的cfDNA片段沒有峰值。所獲的與非特異性小鼠IgG結合的cfDNA文庫未顯示峰(圖 10(b))。
透過ChIP-Seq證明體液中CTCF相連的cfDNA片段與癌症特異性TFBS基因座結合,這表示所研究的主體中存在癌症疾病,並且可以這種方式用作為生物標記物。我們得出結論,本發明的方法對於血漿中轉錄因子的ChIP-Seq和作為疾病的生物標記物是成功的。
實施例19
雄激素受體(AR)是前列腺癌中感興趣的鋅指轉錄因子。我們將實施例17中針對CTCF所述之相同方法應用於AR。對取自8名診斷為患有前列腺癌主體的交聯EDTA血漿樣品(收集於 Streck cfDNA BCT),我們使用小鼠抗-AR抗體進行免疫沉澱AR。我們使用來自LnCAP前列腺癌細胞株細胞的AR作為陽性對照,對固相支持物上透過ChIP 分離的蛋白質進行了西方墨點法分析。圖11中的結果顯示,對應於分子量約為100kD的 AR的蛋白質條帶存在於所有8個樣品中,並且在2個樣品中以高含量存在(圖11的道次2和3)。大約50kD的條帶對應於標記的抗-小鼠IgG抗體與用於ChIP的小鼠抗-AR抗體重鏈的結合。然後我們從固相支持物中萃取DNA,將萃取的DNA片段連接到轉接子寡核苷酸並擴增存在的DNA。結果(圖12)顯示,所有8個樣品的擴增cfDNA文庫均包含35-80bp範圍內的小片段(175-220bp的轉接子連接片段)。儘管擴增的cfDNA文庫包含35-80bp範圍內的小片段,但並非所有這些片段都與樣品中的AR結合,因為從塗有非特異性小鼠 IgG的固相支持物的擴增萃取物中也獲得了小DNA片段。接著,對於藉由西方墨點法觀察到的具有最高AR含量的2個樣品獲得的擴增cfDNA文庫,使用次世代定序進行定序。
參考文獻 Active Motif, Nat. Methods 3: 658 (2006), doi:10.1038/NMETH907 Bohinski et al. Molecular and Cellular Biology, 14(9): 5671 (1994) Corces et al. Science, 362(6413): eaav1898 (2018), doi:10.1126/science.aav1898. Crowley et al. Nat. Rev. Clin. Oncol. 10: 472-484 (2013), doi:10.1038/nrclinonc.2013.110 Darnell, Nat. Rev. Cancer 2: 740-749 (2002), doi:10.1038/nrc906 Deligezer et al. Clinical Chemistry 54:7 1125–1131 (2008) Dunbar, Clinica Chimica Acta 363 (1-2) : 71-82 (2006), doi.org/10.1016/j.cccn.2005.06.023 Gurel et al. Am J Surg Pathol, 34(8):1097-105 (2010), doi:10.1097/PAS.0b013e3181e6cbf3. Heinz et al. Mol. Cell 38(4): 576-89 (2010), doi: 10.1016/j.molcel.2010.05.004. Holdenrieder & Stieber, Crit. Rev. Clin. Lab. Sci. 46(1):1-24 (2009), doi:10.1080/10408360802485875 Hu et al. J. Trans. Med. 17: 124 (2019), doi:10.1186/s12967-019-1871-x Jung et al. Clin. Chim. Acta 411(21-22): 1611-24 (2010), doi:10.1016/j.cca.2010.07.032 Kelly et al. Genome Res. 22: 2497-2506 (2012), doi:10.1101/gr.143008.112. Klenova et al. Nucleic Acids Res. 25(3): 466–473 (1997), doi.org/10.1093/nar/25.3.466 Lambert et al. Cell 172(4):650-665 (2018), doi:10.1016/j.cell.2018.01.029 Latil et al.Cell Stem Cell 20(2): 191-204.e5 (2017), doi:10.1016/j.stem.2016.10.018. Lee et al. J. Mol. Med. (Berl). 85(12):1393-404 (2007), doi: 10.1007/s00109-007-0237-7 Li et al. Bioinformatics 25(16): 2078–2079 (2009), doi: 10.1093/bioinformatics/btp352 Lin et al. PLoS Genet. 3(6):e87 (2007), doi:10.1371/journal.pgen.0030087.eor Liu et al. Oncotarget 8(69): 114183-114194 (2017), doi: 10.18632/oncotarget.23172 Liu et al. EBioMedicine 41: 345-356 (2019), doi:10.1016/j.ebiom.2019.02.010 Maenhaut et al.2015 In: Feingold, Anawalt, Boyce, et al., editors. Endotext. https://www.ncbi.nlm.nih.gov/books/NBK285554/ Mann et al.Curr. Top Dev. Biol. 88: 63-101 (2009), doi:10.1016/S0070-2153(09)88003-4. Mansson et al. Mol. Oncol. 15(11): 2868-2876 (2021), doi:10.1002/1878-0261.13093 Matys et al. Nucleic Acids Res. 34: D108–D110 (2006), doi:10.1093/nar/gkj143 Merabet and Mann, Trends Genet. 32(6): 334-347 (2016), doi:10.1016/j.tig.2016.03.004. Newman et al. Nat. Med. 20(5): 548-54 (2014), doi:10.1038/nm.3519 Park et al. Oncol. Lett. 3(4): 921-926 (2012), doi: 10.3892/ol.2012.592 Pomerantz et al. Nat. Genet. 47(11): 1346-51 (2015), doi:10.1038/ng.3419. Poorey et al. Science 342(6156): 369-72 (2013), doi:10.1126/science.1242369. Ramírez et al.Nucleic Acids Res. 44(W1): W160-5 (2016), doi: 10.1093/nar/gkw257 Ralston, Do transcription factors actually bind DNA? DNA footprinting and gel shift assays. Nature Education 1(1): 121 (2008) Sadeh et al. Nat. Biotechnol. 39: 586–598 (2021), doi.org/10.1038/s41587-020-00775-6 Sanchez et al. NPJ Genom. Med. 3: 31 (2018), doi:10.1038/s41525-018-0069-0 Skene and Henikoff, eLife 6:e21856 (2017), doi:10.7554/eLife.21856.002 Snyder et al. Cell 164(1-2): 57-68 (2016), doi:10.1016/j.cell.2015.11.050 Ulz et al. Nat. Commun. 10(1): 4666 (2019), doi:10.1038/s41467-019-12714-4 Vad-Nielsen et al. Lung Cancer 147 : P244-251 (2020), doi.org/10.1016/j.lungcan.2020.07.023 Vaquerizas et al. Nat. Rev. Genet. 10(4): 252-63 (2009), doi:10.1038/nrg2538 Wang et al. Genome Res. 22(9): 1680-8 (2012), doi: 10.1101/gr.136101.111 Zhang et al. Genome Biol. 9(9): R137 (2008), doi: 10.1186/gb-2008-9-9-r137 Zhou et al. BMC Genomics 18(1):724 (2017), doi:10.1186/s12864-017-4115-6
圖1:各種轉錄因子在表面張力蛋白B (surfactant protein B)、甲狀腺球蛋白(thyroglobulin)、甲狀腺過氧化物酶(thyroperoxidase)和促甲狀腺激素受體(thyrotropin receptor,TSH受體)基因的啟動子位點共結合的卡通圖。CRE:環形單磷酸腺苷反應單元(cyclic adenosine monophosphate response element);GABP:GA結合蛋白 (GA-binding protein);HNF-3:肝細胞核因子3 (Hepatocyte nuclear factor 3);NF-1:核因子1 (Nuclear factor 1);PAX-8:配對盒基因 8 (Paired box gene 8);Runx2:Runt相關轉錄因子2 (Runt-related transcription factor 2);TRα/RXR二聚體:甲狀腺激素受體α/類視色素X受體二聚體 (TRα/RXR dimer: Thyroid hormone receptor α/Retinoid X receptor dimer);TTF-1:甲狀腺轉錄因子1(也稱為NK2同源框1,NKX2-1);TTF-2:甲狀腺轉錄因子2。 圖 2:轉錄複合物的DNA環結構示例的卡通圖,用於說明轉錄複合物中涉及的一些各種調控蛋白的共結合,包括但不限於:一般轉錄因子 (general transcription factor,GTF),基因特異性轉錄因子 (TF)、輔因子、活化子、抑制子、中介因子、DNA彎曲蛋白和RNA聚合酶。調控蛋白與位於基因附近的調控DNA序列以及遠離基因的調控序列結合,包括啟動子序列、TATA盒序列、增強子序列和抑制子序列。其他調控蛋白(例如染色質重塑蛋白)以及其他調控序列是可能的。 圖3:吸附在磁珠上的重組單核小體的西方墨點法分析,該磁珠塗有與組蛋白H3 結合的抗體。結果表示單核小體的劑量依賴性吸附。 圖4:人類血漿樣品和重組單核小體溶液的核小體ELISA結果,其是在核小體使用未塗佈的磁珠或用與組蛋白H3結合的抗體塗佈的磁珠進行免疫沉澱後。結果表示,溶液中天然存在的人類循環核小體和重組核小體均不受未塗佈磁珠的影響,但藉由使用塗有與組蛋白H3結合的抗體的磁珠的免疫沉澱定量地去除。 圖5:在診斷為ER-陰性乳癌 (ER-BC)、卵巢癌或ER-陽性乳癌 (ER+BC)且ER評分為7或8的女性中所測量到的ERα含量。 圖6:使用含有0.1% Tween (0.1%) 的常規單一洗滌劑洗滌緩衝液或含有總計1.2%的洗滌劑(1.2%)的混合物,清洗從癌症患者獲得的血漿樣品的磁性聚苯乙烯顆粒的效果。藉由強洗滌劑沖洗的使用,非特異性IgG塗佈的顆粒顯示了背景結合的更加減少(道次4和5),而不會破壞特異性抗體結合的蛋白質(聚對苯二甲酸化蛋白質的混合物)(道次6和7)。 圖7:使用固定在磁性聚苯乙烯珠上的小鼠抗CTCF抗體從4個合併的交聯EDTA血漿樣品中免疫沉澱的染色質片段的西方墨點法分析,這些樣品取自透過ChIP診斷為CRC的患者,其係使用小鼠抗CTCF抗體固定於其上之磁性聚苯乙烯珠、使用強1.2%洗滌劑混合物洗滌液。所有4個血漿樣品均顯示出一條約140kD的條帶,對應於CTCF蛋白(抗CTCF;道次3、5、7和9)。使用非特異性小鼠IgG的陰性對照實驗顯示沒有對應於CTCF的條帶(NS-IgG;道次2、4、6和8)。實驗顯示,CTCF蛋白是從血漿樣品中分離出來的,並且使用強洗滌緩衝液可以從血漿中萃取相對純的CTCF。 圖8:電泳圖顯示了對從患者採集的交聯EDTA血漿樣品中CTCF染色質片段進行ChIP得到的擴增轉接子(adapter)連接cfDNA片段文庫的分析。大約140bp處的尖峰代表轉接子二聚體,因此175-220bp的轉接子連接片段代表35-80bp的cfDNA 片段(在電泳圖上顯示)。 (a) 特定的CTCF ChIP文庫包含小的cfDNA片段,其螢光峰在35-80bp範圍約為1000 FU。 (b) 非特異性對照IgG文庫還包含螢光峰值約為80 FU的小cfDNA片段。 圖9:透過轉錄因子結合的cfDNA 片段(35-80bp)或核小體結合的cfDNA片段(135-155bp或156-180bp)對 9780 個公佈的CTCF TFBS基因座進行標準化覆蓋(normalised coverage)。(a) 為CRC患者獲得的cfDNA序列文庫的特定CTCF覆蓋度。(b) cfDNA序列文庫的非特異性覆蓋度,其是從染色質片段非特異性結合的小鼠 IgG 塗佈顆粒獲得。結果顯示,源自血漿循環CTCF-DNA複合物的特定cfDNA覆蓋峰與已發表的CTCF TFBS 基因座相關。由於核小體結合而導致的預期振盪覆蓋模式在所研究的5kb跨度中最小。在對照樣品中,在CTCF結合位點未觀察到峰值cfDNA覆蓋度。 圖10:1041個已公布的CTCF TFBS基因座(在癌細胞中而不是在普通細胞中被CTCF佔據)的標準化覆蓋度。顯示了轉錄因子結合的cfDNA 片段 (35-80bp) 或核小體結合 的cfDNA片段 (135-155bp或156-180bp)的覆蓋度。(a) CTCF藉由為CRC患者獲得的cfDNA序列文庫佔據癌症相關位點。結果顯示在大小為35-80bp範圍內的覆蓋度證實了CTCF佔據了這1041個位點中的一些或全部,因此指出了樣品出處之主體中的癌症。(b) 在非特異性對照實驗中沒有觀察到 CTCF佔據峰值。 圖11:從8個交聯EDTA血漿樣品免疫沉澱之染色質片段的西方墨點法分析,其是透過使用小鼠抗AR抗體固定在磁聚苯乙烯珠上,且使用強1.2% 洗滌劑混合洗滌緩衝液。所有8個血漿樣品(S1-S8;道次2-9)均顯示出與AR蛋白相對應的約140kD條帶。樣品 S1和S2觀察到最高密度帶。道次10代表使用來自LnCAP前列腺癌細胞的片段化染色質的陽性對照。 圖12:電泳圖顯示了擴增的轉接子連接cfDNA片段庫,其是來自對取自8名前列腺癌患者(S1-S8)的交聯EDTA血漿樣品中AR染色質片段的ChIP。大約140bp處的尖峰代表轉接子二聚體,因此175-220bp的轉接子連接片段代表35-80bp 的 cfDNA 片段。亦顯示了陰性對照 (ctrl) 的電泳圖。
Figure 12_A0101_SEQ_0001
Figure 12_A0101_SEQ_0002

Claims (26)

  1. 一種檢測從一人類或動物主體獲得的一體液樣品中包含一轉錄因子和一DNA片段的一無細胞染色質片段之方法,包括步驟: (i) 使該體液樣品接觸與該轉錄因子結合的一結合劑; (ii) 檢測或測量與該轉錄因子相連的DNA 片段;和 (iii) 使用該DNA片段的存在或量作為樣品中包含該轉錄因子的該無細胞染色質片段的含量的一量度。
  2. 如請求項1所述之方法,包括在步驟(ii)中檢測相連的DNA片段之前,從剩餘的體液樣品中分離步驟(i)中結合的轉錄因子。
  3. 如請求項1或2所述之方法,其中,步驟(ii)包括對與該轉錄因子相連的DNA片段進行定序。
  4. 如請求項1至3中任一項所述之方法,其還包括萃取與該轉錄因子相連的DNA片段。
  5. 如請求項4所述之方法,其還包括擴增萃取的DNA片段,例如透過PCR。
  6. 如請求項1至5中任一項所述之方法,其中,透過即時PCR以檢測和/或測量與該轉錄因子相連的DNA片段。
  7. 如請求項1至6中任一項所述之方法,其還包括從該體液樣品中去除無細胞核小體。
  8. 如請求項7所述之方法,其包括在步驟(ii)之前使該體液樣品接觸與結合至核小體或其組分的一結合劑且去除結合至該結合劑的該樣品。
  9. 如請求項1至8中任一項所述之方法,其中,該無細胞染色質片段係由該轉錄因子和DNA片段組成。
  10. 如請求項1至9中任一項所述之方法,其中,在步驟(ii)檢測該相連的DNA片段之前,用含有至少1%濃度的清潔劑的一緩衝溶液洗滌步驟(i)中被該結合劑結合的轉錄因子。
  11. 一種檢測一人類或動物主體中一疾病之方法,包括步驟: (i) 使獲自該人類或動物主體的一體液樣品接觸與一轉錄因子結合的一結合劑; (ii) 檢測或測量與該轉錄因子相連的DNA;和 (iii) 使用DNA的存在或數量作為主體中存在該疾病的指標。
  12. 如請求項11所述之方法,其包括使用該轉錄因子和相連的DNA的序列作為一組合生物標記物來指示該主體中該疾病的存在。
  13. 一種檢測一人類或動物主體中受一疾病影響的組織之方法,包括步驟: (i) 使獲自該人類或動物主體的一體液樣品接觸與一轉錄因子結合的一結合劑; (ii) 對與轉錄因子相連的 DNA 進行定序;和 (iii) 使用該轉錄因子的存在和相連的DNA 的序列作為一組合生物標記物以確定該主體中受該疾病影響的組織。
  14. 如請求項13所述之方法,其中,受該疾病影響的該組織是起源器官。
  15. 如請求項11至14中任一項所述之方法,其中,該疾病係癌症或發炎性疾病。
  16. 如請求項1至15中任一項所述之方法,其中,與該轉錄因子結合的該結合劑係一抗體或其片段。
  17. 如請求項1至16中任一項所述之方法,其中,該體液樣品係血液、血清或血漿樣品。
  18. 如請求項1至17中任一項所述之方法,其中,該體液樣品係透過以下方式獲得的血漿樣品:(1) 使一全血樣品接觸一交聯劑;(2) 使交聯後的樣品接觸一鈣離子螯合劑;(3) 從樣品中分離出血漿。
  19. 一種評估一動物或人類主體是否適合進行醫學治療之方法,包括步驟: (i) 檢測、測量或定序與從該主體獲得的一體液樣品中包含一轉錄因子的無細胞染色質片段相連的DNA;和 (ii) 使用在步驟(i) 中檢測到的相連的 DNA含量和/或序列作為替該主體選擇適當治療的一參數。
  20. 一種監測一動物或人類主體治療之方法,包括步驟: (i) 檢測、測量或定序與從主體獲得的體液樣品中包含一轉錄因子的無細胞染色質片段相連的 DNA; (ii) 在一或多種時機下重複檢測、測量或定序與從該主體獲得的一體液樣品中包含該轉錄因子的無細胞染色質片段相連的DNA;和 (iii) 使用比較了步驟(i)和步驟(ii)之後所測得的相連的DNA含量和/或DNA序列的任何變化作為該主體病況任何變化的參數。
  21. 如請求項20所述之方法,其中,該治療係用於治療癌症。
  22. 如請求項1至21中任一項所述之方法,其中,檢測或測量與包含該轉錄因子的無細胞染色質片段相連的DNA作為一套組量測之一。
  23. 一種試劑盒,用於檢測包含作為組合生物標記物的一轉錄因子和DNA 片段的無細胞染色質片段,該試劑盒包含:用於該轉錄因子的一配體或結合劑,可選擇性地加上用於擴增和/或定序與該轉錄因子相連的DNA的試劑、和/或用於核小體的一配體或結合劑、和/或基於如請求項1至22中任一項所述之方法使用該試劑盒的說明書。
  24. 一種在所需主體中治療癌症的方法,其中,該方法包括以下步驟: (a) 使獲自人類或動物主體的一體液樣品接觸與一轉錄因子結合之的一結合劑; (b) 檢測、測量或定序與該轉錄因子相連的DNA片段;和 (c) 使用DNA片段的存在、數量或序列作為該主體中癌症存在的指標;和 (d) 如果在步驟(c)中確定該主體患有癌症,則給予治療。
  25. 如請求項24所述之方法,其中,該治療係選自:手術、放射療法、化學療法、免疫療法、賀爾蒙療法和生物療法。
  26. 一種檢測人類或動物胎兒中一疾病之方法,包括步驟: (i) 從懷孕的人類或動物主體獲取一體液樣品; (ii) 使該體液樣品接觸與一轉錄因子結合的一結合劑; (iii) 檢測、測量或定序與該轉錄因子相連的DNA;和 (iv) 使用該DNA的存在、序列或數量作為胎兒中該疾病存在的指標。
TW110149064A 2020-12-29 2021-12-28 循環轉錄因子分析 TW202242130A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US202063131722P 2020-12-29 2020-12-29
US63/131,722 2020-12-29

Publications (1)

Publication Number Publication Date
TW202242130A true TW202242130A (zh) 2022-11-01

Family

ID=79927307

Family Applications (1)

Application Number Title Priority Date Filing Date
TW110149064A TW202242130A (zh) 2020-12-29 2021-12-28 循環轉錄因子分析

Country Status (10)

Country Link
EP (1) EP4271833A1 (zh)
JP (1) JP2024501063A (zh)
KR (1) KR20230132485A (zh)
CN (1) CN116917496A (zh)
AU (1) AU2021414296A1 (zh)
CA (1) CA3206465A1 (zh)
IL (1) IL303977A (zh)
MX (1) MX2023007818A (zh)
TW (1) TW202242130A (zh)
WO (1) WO2022144407A1 (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115851951A (zh) * 2022-12-12 2023-03-28 广州优泽生物技术有限公司 含多组学标志物组合物的早期肝癌检测模型构建及试剂盒

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB0319376D0 (en) 2003-08-18 2003-09-17 Chroma Therapeutics Ltd Histone modification detection
GB201115098D0 (en) 2011-09-01 2011-10-19 Belgian Volition Sa Method for detecting nucleosomes containing histone variants
GB201115095D0 (en) 2011-09-01 2011-10-19 Singapore Volition Pte Ltd Method for detecting nucleosomes containing nucleotides
SG10201604081YA (en) 2011-12-07 2016-07-28 Singapore Volition Pte Ltd Method for detecting nucleosome adducts
HUE064231T2 (hu) 2015-07-23 2024-02-28 Univ Hong Kong Chinese Sejtmentes DNS fragmentációs mintázatának elemzése
US10934636B2 (en) * 2015-08-12 2021-03-02 CeMM—FORSCHUNGSZENTRUM FÜR MOLEKULARE MEDIZIN GmbH Methods for studying nucleic acids
US11479805B2 (en) * 2015-08-21 2022-10-25 The General Hospital Corporation Combinatorial single molecule analysis of chromatin
GB201604806D0 (en) 2016-03-22 2016-05-04 Singapore Volition Pte Ltd Method of identifying a cancer of unknown origin
EP3765638A2 (en) * 2018-03-13 2021-01-20 Yissum Research Development Company of the Hebrew University of Jerusalem Ltd. Diagnostic use of cell free dna chromatin immunoprecipitation

Also Published As

Publication number Publication date
CN116917496A (zh) 2023-10-20
WO2022144407A1 (en) 2022-07-07
CA3206465A1 (en) 2022-07-07
IL303977A (en) 2023-08-01
AU2021414296A1 (en) 2023-07-27
EP4271833A1 (en) 2023-11-08
MX2023007818A (es) 2023-09-05
KR20230132485A (ko) 2023-09-15
JP2024501063A (ja) 2024-01-10

Similar Documents

Publication Publication Date Title
US11193939B2 (en) Method for detecting nucleosome adducts
CA2965752C (en) Method for the enrichment of circulating tumor dna
Sanders et al. FOXM1 binds directly to non-consensus sequences in the human genome
US20160041153A1 (en) Biomarker compositions and markers
EP2742154A2 (en) Biomarker compositions and methods
EP2721179A2 (en) Biomarker compositions and methods
CN114901832A (zh) 分离循环核小体的方法
CN112119166A (zh) 无细胞dna染色质免疫沉淀的诊断应用
JP6777757B2 (ja) 癌検出のためのヌクレオソーム−転写因子複合体の使用
TW202242130A (zh) 循環轉錄因子分析
TW202242145A (zh) 核小體耗盡循環無細胞染色質片段之轉錄因子結合位點分析
Rodriguez Estrogen Represses Target Genes through Epigenetic Modification of Proximal and Distal Elements