CN114787380A - 诊断用染色体标志物 - Google Patents

诊断用染色体标志物 Download PDF

Info

Publication number
CN114787380A
CN114787380A CN202080078196.XA CN202080078196A CN114787380A CN 114787380 A CN114787380 A CN 114787380A CN 202080078196 A CN202080078196 A CN 202080078196A CN 114787380 A CN114787380 A CN 114787380A
Authority
CN
China
Prior art keywords
chromosomal
interactions
asd
nucleic acids
markers
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202080078196.XA
Other languages
English (en)
Inventor
A·S·拉马达斯
E·亨特
A·阿库利切夫
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oxford Biodynamics PLC
Original Assignee
Oxford Biodynamics PLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oxford Biodynamics PLC filed Critical Oxford Biodynamics PLC
Publication of CN114787380A publication Critical patent/CN114787380A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2521/00Reaction characterised by the enzymatic activity
    • C12Q2521/30Phosphoric diester hydrolysing, i.e. nuclease
    • C12Q2521/301Endonuclease
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2521/00Reaction characterised by the enzymatic activity
    • C12Q2521/50Other enzymatic activities
    • C12Q2521/501Ligase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2523/00Reactions characterised by treatment of reaction samples
    • C12Q2523/10Characterised by chemical treatment
    • C12Q2523/101Crosslinking agents, e.g. psoralen
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2565/00Nucleic acid analysis characterised by mode or means of detection
    • C12Q2565/10Detection mode being characterised by the assay principle
    • C12Q2565/101Interaction between at least two labels
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/106Pharmacogenomics, i.e. genetic variability in individual responses to drugs and drug metabolism

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Health & Medical Sciences (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Engineering & Computer Science (AREA)
  • Analytical Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • Biotechnology (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Immunology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Pathology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Investigating Or Analysing Biological Materials (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
  • Saccharide Compounds (AREA)
  • Medicines Containing Antibodies Or Antigens For Use As Internal Diagnostic Agents (AREA)

Abstract

一种用于分析与自闭症谱系障碍的预后相关的染色体区域和染色体相互作用的方法。

Description

诊断用染色体标志物
技术领域
本发明涉及疾病标志物。
背景技术
自闭症谱系障碍(ASD)被认为与遗传和环境因素的组合有关。风险因素可能包括某些感染、毒素、自身免疫性疾病、可卡因和空气污染物。在全球范围内,据估计有2480万人受自闭症影响(于2015年估计)。在发达国家,近1.5%的儿童被诊断出患有ASD(于2017年估计)。这一比率相比于2000年所估计的0.7%显著增加。
发明内容
本发明基于以下发现:使用染色体构象特征来测量在替代系统分析中检测到的3D基因组结构的系统显著差异,其能够识别特异于自闭症谱系障碍(ASD)和不同形式的ASD的散布的个体染色体构象。
因此,本发明提供了一种用于检测代表群体中的亚群的染色体状态的方法(process),所述方法包括确定在基因组的限定区域内是否存在与所述染色体状态相关的染色体相互作用;以及
-其中所述染色体相互作用任选地已通过包括以下步骤的确定哪些染色体相互作用与对应于所述群体的所述亚群的染色体状态相关的方法(method)进行了鉴定:将来自具有不同状态的所述染色体的亚群的第一组核酸与第二组索引核酸接触,并且允许互补序列杂交,其中所述第一组核酸和第二组核酸中的核酸代表连接产物,所述连接产物包括来自在染色体相互作用中已聚集在一起的两个染色体区域的序列,并且其中所述第一组核酸和第二组核酸之间的杂交模式允许确定哪些染色体相互作用对所述亚群是特异性的;以及
-其中所述亚群与自闭症谱系障碍(ASD)的预后有关,并且所述染色体相互作用:
(i)存在于表1、表2、表3或表4中任一个所列出的任一区域或基因中;和/或
(ii)对应于表1、表2、表3或表4中任一个所示的任何探针所代表的任一染色体相互作用,和/或
(iii)存在于包括(i)或(ii)或位于(i)或(ii)侧面的4000碱基区域中。
此外,本发明提供了一种用于鉴定ASD预后的方法,其包括确定是否存在表1、表2、表3或表4中任一个所示的染色体相互作用,从而确定所述预后。在一个方面,本发明提供了一种用于鉴定ASD预后的方法,其包括确定是否存在表8、表9或表10中任一个所示的染色体相互作用,从而确定所述预后。本发明还提供了一种用于鉴定ASD预后的方法,其包括确定是否存在如本文中任一表格所示的染色体相互作用,从而确定所述预后。
具体实施方式
本发明的方面
本发明涉及ASD预后的确定,包括关于ASD的严重性和/或ASD的类型是侵袭性的还是惰性的。所述确定是通过对本文所公开的任何相关标志物(如任何表所示的标志物)、或优选的标志物的组合、或本文所公开的限定的特定区域中的标志物进行分型。因此,本发明涉及一种对个体进行分型以确定ASD状态的方法,例如诊断ASD或ASD的类型,或确定ASD的预后或ASD的类型。
在本发明的方法中,ASD的亚群体基本上可以通过标志物的分型来鉴定。因此,例如,本发明涉及与ASD预后相关的一组表观遗传标志物。因此,本发明允许向患者提供准确反映患者需求的个性化疗法。本文提及的任何疗法,例如药物,都可以基于分型结果施用于个体。因此可以实施本发明的方法以选择个体进行医学治疗。
优选地,在所述方法中被分型的标志物是由表中的探针或引物序列所代表的那些标志物。
发明方法
本发明的方法包括用于检测与预后相关的染色体相互作用的分型系统。所述分型可以使用本文所提到的EpiSwitchTM系统进行,该系统基于在染色体相互作用中聚集在一起的染色体交联区域,对染色体DNA进行切割,然后连接存在于交联实体中的核酸,从而获得具有来自形成染色体相互作用的两个区域的序列的连接核酸。检测该连接核酸可以用于确定是否存在特定染色体相互作用。
可以通过上述使用第一和第二核酸群体的方法鉴定染色体相互作用。这些核酸也可以使用EpiSwitchTM技术生成。
与本发明相关的表观遗传相互作用
如本文所用,术语“表观遗传”和“染色体”相互作用通常是指染色体末端区域之间的相互作用,所述相互作用是动态的并且根据染色体区域的状态而改变、形成或断裂。
在本发明的特定方法中,通常首先通过产生连接核酸来检测染色体相互作用,所述连接核酸包含来自作为相互作用一部分的染色体的两个区域的序列。在这样的方法中,这些区域可以通过任何合适的方式进行交联。在一个优选方面,相互作用使用甲醛进行交联,但也可以通过任何醛或D-生物素-e-氨基己酸-N-羟基琥珀酰亚胺酯或地高辛-3-O-甲基羰基-e-氨基己酸-N-羟基琥珀酰亚胺酯进行交联。对甲醛可以使相距4埃的DNA链交联。优选地,染色体相互作用在同一条染色体上并且任选地相据2埃至10埃。
染色体相互作用可以反映染色体区域的状态,例如,其是否响应生理条件的变化而被转录或抑制。本文定义的亚群特异性的染色体相互作用已被发现是稳定的,从而提供了测量两个亚群之间差异的可靠方式。
此外,对特征(例如预后)特异性的染色体相互作用通常发生在生物过程的早期,例如与其他表观遗传标志物(例如甲基化或组蛋白结合的变化)相比。因此,本发明的方法能够检测生物过程的早期阶段。这使得早期干预(例如治疗)可能会更加有效。染色体相互作用也反映了个体的当前状态,因此可用于评估预后的变化。此外,同一亚群内的个体之间的相关染色体相互作用几乎没有变化。由于每个基因都有多达50种不同的可能相互作用,检测染色体相互作用提供了非常有用的信息,因此本发明的方法可以查询500,000种不同的相互作用。
染色体相互作用与遗传标志物或其他类型的表观遗传标志物(例如甲基化)之间没有一一对应的关系。因此,染色体相互作用代表了一种单独的调节方式。
优选标志物集
本文中术语“标志物”或“生物标志物”是指可以在本发明中可以检测(分型)的特定染色体相互作用。本文公开的特异性标志物中的任何一个都可用于本发明。可以使用更多标志物集,例如以本文公开的组合或数字使用。本文表中公开的特异性标志物是优选的,以及本文表中提及的基因和区域中存在的标志物是优选的。这些标志物可以通过任何合适的方法进行分型,例如本文中公开的基于PCR或探针的方法,包括qPCR方法。在本文中通过位置或通过探针和/或引物序列来限定标志物。
染色体相互作用的位置和原因
染色体相互作用可重叠,并且包括显示编码相关基因或未描述基因的染色体区域,但同样可能位于基因间区。还应注意,发明人已发现所有区域中的表观遗传相互作用对于确定染色体基因座的状态方面同样重要。这些相互作用不一定在位于该基因座的特定基因的编码区中,而可能位于基因间区。
本发明中检测到的染色体相互作用可能受到潜在DNA序列的变化、环境因素、DNA甲基化、非编码反义RNA转录物、非诱变致癌物、组蛋白修饰、染色质重塑和特定的局部DNA相互作用的影响。导致染色体相互作用的变化可能会受到潜在核酸序列变化的影响,这些变化本身并不直接影响基因产物或基因表达模式。此类变化可能是例如基因内和/或基因外的SNP、基因间DNA、微RNA和非编码RNA的基因融合和/或基因缺失。例如,已知约20%的SNP位于非编码区域,因此所述方法在非编码情况下也能提供有用信息。一个方面,聚集在一起形成相互作用的染色体区域在同一染色体上相距小于5kb、3kb、1kb、500个碱基对或200个碱基对。
检测到的染色体相互作用优选在表1、表2、表3或表4中提及的任何基因内。然而,所述染色体相互作用也可以位于所述基因的上游或下游,例如位于所述基因或所述编码序列的上游或下游高达50,000、高达30,000、高达20,000、高达10,000或高达5000个碱基处。
亚群、时间点和个性化治疗
在一个方面,本发明确定预后。这可以是在一个或多个限定的时间点,例如至少1、2、5、8或10个不同的时间点。至少1、2、5或8个时间点之间的持续时间可以是至少5天、10天、20天、50天、80天或100天。
如本文所用,“亚群”优选地指群体亚群,更优选地指特定动物如特定真核生物或哺乳动物(例如人类、非人类、非人灵长类,或啮齿动物,例如小鼠或大鼠)群体中的亚群。最优选地,“亚群”是指人类群体中的亚群。
本发明包括检测和治疗群体中的特定亚群。发明人发现,给定群体中的子集(例如至少两个子集)之间的染色体相互作用是不同的。鉴定这些差异将允许医生将他们的患者归类为如方法中所述的群体的一个子集的一部分。因此,本发明为医生提供了一种基于患者的表观遗传染色体相互作用为患者个性化药物的方法,例如药物类型和/或药物剂量和/或药物施用频率。
本发明涉及ASD广义定义范围内的任何特定病症。在一个方面,所述病症是自闭症或儿童自闭症。所述病症可以是阿斯伯格综合征、PDD-NOS(广泛性发育障碍)或儿童崩解症。本发明涉及任何PDD-NOS病症,包括成瘾性病症,例如对物质或数字媒体设备的成瘾。ASD EpiSwitch标志物揭示了成瘾通路,轴突蛋白(neuroxin)和神经连接蛋白调控通路,雌激素信号传导,TH17分化和NK细胞调控,Hippo、IL4和IL13调控、HPV感染和mTOR信号传导中表观遗传的失调和调节缺陷。
生成连接核酸
本发明的某些方面利用连接核酸,特别是连接DNA。这些连接核酸包括来自在染色体相互作用中聚集在一起的两个区域的序列,并因此提供了有关相互作用的信息。本文所述的EpiSwitchTM方法使用此类连接核酸的生成来检测染色体相互作用。
因此,本发明的方法可以包括通过以下步骤(包括包含这些步骤的方法)生成连接核酸(例如DNA)的步骤:
(i)对存在于染色体基因座的表观遗传染色体相互作用进行交联,优选在体外;
(ii)任选地从所述染色体基因座分离交联DNA;
(iii)对所述交联DNA进行切割,例如用至少将交联DNA切割一次的酶(特别是在所述染色体基因座内至少切割一次的酶)进行限制性消化;
(iv)连接所述交联切割的DNA末端(特别是形成DNA环);以及
(v)任选地鉴定所述连接DNA和/或所述DNA环的存在,特别是使用如PCR(聚合酶链反应)的技术,以鉴定特定染色体相互作用的存在。
可以实施这些步骤以检测本文提及的任何方面的染色体相互作用。也可以实施这些步骤以生成本文提及的第一组核酸和/或第二组核酸。
PCR(聚合酶链反应)可用于检测或鉴定连接核酸,例如,生成的PCR产物的大小可指示存在的特定染色体相互作用,并且因此可用于鉴定基因座状态。在优选的方面,将如表5中所示的至少1、2或3个引物或引物对用于PCR反应。在其他方面,将如表1、表2、表3或表4中所示的至少1、10、20、30、50或80个引物或引物对用于PCR反应。本领域技术人员会知道可用于切割目标染色体基因座内的DNA的多种限制性内切酶。显然,将根据所研究的基因座和位于其中的DNA序列使用具体的酶。如本发明中所述,可用于切割DNA的限制性内切酶的非限制性实例是TaqI。
EpiSwitchTM技术
EpiSwitchTM技术还涉及使用微阵列EpiSwitchTM标志物数据来检测表型特异性的表观遗传染色体构象特征。诸如以本文所述方式利用连接核酸的EpiSwitchTM的方面具有几个优点。它们具有低水平的随机噪声,例如因为来自本发明第一组核酸的核酸序列与第二组核酸杂交,或未能与第二组核酸杂交。这提供了一个二元结果,允许以相对简单的方式在表观遗传水平上测量复杂的机制。EpiSwitchTM技术处理时间快且成本低。在一个方面,处理时间为3小时至6小时。
样本和样本处理
本发明的方法通常将在样本上进行。样本可以在限定的时间点获得,例如在本文限定的任何时间点。样本通常包含来自个体的DNA。样本通常包含细胞。在一个方面,通过微创方式获得样本,并且可以是例如血液样本。可以提取DNA并用标准限制酶切割DNA。这可以预先确定哪些染色体构象被保留,并将使用EpiSwitchTM平台进行检测。由于组织和血液之间染色体相互作用的同步性,包括水平转移,血液样本可用于检测组织中的染色体相互作用,例如与疾病相关的组织。
本发明核酸的性质
本发明涉及某些核酸,例如本文所述的在本发明的方法中使用或生成的连接核酸。这些核酸可以与本文提及的第一核酸和第二核酸相同或具有它们的任何性质。本发明的核酸通常包括两个部分,每个部分包括来自在染色体相互作用中聚集在一起的染色体的两个区域之一的序列。通常,每个部分的长度为至少8、10、15、20、30或40个核苷酸,例如长度为10个至40个核苷酸。优选的核酸包括来自任何所述表中提及的任何基因的序列。通常优选的核酸包括表1、表2、表3或表4中提及的特异性探针序列;或这些序列的片段和/或同源物。
优选地,所述核酸是DNA。应当理解,在提供特定序列的情况下,本发明可以根据特定方面的需要使用互补序列。优选地,所述核酸是DNA。应当理解,在提供特定序列的情况下,本发明可以根据特定方面的需要使用互补序列。
如本文所述,表1、表2、表3或表4中任一个所示的引物也可用于本发明。在一个方面,使用包括以下任一项的引物:表1、表2、表3或表4所示的序列;或表1、表2、表3或表4所示的任一序列的片段和/或同源物。
“第一”和“第二”核酸
在本发明的一个方面:
-所述第二组核酸来自比所述第一组核酸更大的个体群;和/或
-所述第一组核酸来自至少8个个体;和/或
-所述第一组核酸来自第一亚群的至少4个个体和来自第二亚群的至少4个个体,所述第二亚群优选与所述第一亚群不重叠。
在本发明的另一个方面:
-所述第二组核酸代表未经选择的群体;和/或
-其中所述第二组核酸在限定位置与阵列结合;和/或
-其中所述第二组核酸代表在至少100个不同基因中的染色体相互作用;和/或
-其中所述第二组核酸包括代表至少1,000种不同染色体相互作用的至少1,000种不同核酸;和/或
-其中所述第一组核酸和所述第二组核酸包括至少100个长度为10个至100个核苷酸碱基的核酸。
第二组核酸——“索引”序列
第二组核酸序列具有作为一组索引序列的功能,并且本质上是一组适合鉴定亚群特异性序列的核酸序列。它们可以代表“背景”染色体相互作用,并且可能以某种方式被选择或不被选择。它们通常是所有可能的染色体相互作用的子集。
所述第二组核酸可以通过任何合适的方法获得。它们可以通过计算得出,也可以基于个体的染色体相互作用得到。它们通常代表比第一组核酸更大的群体。在一个具体的方面,所述第二组核酸代表具体基因组中所有可能的表观遗传染色体相互作用。在另一个具体的方面,所述第二组核酸代表存在于本文所述群体中的所有可能的表观遗传染色体相互作用的大部分。在一个具体的方面,所述第二组核酸代表至少20个、50个、100个或500个基因(例如20个至100个或50个至500个基因中)中至少50%或至少80%的表观遗传染色体相互作用。
所述第二组核酸通常代表至少100种可能的表观遗传染色体相互作用,它们修饰、调控或以任何方式介导群体中的表型。所述第二组核酸可以代表影响物种的疾病状态(通常与诊断或预后相关)的染色体相互作用。所述第二组核酸通常包括代表与预后亚群相关和不相关的表观遗传相互作用的序列。
在一个具体的方面,所述第二组核酸至少部分来源于群体中天然存在的序列,并且通常通过计算机(in silico)方法获得。与天然存在的核酸中存在的核酸的相应部分相比,所述核酸还可以包括单个或多个突变。所述突变包括一个或多个核苷酸碱基对的缺失、取代和/或添加。在一个具体的方面,所述第二组核酸可以包括代表与天然存在的物种中存在的核酸的相应部分具有至少70%序列一致性的同源基因和/或直系同源基因(orthologue)的序列。在另一个具体的方面,提供了与天然存在的物种中存在的核酸的相应部分至少80%的序列一致性或至少90%的序列一致性。
第二组核酸的性质
在一个具体的方面,在所述第二组核酸中存在至少100种不同的核酸序列,优选至少1000种、2000种或5000种不同的核酸序列,最多100,000种、1,000,000种或10,000,000种不同的核酸序列。通常数量为100至1,000,000,例如1,000种到100,000种不同的核酸序列。所有或至少90%或至少50%或这些核酸序列对应于不同的染色体相互作用。
在一个具体的方面,所述第二组核酸代表至少20个不同基因座或基因中的染色体相互作用,优选至少40个不同基因座或基因,并且更优选至少100个、至少500个、至少1000个或至少5000个不同基因座或基因,例如100个至10,000个不同基因座或基因。所述第二组核酸的长度使它们适合于根据沃森-克里克碱基配对与所述第一组核酸进行特异性杂交,从而可以鉴定亚群特异性的染色体相互作用。通常,所述第二组核酸包括依次对应于在染色体相互作用中聚集在一起的两个染色体区域的两个部分。所述第二组核酸通常包括长度至少为10个,优选为20个,并且更优选为30个碱基(核苷酸)的核酸序列。在另一个方面,所述核酸序列的长度可以为不超过500个,优选不超过100个,并且更优选不超过50个碱基对。在一个优选的方面,所述第二组核酸包括17个至25个碱基对的核酸序列。在一个方面,至少100%、80%或50%的第二组核酸序列具有上述长度。优选地,不同的核酸不具有任何重叠序列,例如至少100%、90%、80%或50%的核酸在至少5个连续核苷酸上不具有相同序列。
假设所述第二组核酸作为“索引”,那么相同的第二组核酸可以与代表不同特征的亚群的不同第一组核酸一起使用,即所述第二组核酸可以代表可用于鉴定与不同特征相关的染色体相互作用的“通用”的核酸集合。
第一组核酸
第一组核酸通常来自与预后相关的亚群。所述第一组核酸可具有本文提及的第二组核酸的任何特征和性质。所述第一组核酸通常来自个体样本,所述个体已经经历了本文所述的处理和加工,特别是EpiSwitchTM交联和切割步骤。通常,所述第一组核酸代表取自个体的样本中存在的全部或至少80%或50%的染色体相互作用。
通常,与由所述第二组核酸代表的染色体相互作用相比,所述第一组核酸代表了由第二组核酸代表的基因座或基因的更小的染色体相互作用群体,即所述第二组核酸是代表限定的基因座或基因中的相互作用的背景或索引组。
核酸文库
本文提及的任何类型的核酸群体都可以以文库的形式存在,所述文库包括至少200个、至少500个、至少1000个、至少5000个或至少10000个该类型的不同核酸,例如“第一”或“第二”核酸。这样的文库可以是与阵列绑定的形式。所述文库可以包括表1、表2、表3或表4中任一个所示的一些或全部的探针或引物对。所述文库可以是组合物的形式或可以是试剂盒(其中所述核酸在单独的容器中提供)的形式。
杂交
本发明需要一种可以使来自所述第一组核酸和第二组核酸的全部互补或部分互补的核酸序列杂交的手段。在一个方面,所有第一组核酸在单个分析中(即在单个杂交步骤中)与所有第二组核酸接触。然而,可以使用任何合适的分析。
标记核酸和杂交模式
本文提及的核酸可以被标记,优选使用有助于检测成功杂交的独立的标记,例如荧光团(荧光分子)或放射性标记。某些标记可以在紫外光下检测到。杂交模式,例如在本文描述的阵列上,代表两个亚群之间表观遗传染色体相互作用的差异,并因此提供了一种用于比较表观遗传染色体相互作用和确定哪些表观遗传染色体相互作用是特异于本发明群体中的亚群的方法。
术语“杂交模式”广泛涵盖第一组和第二组核酸之间存在杂交和不存在杂交,即第一组中的哪些特定核酸与第二组中的哪些特定核酸杂交,因此它不限于任何特定的分析或技术,或者需要具有可以检测到“模式”的表面或阵列。
选择具有特定特征的亚群
本发明提供了一种方法,所述方法包括检测是否存在染色体相互作用,通常为5个至20个或5个至500个这样的相互作用,优选20个至300个或50个至100个相互作用,以确定个体中是否存在与预后相关的特征。优选地,所述染色体相互作用是本文提及的任一基因中的那些染色体相互作用。在一个方面,分型的染色体相互作用是表1、表2、表3或表4中的核酸所示的那些染色体相互作用。表中标题为“检出环”的列显示了每个探针检测到的亚群。检测可以是所述亚群中染色体相互作用的存在或染色体相互作用的不存在。
测试的个体
测试的个体通常是本文提及的任何物种。此外,在本发明的方法中测试的个体可能已经以某种方式被选择。所述个体可能对本文提及的任何病症易感和/或可能需要本文提及的任何疗法。所述个体可能正在接受本文提及的任何疗法。特别是,所述个体可能患有ASD或被怀疑患有ASD。
所述个体可能被怀疑患有ASD广义定义范围内的任何具体病症。所述病症可以是自闭症、儿童自闭症、阿斯伯格综合征、PDD-NOS(广泛性发育障碍)、儿童崩解症、成瘾(例如对物质或数字媒体设备成瘾)。
对标志物的组合进行分型
本发明包括一种方法,其中对染色体相互作用的特定组合进行分型:
(i)包括表1、表2、表3或表4中的探针所代表的所有染色体相互作用;和/或
(ii)包括表1、表2、表3或表4中的探针所代表的至少25、50、100、150或200个染色体相互作用;和/或
(iii)共同存在于表1、表2、表3或表4所列的至少10、20、30或40个区域或基因中的染色体相互作用;和/或
(iv)其中至少10、20、30或40个被分型的染色体相互作用存在于4,000碱基区域中,所述4,000碱基区域包括表1、表2、表3或表4中的探针所代表的染色体相互作用或位于表1、表2、表3或表4中的探针所代表的染色体相互作用的侧面。
在本发明的方法中,通常对至少20、30、40或50个染色体相互作用进行分型。
优选的基因区域、基因座、基因和染色体相互作用
对于本发明的所有方面,优选的基因区域、基因座、基因和染色体相互作用在表中(例如在表1、表2、表3或表4中)提及。通常在本发明的方法中,从表1所列的至少10个,20、30、40或50个基因中检测到染色体相互作用。通常在本发明的方法中,从表2所列的至少10、20、30、40或50个基因中检测到染色体相互作用。通常在本发明的方法中,从表3所列出的至少10、20、30、40或50个基因中检测到染色体相互作用。通常在本发明的方法中,从表4所列出的从至少10、20、30、40或50个基因中检测到染色体相互作用。
优选地,检测到表1中的探针序列所代表的至少10、20、50、150或200个相关的特异性染色体相互作用是否存在。优选地,检测到表2中的探针序列所代表的至少10、20、50、150或200个相关的特异性染色体相互作用是否存在。优选地,检测到表3中的探针序列所代表的至少10、20、50、150或200个相关的特异性染色体相互作用是否存在。优选地,检测到表4中的探针序列所代表的至少10、20、50、150或200个相关的特异性染色体相互作用是否存在。所述染色体相互作用可以位于本文提及的任何基因的上游或下游,例如位于上游50kb或下游20kb(例如距离所述编码序列)内。
优选的标志物的组合和数量
在一个方面,本发明涉及对表1所示的标志物进行分型。在这个方面,被分型的标志物可以存在或不存在于任何其他表格中。因此,本发明包括一种通过对表1所示的一种或多种染色体相互作用进行分型来确定ASD预后的方法。通常,检测表1中至少1、5、8、10、15、20个染色体相互作用是否存在。
在一个方面,本发明涉及对表2所示的标志物进行分型。在这个方面,被分型的标志物可以存在或不存在于任何其他表格中。因此,本发明包括一种通过对表2所示的一种或多种染色体相互作用进行分型来确定ASD预后的方法。通常,检测表2中至少1、5、8、10、15、20个染色体相互作用是否存在。
在一个方面,本发明涉及对表3所示的标志物进行分型。在这个方面,被分型的标志物可以存在或不存在于任何其他表格中。因此,本发明包括一种通过对表3所示的一种或多种染色体相互作用进行分型来确定ASD预后的方法。通常检测表3中至少1、5、8、10、15、20个染色体相互作用是否存在。
在一个方面,本发明涉及对表4所示的标志物进行分型。在这个方面,被分型的标志物可以存在或不存在于任何其他表格中。因此,本发明包括一种通过对表4所示的一种或多种染色体相互作用进行分型来确定ASD预后的方法。通常,检测表4中至少1、5、8、10、15、20个染色体相互作用是否存在。
在一个方面,本发明涉及对表8所示的标志物进行分型。在这个方面,被分型的标志物可以存在或不存在于任何其他表格中。因此,本发明包括一种通过对表8所示的一种或多种染色体相互作用进行分型来确定ASD预后的方法。通常,检测表8中至少1、5、8、10、15、20个染色体相互作用是否存在。在一个方面,检测表8中至少30、50、80、100或150个相互作用是否存在。
表8包括其中定义如下的标志物组:
A组:编号为1至12的标志物
B组:编号为13至76和139至167的标志物
C组:编号为77至138的标志物
D组:编号为168至183的标志物
通常,检测表8中A组的至少1、5、8、10个或所有染色体相互作用是否存在。在一个方面,检测表8中B组的至少1、5、8、10、15、20个或所有染色体相互作用是否存在。通常,检测表8中C组的至少1、5、8、10、15、20个或所有染色体相互作用是否存在。在一个方面,检测表8中D组的至少1、5、8、10、15、20个或所有染色体相互作用是否存在。
在一个方面,本发明涉及对表9所示的标志物进行分型。在这个方面,被分型的标志物可以存在或不存在于任何其他表格中。因此,本发明包括一种通过对表9所示的一种或多种染色体相互作用进行分型来确定ASD预后的方法。通常,检测表9中至少1、5、8、10、15、20个染色体相互作用是否存在。在一个方面,检测表9中至少30、50、80、100或150个相互作用是否存在。
表9包括其中定义如下的标志物组:
A组:编号为2至7和9至15的标志物
B组:编号为1、8、16至87和149至171的标志物
C组:编号为88至148的标志物
D组:编号为172至182的标志物
通常,检测表9中A组的至少1、5、8、10个或所有染色体相互作用是否存在。在一个方面,检测表9中B组的至少1、5、8、10、15、20个或所有染色体相互作用是否存在。通常,检测表9中C组的至少1、5、8、10、15、20个或所有染色体相互作用是否存在。在一个方面,检测表9中D组的至少1、5、8个或所有染色体相互作用是否存在。
在一个方面,检测表10中至少1、5、8、10、15、20个或所有染色体相互作用是否存在。在优选的方面,对表10的前两个标志物中的一个或两个进行分型。
对附图中提及的染色体相互作用进行分型
在一个方面,本发明的方法包括对一个或多个染色体相互作用进行分型,所述染色体相互作用涉及任何附图中提到的任何基因(如表中所定义)。通常,对至少1、5、8、10、15或20个这样的相互作用进行分型。
对不同类型的ASD进行分型
从表中可以看出,不同的标志物特异于不同类型的ASD(通过它们是否存在来定义)。本发明的方法通常包括对具有以下任何特征的标志物进行分型:
(i)存在于健康对照(HC)中,但不存在于轻度ASD和重度ASD中
(ii)仅存在于轻度ASD或重度ASD中,且不存在于HC中
(iii)常见于或存在于在重度ASD和轻度ASD中,但不存在于HC中
(iv)存在于或不存在于重度ASD或轻度ASD中。
在一个方面,对至少1、5、8、10、15或20个具有特征(i)的染色体相互作用进行分型。在另一个方面,对至少1、5、8、10、15或20个具有特征(ii)的染色体相互作用进行分型。在一个方面,对至少1、5、8、10、15或20个具有特征(iii)的染色体相互作用进行分型。在另一个方面,对至少1、5、8、10、15或20个具有特征(vi)的染色体相互作用进行分型。
染色体相互作用的类型
在一个方面,基因座(包括检测到染色体相互作用的基因和/或位置)可包括CTCF结合位点。这是能够结合转录阻遏物CTCF的任何序列。该序列可由序列CCCTC组成或包括序列CCCTC,其中,序列CCCTC可以在基因座中以1个、2个或3个拷贝存在。CTCF结合位点序列可以包括序列CCGCGNGGNGGCAG(IUPAC表示法)。CTCF结合位点可以在染色体相互作用的至少100、500、1000或4000个碱基内或在表1、表2、表3或表4所示的任何染色体区域内。CTCF结合位点可以在染色体相互作用的至少100、500、1000或4000个碱基内或在表1、表2、表3或表4所示的任何染色体区域内。
在一个方面,检测到的染色体相互作用存在于表1、表2、表3或表4所示的任何基因区域。如果在该方法中检测到连接核酸,则可以检测到表1、表2、表3或表4的任何探针序列中所示的序列。
因此,通常可以检测来自探针的两个区域(即来自染色体相互作用的两个位点)的序列。在优选的方面,在该方法中使用的探针包括与任何表中所示的探针相同或互补的序列或由与任何表中所示的探针相同或互补的序列组成。在某些方面,使用的探针包括与表中所示的任何探针序列同源的序列。
在一个方面,分型的一种或多种染色体相互作用位于具有以下特征的基因座/区域:
(i)包括单核苷酸多态性(SNP);和/或
(ii)表达微RNA(miRNA);和/或
(iii)表达非编码RNA(ncRNA);和/或
(iv)表达编码至少10个连续氨基酸残基的核酸序列;和/或
(v)表达调控元件;和/或
(vii)包括CTCF结合位点。
表格说明
表1显示了存在于健康对照中,但不存在于重度自闭症和轻度自闭症中的标志物。名称“mHC”表示其在轻度和重度中均不存在(mHC,表示来自于轻度与HC的比较)。名称“sHC”表示其在轻度和重度中均不存在(sHC,表示来自于重度与HC的比较)。
表2显示了轻度自闭症和重度自闭症中存在的独有标志物。名称“sAD”表示其在对照和轻度中不存在。名称“mAD”表示其在对照和重度中不存在。
表3显示了在重度自闭症和轻度自闭症中存在的共有标志物。名称“sAD”表示其在轻度中存在(表示来自于重度与HC的比较)。名称“mAD”表示其在重度中存在(表示来自于轻度与HC的比较)。
表4显示了不存在于重度自闭症或轻度自闭症中的独有标志物。名称“sHC”表示其存在于健康对照中,但仅用于在重度和HC患者之间的比较。这并没有提及轻度状态。名称“mHC”表示其存在于健康对照中,但仅用于在轻度和HC患者之间的比较。这并没有提及重度的状态。
表8显示了与重度自闭症相关的标志物。此表中显示了四组标志物,如上定义并在表中所示的A组、B组、C组、D组。标志物可以从整个表格或一组中进行选择。
表9显示了与轻度自闭症相关的标志物。此表中显示了四组标志物,如上定义并在表中所示的A组、B组、C组、D组。标志物可以从整个表格或一组中进行选择。
表10显示了具有高性能的标志物,并且是一个优化的组套(panel)。特别地,该组套包括与NAMPT和MAP2(表中的编号为1和2的标志物)相关的染色体相互作用。
所有表中的LS列都有“1”或“-1”。这反映了比较是如何进行的,健康对照始终是分子,因此HC中存在的显著标志物将为1,而疾病样本(轻度或重度)则始终是分母,因此疾病样本中存在的显著标志物将始终为-1。
表格显示了探针(EpiswitchTM标志物)数据和代表与预后相关的染色体相互作用的基因数据。探针序列显示了可用于检测由在染色体相互作用中聚集在一起的基因区域的两个位点生成的连接产物的序列,即探针将包括与连接产物中的序列互补的序列。前两组的起始-终止位置显示探针位置,后两组的起始-终止位置显示相关的4kb区域。探针数据表中提供了以下信息:
-HyperG_Stats:基于超几何富集的参数在基因座中找到显著EpiswitchTM标志物数量的概率的p值
-探针总计数:在基因座中测试的EpiSwitchTM构象总数
-探针计数Sig:在基因座中发现具有统计学显著性的EpiSwitchTM构象的数量
-FDR HyperG:多重测试(免疫反应发现率)校正的超几何p值
-百分比Sig:显著EpiSwitchTM标志物相对于在基因座中测试的标志物数量的百分比
-logFC:以2为底的表观遗传率(FC)对数
-AveExpr:在所有阵列和通道上探针的平均log2表达式
-T:适度t统计量(moderated t-statistic)
-p值:原始p值
-adj.p值:调整后的p值或q值
-B-B统计(lods或B)是基因差异表达的对数优势(log-odds)。
-FC-非对数倍数变化
-FC_1-以零为中心的非对数倍数变化
-LS-二元值,与FC_1值相关。低于-1.1的FC_1值则设置为-1,并且如果FC_1值高于1.1,则设置为1。在这些值之间,值为0。
这些表显示了已发现的发生了相关染色体相互作用的基因。基因座表中的p值与HyperG Stats相同(基于超几何富集的参数在基因座中找到显著EpiSwitchTM标志物数量的概率的p值)。LS列显示出与所述特定亚群(预后状态)相关的相互作用是否存在。
探针被设计为距离Taq1位点30bp。在PCR的情况下,通常设计PCR引物来检测连接产物,但它们距Taq1位点的位置不同。
探针位置:
起始1-片段1上TaqI位点上游30个碱基
终止1-片段1上TaqI限制性位点
起始2-片段2上TaqI限制性位点
终止2-片段2上TaqI位点下游30个碱基
4kb序列位置:
起始1-片段1上TaqI位点上游4000个碱基
终止1-片段1上TaqI限制性位点
起始2-片段2上TaqI限制性位点
终止2-片段2上TaqI位点下游4000个碱基
与用于拟合整个套索(lasso)或弹性网正则化(λ设置为0.5(弹性网))的程序相关的GLMNET值。
某些标志物在涉及共有标志物的地方显示了两次,一次是针对其在轻度自闭症中的存在/不存在,一次是针对其在重度自闭症中的存在/不存在。
样本制备和染色体相互作用检测的优选方面
本文描述了制备样本和检测染色体构象的方法。可以使用这些方法的优化(非常规)版本,例如本部分所述。
通常,样本将包含至少2×105个细胞。样本可包含多达5×105个细胞。在一个方面,样本包含2×105至5.5×105个细胞。
本文描述了存在于染色体基因座的表观遗传染色体相互作用的交联。这可以在细胞裂解发生之前进行。细胞裂解可进行3分钟至7分钟,例如4分钟至6分钟或约5分钟。在一些方面,细胞裂解进行至少5分钟并且少于10分钟。
本文描述了用限制性内切酶消化DNA。通常,DNA限制性酶切于约55℃至约70℃进行,例如于约65℃,持续约10分钟至30分钟,例如约20分钟。
优选地,使用频繁切割的限制性内切酶,其产生平均片段大小高达4000个碱基对的连接DNA片段。任选地,限制性内切酶产生平均片段大小为约200至300个碱基对(例如约256个碱基对)的连接DNA片段。在一个方面,通常片段大小为200个碱基对到4,000个碱基对,例如400个到2,000个或500个到1,000个碱基对。
在EpiSwitch法的一个方面,在DNA限制性消化步骤和DNA连接步骤之间不进行DNA沉淀步骤。
本文描述了DNA连接。通常DNA连接进行5分钟至30分钟,例如约10分钟。
可以酶促消化(例如使用蛋白酶,任选地蛋白酶K)样本中的蛋白质。可以酶促消化蛋白质约30分钟至1小时,例如约45分钟。在一个方面,在蛋白消化(例如蛋白酶K消化)后,没有交联逆转DNA提取或酚DNA提取步骤。
在一个方面,PCR检测能够检测连接核酸的单拷贝,优选地通过二元读出是否存在连接核酸。
图10显示了检测染色体相互作用的优选方法。
本发明的方法和用途
可以用不同的方式描述本发明的方法。其可以描述为一种制备连接核酸的方法,包括(i)将染色体相互作用中聚集在一起的染色体区域进行体外交联;(ii)对所述交联DNA进行切割或限制性消化酶切;以及(iii)连接所述交联的切割DNA末端以形成连接核酸,其中连接核酸的检测可用于鉴定基因座的染色体状态,并且其中优选地:
-基因座可以是表1、表2、表3或表4中提及的任何基因座、区域或基因,和/或
-其中染色体相互作用可以是本文提及的任何染色体相互作用或对应于表1、表2、表3或表4中公开的任何探针,和/或
-其中连接产物可以具有或包括(i)与表1、表2、表3或表4中公开的任何探针序列相同或同源的序列;或(ii)与(ii)互补的序列。
本发明的方法可以描述为检测代表群体中不同亚群的染色体状态的方法,包括确定在基因组的限定的表观遗传活性区域内是否存在染色体相互作用,其中优选地:
-亚群由是否存在病症或病症的类型来定义,和/或
-染色体状态可以在表1、表2、表3或表4中提及的任何基因座、区域或基因上;和/或
-染色体相互作用可以是表1、表2、表3或表4中提及的任何染色体相互作用或对应于该表中公开的任何探针。
本发明包括检测表1、表2、表3或表4提及的任何基因座、基因或区域的染色体相互作用。本发明包括使用本文提及的核酸和探针来检测染色体相互作用,例如使用至少1个、5个、10个、20个或50个这样的核酸或探针来检测染色体相互作用。优选地,核酸或探针检测在至少1个、5个、10个、20个或50个不同基因座或基因中的染色体相互作用。本发明包括使用表1、表2、表3或表4中列出的任何引物或引物对或使用如本文所述的这些引物的变体(包括引物序列或包括引物序列的片段和/或同源序列的序列)来检测染色体相互作用。
当分析染色体相互作用是否在限定的基因、区域或位置“内”发生时,或者在相互作用中聚集在一起的两个染色体部分都在限定的基因、区域或位置内,或者在某些方面只有染色体的一部分在限定的基因、区域或位置内。
表中显示的标志物是“播散(disseminating)”标志物,其是否存在与本文定义的特定ASD状态相关(如相关表中所示)。因此,根据标志物与ASD状态相关联的方式,对本发明方法的结果进行了分析。
本发明的方法在鉴定新的治疗方法中的用途
染色体相互作用的知识可用于确定新的ASD治疗方法。本发明提供本文定义的染色体相互作用的方法和用途,以鉴定或设计新的治疗剂,例如与ASD的治疗有关的治疗剂。
同源物
本文涉及多核苷酸/核酸(例如DNA)序列的同源物。此类同源物通常具有至少70%的同源性,优选至少80%、至少85%、至少90%、至少95%、至少97%、至少98%或至少99%的同源性,例如在至少10个、15个、20个、30个、100个或更多个连续核苷酸的区域上,或跨越来自参与染色体相互作用的染色体区域的核酸部分。同源性可以基于核苷酸一致性(有时称为“硬同源性”)来计算。
因此,在具体方面,多核苷酸/核酸(例如DNA)序列的同源物在本文中是指序列一致性百分比。通常,此类同源物具有至少70%的序列一致性,优选至少80%、至少85%、至少90%、至少95%、至少97%、至少98%或至少99%的序列一致性,例如在至少10个、15个、20个、30个、100个或更多个连续核苷酸的区域上,或跨越来自参与染色体相互作用的染色体区域的核酸部分。
例如,UWGCG软件包提供了BESTFIT程序,可用于计算同源性和/或序列一致性%(例如在其默认设置下使用)(Devereux et al(1984)Nucleic Acids Research 12,p387-395)。PILEUP和BLAST算法可用于计算同源性和/或序列一致性%和/或排列序列(例如鉴定等效序列或相应序列(通常在它们的默认设置下)),例如Altschul S.F.(1993)J MoI Evol36:290-300;Altschul,S,F et al(1990)J MoI Biol 215:403-10中所述。
执行BLAST分析的软件可通过国家生物技术信息中心公开获得。该算法包括首先通过识别查询序列中长度为W的短片段(short word)来识别高分序列对(high scoringsequence pair,HSP),当该短片段与数据库序列中相同长度的片段进行比对时,其匹配或满足某个正数阈值分数T。T被称为邻近片段分数阈值(Altschul et al,同上)。这些初始的邻近匹配片段(word hit)作为种子(seed),用于启动搜索以查找包含它们的HSP。匹配片段沿每个序列在两个方向上延伸,只要可以增加累积比对分数。在以下情况下,匹配片段在每个方向的延伸将停止:累积比对分数从其最大实现值下降了数量X;累积分数由于一个或多个负分数残基比对的累积而变为零或更低;或到达任一序列的末尾端。BLAST算法参数W5T和X决定了比对的灵敏度和速度。BLAST程序默认使用11的字长(W),BLOSUM62评分矩阵(参见Henikoff and Henikoff(1992)Proc.Natl.Acad.Sci.USA 89:10915-10919)比对(B)为50,期望值(E)为10,M=5,N=4,以及两条链的比较。
BLAST算法对两个序列之间的相似性进行统计分析;参见例如Karlin andAltschul(1993)Proc.Natl.Acad.Sci.USA 90:5873-5787。BLAST算法提供的一种相似性度量是最小和概率(P(N)),其提供了两个多核苷酸序列之间偶然发生匹配的概率的指示。例如,如果第一序列与第二序列相比的最小和概率小于约1,优选小于约0.1,更优选小于约0.01,最优选小于约0.001,则认为一个序列与另一个序列相似。
同源序列通常相差1个、2个、3个、4个或更多个碱基,例如少于10个、15个或20个碱基(可以是核苷酸的取代、缺失或插入)。这些变化可以在与计算同源性和/或序列一致性%有关的上述任何区域中测量。
可以计算“引物对”的同源性,例如,通过将两个序列视为单个序列(好像两个序列连接在一起),然后与另一个也被视为单个序列的引物对进行比较。
阵列
第二组核酸可以结合到阵列上,并且在一个方面,至少有15,000个、45,000个、100,000个或250,000个不同的第二组核酸结合到阵列上,优选地,其代表至少300个、900个、2000个或5000个基因座。在一方面,第二组核酸的一个或多个或所有不同群体结合到阵列的一个以上的不同区域,实际上在阵列上重复以允许错误检测。该阵列可以基于AgilentSurePrint G3定制CGH微阵列平台。第一组核酸与阵列的结合可以通过双色系统来检测。
治疗剂(例如基于个体分型来选择的治疗剂或基于根据本发明的测试来选择的治疗剂)
本文中提及了治疗剂。本发明提供了用于预防或治疗某些个体的疾病状况的此类剂,例如通过本发明的方法鉴定的那些剂。这可以包括向有需要的个体施用治疗有效量的剂。本发明提供了所述剂在制备预防或治疗某些个体的病症的药物中的用途。
所述剂的配方将取决于所述剂的性质。所述剂将以包含该剂和药学上可接受的载体或稀释剂的药物组合物的形式提供。合适的载体和稀释剂包括等渗盐水溶液,例如磷酸盐缓冲盐水。典型的口服剂量组合物包括片剂、胶囊、液体溶液和液体悬浮液。该剂可以配制用于肠胃外、静脉内、肌肉内、皮下、透皮或口服施用。
所述剂的剂量可以根据多种参数来确定,尤其是根据所使用的物质;接受治疗的个体的年龄、体重和病况;施用途径;和所需的方案。医生能够确定任何具体剂所需的施用途径和剂量。然而,合适的剂量可为0.1mg/kg体重至100mg/kg体重,例如1mg/kg体重至40mg/kg体重,例如每天服用1至3次。
治疗剂可以是本文公开的任何此类剂,或可以靶向本文公开的任何“靶标”,包括在本文任何表(包括表1、表2、表3或表4)中公开的任何蛋白质或基因。
ASD疗法
在本发明中可以使用任何抗ASD疗法,例如针对ASD症状(例如旨在调节行为)的任何药物。该疗法可以是精神药物、抗惊厥药、抗抑郁药或抗精神病药。所述抗精神病药可以是利培酮或阿立哌唑。
本文提及的物质的形式
本文提及的任何物质,例如核酸或治疗剂,可以是纯化的或分离的形式。它们可以以不同于自然界中发现的形式存在,例如它们可以与自然界中不存在的其他物质组合存在。核酸(包括本文限定的序列的部分)可以具有与自然界中发现的序列不同的序列,例如在序列中具有至少1个、2个、3个、4个或更多个核苷酸变化,如同源性部分所述。核酸可在5′末端或3′末端具有异源序列。核酸在化学上可以与那些在自然界中发现的核酸不同,例如它们可以以某种方式被修饰,但优选地仍然能够进行沃森-克里克碱基配对。在适当的情况下,核酸将以双链或单链的形式提供。本发明以单链或双链形式提供了本文提及的所有具体核酸序列,并因此包括所公开的任何序列的互补链。
本发明提供了用于实施本发明的任何方法(包括检测与预后相关的染色体相互作用)的试剂盒。这种试剂盒可以包括能够检测相关染色体相互作用的特异性结合剂,例如能够检测由本发明的方法生成的连接核酸的剂。试剂盒中的优选剂包括能够与连接核酸或引物对杂交的探针,例如本文所述能够在PCR反应中扩增连接核酸的探针。
本发明提供了一种能够检测相关染色体相互作用的装置。该装置优选地包括能够检测染色体相互作用的任何特异性结合剂、探针或引物对,例如本文所述的任何此类剂、探针或引物对。
检测方法
在一个方面,使用在PCR反应过程中激活时可检测的探针对染色体相互作用相关的连接序列进行定量检测,其中所述连接序列包括来自在表观遗传染色体相互作用中聚集在一起的两个染色体区域的序列,其中所述方法包括在PCR反应过程中使连接序列与探针接触,并检测探针的激活程度,并且其中所述探针与连接位点相结合。该方法通常可以使用双标记荧光水解探针以符合MIQE的方式检测特定的相互作用。
探针通常用具有非活性和活性状态的可检测的标签进行标记,因此所述探针只有在激活时才能被检测到。激活的程度将与PCR反应中存在的模板(连接产物)的程度有关。检测可在全部或部分PCR反应过程中进行,例如至少50%或80%的PCR周期。
探针可以包括共价连接到寡核苷酸一端的荧光团和连接到核苷酸另一端的猝灭剂,使得荧光团的荧光被猝灭剂猝灭。在一方面,荧光团连接到寡核苷酸的5′端,猝灭剂共价连接到寡核苷酸的3′端。可用于本发明方法的荧光团包括FAM、TET、JOE、Yakima黄、HEX、花青素3(Cyanine 3)、ATTO 550、TAMRA、ROX、德克萨斯红(Texas Red)、花青素3.5、LC610、LC 640、ATTO 647N、花青素5、花青素5.5和ATTO 680。可以与合适的荧光团一起使用的猝灭剂包括TAM、BHQ1、DAB、Eclip、BHQ2和BBQ650,任选地,其中所述荧光团选自HEX、德克萨斯红和FAM。荧光团和猝灭剂的优选组合包括带有BHQ1的FAM,以及带有BHQ2的德克萨斯红。
探针在qPCR检测中的用途
本发明的水解探针通常是用浓度匹配的阴性对照对温度梯度进行优化。优选地,对单步PCR反应进行优化。更优选地,计算标准曲线。使用穿过连接序列的连接处结合的特异性探针的一个优点是无需使用嵌套PCR方法即可实现对连接序列的特异性。本文描述的方法可以准确和精确地定量低拷贝数靶标。在温度梯度优化之前,可以对靶标连接序列进行纯化,例如凝胶纯化。可以对靶标连接序列进行测序。优选地,使用约10ng、或5ng至15ng、或10ng至20ng、或10ng至50ng、或10ng至200ng模板DNA进行PCR反应。正向和反向引物被设计为使得一个引物与连接DNA序列中表示的染色体区域之一的序列结合,而另一个引物与连接DNA序列中表示的其他染色体区域结合,例如,通过与该序列互补。
连接DNA靶标的选择
本发明包括选择用于本文限定的PCR方法的引物和探针,包括基于引物结合和扩增连接序列的能力选择引物,并基于探针将结合的靶序列的特性,特别是靶序列的曲率选择探针序列。
通常设计/选择探针与连接序列结合,所述连接序列是跨越限制性位点的并列限制性片段。在本发明的一方面,例如使用本文引用的具体算法,计算与特定染色体相互作用相关的可能连接序列的预测曲率。曲率可以表示为每个螺旋转角的度数,例如每个螺旋转角为10.5°。选择用于靶向的连接序列,其中连接序列的曲率倾向峰值分数为每个螺旋转角至少为5°,通常每个螺旋转角至少10°、15°或20°,例如每个螺旋转角为5°至20°。优选地,对于连接位点上游和/或下游的至少20个、50个、100个、200个或400个碱基,例如20个至400个碱基,计算每个螺旋转角的曲率倾向分数。因此,在一方面,连接产物中的靶序列具有这些曲率水平中的任何一个。也可以基于最低热力学结构自由能来选择靶序列。
特定方面
在一个方面,仅对染色体内相互作用进行分型/检测,而对染色体外相互作用(不同染色体之间)不进行分型/检测。
在特定方面,没有对某些染色体相互作用进行分型,例如本文提及的任何具体相互作用(例如由本文提及的任何探针或引物对所限定的)。在某些方面,在本文提及的任何基因中都没有对染色体相互作用进行分型。
在一个方面,没有对未在任何一个表中列出的标志物进行分型,例如,只对表10所列出的标志物进行分型。
筛选方法
本发明提供了一种确定哪些染色体相互作用与对应于群体中预后亚群的染色体状态相关的方法,包括将来自具有不同染色体状态的亚群的第一组核酸与第二组索引核酸接触,并且允许互补序列杂交,其中第一组核酸和第二组核酸中的核酸代表连接产物,包括来自在染色体相互作用中聚集在一起的两个染色体区域的序列,并且所述第一组核酸和第二组核酸之间的杂交模式允许确定哪些染色体相互作用对于预后亚群是特异性的。亚群可以是本文限定的任何具体亚群,例如与特定病症或治疗相关的亚群。
本发明还提供了一种使用本发明的预后/检测方法来鉴定或设计用于ASD的治疗剂的过程;
-其中优选地,所述过程用于检测候选剂是否能够引起与ASD相关的染色体状态的改变;
-其中所述染色体相互作用由表1、表2、表3或表4中的任何探针代表;和/或
-所述染色体相互作用存在于表1、表2、表3或表4列出的任何区域或基因中;
并且其中任选地:
-通过如权利要求1所限定的确定哪些染色体相互作用与染色体状态相关的方法来鉴定所述染色体相互作用,和/或
-使用(i)与表1、表2、表3或表4中提及的任何探针序列具有至少70%一致性的探针,和/或(ii)与表1、表2、表3或表4中的任何引物对具有至少70%一致性的引物对来监测所述染色体相互作用的变化。
对“播散”标志物进行分型
本文提供的数据表明,这些标志物是能够区分相关疾病情况的病例和非病例的“播散”标志物。因此,当实施本发明时,技术人员将能够通过检测相互作用来确定个体所属的亚群。在一个方面,至少70%的与相关疾病情况有关的形式(通过不存在或存在)的受试标志物的检测阈值可用于确定个体是否属于相关亚群。在其他方面,可以使用至少80%或至少90%的阈值。
在一个方面,可以使用分类器作为检测方法的一部分,例如利用包括与一种或多种播散标志物有关的信息的经训练的算法,例如如本文任一表中所定义的。
出版物
本文提及的所有出版物的内容均通过引用并入本说明书中,并可用于进一步限定与本发明相关的特征。
用于鉴定标志物和标志物组套的方法
本文所述的发明涉及染色体构象图谱和3D结构,作为其本身的调控方式,与表型密切相关。生物标志物的发现是基于对代表表型差异的临床样本的代表性队列进行模式鉴定和筛选的注释。我们对基因组的重要部分进行了注释和筛选,跨越已知基因的非编码5′和3′的大摇摆以及编码部分和非编码部分,用于鉴定统计学上播散一致的条件播散染色体构象,例如锚定在开放阅读框内(内含子)或开放阅读框外的非编码位点。
在选择最佳标志物时,我们被用于标志物引导的统计数据和p值所驱动。对特定基因的参考是为了便于位置参考——通常使用最接近的基因作为参考。不能排除这样一种可能性,即基因顺式位置和相关邻近的染色体构象可能对特定基因的表达产生特定的调控成分。在标志物选择或验证时,染色体构象名称中作为位置坐标参考的基因不需要表达参数。无论参考中使用的基因的表达谱如何,特征内选择和验证的染色体构象本身就是播散分类实体(disseminating stratifying entities)。相关的调控模式,如锚定位点的SNP、基因转录谱的变化、H3K27ac水平的变化等,还有待进一步研究。
我们正在从基础生物学和表观遗传学对表型控制的基础上-包括例如从调节网络的框架,来研究临床表型差异及其分类的问题。因此,为了协助分类,可以捕获网络中的变化,并且优选地通过几种生物标志物的特征来完成,例如通过遵循机器学习算法来缩减标志物,其中包括评估标志物的最佳数量,以最小噪声对测试队列进行分类。这可能以3个至20个标志物结束。可以通过交叉验证统计性能(而不是例如通过用于参考名称的相邻基因的功能相关性)来为组套选择标志物。一个标志物组套(带有相邻基因的名称)是从基因组重要部分筛选中聚类选择的产物,以无偏差的方式分析基因组重要部分超过14,000至60,000个带注释的EpiSwitch位点的统计播散能力。对于分类问题,不应将其视为对已知功能价值的基因的染色体构象的定制捕获。染色体相互作用的位点总数为120万个,因此潜在的组合数为120万的120万次方。尽管如此,我们遵循的方法允许鉴定相关的染色体相互作用。
本申请提供的特异性标志物已通过选择,在统计上(显著)与疾病相关联。这就是相关表格中的p值所展示的。每个标志物都可以被视为生物表观遗传事件的代表,作为网络失调(network deregulation)的一部分,在相关疾病下表现出来。实际上,这意味着与对照组相比,这些标志物在各组患者中普遍存在。平均而言,例如,个体标志物通常可以存在于80%的受试患者和10%的受试对照中。
简单地添加所有标志物并不能代表一些失调的网络相互关系。这就是标准多变量生物标志物分析GLMNET(R软件包)的引入之处。GLMNET软件包有助于鉴定某些标志物之间的相互依赖性,这反映了它们在实现导致疾病表型的失调中的共同作用。建模然后测试具有最高GLMNET分数的标志物不仅可以鉴定出准确鉴定患者队列的标志物的最小数量,而且还可以鉴定在对照组患者中提供最少假阳性结果的标志物的最小数量,这应归于对照组低发生率的背景统计噪声。通常,一组(组合)选定标志物(例如3个至10个)提供了检测灵敏度和特异性之间的最佳平衡,出现在从所有为疾病选定的统计显著性标志物的单个属性的多变量分析的背景下。
本文的表格显示了用于阵列分析的阵列探针(60-mer)的参考名称,这些探针与长程相互作用位点、染色体数目和并列的两个染色体片段的起点和终点之间的连接点重叠。
具体方面
EpiSwitchTM平台技术检测基因座处的正常情况和异常情况之间调控变化的表观遗传调节特征。EpiSwitchTM平台鉴定和监测与人类染色体的调控高级结构(也被称为染色体构象特征)相关的基因调控的基本表观遗传水平。染色体特征是一连串基因去调控中独有的主要步骤。它们是高级生物标志物,与利用晚期表观遗传和基因表达生物标志物(例如DNA甲基化和RNA分析)的生物标志物平台相比,具有一系列独有的优势。
EpiSwitchTM阵列分析
定制的EpiSwitchTM阵列筛选平台有4种密度(15K、45K、100K和250K)的独特的染色体构象,每个嵌合片段在阵列上重复4次,使有效密度分别为60K、180K、400K和100万。
定制设计的EpiSwitchTM阵列
15K的EpiSwitchTM阵列可以筛选整个基因组,包括通过EpiSwitchTM生物标志物发现技术查询的约300个基因座。EpiSwitchTM阵列建立在Agilent SurePrint G3定制CGH微阵列平台上;该技术提供4种密度(60K、180K、400K和100万)的探针。每个阵列的密度降低到15K、45K、100K和250K,因为每个EpiSwitchTM探针以一式四份存在,因此可以对再现性进行统计评估。查询每个基因座的潜在EpiSwitchTM标志物的平均数量为50,因此可以调查的基因座数量为300、900、2000和5000。
EpiSwitchTM定制阵列流水线
EpiSwitchTM阵列是一个双色系统,在EpiSwitchTM文库生成后,用Cy5标记其中一组样本,并且待比较/分析的其他样本(对照)用Cy3标记。使用Agilent SureScan扫描仪扫描阵列,并使用Agilent Feature Extraction软件提取结果特征。然后使用R中的EpiSwitchTM阵列处理脚本对数据进行处理。使用R:Limma*中的Bioconductor中标准双色包对阵列进行处理。使用Limma*中的normalisedWithinArrays功能完成阵列的归一化,这是相对于芯片上的Agilent阳性对照和EpiSwitchTM阳性对照完成的。根据Agilent标记调用筛选数据,移除Agilent对照探针,并对技术复制探针进行平均,以便使用Limma*对其进行分析。探测基于2个比较场景之间的差异进行建模,然后使用错误发现率进行校正。变异系数(CV)<=30%,且为<=-1.1或=<1.1并且通过p<=0.1FDR p值的探针用于进一步筛选。为了进一步缩减探针集合,使用R中的FactorMineR软件包执行多因素分析。
*注:LIMMA是用于评估微阵列实验中差异表达的线性模型和经验贝叶斯法。Limma是一个R软件包,用于分析来自微阵列或RNA-Seq的基因表达数据。
根据调整后的p值、FC和CV<30%(任意截止点)参数初步选择探针池,用于最终挑选。仅根据前两个参数(adj.p值;FC)绘制进一步分析和最终列表。
统计流水线
使用R中的EpiSwitchTM分析包对EpiSwitchTM筛选阵列进行处理,以便选择高价值的EpiSwitchTM标志物翻译到EpiSwitchTM PCR平台上。
步骤1
根据探针的经校正p值(错误发现率,FDR)选择探针,经校正p值是修正的线性回归模型的产物。选择p值<=0.1的探针,然后根据其表观遗传比(ER)进一步缩减探针,探针ER必须<=-1.1或=<1.1才能被选择用于进一步分析。最后一个筛选器是变异系数(CV),探针的变异系数必须低于<=0.3。
步骤2
统计列表中的前40个标志物是根据它们的ER选择的,用于选择作为PCR转化的标志物。具有最高负ER量的前20个标志物和具有最高正ER量的前20个标志物组成列表。
步骤3
从步骤1得到的标志物,即具有统计学显著性的探针,构成了使用超几何富集(HE)进行富集分析的基础。这种分析能够缩减显著探针列表中的标志物,并与步骤2中的标志物一起形成转化到EpiSwitchTM PCR平台上的探针列表。
通过HE对统计探针进行处理,以确定哪些遗传位置富集有统计学显著探针,从而表明哪些遗传位置是表观遗传差异的中心。
基于经校正的p值的最显著的富集基因座被选择用于生成探针列表。选择低于p值0.3或0.2的遗传位置。映射到这些遗传位置的统计探针与来自步骤2的标志物一起,形成用于EpiSwitchTM PCR转化的高价值标志物。
阵列设计和处理
阵列设计
1.使用SII软件(目前为v3.2)处理基因座,以:
a.提取这些具体基因座的基因组序列(上游50kb,下游20kb的基因序列)
b.定义该区域内的序列参与CC的概率
c.使用具体的RE切割序列
d.确定哪些限制性片段可能在某个方向上相互作用
e.对不同CC一起相互作用的可能性进行排序。
2.确定阵列大小,从而确定可用探针位置的数量(x)。
3.提取x/4个相互作用。
4.对于每个相互作用,定义从第1部分到限制性位点的30bp序列和从第2部分到限制性位点的30bp序列。检查那些区域是否重复,如果重复,则排除并在列表中记录下一个相互作用。连接两个30bp来定义探针。
5.创建x/4个探针加上定义的对照探针的列表并复制4次以创建要在阵列上建立的列表。
6.将探针列表上传到Agilent Sure设计网站,用于定制CGH阵列。
7.使用探针组设计Agilent定制CGH阵列。
阵列处理
1.使用EpiSwitchTM标准操作程序(SOP)处理样本,用于模板生产。
2.通过阵列处理实验室用乙醇沉淀法进行清理。
3.根据Agilent SureTag完整DNA标记试剂盒处理样本——基于Agilent寡核苷酸阵列的CGH用于血液、细胞或组织的基因组DNA分析酶标记。
4.使用Agilent C扫描仪,通过使用Agilent特征提取软件,进行扫描。
EpiSwitchTM生物标志物特征在复杂疾病表型的分类中表现出高稳健性、高敏感性和高特异性。该项技术利用了表观遗传学的最新突破、监测和评估染色体构象特征作为一类信息量丰富的表观遗传生物标志物。目前在学术环境中使用的研究方法需要3天到7天的时间对细胞材料进行生化处理,以检测CCS。这些程序的灵敏度和再现性有限;此外,这些程序也不具备EpiSwitchTM分析包在设计阶段提供的靶向洞察的优势。
计算机标志物鉴定中的EpiSwitchTM阵列
整个基因组的CCS位点由EpiSwitchTM阵列对来自测试队列的临床样本直接进行评估,以鉴定所有相关的分类引导生物标志物。EpiSwitchTM阵列平台因其高通量并且能够快速筛选大量基因座的能力而被用于标志物鉴定。所使用的阵列是Agilent定制CGH阵列,它允许查询由计算机软件鉴定的标志物。
EpiSwitchTM PCR
通过EpiSwitchTM PCR或DNA测序仪(即Roche 454、Nanopore MinION等)对由EpiSwitchTM阵列鉴定的潜在标志物进行验证。选择统计上显著并显示出最好再现性的最佳PCR标志物,以进一步缩减为最终的EpiSwitchTM特征集,并在独立的样本队列中进行验证。EpiSwitchTM PCR可由经培训的技术人员按照已建立的标准化操作程序协议进行。所有协议和试剂制备均在ISO 13485和9001认证下进行,以确保工作质量和转移协议的能力。EpiSwitchTM PCR和EpiSwitchTM阵列生物标志物平台与全血分析和细胞系分析都兼容。这些测试足够灵敏,可以使用少量血液检测出非常低拷贝数的异常。
实施例1
鉴定播散个体染色体构象,所述染色体构象不仅针对自闭症谱系障碍,而且更针 对在轻度自闭症与重度自闭症和健康对照之间的具体差异
由于无法基于客观的生物标志物鉴定出自闭症群体中具有生物学意义的亚群,导致对ASD病因的研究变得复杂,目前的诊断和护理受精神病学的、心理学的和儿科的方法之间的限制、界限和差异的影响。当前的诊断工具基于1)自闭症诊断访谈-修订版(ADI-R);2)自闭症诊断观察量表(ADOS);儿童自闭症评定量表(CARS),特别是用于通过观察孩子来评估严重程度。也使用交往和交流障碍诊断访谈(DISCO)。通常,社交发展缺陷将自闭症谱系障碍与其他发育障碍区分开来。
目前针对ADS症状的药物旨在调节社会环境中的行为治疗。精神药物、抗惊厥药、抗抑郁药、抗精神病药。例如,抗精神病药利培酮和阿立哌唑已获得FDA批准。这些治疗的副作用:体重增加、流口水、攻击性——往往超过了其益处。在个性化医疗的背景下,如果没有与疾病失调的生物亚型相关的客观的生物标志物,仍然很难为个体患者选择对其有益的药物。
我们已经通过染色体构象对12名临床诊断为轻度ASD的个体患者和12名患有严重ASD的患者进行血液谱的非偏倚全基因组筛查,并与合并的健康对照的平均谱进行比较。
在这些比较中,染色体构象的检测不受任何特定基因或对特定基因的任何偏好或兴趣的驱动。对其中一个亚群的统计上显著的染色体构象的识别来鉴定组装的拓扑自主染色体结构域的调节域,所述拓扑自主染色体结构域通过3D结构的性质影响范围内捕获的基因的调节。这将允许对生物学相关性进行评估,对于通过EpiSwitch筛选捕获的基因比较发现的具有ASD的生物学相关性的非偏倚系统生物标志物。物理上,染色体构象长程相互作用/锚定点的目标位点始终位于基因组的非编码部分(包括内含子)内。它们不会改变基因组序列(即其调控性质是非遗传的),因此与任何基因对蛋白质氨基酸组成的任何影响都没有直接关系。
图1显示了存在于轻度ASD或重度ASD中的前200个具有统计学意义的标志物(相对于健康对照(HC)进行鉴定)。这两组标志物有重叠——与HC相比,145个标志物具有统计学意义,并且存在于重度ASD和轻度ASD中。51个重度ASD标志物为重度类型是独有的。55个轻度ASD标志物为轻度类型是独有的。
图2显示了已确立的重要标志物,作为染色质长距离结构域,最近的编码区域——基因——在多个重叠(上游、下游、域内重叠)组合的场景中被鉴定。所有这些与蛋白质编码区重叠的组合已被证明具有染色体构象域如何影响基因调控的生物学实例。
对轻度ASD独有的标志物(染色体构象仅在轻度ASD中存在,或仅在ASD中不存在)进行分析,以确定它们在其调控范围内可能会影响的基因。然后通过使用这些基因的蛋白质产物将所述基因用于构建标准Cytoscape网络,其中将所述蛋白质与已知的蛋白质调控网络和通路的系统数据库相核对。结果表明,通过染色体构象选择的在轻度ASD失调下的基因符合一个已知的调控相互作用和几个关键生物学通路的紧密网络。排在首位的是轴突蛋白和神经连接蛋白调节通路。还鉴定了Hippo通路。
对针对已知转录因子结合位点(TFBS)的特异性标志物进行了类似的分析。这是针对重度ADS独有的标志物、轻度ASD独有的标志物以及重度ASD和轻度ASD共同的标志物进行的。每组显著富集的TF数量被绘制在图3的VENN图上。例如,对于轻度ASD独有的标志物,18个TF的富集是独有的,7+5个TF与在重度ASD标志物区域观察到的富集是共有的,5+5个TF与在轻度ASD和重度ASD共同的标志物富集的TF是共有的,5个TF为所有三组ASD标志物(轻度、重度、共同共有)的富集所共有。经鉴定的富集的TF的组被用于标准STRING网络和通路富集工具,以评估哪些调控通路和网络会通过TF受到三组标志物的影响。
将具有轻度AD独有的标志物的TF的String网络进行富集,以用于控制雌激素信号传导和Th17分化。图4显示了轻度ASD独有的标志物的TF通路富集。请注意轴突蛋白和神经连接蛋白通路、hippo通路、成瘾通路。
表5显示了相同的分析,但该分析不仅基于只在轻度ASD中存在的染色体构象标志物,也基于仅不存在于轻度ASD中的染色体构象标志物。标志物的独特存在对于检测测试具有重要的实践优势,而标志物的独特缺失在调节方面具有有价值的生物学洞察力。对轻度ASD和重度ASD共有的标志物进行了相同的分析,并鉴定出了IL4、IL13和Hippo。
表6显示了与表5相同的分析,但针对轻度和重度共有的(共同)ASD标志物。请注意HPV感染途径。
针对重度ASD的Cytoscape网络鉴定出了IL-4介导的信号通路。
表7是一个网络分析,其考虑了所有重度ASD独特缺失的染色体构象,而不仅仅是独特存在的染色体构象。
图7是图3的重复,作为对重度ASD标志物的String网络和富集分析之前的提示。
通过TF对重度ASD标志物进行String分析和通路富集确定了病毒感染通路、大脑发育和雌激素依赖性GEX。
图6显示了选择的经鉴定的轻度ASD标志物通路用于进一步分析。图7显示了针对重度ASD的同样结果。
图8显示了基于轻度通路标志物的主成分分析。左侧大椭圆——轻度ASD,左侧小椭圆——重度ASD,右侧椭圆——健康对照。注意HC与两种类型的ASD完全分离,与轻度ASD相比,重度ASD由一个紧密的群组决定——从轻度ASD标志物的角度来看,轻度ASD和重度ASD轮廓存在明显差异。
图9显示了使用了重度ASD通路标志物的相同分析。注意HC(右侧椭圆)与两种类型的ASD(左侧椭圆)的明显分离。
对GRIN2A的遗传定位进行了分析,其中在血液中检测到的重度ASD或轻度ASD独有的显著EpiSwitchTM二元标志物,根据H3K27ac峰的位置(峰本身很宽并带有背景噪声),在尸检的大脑活检中检测到。H3K27ac被认为在某些情况下与3D染色体结构的要素相关。回顾性观察到,非侵入性二元标志物在两种情况下与标记的峰位有关。并非所有H3K27ac峰都与轻度ASD和重度ASD患者之间的显著播散差异相关。
表8至表10提供了具有特定性能标准的其他标志物的列表和组套。表10给出了SHAP值,即沙普利加和解释(SHapley Additive exPlanations)。SHAP值显示了每个预测变量对目标变量的贡献。
图11显示了轻度ASD独有的标志物的网络和通路。
图12显示了在所有轻度ASD标志物上开发的网络中的富集。
图13显示了常见ASD标志物的路富集。
图14显示了在所有常见ASD标志物上开发的网络中的富集。
图15显示了重度ASD独有的标志物的网络路。
图16显示了从重度ASD独有的标志物开发的网络中的富集。
图17显示了对于所有重度ASD标志物开发的网络中的富集。
图18显示了使用重度ASD标志物构建的TF网络。
图19显示了表10中的标志物的性能特征。左侧是训练数据,右侧是测试数据。
结论
EpiSwitch定制Agilent CGH阵列全基因组筛选提供了在组间具有显著统计学意义的标志物:
1.存在于健康对照组(HC)中,但不存在于轻度ASD和重度ASD中
2.在轻度ASD或重度ASD中独有,且不存在于HC中
3.常见于重度ASD和轻度ASD中,但不存在于HC中
4.在重度ASD或轻度ASD中独特缺失
在对ASD患者进行鉴定和亚分型(sub-typing)的方法可能令人困惑、主观和矛盾的背景下,作为与ASD相关的系统性非遗传性失调的测量,在血液中的染色体构象水平的无偏倚全基因组筛选已经鉴定了具有播散能力的统计学显著的非侵入性生物标志物,从而一致地区分健康对照、轻度ASD和重度ASD。对受经鉴定的染色体构象控制的基因组区域的分析与ASD涉及的生物通路机制是一致的,所述通路包括神经性失调(轴突蛋白等)、成瘾、雌激素、HPV感染和免疫系统重置(NK细胞)。这种免疫反应在重度ASD亚群中尤为明显。
Figure BPA0000320862190000361
Figure BPA0000320862190000371
表1.a1
Figure BPA0000320862190000372
Figure BPA0000320862190000381
表1.a2
Figure BPA0000320862190000382
Figure BPA0000320862190000391
表1.a3
Figure BPA0000320862190000392
Figure BPA0000320862190000401
表1.a4
Figure BPA0000320862190000402
Figure BPA0000320862190000411
表1.a5
Figure BPA0000320862190000412
Figure BPA0000320862190000421
表1.a6
Figure BPA0000320862190000422
Figure BPA0000320862190000431
表1.a7
Figure BPA0000320862190000432
Figure BPA0000320862190000441
Figure BPA0000320862190000451
表1.a8
Figure BPA0000320862190000452
Figure BPA0000320862190000461
Figure BPA0000320862190000471
表1.b1
Figure BPA0000320862190000472
Figure BPA0000320862190000481
表1.b2
Figure BPA0000320862190000482
Figure BPA0000320862190000491
表1.b3
Figure BPA0000320862190000492
Figure BPA0000320862190000501
表1.b4
Figure BPA0000320862190000502
Figure BPA0000320862190000511
表1.b5
Figure BPA0000320862190000512
Figure BPA0000320862190000521
表1.b6
Figure BPA0000320862190000522
Figure BPA0000320862190000531
Figure BPA0000320862190000541
表1.b7
Figure BPA0000320862190000542
Figure BPA0000320862190000551
表1.b8
Figure BPA0000320862190000552
Figure BPA0000320862190000561
Figure BPA0000320862190000571
表1.b9
Figure BPA0000320862190000572
Figure BPA0000320862190000581
Figure BPA0000320862190000591
表1.c1
Figure BPA0000320862190000592
Figure BPA0000320862190000601
表1.c2
Figure BPA0000320862190000602
Figure BPA0000320862190000611
Figure BPA0000320862190000621
表1.c3
Figure BPA0000320862190000622
Figure BPA0000320862190000631
Figure BPA0000320862190000641
1.c4
Figure BPA0000320862190000642
Figure BPA0000320862190000651
Figure BPA0000320862190000661
表1.c5
Figure BPA0000320862190000662
Figure BPA0000320862190000671
表1.c6
Figure BPA0000320862190000672
Figure BPA0000320862190000681
Figure BPA0000320862190000691
Figure BPA0000320862190000701
Figure BPA0000320862190000711
表1.c7
Figure BPA0000320862190000712
Figure BPA0000320862190000721
表1.c8
Figure BPA0000320862190000722
Figure BPA0000320862190000731
Figure BPA0000320862190000741
表1.c9
Figure BPA0000320862190000742
Figure BPA0000320862190000751
Figure BPA0000320862190000761
表1.d1
Figure BPA0000320862190000762
Figure BPA0000320862190000771
表1.d2
Figure BPA0000320862190000772
Figure BPA0000320862190000781
表1.d3
Figure BPA0000320862190000782
Figure BPA0000320862190000791
Figure BPA0000320862190000801
表1.d4
Figure BPA0000320862190000802
Figure BPA0000320862190000811
表1.d5
Figure BPA0000320862190000812
Figure BPA0000320862190000821
表1.d6
Figure BPA0000320862190000822
Figure BPA0000320862190000831
Figure BPA0000320862190000841
Figure BPA0000320862190000851
表1.d7
Figure BPA0000320862190000852
Figure BPA0000320862190000861
表1.d8
Figure BPA0000320862190000862
Figure BPA0000320862190000871
表1.d9
Figure BPA0000320862190000872
Figure BPA0000320862190000881
Figure BPA0000320862190000891
表1.e1
Figure BPA0000320862190000901
Figure BPA0000320862190000911
表1.e2
Figure BPA0000320862190000912
Figure BPA0000320862190000921
Figure BPA0000320862190000931
表1.e3
Figure BPA0000320862190000932
Figure BPA0000320862190000941
表1.e4
Figure BPA0000320862190000942
Figure BPA0000320862190000951
表1.e5
Figure BPA0000320862190000952
Figure BPA0000320862190000961
表1.e6
Figure BPA0000320862190000971
Figure BPA0000320862190000981
Figure BPA0000320862190000991
表1.e7
Figure BPA0000320862190000992
Figure BPA0000320862190001001
表1.e8
Figure BPA0000320862190001002
Figure BPA0000320862190001011
Figure BPA0000320862190001021
表1.e9
Figure BPA0000320862190001022
Figure BPA0000320862190001031
表2.a1
Figure BPA0000320862190001032
Figure BPA0000320862190001041
Figure BPA0000320862190001051
表2.a2
Figure BPA0000320862190001052
Figure BPA0000320862190001061
表2.a3
Figure BPA0000320862190001062
Figure BPA0000320862190001071
Figure BPA0000320862190001081
表2.a4
Figure BPA0000320862190001082
Figure BPA0000320862190001091
表2.a5
Figure BPA0000320862190001092
Figure BPA0000320862190001101
Figure BPA0000320862190001111
表2.a6
Figure BPA0000320862190001112
Figure BPA0000320862190001121
Figure BPA0000320862190001131
表2.a7
Figure BPA0000320862190001132
Figure BPA0000320862190001141
Figure BPA0000320862190001151
表2.a8
Figure BPA0000320862190001152
Figure BPA0000320862190001161
表2.a9
Figure BPA0000320862190001162
Figure BPA0000320862190001171
Figure BPA0000320862190001181
表2.b1
Figure BPA0000320862190001182
Figure BPA0000320862190001191
表2.b2
Figure BPA0000320862190001192
Figure BPA0000320862190001201
Figure BPA0000320862190001211
表2.b3
Figure BPA0000320862190001212
Figure BPA0000320862190001221
表2.b4
Figure BPA0000320862190001222
Figure BPA0000320862190001231
Figure BPA0000320862190001241
表2.b5
Figure BPA0000320862190001242
Figure BPA0000320862190001251
表2.b6
Figure BPA0000320862190001252
Figure BPA0000320862190001261
Figure BPA0000320862190001271
Figure BPA0000320862190001281
表2.b7
Figure BPA0000320862190001282
Figure BPA0000320862190001291
表2.b8
Figure BPA0000320862190001292
Figure BPA0000320862190001301
表2.b9
Figure BPA0000320862190001311
Figure BPA0000320862190001321
Figure BPA0000320862190001331
表3.a1
Figure BPA0000320862190001332
Figure BPA0000320862190001341
Figure BPA0000320862190001351
表3.a2
Figure BPA0000320862190001352
Figure BPA0000320862190001361
Figure BPA0000320862190001371
表3.a3
Figure BPA0000320862190001372
Figure BPA0000320862190001381
Figure BPA0000320862190001391
Figure BPA0000320862190001401
Figure BPA0000320862190001411
表3.a4
Figure BPA0000320862190001412
Figure BPA0000320862190001421
Figure BPA0000320862190001431
表3.a5
Figure BPA0000320862190001432
Figure BPA0000320862190001441
Figure BPA0000320862190001451
表3.a6
Figure BPA0000320862190001452
Figure BPA0000320862190001461
Figure BPA0000320862190001471
Figure BPA0000320862190001481
表3.a7
Figure BPA0000320862190001482
Figure BPA0000320862190001491
Figure BPA0000320862190001501
表3.a8
Figure BPA0000320862190001502
Figure BPA0000320862190001511
Figure BPA0000320862190001521
表3.a9
Figure BPA0000320862190001522
Figure BPA0000320862190001531
Figure BPA0000320862190001541
Figure BPA0000320862190001551
表3.b1
Figure BPA0000320862190001552
Figure BPA0000320862190001561
Figure BPA0000320862190001571
表3.b2
Figure BPA0000320862190001572
Figure BPA0000320862190001581
Figure BPA0000320862190001591
Table 3.b3
Figure BPA0000320862190001601
Figure BPA0000320862190001611
表3.b4
Figure BPA0000320862190001612
Figure BPA0000320862190001621
Figure BPA0000320862190001631
表3.b5
Figure BPA0000320862190001632
Figure BPA0000320862190001641
Figure BPA0000320862190001651
表3.b6
Figure BPA0000320862190001652
Figure BPA0000320862190001661
Figure BPA0000320862190001671
Figure BPA0000320862190001681
Figure BPA0000320862190001691
表3.b7
Figure BPA0000320862190001692
Figure BPA0000320862190001701
表3.b8
Figure BPA0000320862190001711
Figure BPA0000320862190001721
Figure BPA0000320862190001731
表3.b9
Figure BPA0000320862190001732
Figure BPA0000320862190001741
Figure BPA0000320862190001751
表3.c1
Figure BPA0000320862190001752
Figure BPA0000320862190001761
Figure BPA0000320862190001771
表3.c2
Figure BPA0000320862190001772
Figure BPA0000320862190001781
Figure BPA0000320862190001791
表3.c3
Figure BPA0000320862190001792
Figure BPA0000320862190001801
Figure BPA0000320862190001811
表3.c4
Figure BPA0000320862190001812
Figure BPA0000320862190001821
Figure BPA0000320862190001831
表3.c5
Figure BPA0000320862190001832
Figure BPA0000320862190001841
Figure BPA0000320862190001851
表3.c6
Figure BPA0000320862190001852
Figure BPA0000320862190001861
Figure BPA0000320862190001871
Figure BPA0000320862190001881
表3.c7
Figure BPA0000320862190001882
Figure BPA0000320862190001891
Figure BPA0000320862190001901
表3.c8
Figure BPA0000320862190001902
Figure BPA0000320862190001911
Figure BPA0000320862190001921
表3.c9
Figure BPA0000320862190001922
Figure BPA0000320862190001931
Figure BPA0000320862190001941
表3.d1
Figure BPA0000320862190001942
Figure BPA0000320862190001951
Figure BPA0000320862190001961
表3.d2
Figure BPA0000320862190001962
Figure BPA0000320862190001971
Figure BPA0000320862190001981
表3.d3
Figure BPA0000320862190001991
Figure BPA0000320862190002001
表3.d4
Figure BPA0000320862190002002
Figure BPA0000320862190002011
Figure BPA0000320862190002021
表3.d5
Figure BPA0000320862190002022
Figure BPA0000320862190002031
Figure BPA0000320862190002041
表3.d6
Figure BPA0000320862190002042
Figure BPA0000320862190002051
Figure BPA0000320862190002061
Figure BPA0000320862190002071
表3.d7
Figure BPA0000320862190002072
Figure BPA0000320862190002081
Figure BPA0000320862190002091
表3.d8
Figure BPA0000320862190002092
Figure BPA0000320862190002101
Figure BPA0000320862190002111
表3.d9
Figure BPA0000320862190002112
Figure BPA0000320862190002121
Figure BPA0000320862190002131
Figure BPA0000320862190002141
表4.a1
Figure BPA0000320862190002142
Figure BPA0000320862190002151
Figure BPA0000320862190002161
表4.a2
Figure BPA0000320862190002162
Figure BPA0000320862190002171
Figure BPA0000320862190002181
表4.a3
Figure BPA0000320862190002182
Figure BPA0000320862190002191
Figure BPA0000320862190002201
表4.a4
Figure BPA0000320862190002202
Figure BPA0000320862190002211
Figure BPA0000320862190002221
表4.a5
Figure BPA0000320862190002222
Figure BPA0000320862190002231
Figure BPA0000320862190002241
表4.a6
Figure BPA0000320862190002242
Figure BPA0000320862190002251
Figure BPA0000320862190002261
Figure BPA0000320862190002271
Figure BPA0000320862190002281
表4.a7
Figure BPA0000320862190002282
Figure BPA0000320862190002291
Figure BPA0000320862190002301
表4.a8
Figure BPA0000320862190002302
Figure BPA0000320862190002311
Figure BPA0000320862190002321
表4.a9
Figure BPA0000320862190002322
Figure BPA0000320862190002331
Figure BPA0000320862190002341
Figure BPA0000320862190002351
表4.b1
Figure BPA0000320862190002352
Figure BPA0000320862190002361
Figure BPA0000320862190002371
表4.b2
Figure BPA0000320862190002372
Figure BPA0000320862190002381
Figure BPA0000320862190002391
表4.b3
Figure BPA0000320862190002401
Figure BPA0000320862190002411
Figure BPA0000320862190002421
表4.b4
Figure BPA0000320862190002422
Figure BPA0000320862190002431
Figure BPA0000320862190002441
表4.b5
Figure BPA0000320862190002442
Figure BPA0000320862190002451
Figure BPA0000320862190002461
表4.b6
Figure BPA0000320862190002462
Figure BPA0000320862190002471
Figure BPA0000320862190002481
Figure BPA0000320862190002491
表4.b7
Figure BPA0000320862190002501
Figure BPA0000320862190002511
表4.b8
Figure BPA0000320862190002521
Figure BPA0000320862190002531
Figure BPA0000320862190002541
表4.b9
Figure BPA0000320862190002542
Figure BPA0000320862190002551
Figure BPA0000320862190002561
表5.a1
Figure BPA0000320862190002571
Figure BPA0000320862190002581
表5.a2
Figure BPA0000320862190002582
Figure BPA0000320862190002591
Figure BPA0000320862190002601
表5.b1
Figure BPA0000320862190002611
Figure BPA0000320862190002621
Figure BPA0000320862190002631
表5.b2
Figure BPA0000320862190002632
Figure BPA0000320862190002641
Figure BPA0000320862190002651
表5.c1
Figure BPA0000320862190002652
Figure BPA0000320862190002661
Figure BPA0000320862190002671
表5.c2
Figure BPA0000320862190002672
Figure BPA0000320862190002681
Figure BPA0000320862190002691
表5.d1
Figure BPA0000320862190002701
Figure BPA0000320862190002711
表5.d2
Figure BPA0000320862190002712
Figure BPA0000320862190002721
Figure BPA0000320862190002731
表6.a1
Figure BPA0000320862190002741
Figure BPA0000320862190002751
Figure BPA0000320862190002761
表6.a2
Figure BPA0000320862190002762
Figure BPA0000320862190002771
Figure BPA0000320862190002781
表6.b1
Figure BPA0000320862190002791
Figure BPA0000320862190002801
Figure BPA0000320862190002811
表6.b2
Figure BPA0000320862190002812
Figure BPA0000320862190002821
Figure BPA0000320862190002831
表6.c1
Figure BPA0000320862190002841
Figure BPA0000320862190002851
Figure BPA0000320862190002861
表6.c2
Figure BPA0000320862190002862
Figure BPA0000320862190002871
Figure BPA0000320862190002881
表6.d1
Figure BPA0000320862190002882
Figure BPA0000320862190002891
Figure BPA0000320862190002901
表6.d2
Figure BPA0000320862190002902
Figure BPA0000320862190002911
Figure BPA0000320862190002921
表7.a1
Figure BPA0000320862190002931
Figure BPA0000320862190002941
Figure BPA0000320862190002951
表7.a2
Figure BPA0000320862190002952
Figure BPA0000320862190002961
Figure BPA0000320862190002971
表7.b1
Figure BPA0000320862190002981
Figure BPA0000320862190002991
表7.b2
Figure BPA0000320862190002992
Figure BPA0000320862190003001
Figure BPA0000320862190003011
表7.c1
Figure BPA0000320862190003021
Figure BPA0000320862190003031
Figure BPA0000320862190003041
表7.c2
Figure BPA0000320862190003042
Figure BPA0000320862190003051
Figure BPA0000320862190003061
表7.d1
Figure BPA0000320862190003071
Figure BPA0000320862190003081
Figure BPA0000320862190003091
表7.d2
Figure BPA0000320862190003092
Figure BPA0000320862190003101
Figure BPA0000320862190003111
表7.e1
Figure BPA0000320862190003112
Figure BPA0000320862190003121
Figure BPA0000320862190003131
表7.e2
Figure BPA0000320862190003141
表8.1a
Figure BPA0000320862190003151
Figure BPA0000320862190003161
表8.1b
Figure BPA0000320862190003162
Figure BPA0000320862190003171
表8.1c
Figure BPA0000320862190003172
Figure BPA0000320862190003181
表8.1d
Figure BPA0000320862190003182
Figure BPA0000320862190003191
表8.1e
Figure BPA0000320862190003192
Figure BPA0000320862190003201
表8.1f
Figure BPA0000320862190003202
Figure BPA0000320862190003211
表8.1g
Figure BPA0000320862190003212
Figure BPA0000320862190003221
表8.1h
Figure BPA0000320862190003222
Figure BPA0000320862190003231
表8.2a
Figure BPA0000320862190003232
Figure BPA0000320862190003241
表8.2b
Figure BPA0000320862190003242
Figure BPA0000320862190003251
表8.2c
Figure BPA0000320862190003252
Figure BPA0000320862190003261
表8.2d
Figure BPA0000320862190003262
Figure BPA0000320862190003271
表8.2e
Figure BPA0000320862190003272
Figure BPA0000320862190003281
表8.2f
Figure BPA0000320862190003282
Figure BPA0000320862190003291
表8.2g
Figure BPA0000320862190003292
Figure BPA0000320862190003301
表8.2h
Figure BPA0000320862190003302
Figure BPA0000320862190003311
表8.3a
Figure BPA0000320862190003312
Figure BPA0000320862190003321
表8.3b
Figure BPA0000320862190003322
Figure BPA0000320862190003331
表8.3c
Figure BPA0000320862190003332
Figure BPA0000320862190003341
表8.3d
Figure BPA0000320862190003342
Figure BPA0000320862190003351
表8.3e
Figure BPA0000320862190003361
表8.3f
Figure BPA0000320862190003371
Figure BPA0000320862190003381
表8.3g
Figure BPA0000320862190003382
Figure BPA0000320862190003391
表8.3h
Figure BPA0000320862190003392
表8.4a
Figure BPA0000320862190003393
Figure BPA0000320862190003401
表8.4b
Figure BPA0000320862190003402
表8.4c
Figure BPA0000320862190003403
Figure BPA0000320862190003411
表8.4d
Figure BPA0000320862190003412
Figure BPA0000320862190003421
表8.4e
Figure BPA0000320862190003422
表8.4f
Figure BPA0000320862190003423
Figure BPA0000320862190003431
表8.4g
Figure BPA0000320862190003432
Figure BPA0000320862190003441
表8.4h
Figure BPA0000320862190003442
Figure BPA0000320862190003451
表9.1a
Figure BPA0000320862190003452
Figure BPA0000320862190003461
表9.1b
Figure BPA0000320862190003462
Figure BPA0000320862190003471
表9.1c
Figure BPA0000320862190003472
Figure BPA0000320862190003481
表9.1d
Figure BPA0000320862190003482
Figure BPA0000320862190003491
表9.1e
Figure BPA0000320862190003492
Figure BPA0000320862190003501
表9.1f
Figure BPA0000320862190003502
Figure BPA0000320862190003511
表9.1g
Figure BPA0000320862190003512
Figure BPA0000320862190003521
表9.1h
Figure BPA0000320862190003522
Figure BPA0000320862190003531
表9.2a
Figure BPA0000320862190003532
Figure BPA0000320862190003541
表9.2b
Figure BPA0000320862190003542
Figure BPA0000320862190003551
表9.2c
Figure BPA0000320862190003552
Figure BPA0000320862190003561
表9.2d
Figure BPA0000320862190003562
Figure BPA0000320862190003571
表9.2e
Figure BPA0000320862190003572
Figure BPA0000320862190003581
表9.2f
Figure BPA0000320862190003582
Figure BPA0000320862190003591
表9.2g
Figure BPA0000320862190003601
表9.2h
Figure BPA0000320862190003611
Figure BPA0000320862190003621
表9.3a
Figure BPA0000320862190003622
Figure BPA0000320862190003631
表9.3b
Figure BPA0000320862190003632
Figure BPA0000320862190003641
表9.3c
Figure BPA0000320862190003642
Figure BPA0000320862190003651
表9.3d
Figure BPA0000320862190003652
Figure BPA0000320862190003661
表9.3e
Figure BPA0000320862190003662
Figure BPA0000320862190003671
表9.3f
Figure BPA0000320862190003672
Figure BPA0000320862190003681
表9.3g
Figure BPA0000320862190003682
Figure BPA0000320862190003691
表9.3h
Figure BPA0000320862190003692
表9.4a
Figure BPA0000320862190003701
表9.4b
Figure BPA0000320862190003702
Figure BPA0000320862190003711
表9.4c
Figure BPA0000320862190003712
表9.4d
Figure BPA0000320862190003713
Figure BPA0000320862190003721
表9.4e
Figure BPA0000320862190003722
Figure BPA0000320862190003731
表9.4f
Figure BPA0000320862190003732
表9.4g
Figure BPA0000320862190003733
Figure BPA0000320862190003741
表9.4h
Figure BPA0000320862190003742
表10.a
Figure BPA0000320862190003743
Figure BPA0000320862190003751
表10.b。

Claims (13)

1.一种用于检测代表群体中的亚群的染色体状态的方法,所述方法包括确定在基因组的限定区域内是否存在与所述染色体状态相关的染色体相互作用;以及
-其中所述染色体相互作用任选地已通过包括以下步骤的确定哪些染色体相互作用与对应于所述群体的所述亚群的染色体状态相关的方法进行了鉴定:将来自具有不同状态的染色体的亚群的第一组核酸与第二组索引核酸接触,并且允许互补序列杂交,其中所述第一组核酸和第二组核酸中的核酸代表连接产物,所述连接产物包括来自在染色体相互作用中已聚集在一起的两个染色体区域的序列,并且其中所述第一组核酸和所述第二组核酸之间的杂交模式允许确定哪些染色体相互作用对所述亚群是特异性的;以及
-其中所述亚群与自闭症谱系障碍(ASD)的预后有关,并且所述染色体相互作用:
(i)存在于表1至表4中任一个所列出的任一区域或基因中;和/或
(ii)对应于表1至表4中任一个所示的任何探针所代表的任一染色体相互作用,和/或
(iii)存在于包括(i)或(ii)或位于(i)或(ii)侧面的4000碱基区域中。
2.根据权利要求1所述的方法,其中对如下列表中所示的至少10个染色体相互作用进行分型:
-表1,或
-表2,或
-表3,或
-表4。
3.根据权利要求1或2所述的方法,其中对如表8、表9或表10所示的至少1个、5个、8个或10个染色体相互作用进行分型。
4.根据前述权利要求中任一项所述的方法,其中对如表10所示的至少1个、5个、8个、10个、15个或20个染色体相互作用进行分型。
5.根据前述权利要求中任一项所述的方法,其中对所述染色体相互作用进行分型:
-在来自个体的样本中,和/或
-通过检测在所述染色体相互作用位点是否存在DNA环,和/或
-检测在染色体构象中是否存在聚集在一起的染色体末端区域,和/或
-通过检测在所述分型过程中产生的连接核酸的存在,并且所述连接核酸的序列包括两个区域,每个区域对应于在所述染色体相互作用中聚集在一起的染色体区域,其中优选地对所述连接核酸的检测是通过与表1、表2、表3或表4中任一个中提及的任何特异性探针序列具有至少70%一致性的探针,和/或(ii)通过与表1、表2、表3或表4中的任何引物对具有至少70%一致性的引物对。
6.根据前述权利要求中任一项所述的方法,其中所述染色体相互作用的检测是通过包括以下步骤的方法进行的:-
(i)将已在染色体相互作用中聚集在一起的染色体区域进行交联;
(ii)对所述交联区域进行切割,任选地通过用酶进行限制性消化酶切;以及
(iii)连接所述交联的切割的DNA末端以形成所述第一组核酸(特别包括连接DNA);
检测所述连接DNA是否存在。
7.根据前述权利要求中任一项所述的方法,实施所述方法以确定ASD的严重性或ASD的类型。
8.根据前述权利要求中任一项所述的方法,其中对特异于轻度ASD的至少1个、5个、8个、10个、15个或20个染色体相互作用进行分型。
9.根据前述权利要求中任一项所述的方法,其中对特异于重度ASD的至少1个、5个、8个、10个、15个或20个染色体相互作用进行分型。
10.根据前述权利要求中任一项所述的方法,其中所述分型或检测包括通过定量PCR(qPCR)对所述连接产物进行特定检测,所述定量PCR使用在所述PCR反应过程中能够扩增所述连接产物的引物和结合连接位点的探针,其中所述探针包括与在所述染色体相互作用中聚集在一起的每个所述染色体区域的序列互补的序列,其中优选地,所述探针包括:
与所述连接产物特异性结合的寡核苷酸,和/或
与所述寡核苷酸5′末端共价连接的荧光团,和/或
与所述寡核苷酸3′末端共价连接的猝灭剂,和
任选地,
所述荧光团选自HEX、德克萨斯红和FAM;和/或
所述探针包括长度为10个至40个核苷酸碱基的核酸序列,优选长度为20个至30个核苷酸碱基的核酸序列。
11.根据前述权利要求中任一项所述的方法,其中:
-在报告中提供所述方法的结果,和/或
-使用所述方法的结果选择患者治疗计划,并优选为所述个体选择具体的疗法。
12.根据前述权利要求中任一项所述的方法,其中所述个体已基于身体特征、风险因素或症状并且优选地基于具有以下的症状或所述症状的风险因素进行了预选:自闭症、儿童自闭症、阿斯伯格综合征、PDD-NOS(广泛性发育障碍)、儿童崩解症或成瘾。
13.一种用于在个体中治疗ASD的方法中之用途的治疗剂,所述个体已通过根据前述权利要求中任一项所述的方法被鉴定为需要所述治疗剂的个体。
CN202080078196.XA 2019-09-11 2020-09-10 诊断用染色体标志物 Pending CN114787380A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201962898969P 2019-09-11 2019-09-11
US62/898,969 2019-09-11
PCT/GB2020/052171 WO2021048544A1 (en) 2019-09-11 2020-09-10 Diagnostic chromosome marker

Publications (1)

Publication Number Publication Date
CN114787380A true CN114787380A (zh) 2022-07-22

Family

ID=72521653

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202080078196.XA Pending CN114787380A (zh) 2019-09-11 2020-09-10 诊断用染色体标志物

Country Status (12)

Country Link
US (1) US20220333199A1 (zh)
EP (1) EP4028547A1 (zh)
JP (1) JP2022548249A (zh)
KR (1) KR20220058616A (zh)
CN (1) CN114787380A (zh)
AU (1) AU2020344206B2 (zh)
CA (1) CA3152645A1 (zh)
GB (1) GB2604247A (zh)
IL (1) IL291194A (zh)
TW (1) TW202124726A (zh)
WO (1) WO2021048544A1 (zh)
ZA (1) ZA202202930B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113984482B (zh) * 2021-12-24 2022-03-15 北京仁基源医学研究院有限公司 一种用于制备超高分辨染色体的复合试剂及其应用方法

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108377651A (zh) * 2015-06-24 2018-08-07 牛津生物动力有限公司 染色体互相作用的检测
CA3047888A1 (en) * 2016-12-23 2018-06-28 Oxford Biodynamics Limited Method for typing epigenetic chromosome interactions
US20200407790A1 (en) * 2017-10-02 2020-12-31 Oxford Biodynamics Limited Biomarker
JP2021501592A (ja) * 2017-11-03 2021-01-21 オックスフォード バイオダイナミックス リミテッド 遺伝子調節

Also Published As

Publication number Publication date
US20220333199A1 (en) 2022-10-20
AU2020344206A1 (en) 2022-04-07
WO2021048544A9 (en) 2022-11-10
AU2020344206B2 (en) 2022-08-25
KR20220058616A (ko) 2022-05-09
WO2021048544A1 (en) 2021-03-18
JP2022548249A (ja) 2022-11-17
GB202204550D0 (en) 2022-05-11
TW202124726A (zh) 2021-07-01
ZA202202930B (en) 2023-07-26
EP4028547A1 (en) 2022-07-20
CA3152645A1 (en) 2021-03-18
IL291194A (en) 2022-05-01
AU2020344206A8 (en) 2022-08-25
GB2604247A (en) 2022-08-31

Similar Documents

Publication Publication Date Title
CN109661477B (zh) 与乳腺癌相关的染色体相互作用的检测
CN111344415B (zh) 生物标志物
JP2023082157A (ja) 遺伝子調節
CN111411150A (zh) 诊断肌少症的肠道菌群及其应用
CN114787380A (zh) 诊断用染色体标志物
AU2022206099B2 (en) Chromosome interactions
CN113366121A (zh) 染色体生物标志物
CN110225981B (zh) 分型方法
AU2021283746B2 (en) Detecting a chromosome conformation as marker for fibrosis, e.g. scleroderma
AU2021360263B2 (en) Disease marker
CN117203350A (zh) 染色体相互作用
JPWO2019069067A5 (zh)
KR20240006020A (ko) 염색체 상호작용 마커
CN117795098A (zh) 染色体相互作用标志物

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40076364

Country of ref document: HK