CN117203350A - 染色体相互作用 - Google Patents

染色体相互作用 Download PDF

Info

Publication number
CN117203350A
CN117203350A CN202280017694.2A CN202280017694A CN117203350A CN 117203350 A CN117203350 A CN 117203350A CN 202280017694 A CN202280017694 A CN 202280017694A CN 117203350 A CN117203350 A CN 117203350A
Authority
CN
China
Prior art keywords
chromosomal
interactions
markers
sequence
probe
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202280017694.2A
Other languages
English (en)
Inventor
A·S·拉马达斯
E·亨特
A·阿库利切夫
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oxford Biodynamics PLC
Original Assignee
Oxford Biodynamics PLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oxford Biodynamics PLC filed Critical Oxford Biodynamics PLC
Priority claimed from PCT/GB2022/050009 external-priority patent/WO2022148957A1/en
Publication of CN117203350A publication Critical patent/CN117203350A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

一种分析与冠状病毒感染相关的染色体相互作用的方法。

Description

染色体相互作用
技术领域
本发明涉及感染性疾病过程。
背景技术
冠状病毒是在哺乳动物和鸟类中引起疾病的一组相关RNA病毒。在人类和鸟类中,它们会引起从轻微到致命的呼吸道感染。人类的轻微疾病包括一些普通感冒病例,但也有更致命的疾病,如Covid-19。
发明内容
本发明人已经鉴定出了与冠状病毒感染预后特别是与Covid-19感染预后相关的染色体构象特征。这样就可以对患者进行分类(stratification),以便预先预后性地鉴定当暴露于冠状病毒特别是Covid-19时将发展为严重恶化而导致需要ICU(重症监护病房)支持的高风险个体。将患者送入ICU的决定很大程度上基于患者的个人情况,并且通常在有明显的对临床护理标准不响应的并发症的临床表现时进行。冠状病毒并发症的所有广泛的表现均与过度炎症和针对各个器官的免疫过度反应有关。由发明人分析的稳定的3D基因组系统谱携带强有力的预后信息,能在结果显现出来之前将无症状、轻症(mild)和重症(ICU)结果与持久的冠状病毒感染区分开来。
因此,本发明提供了一种在个体中检测冠状病毒感染预后的方法,其包括确定由表1或表3中所示探针所代表的一个或多个染色体相互作用的存在与否,从而确定所述个体中的所述预后。本发明还提供了在个体中检测冠状病毒感染预后的方法,其包括确定由表7所示探针所代表的一个或多个染色体相互作用的存在与否,从而确定所述个体中的所述预后。本发明还提供了一种在个体中检测冠状病毒感染预后的方法,其包括确定由表8、表9、表10和表11中任一表所示探针所代表的一个或多个染色体相互作用的存在与否,从而确定所述个体中的所述预后。
本发明提供了一种在个体中确定冠状病毒感染预后的方法,其包括确定由表14、表15、表6和表17中任一表所示的探针所代表的一个或多个染色体相互作用的存在与否,从而确定所述个体中的所述预后。
本发明还提供了一种在个体中检测脓毒症的存在或易感性的方法,其包括确定由表12或表13所示探针所代表的一个或多个染色体相互作用的存在与否。
优选地,实施所述方法以选择接受疗法或治疗的个体。所述方法可以对例如基于身体特征、风险因素或症状的存在而预先选定的个体实施。
附图说明
图1显示了用于实施本发明的标志物检测步骤的优选方法。
图2显示了白细胞谱系。
图3显示了研究的设计。
图4显示了无症状(正方形)、轻症(三角形)和ICU(重症)(圆形)的38名患者(来自3个队列)的PCA。
图5显示了仅针对轻症和(圆形)ICU(方形)的PCA。
图6显示了分析流程(pipeline)。
图7显示了ICU和轻症的20个标志性基因集合(Hallmark GeneSet)。中间一列代表ICU和轻症共有的基因集合。右下方的四个基因集合表示与ICU患者相关的免疫过程。这20个基因集合是根据排在前列(top)的EpiSwitch标志物鉴定出的,并且基因集合描述了它们在基因位置的定位。
图8显示了ICU与轻症的BioCarta通路。共有基因集合显示在中间,最左侧的7个基因集合显示了与ICU相关的免疫过程。这种分析是基于排在前列的EpiSwitch标志物的基因组位置,以查看哪些重叠基因是哪些通路的一部分。
图9显示了ICU与轻症的前20个reactome通路。ICU右侧的7个基因集合与免疫过程相关。免疫和血管紧张素过程显示在轻症中。在该分析中,将EpiSwitch位置与reactome数据库中描述的相同基因组位置进行比较。
图10显示了与免疫过程相关的轻症的前100个显著标志物。这不是二维PCA,而是一种类似的一维标准线性判别分析(对于三种临床结果/表型,所有的复杂度简化为一个线性分数)。它是基于这前100个显著标志物产生的,所述标志物仅存在于轻症病例中,而不存在于无症状或重症ICU中,并且在它们的位置上与基因组中的免疫遗传基因座重叠(因此称为免疫EpiSwitch标志物)。该分析包括80名患者:除来自英国(1)和美国(2)的三个队列,还有来自秘鲁利马的42名患者,所有这些患者都是在利马成为Covid-19死亡率最高的地点时募集的。图表的顶部在页面的左侧。顶部的圆圈集合是重症(页面的左下方)。中间的圆圈集合是重症(页面顶部)。底部的圆圈集合是无症状(在页面的中间右侧)。
图11显示了图10的标志物的基因组视图。
图12显示了与免疫过程相关的ICU的前100个显著标志物,表明ICU是一种独特的表型。该分析以与图10相同的方式进行,除了使用的排在前列的标志物都具有统计学显著性,并且存在于ICU(重症)患者组中,而不存在于轻症或无症状患者组中。这表明,基于ICU结果特有的并且在采血和首次Covid-19检测时先于并发症出现的排在前列的标志物,人们可以预后性地鉴定和区分存在于重症结果中的特征(profile),作为3D基因组学中与独特的临床结果相关的独特表型。图表的顶部在页面的左边。顶部的圆圈集合是重症(页面的左上角)。中间的圆圈集合是轻症(从页面底部数第二组圆圈)。底部的圆圈集合是无症状的(在页面的右下方)。
图13显示了图12的标志物的基因组视图。
图14涉及如何选择与免疫过程相关的前50个ICU标志物以用于LDA分析和分类统计。使用30个训练样本集合来选择标志物,然后将标志物用于对12个测试集合进行分类。
图15显示了使用以前50个标志物富集的遗传位置的通路富集。
图16显示了使用以前50个标志物富集的遗传位置的化合物富集。
图17显示了使用前50个标志物的30个训练集合的LDA图。页面的左侧是图表的顶部。顶部的三角形是重症(页面的左上角)。底部的圆圈是轻症(页面的右下方)。
图18显示了采用12个测试集合的30个训练集合的LDA图。
图19显示了来自利马队列的42名患者通过LDA的患者判定(call)以及通过LDA判定的预后分类的效力。
图20显示了一个标准的STRING网络分析-功能蛋白质关联网络,其中具有ICU/重症COVID相关的EpiSwitch显著标志物的免疫基因被叠加到已知的相互作用网络上。它与已知的网络非常匹配,并通过EpiSwitch失调基因(deregulated gene)的显示了调控网络的高度连接部分。不需要添加EpiSwitch列表之外的额外节点形式来完成网络。表5显示了涉及的关键基因的名称,并提供了其他数据。
图21显示了如何解释表6。
图22显示了通过分析本研究中发现的标志物而鉴定的与Covid感染和脓毒症相关的通路。特别是涉及了PSMA5,并且HG38_1_109341939_109348573_109359719_109366704_RR(OBD183_q481.q483)是共有标志物。PSMA5、CD3D和CD3G是与抗原加工-交叉呈递相关的通路中的匹配基因,KLRG1、CD3D和CD3G是与淋巴细胞和非淋巴细胞之间的免疫调节相互作用相关的通路中的匹配基因。
具体实施方式
本文使用的术语
本发明的方法在本文中可被称为本发明的“过程/方法(process)”。
分型的染色体相互作用在本文中可被称为“标志物”、“CCS”、“染色体构象特征”、“表观遗传相互作用”或“EpiSwitch标志物”。
“分型(type)”一词将根据上下文来解释,但通常是指检测特定染色体相互作用是否存在。
与本发明相关的表观遗传相互作用
在本发明中的分型的染色体相互作用通常是染色体远端区域之间的相互作用,所述相互作用是动态的,并且根据染色体区域的状态而改变、形成或破坏。该状态将反映冠状病毒感染的不同方面,因此可以实施本发明来检测对感染的预后,特别是检测对重症疾病的易感性(其特征可以是例如本文提及的免疫反应的任何有害作用)。
例如,染色体相互作用可以反映它是否被转录或阻遏。对本文定义的冠状病毒感染亚组特异的染色体相互作用已被发现是稳定的,因此提供了测量两个亚组之间差异(例如反映感染的不同结果)的可靠方法。
对冠状病毒感染特异的染色体相互作用通常发生在疾病过程的早期,例如与其他表观遗传标志物如甲基化或与组蛋白结合的变化相比。因此,本发明的方法能够在早期检测疾病。这使得早期干预(例如治疗)成为可能,因此也更加有效。染色体相互作用也反映了个体的当前状态,因此可用于评估疾病状态的变化。此外,同一亚组内的个体之间的相关染色体相互作用几乎没有变化。由于每个基因都有多达50种不同的可能相互作用,检测染色体相互作用提供了非常有用的信息,因此本发明的方法可以例如查询500,000种可能的不同相互作用。
染色体相互作用可重叠并包括被证明编码相关基因或未描述基因的染色体区域,但同样可位于基因间区。还应该注意的是,发明人已经发现所有区域中的染色体相互作用在确定染色体基因座的状态方面同等重要。
本发明中检测到的染色体相互作用可受潜在DNA序列的变化、环境因素、DNA甲基化、非编码反义RNA转录物、非诱变致癌物、组蛋白修饰、染色质重塑和特定的局部DNA相互作用影响。然而,必须记住的是,本文所定义的染色体相互作用本身就是一种调节方式,与任何遗传标志物(DNA序列变化)或任何其他表观遗传标志物没有一一对应关系。
在本发明的方法中检测的染色体相互作用可以位于表中定义的任何基因、染色体区域中,或者在本文所示的任何通路中(例如在这种通路中的任何基因中)。
染色体相互作用可受潜在核酸序列的变化影响,所述潜在核酸序列的变化本身并不直接影响基因产物或基因表达模式。所述变化可以是例如基因内和/或基因外的SNP,基因间DNA、microRNA和非编码RNA的基因融合和/或基因缺失。例如,已知约20%的SNP位于非编码区域,因此所述方法在非编码情况下也能提供有用信息。在一方面,聚集在一起形成相互作用的染色体区域在同一染色体上相距小于5kb、3kb、1kb、500个碱基对或200个碱基对。
检测到的染色体相互作用可以在基因例如本文提到的任何基因内。然而,它也可以位于所述基因的上游或下游,例如位于所述基因或所述编码序列的上游或下游最高达50,000、最高达30,000、最高达20,000、最高达10,000或最高达5000个碱基处。
本发明的方法
本发明的方法包括用于检测与冠状病毒感染预后相关的染色体相互作用的分型系统。可以使用任何合适的分型方法,例如检测相互作用中染色体的接近度的方法。所述分型方法可以使用本文提到的EpiSwitchTM系统进行,所述方法例如可以通过包括以下步骤的方法进行(例如对来自受试者的样本):
(i)对在染色体相互作用中聚集在一起的染色体区域进行交联,
(ii)任选地从所述染色体基因座分离交联的DNA,
(iii)对交联的DNA进行切割,和
(iv)连接存在于交联实体中的核酸,以获得具有来自形成染色体相互作用的两个区域的序列的连接核酸。
检测该连接核酸可以用于确定具体染色体相互作用的存在与否。因此,连接核酸充当了存在染色体相互作用的标志物。优选地,通过PCR或基于探针的方法(包括qPCR方法)来检测连接核酸。
在该方法中,染色体可以通过任何合适的方式进行交联,例如通过通常是化合物的交联剂来进行交联。在一个优选的方面,相互作用使用甲醛进行交联,但也可以使用任何醛或D-生物素基-e-氨基己酸-N-羟基琥珀酰亚胺酯或地高辛-3-O-甲基羰基-e-氨基己酸-N-羟基琥珀酰亚胺酯进行交联。低聚甲醛可以交联相距4埃的DNA链。优选地,染色体相互作用在同一染色体上。典型地,染色体相互作用相距2埃至10埃。
优选地,交联在体外进行。切割优选通过用酶如TaqI进行限制性消化来进行。连接可以形成DNA环。
当将PCR(聚合酶链式反应)用于检测或鉴定连接核酸时,产生的PCR产物的大小可以指示存在的特定染色体相互作用,并因此可以用于鉴定基因座的状态。在优选的方面,使用本文任何表中所示的引物,例如使用表1或表3中所示的引物对(对应于被检测的染色体相互作用)。在其它优选的方面,使用表8、表9、表10、表11、表12、表13、表14、表15、表16或表17中所示的引物(对应于被检测的染色体相互作用)。也可以使用这种引物或引物对的同源物,所述同源物可以与原始序列具有至少70%的一致性。
当将探针用于检测或鉴定连接核酸时,这通常是通过探针和连接核酸之间的基于沃森-克里克的碱基配对来实现的。可以使用本文任何表中所示的探针序列,例如表1或表3中所示的探针序列(对应于被检测的染色体相互作用)。可以使用表8、表9、表10、表11、表12、表13和表14中所示的探针序列(对应于被检测的染色体相互作用)。也可以使用这些探针序列的同源物,所述同源物可以与原始序列具有至少70%的一致性。
根据本发明方法的分型可以在多个时间点进行,例如以监测疾病的进展。这可以在一个或多个限定的时间点,例如在至少1、2、5、8或10个不同的时间点。至少1、2、5或8个时间点之间的持续时间可以是至少5、10、20、50、80或100天。通常有3个至少相距50天的时间点。
亚组和个性化治疗
如本文所用,“亚组”优选指群体亚组,更优选指具体生物体如具体真核生物、动物、鸟类或哺乳动物群体中的亚组。最优选地,“亚组”是指人类群体中的亚组。因此,优选实施本发明的方法来在真核生物如动物、哺乳动物或鸟类优选人类中检测冠状病毒感染的存在。可以实施本发明的方法以用于诊断或预后目的。
本发明包括检测和治疗群体中的具体亚组,这些亚组对冠状病毒感染的预后通常是不同的。发明人已经发现,相关群体中的子集(例如至少两个子集)之间的染色体相互作用是有差异的。鉴定这些差异将允许医生将他们的病人归类为所述群体中的一个子集的一部分。因此,本发明为医生提供了一种基于患者的表观遗传染色体相互作用为该患者提供个性化医疗的方法。这种测试可用于选择随后如何治疗患者,例如药物类型和/或药物剂量和/或药物施用频率。
被测试的个体
在本发明的方法中被测试的个体可以以某种方式例如基于风险因素或身体特征被选择。可以基于对给定疾病无症状、或处于该疾病的早期阶段、或具有该疾病的轻症形式来选择个体。
该个体可能对本文提及的任何病症易感和/或可能需要本文提及的任何疗法。该个体可以接受本文提及的任何疗法。特别是,所述个体可能患有或被怀疑患有冠状病毒感染。所述个体可能患有或被怀疑患有Covid-19病毒感染。因此,本发明包括对患者进行分型以确定冠状病毒预后的方法,这相当于确定他们所属的亚组。
所述个体可能具有以下特征中的一个或多个:
-接受过器官移植
-接受过针对癌症的化疗或抗体治疗,包括免疫疗法
-接受过针对肺癌的放射疗法的强化疗程(根治性放射疗法)
-接受过可影响免疫系统的靶向癌症治疗(如蛋白激酶抑制剂或PARP抑制剂)
-他们患有或曾经患有血癌或骨髓癌(如白血病、淋巴瘤或骨髓瘤)
-他们患有或曾经患有严重的肺部病症(如囊性纤维化、重度哮喘或重度COPD)
-高感染风险(如SCID或镰状细胞)
-他们正在服用使个人更容易感染的药物(如高剂量的类固醇或免疫抑制药物)
-他们怀孕了
-具有脾脏问题或脾脏已被切除(脾切除术)
-他们具有唐氏综合征
-正在透析或患有重度(5期)长期肾病
-根据临床判断和对其需求的评估,归类为临床上极其脆弱
-70岁或以上
-患有不严重的肺病(如哮喘、COPD、肺气肿或支气管炎)
-患有心脏病(如心力衰竭)
-患有糖尿病
-患有肝病(如肝炎)
-患有影响大脑或神经的病症(如帕金森氏病、运动神经元疾病、多发性硬化症或脑瘫)
-他们非常肥胖(例如BMI为40或以上)。
被确定的预后
本发明的方法优选确定对由冠状病毒引起的疾病的严重程度的预后,所述疾病优选由Covid-19引起。因此,所述方法可以确定个体是否具有重症疾病或轻症疾病的预后。所述方法可以确定个体是否具有将导致以下情况的重症疾病的预后:需要ICU治疗、细胞因子风暴(细胞因子释放综合征)、过度炎症或脓毒症。
本文提供的表格
表1、表2、表3和表4显示了可用于检测冠状病毒感染的特定标志物,即它们的存在或不存在可用于此类检测(即它们是“传播性(disseminating)”标志物)。表1和表2显示了存在于具有重症疾病预后的个体中的标志物。表3和表4显示了存在于具有轻症疾病预后的个体中的标志物。表2和表4分别是表1和表3中标志物的子集。可以使用来自表1至表4中任一表的标志物或通过使用来自超过一个的表的标志物例如使用来自表1和表3的标志物来实施本发明的方法。
表7显示了可用于检测冠状病毒感染预后的另一标志物集合。本发明的方法可以仅使用表7的标志物来实施,或者这些标志物可以与本文公开的其他标志物组合。
表8、表9、表10、表11、表12、表13和表14显示了可用于检测冠状病毒感染预后的其他标志物集合。本发明的方法可以仅使用表8、表9、表10、表11、表12、表13和表14中的任一表中的标志物来实施,或者这些标志物可以与本文公开的其它标志物组合。
表8包括与重症表型相关的标志物。在该表中,在LS列中有‘1’的标志物与重症表型相关。这些是待在本发明中使用的优选标志物。
表9显示了全都与重症表型相关的优选标志物。
表10包括与轻症表型相关的标志物。在LS列中有‘-1’的标志物与轻症表型相关。这些是待在本发明中使用的优选标志物。
表11显示了全都与轻症表型相关的优选标志物。
表12和表13显示了可用于确定脓毒症状态的标志物。表12中的结果与“S_SS”和“qPCR_ICU”相关。这27个标志物是ICU预后标志物,但它们在脓毒症患者相对于重症脓毒症患者的分析中也已经被发现是显著的和脓毒症特异性的。表13中的结果与“H_SS”和“qPCR_ICU”相关。这5个标志物是ICU预后标志物,当与健康人比较时,它们在重症脓毒症患者的分析中也是显著的和重症脓毒症特异性的。
表14和表15显示了优选的重症(ICU)疾病标志物,CCS列中的‘1’代表该表型。
表16和表17显示了优选的轻症疾病标志物,CCS列中的‘-1’代表该表型。
使用探针序列(所述探针序列检测本文限定的连接产物)限定标志物。前两个集合的起始-终止位置显示了探针位置,后两个集合的起始-终止位置显示了相关的4kb区域。可以参照所提供的起始-终止位置来限定标志物,因为它们将以与探针序列相同的方式唯一地鉴定标志物。
探针数据表中提供了以下信息:
RP–按照每个染色体相互作用评估的秩积统计量的秩和(Rsum)。
FC-相互作用频率(正或负)。
Pfp–估计的假阳性预测百分比(pfp),同时考虑阳性染色体相互作用和阴性染色体相互作用两者。
Pval-每个阳性CCS和阴性CCS的估计p值。
Adj.p值(FDR)-错误发现率调整后的p值
检出环-环存在的状态。
简单的基于置换(permutation)的估计被用于确定在随机实验中观察到给定RP值或更好的RP值的可能性。这包括以下步骤:
1.生成长度为n的k个排序列表的p个置换。
2.计算p个置换中n个CCS的秩积。
3.对在置换中CCS的秩积小于或等于观察到的秩积的次数进行计数(c)。将c设置为该值。
4.通过Erp(g)=c/p计算秩积的平均期望值。
5.假阳性的百分比的计算如下:pfp(g)=Erp(g)/秩(g),其中秩(g)是CCS g在按RP递增排序的所有n个CCS的列表中的秩。
秩积统计量根据每个微阵列中的强度对染色体相互作用进行排序,并计算多个微阵列中这些排序的乘积。这种技术可以鉴定出在许多复制的微阵列中最具差异性的染色体相互作用中一致检测出的染色体相互作用。当p值为0时,这表明样本中CCS的秩积变化很小,这是CCS的信噪比和效应大小的一个很好的示例。其中p值为0且pfp为0意味着置换的秩积与实际观察到的秩积没有不同。这些方法描述于Breitling R and Herzyk P(2005)Rank-based methods as a non-parametric alternative of the t-test for theanalysis of biological microarray data.JBioinfComp Biol 3,1171–1189。
FC表示在每次比较中标志物的出现率,2表示为平均测试的两倍,1.5表示为平均测试的1.5倍,以此类推,因此FC表示标志物对表型/组的权重。FC值可用于指示高度有效的测试需要多少标志物。各标志物(indiviudal markers)是预后的强有力指标,通常5至10个标志物将给出高度有效的测试,尽管较少数量的标志物将给出用于冠状病毒预后检测的功能测试。
探针被设计为距离Taq1位点30bp。在PCR的情况下,通常设计PCR引物以用于检测连接产物,但是它们距Taq1位点的位置不同。探针位置:
起始1-片段1上TaqI位点上游30个碱基
终止1-片段1上TaqI限制性位点
起始2-片段2上TaqI限制性位点
终止2-片段2上TaqI位点下游30个碱基
4kb序列位置:
起始1-片段1上TaqI位点上游4000个碱基
终止1-片段1上TaqI限制性位点
起始2-片段2上TaqI限制性位点
终止2-片段2上TaqI位点下游4000个碱基
表5涉及图20所示的网络分析,并显示了该网络中代表的String功能子网络,该子网络中关键基因的名称与EpiSwitch标志物相关。
表6提供了治疗性化合物的列表,具有与所述治疗性化合物相关的受影响基因集合(见基因数列),并且具有来自这些集合的与对重症疾病结果特异的EpiSwitch显著标志物相关的各基因(见随后的匹配基因数列)(它们都是免疫相关基因)。在该表中:
-基因总数列显示了受该治疗剂影响的基因,
-匹配基因列显示了与EpiSwitch标志物匹配的受影响基因的数量。
获得的高分证实了匹配基因的非随机选择,即受重症疾病患者中的3D基因组结构的影响。
表7显示了用于本发明的优选标志物集合以及优选的探针和PCR引物。与每个标志物的存在相关的特定预后显示在第一列中:“轻症”表示COVID疾病的临床表现(与无症状状况相反),其中患者甚至可能住院,但对标准护理有反应并保持稳定;“ICU”表示当住院患者对医院病房的标准护理没有反应并需要重症监护病房(ICU)支持时的重症情况。重症(ICU)的实例是过度炎症和需要机械通气。
表8显示了用于本发明的一个标志物集合。可以使用该表中的任何标志物。在该表中,在LS列中具有‘1’的优选标志物与重症表型相关,因此所有这些标志物代表标志物的优选子集,可以从中选择标志物用于本发明。
表9显示了与重症表型相关的标志物。该表还显示了优选的引物和探针序列。这些引物和探针可以以qPCR形式用于检测相关标志物。
表10显示了用于本发明的一个标志物集合。可以使用该表中的任何标志物。在该表中,LS列中具有‘-1’的优选标志物与轻症表型相关,因此所有这些标志物代表标志物的优选子集,可以从中选择标志物用于本发明。
表11显示了与轻症表型相关的标志物。该表还显示了优选的引物和探针序列。这些引物和探针可以以qPCR形式用于检测相关标志物。
表14和表16显示了优选的探针和引物序列,其可以任选地以qPCR形式使用。表15和表17显示了优选的引物序列,其可以任选地以嵌套PCR形式使用。
优选的标志物集合
本发明涉及通过对染色体相互作用标志物进行分型来检测冠状病毒感染预后,所述标志物是例如本文公开的任何特定标志物,例如表1或表3中的标志物,或标志物的优选组合,或本文公开的限定的特定区域中的标志物。可以对表中提及的基因和区域中存在的标志物进行分型。在本文中通过位置或通过探针和/或引物序列来限定特定标志物。因此,优选的标志物是由本文表格中公开的探针和/或引物对代表的那些标志物。
本发明涉及通过对染色体相互作用标志物进行分型来检测冠状病毒感染预后,所述标志物例如表8、表9、表10、表11、表14、表15、表16或表17中公开的任何特定标志物或这些表中任一表中的标志物的优选组合,或这些表中的任一表中公开的限定的特定区域中的标志物。
本发明涉及通过对染色体相互作用标志物进行分型来进一步检测冠状病毒感染期间的脓毒症状态,所述染色体相互作用标志物是例如表12或13中公开的任何特定标志物,或者来自这些表中的任一表中的标志物的优选组合。
可以用不同的方式限定标志物的组合,例如:
-通过以本文定义的任何参数进行排序,或
-通过表1或表3的任何“部分”,
-参考表格左列中列出的标志物“编号”。
在优选的方面,对来自表中提及的任何参数(例如FC)的前40个标志物中的至少10个标志物进行分型。
在一方面,对一个或多个标志物进行分型,所述一个或多个标志物:
(i)存在于表1或表3所列的任一区域;和/或
(ii)对应于表1或表3所示的任何探针所代表的任一染色体相互作用;和/或
(iii)存在于包括(i)或(ii)或位于(i)或(ii)侧面的4000个碱基的区域中。
在优选的方面:
-对来自表1的至少5个染色体相互作用进行分型,和/或
-对来自表3的至少5个染色体相互作用进行分型。
在另一个优选的方面,对选自以下相互作用的至少5个染色体相互作用进行分型:
-使用任何参数限定的表1中前40个相互作用,和/或
-使用任何参数限定的表3中前40个相互作用。
标志物的组合可以由表8、表9、表10、表11、表12、表13、表14、表15、表16或表17的任何“部分”所限定。
在优选的方面,对来自这些表中提及的任何参数(例如FC)的前40个标志物的至少10个标志物进行分型。
在一个方面,对一个或多个标志物进行分型,所述一个或多个标志物:
(i)存在于表8、表9、表10或表11所列的任一区域;和/或
(ii)对应于表8、表9、表10或表11所示的任何探针所代表的任一染色体相互作用;和/或
(iii)存在于包括(i)或(ii)或位于(i)或(ii)侧面的4000个碱基的区域中。
在优选的方面:
-对表9的至少5个染色体相互作用进行分型,和/或
-对表11的至少5个染色体相互作用进行分型。
在另一个优选的方面,对选自以下相互作用的至少5个染色体相互作用进行分型:
-使用任何参数限定的表8中前40个相互作用,和/或
-使用任何参数限定的表10中前40个相互作用。
待分型的标志物的优选数量
由于染色体相互作用的调节性质,包括它们的网络样特性,对本文公开的极少数量的标志物进行分型将导致有效的测试。标志物的不同数量和组合产生不同的性能特性。此外,可以理解的是,标志物可以选自整个表1或表3,或者选自由数字和字母(例如“a2”)限定的表的部分。类似地,标志物可以选自表8、表9、表10、表11、表14、表15、表16或表17的全部或部分。标志物也可以选自表12和表13的全部或部分。
在一方面,所述方法包括对表1中探针所代表的至少3、5、8、10、15、20、50、100、150、200、250或300个染色体相互作用进行分型。在一个实施方案中,对表1中探针所代表的至少10个染色体相互作用进行分型。
在一方面,所述方法包括对表2中探针所代表的至少3、5、8、10、15、20、25或30个染色体相互作用进行分型。在一个实施方案中,对表2中探针所代表的至少10个染色体相互作用进行分型。
在一方面,所述方法包括对表3中探针所代表的至少3、5、8、10、15、20、50、80、100、150或200个染色体相互作用进行分型。
在一方面,所述方法包括对表4中探针所代表的至少3、5、8或10个染色体相互作用进行分型。在一个实施方案中,对表4中探针所代表的至少10个染色体相互作用进行分型。
在一方面,对来自表1中使用任何参数限定的前40个标志物的至少3、5、8、10、15或20个染色体相互作用进行分型,和/或对来自表3中使用任何参数限定的前40个标志物的至少3、5、8、10、15或20个染色体相互作用进行分型。
在一方面,对表7的2、3、4、5或6个标志物进行分型。可以对表7的所有6个标志物进行分型。在另一方面,将表7中的所有6个标志物与表1中的至少3、5、8、10、15或20个染色体相互作用一起进行分型。在另一方面,将表7的所有6个标志物与来自表3的至少3、5、8、10、15或20个标志物一起进行分型。
在一方面,所述方法包括对表8中探针所代表的至少3、5、8、10、15、20、50、100、150、200、250或300个染色体相互作用进行分型。优选地,对表8中探针所代表的至少10个染色体相互作用进行分型。
在一方面,所述方法包括对表8中所示的在LS列中具有‘1’的至少3、5、8、10、15、20、50、100个或所有染色体相互作用进行分型。优选地,对表8所示的在LS列中具有‘1’的至少10个染色体相互作用进行分型。
在一方面,所述方法包括对表9中所示的至少3、5、8、10、15、20、30个或所有染色体相互作用进行分型。优选地,对表9中探针所代表的至少10个染色体相互作用进行分型。
在一方面,所述方法包括对表10中探针代表的至少3、5、8、10、15、20、50、100、150、200个或所有染色体相互作用进行分型。优选地,对表10中探针所代表的至少10个染色体相互作用进行分型。
在一方面,所述方法包括对表10中所示的在LS列中具有‘-1’的至少3、5、8、10、15、20、50、80个或所有染色体相互作用进行分型。优选地,对表10所示的在LS列中具有‘-1’的至少10个染色体相互作用进行分型。
在一方面,所述方法包括对表11所示的至少3、5、8、10个或所有染色体相互作用进行分型。优选地,对表11中探针所代表的至少10个染色体相互作用进行分型。
在一方面,所述方法包括对表12所示的至少3、5、8、10、20、25个或所有染色体相互作用进行分型。优选地,对表12中探针所代表的至少10个染色体相互作用进行分型。
在一方面,所述方法包括对表13所示的至少2、3或5个染色体相互作用进行分型。优选地,对表13中探针所代表的至少5个染色体相互作用进行分型。
在一方面,所述方法包括对表14中探针所代表的至少3、5、8、10、15、20、50、70个或所有染色体相互作用进行分型。优选地,对表14中探针所代表的至少10个染色体相互作用进行分型。
在一方面,所述方法包括对表15中探针所代表的至少3、5、8、10、15、20、50、100、120个或所有染色体相互作用进行分型。优选地,对表15中探针所代表的至少10个染色体相互作用进行分型。
在一方面,所述方法包括对表16中探针所代表的至少3、5、8、10、15、20、40个或所有染色体相互作用进行分型。优选地,对表16中探针所代表的至少10个染色体相互作用进行分型。
在一方面,所述方法包括对表17中探针所代表的至少3、5、8、10、15、20、50、80个或所有染色体相互作用进行分型。优选地,对表17中探针所代表的至少10个染色体相互作用进行分型。
染色体相互作用的类型
在一方面,基因座(包括检测到染色体相互作用的基因和/或位置)可包括CTCF结合位点。这是能够结合转录阻遏物CTCF的任何序列。该序列可由序列CCCTC组成或包括序列CCCTC,其中,序列CCCTC可以在基因座中以1个、2个或3个拷贝存在。CTCF结合位点序列可以包括序列CCGCGNGGNGGCAG(IUPAC表示法)。CTCF结合位点可以在染色体相互作用的至少100个、500个、1000个或4000个碱基内或在表1所示的任何染色体区域内。
当使用探针进行检测时,通常可以检测来自探针的两个区域(即来自染色体相互作用的两个位点)的序列。在优选的方面,该方法中使用的探针包括与任何表中所示的探针相同或互补的序列或由与任何表中所示的探针相同或互补的序列组成。在某些方面,使用的探针包括与表中所示的任何探针序列同源的序列。
用于鉴定标志物和标志物组套(panel)的方法
本文所述的发明涉及本身作为调节方式的染色体构象谱和3D结构,与表型密切相关。生物标志物的发现是基于通过对代表表型差异的临床样本的代表性队列进行模式鉴定和筛选的注释。我们对基因组的重要部分进行了注释和筛选,所述基因组的重要部分跨越已知基因的编码部分和非编码部分及其非编码5'和3'的大摇摆(large sways),用于鉴定统计学上传播一致的条件传播性染色体构象,例如锚定在开放阅读框内(内含子)或开放阅读框外的非编码位点。
在选择最佳标志物时,我们由先导标志物(marker lead)的统计数据和p值所驱动。无论参考中使用的基因的表达谱如何,特征内经选择和验证的染色体构象本身就是传播性分类实体(disseminating stratifying entities)。相关的调节模式,如锚定位点的SNP、基因转录谱的变化、H3K27ac水平的变化等,还有待进一步研究。
我们正在从基础生物学和表观遗传学对表型控制(包括例如从调节网络的框架)的基础上来研究临床表型差异及其分类的问题。因此,为了协助分类,可以捕获网络中的变化,这优选地通过几种生物标志物的特征来完成,例如通过遵循机器学习算法来缩减标志物,其中包括评估标志物的最佳数量,从而以最小噪声对测试队列进行分类。这可以以3个至20个标志物结束。
可以通过交叉验证统计性能(而不是例如通过用于参考名称的相邻基因的功能相关性)来为组套选择标志物。
一个标志物组套(带有相邻基因的名称)是从对基因组重要部分筛选中聚类选择的产物,以无偏差的方式分析基因组重要部分中超过14,000至60,000个带注释的EpiSwitch位点的统计传播能力。对于分类问题,不应将其视为对已知功能价值的基因的染色体构象的定制捕获。染色体相互作用的位点总数为120万个,因此潜在的组合数为120万的120万次方。尽管如此,我们遵循的方法允许鉴定相关的染色体相互作用。
本申请提供的特定标志物已通过选择,在统计上(显著)与病症或亚组相关联。相关表格中的数据证明了这一点。每个标志物都可以被视为代表作为在相关病症中表现出的网络失调(network deregulation)的一部分的生物表观遗传事件。实际上,这意味着,与在对照组相比,这些标志物在各组患者中普遍存在。平均而言,例如,各标志物通常可以存在于80%的测试患者和10%的测试对照中。
所有标志物的简单加和并不能直接代表一些失调的网络相互关系。这就是标准多变量生物标志物分析GLMNET(R软件包)的引入之处。GLMNET软件包有助于鉴定某些标志物之间的相互依赖性,这反映了它们在实现导致疾病表型的失调中的共同作用。建模然后测试具有最高GLMNET分数的标志物不仅可以鉴定出准确鉴定患者队列的最小数量的标志物,而且还可以鉴定出在对照组患者中提供最少假阳性结果的最小数量的标志物,这应归于对照组低出现率的背景统计噪声。通常,一组(组合)选定标志物(例如3个至10个)提供了检测灵敏度和特异性之间的最佳平衡,出现在从所有针疾病选择的统计显著性标志物的各属性的多变量分析的背景下。
本文的表格显示了用于阵列分析的与长程相互作用位点之间的连接点重叠的阵列探针(60-mer)的参考名称、染色体编号和并置的两个染色体片段的起始和终止。表中列出的每个标志物的名称给出了被相关探针识别的两个区域的染色体位置编号,提供了以独特方式限定染色体相互作用的另一种方法。
样本和样本处理
本发明的方法通常在样本上进行。样本可以在限定的时间点例如在本文中限定的任何时间点获得。样本通常包含来自个体的DNA。样本通常包含细胞。在一方面,通过微创方式获得样本,并且样本可以是例如血液样本。可以提取DNA并用标准的限制性内切酶切割DNA。这可以预先确定哪些染色体构象被保留并将由EpiSwitchTM平台检测。由于组织和血液之间染色体相互作用的同步性,包括水平转移,因此血液样本可用于检测组织例如与疾病相关的组织中的染色体相互作用。
样本制备和染色体相互作用检测的优选方面
本文描述了制备样本和检测染色体构象的方法。可以使用这些方法的优化(非常规)版本,例如本部分所述。
通常,样本包含至少2×105个细胞。样本可包含多达5×105个细胞。在一方面,样本包含2×105至5.5×105个细胞。
本文描述了对存在于染色体基因座的表观遗传染色体相互作用的交联。这可以在细胞裂解发生之前进行。细胞裂解可进行3分钟至7分钟,例如4分钟至6分钟或约5分钟。在一些方面,细胞裂解进行至少5分钟并且少于10分钟。
本文描述了用限制性内切酶消化DNA。通常,DNA限制性酶切于约55℃至约70℃、例如于约65℃进行,持续约10分钟至30分钟,例如约20分钟。
优选地,使用高频剪切性限制性内切酶(frequent cutter restrictionenzyme),其产生平均片段大小最高达4000个碱基对的连接DNA的片段。任选地,限制性内切酶产生平均片段大小为约200至300个碱基对(例如约256个碱基对)的连接DNA的片段。在一方面,通常片段大小为200个碱基对到4,000个碱基对,例如400个到2,000个或500个到1,000个碱基对。
在EpiSwitch方法的一方面,在DNA限制性消化步骤和DNA连接步骤之间不进行DNA沉淀步骤。
本文描述了DNA连接。通常DNA连接进行5分钟至30分钟,例如约10分钟。
可以酶促消化样本中的蛋白质,例如使用蛋白酶,任选地蛋白酶K。可以酶促消化蛋白质约30分钟至1小时,例如约45分钟。在一方面,在蛋白质消化(例如蛋白酶K消化)后,没有交联逆转DNA提取或酚DNA提取步骤。
在一方面,PCR检测能够检测单拷贝的连接核酸,优选地通过存在/不存在连接核酸的二元信息读出。
图1显示了检测染色体相互作用的优选方法。
本发明的方法和用途
可以用不同的方式描述本发明的方法。其可以描述为一种制备连接核酸的方法,包括:(i)将染色体相互作用中聚集在一起的染色体区域进行体外交联;(ii)对所述交联DNA进行切割或限制性消化酶切;以及(iii)连接所述交联的切割的DNA末端以形成连接核酸,其中连接核酸的检测可用于鉴定基因座的染色体状态,并且其中优选地:
-基因座可以是表1、表3、表8或表10中提及的任何基因座或区域,和/或
-其中染色体相互作用可以是本文提及的任何染色体相互作用或对应于表1、表3、表8或表10中公开的任何探针,和/或
-其中连接产物可以具有或包括:(i)与表1、表3、表8或表10中公开的任何探针序列相同或同源的序列;或(ii)与(i)互补的序列。
本发明的方法可以描述为用于检测代表群体中不同亚组的染色体状态的方法,包括确定在所限定的基因组的表观遗传活性区域内是否存在染色体相互作用,其中优选地:
-亚组由冠状病毒感染预后来限定,和/或
-染色体状态可以在表1或表3中提及的任何基因座或区域;和/或
-染色体相互作用可以是表1或表3中提及的任何一种,或者对应于那些表中公开的任何探针。
表7中的一个或多个标志物,例如表7中的3、4、5个或所有标志物,可用于本发明的这些方面。
此外,表8、表9、表10、表11、表12、表13、表14、表15、表16或表17中的一个或多个标志物可用于本发明的这些方面,包括本文公开的这些表中的任何一个的特定数目或组合的标志物。
同源物
本文涉及多核苷酸/核酸(例如DNA)序列的同源物。此类同源物通常具有至少70%的同源性,优选至少80%、至少85%、至少90%、至少95%、至少97%、至少98%或至少99%的同源性,例如在至少10、15、20、30、100个或更多个连续核苷酸的区域上,或在跨越来自参与染色体相互作用的染色体区域的核酸部分上。同源性可以基于核苷酸一致性(有时称为“硬同源性”)来计算。
因此,在一个具体方面,多核苷酸/核酸(例如DNA)序列的同源物在本文中是指序列一致性百分比。通常,此类同源物具有至少70%的序列一致性,优选至少80%、至少85%、至少90%、至少95%、至少97%、至少98%或至少99%的序列一致性,例如在至少10、15、20、30、100个或更多个连续核苷酸的区域上,或在跨越来自参与染色体相互作用的染色体区域的核酸部分上。在整个探针、引物或引物对中,同源物可以具有至少70%的序列一致性,优选至少80%、至少85%、至少90%、至少95%、至少97%、至少98%或至少99%的序列一致性。
例如,UWGCG软件包提供了BESTFIT程序,该BESTFIT程序可用于计算同源性和/或序列一致性%(例如在其默认设置下使用)(Devereux et al(1984)Nucleic AcidsResearch 12,p387-395)。PILEUP和BLAST算法可用于计算同源性和/或序列一致性%和/或排列序列(line up sequence)(例如鉴定等效序列或相应序列(通常在它们的默认设置下)),例如Altschul S.F.(1993)J MoI Evol 36:290-300;Altschul,S,F et al(1990)JMoI Biol 215:403-10中所述。
执行BLAST分析的软件可通过国家生物技术信息中心公开获得。该算法包括首先鉴定高分序列对(high scoring sequence pair,HSP),这通过鉴定当与数据库序列中长度为W的字段(word)进行比对时查询序列中匹配或满足某个正数阈值分数T的相同长度的短字段。T被称为相邻字段分数阈值(Altschul et al,同上)。这些初始的相邻匹配字段(wordhit)作为用于启动搜索以查找包含它们的HSP的种子(seed)。匹配字段沿着每个序列在两个方向上延伸,直到累积比对分数可以增加为止。在以下情况下终止匹配字段在每个方向的延伸:累积比对分数从其最大实现值下降了数量X;由于一个或多个负分数残基比对的累积,累积分数变为零或更低;或到达任一序列的末尾端。BLAST算法参数W5 T和X决定了比对的灵敏度和速度。BLAST程序默认使用11的字段长度(W),BLOSUM62评分矩阵(参见Henikoffand Henikoff(1992)Proc.Natl.Acad.Sci.USA 89:10915-10919)比对(B)为50,期望值(E)为10,M=5,N=4,以及两条链的比较。
BLAST算法对两个序列之间的相似性进行统计分析;参见例如Karlin andAltschul(1993)Proc.Natl.Acad.Sci.USA 90:5873-5787。BLAST算法提供的一种相似性度量是最小和概率(P(N)),其提供了两个多核苷酸序列之间偶然发生匹配的概率的指示。例如,如果第一序列与第二序列相比的最小和概率小于约1,优选小于约0.1,更优选小于约0.01,最优选小于约0.001,则认为一个序列与另一个序列相似。
同源序列通常具有1、2、3、4个或更多个碱基的差异,例如具有少于10、15或20个碱基的差异(可以是核苷酸的取代、缺失或插入)。这些变化可以在上文中针对计算同源性和/或序列一致性%提到的任何区域中测量。
可以计算“引物对”的同源性,例如,通过将这两个序列视为单个序列(好像两个序列连接在一起),目的是然后与另一个也被视为单个序列的引物对进行比较。
EpiSwitchTM技术
EpiSwitchTM技术还涉及使用微阵列EpiSwitchTM标志物数据来检测表型特异性的表观遗传染色体构象特征。诸如以本文所述方式利用连接核酸的EpiSwitchTM等方面具有几个优点。它们具有低水平的随机噪声,例如因为来自本发明第一集合的核酸的核酸序列与第二集合的核酸杂交,或不与第二集合的核酸杂交。这提供了一个二元结果,允许以相对简单的方式在表观遗传水平上测量复杂的机制。EpiSwitchTM技术处理时间快且成本低。在一方面,处理时间为3小时至6小时。
阵列
本文公开的所有核酸均可以结合到阵列上,并且在一方面,至少有15,000个、45,000个、100,000个或250,000个不同的核酸结合到阵列上,优选地,其代表至少300个、900个、2000个或5000个基因座。在一方面,一个或多个或所有不同群体的核酸结合到阵列的超过一个不同的区域,实际上在阵列上重复以允许错误检测。该阵列可以基于AgilentSurePrint G3定制CGH微阵列平台。第一核酸与阵列的结合可以通过双色系统来检测。
检测阈值
已经发现本文公开的标志物是能够确定冠状病毒感染状态或亚组的“传播性标志物”。实际上,这意味着,与对照组相比,这些标志物在各组患者中普遍存在(例如,如FC值所示)。平均而言,例如,各标志物通常可以存在于80%的测试患者和10%的测试对照中。因此,在所述方法的一方面,如果针对相关冠状病毒预后亚组测试的至少80%的标志物存在于某一个体中,和/或如果测试的与对照相关的至少80%的标志物不存在于某一个体中,则该个体被认为是该亚组的一部分。
治疗剂和治疗
本部分与以下两者相关:
-给予通过本发明的方法选择的个体的治疗剂,和
-基于本发明方法的结果选择的治疗剂。
本发明提供了用于在某些个体(例如通过本发明的方法鉴定的那些个体)中预防或治疗冠状病毒感染或相关亚病症的治疗剂。这可以包括向有需要的个体施用治疗有效量的剂。本发明提供了所述剂在制备用于在某些个体中预防或治疗病症的药物中的用途。所述疾病或病症可以是冠状病毒感染、任何类型的冠状病毒感染亚病症例如重症疾病、或冠状病毒感染的某个阶段。
对所述剂的制剂将取决于剂的性质。所述剂将以包含该剂和药学上可接受的载体或稀释剂的药物组合物的形式提供。合适的载体和稀释剂包括等渗盐水溶液,例如磷酸盐缓冲盐水。典型的口服剂量组合物包括片剂、胶囊、液体溶液和液体悬浮液。该剂可以配制用于肠胃外、静脉内、肌肉内、皮下、透皮或口服施用。
所述剂的剂量的确定可以根据多种参数,尤其是根据所使用的物质,待治疗的个体的年龄、体重和状况,施用途径,和所需的方案。医生能够确定任何具体剂所需的施用途径和剂量。然而,合适的剂量可为0.1mg/kg体重至100mg/kg体重,例如1mg/kg体重至40mg/kg体重,例如每天服用1至3次。
治疗剂可以是本文公开的任何此类剂,或者可以靶向本文公开的任何“靶标”,包括本文的任何表中公开的任何蛋白质或基因。应当理解,以组合方式公开的任何剂应当被视为也公开了用于单独施用。
可用于本发明的治疗剂和治疗包括如下:
抗病毒药物
·瑞德西韦(Remdesivir)-减少肺部病毒和肺部损伤。
·洛匹那韦(Lopinavir)、利托那韦(ritonavir)或洛匹那韦/利托那韦组合-减少肺部病毒和肺部损伤。
·Umifenovir-抑制病毒进入靶细胞并刺激免疫反应。
免疫调节剂
·地塞米松-用于抑制身体的免疫系统。
·康复期血浆-含有高水平的多克隆病原体特异性抗体。这些抗体可以赋予接受者被动免疫。
所述个体的治疗可以用选自表6的任何治疗剂,优选阿巴西普(Abatacept)、阿非莫单抗(Afelimomab)、血管紧张素II、地塞米松、伊马替尼(Imatinib)、免疫球蛋白、英夫利昔单抗(Infliximab)、尼达尼布(Nintedanib)、利妥昔单抗(Rituximab)或Ulixertinib。
被鉴定为具有重症疾病预后的个体:
-可接受针对过度炎症的治疗
-可在密切观察下接受专门治疗
-可用降低病毒载量的剂治疗
-可被给予免疫调节剂
-可接种疫苗
-可被给予预防性治疗
-可被提供检疫隔离
-可被给予预防或治疗脓毒症的治疗剂。
进一步疗法的实施方案
本发明提供了对个体的疗法,以预防或治疗本文提及的任何预后(包括对重症冠状病毒疾病的预后),所述个体是例如本文提及的任何类型的个体(包括由风险因素、疾病、易感性或本文提及的任何其他特征所限定的)。所述个体可能已被鉴定为对重症冠状病毒疾病易感。优选地,本发明提供预防或治疗重症冠状病毒疾病的疗法,任选地在已被鉴定为对所述疾病易感的个体中。所述个体可以接受本文提及的任何疗法,包括表6中列出的任何剂。
本发明提供了选自表6所示的任何剂的治疗剂,用于治疗重症冠状病毒疾病的方法,所述方法包括:
-通过本发明的方法(即通过对个体中的染色体相互作用进行分型)鉴定个体是否对重症冠状病毒疾病易感,和
-对任何被鉴定为易感的个体施用所述剂。
本发明提供了一种治疗方法,其包括:通过本发明的分型方法鉴定个体是否对重症冠状病毒疾病易感,并向任何被鉴定为易感的个体施用表6中所列的任何剂。
表6中的优选剂包括阿巴西普、阿非莫单抗、血管紧张素II、地塞米松、伊马替尼、免疫球蛋白、英夫利昔单抗、尼达尼布、利妥昔单抗和Ulixertinib。
本发明提供了一种剂,其:
-预防或治疗冠状病毒感染,和/或
-预防或治疗有害的免疫反应;
用于治疗已根据本发明的方法被鉴定为由于冠状病毒感染而对重症疾病易感的个体之用途。
个性化疗法
本发明提供不同类型的个性化疗法。在一方面,基于本发明方法的结果,即基于检测一个或多个特定染色体相互作用的存在与否,向个体给予疗法或不给予疗法。在这个意义上,本发明的方法通常允许基于对个体的预后或对疗法的反应性来选择疗法。
一方面,本发明提供了一种治疗个体的方法,其包括:
(i)检测由表1或表3所示探针所代表的一个或多个染色体相互作用的存在与否,
(ii)向所述个体施用治疗剂,所述治疗剂是基于所述个体中所述染色体相互作用的存在或不存在而选择的。
在一方面,选择靶向具体基因或基因产物(例如表达的蛋白质)的治疗剂,其中该基因是染色体相互作用与之相关或存在于其中的基因。
在本发明的个性化疗法方面,可以对本文中(例如在任何表格中)提及的任何特定的染色体相互作用进行分型。可以对本文公开的任何数目或组合的相互作用进行分型。表7中的一个或多个标志物(例如表7中的3、4、5个或所有标志物)可用于本发明的这些方面。此外,表8、表9、表10、表11、表12、表13、表14、表15、表16或表17中的一个或多个标志物,包括本文公开的这些表中的任何一个中的特定数目或组合的标志物,可用于本发明的这些方面。
治疗剂的筛选
本发明提供了筛选候选剂(例如化合物)的方法,以确定它们是否可用于治疗本文提及的任何病症,包括对重症冠状病毒疾病的易感性,优选对重症Covid-19疾病的易感性。
在一方面,本发明提供了确定候选剂是否对重症冠状病毒疾病有治疗作用的方法,包括确定候选剂是否能够改变本文公开的一个或多个染色体相互作用,包括本文公开的数量和组合的染色体相互作用,例如如表1或表3所示的探针所代表的染色体相互作用。该方法可以确定候选剂是否能够产生或破坏一个或多个此类相互作用。
在一方面,本发明提供了用于确定候选剂是否可用于预防或治疗重症冠状病毒疾病的方法,其包括:
(i)将候选剂与一条或多条染色体接触,
(ii)确定候选剂是否能够在所述染色体上产生或破坏由表1或表3所示探针代表的一个或多个染色体相互作用,
从而确定所述候选剂是否可用于预防或治疗重症冠状病毒疾病。
表7中的一个或多个标志物,例如表7中的3、4、5个或所有标志物,可用于本发明的这些方面。此外,表8、表9、表10、表11、表12、表13、表14、表15、表16或表17中的一个或多个标志物,包括本文公开的这些表中的任一表的特定数目或组合的标志物,可用于本发明的这些方面。
本发明核酸的特性
本发明涉及某些核酸,例如本文描述的在本发明的方法中使用或产生的连接核酸。这些可以与本文提到的第一核酸和第二核酸相同,或者具有它们的任何特性。本发明的核酸通常包含两个部分,每个部分包括来自在染色体相互作用中聚集在一起的染色体的两个区域之一的序列。通常,每个部分的长度为至少8、10、15、20、30或40个核苷酸,例如长度为10个至40个核苷酸。优选的核酸包括来自任何所述表中提及的任何基因的序列。通常优选的核酸包括表1或表3中提及的特定探针序列或这些序列的片段和/或同源物。
优选地,核酸是DNA。应当理解,在提供特定序列的情况下,本发明可以根据具体方面的需要使用互补序列。优选地,所述核酸是DNA。应当理解,在提供特定序列的情况下,本发明可以根据具体方面的需要使用互补序列。
如本文所述,表1或表3中所示的引物也可用于本发明。在一方面,使用包括以下任一项的引物:表1或表3所示的序列;或表1或表3中所示任一序列的片段和/或同源物。
表7中的一个或多个探针或引物对,例如表7中的3、4、5个或所有探针或引物对,可用于本发明的这些方面。此外,表8、表9、表10、表11、表12、表13、表14、表15、表16或表17中任一表中的一个或多个探针或引物可用于本发明的这些方面。
筛选以鉴定相关的染色体相互作用
在一方面,分型的一个或多个染色体相互作用已通过确定哪些染色体相互作用与对应于群体的冠状病毒感染亚组的染色体状态相关的方法进行了鉴定,该方法包括将来自具有不同状态的染色体的亚组的第一集合的核酸与第二集合的索引核酸(index nucleicacid)接触,并允许互补序列杂交,其中第一集合的核酸和第二集合的核酸中的核酸代表包括来自在染色体相互作用中已聚集在一起的两个染色体区域的序列的连接产物,并且其中所述第一集合的核酸和第二集合的核酸之间的杂交模式允许确定哪些染色体相互作用对所述亚组是特异性的。
第二集合的核酸序列具有作为索引序列集合的功能,并且本质上是适合鉴定亚组特异性序列的核酸序列集合。它们可以代表“背景”染色体相互作用,并且可能以某种方式被选择或不被选择。它们通常是所有可能的染色体相互作用的子集。
第二集合的核酸可以通过任何合适的方法获得。它们可以通过计算得出,也可以基于个体的染色体相互作用。它们通常代表比第一集合的核酸更大的群体组。在一个具体的方面,第二集合的核酸代表特定集合的基因中所有可能的表观遗传染色体相互作用。在另一个具体的方面,第二集合的核酸代表本文所述的群体中存在的所有可能的表观遗传染色体相互作用的大部分。在一个具体的方面,第二集合的核酸代表至少20、50、100或500个基因(例如20至100或50至500个基因)中至少50%或至少80%的表观遗传染色体相互作用。
第二集合的核酸通常代表至少100种可能的表观遗传染色体相互作用,它们修饰、调控或以任何方式介导群体中的表型。第二集合的核酸可以代表影响物种的疾病状态的染色体相互作用(通常与诊断或预后相关)。第二集合的核酸通常包括代表与预后亚组相关和不相关的表观遗传相互作用的序列。
在一个具体的方面,第二集合的核酸至少部分源自群体中天然存在的序列,并且通常通过in silico方法获得。与天然存在的核酸中存在的核酸的相应部分相比,所述核酸可以进一步包括单个或多个突变。突变包括一个或多个核苷酸碱基对的缺失、取代和/或添加。在一个具体的方面,第二集合的核酸可包括代表与天然存在的物种中存在的核酸的相应部分具有至少70%序列一致性的同源物和/或直系同源物(orthologue)的序列。在另一个具体的方面,提供了与天然存在的物种中存在的核酸的相应部分至少80%的序列一致性或至少90%的序列一致性。
第二集合的核酸的特性
在一个具体的方面,在第二集合的核酸中存在至少100种不同的核酸序列,优选至少1000种、2000种或5000种不同的核酸序列,最多100,000种、1,000,000种或10,000,000种不同的核酸序列。通常数量为100至1,000,000例如1,000种到100,000种不同的核酸序列。所有或至少90%或至少50%的这些核酸序列对应于不同的染色体相互作用。
在一个具体的方面,第二集合的核酸代表至少20个不同基因座或基因中的染色体相互作用,优选至少40个不同基因座或基因中的染色体相互作用,更优选至少100个、至少500个、至少1000个或至少5000个不同基因座或基因中的染色体相互作用,例如100个至10,000个不同基因座或基因中的染色体相互作用。第二集合的核酸的长度使它们适合于根据沃森-克里克碱基配对与第一集合的核酸进行特异性杂交,从而可以鉴定亚组特异性的染色体相互作用。通常,第二集合的核酸将包括序列对应于在染色体相互作用中聚集在一起的两个染色体区域的两个部分。第二集合的核酸通常包含长度至少为10个、优选为20个并且更优选为30个碱基(核苷酸)的核酸序列。在另一方面,核酸序列的长度可以为不超过500个、优选不超过100个并且更优选不超过50个碱基对。在一个优选的方面,第二集合的核酸包括17个至25个碱基对的核酸序列。在一方面,至少100%、80%或50%的第二集合的核酸序列具有上述长度。优选地,不同的核酸不具有任何重叠序列,例如至少100%、90%、80%或50%的核酸在至少5个连续核苷酸上不具有相同序列。
假设第二集合的核酸作为“索引”,那么同一集合的第二核酸可以与代表不同特征的亚组的不同集合的第一核酸一起使用,即第二集合的核酸可以代表可用于鉴定与不同特征相关的染色体相互作用的“通用”的核酸系列。
第一集合的核酸(针对相关的染色体相互作用的筛选)
第一集合的核酸通常来自与冠状病毒感染相关的亚组。第一集合的核酸可以具有本文提及的第二集合的核酸的任何特征和特性。第一集合的核酸通常来源于来自个体的经历了本文所述的处理和加工特别是EpiSwitchTM交联和切割步骤的样本。通常,第一集合的核酸代表取自个体的样本中存在的全部或至少80%或50%的染色体相互作用。
通常,第一集合的核酸代表与第二集合的核酸所代表的染色体相互作用相比在跨越第二集合的核酸所代表的基因座或基因上更小的染色体相互作用群体,即第二集合的核酸代表限定集合的基因座或基因中背景或索引集合的相互作用。
核酸文库
本文提及的任何类型的核酸群体可以以文库的形式存在,所述文库包含至少200、至少500、至少1000、至少5000或至少10000个该类型的不同核酸,例如“第一”或“第二”核酸。这样的文库可以是与阵列结合的形式。文库可包括本文公开的任何表中所示的一些或全部探针或引物对。该文库可以包括来自本文公开的任何表中的所有探针序列。
杂交
本发明通常需要一种允许完全或部分互补的核酸序列杂交的手段,例如在本发明的方法中杂交,或者在第一集合的核酸和第二集合的核酸之间杂交。在一方面,所有第一集合的核酸在单个分析中(即在单个杂交步骤中)与所有第二集合的核酸接触。然而,可以使用任何合适的分析。
标记核酸和杂交模式
本文提及的核酸可以被标记,优选使用有助于检测成功杂交的独立的标记,例如荧光团(荧光分子)或放射性标记。某些标记可以在紫外光下检测到。杂交模式,例如在本文描述的阵列上的杂交模式,代表两个亚组之间表观遗传染色体相互作用的差异,并因此提供了一种比较表观遗传染色体相互作用和确定哪些表观遗传染色体相互作用是特异于本发明群体中的亚组的方法。
术语“杂交模式”广泛涵盖杂交的存在和不存在,例如第一集合的核酸和第二集合的核酸之间杂交的存在和不存在,即第一集合中的哪些特定核酸与第二集合中的哪些特定核酸杂交,因此它不限于任何具体的分析或技术,或者对具有可以检测到“模式”的表面或阵列的需要。
本文提及的物质的形式
本文提及的任何物质,例如核酸或治疗剂,可以是纯化的或分离的形式。它们可以以不同于自然界中发现的形式存在,例如它们可以与自然界中不存在的其他物质组合存在。核酸(包括本文限定的序列的部分)可以具有与自然界中发现的序列不同的序列,例如在序列中具有至少1个、2个、3个、4个或更多个核苷酸变化,如在针对同源性的部分中所述。核酸可在5'末端或3'末端具有异源序列。核酸在化学上可以与自然界中发现的不同,例如它们可以以某种方式被修饰,但优选地仍然能够进行沃森-克里克碱基配对。在适当的情况下,核酸将以双链或单链的形式提供。本发明以单链或双链形式提供了本文提及的所有特定核酸序列,并因此包括所公开的任何序列的互补链。
本发明提供了用于实施本发明的任何方法的试剂盒,所述方法包括检测与预后相关的染色体相互作用。这种试剂盒可以包括能够检测相关染色体相互作用的特定结合剂,例如能够检测由本发明的方法生成的连接核酸的剂。试剂盒中的优选剂包括能够与连接核酸杂交的探针或者能够在PCR反应中扩增连接核酸的引物对,例如本文描述的那些引物对。
本发明提供了一种能够检测相关染色体相互作用的装置。该装置优选包括能够检测染色体相互作用的任何特定结合剂、探针或引物对,例如本文所述的任何此类结合剂、探针或引物对。
检测方法
在一方面,使用在PCR反应过程中激活时可检测的探针对染色体相互作用相关的连接序列进行定量检测,其中所述连接序列包括来自在表观遗传染色体相互作用中聚集在一起的两个染色体区域的序列,其中所述方法包括:在PCR反应过程中使连接序列与探针接触,并检测探针的激活程度,并且其中所述探针结合连接位点。该方法通常可以使用双标记荧光水解探针以符合MIQE的方式检测具体的相互作用。
探针通常用具有非活性和活性状态的可检测的标记进行标记,因此只有在激活时才能被检测到。激活的程度将与PCR反应中存在的模板(连接产物)的程度有关。检测可在全部或部分PCR反应过程中进行,例如在至少50%或80%的PCR循环中进行。
探针可以包括共价连接到寡核苷酸一端的荧光团和连接到寡核苷酸另一端的猝灭剂,使得荧光团的荧光被猝灭剂猝灭。在一方面,荧光团连接到寡核苷酸的5'端,猝灭剂共价连接到寡核苷酸的3'端。可用于本发明方法的荧光团包括FAM、TET、JOE、Yakima黄、HEX、花青素3(Cyanine 3)、ATTO 550、TAMRA、ROX、德克萨斯红(Texas Red)、花青素3.5、LC610、LC 640、ATTO 647N、花青素5、花青素5.5和ATTO 680。可以与合适的荧光团一起使用的猝灭剂包括TAM、BHQ1、DAB、Eclip、BHQ2和BBQ650,任选地,其中所述荧光团选自HEX、德克萨斯红和FAM。荧光团和猝灭剂的优选组合包括FAM与BHQ1以及德克萨斯红与BHQ2。
探针在qPCR检测中的用途
本发明的水解探针通常是经温度梯度优化的,并具有浓度匹配的阴性对照。优选地,对单步PCR反应进行优化。更优选地,计算标准曲线。使用跨越连接序列的连接处结合的特定探针的一个优点是无需使用嵌套PCR方法即可实现对连接序列的特异性。本文描述的方法可以准确和精确地定量低拷贝数靶标。在温度梯度优化之前,可以对靶标连接序列进行纯化,例如凝胶纯化。可以对靶标连接序列进行测序。优选地,使用约10ng、或5ng至15ng、或10ng至20ng、或10ng至50ng、或10ng至200ng模板DNA进行PCR反应。正向和反向引物被设计为使得一个引物与连接DNA序列中表示的染色体区域之一的序列结合,而另一个引物与连接DNA序列中表示的另一染色体区域结合,例如,通过序列互补。
连接核酸的检测可以使用本文任何表中公开的任何探针和/或引物对。在一方面,使用qPCR系统,所述qPCR系统使用表7中公开的探针和引物对,或这些探针和引物对的同源物。优选地,将表7的“修饰序列”列中所示的探针与所示类型的淬灭剂和报告子一起使用。
连接DNA靶标的选择
本发明包括选择用于本文限定的PCR方法的引物和探针,包括基于引物结合和扩增连接序列的能力选择引物,并基于探针将结合的靶序列的特性特别是靶序列的曲率选择探针序列。
探针通常被设计/选择以与连接序列结合,所述连接序列是跨越限制性位点的并置的限制性片段。在本发明的一方面,例如使用本文引用的特定算法,计算与具体染色体相互作用相关的可能的连接序列的预测曲率。曲率可以表示为度数/螺旋转角,例如10.5°/螺旋转角。在连接序列的曲率倾向峰值分数为至少5°/螺旋转角时,通常为至少10°、15°或20°/螺旋转角时,例如为5°至20°/螺旋转角时,选择所述连接序列用于靶向。优选地,对于连接位点上游和/或下游的至少20个、50个、100个、200个或400个碱基,例如20个至400个碱基,计算每个螺旋转角的曲率倾向分数。因此,在一方面,连接产物中的靶序列具有这些曲率水平中的任何一个。也可以基于最低热力学结构自由能来选择靶序列。
具体方面
在一方面,仅对染色体内相互作用进行分型/检测,而不对染色体外相互作用(不同染色体之间)进行分型/检测。
在一个具体方面,不对某些染色体相互作用进行分型,例如本文提及的任何特定相互作用(例如由本文提及的任何探针或引物对所限定的)。在某些方面,不对在本文提及的与染色体相互作用相关的任何基因中的染色体相互作用进行分型。
本文提供的数据表明,这些标志物是能够区分相关疾病情况(例如预后)的病例和非病例的“传播性”标志物。因此,当实施本发明时,技术人员将能够通过检测相互作用来确定个体所属亚组。在一个实施方案中,至少70%的测试标志物(以其与相关疾病情况有关的形式(通过不存在或存在))的检测阈值可用于确定个体是否属于相关亚组。
筛选方法
本发明提供了一种确定哪些染色体相互作用与对应于群体的预后亚组的染色体状态相关的方法,包括使来自具有不同染色体状态的亚组的第一集合的核酸与第二集合的索引核酸接触,并且允许互补序列杂交,其中第一集合的核酸和第二集合的核酸中的核酸代表连接产物,所述连接产物包括来自在染色体相互作用中聚集在一起的两个染色体区域的序列,并且其中所述第一集合的核酸和第二集合的核酸之间的杂交模式允许确定哪些染色体相互作用对于预后亚组是特异性的。亚组可以是本文限定的任何特定亚组,例如针对具体病症或疗法限定的亚组。
出版物和优先权申请中的公开内容
本文提及的所有出版物的内容通过引用并入本说明书中,并可用于进一步限定与本发明相关的特征。所有优先权申请的内容都并入到本说明书中,并可用于限定与本发明相关的特征。
用于鉴定特定相关染色体相互作用的技术
EpiSwitchTM平台技术检测基因座处的正常情况和异常情况之间调控变化的表观遗传调节特征。EpiSwitchTM平台鉴定和监测与人类染色体的调控高级结构(也被称为染色体构象特征)相关的基因调控的基本表观遗传水平。染色体特征是基因失调级联反应中独特的初始步骤。它们是高级的生物标志物,与利用晚期表观遗传和基因表达生物标志物(例如DNA甲基化和RNA谱分析(profiling))的生物标志物平台相比,具有一系列独有的优势。
EpiSwitchTM阵列分析
定制的EpiSwitchTM阵列筛选平台有4个密度(15K、45K、100K和250K)的独特的染色体构象,每个嵌合片段在阵列上重复4次,使有效密度分别为60K、180K、400K和100万。
定制设计的EpiSwitchTM阵列
15K的EpiSwitchTM阵列可以筛选整个基因组,包括通过EpiSwitchTM生物标志物探索技术查询的约300个基因座。EpiSwitchTM阵列建立在Agilent SurePrint G3定制CGH微阵列平台上;该技术提供4个密度(60K、180K、400K和100万)的探针。每个阵列的密度降低到15K、45K、100K和250K,因为每个EpiSwitchTM探针以一式四份存在,因此可以对再现性进行统计评估。每个基因座的查询的潜在EpiSwitchTM标志物的平均数量为50,因此可以调查的基因座数量为300、900、2000和5000。
EpiSwitchTM定制阵列流程
EpiSwitchTM阵列是一个双色系统,其中一个集合的样本在EpiSwitchTM文库生成后用Cy5标记,而待比较/分析的另一集合的样本(对照)用Cy3标记。使用Agilent SureScan扫描仪扫描阵列,并使用Agilent Feature Extraction软件提取所得特征。然后使用R中的EpiSwitchTM阵列处理脚本对数据进行处理。使用R:Limma*中的Bioconductor中的标准双色包对阵列进行处理。使用Limma*中的normalisedWithinArrays函数完成阵列的归一化,这是相对于芯片上的Agilent阳性对照和EpiSwitchTM阳性对照完成的。根据Agilent Flag判定过滤数据,移除Agilent对照探针,并对技术重复探针进行平均,以便使用Limma*对其进行分析。探针基于2个比较场景之间的差异进行建模,然后使用错误发现率(FalseDiscovery Rate)进行校正。变异系数(CV)<=30%且为<=-1.1或=>1.1并且通过p<=0.1FDR p值的探针用于进一步筛选。为了进一步缩减探针集合,使用R中的FactorMineR软件包执行多因素分析(Multiple FactorAnalysis)。
*注:LIMMA是用于评估微阵列实验中差异表达的线性模型和经验贝叶斯法。Limma是用于分析来自微阵列或RNA-Seq的基因表达数据的R软件包。
根据调整后的p值、FC和CV<30%(任意截止点)参数初步选择探针池,用于最终挑选。仅根据前两个参数(调整后的p值(adj.p);FC)绘制进一步分析和最终列表。
统计流程
使用R中的EpiSwitchTMAnalytical Package对EpiSwitchTM筛选阵列进行处理,以选择高价值的EpiSwitchTM标志物用于转移到EpiSwitchTMPCR平台上。
步骤1
根据校正的p值(错误发现率,FDR)选择探针,校正的p值是修正的线性回归模型的结果。选择p值<=0.1的探针,然后根据其表观遗传比(ER)进一步缩减探针,探针ER必须<=-1.1或=>1.1才能被选择用于进一步分析。最后一个过滤器是变异系数(CV),探针的变异系数必须<=0.3。
步骤2
统计列表中的前40个标志物是根据其选择作为用于PCR转移的标志物的ER选择的。负ER量最高的前20个标志物和正ER量最高的前20个标志物组成列表。
步骤3
步骤1得到的标志物,即具有统计学显著性的探针,构成了使用超几何富集(HE)进行富集分析的基础。该分析使得能够缩减显著探针列表中的标志物以及来自步骤2的标志物,两者形成转移到EpiSwitchTM PCR平台上的探针列表。
通过HE对统计探针进行处理,以确定哪些遗传位置富集有统计学显著探针,从而表明哪些遗传位置是表观遗传差异的中心。
基于校正的p值的最显著的富集基因座被选择用于生成探针列表。选择低于p值0.3或0.2的遗传位置。映射到这些遗传位置的统计探针与来自步骤2的标志物一起,形成用于EpiSwitchTM PCR转移的高价值标志物。
阵列设计和处理
阵列设计
使用SII软件(目前为v3.2)处理基因座,以:
-提取出基因组在这些特定基因座的序列(具有上游50kb和下游20kb的基因序列)
-定义该区域内的序列参与CC的概率
-使用特定RE切割序列
-确定哪些限制性片段可能在某个方向上相互作用
-对不同CC一起相互作用的可能性进行排序
-确定阵列大小,从而确定可用探针位置的数量(x)
-提取出x/4个相互作用
-对于每个相互作用,定义距离第1部分的限制性位点30bp的序列和距离第2部分的限制性位点30bp的序列。检查那些区域是否重复,如果重复则排除,并在列表中记录下一个相互作用。连接两个30bp来定义探针。
-创建x/4个探针加上定义的对照探针的列表并复制4次以创建要在阵列上建立的列表
-将探针列表上传到Agilent Sure设计网站,用于定制CGH阵列。
-使用探针组以设计Agilent定制CGH阵列。
阵列处理
-使用EpiSwitchTM Standard Operating Procedure(SOP)处理样本,用于模板生产。
-通过阵列处理实验室用乙醇沉淀法进行清理。
-根据Agilent SureTag完整DNA标记试剂盒处理样本——基于Agilent寡核苷酸阵列的CGH用于血液、细胞或组织的基因组DNA分析酶标记。
-使用Agilent C扫描仪,通过使用Agilent特征提取软件,进行扫描。
EpiSwitchTM生物标志物特征在复杂疾病表型的分类中表现出高稳健性、高敏感性和高特异性。该项技术利用了表观遗传学的最新突破,监测和评估染色体构象特征作为一类信息量丰富的表观遗传生物标志物。目前在学术环境中使用的研究方法需要3天到7天的时间对细胞材料进行生化处理,以检测CCS。这些程序的灵敏度和再现性有限;此外,这些程序也不具备EpiSwitchTMAnalyticalPackage在设计阶段提供的针对性了解的优势。
EpiSwitchTM阵列in silico标志物鉴定
整个基因组的CCS位点由EpiSwitchTM阵列对来自测试队列的临床样本直接进行评估,以鉴定所有相关的分类先导生物标志物。EpiSwitchTM阵列平台因其高通量及其快速筛选大量基因座的能力而被用于标志物鉴定。所使用的阵列是Agilent定制CGH阵列,它允许查询由in silico软件鉴定的标志物。
EpiSwitchTMPCR
然后通过EpiSwitchTM PCR或DNA测序仪(即Roche 454、Nanopore MinION等)对由EpiSwitchTM阵列鉴定的潜在标志物进行验证。选择统计上显著的并显示出最好再现性的排在前列的PCR标志物,以进一步缩减为最终的EpiSwitchTM特征集合,并在独立的样本队列中对其进行验证。EpiSwitchTMPCR可由经培训的技术人员按照已建立的标准化操作程序方案进行。所有方案和试剂制备均在ISO 13485和9001认证下进行,以确保工作质量和转移方案的能力。EpiSwitchTMPCR和EpiSwitchTM阵列生物标志物平台与全血分析和细胞系分析都兼容。这些测试足够灵敏,可以使用少量血液检测出非常低拷贝数的异常。
分类器的使用
本发明的方法可以包括分析在个体中鉴定的染色体相互作用,例如使用分类器,这可以提高性能例如灵敏度或特异性。该分类器通常是已经对来自群体的样本进行了“训练”的分类器,并且这种训练可以帮助分类器检测本文提及的任何预后(包括易感性)。
本发明通过以下来说明:
实施例
使用EpiSwitchTM平台鉴定染色体相互作用标志物,这些标志物代表因感染Sars- Covid-2病毒而导致的染色体构象变化
染色体相互作用标志物是基于排在前列的免疫遗传标志物和基于“纯统计(purestats)”来鉴定的,包括具有与重要临床观察结果如高钙血症的其他生物学联系(围绕Ca稳态破坏、钙调蛋白(calmodulin)、钙调神经磷酸酶(calcineurin)等的标志物)。
预后分类是基于在无症状个体或刚入院的人中的Covid阳性测试后不久的血液采集。分类是基于轻症Covid疾病和重症Covid疾病的结果,前者表现为住院患者留在病房并对治疗有反应,而后者与患者被转移到ICU(重症监护病房)有关。重症患者对医院病房的治疗(额外氧气、抗炎药等)无反应并恶化到ICU急救支持。所述分类会在个体暴露于Covid感染时提供对其免疫健康和过度炎症的预后。
标志物数据基于来自英国、美国和秘鲁的混合队列的80名患者,代表了无症状、轻症和ICU重症病例。42份样本来自秘鲁利马,在利马是Covid-19并发症和死亡人数最多的世界热点地区(秘鲁的人均死亡率最高,为107/100,000,而作为比较,美国为71/100,000;巴西为76/100,000)时收集。有11个样本来自英国,19个样本来自美国。
实验性工作
全血样本取自确诊为Covid-19疾病(SARS-CoV-2感染的症状)的住院患者,并分为两种定义:重症结果和轻症结果。重症结果定义包括入院并需要在ICU护理中进行更积极干预的患者,或除合并症外本应提供这种干预的患者。入院时仅接受氧气治疗和/或在病房接受侵入性较小干预的患者(未入住ICU)被定义为轻症。
EpiSwitchTM微阵列平台最初用于查询具有已知临床结果的患者样本,以获得生物学了解,并鉴定可区分重症和轻症患者样本的一组潜在标志物。目的是鉴定最具统计学显著性和生物学相关性的标志物。这项研究是在全基因组阵列上进行的,在图12的LDA分析中给出了对80名患者中的每一位查询的超过900,000个选择的锚定位点,所有这些都简化为一个线性分数。
对排在前列的EpiSwitch标志物进行引物设计,以鉴定可在实验室中通过嵌套PCR(nPCR)成功查询的相互作用。从成功设计的相互作用的列表中选择排在前列的标志物,并用于通过在完整样本队列中筛选前150个标志物来将微阵列标志物转化为nPCR标志物。
这项工作有三个主要目标:研究全血样本中的Covid-19,鉴定排在前列的微阵列相互作用并将其转移至nPCR中,以及为基于Covid-19严重性全血的EpiSwitchTM nPCR产品提供概念证明。
全血和PBMC通常包含不同的细胞群,在从全血中纯化PBMC组分的密度梯度处理过程中,存在于全血中的大部分粒细胞(嗜碱性粒细胞、嗜中性粒细胞和嗜酸性粒细胞)会丢失(见图2)。在解释结果时,必须牢记这一点。研究设计如图3所示。
42名患者参加了这部分工作的收集。从每个受试者身上采集静脉血样本。采集5ml或更多的全血用于EpiSwitchTM生化处理。
纳入标准
受试者必须在入院的72小时内登记
受试者被招募到以下两组:
-重症病例:24名患者,他们在ICU和/或接受机械通气
-轻症Covid-19:18名患者,他们不在ICU,也没有机械通气,但刚刚住院(他们可以通过鼻插管接受补充氧气)。
将全血样本收集在EDTAK3血液收集管中。随附样本的临床注释由以下组成:
-人口统计
-旅行记录
-症状
-症状出现的日期
-既往医疗状况
-SARS-CoV-2 RT-PCR结果
-标本采集日期
-其他SOC呼吸诊断结果(如有)
-住院日期
-入住ICU的日期(如适用)
-关于机械通气的使用和使用持续时间的信息
-关于补充氧气和使用持续时间的信息
在血液取样后,将EDTA管倒置,使样本与管表面的EDTA涂层混合,以避免血液凝块。将样本储存在-20℃或更低温度,最好在收集后60分钟内。
EpiSwitch文库制备
使用EpiSwitchTM提取方案对42份采集的样本进行处理。用Picogreen和Nanoquant(分别为dsDNA和总核酸测量)对制备的文库进行定量。使用标准的OBD nPCR阳性对照分析对每个制备好的EpiSwitchTM文库进行质量控制,然后储存在-80℃直至在后续步骤中使用。
在生成用于微阵列处理的所需体积的EpiSwitchTM文库后,继续提取以生成用于nPCR转移的所需体积的文库。
微阵列处理
使用单通道分析来利用EpiSwitchTM全基因组中密度蛋白质编码聚焦阵列。该阵列由973,335个EpiSwitchTM相互作用探针和2500个EpiSwitchTM对照探针组成。该设计的重点围绕在基因组(GRCh38)中的蛋白质编码基因座和长非编码RNA基因座。
对42个EpiSwitchTM文库中的每一个进行处理并仅使用Cy3染料标记,以用于单通道微阵列。将每个处理过的文库杂交至单独的微阵列。由四个外部DNA片段组成的顺序连接(in-line)的对照混合物被用于提供质量控制和定量。
微阵列分析
分析EpiSwitchTM微阵列数据,以鉴定两种不同疾病表型状况之间差异检测的相互作用。在统计学和生物学分析中鉴定出排在前列的标志物后,为每个推定的标志物设计nPCR引物组合。只有设计了引物组合的标志物才被转移至nPCR分析。宏基因组引物设计的默认参数最初用于设计标志物的最佳引物组合,随后根据需要提高或降低参数阈值。
EpiSwitchTM探索嵌套PCR转移
对于从微阵列和引物设计中鉴定出的前150个标志物,订购实物引物以实现可以区分重症和轻症疾病表型的nPCR分析的筛选。将全部42个样本队列用于nPCR转移。将每个患者文库归一化为1ng/μldsDNA浓度并获得由1x、1:2x和1:4x组成的系列稀释液以用于分析筛选。
使用5K的芯片和试剂选择,在LabChip GX触摸式高通量毛细管电泳仪上运行终点nPCR产物。在每次分析中使用适当的对照(包括阴性人类基因组对照),以确保检测到的产物是真实的染色体构象捕获产物,而不是高拷贝数基因组DNA的非特异性结合。NTC用于检测试剂的任何交叉污染。
EpiSwitchTM探索嵌套PCR分析
用多种统计技术,包括但不限于Fishers精确检验、GLMNET(逻辑回归)和贝叶斯逻辑回归,来分析EpiSwitch嵌套PCR平台数据输出。在开发EpiSwitch分类器时,使用了以下统计分析:
-XGBoost.一种梯度增强的决策树算法。生成弱决策树模型的集合并将其组合以产生一个强分类模型。
-逻辑主成分分析,优化以使用二元数据。
-GLMNET.通过惩罚最大似然拟合的广义线性模型。
结果和治疗意义
在上述工作中鉴定出的标志物显示在表1至4中,附图显示了额外的数据和结果。如表中所示,平行开发了不同集合的nPCR和qPCR标志物。从阵列中选择qPCR标志物(与nPCR相比)依赖于用于高丰度的额外的过滤器。在这些表中,如果标志物的基因组位置与免疫-遗传基因座(免疫对照的遗传标志物)重叠,则该标志物被标记为“免疫(immune)”,如果其与心血管遗传标志物相交,则被标记为“心血管(cardio)”。
基于鉴定出的标志物的预后测试是在暴露于Covid-19感染下的免疫-健康和免疫能力的量度。高风险组(预后为重症疾病)可能会出现过度炎症并对标准护理治疗反应不佳,提醒医生有必要在密切观察下进行专门治疗:减少病毒载量并引入免疫调节剂。此外,在疫苗使用和分发方面,该测试鉴定应该接受疫苗接种的高风险组。与此同时,在一般工作群体中,它可以帮助鉴定高风险组,以进行进一步的预防性治疗、保护和检疫隔离,同时可以支持低风险组重返工作岗位。
基因通路的鉴定
染色体相互作用标志物对应于调节网络。我们的分析着眼于这些标志物如何与生物通路相对应。我们获得了显示了显著性EpiSwitch3D基因组标志物与代表具体通路的基因座的相对重叠的统计分数。分数越高,则该通路中与基因组结构中的失调位点共定位的基因越多。这在3D基因组学表现水平上显示了通路不同于各个基因的生物学相关性。鉴定出的通路显示了标志物如何与免疫健康(系统免疫能力)相关,而不仅仅是Covid-19疾病模型。
在遗传位置处受3D失调影响的主要通路包括:
-先天免疫系统
-Toll样受体信号通路
-ERK信号传导
-TGF-β信号通路(Wiki通路)
-免疫系统中的细胞因子信号传导
-TCR信号传导(REACTOME)
-Th17细胞分化
-I类MHC介导的抗原加工和呈递
-凋亡通路
-风湿性关节炎
-免疫反应中的免疫反应性NFAT
-辅助性T细胞中的ICos-ICosL通路
-GPCR信号传导
-同种异体移植排斥
-STAT4介导的IL12信号传导
-T淋巴细胞中的MEF2免疫反应功能
-CXCR4介导的信号传导事件
-滑膜成纤维细胞中的凋亡通路
-GPCR通路。
图20显示了实施的标准STRING网络分析,表5显示了网络中与EpiSwitch标志物相关的关键基因的名称。
鉴定的疗法
使用受影响基因的集合和与重症疾病组特异的EpiSwitch显著标志物相关的基因集合来鉴定治疗性化合物。表6显示了化合物列表,图21描述了如何解释该表。
结论
本发明的工作清楚地表明,当使用EpiSwitch标志物(即染色体相互作用标志物)进行3D基因组谱分析时,重症/ICU(重症监护病房)是与轻症或无症状患者不同的表型。此外,这被看做是可以提前预后的。鉴定出的标志物主要定位于负责免疫的基因周围。事实上,这意味着,通过基因组免疫-遗传部分的3D基因组学,在个体中存在免疫-健康倾向。这种倾向意味着,如果某些个体暴露于Covid-19感染,他们将由于其免疫反应的性质而恶化,并且对标准治疗无反应(因此他们被转移到ICU)。他们会经历过度炎症,过度炎症通常靶向特定器官。
与表7的标志物相关的进一步工作
从阵列中选择标志物
加载数据并使用R Limma软件包对其归一化,首先移除Agilent对照探针,下一步骤是排除任何高于系统饱和点65,525的探针,这是由于扫描仪的检测范围。接下来的两个步骤涉及数据的归一化,首先是背景校正,然后使用分位数方法进行阵列之间的归一化,这对阵列上和阵列之间的探针进行了标准化,这两个步骤都最大限度减小了非生物变异。
在归一化之后,并在统计分析之前,立即去除对照中的阳性和spike。采用了两种统计程序用于统计分析,使用LIMMA软件包的线性建模和使用BigRankProduct软件包的秩积分析。线性分析是一种参数方法,而秩积是一种非参数方法。为了使探针具有统计学显著性,它们调整后的p值必须低于<=0.05。比较了来自两种方法的统计列表,并两者的联合进一步通过两个步骤限制。组合统计列表中的下一个过滤器是丰度,探针的丰度尺度(scale)必须是-1.2<=或=>1.2。然后,通过考虑样本的归一化强度对该列表进行进一步过滤,以转移到qPCR,所有样本的强度单位必须大于=>1000,或者其log2尺度必须大于=>9.66。一旦应用了这些过滤器,数据就按照探针丰度值排序(正整数降序排列,负整数升序排列),来自正选择和负选择的前120个至200个标志物形成用于转移到qPCR平台的标志物列表。
最终的C19模型
已经使用严重程度取决于患者是否进行了通气的WHO分类建立了最终的二元结果COVID19模型(见下文)。
/>
处于风险中的患者(非常严重,要通气)是需要通气的患者,而不需要通气的患者形成该分类器中的另一集合,平均风险(不通气)。两个增强分类器形成了CST模型的基础,XGBoost(极端梯度增强)和CatBoost(决策树上的梯度增强),来自这些模型的概率被组合,并且判定是高风险患者是达到组合概率分数=>0.75的患者,平均风险患者是组合概率分数低于<0.75的患者。
最终组合模型统计
第一个混淆表是组合的训练集合和两个测试集合。
用于预测高风险(严重/重症(ICU))的统计数据(n=116)
准确率:92%
灵敏度:96%
特异性:86%
PPV:92%
NPV:93%
参见下文:
第二个是组合的2个测试集合:28个通气患者(ICU(18个)和非ICU(10个)的混合)和死亡患者(11个ICU,8个非ICU,未通气)。在模型构建中没有使用这2个集合。如下所示:
/>
进一步的结论
就测试效率而言,qPCR形式具有许多优点,其中成对引物和探针的高效设计提供了高检测效率。
通过在测试中同时使用多个标志物,可以获得进一步的技术优势。基于EpiSwitch标志物的系统表观遗传信息学读出捕获了反映潜在特定病理表型的细胞水平上的生物网络调节的功能设置。分类模型可以基于反映各个影响因素之间的调节网络相互关系和同步性的生物标志物组。这可以与机器学习模型相结合,并可以对“优化建模”做出决定,包括在测试中使用多少标志物。
脓毒症工作
进一步分析这些标志物以鉴定与脓毒症表型相关的标志物。结果见表12和表13以及图22。必须注意的是,PSMA5是已经在脓毒症领域以及Covid研究中被鉴定为可能的治疗靶点的基因。本工作首次直接揭示了PSMA5基因座在Covid和脓毒症病症中在染色体构象水平上参与相同的失调网络,并提供了用于在冠状病毒患者中监测脓毒症和确定脓毒症样结果的预后的标志物。
/>
/>
表1.a1
/>
/>
表1.a2
/>
/>
/>
表1.a3
/>
/>
表1.a4
/>
/>
表1.a5
/>
/>
表1.a6
/>
/>
表1.a7
/>
/>
/>
表1.b1
/>
/>
表1.b2
/>
/>
Table 1.b3
/>
/>
表1.b4
/>
/>
表1.b5
/>
/>
/>
表1.b6
/>
/>
表1.b7
/>
/>
表1.c1
/>
/>
表1.c2
/>
/>
表1.c3
/>
/>
表1.c4
/>
/>
表1.c5
/>
/>
表1.c6
/>
/>
表1.c7
/>
表2.a
/>
表2.b
表2.c
表2.d
/>
/>
表3.a1
/>
/>
表3.a2
/>
/>
表3.a3
/>
/>
/>
表3.a4
/>
/>
表3.a5
/>
/>
表3.a6
/>
/>
/>
表3.a7
/>
/>
表3.b1
/>
/>
表3.b2
/>
/>
表3.b3
/>
/>
表3.b4
/>
/>
/>
表3.b5
/>
/>
表3.b6
/>
/>
表3.b7
/>
表4.a
表4.b
表4.c
表4.d
/>
表5.a1
/>
表5.a2
/>
表5.a3
/>
表5.a4
/>
/>
表6.a1
/>
表6.a2
阵列_标志物_分型 探针 基因
1 轻症 Hg38_8_30132536_30134220_30177058_30181551_RR DCTN6
2 ICU HG38_1_109341939_109348573_109359719_109366704_RR PSMA5
3 轻症 Hg38_19_55694907_55697956_55776223_55778463_RF NLRP9
4 ICU HG38_6_46130577_46139255_46168740_46175484_fF ENPP4
5 ICU HG38_2_223382061_223395131_223446116_223450606_FF AP1S3
6 ICU HG38_5_76572657_76583168-76676513_76680170-RF IQGAP2
表7a
RPs FC:(class1/class2) pfp P.值 CCSs
1 74556.42789 -1.167913965 0.005042802 0.004887801 免疫
2 48297.45591 1.211313728 0.000190318 2.73916E-05 免疫
3 64771.6835 -1.167926895 0.00063478 0.000168739 免疫
4 46958.78429 1.208676033 0.000190318 5.85964E-05 免疫
5 36942.13688 1.210848175 0.001762385 0.001715734 免疫
6 42674.08273 1.220877422 0.000190318 2.56474E-05 免疫
表7b
表7c
表7d
超始2 终止2
1 30177060 30181059
2 109359721 109363720
3 55774462 55778461
4 46171483 46175482
5 223446605 223450604
6 76676169 76680168
表7e
表7f
表7g
表7h
表7i
qPCR引物集
探针序列
1 ATTTTCGAATTGCTGGCAATCAGTCAGTCCCGC
2 AGATTACCrGAGGTCAGGAGTTCGACATGTAAA
3 TCCAGGTCGAACCTCTCAGCTTGCTCCTTCCT
4 TGCGAATCACAAAGTCAGGAGTTCGAAAGGCTTA
5 TCAGGAGTTCGACCTATACATTTAATGTCATCCC
6 TCCTGAAGTCAGGAGTTCGATTCTATCCCATTAG
表7j
qPCR引物集
修饰Seq
1 /56-FAM/AGC GGG ACT/ZEN/GAC TGA TTG CCA GCA ATT CGA AAA T/3IABkFQ/
2 /56-FAM/TAC ATG TCG/ZEN/AAC TCC TGA CCT CAG GTA ATC TTC C/3IABkFQ/
3 /56-FAM/TAG GAA GGA/ZEN/GCA AGC TGA GAG GTT CGA CCT GG/3IABkFQ/
4 /56-FAM/ATT AAG CCT/ZEN/TTC GAA CTC CTG ACT TTG TGA TTC GC/3IABkFQ/
5 /56-FAM/TGG GAT GAC/ZEN/ATT AAA TGT ATA GGT CGA ACT CCT G/3IABkFQ/
6 /56-FAM/ATA GAA TCG/ZEN/AAC TCC TGA CTT CAG GAA ATC T6C CC/3IABkFQ/
表7k
/>
表8.a1
/>
表8.a2
/>
表8.a3
/>
表8.a4
/>
表8.a5
/>
表8.a6
/>
表8.a7
/>
表8.a8
/>
表8.b1
/>
表8.b2
表8.b3
表8.b4
表8.b5
表8.b6
表8.b7
表8.b8
表8.c1
表8.c2
表8.c3
表8.c4
表8.c5
/>
表8.c6
/>
表8.c7
/>
表8.c8
/>
表8.d1
/>
表8.d2
/>
表8.d3
/>
表8.d4
/>
表8.d5
/>
表8.d6
/>
表8.d7
表8.d8
表8.e1
表8.e2
表8.e3
表8.e4
表8.e5
表8.e6
/>
表8.e7
/>
表8.e8
/>
表8.f1
/>
表8.f2
/>
表8.f3
/>
表8.f4
/>
表8.f5
/>
表8.f6
/>
表8.f7
/>
表8.f8
表8.g1
表8.g2
表8.g3
表8.g4
表8.g5
表8.g6
表8.g7
表8.g8
表9.a
表9.b
表9.c
表9.d
表9.e
/>
表10.a1
/>
表10.a2
/>
表10.a3
/>
表10.a4
/>
表10.a5
/>
表10.a6
/>
表10.a7
/>
表10.a8
/>
表10.b1
/>
表10.b2
/>
表10.b3
表10.b4
表10.b5
表10.b6
/>
表10.b7
表10.b8
表10.c1
表10.c2
表10.c3
表10.c4
/>
表10.c5
/>
表10.c6
/>
表10.c7
/>
表10.c8
/>
表10.d1
/>
表10.d2
/>
表10.d3
/>
表10.d4
/>
表10.d5
/>
表10.d6
/>
表10.d7
/>
表10.d8
201 Hg38_19_11340579_11345804_11418077_11420873_FF RAB3D 75158.23965
202 Hg38_6_31621846_31623705_31658615_31662274_FR BAG6 73476.96162
203 Hg38_6_27833806_27836574_27892394_27893632_FF HIST1H3I 87306.02454
204 Hg38_10_30369802_30374526_30437454_30440597_RR MAP3K8 99482.11373
205 Hg38_1_36421193_36424970_36575866_36579237_RF CSF3R 88238.80531
206 Hg38_19_18333551_18335634_18573351_18575967_FR UBA52 101798.2618
207 Hg38_4_137465162_137478589_137647185_137649115_FR SLC7A11 104516.3011
208 Hg38_2_47522457_47530546_47552565_47559543_FF EPCAM 82019.4599
209 Hg38_11_128362004_128366353_128529463_128539984_RR ETS1 95196.97394
210 Hg38_1_20161773_20167840_20178914_20185415_RF PLA2G2F 71067.54178
211 Hg38_1_121333642_121342053_121433689_121438873_FF FCGR1B 74438.73456
212 Hg38_19_11261901_11265731_11340579_11345804_RF RAB3D 81266.52708
213 Hg38_1_159779096_159781322_159863199_159866609_RF FCRL6 102134.347
214 Hg38_14_87618180_87629304__87841922_87846485_RF GPR65 72699.81319
215 Hg38_2_215339857_215344488_215450480_215454642_FF FN1 96409.36325
216 Hg38_12_54361590_54362896_54482792_54487121_FF GPR84 100643.6652
217 Hg38_1_121333642_121342053_121465918_121472610_FR FCGR1B 75113.82198
218 Hg38_19_14087074_14088724_14138048_14139567_FF PRKACA 100867.5092
219 Hg38_3_55486659_55489812_55535014_55543312_RF WNT5A 101340.9799
220 Hg38_X_133584341_133592788_133714472_133717449_RF GPC3 89298.90821
221 Hg38_6_41533263_41541541_41639865_41645770_FF TFEB 83891.12372
222 Hg38_20_23532159_23546814_23581107_23587842_FR CST9 103099.2686
223 Hg38_7_6241289_6247872_6305163_6306814_FR RAC1 96671.96879
224 Hg38_8_85458958_85464677_B5620981_85632239_FR CA2 94553.62101
225 Hg38_1_39655161_39659067_39891844_39898103_FF PPIE 85073.55945
226 Hg38_1_121080942_121088798_121333642_121342053_RF FCGR1B 81524.31487
227 Hg38_19_50382303_50383705_50507414_50511937_FR NR1H2 91360.83698
228 Hg38_6_27728784_27735060_27860135_27864160_RF HIST1H3H 82074.91985
229 Hg38_13_52856863_52871994_53037034_53038116_RR OLFM4 100019.3414
230 Hg38_19_55646678_55648748_55776223_55778463_FF NLRP9 90744.99246
231 Hg38_3_107828110_107834026_107847362_107853810_FF CD47 86522.95908
232 Hg38_1_121302597_121312167_121333642_121342053_RF FCGR1B 75746.22226
233 Hg38_6_33032719_33045940_33181270_33183497_RF HLA-DPA1 86309.24088
234 Hg38_6_108163024_108164102_108359267_108371469_RR OSTM1 102519.1724
235 Hg38_11_6268414_6277518_6399479_6402059_RF APBB1 88516.17938
236 Hg38_19_38359207_38361549_38528221_38534565_FF RASGRP4 92074.97165
237 Hg38_1_203176687_203182913_203223882_203229092_FR CHI3L1 92883.913
表10.e1
表10.e2
/>
表10.e3
/>
表10.e4
/>
表10.e5
/>
表10.e6
/>
表10.e7
表10.e8
表11.a
表11.b
表11.a3
表11.c
表11.d
在“S_ss”和“aPCR_ICU”中的27个共同要素
探针
1 HG38_5_74325511_74329920_74537627_74543794_FR
2 HG38_22_38362202_38364548_38442867_38446753_FF
3 HG38_12_8956666_8971971_9041253_9052225_RF
4 HG38_15_34886920_34889054_34974237_34980574_FF
5 HG38_11_118323848_118335396_118462783_118464333_RR
6 HG38_14_56302711_56310533_56523582_56531640_RR
7 HG38_21_10469195_10476377_10561289_10564307_FF
8 HG38_8_100518647_100527202_100566246_100573436_FR
9 HG38_3_140876349_140880490_140923822_140931266_FR
10 HG38_3_10166863_10171451_10267732_10269649_RF
11 HG38_18_56075450_56084543_56148926_56154674_RF
12 HG38_6_6906046_6910447_7167574_7173314_FF
13 HG38_6_96904639_96916143_97164838_97174050_FR
14 HG38_7_38195275_38200060_38339555_38347520_RF
15 HG38_9_104713365_104717628_104860975_104864532_FR
16 HG38_8_5120591_5125403_5295149_5302540_FF
17 HG38_1_109341939_109348573_109359719_109366704_RR
18 HG38_16_73137152_73141460_73235290_73240438_RR
19 HG38_5_67178844_67182260_67213797_67219491_FR
20 HG38_1_109359719_109366704_109565116_109566579_RF
21 HG38_15_65465777_65469194_65573794_65596385_RF
22 HG38_1_17044824_17050263_17192218_17198113_FF
23 HG38_9_77019945_77021308_77093295_77095880_FR
24 HG38_22_37732067_37737457_37944696_37945909_FF
25 HG38_16_20282299_20286605_20445721_20457266_FR
26 HG38_1_220397549_220404820_220583887_220590755_FR
27 HG38_2_13572319_13584069_13777052_13783676_RR
表12.a
/>
表12.b
/>
表12.c
表12.d
表12.d
/>
表12.e
表13.a
表13.b
表13.c
表13.d
表13.e
/>
表14.a1
/>
表14.a2
/>
表14.a3
/>
表14.a4
表14.a5
表14.a6
表14.a7
表14.a8
表14.a9
表14.a10
表14.b1
表14.b2
表14.b3
表14.b4
表14.b5
表14.b6
表14.b7
表14.b8
表14.b9
表14.b10
/>
表15.a1
/>
表15.a2
/>
/>
表15.a3
/>
表15.a4
/>
表15.a5
/>
/>
表15.a6
/>
表15.a7
/>
表15.a8
/>
表15.b1
/>
表15.b2
/>
表15.b3
/>
表15.b4
/>
/>
表15.b5
/>
表15.b6
/>
表15.b7
/>
表15.b8
/>
表15.c1
/>
表15.c2
/>
表15.c3
/>
表15.c4
/>
表15.c5
/>
表15.c6
/>
表15.c7
/>
表15.c8
/>
表16.a
/>
表16.b
/>
表16.c
/>
表16.d
/>
表16.e
/>
表16.f
/>
/>
表16.g
/>
表16.h
/>
表16.i
/>
/>
表17.a1
/>
表17.a2
/>
表17.a3
/>
表17.a4
/>
/>
表17.a5
/>
表17.a6
/>
表17.a7
/>
表17.a8
表17.b1
表17.b2
表17.b3
表17.b4
表17.b5
表17.b6
表17.b7
表17.b8。

Claims (33)

1.一种在个体中检测冠状病毒感染预后的方法,其包括确定由表1或表3中所示探针所代表的一个或多个染色体相互作用的存在与否,从而确定所述个体中的所述预后。
2.根据权利要求1所述的方法,其中:
(i)对来自表1的至少5个染色体相互作用进行分型,和/或
(ii)对来自表3的至少5个染色体相互作用进行分型。
3.根据权利要求1或2所述的方法,其中所述冠状病毒感染是Covid-19感染。
4.根据前述权利要求中任一项所述的方法,其中:
(i)对来自表2的至少5个染色体相互作用进行分型,和/或
(ii)对来自表4的至少5个染色体相互作用进行分型。
5.根据前述权利要求中任一项所述的方法,其中对所述染色体相互作用进行分型:
-在来自个人的样本中,和/或
-通过检测在所述染色体相互作用位点是否存在DNA环,和/或
-检测是否存在在染色体构象中聚集在一起的染色体远端区域,和/或
-通过检测在所述分型过程中产生的连接核酸的存在,并且所述连接核酸的序列包括两个区域,每个区域对应于在所述染色体相互作用中聚集在一起的染色体区域,和/或
-通过检测在所述染色体相互作用中聚集在一起的染色体区域的接近度的方法。
6.根据前述权利要求中任一项所述的方法,其中所述检测染色体相互作用的存在与否是通过包括以下步骤的方法进行的:
(i)对存在的表观遗传染色体相互作用进行体外交联;
(ii)任选地分离交联的DNA;
(iii)对所述交联的DNA进行切割;
(iv)连接所述交联的切割的DNA末端以形成连接DNA;和
(v)鉴定所述连接DNA的存在与否;
从而确定所述染色体相互作用的存在与否。
7.根据权利要求5或6所述的方法,其中通过PCR或使用探针检测所述连接DNA。
8.根据权利要求7所述的方法,其中:
(i)通过使用探针进行检测,其中所述探针与表1或表3中所示的任一探针具有至少70%的一致性,或
(ii)通过使用PCR进行检测,其中所述PCR使用与表1或表3中所示的任一引物对具有至少70%一致性的引物对。
9.根据前述权利要求中任一项所述的方法,其中:
(i)预先预后性地实施所述方法,以检测个体在暴露于冠状病毒例如Covid-19后随后发生严重过度炎症并发症的高风险,和/或
(ii)实施所述方法以选择接受冠状病毒感染疗法或治疗的个体,和/或
(iii)对基于身体特征、风险因素或症状的存在而预先选定的个体实施所述方法,和/或
(iv)实施所述方法以确定对冠状病毒感染严重程度的预后,和/或(v)实施所述方法以确定对发展出作为冠状病毒疾病的一部分的脓毒症的预后,和/或
(vi)实施所述方法以确定对作为冠状病毒疾病的一部分的细胞因子释放综合征的预后。
10.根据前述权利要求中任一项所述的方法,其中所述个体:
(i)被怀疑患有冠状病毒或Covid-19感染,及/或
(ii)已入院。
11.根据前述权利要求中任一项所述的方法,其中对至少5个染色体相互作用进行分型,所述染色体相互作用存在于:
(i)表1或表3所示的任何4kb区域中,和/或
(ii)表1或表3所示的基因中。
12.根据前述权利要求中任一项所述的方法,其中对至少10、20、30或50个染色体相互作用进行分型,并且优选地,对5个至50个染色体相互作用进行分型。
13.一种在个体中检测冠状病毒感染预后的方法,其任选地从属于前述权利要求中的任一项,所述方法包括确定由表7所示探针代表的一个或多个染色体相互作用的存在与否,从而确定所述个体中的所述预后。
14.根据权利要求13所述的方法,其中对来自表7的至少3、4、5或6个染色体相互作用进行分型,和/或其中所述冠状病毒感染是Covid-19感染。
15.根据权利要求13或14所述的方法,其中对所述染色体相互作用进行分型:
-在来自个人的样本中,和/或
-通过检测在所述染色体相互作用位点是否存在DNA环,和/或
-检测是否存在在染色体构象中聚集在一起的染色体远端区域,和/或
-通过检测在所述分型过程中产生的连接核酸的存在,并且所述连接核酸的序列包括两个区域,每个区域对应于在所述染色体相互作用中聚集在一起的染色体区域,和/或
-通过检测在所述染色体相互作用中聚集在一起的染色体区域的接近度的方法。
16.根据权利要求13至15中任一项所述的方法,所述检测染色体相互作用的存在与否是通过包括以下步骤的方法进行的:
(i)对存在的表观遗传染色体相互作用进行体外交联;
(ii)任选地分离交联的DNA;
(iii)对所述交联的DNA进行切割;
(iv)连接所述交联的切割的DNA末端以形成连接DNA;和
(v)鉴定所述连接DNA的存在与否;
从而确定所述染色体相互作用的存在与否。
17.根据权利要求13至16中任一项所述的方法,其中通过PCR或使用探针检测所述连接DNA。
18.根据权利要求17所述的方法,其中:
(i)通过使用探针进行检测,其中所述探针与表7中所示的任一探针具有至少70%的一致性,或
(ii)通过使用PCR进行检测,其中所述PCR使用与表7中所示的任一引物对具有至少70%一致性的引物对。
19.根据权利要求17或18中任一项所述的方法,其中使用qPCR系统检测所述连接DNA,在所述qPCR系统中,所述探针与表7中所示的任一探针具有至少70%的一致性,所述引物对与表7中所示的任一引物对具有至少70%的一致性;其中优选地,所述探针序列是表7所示的探针序列的序列或包含表7所示的探针序列的序列,和/或每个引物具有表7所示的引物的序列或包含表7所示的引物的序列。
20.根据权利要求17至19中任一项所述的方法,其中检测由表7的探针所代表的所有6个染色体相互作用的存在与否,任选地使用表7中所示的所有探针和/或所有引物对。
21.根据权利要求13至20中任一项所述的方法,其中:
(i)预先预后性地实施所述方法,以检测个体在暴露于冠状病毒例如Covid-19后随后发生严重过度炎症并发症的高风险,和/或
(ii)实施所述方法以选择接受冠状病毒感染疗法或治疗的个体,和/或
(iii)对基于身体特征、风险因素或症状的存在而预先选定的个体实施所述方法,和/或
(iv)实施所述方法以确定对冠状病毒感染严重程度的预后,和/或(v)实施所述方法以确定对发展出作为冠状病毒疾病的一部分的脓毒症的预后,和/或
(vi)实施所述方法以确定对作为冠状病毒疾病的一部分的细胞因子释放综合征的预后。
22.根据权利要求13至21中任一项所述的方法,其中所述个体:
(i)被怀疑患有冠状病毒或Covid-19感染,及/或
(ii)已入院。
23.根据前述权利要求中任一项所述的方法,其中所述对染色体相互作用进行分型包括通过定量PCR(qPCR)对连接产物的专门检测,所述定量PCR使用能够扩增所述连接产物的引物和在PCR反应过程中结合连接位点的探针,其中所述探针包括与来自在染色体相互作用中聚集在一起的每个染色体区域的序列互补的序列,其中优选地,所述探针包括:
-与所述连接产物特异性结合的寡核苷酸,和/或
-与所述寡核苷酸5'末端共价连接的荧光团,和/或
-与所述寡核苷酸3'末端共价连接的猝灭剂,和
任选地,
-所述荧光团选自HEX、德克萨斯红和FAM;和/或
-所述探针包括长度为10个至40个核苷酸碱基的核酸序列,优选包括长度为20个至30个核苷酸碱基的核酸序列。
24.根据前述权利要求中任一项所述的方法,其包括确定由表8、表9、表10、表11、表12、表13、表14、表15、表16或表17中任一表所示的探针所代表的一个或多个染色体相互作用的存在与否,从而确定所述个体中的所述预后。
25.根据前述权利要求中任一项所述的方法,其包括确定是否存在:
-与重症冠状病毒感染相关的一个或多个染色体相互作用,其中优选地,所述染色体相互作用如表8、表9、表14或表15所示,和/或
-与轻症冠状病毒感染相关的一个或多个染色体相互作用,其中优选地,所述染色体相互作用如表10、表11、表16或表17所示。
26.根据前述任一项所述的方法,其中通过权利要求17所述的方法确定染色体相互作用的存在与否,并且:
(i)通过使用探针进行检测,其中所述探针与表9或表11中所示的任一探针具有至少70%的一致性,或
(ii)通过使用PCR进行检测,其中所述PCR使用与表9或表11中所示的任一引物对具有至少70%一致性的引物对。
27.根据权利要求26所述的方法,其中使用qPCR系统检测所述连接DNA,在所述qPCR系统中,所述探针与表9、表11、表14或表16中所示的任一探针具有至少70%的一致性,所述引物对与表9、表11、表14或表16中所示的任一引物对具有至少70%的一致性;其中优选地,所述探针序列是表9、表11、表14或表16所示的探针序列的序列或包含表9、表11、表14或表16所示的探针序列的序列,和/或每个引物具有表9、表11、表14或表16所示的引物的序列或包含表9、表11、表14或表16所示的引物的序列。
28.根据前述权利要求中任一项所述的方法,其中检测由表9或表11中的探针所代表的至少5个染色体相互作用的存在与否,任选地使用表9或表11中所示的所有探针和/或所有引物对。
29.根据前述权利要求中任一项所述的方法,其包括通过检测表12或表13中所示的任何染色体相互作用的存在与否来检测所述个体的脓毒症状态。
30.一种治疗剂,其选自表6中所示的任何剂,用于治疗重症冠状病毒疾病的方法之用途,所述方法包括:
-通过前述权利要求中任一项所述的方法鉴定个体是否对重症冠状病毒疾病易感,和
-对任何被鉴定为易感的个体施用所述剂。
31.一种剂,其:
-预防或治疗冠状病毒感染,和/或
-预防或治疗有害的免疫反应;
用于治疗已根据权利要求1至29中任一项被鉴定为对由冠状病毒感染导致的重症疾病易感的个体之用途。
32.一种治疗脓毒症的治疗剂,用于治疗脓毒症的方法之用途,所述方法包括:
-通过权利要求1至29中任一项所述的方法鉴定个体是否对脓毒症易感或患有脓毒症,和
-对任何被鉴定为对脓毒症易感或患有脓毒症的个体施用所述剂。
33.一种预防或治疗脓毒症的剂,其用于治疗已根据权利要求1至30中任一项被鉴定为对脓毒症易感或患有脓毒症的个体之用途。
CN202280017694.2A 2021-01-07 2022-01-06 染色体相互作用 Pending CN117203350A (zh)

Applications Claiming Priority (6)

Application Number Priority Date Filing Date Title
US63/134,765 2021-01-07
US63/134,776 2021-01-07
US202163163700P 2021-03-19 2021-03-19
US63/163,698 2021-03-19
US63/163,700 2021-03-19
PCT/GB2022/050009 WO2022148957A1 (en) 2021-01-07 2022-01-06 Chromosome interactions

Publications (1)

Publication Number Publication Date
CN117203350A true CN117203350A (zh) 2023-12-08

Family

ID=88987364

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202280017694.2A Pending CN117203350A (zh) 2021-01-07 2022-01-06 染色体相互作用

Country Status (1)

Country Link
CN (1) CN117203350A (zh)

Similar Documents

Publication Publication Date Title
JP2023082157A (ja) 遺伝子調節
US20200407790A1 (en) Biomarker
AU2022206099B2 (en) Chromosome interactions
AU2020344206B2 (en) Diagnostic chromosome marker
WO2015125106A1 (en) Variant analysis in high-throughput sequencing applications
CN117203350A (zh) 染色体相互作用
AU2021283746B2 (en) Detecting a chromosome conformation as marker for fibrosis, e.g. scleroderma
JP2022512842A (ja) 染色体バイオマーカー
AU2021360263B2 (en) Disease marker
CN112048552B (zh) 诊断重症肌无力的肠道菌群及其应用
AU2022230780B2 (en) Chromosome interaction markers
CN117795098A (zh) 染色体相互作用标志物
JPWO2020225551A5 (zh)

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination