CN111836907A

CN111836907A - 基因组位点处核小体修饰和突变的定量方法及其临床应用

Info

Publication number: CN111836907A
Application number: CN201980018514.0A
Authority: CN
Inventors: M·W·考雷司; 迈克尔-克里斯托弗·基奥
Original assignee: Epsilover Ltd
Current assignee: Epsilover Ltd; Epicypher Inc
Priority date: 2018-01-10
Filing date: 2019-01-10
Publication date: 2020-10-27
Also published as: US20230407406A1; WO2019140082A1; AU2019206547A1; EP3737772A1; CA3088077A1; JP2023182657A; EP3737772A4; US20200332370A1; JP2021510306A

Abstract

本发明涉及定量染色质映射分析的临床应用，例如，染色质免疫沉淀分析和采用束缚酶的分析(例如，染色质免疫切割(ChIC)和核酸酶靶向切割和释放(CUT&

Description

基因组位点处核小体修饰和突变的定量方法及其临床应用

优先权声明

本申请要求2018年1月10日提交的序列号为62/615,770的美国临时申请的权益，通过引用，该临时申请通过引用全文纳入本申请中。

技术领域

本发明涉及定量染色质映射分析的临床应用，例如，染色质免疫沉淀分析和采用束缚酶的分析(例如，染色质免疫切割(ChIC)和核酸酶靶向切割和释放

)。所述方法可以用于检测和定量生物样品中核小体(组蛋白和/或DNA)上的表观遗传修饰和突变的存在，监测这些修饰和突变状态的变化，监测表观遗传和突变治疗的效果，选择合适的疾病治疗方法，确定受试者的预后，鉴定疾病的生物标记，及筛选修饰表观遗传或突变状态的试剂。本发明进一步涉及本发明方法中使用的试剂盒。

背景技术

调节蛋白、组蛋白翻译后修饰(PTM)和染色质结构之间的合作功能代表了一种复杂的系统级信号传导网络。许多染色质调控因子与多种人类病理学有关，包括白血病(Yooet al.,Int.J.Biol.Sci.8(1):59(2012))、结直肠癌(Ashktorab et al.,Dig.Dis.Sci.54(10):2109(2009)；Benard et al.,BMC Cancer 14:531(2014))、阿尔茨海默病(Hendrickxet al.,PLoS One 9(6):e99467(2014))和亨廷顿病(Moumne et al.,Front.Neurol.4:127(2013))。因此，这些酶(即组蛋白PTM)的催化靶正作为有用的疾病指标(Khan et al.,World J.Biol.Chem.6(4):333(2015)；Chervona et al.,Am.J.Cancer Res.2(5):589(2012))而不断出现。到目前为止，市场上有几种FDA-批准的治疗癌症的表观遗传靶向药，许多靶向染色质调控的治疗方法正在进入临床前开发和I/II期临床试验(Jones et al.,Nat.Rev.Genet.17(10):630(2016))。

无法对患者的响应直接检测和定量仍然是继续阻碍表观遗传药物开发的巨大技术障碍。定义患者独特的表观遗传背景，然后对这种背景如何因响应治疗而发生改变进行监测，对于根据患者独特的遗传学和表观遗传学特征，对患者的响应进行选择、分类和评价非常具有价值。但是，目前使用的组蛋白PTM定量工具的临床研究不够可靠(即定量性、鲁棒性等)。ChIP采用抗体来富集包含特异性组蛋白PTM的核小体；然后，分离相关DNA，并分别采用qPCR或新一代测序(NGS)法映射到特异性基因组位点，提供所研究PTM的局部或全基因组-范围的情况。但是，ChIP-seq方法最多只能算半-定量方法(Park et al.,Nat.Rev.Genet.10(10):669(2009))。或者，可以采用ELISA，但是，这种方法仅限于定量总体PTM变化(即并非选择的基因组位点处的变化)，因此，对于鉴定/测定癌症-特异性生物标记缺少分辨率和灵敏度。因此，只是常规间接监测疾病进程和患者对表观遗传靶向治疗的任何反应(例如，通过测定下游代谢物、基因表达等的变化)。因此，临床前/临床药物开发流程中目前缺少患者-特定的表观遗传背景和对治疗反应的任何直接量化方法。

值得注意的是，人们已经开发了新的染色质映射方法，将酶束缚到基因组区域，从而引起靶材料释放、富集，并在之后开展分析(例如，DamID、ChIC、ChEC和

方法)。CUT&RUN(核酸酶靶向切割和释放)方法(PCT/US2018/052707)开发了使用固相载体的完整细胞稳健方案，扩展了以前的染色质免疫切割方法(ChIC；美国专利No.7,790,379)。

和ChIC采用因子-特异性抗体将蛋白A的融合蛋白和微球菌核酸酶(pA-MN)束缚到完整细胞的基因组结合位点，然后，加入钙激活，从而切割DNA。pA-MN提供了将抗体束缚到目标PTM、转录因子或染色质蛋白质的切割束缚系统。CUT&RUN分析采用很少的100个细胞和300万次读数，即可获得高质量、可重现的全基因组PTM映射数据。虽然染色质映射技术(与传统ChIP相比)取得了这些显著的进步，但是，样品的易变性及无法监测抗体性能仍然是巨大的技术障碍。

最近，开发了一种新的ChIP定量方法，称为ICeChIP(内标校准的ChIP(Grzybowskiet al.,Mol.Cell,2015.58(5):886(2015))和美国公开No.2016/0341743。此方法已经以CAP-

(校准和抗体谱分析)及SNAP-

(样品归一化和抗体谱分析)的名称商业化。这种技术采用携带特异性组蛋白PTM的DNA条形码化设计者核小体(dNucs)作为内部对照标准物，用于样品归一化和校准。将条形码化的dNucs掺入到各种浓度(其条形码序列中编码的相对数量)的片段染色质样品中，然后，采用磁珠固定抗体(对目标PTM具有特异性)捕获此库中(细胞衍生的和dNuc)的核小体。在免疫沉淀后，开展NGS(或qPCR)数据分析，了解检测的读数，用于：1)每个条形码；及2)输入库和IP-捕获库内的样品DNA。然后，将IP读数归一化为每个条形码dNuc的输入浓度，得到一条标准曲线，用于样品DNA读数直接定量。条形码dNucs作为直接校准物，因为他们在ChIP处理期间会经历与样品染色质同样的易变性来源的影响，并且代表内源性抗体靶，修饰的单核小体。

本领域需要一种用于临床应用和药物开发的定量生物样品中组蛋白PTM的可靠且稳健的方法。

发明内容

本发明涉及条形码化重组设计者核小体作为定量染色质映射分析(如ChIP,ChIC或CUT&RUN)的掺入对照的临床应用，所述定量染色质映射分析监测靶向表观遗传治疗和其它治疗之前和之后患者样品中的组蛋白PTM、染色质相关蛋白(例如，转录因子、染色质结合蛋白、染色质重塑剂等)，和/或突变。直接定量染色质修饰和调节蛋白全基因组的能力提供了表观遗传治疗效果强大的读数功能及能够开发出用于疾病治疗的伴随诊断方法。因此，本方法用于药物开发和临床应用。

本发明中使用的染色质分析可以是本领域熟悉的产生定量结果的任何染色质分析。实例包括但不限于CUT&RUN分析(PCT/US2018/052707)、ChIC分析(美国专利No.7,790,379)和ICeChIP分析(WO 2015/117145)。这些参考文献全文纳入本申请中。

在一些实施例中，定量染色质分析是染色质免疫沉淀分析。因此，本发明的一个方面涉及一种检测和定量受试者生物样品染色质内特异性基因组位点核心组蛋白表位处表观遗传修饰或突变的方法，所述方法包括：

a)从受试者分离生物样品；

b)从所述生物样品的染色质制备天然核小体文库，其中所述文库包括核小体，所述核小体包括具有表位的核心组蛋白及多核苷酸，所述多核苷酸包括指示基因组位点的核苷酸序列。

c)向文库中加入标准物，建立掺杂文库；其中所述标准物包括重组核小体，其包括：(i)具有表位的标准组蛋白或组蛋白片段和(ii)标准多核苷酸，包括核小体定位序列和条形码标识序列，其中标准组蛋白或组蛋白片段和标准多核苷酸形成稳定的蛋白质-DNA结合；

d)向掺杂文库中加入亲和试剂，捕获一定数量的天然核小体和包含表位的标准物；

e)将掺杂文库输入数量中与被捕获的含表位天然核小体结合的给定核苷酸序列的数量与和天然核小体结合的给定核苷酸序列的数量进行比较，确定表位的相对基因组丰度；

f)将掺杂文库输入数量中与被捕获标准物结合的条形码标识序列的数量与和标准物结合的给定核苷酸序列的数量进行比较，确定表位的标准物捕获效率；

g)将相对基因组丰度与标准物捕获效率进行比较，确定基因组位点核心组蛋白表位的密度；从而，检测和定量表位的表观遗传修饰或突变。

本发明的另一个方面涉及一种测定和定量患有疾病或病症的受试者生物样品染色质中特异性基因组位点表观遗传或突变状态的方法，所述方法包括：

a)从受试者分离生物样品；

g)将相对基因组丰度与标准物捕获效率进行比较，确定基因组位点核心组蛋白表位的密度；从而测定和定量基因组位点表观遗传或突变的状态。

本发明的另一个方面涉及一种监测受试者生物样品染色质中特异性基因组位点表观遗传或突变状态随时间变化的方法，所述方法包括：

a)从受试者分离生物样品；

g)将相对基因组丰度与标准物捕获效率进行比较，确定基因组位点核心组蛋白表位的密度；

h)重复步骤a)至g)至少一次；及

从而监测基因组位点处表观遗传或突变状态随时间的变化情况。

本发明的另一个方面涉及一种监测患有与表观遗传修饰或突变有关的疾病或病症的受试者表观遗传治疗或突变治疗有效性的方法，所述方法包括监测受试者生物样品染色质中特异性基因组位点表观遗传或突变状态随时间变化的情况，所述方法包括：

a)从受试者分离生物样品；

h)在表观遗传治疗或突变治疗开始后重复步骤a)至g)至少一次；

从而监测受试者表观遗传治疗或突变治疗的有效性。

本发明的另一个方面涉及一种根据受试者生物样品染色质中特异性基因组位点表观遗传或突变状态的情况，选择患有与表观遗传修饰或突变有关的疾病或病症的受试者合适治疗的方法，所述方法包括：

a)从受试者分离生物样品；

h)根据核心组蛋白表位的表观遗传或突变状态，选择合适的治疗。

本发明的另一个方面涉及一种根据受试者生物样品染色质中特异性基因组位点表观遗传或突变状态的情况，确定患有与表观遗传修饰或突变有关的疾病或病症的受试者预后的方法，所述方法包括：

a)从受试者分离生物样品；

c)向文库中加入标准物，建立掺杂文库；其中所述标准物包括重组核小体，包括：(i)具有表位的标准组蛋白或组蛋白片段和(ii)标准多核苷酸，包括核小体定位序列和条形码标识序列，其中标准组蛋白或组蛋白片段和标准多核苷酸形成稳定的蛋白-DNA结合；

h)根据核心组蛋白表位的表观遗传或突变状态，确定受试者的预后。

本发明的另一个方面涉及一种根据受试者生物样品染色质中特异性基因组位点表观遗传或突变状态的情况，鉴定与表观遗传修饰或突变有关的疾病或病症的生物标记的方法，所述方法包括：

a)从受试者分离生物样品；

h)将基因组位点的表观遗传或突变状态与表观遗传修饰或突变相关疾病或病症相关联；

从而鉴定表观遗传修饰或突变相关疾病或病症的生物标记。

本发明涉及一种筛选修饰受试者生物样品染色质中特异性基因组位点表观遗传或突变状态的试剂的方法，所述方法包括在存在和不存在所述试剂的条件下测定基因组位点的表观遗传或突变状态；

其中所述测定基因组位点的表观遗传或突变状态包括：

a)从受试者分离生物样品；

其中存在和不存在所述试剂的条件下基因组位点表观遗传或突变状态发生变化，则表明试剂修饰基因组位点的表观遗传或突变状态。

在一些实施例中，定量染色质分析是采用束缚酶的染色质映射分析。因此，本发明的一个方面涉及一种检测和定量受试者生物样品染色质内特异性基因组位点核心元件表位处表观遗传修饰或突变的方法，所述方法包括：

a)从受试者分离生物样品；

b)将生物样品中包括带表位核心元件的细胞、细胞核、细胞器或组织与固相载体结合；

c)透化处理细胞、细胞核、细胞器或组织；

d)将固相载体与包括带表位核心元件的重组核小体标准物结合，所述核小体标准物包括：

a.蛋白八聚体，包含组蛋白H2A、H2B、H3和H4中每个组蛋白的两个拷贝，及任选包含连接组蛋白H1；

b.DNA分子，包括：

i.核小体定位序列，

ii.DNA条形码；

iii.核酸酶或转座酶识别序列；及

c.与DNA分子连接的结合成员，其中所述结合成员与结合伴侣特异性结合；

e)将c)所述的透化细胞、细胞核、细胞器或组织及d)所述的结合核小体标准物与和所述表位特异性结合的亲和试剂接触；

f)加入与核酸酶或转座酶结合的亲和试剂-结合试剂；

g)使核酸酶或转座酶切割细胞、细胞核、细胞器或组织中的DNA及核小体标准物中的核酸酶或转座酶识别序列；

h)分离切割的DNA；及

i)鉴定切割的DNA；及

j)通过将其丰度与核小体标准物进行比较，对基因组位点的表位进行检测和定量。

本发明的另一个方面涉及一种测定和定量患有疾病或病症的受试者生物样品染色质中特异性基因组位点核心元件表位的表观遗传或突变状态的方法，所述方法包括：

a)从受试者分离生物样品；

c)透化处理细胞、细胞核、细胞器或组织；

b.DNA分子，包括：

i.核小体定位序列，

ii.DNA条形码；

iii.核酸酶或转座酶识别序列；及

f)加入与核酸酶或转座酶结合的亲和试剂-结合试剂；

h)分离切割的DNA；及

i)鉴定切割的DNA；及

j)通过将其丰度与核小体标准物进行比较，对基因组位点的表位进行检测和定量；

从而测定和定量基因组位点表观遗传或突变的状态。

本发明的另一个方面涉及一种监测受试者生物样品染色质中特异性基因组位点核心元件表位的表观遗传或突变状态随时间变化的方法，所述方法包括：

a)从受试者分离生物样品；

c)透化处理细胞、细胞核、细胞器或组织；

b.DNA分子，包括：

i.核小体定位序列，

ii.DNA条形码；

iii.核酸酶或转座酶识别序列；及

f)加入与核酸酶或转座酶结合的亲和试剂-结合试剂；

h)分离切割的DNA；及

i)鉴定切割的DNA；

j)通过将相对基因组丰度与核小体标准物进行比较，对基因组位点的表位进行检测和定量；

k)重复步骤a)至j)至少一次；

本发明的另一个方面涉及一种监测患有与表观遗传修饰或突变有关的疾病或病症的受试者表观遗传治疗或突变治疗有效性的方法，所述方法包括监测受试者生物样品染色质中特异性基因组位点核心元件表位的表观遗传或突变状态随时间变化的情况，所述方法包括：

a)从受试者分离生物样品；

c)透化处理细胞、细胞核、细胞器或组织；

b.DNA分子，包括：

i.核小体定位序列，

ii.DNA条形码；

iii.核酸酶或转座酶识别序列；及

f)加入与核酸酶或转座酶结合的亲和试剂-结合试剂；

h)分离切割的DNA；及

i)鉴定切割的DNA；

k)重复步骤a)至j)至少一次；

从而监测受试者表观遗传治疗或突变治疗的有效性。

本发明的另一个方面涉及一种根据受试者生物样品染色质中特异性基因组位点核心元件表位的表观遗传或突变状态的情况，选择患有与表观遗传修饰或突变有关的疾病或病症的受试者合适治疗的方法，所述方法包括：

a)从受试者分离生物样品；

c)透化处理细胞、细胞核、细胞器或组织；

b.DNA分子，包括：

i.核小体定位序列，

ii.DNA条形码；

iii.核酸酶或转座酶识别序列；及

f)加入与核酸酶或转座酶结合的亲和试剂-结合试剂；

h)分离切割的DNA；及

i)鉴定切割的DNA；

k)根据核心元件表位的表观遗传或突变状态，选择合适的治疗。

本发明的另一个方面涉及一种根据受试者生物样品染色质中特异性基因组位点核心元件表位的表观遗传或突变状态的情况，确定患有与表观遗传修饰或突变有关的疾病或病症的受试者预后的方法，所述方法包括：

a)从受试者分离生物样品；

c)透化处理细胞、细胞核、细胞器或组织；

b.DNA分子，包括：

i.核小体定位序列，

ii.DNA条形码；

iii.核酸酶或转座酶识别序列；及

f)加入与核酸酶或转座酶结合的亲和试剂-结合试剂；

h)分离切割的DNA；及

i)鉴定切割的DNA；

j)通过将相对基因组丰度与核小体标准物进行比较，对基因组位点的表位进行检测和定量；及

k)根据核心元件表位的表观遗传或突变状态，确定受试者的预后。

本发明的另一个方面涉及一种根据受试者生物样品染色质中特异性基因组位点核心元件表位的表观遗传或突变状态的情况，鉴定与表观遗传修饰或突变有关的疾病或病症的生物标记的方法，所述方法包括：

a)从受试者分离生物样品；

c)透化处理细胞、细胞核、细胞器或组织；

b.DNA分子，包括：

i.核小体定位序列，

ii.DNA条形码；

iii.核酸酶或转座酶识别序列；及

f)加入与核酸酶或转座酶结合的亲和试剂-结合试剂；

h)分离切割的DNA；及

i)鉴定切割的DNA；

k)将基因组位点的表观遗传或突变状态与表观遗传修饰或突变相关疾病或病症相关联；

从而鉴定表观遗传修饰或突变相关疾病或病症的生物标记。

本发明涉及一种筛选修饰受试者生物样品染色质中特异性基因组位点核心元件表位的表观遗传或突变状态的试剂的方法，所述方法包括在存在和不存在所述试剂的条件下测定基因组位点的表观遗传或突变状态；

其中所述测定基因组位点的表观遗传或突变状态包括：

a)从受试者分离生物样品；

c)透化处理细胞、细胞核、细胞器或组织；

b.DNA分子，包括：

i.核小体定位序列，

ii.DNA条形码；

iii.核酸酶或转座酶识别序列；及

f)加入与核酸酶或转座酶结合的亲和试剂-结合试剂；

h)分离切割的DNA；及

i)鉴定切割的DNA；及

本发明的另一方面涉及试剂盒，包括一组设计者核小体，每个核小体包括一种或多种疾病-相关表观遗传修饰或组蛋白突变。

本发明的这些方面和其它方面在下面本发明的具体实施方式中进行更详细的说明。

具体实施方式

下面对本发明进行更详细的说明。这些说明并非是本发明可以实施的所有不同方式或本发明可以加入的所有特征的详细目录。例如，一个实施例中谈到的特征可以在其它实施例中采纳，特定实施例中阐明的特征也可以从该实施例中删除。此外，根据本发明，对于此处建议的各种实施例的许多变化和添加，对于本领域技术人员将是显而易见的，其并不背离本发明。因此，以下说明旨在阐明本发明的一些特定实施例，而不是穷举地指定其所有排列、组合和变形。

除非上下文另外声明，应该特别指出的是，此处描述的本发明的各种特征可以以任何组合形式使用。此外，本发明还设想在本发明的一些实施例中，可以排除或省略此处提出的任何特征或特征组合。例如，如果说明书声明一种复合物包含组分A、B和C，应该特别指出的是，A、B或C组分中的任一种组分，或它们的组合，都可以单独或在任何组合中省略和放弃。

除非特别规定，本发明使用的所有术语(包括技术名词和科学术语)的意义与本发明所属领域技术人员通常理解的相同。本发明说明中使用的术语仅仅是为了描述特定实施例，并不是用于限制本发明。

除非特别说明，此处核苷酸序列仅以从左至右5'至3'方向的单链显示。此处核苷酸和氨基酸按照IUPAC-IUB生化命名委员会推荐的方式表示，或(氨基酸)按照37CFR§1.822和惯用法以单字母代码或三字母代码表示。

除非另有说明，否则本领域技术人员熟悉的标准方法可用于制备重组和合成的多肽、抗体或其抗原结合片段，操作核酸序列，产生转化细胞，构建核小体及瞬时转染和稳定转染的细胞。这些技术是本领域技术人员熟悉的。参见，例如，SAMBROOK et al.,MOLECULARCLONING:A LABORATORY MANUAL 2nd Ed.(Cold Spring Harbor,NY,1989)；F.M.AUSUBELet al.CURRENT PROTOCOLS IN MOLECULAR BIOLOGY(Green Publishing Associates,Inc.and John Wiley&Sons,Inc.,New York)。

此处提到的所有出版物、专利、核苷酸序列、氨基酸序列和其它参考文献都通过引用而整体纳入本申请中。

在本发明中，除非上下文中清楚表明，否则，单数形式“一”、“这个”也包括复数形式。

此处所述“和/或”指的是和包括一个或多个相关列出项目的任何和所有可能组合，及缺少替代(“或”)中阐明的组合。

此外，本发明还设想在本发明的一些实施例中，可以排除或省略此处提出的任何特征或特征组合。

此外，提到可测量值，如本发明化合物或试剂的数量、剂量、时间、温度等时使用的词语“大约”指的是包括规定数值±10％、±5％、±1％、±0.5％或甚至±0.1％的变化范围。

此处所述与核酸或蛋白质有关的词语“基本上由……组成”是指核酸或蛋白质除所列举的要素以外不包含任何显著改变(例如，大于约1％、5％或10％)目标核酸或蛋白质功能的要素。

词语“多肽”、“肽”和“蛋白质”此处互换使用，指的是氨基酸残基聚合物。也就是说，针对多肽的描述同样适用于肽的描述和蛋白质的描述，反之亦然。这些词语适用于天然氨基酸聚合物以及其中一个或多个氨基酸残基为非天然氨基酸的氨基酸聚合物。正如此处所使用的那样，这些词语涵盖任何长度的氨基酸链，包括全长蛋白质，其中氨基酸残基通过共价肽和/或假肽键连接。

“核酸”或“核苷酸序列”是核苷酸碱基序列，可能是RNA、DNA或DNA-RNA混合序列(包括天然和非天然核苷酸)，但是优选是单链或双链DNA序列。

此处所述“分离”核酸或核苷酸序列(例如，“分离DNA”或“分离RNA”)指的是分离的核酸或核苷酸或基本上不含天然生物或病毒的至少一些其它组分，例如，通常发现的与核酸或核苷酸序列有关的细胞或病毒结构组分或其它多肽或核酸。

同样，“分离”多肽指的是与天然生物或病毒至少其它一些组分(例如，通常发现与多肽有关的细胞或病毒结构组分或其它多肽或核酸)分离的多肽或基本上不含天然生物或病毒至少其它一些组分的多肽。

“基本上保留”一种性质指的是保留所述性质(例如，活性或其它可测量的特性)的至少大约75％、85％、90％、95％、97％、98％、99％或100％。

词语“表位”指的是生物分子上能引起亲和试剂结合的任何位点。亲和试剂可以识别生物分子或生物分子片段的线性序列、生物分子或生物分子片段的形状、生物分子或生物分子片段的化学物理性质或它们的组合。

此处所述“氨基酸”可以采用其众所周知的三个字母符号或采用IUPAC-IUB生化命名委员会推荐的一个字母符号来表示。蛋白质或肽中的氨基酸残基缩写如下：苯丙氨酸为Phe或F；亮氨酸是Leu或L；异亮氨酸是Ile或I；蛋氨酸是Met或M；缬氨酸是Val或V；丝氨酸是Ser或S；脯氨酸是Pro或P；苏氨酸是Thr或T；丙氨酸是Ala或A；酪氨酸是Tyr或Y；组氨酸是His或H；谷氨酰胺是Gln或Q；天冬酰胺是Asn或N；赖氨酸是Lys或K；天冬氨酸是Asp或D；谷氨酸是Glu或E；半胱氨酸是Cys或C；色氨酸是Trp或W；精氨酸是Arg或R；甘氨酸是Gly或G。

词语“氨基酸”指的是天然的和非天然的氨基酸，以及功能与天然氨基酸类似的氨基酸类似物和氨基酸模拟物。天然编码的氨基酸是20种常见氨基酸(丙氨酸、精氨酸、天冬酰胺、天冬氨酸、半胱氨酸、谷氨酰胺、谷氨酸、甘氨酸、组氨酸、异亮氨酸、亮氨酸、赖氨酸、蛋氨酸、苯丙氨酸、脯氨酸、丝氨酸、苏氨酸、色氨酸、酪氨酸和缬氨酸)和吡咯赖氨酸和硒代半胱氨酸。氨基酸类似物指的是基本化学结构与天然氨基酸相同的化合物，即与氢，羧基，氨基和R基结合的碳，例如高丝氨酸、正亮氨酸、蛋氨酸亚砜和蛋氨酸甲基锍。所述类似物具有修饰的R基团(例如正亮氨酸)或修饰的肽主链，但是保留了与天然氨基酸相同的基本化学结构。

关于氨基酸序列，本领域技术人员将认识到，核酸、肽、多肽或蛋白质序列的单个替换、删除或添加，改变、添加或删除编码序列中的单个氨基酸或小百分比的氨基酸，是“保守修饰变体”，其中的改变导致氨基酸被化学上相似的氨基酸取代。列出功能相似氨基酸的保守替换表是本领域技术人员熟悉的。所述保守修饰变体是此处所述试剂的多态变体、种间同系物/直系同源物和等位基因的补充，并且不排除这些。

此处所述“抗原”可以是被抗体识别或可以产生识别抗体的任何结构。在某些实施例中，抗原可以包含单个氨基酸残基或2个或更多个残基的氨基酸片段。在某些实施例中，抗原可以包含氨基酸的修饰，例如乙酰化，甲基化(例如单-、双-、三-)、磷酸化、泛素化(例如单-、双-、三-、多-)、类泛素化、ADP-核糖基化、瓜氨酸化、生物素化和顺反异构化。在某些实施例中，抗原可以包含核苷酸修饰，例如5-甲基胞嘧啶。在其他实施例中，抗原可以包含特异性突变，例如点突变。在其他实施例中，抗原可以包含野生型氨基酸序列或核苷酸序列。

词语“翻译后修饰”是指天然或非天然氨基酸在体内或体外被掺入到多肽链后发生或将要发生的任何修饰。这样的修饰包括但不限于酰化(例如，乙酰基-、丁酰基-、巴豆酰基-)、甲基化(例如，单-、二-、三-)、磷酸化、泛素化(例如，单-、二-、三-、多-)、类泛素化、ADP-核糖基化、瓜氨酸化、生物素化和顺反异构化。这样的修饰可以在多肽合成过程中通过合成方法，例如化学方法引入，或者在多肽合成或多肽纯化之后通过酶引入。

词语“翻译后修饰”是指天然或非天然核苷酸在体内或体外被掺入到多核苷酸链后发生或将要发生的任何修饰。所述修饰包括但不限于5-甲基胞嘧啶、5-羟甲基胞嘧啶、5,6-二氢尿嘧啶、7-甲基鸟苷、黄苷和肌苷。

词语“免疫沉淀(IP)富集”是指免疫沉淀样品的内标读数除以输入样品的内标读数。

词语“不对称”是指其中组蛋白二聚体中的一个组蛋白包含翻译后修饰的核小体。例如，三甲基修饰存在于一个组蛋白H3的第9位赖氨酸上，而在二聚体中的第二个H3上不存在。

词语“对称”是指其中组蛋白二聚体中的两个组蛋白都包含翻译后修饰的核小体。例如，在两个组蛋白H3的第9位赖氨酸上都发现了三甲基修饰。

本发明涉及CAP-ChIP和SNAP-ChIP在靶向表观遗传治疗和其他治疗之前和之后定量监测患者样品中组蛋白PTM和突变的临床应用。直接定量HMD全基因组的能力提供了表观遗传治疗效果强大的读数功能及能够开发出用于疾病治疗的伴随诊断方法。因此，本方法用于药物开发和临床应用。

因此，本发明的一个方面涉及一种检测和定量受试者生物样品染色质内特异性基因组位点核心组蛋白表位处表观遗传修饰或突变的方法，所述方法包括：

a)从受试者分离生物样品；

从而，检测和定量表位处的表观遗传修饰或突变。所述方法的步骤不限于叙述它们的顺序。例如，添加标准物的步骤(c)可以在步骤(b)之前或之后进行，例如，标准物可以在执行步骤(b)之前添加到生物样品中，或者可以在执行步骤(b)之后添加到文库中。

所述分析方法的一般描述如下。将具有定义浓度(由每个唯一的DNA条形码编码)的修饰或突变组蛋白(例如，4位赖氨酸N6,N6,N6-三甲基化的H3)的半合成核小体梯带(ladder)标准物掺入到从人细胞核分离并通过例如微球菌核酸酶的核内消化而释放的天然核小体文库中。然后，例如通过下一代测序，对梯带(ladder)-掺杂文库的样品进行免疫沉淀(IP)、DNA纯化和DNA表征。保留梯带(ladder)-掺杂文库的另一个样本作为输入样品，并且不进行免疫沉淀。在此，免疫沉淀(IP)或“拉下(pull-down)”是指用于纯化染色质、核小体，DNA-蛋白质复合物或包含一个或多个目标表位的蛋白质的方法或技术，其中将所述表位与对表位具有特异性的亲和试剂接触，并与该文库的其他组分分离。亲和试剂可以是与表位特异性结合并且适合用于沉淀分析的任何试剂。亲和试剂可以是抗体或其片段或衍生物。亲和试剂可以是非抗体试剂，例如适体或蛋白质-蛋白质相互作用域。词语“免疫沉淀”在本文中采用广义，以涵盖非抗体亲和试剂。

免疫沉淀的样品和输入样品均采用能够读出和定量DNA序列的方法进行分析。将回收的DNA片段根据参考基因组映射到相对基因组位置，并针对从IP(使用亲和试剂通过免疫沉淀得到的样品)中回收的DNA及输入(未进行免疫沉淀的样品)对基因组的每个碱基对测量这些片段的丰度。对于用于制备半合成核小体的独特核苷酸序列，从测序数据中进行相同的读数计数。IP和输入中半合成核小体的丰度比用于测定IP效率，IP和输入中任何基因组位点DNA片段的丰度比用于测定相对富集。所添加的半合成核小体的标记数构成了一条校准曲线，可用于推导全基因组天然核小体的组蛋白修饰或突变密度。带有100％修饰的半合成核小体梯带的平均IP富集率用作带有相同表位的天然染色质的标量校准，以比率的比率计算所需基因组间隔内的修饰量。随后将IP效率应用于相对富集，以碱基对分辨率测量整个基因组范围的组蛋白翻译后修饰或突变的组蛋白修饰密度。在一些实施例中，具有天然样的亲和力、特异性和亲合力的蛋白表位包括蛋白亚型和/或具有翻译后修饰的蛋白。例如，表位可以是在测定中对其密度进行测量的组蛋白修饰或具有相似结合特性的表位。在一个实施例中，DNA-蛋白质复合物的蛋白质部分是包含核心组蛋白H2A、H2B、H3和H4的核心组蛋白八聚体复合物。这些序列在专利申请No:US2013/044537中进行了说明，通过引用，其内容并入本发明中。为了重现天然样的亲和力，任何上述核心组蛋白的蛋白质表位的特异性和亲合力可以用包括表1(a)-1(f)中所列的任何组蛋白变体来表示。在本发明的一个实施例中，蛋白质表位可以是组蛋白的片段。

在本发明的另一方面，蛋白质-DNA复合物包含标准多核苷酸，其包括但不限于定位序列和唯一的条形码标识符序列。包含蛋白质定位序列允许通过与蛋白质的特异性天然样相互作用来形成DNA-蛋白质复合物。在一个实施例中，蛋白质定位序列是核小体定位序列。在一个实施例中，定位序列包括至少146个碱基对的天然或合成双链DNA序列。在一个实施例中，蛋白质定位序列是“601-Widom”序列-通过选择对核小体表现出亲和力的序列制备的合成核小体结合序列。尽管我们在这里提到了“601-Widom”序列作为核小体定位序列，但是本实施例涵盖了使用对核小体表现出亲和力的其他此类合成和天然序列。在一些实施例中，标准多核苷酸不包含定位序列。只要标准多核苷酸能够与组蛋白或组蛋白片段形成稳定的蛋白质-DNA结合，就可以将其用于本发明的方法中。

单一序列允许在天然DNA-蛋白质复合物的文库或库中特异性鉴定DNA-蛋白质复合物，即条形码。在一些实施例中，单一序列可以采用另一种特异性识别方式取代，例如多肽、荧光团、发色团、RNA序列、锁核酸序列、亲和标签等。一方面，单一序列可以通过任何熟悉的核苷酸分析技术开展分析，例如，下一代测序，PCR、qPCR、RT-PCR、ddPCR、杂交、放射自显影、荧光标记、光密度和使用嵌入荧光探针。单一序列和定位序列可以是相同序列，并且具有作为识别分子的双重功能。单一序列可以位于定位序列的5'-末端、定位序列的3'-末端、定位序列的两端和/或定位序列的内部。

在一些实施例中，单一序列是具有最小长度的双链DNA序列，与正在研究的生物体的基因组序列及样品中可能发现的所有其他序列之间的汉明距离至少保持为1。在一个实施例中，为了确保在天然基因组序列环境中对条形码进行有力的区分，每个条形码均由人和小鼠基因组中不存在的两个11个碱基对(bp)序列组成(Herold et al.,BMCBioinformatics 9:167(2008))，其中11个bp序列是确保人类和小鼠基因组的汉明距离至少为1的最短序列。在另一个实施例中，条形码序列是细胞基因组中不存在的序列。在另一个实施例中，条形码序列是自然界中不存在的序列。虽然这里提到11个bp可能是人类和小鼠的汉明距离至少为1的最短序列，但汉明距离至少为1的数量不受限的较长序列也可以成功作为上述单一序列。此外，对于其他生物的基因组，汉明距离至少为1的单一序列的最短序列可能短于11个bp，因此，对于这些生物，可以成功使用短于11个bp的序列。条形码是一种分子，在一个实施例中是DNA，其可以通过人们熟悉的DNA分析技术进行分析，包括但不限于下一代测序和PCR。条形码序列编码给定内标核小体的浓度和/或一致性。

在一些实施例中，单一核苷酸序列指示给定内标的浓度和一致性。在本发明的一方面，单一序列包括长度至少或至多10、11、12、13、14、15、16、17、18、19、20、25、30、35、40、45、50、60、70、80、90或100个碱基对长度。在另一个实施例中，定位序列和单一序列的总长度具有至少100个碱基对长度。一方面，单一序列是微球菌核酸酶抗性的。在本发明的一个实施例中，包括但不限于定位序列和单一序列或条形码的标准物分子包括，基本上由或由SEQ ID NO：1；SEQ ID NO：2；SEQ ID NO：3；SEQ ID NO：4；SEQ ID NO：5；SEQ ID NO：6；SEQID NO：7；SEQ ID NO：8；SEQ ID NO：9；SEQ ID NO：10；SEQ ID NO：11；SEQ ID NO：12；SEQ IDNO：13；SEQ ID NO：14；或SEQ ID NO：15组成。在一个实施例中，包含但不限于定位序列和独特序列或条形码的标准分子包括，基本上由或由SEQ ID NO：16；SEQ ID NO：17；SEQ ID NO：18；SEQ ID NO：19；SEQ ID NO：20；SEQ ID NO：21；SEQ ID NO：22；SEQ ID NO：23；SEQ IDNO：24；SEQ ID NO：25；SEQ ID NO：26；SEQ ID NO：27；SEQ ID NO：28；SEQ ID NO：29；SEQ IDNO：30；SEQ ID NO：31；SEQ ID NO：32；SEQ ID NO：33；SEQ ID NO：34；SEQ ID NO：35；SEQ IDNO：36；SEQ ID NO：37；SEQ ID NO：38；SEQ ID NO：39；SEQ ID NO：40；SEQ ID NO：41；SEQ IDNO：42；SEQ ID NO：43；SEQ ID NO：44；SEQ ID NO：45；SEQ ID NO：46；SEQ ID NO：47；SEQ IDNO：48；SEQ ID NO：49；SEQ ID NO：50；SEQ ID NO：51；SEQ ID NO：52；SEQ ID NO：53；SEQ IDNO：54；SEQ ID NO：55；SEQ ID NO：56；SEQ ID NO：57；SEQ ID NO：58；SEQ ID NO：59；SEQ IDNO：60；SEQ ID NO：61；SEQ ID NO：62；SEQ ID NO：63；SEQ ID NO：64；SEQ ID NO：65；SEQ IDNO：66；SEQ ID NO：67；SEQ ID NO：68；SEQ ID NO：69；SEQ ID NO：70；SEQ ID NO：71；SEQ IDNO：72；SEQ ID NO：73；SEQ ID NO：74；SEQ ID NO：75；SEQ ID NO：76；SEQ ID NO：77；SEQ IDNO：78；SEQ ID NO：79；SEQ ID NO：80；SEQ ID NO：81；SEQ ID NO：82；SEQ ID NO：83；SEQ IDNO：84；SEQ ID NO：85；SEQ ID NO：86；SEQ ID NO：87；SEQ ID NO：88；SEQ ID NO：89；SEQ IDNO：90；SEQ ID NO：91；SEQ ID NO：92；SEQ ID NO：93；SEQ ID NO：94；SEQ ID NO：95；SEQ IDNO：96；SEQ ID NO：97；SEQ ID NO：98；SEQ ID NO：99；SEQ ID NO：100；SEQ ID NO：101；SEQID NO：102；SEQ ID NO：103；SEQ ID NO：104；SEQ ID NO：105；SEQ ID NO：106SEQ ID NO：107；SEQ ID NO：108；SEQ ID NO：109；SEQ ID NO：110；SEQ ID NO：111；SEQ ID NO：112；SEQID NO：113；SEQ ID NO：114；或SEQ ID NO：115组成。

在此处所述表位密度测定方法的一个实施例中，将一组具有标准多核苷酸的上述半合成核小体掺入天然核小体集合中。该组可以包括其中标准多核苷酸带有一个以上表位，但包含至少一个目标表位的半合成核小体。例如，一组半合成核小体可以具有翻译后修饰，例如H3K9me3，以及保守的或不变的表位，例如组蛋白的多肽序列。或者，一组半合成的核小体可以具有多个翻译后修饰。另一方面，该组标准物包括至少一个半合成的、重组的或含有变体的DNA结合蛋白，其具有与目标表位不同的假阳性表位的天然样亲和力、特异性和亲合力。在一个实施例中，一组包含半合成或变体的核小体，包括至少一个具有真阳性表位的天然样亲和力、特异性和亲合力的核小体和至少一个具有假阳性表位的天然样亲和力、特异性和亲合力的核小体。

为了从许多蛋白质-DNA复合物中提纯出一群天然或半合成核小体，可以采用一种亲和捕获步骤，其中亲和试剂识别核小体的不变片段，例如组蛋白。本发明方法中采用的亲和试剂可以是识别并特异性结合目标表位的任何合适分子。一方面，与目标表位接触的亲和试剂包括抗体或其片段、单体(monobody)、scFv、适体、Fab或结合肽。纯化一群核小体的方法可能仅适用于半合成核小体，仅适用于天然核小体或适用于掺有半合成核小体的天然核小体。

在一个实施例中，为了执行本发明的方法，将一组可以与ChIP读出进行比较的前述内标掺入到天然DNA-蛋白质复合物的集合中。下文描述了如何使用这些标准物来计算标准IP效率，而标准IP效率又可以用于计算蛋白质或表位密度(PD)、蛋白质变体密度(PVD)或蛋白质修饰密度(PMD)，这取决于所研究的表位是否是不变的蛋白质片段、蛋白质亚型、蛋白质翻译后修饰或多核苷酸转录后修饰。采用具有天然的亲和力、特异性和亲合力且基于半合成或含变体的核小体的标准物，，可以通过对组蛋白修饰密度(HMD)或组蛋白变体密度(HVD)进行绝对定量，从而改善染色质的免疫沉淀。

组蛋白修饰密度是一个标准化的标度，定义为在给定基因组位置上，携带特异性表位的核小体占所有核小体的表观百分数。组蛋白修饰密度以模拟标度表示，范围为0％(表示不存在)至100％(表示表位饱和)。例如，GAPDH基因的核小体+1(转录起始位点下游的第一个核小体)的90H3K4me3组蛋白修饰密度应解释为，在GAPDH基因启动子上构成核小体+1的所有组蛋白H3分子群体中，90％具有组蛋白H3第％4位赖氨酸的N6，N6，N6-三甲基化(H3K4me3)翻译后修饰，并且它们中的10％应没有H3K4me3。虽然该实例给出了跨越单个核小体的基因组区域，该区域大约为147个bp，但是，可以将其应用于从单个碱基对到整个基因组的任何基因组范围。

为了计算蛋白质或表位密度，需要了解四件事：基因组位点大小、表位丰度、一般蛋白质丰度和免疫沉淀效率(“IP效率”)。基因组位点大小由用户定义，可以从单个碱基对到整个基因组。表位丰度定义为在基因组位点范围内表位的丰度。丰度通常是通过量化与DNA-蛋白质复合物结合的DNA的量来推断，因为它对蛋白质而言是符合化学计量的，并且DNA易于通过多种方法进行定量，例如PCR、RT-PCR、ddPCR、下一代测序、杂交、放射自显影、荧光标记、光密度、插入式荧光探针等。但是，也可以通过光密度、荧光、放射自显影、质谱、比色法、多肽总分解等方法测量蛋白质浓度来直接测量丰度。

在特异性亲和试剂识别表位的亲和捕获步骤后，测量表位的丰度，在此步骤后，将表位-亲和试剂复合物与DNA-蛋白质复合物中未结合的部分分离。最常见的是，通过将表位-亲和试剂复合物固定在表面上并洗去未结合的DNA-蛋白质复合物部分，将表位-亲和试剂复合物与未结合的核小体分离。一般蛋白质丰度定义为在给定基因组位点范围内，形成DNA复合物的给定种类所有蛋白质的丰度。一般蛋白质丰度的测定方法与表位丰度相同。

为了从其它蛋白质-DNA复合物中提纯出一群核小体，可以采用一种亲和捕获步骤，其中亲和试剂识别核小体的不变片段，例如组蛋白。但是，如果涉及蛋白质-DNA复合物制备的给定不变片段与考虑的基因组位点大小相比占主导地位，则在假设其他蛋白质-DNA复合物群体微不足道的条件下，可以跳过一般蛋白质群体的亲和捕获步骤。表位丰度与一般蛋白质丰度之比得到每种蛋白质的表位密度。然而，很少有亲和力捕获步骤效率为100％的情况，并且如果使用两个或多个亲和力捕获步骤时，它们的捕获效率几乎不会彼此相等。为了解决这个问题，需要了解表位丰度与一般蛋白质丰度测量之间的相对IP效率。

“IP效率”是指一个或多个拉下(pull-downs)实验之间表位的相对回收率。了解标准物的IP效率，可以通过校准一个或多个拉下实验之间的回收率差异来执行绝对量化。在一个实施例中，通过使用一组与天然表位具有相同的亲和力、特异性和亲合力并且易于在复杂混合物中测量其丰度的上述标准物来测量上述IP效率。将这些半合成标准物掺入到天然DNA-蛋白质复合物库中，对其样品进行亲和捕获。在此步骤之后，针对上述半合成标准物和天然DNA-蛋白质复合物库，使用上述丰度测量方法中的其中一种方法，对表位丰度和一般蛋白质密度进行上述测量。在一个实施例中，一组标准物包括以不同浓度添加的标准物。此处添加的浓度由条形码唯一标识。

在一个实施例中，对标准DNA-蛋白质复合物和天然DNA-蛋白质复合物来说，表位丰度可通过定量与DNA-蛋白质复合物结合的DNA来测定。在一个实施例中，IP中给定标准物条形码的表位与半合成核小体的输入材料的表位之比等于标准物IP效率。或者，该标准物IP效率可以以表位特异性IP中的条形码丰度与一般蛋白质丰度(对于组蛋白H3来说，例如抗H3普通IP的条形码计数)之比计算。一旦计算出IP效率，就可以将该标准物IP效率应用于任何基因组位点的IP/输入DNA或IP表位/IP一般蛋白质之比。这是通过将基因组IP效率-IP中表位丰度(亲和步骤中捕获的给定基因组间隔的DNA量)和输入中相同间隔的DNA量之比，除以标准物IP效率计算得出。或者，这可以以IP中给定基因组DNA片段的比率除以上述任何基因组位点的一般表位丰度IP中相同种类的数量，然后除以标准物IP效率计算得出。得到的数值为蛋白质或表位密度(PD)，也称为蛋白质变体密度(PVD)或蛋白质修饰密度(PMD)。

拉下实验面临的另一个问题挑战分析是拉下实验中所用亲和试剂的脱靶特异性导致预测精度低。术语“假阳性”和“脱靶”是同义词，是指与亲和试剂混杂或非特异性接触的表位或错误的结果。术语“真阳性”和“上靶”是同义词，是指目标表位或正确的结果。

假阳性表位信号的发生率在各拉下实验之间有所不同，并取决于亲和试剂的质量(其对期望表位的固有结合亲和力vs对其他相关表位的亲和力)，天然染色质中上靶vs脱靶表位的丰度，拉下实验中亲和试剂的能力与DNA-蛋白质复合物负载水平的比值以及开展拉下实验的其他条件。对于不同的亲和试剂，虽然在常规ChIP的给定实验中，上靶结合和脱靶结合两者中任一来源对表观ChIP信号的作用尚不清楚，但是，它们两者都不同程度地影响表观ChIP信号。在不了解脱靶结合的丰度的情况下，人们无法决定观察到的表位丰度是否显着，这反过来使得在医学诊断和研究中使用拉下实验是不切实际的。本发明人发现了一种在拉下实验中就地定量假阳性和真阳性表位的IP效率的方法，由于很容易计算出阳性预测值(PPV)，因此提高了数据解释的精度。PPV允许将某个置信水平的最小表位丰度估算值视为真阳性。

使用上述计算IP效率和标准物IP效率的方法，可以计算阳性预测值(PPV)，也称为精度。了解PPV简化了任何数据分析，因为它可以估计蛋白质密度的任何差异是否显着，而这是当前可用的方法和技术无法实现的。

ηTP是真阳性表位的IP效率，α是真阳性表位的给定重量,ηFP是假阳性表位(也称为脱靶表位)的IP效率，β是假阳性表位的重量。在没有事先了解重量分布的情况下，α＝β＝1。该式存在其他变化形式，并且在其他应用中可以利用对假阳性和真阳性表位发生率的了解。

有两种替代方法可以校准ChIP：使用外标进行总体组蛋白修饰密度校准和直接进行内标校准。像本工作中主要采用的相对内标方法一样，这两种方法都可以得到以“组蛋白修饰密度”单位表示的结果，这些结果等于所探测表位与给定基因组位点中所有其他表位的表观比率。

总体组蛋白修饰密度校准依赖于相对于组蛋白数量的修饰总比率的测定，例如，了解到所有H3的百分比都是K4三甲基化的。然后，可以将质谱或定量免疫印迹法测定得到的总体组蛋白修饰密度，针对任何给定基因组位点的输入深度进行校准，在所有IP峰中重新进行分配。除了总丰度测量时存在巨大的误差(例如，MS准确度及可能无法观察到所有可能的修饰形式的不确定性)之外，这种方法的缺点是此类通过正交法进行的外部测量采用的核小体样品必须与ChIP中采用的是同一样品，而且这两种技术中的样品处理损失都是造成误差的重要原因。特别是，IP效率永远不会达到100％(实际上可能会大大降低)，因此，效率偏离理论最大值的程度将反映在表观HMD的相当虚增值上。

直接内标校准通过ChIP方法测定加标条形码核小体标准物的标签计数，了解输入中每个内标梯带成员的精确摩尔浓度，从而推断出原始样品中所探测表位的绝对摩尔丰度。这种校准受微球菌核酸酶消化的细胞核数量的计数准确性的限制，并且从这种很好定量的数量到彻底破碎的染色质分离物的过程中，存在损失偏差。由于在高度优化的消化和分离条件下，我们从消化细胞核中回收的总核酸几乎不超过80％，因此，由于基因组回收偏差而存在一些系统误差(Henikoff et al,Nat.Rev.Genet.9:15(2009))。

该实施例的另一个优点是能够通过解以下矩阵方程，从假阳性表位信号反卷积真阳性表位信号的能力，在此以组蛋白修饰密度为例进行介绍：A*x＝b。对于指定的数据集，通过解以下矩阵方程，对CAP-ChIP和SNAP-ChIP-seq轨迹进行了非特异性校准：A*x＝b。

本发明的另一个实施例描述了一种通过解以下矩阵方程，从假阳性表位信号反卷积真阳性表位信号的方法，在此以组蛋白修饰密度为例进行介绍：A*x＝b。

式中，x是校准HMD分数矩阵，A是校准因子矩阵，b是未校准HMD分数矩阵，其中t是免疫沉淀中对来自‘a’到‘z’组蛋白标记(下标)集的组蛋白标记的特异性校准因子，其中在所述免疫沉淀中，采用抗来自‘a’到‘z’组蛋白标记集(上标)的组蛋白标记的抗体；HMD是从第1个到第n个基因组位点给定组蛋白标记(‘a’至‘z’)的组蛋白修饰密度；HMD(Cor)是从第1个到第n个基因组位点的给定组蛋白标记的校准组蛋白修饰密度。

式中，t是免疫沉淀中对来自‘a’到‘z’组蛋白标记(下标)集的组蛋白标记的特异性校准因子，其中在所述免疫沉淀中，采用抗来自‘a’到‘z’组蛋白标记集(上标)的组蛋白标记的抗体；HMD是从第1个到第n个基因组位点给定组蛋白标记(‘a’至‘z’)的组蛋白修饰密度；HMD(Cor)是从第1个到第n个基因组位点的给定组蛋白标记的校准组蛋白修饰密度。

其中,Σ₁ ^NIP和Σ₁ ^N输入是指IP或输入中给定条形码的丰度，上标是指产生抗体的组蛋白标记，而下标是指被拉下的半合成核小体上的标记。

常规ChIP测定法未在临床中采用的主要原因是，由于微妙的处理差异和易变的抗体特异性，它们通常无法重现，从而使IP富集的百分含量随实验而变化很大，并且使无偏差对比存在问题且不可靠。由于采用的内标经历对变化敏感的ChIP步骤，CAP-ChIP和SNAP-ChIP在结果重复性和可靠性方面要稳健很多，并且因为通过与定义明确的内标直接进行原位比较，HMD是通用的，具有生物学上相关的量度，因此，这些数值很容易进行比较。

组蛋白修饰和其他表观遗传机制对于调节基因活性和细胞过程至关重要。不同的组蛋白修饰调节不同的过程，例如转录、DNA复制和DNA修复。这些修饰中任何一种修饰失调都会改变基因表达的平衡，从而导致异常的表观遗传模式和细胞异常。例如，在各种癌症中都检测到了组蛋白翻译后修饰和变体的变化，并且在某些情况下，异常修饰模式是导致疾病的驱动因素(Daigle et al.,Cancer Cell 20:53(2011)；Chi et al.,Nat.Rev.Cancer10:457(2010))。

本发明可用于与组蛋白翻译后修饰、转录后修饰和突变的变化有关的任何疾病(包括患者，例如人类患者的癌症)的诊断、预后、分类、疾病风险的预测、复发的检测、治疗选择以及治疗效果的评估。此类分析与患者细胞或诱导多能干细胞的离体培养一起用于评估给定去分化方案用于生产真正的多能干细胞的适用性，或用于评估将干细胞分化为特异性细胞类型的方案的适用性。

在根据特定组蛋白PTM或突变的存在、不存在或HMD进行诊断、预后、风险评估、分类、复发检测或治疗选择时，可以将PTM或突变的数量与阈值进行比较，将一种诊断、预后、风险评估、分类等与另一种进行区分。例如，阈值可以代表组蛋白甲基化的程度，其以期望的敏感性和特异性水平满意地区分癌症样品和正常活检样品。使用ICe-ChIP时，阈值不会根据所用抗体或处理条件而变化。阈值或范围可通过以下方法确定：使用ICe-ChIP测量病变样品和正常样品中特定的目标组蛋白PTM，然后确定能够将至少大部分癌症样品与大多数非癌症样品区分开的数值。

本发明方法中使用的生物样品可以是任何合适的样品。生物样品可以是，例如血液、血清、血浆、尿液、唾液、精液、前列腺液、乳头吸取液、泪液、汗液、粪便、面颊拭子、脑脊髓液、细胞裂解液样品、羊水、胃肠道液、活检组织、淋巴液或脑脊髓液。

在一些实施例中，生物学样品包括细胞，并且从细胞中分离出染色质。在某些实施例中，细胞是来自受与组蛋白翻译后修饰或DNA修饰变化有关的疾病或病症影响的组织或器官的细胞，例如病变细胞。在某些实施例中，细胞是来自受与组蛋白突变有关的疾病或病症影响的组织或器官的细胞，例如病变细胞。可以通过本领域熟悉的任何方式从病变器官或组织获得细胞，包括但不限于活检、抽吸和手术。

在其他实施例中，细胞不是来自受与组蛋白翻译后修饰或DNA修饰变化有关或与组蛋白的突变有关的疾病或病症影响的组织或器官的细胞。细胞可以是，例如充当病变细胞代理的细胞。细胞可以是比病变细胞更容易获取的细胞，例如，不需要复杂或痛苦的过程(例如活检)即可获得的细胞。合适细胞的实例包括但不限于外周血单核细胞。

在一些实施例中，生物学样品包括循环核小体，例如已经从垂死细胞释放的核小体。在某些实施例中，循环核小体可以来自血细胞。在某些实施例中，循环核小体可以来自受与组蛋白翻译后修饰或DNA修饰变化有关或与组蛋白的突变有关的疾病或病症影响的组织或器官的细胞。

受试者可以是需要本发明方法的任何受试者。在一些实施例中，受试者是哺乳动物，例如人。在一些实施例中，受试者是实验动物，例如小鼠、大鼠、狗或猴子，例如疾病的动物模型。在某些实施例中，受试者可以是已经被诊断患有或怀疑患有疾病或病症的受试者。在一些实施例中，受试者可以是例如由于遗传学、家族史、暴露于毒素等而有疾病或病症罹患风险的受试者。

在某些实施例中，将多个标准物添加到文库中。在一些实施例中，将多个标准物添加到文库中，每个标准物包括重组的核小体，其包括(i)具有表位的标准组蛋白或组蛋白片段，和(ii)包括核小体定位序列和条形码标识符序列的标准多核苷酸，其中条形码标识符序列编码指示添加到文库中的标准物浓度的浓度参数，并且其中将具有相当浓度的标准物添加到文库中。在一些实施例中，每个PTM或突变由两个或更多个(例如，2、3、4、5、6、7、8、9或10个)浓度相同或相似的标准物代表。任选每个重复的标准物具有不同的条形码标识符序列，例如，用作内部标准物。

在一些实施例中，将多个标准物添加到文库中，每个标准物包括重组的核小体，其包括(i)具有表位的标准组蛋白或组蛋白片段，和(ii)包括核小体定位序列和条形码标识符序列的标准多核苷酸，其中条形码标识符序列编码指示添加到文库中的标准物浓度的浓度参数，并且其中将至少两个不同浓度的标准物添加到文库中。在一些实施例中，添加2、3、4、5、6、7、8、9或10或更多个不同浓度的标准物。任选每个浓度重复的标准物具有不同的条形码标识符序列，例如，用作内部标准物。

在某些实施例中，多个标准物可以进一步包括包含重组核小体的标准物，所述核小体包含(i)一个或多个脱靶表位和(ii)编码脱靶表位一致性的标准分子条形码和指示脱靶表位的浓度参数。

在一些实施例中，该方法进一步包括根据脱靶表位的一种或多种捕获效率来确定亲和试剂的脱靶捕获特异性，并根据脱靶捕获特异性来校准基因组位点核心组蛋白的表位密度。

表位可以是核心组蛋白上需要定量和/或监测的任何表位。在一些实施例中，表位是翻译后修饰或蛋白质亚型。在一些实施例中，核心组蛋白的表位包含至少一种翻译后氨基酸修饰，例如选自丝氨酸和丙氨酸的N-乙酰化；丝氨酸、苏氨酸和酪氨酸的磷酸化；赖氨酸的N-酰化(例如巴豆酰化或丁酰化)；赖氨酸的N6-甲基化、N6，N6-二甲基化、N6，N6，N6-三甲基化；精氨酸的ω-N-甲基化、对称-二甲基化、不对称-二甲基化；精氨酸的瓜氨酸化；赖氨酸的泛素化；赖氨酸的类泛素化；丝氨酸和苏氨酸的O-甲基化；丝氨酸、苏氨酸或酪氨酸的磷酸化；精氨酸、天冬氨酸和谷氨酸的ADP-核糖基化，及它们的任意组合。修饰可以是表1(a)-1(f)中所列的任何修饰，可以是单独的或它们的任何组合。

在一些实施例中，表位是核心组蛋白的突变，例如与疾病或病症相关的突变。在一些实施例中，所述突变是致癌突变，例如包括但不限于H3K4M、H3K9M、H3K27M、H3G34R、H3G34V、H3G34W、H3K36M及其任何组合的突变。H3突变体可以基于H3的任何变体主链，例如，H3.1、H3.2或H3.3。

在某些实施例中，本发明的方法可以进一步包括：

确定掺杂文库中基因组位点核心组蛋白的数量；和

确定掺杂文库中标准物的数量。

在一些实施例中，确定掺杂文库中基因组位点核心组蛋白的数量的步骤可以包括：

向掺杂文库中添加第二亲和试剂，回收一定数量的包括第二表位的核小体，其中第二表位是位于核心组蛋白上的不变表位，和

确定回收的包括第二表位的核小体中多核苷酸的数量。

在一些实施例中，确定掺杂文库中标准物的数量的步骤可以包括：

回收一定数量的重组核小体；其中重组核小体包括第二表位，和

确定回收的包括第二表位的核小体中标准物的数量。

在这些实施例中，亲和试剂可以是靶向表位的抗体或其片段或其变体或非抗体试剂，而第二亲和试剂可以是靶向第二表位的抗体或其片段或其变体或非抗体试剂。

a)从受试者分离生物样品；

上面描述的用于检测和定量表观遗传修饰或突变的方法的细节也适用于此方法。

a)从受试者分离生物样品；

h)重复步骤a)至g)至少一次；及

该方法的步骤可以根据需要重复多次，以监测表观遗传修饰或突变状态的变化，例如重复2、3、4、5、6、7、8、9、10、25、50或100或更多次。该方法可以定期(例如每天、每周、每月、每年)或根据需要重复进行。该方法可以例如在受试者的治疗之前、期间和/或之后重复；在诊断出受试者的疾病或病症之后重复；作为确定受试者疾病或病症的诊断的一部分；在确定受试者存在患病或出现病症的风险之后重复，或在需要监测表观遗传修饰或突变的可能变化的任何其他情况时重复。

a)从受试者分离生物样品；

从而监测受试者表观遗传治疗或突变治疗的有效性。

表观遗传治疗是旨在改变蛋白质(例如，组蛋白)或DNA的表观遗传状态的疗法。表观遗传治疗的一个实例包括赖氨酸脱乙酰基酶抑制剂(以前称为组蛋白脱乙酰基酶抑制剂)(例如，伏立诺他(辛二酰苯胺异羟肟酸)、CI-994(泰克地那林(tacedinaline))、MS-275(恩提诺特(entinostat))、BMP-210、M344、NVP-LAQ824、LBH-529(帕比司他)、MGCD0103(莫塞替诺特)、PXD101(贝利司他)、CBHA、PCI-24781、ITF2357、丙戊酸、曲古抑菌素A和丁酸钠)，用于治疗皮肤T细胞淋巴瘤(CTCL)或在临床试验中用于治疗血液和实体瘤，包括肺癌、乳腺癌、胰腺癌、肾癌和膀胱癌、黑素瘤、成胶质细胞瘤、白血病、淋巴瘤和多发性骨髓瘤。表观遗传治疗的另一个实例是组蛋白乙酰转移酶抑制剂(例如，表没食子儿茶素-3-没食子酸酯、山竹醇、鸡腰果酸、CPTH2、姜黄素、MB-3、MG149，C646和罗米地辛)。表观遗传治疗的另一个实例是DNA甲基转移酶抑制剂(例如氮杂胞苷，地西他滨、泽布拉林(zebularine)、咖啡酸、绿原酸、表没食子儿茶素、肼苯哒嗪、普鲁卡因酰胺、普鲁卡因和RG108)，它们已被批准用于治疗急性髓细胞性白血病、骨髓增生异常综合症和慢性粒细胞性单核细胞白血病以及用于治疗实体瘤的临床试验。其他表观遗传治疗包括但不限于赖氨酸甲基转移酶(例如，pinometostat(匹美司他)，他泽司他(tazometostat)、CPI-1205)；赖氨酸脱甲基酶(例如ORY1001)；精氨酸甲基转移酶(例如，EPZ020411)；精氨酸脱亚氨酶(例如，GSK484)；和异柠檬酸脱氢酶(例如恩西地平、艾伏尼布)。参见Fischle et al.,ACS Chem.Biol.11:689(2016)；DeWoskin et al.,Nature Rev.12:661(2013)；Campbell et al.,J.Clin.Invest.124:64(2014)；and Brown et al.,Future Med.Chem.7:1901(2015)；通过引用，这些文献全文纳入本申请中。

突变疗法包括旨在改变基因的核苷酸序列(例如，编码组蛋白)的疗法。实例包括但不限于基因疗法。

该方法的步骤可以根据需要重复多次，以监测治疗的变化，例如重复2、3、4、5、6、7、8、9、10、25、50或100或更多次。该方法可以定期(例如每天、每周、每月、每年)或根据需要重复进行，例如，直到治疗结束。该方法可以例如在对受试者进行治疗之前、期间和/或之后，例如在每次给予治疗之后重复。在一些实施例中，治疗一直持续到本发明的方法显示治疗有效为止。

a)从受试者分离生物样品；

该方法可以例如应用于已经被诊断或怀疑患有与表观遗传修饰或突变相关的疾病或病症的受试者。对表位的表观遗传状态或突变状态的确定可以指示表位的状态已经被修饰，并且应当向受试者施用表观遗传疗法或突变疗法以纠正该修饰。相反，确定表位的状态没有被修饰将表明表观遗传疗法或突变疗法预期无效，应避免采用这些疗法。例如，确定特定基因组位点已被脱乙酰化，可能表明采用组蛋白脱乙酰基酶抑制剂进行治疗将是适当的。类似地，确定特定基因组位点已被超甲基化，可能表明采用DNA甲基转移酶抑制剂进行治疗将是适当的。

a)从受试者分离生物样品；

在一些情况下，表位的表观遗传状态或突变状态指示与表观遗传修饰或突变相关的疾病或病症的预后。因此，确定已经诊断出或怀疑患有与表观遗传修饰或突变相关的疾病或病症的受试者的表位的表观遗传状态或突变状态可能对确定受试者的预后有用。许多这样的例子是本领域熟悉的。一个实例是前列腺癌和谷胱甘肽S转移酶P1(GSTP1)基因启动子、腺瘤性结肠息肉病(APC)基因、PITX2、C1orf114和GABRE～miR-452～miR-224基因，及三基因标记组合AOX1/C1orf114/HAPLN3和13基因标记组合GSTP1、GRASP、TMP4、KCNC2、TBX1、ZDHHC1、CAPG、RARRES2、SAC3D1、NKX2-1、FAM107A、SLC13A3、FILIP1L的超甲基化。另一个实例是前列腺癌和组蛋白PTMS，包括但不限于H3K18乙酰化和H3K4二甲基化增加与前列腺癌复发风险显著升高有关，H4K12乙酰化和H4R3二甲基化和与肿瘤分期相关，H3K9二甲基化与和与低级前列腺癌患者肿瘤复发风险有关。另一个实例是乳腺癌患者的总生存率与CREB5、EXPH5、ZNF775、ADCY3和ADMA8基因中CpG甲基化状态之间的联系。另一个实例是成胶质细胞瘤和EGFR、PTEN、NF1、PIK3R1、RB1、PDGFRA和QKI等基因的内含子区域超甲基化有关。另一个实例是结肠癌的预后较差和CNRIP1、FBN1、INA、MAL、SNCA和SPG20基因启动子的甲基化状态有关。

a)从受试者分离生物样品；

从而鉴定表观遗传修饰或突变相关疾病或病症的生物标记。

在此方法中，病变组织的生物学样品可以从患有疾病或病症并且确定一个或多个表位的表观遗传或突变状态的许多患者中获取。然后，可以采用本领域众所周知的分析技术来鉴定表位状态与发生、分期、亚型、预后等之间的相关性。

在本发明的任何方法中，与表观遗传修饰或突变相关的疾病或病症可以是癌症、中枢神经系统(CNS)疾病、自身免疫性疾病、炎症性疾病或感染性疾病。

癌症可以是细胞的任何良性或恶性异常生长，包括但不限于听神经瘤、急性粒细胞性白血病、急性淋巴细胞性白血病、急性骨髓性白血病、腺癌、肾上腺癌、肾上腺皮质癌、肛门癌、间变性星形细胞瘤、血管肉瘤、基底细胞癌、胆管癌、膀胱癌、脑癌、乳腺癌、支气管癌、子宫颈癌、宫颈增生、脊索瘤、绒毛膜癌、慢性粒细胞性白血病、慢性淋巴细胞性白血病、慢性粒细胞性白血病、结肠癌、结肠直肠癌、颅咽管瘤、囊腺肉瘤、胚胎癌、子宫内膜癌、内皮细胞肉瘤、室管膜瘤、上皮癌、食道癌、原发性血小板增多症、尤文氏瘤、纤维肉瘤、泌尿生殖系癌、胶质母细胞瘤、胶质瘤、胶质肉瘤、毛细胞性白血病、头颈癌、成血管细胞瘤、肝癌、霍奇金病、卡波济氏肉瘤、平滑肌肉瘤、白血病、脂肪肉瘤、肺癌、淋巴管内皮细胞肉瘤、淋巴管肉瘤、淋巴瘤、恶性类癌、恶性高钙血症、恶性黑色素瘤、恶性胰腺胰岛素瘤、肥大细胞瘤、髓样癌、成神经管细胞瘤、黑色素瘤、脑膜瘤、间皮瘤、多发性骨髓瘤、阿利贝尔氏病、骨髓瘤、粘液瘤、粘液肉瘤、神经母细胞瘤、非霍奇金淋巴瘤、非小细胞肺癌、间胶质瘤、成骨肉瘤、卵巢癌、胰腺癌、乳头状腺肉瘤、乳头状肉瘤、松果体瘤、真性红细胞增多症、原发性脑癌、原发性巨球蛋白血症、前列腺癌、直肠癌、肾细胞癌、视网膜母细胞瘤、横纹肌肉瘤，皮脂腺肉瘤、精原细胞瘤、皮肤癌、小细胞肺癌、软组织肉瘤、鳞状细胞癌、胃癌、汗腺癌、滑膜瘤、睾丸癌、喉癌、甲状腺癌和肾母细胞瘤。

中枢神经系统(CNS)疾病包括遗传疾病、神经退行性疾病、精神病和肿瘤。CNS示例性疾病包括但不限于阿尔茨海默病、帕金森氏病、亨廷顿氏舞蹈病、海绵状脑白质营养不良症、雷氏病、雷夫叙姆病、妥瑞症、原发性脊髓侧索硬化、肌萎缩性侧索硬化、进行性肌萎缩、皮克氏病、肌肉萎缩症、多发性硬化、重症肌无力、皮质下动脉硬化性脑病、脊髓或头部损伤引起的创伤、泰-萨克斯病、莱施-尼汉病、癫痫、脑梗死、精神疾病(包括情感障碍(例如，抑郁症、双相情感障碍、持续性情感障碍、继发性情感障碍、噪狂症、躁狂性精神病)、精神分裂症、分裂情感性障碍、分裂样精神病、赖药症(例如，酒精和其它物质依赖症)、神经症(例如，焦虑、强迫症、躯体形式障碍、分离性障碍、悲伤、产后忧郁症)、精神病(例如，幻觉和妄想，未指定的精神病(Psychosis NOS))、痴呆、衰老、偏执狂、注意力缺失症、性心理障碍、睡眠障碍、疼痛障碍、饮食或体重失调(例如，肥胖症、恶病质、神经性厌食症和易饿症)，涉及视网膜、后束和视神经的眼睛疾病(例如，色素性视网膜炎、糖尿病视网膜病、和其它视网膜退行性疾病、葡萄膜炎、老年性黄斑变性、青光眼)及CNS癌症和肿瘤(例如，垂体瘤)。

自身免疫性疾病和炎症性疾病和病症包括但不限于心肌炎、心肌梗塞后综合征、心包切开术后综合征、亚急性细菌性心内膜炎、抗肾小球基底膜肾炎、间质性膀胱炎、狼疮性肾炎、自身免疫性肝炎、原发性胆汁性肝硬化、原发性硬化性胆管炎综合征、抗合成酶综合征、鼻窦炎、牙周炎、动脉粥样硬化、皮炎、过敏、过敏性鼻炎，过敏性气道炎症、慢性阻塞性肺病、嗜酸细胞性肺炎、嗜酸细胞性食管炎、嗜酸性白细胞性增多综合征、移植物抗宿主病、特应性皮炎、肺结核、哮喘、慢性消化性溃疡、斑秃、自身免疫性血管性水肿、自身免疫性孕酮性皮炎、自身免疫性荨麻疹、大疱性类天疱疮、瘢痕性类天疱疮、疱疹样皮炎、盘状红斑狼疮、后天性大疱性表皮松解、结节性红斑、妊娠性天疱疮、化脓性汗腺炎、扁平苔藓、萎缩性硬化性苔藓、线性IgA病、硬斑病、寻常性天疱疮、急性痘疮样苔藓样糠疹、穆-哈二氏病、牛皮癣、系统性硬皮病、白斑病、艾迪生氏病、自身免疫性多内分泌腺病综合征Ⅰ型、自身免疫性多内分泌腺病综合征II型、自身免疫性多内分泌腺病综合征III型、自身免疫性胰腺炎、糖尿病I型、自身免疫性甲状腺炎、奥德甲状腺炎、格雷夫斯病、自身免疫性卵巢炎、子宫内膜异位症、自身免疫性睾丸炎、干燥综合征、自身免疫性肠病、乳糜泻、克罗恩病、肠易激综合症、憩室炎，显微镜下结肠炎、溃疡性结肠炎、抗磷脂综合征、再生障碍性贫血、自身免疫性溶血性贫血、自身免疫性淋巴细胞增生综合征、自身免疫性嗜中性白血球减少症、自身免疫性血小板减少性紫癜、冷凝集病、特发性混合性冷球蛋白血症、伊文氏综合征、恶性贫血、纯红细胞再生障碍、血小板减少症、痛性肥胖症、成人斯蒂尔病、强直性脊柱炎、CREST综合征、药物诱发狼疮、与附着点炎症相关的关节炎、嗜酸性筋膜炎、费尔蒂综合征、IgG4相关疾病、青少年关节炎、莱姆病(慢性)、混合性结缔组织病、汉-罗二氏综合征、帕罗综合征、神经痛性肌萎缩、银屑病关节炎、反应性关节炎、复发性多软骨炎、腹膜后纤维化、风湿热、类风湿性关节炎、结节病、施尼茨勒综合征、系统性红斑狼疮、未分化的结缔组织病、皮肌炎、纤维肌痛、肌炎、重症肌无力、神经性肌强直、副肿瘤性小脑神经变性、多发性肌炎、急性播散性脑脊髓炎、急性运动轴索性神经病、抗N-甲基-D-天冬氨酸受体脑炎、巴洛同心性硬化症、Bickerstaff脑干脑炎、慢性炎性脱髓鞘性多发性神经病、格林-巴雷综合征、桥本脑病、特发性炎性脱髓鞘性疾病、兰伯特-伊顿肌无力综合征、多发性硬化症、奥舒兰综合征、与链球菌相关的儿童自身免疫性神经精神疾病(PANDAS)、进行性炎症性神经病、躁动性腿综合征、僵人综合征、小舞蹈病、横贯性脊髓炎、自身免疫性视网膜病、自身免疫性葡萄膜炎、科根综合症、甲状腺眼病、中间葡萄膜炎、木样结膜炎、蚕蚀性角膜溃疡、视神经脊髓炎、眼球阵挛肌阵挛综合征、视神经炎、巩膜炎、Susac综合征、交感性眼炎、Tolosa-Hunt综合征、自身免疫性内耳病、梅尼埃病、

病、嗜酸性肉芽肿伴多血管炎、巨细胞动脉炎、肉芽肿伴多发性脉管炎、IgA血管炎、川崎病、白细胞增生性血管炎、狼疮性血管炎、类风湿性血管炎、显微镜下多血管炎、结节性多动脉炎、风湿性多肌痛、荨麻疹性血管炎、血管炎和原发性免疫缺陷。

此处所述术语“感染性疾病”是指与感染剂感染有关的任何疾病。感染剂的实例包括但不限于病毒和微生物(例如细菌、寄生虫、原生动物、隐孢子虫)。病毒包括但不限于肝炎病毒科，包括甲型、乙型、丙型、丁型、戊型、庚型肝炎等；黄病毒科，包括丙型肝炎病毒(HCV)、黄热病病毒和登革热病毒；逆转录病毒科，包括人类免疫缺陷病毒(HIV)和人类T淋巴细胞病毒(HTLV1和HTLV2)；疱疹病毒科，包括单纯疱疹病毒(HSV-1和HSV-2)、爱泼斯坦-巴尔病毒(EBV)、巨细胞病毒、水痘-带状疱疹病毒(VZV)、人类疱疹病毒6(HHV-6)、人类疱疹病毒8(HHV-8)和疱疹B病毒；乳多空病毒科，包括人乳头状瘤病毒；弹状病毒科，包括狂犬病病毒；副粘病毒科，包括呼吸道合胞病毒；呼肠孤病毒科，包括轮状病毒；布尼亚病毒科，包括汉坦病毒；丝状病毒科，包括埃博拉病毒；腺病毒科；细小病毒科，包括细小病毒B-19；沙眼病毒科，包括拉沙病毒；正粘病毒科，包括流感病毒；痘病毒科，包括羊痘病毒、传染性软疣病毒、天花病毒和猴痘病毒；披膜病毒科，包括委内瑞拉马脑炎病毒；冠状病毒科，包括冠状病毒，例如严重急性呼吸系统综合症(SARS)病毒；和微小核糖核酸病毒科，包括脊髓灰质炎病毒；鼻病毒；环状病毒；微小核糖核酸病毒；脑心肌炎病毒(EMV)；副流感病毒、腺病毒、柯萨奇病毒、埃科病毒、麻疹病毒、风疹病毒、人乳头瘤病毒、犬瘟热病毒、犬传染性肝炎病毒、猫杯状病毒、猫鼻气管炎病毒、TGE病毒(猪)、口蹄疫病毒、猿猴病毒5型、人副流感病毒2型、人偏肺病毒、肠病毒和任何其他已知或以后鉴定的病原性病毒(参见，例如，Fundamental Virology,Fields et al.,Eds.,3rd ed.,Lippincott-Raven,New York,1996，通过引用，其全部内容并入本申请中，用于病原性病毒的教导)。

病原微生物包括但不限于立克次氏体、衣原体、嗜衣原体、分枝杆菌、梭状芽胞杆菌、棒状杆菌、支原体、脲原体、军团菌、志贺氏菌、沙门氏菌、致病性大肠杆菌、博代氏菌、奈瑟氏菌、密螺旋体、芽孢杆菌、嗜血杆菌、莫拉氏菌、弧菌、葡萄球菌属、链球菌属、弯曲杆菌属、疏螺旋体属、钩端螺旋体属、埃利希体属、克雷伯菌属、假单胞菌属、幽门螺杆菌，以及现在已知或以后鉴定的其他任何病原微生物(参见，例如，Microbiology,Davis et al,Eds.,4^thed.,Lippincott,New York,1990，通过引用，其全部内容并入本申请中，用于病原微生物的教导)。微生物的具体实例包括但不限于幽门螺杆菌、肺炎衣原体、沙眼衣原体、解脲支原体、肺炎支原体、金黄色葡萄球菌、化脓性链球菌、肺炎链球菌、绿色链球菌、粪肠球菌、脑膜炎奈瑟菌、淋病奈瑟菌，梅毒螺旋体、炭疽杆菌、伤寒沙门氏菌、霍乱弧菌、鼠疫巴氏杆菌(鼠疫耶尔森菌)、铜绿假单胞菌、空肠弯曲菌、艰难梭菌、肉毒杆菌、结核分枝杆菌、伯氏疏螺旋体、杜克雷嗜血杆菌、白喉棒状杆菌、百日咳杆菌，副百日咳博德特菌、支气管败血症博德特菌、流感嗜血杆菌、单核细胞增生性李斯特菌、福氏志贺氏菌、嗜吞噬细胞无形体、肠毒性大肠杆菌和埃及血吸虫。

在一些实施例中，所述疾病或病症包括但不限于肥胖症、糖尿病、心脏病、自闭症、脆性X综合征、ATR-X综合征、快乐木偶综合征、普拉德-威利综合征、伯-韦综合征、解救综合征、鲁宾斯坦-泰比综合征、锥形指和鸡胸综合征、免疫缺陷、着丝粒不稳定面部异常综合征、α-地中海贫血、白血病、德朗热综合征、歌舞伎综合征、进行性系统性硬化和心脏肥大。

其中所述测定基因组位点的表观遗传或突变状态包括：

a)从受试者分离生物样品；

其中存在和不存在所述试剂的条件下基因组位点表观遗传或突变状态发生变化，则表明所述试剂修饰基因组位点的表观遗传或突变状态。

筛选方法可用于鉴定增加或减少表观遗传修饰或突变的试剂。在一些实施例中，检测到的增加或减少在统计学上是显著的，例如至少p＜0.05，例如p＜0.01、0.005或0.001。在其他实施例中，检测到的增加或减少是至少约10％、20％、30％、40％、50％、60％、70％、80％、90％、100％或更多。

可以根据本发明筛选任何目标化合物。合适的试验化合物包括有机和无机分子。合适的有机分子可包括但不限于小分子(小于大约1000道尔顿的化合物)、多肽(包括酶、抗体和抗体片段)、碳水化合物、脂质、辅酶和核酸分子(包括DNA、RNA和嵌合体及其类似物)以及核苷酸和核苷酸类似物。

此外，本发明的方法可以实践用于筛选化合物文库，例如小分子文库、组合化学化合物文库、多肽文库、cDNA文库、反义核酸文库等，或化合物的阵列集合，例如多肽和核酸阵列。

可以使用任何合适的筛选测定形式，例如高通量筛选。

该方法还可用于表征已被鉴定为修饰染色质中特异性基因组位点的表观遗传或突变状态的试剂。表征，例如临床前表征，可包括例如确定有效浓度，确定有效剂量方案，以及测量药代动力学和药效学。

a)从受试者分离生物样品；

c)透化处理细胞、细胞核、细胞器或组织；

b.DNA分子，包括：

i.核小体定位序列，

ii.DNA条形码；

iii.核酸酶或转座酶识别序列；及

f)加入与核酸酶或转座酶结合的亲和试剂-结合试剂；

h)分离切割的DNA；及

i)鉴定切割的DNA；及

a)从受试者分离生物样品；

c)透化处理细胞、细胞核、细胞器或组织；

b.DNA分子，包括：

i.核小体定位序列，

ii.DNA条形码；

iii.核酸酶或转座酶识别序列；及

f)加入与核酸酶或转座酶结合的亲和试剂-结合试剂；

h)分离切割的DNA；及

i)鉴定切割的DNA；及

从而测定和定量基因组位点表观遗传或突变的状态。

a)从受试者分离生物样品；

c)透化处理细胞、细胞核、细胞器或组织；

b.DNA分子，包括：

i.核小体定位序列，

ii.DNA条形码；

iii.核酸酶或转座酶识别序列；及

f)加入与核酸酶或转座酶结合的亲和试剂-结合试剂；

h)分离切割的DNA；及

i)鉴定切割的DNA；

k)重复步骤a)至j)至少一次；

a)从受试者分离生物样品；

c)透化处理细胞、细胞核、细胞器或组织；

b.DNA分子，包括：

i.核小体定位序列，

ii.DNA条形码；

iii.核酸酶或转座酶识别序列；及

f)加入与核酸酶或转座酶结合的亲和试剂-结合试剂；

h)分离切割的DNA；及

i)鉴定切割的DNA；

j)通过将相对基因组丰度与核小体标准物进行比较，对基因组位点的表位进行检测和定量；k)重复步骤a)至j)至少一次；

从而监测受试者表观遗传治疗或突变治疗的有效性。

a)从受试者分离生物样品；

c)透化处理细胞、细胞核、细胞器或组织；

b.DNA分子，包括：

i.核小体定位序列，

ii.DNA条形码；

iii.核酸酶或转座酶识别序列；及

f)加入与核酸酶或转座酶结合的亲和试剂-结合试剂；

h)分离切割的DNA；及

i)鉴定切割的DNA；

a)从受试者分离生物样品；

c)透化处理细胞、细胞核、细胞器或组织；

b.DNA分子，包括：

i.核小体定位序列，

ii.DNA条形码；

iii.核酸酶或转座酶识别序列；及

f)加入与核酸酶或转座酶结合的亲和试剂-结合试剂；

h)分离切割的DNA；及

i)鉴定切割的DNA；

a)从受试者分离生物样品；

c)透化处理细胞、细胞核、细胞器或组织；

b.DNA分子，包括：

i.核小体定位序列，

ii.DNA条形码；

iii.核酸酶或转座酶识别序列；及

f)加入与核酸酶或转座酶结合的亲和试剂-结合试剂；

h)分离切割的DNA；及

i)鉴定切割的DNA；

从而鉴定表观遗传修饰或突变相关疾病或病症的生物标记。

其中所述测定基因组位点的表观遗传或突变状态包括：

a)从受试者分离生物样品；

c)透化处理细胞、细胞核、细胞器或组织；

b.DNA分子，包括：

i.核小体定位序列，

ii.DNA条形码；

iii.核酸酶或转座酶识别序列；及

f)加入与核酸酶或转座酶结合的亲和试剂-结合试剂；

h)分离切割的DNA；及

i)鉴定切割的DNA；及

对于这些束缚酶方法中的每一种方法，都适用以上关于染色质免疫沉淀测定的描述。

在一些实施例中，DNA分子在核小体定位序列和结合成员之间包含长度为大约10至大约80个核苷酸，例如大约15至大约40个核苷酸或大约15至大约30个核苷酸的接头，其中该接头包括核酸酶或转座酶识别序列。

此处所述“核心元件”是与核小体共价或非共价结合或作为其一部分的任何蛋白质或核酸，包括但不限于组蛋白、核酸、转录因子、染色质阅读器和染色质重塑剂(例如，写入器、擦除器)，例如组蛋白乙酰基转移酶、组蛋白脱乙酰基酶、SWI/SNF、ISWI。

核小体标准物将包括与生物样品中检测到的靶表位相同的靶表位。核小体标准物可包括一个或一个以上的靶表位。核小体标准物可以以一系列浓度存在。

在一些实施例中，核酸酶或转座酶识别序列被内脱氧核糖核酸酶识别，例如被微球菌核酸酶、S1核酸酶、绿豆核酸酶、胰腺DNase I、酵母HO内切核酸酶、限制性内切核酸酶或归巢内切核酸酶识别。在一些实施例中，识别序列可以是被核酸酶或转座酶结合的特异性序列。在一些实施例中，识别序列可以是基于特异性序列未被核酸酶或转座酶识别的序列，但是具有使该序列优先被核酸酶或转座酶结合的特征。在一个实施例中，识别序列是富-A/T区域。

在一些实施例中，核酸酶或转座酶识别序列被转座酶识别，例如被Tn5，Mu，IS5，IS91，Tn552，Ty1，Tn7，Tn/O，Mariner，P Element，Tn3，Tn10或Tn903识别。

在一些实施例中，结合成员及其结合伴侣配对，例如生物素与抗生物素蛋白或抗生蛋白链菌素，纳米标签与抗生蛋白链菌素，谷胱甘肽与谷胱甘肽转移酶，抗原/表位与抗体，多组氨酸与镍，多核苷酸与互补的多核苷酸，适体与其特异性靶分子，或Si-标签和二氧化硅。

在一些实施例中，结合成员连接至DNA分子的5'和/或3'末端。

在一些实施例中，DNA条形码具有大约6至大约50个碱基对的长度，例如大约7至大约30个碱基对或大约8至大约20个碱基对。

在一些实施例中，核小体中的每个组蛋白独立地是完全合成的、半合成的或重组的。

在一些实施例中，组蛋白翻译后修饰、突变和/或组蛋白变体和/或DNA转录后修饰选自翻译后修饰，包括但不限于丝氨酸和丙氨酸的N-乙酰化；丝氨酸、苏氨酸和酪氨酸的磷酸化；N-巴豆酰化、赖氨酸的N-酰化；赖氨酸的N6-甲基化、N6，N6-二甲基化、N6，N6，N6-三甲基化；精氨酸的ω-N-甲基化、对称-二甲基化、不对称-二甲基化；精氨酸的瓜氨酸化；赖氨酸的泛素化；赖氨酸的类泛素化；丝氨酸和苏氨酸的O-甲基化；精氨酸、天冬氨酸和谷氨酸的ADP-核糖基化；致癌突变(例如H3K4M，H3K9M，H3K27M，H3G34R，H3G34V，H3G34W或H3K36M)；转录后修饰包括但不限于5-甲基胞嘧啶、5-羟甲基胞嘧啶、5-甲酰基胞嘧啶、5-羧基胞嘧啶和3-甲基胞嘧啶；和组蛋白变体(例如，H3.3、H2A.Bbd、H2A.Z.1、H2A.Z.2、H2A.X、mH2A1.1、mH2A1.2、mH2A2和TH2B)。

在一些实施例中，核小体可以是一个组合的一部分，其中所述组合包括至少两个包括不同组蛋白翻译后修饰、突变和/或组蛋白变体和/或DNA转录后修饰的核小体。在某些实施例中，组合中的每个核小体包括不同的组蛋白翻译后修饰、突变和/或组蛋白变体和/或DNA转录后修饰，它们在组合中的浓度相同。在某些实施例中，组合中的每个核小体包括不同的组蛋白翻译后修饰、突变和/或组蛋白变体和/或DNA转录后修饰，它们在组合中以多种浓度存在，每个核小体的DNA条形码表明组合中存在的核小体的浓度。在一些实施例中，该组合进一步包括不包含翻译后修饰、突变或组蛋白变体和/或DNA转录后修饰的合成核小体。

在一些实施例中，核小体是例如包含2-10个核小体的多核小体的一部分。在一些实施例中，多核小体是阵列的一部分。在一些实施例中，所述阵列是阵列库的一部分，其中每个阵列包含独特的组蛋白翻译后修饰、突变或组蛋白变体和/或DNA转录后修饰。

在一些实施例中，步骤(f)的核酸酶或转座酶是无活性的，并且步骤(g)包括例如通过添加活化离子(例如钙)来活化核酸酶或转座酶。

在一些实施例中，鉴定切割的DNA包括对切割的DNA进行扩增和/或测序，例如qPCR，下一代测序或纳米串。

在一些实施例中，该方法进一步包括基于切割DNA中的DNA条形码序列，确定核小体、组合、多核小体、阵列或库的身份。

在上述方法中，固相载体可以是，例如珠子(例如，磁珠)或孔。

本发明的另一方面提供了包含执行此处所述方法之一的试剂及包含所述试剂的试剂盒。试剂可以包含在合适的包装或容器中。试剂盒可包括一种或多种含有本文所述标准物的试剂，用于例如在拉下实验、染色质免疫沉淀测定或染色质束缚酶测定中对真阳性和假阳性表位进行绝对定量。试剂盒还可包含至少一种此处所述的亲和试剂，例如抗体或其片段或变体。试剂盒还可以包括用于对条形码标识符序列进行测序的试剂(例如引物、探针)。这些标准物对于真阳性表位可能具有类似天然的亲和力、特异性和亲合力。试剂盒还可包括至少一种对假阳性表位具有类似天然的表位亲和力、特异性和亲合力的标准物。

在一些实施例中，标准物包括DNA-蛋白质复合物，其包括用组蛋白、组蛋白亚型、组蛋白翻译后修饰或组蛋白突变制备的半合成核小体，具有类似天然的亲和力、特异性和亲合力及条形码标识符序列。在各种实施例中，本领域熟悉的核心组蛋白序列的任何变体，或翻译后修饰，包括表1(a)-1(f)中定义的那些,可以安装在包括组蛋白八聚体的组蛋白上，假设维持了类似天然的表位亲和力、特异性和亲合力的话。在一个实施例中，一组标准物包括至少一个DNA-复合物标准物，其对真阳性表位具有类似天然的表位亲和力、特异性和亲合力，以及多个DNA-复合物标准物，它们对天然的DNA-蛋白质复合物库中可能存在的一系列脱靶表位(假阳性表位)具有类似天然的表位亲和力、特异性和亲合力。

在其他实施例中，试剂盒可在包装或容器中包括一种或多种洗涤缓冲液(例如，磷酸盐缓冲盐水)和/或其他缓冲液。在其他实施例中，试剂盒可包括分离捕获试剂必需的试剂，例如固相捕获试剂，其包括，例如与第二抗体或蛋白-A连接的顺磁性颗粒。试剂盒还可以包括用于测量捕获的标准物或样品数量所需的试剂。

供应试剂盒时，可以将不同的组分包装在单独的容器中，并在使用前立即混合。各组分的这种单独包装允许长期储存而不会丧失活性组分的功能。试剂盒还可以随附说明性材料。说明可以印刷在纸或其他基材上，和/或可以作为电子可读介质提供。

在一些实施例中，试剂盒可包括一组标准物，这些标准物代表特定类别的PTM的某些或全部不同可能性，例如单个组蛋白或多个组蛋白的，例如赖氨酸甲基化、赖氨酸酰化或精氨酸甲基化。该组标准物可以包括被认为与一种或多种疾病有关的一些或全部修饰。在一些实施例中，试剂盒可包括一组标准物，这些标准物代表组蛋白突变的大多数或全部不同可能性，例如单个组蛋白或多个组蛋白的，例如致癌性组蛋白突变。该组标准物可用于评估亲和试剂的特异性，监测技术变化性并归一化实验。量化标准物的回收率也可以用作继续进行其余测定(例如，下一代测序)的停止/继续决策点。

在一些实施例中，组中的每个种类可以多次包括。在一些实施例中，每个种类可以以相同的浓度多次表示，该种类的每次迭代具有作为内部对照的不同的条形码标识符序列。在一些实施例中，每个种类可以以不同的浓度多次表示，该种类的每次迭代具有代表标准物浓度的唯一的条形码标识符序列。这样的浓度系列可以用于绘制测定用标准曲线。每种浓度可以多次表示，该种类的每次迭代具有作为内部对照的不同的条形码标识符序列。

标准物的赖氨酸甲基化组的一个实例包括选自H3K4，H3K9，H3K27，H3K36和H4K20的部分或全部PTM，在该组中每个标准物可能代表有0、1、2或3个甲基。在一个实施例中，该组可以具有16个种类(5个赖氨酸残基中的每一个具有1、2或3个甲基基团以及未修饰的标准物)。在一些实施例中，该组可以包括具有作为内部对照的不同条形码标识符序列的每个标准物的副本。因此，该组可包括多达32个不同的种类。在一些实施例中，高达16种不同标准物中的每个标准物可以以相同的或不同的浓度多次表示，每个标准物具有代表标准物浓度的唯一的条形码标识符序列。例如，每个标准物在组中可以以2、3、4、5、6、7、8、9、10或更多种不同的浓度存在，每种浓度具有不同的条形码标识符序列。因此，一组可以具有唯一标准物，其具有8或16的倍数，例如总计16、24、32、40、48、56、64、72、80、96、104、112、120、128、136、144、152或160个种类。

标准物的精氨酸甲基化组的一个实例包括选自以下的一些或全部PTM：H2AR2me1、H2AR2me2a、H2AR2me2s、H3R2me1、H3R2me2a、H3R2me2s、H3R8me1、H3R8me2a、H3R8me2s、H3R17me1、H3R17me2a、H4R3me1、H4R3me2a和H4R3me2s，其中a是不对称的，而s是对称的。在一个实施例中，该组可以具有15个种类(14个PTM中的每一种以及未修饰的标准物)。在一些实施例中，该组可以包括具有作为内部对照的不同条形码标识符序列的每个标准物的副本。因此，该组可包括多达30个不同的种类。在一些实施例中，高达15种不同标准物中的每个标准物可以以相同的或不同的浓度多次表示，每个标准物具有代表标准物浓度的唯一的条形码标识符序列。例如，每个标准物在组中可以以2、3、4、5、6、7、8、9、10或更多种不同的浓度存在，每种浓度具有不同的条形码标识符序列。因此，一组可以具有唯一标准物，其具有15的倍数，例如总计30、45、60、75、90、105、120、135、或150个种类。

标准物的赖氨酸酰化组的一个实例包括选自以下的部分或全部PTM：ptmH2AtetraAc、H3K4ac、H3K9ac、H3K9bu、H3K9cr、H3K14ac、H3K18ac、H3K18bu、H3K18cr、H3tetraAc(K4-9-14-18ac)、H3K23ac、H3K27ac、H3K27bu、H3K27cr、H3K36ac、H3K56ac、H4K5ac、H4K8ac、H4K12ac、H4K16ac、H4tetraAc(K5-8-12-16ac)和H4K20ac。在一个实施例中，该组可以具有23个种类(22个PTM中的每一种以及未修饰的标准物)。在一些实施例中，该组可以包括具有作为内部对照的不同条形码标识符序列的每个标准物的副本。因此，该组可包括多达46个不同的种类。在一些实施例中，高达23种不同标准物中的每个标准物可以以相同的或不同的浓度多次表示，每个标准物具有代表标准物浓度的唯一的条形码标识符序列。例如，每个标准物在组中可以以2、3、4、5、6、7、8、9、10或更多种不同的浓度存在，每种浓度具有不同的条形码标识符序列。因此，一组可以具有唯一标准物，其具有23的倍数，例如总计46、69、92、115、138、161、184、207、或230个种类。

标准物的致癌突变组的一个实例包括部分或全部突变，包括但不限于H3K4M、H3K9M、H3K27M、H3G34R、H3G34V、H3G34W、H3K36M及其任何组合。该组还可以包括野生型H3。H3突变体可以基于H3的任何变体主链，例如，H3.1、H3.2或H3.3。因此，该组可包括多达8个不同的种类，每个种类具有唯一的条形码标识符序列。在一些实施例中，该组可以包括具有作为内部对照的不同条形码标识符序列的每个标准物的副本。因此，该组可包括多达16个不同的种类。在一些实施例中，高达8种不同标准物中的每个标准物可以以相同的或不同的浓度多次表示，每个标准物具有代表标准物浓度的唯一的条形码标识符序列。例如，每个标准物在组中可以以2、3、4、5、6、7、8、9、10或更多种不同的浓度存在，每种浓度具有不同的条形码标识符序列。因此，一组可以具有唯一标准物，其具有8或16的倍数，例如总计16、24、32、40、48、56、64、72、80、96、104、112、120、128、136、144、152或160个种类。

在一些实施例中，试剂盒适合采用束缚酶的染色质分析。在一些实施例中，试剂盒包括本发明的核小体、组、多核体、阵列、库或珠。在一些实施例中，试剂盒还包括抗体、适体或其它亲和试剂，它们与组蛋白翻译后修饰、突变或组蛋白变体或DNA转录后修饰特异性结合。在一些实施例中，试剂盒还包括与抗体结合蛋白(例如蛋白质A、蛋白质G、蛋白质A与蛋白质G之间的融合、蛋白质L或蛋白质Y等)、或与结合识别剂的实体(例如蛋白质)连接的核酸酶或转座酶。在一些实施中，试剂盒还包括珠粒，其包括结合元件的结合伴侣，例如磁珠。

上述说明是为了阐明本发明，不应视为限制本发明。本发明由下述权利要求定义，与所述权利要求相当的内容也包括在本发明中。

表1(a)人类组蛋白H2A 1/2/3类、H2A.X、H2A.Z和H2A.V的1/2/3/4/5亚型的翻译后修饰

表1(b)人类组蛋白H2A.J和H2B 1类的翻译后修饰

表1(c)人类组蛋白H2B 2/3/F-S类的翻译后修饰

位置	修饰类型说明
		1	N-乙酰脯氨酸
5	N6-乙酰赖氨酸
		5	N6-巴豆酰-L-赖氨酸
11	N6-乙酰赖氨酸
		11	N6-巴豆酰-L-赖氨酸
12	N6-乙酰赖氨酸
		12	N6-巴豆酰-L-赖氨酸
14	磷酸丝氨酸
		15	N6-乙酰赖氨酸
15	N6-巴豆酰-L-赖氨酸
		16	N6-乙酰赖氨酸
16	N6-巴豆酰-L-赖氨酸
		20	N6-乙酰赖氨酸
20	N6-巴豆酰-L-赖氨酸
		23	N6-乙酰赖氨酸
23	N6-巴豆酰-L-赖氨酸
		34	N6-巴豆酰-L-赖氨酸
36	磷酸丝氨酸
		46	N6-甲基赖氨酸
57	N6,N6-二甲基赖氨酸
		79	二甲基化精氨酸
85	N6,N6,N6-三甲基赖氨酸
		85	N6-乙酰赖氨酸
86	ω-N-甲基精氨酸
		92	ω-N-甲基精氨酸
108	N6-甲基赖氨酸
		115	磷酸苏氨酸
116	N6-甲基化赖氨酸
		112	O-连接的(GlcNAc)
34	甘氨酰赖氨酸异肽(Lys-Gly)(泛素中的G-Cter链间)
		121	甘氨酰赖氨酸异肽(Lys-Gly)(泛素中的G-Cter链间)

表1(d)人类推定组蛋白H2B 2-D/2-C类的翻译后修饰

位置	修饰类型说明
		1	N-乙酰脯氨酸
5	N6-乙酰赖氨酸
		5	N6-巴豆酰-L-赖氨酸
11	N6-乙酰赖氨酸
		11	N6-巴豆酰-L-赖氨酸
12	N6-乙酰赖氨酸
		12	N6-巴豆酰-L-赖氨酸
14	磷酸丝氨酸
		15	N6-乙酰赖氨酸
15	N6-巴豆酰-L-赖氨酸
		16	N6-乙酰赖氨酸
16	N6-巴豆酰-L-赖氨酸
		20	N6-乙酰赖氨酸
20	N6-巴豆酰-L-赖氨酸
		23	N6-乙酰赖氨酸
23	N6-巴豆酰-L-赖氨酸
		34	N6-巴豆酰-L-赖氨酸
36	磷酸丝氨酸
		46	N6-甲基赖氨酸
57	N6,N6-二甲基赖氨酸
		79	二甲基化精氨酸
85	N6,N6,N6-三甲基赖氨酸
		85	N6-乙酰赖氨酸
86	ω-N-甲基精氨酸
		92	ω-N-甲基精氨酸

表1(e)人类组蛋白H3.1/H3.1t/H3.2/H3.3/H3.3C的翻译后修饰

表1(f)人类组蛋白H3-样着丝粒蛋白A和人类组蛋白H4的翻译后修饰

序列表

<110> 埃皮赛佛尔有限公司

M·W·考雷司

迈克尔-克里斯托弗·基奥

<120> 基因组位点处核小体修饰和突变的定量方法及其临床应用

<130> 1426-11WO

<150> US 62/615,770

<151> 2018-01-10

<160> 115

<170> SIPOSequenceListing 1.0

<210> 1

<211> 203

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 1

ggcggccgac gcgatacacc gttcgtcgct ggagaatccc ggtgccgagg ccgctcaatt 60

ggtcgtagac agctctagca ccgcttaaac gcacgtacgc gctgtccccc gcgttttaac 120

cgccaagggg attactccct agtctccagg cacgtgtcag atatatacat cctgtgcgtt 180

cgacggtacg tcgagcggcc gcc 203

<210> 2

<211> 203

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 2

ggcggcgtat cgcgtcgcgc gtaatcgact ggagaatccc ggtgccgagg ccgctcaatt 60

ggtcgtagac agctctagca ccgcttaaac gcacgtacgc gctgtccccc gcgttttaac 120

cgccaagggg attactccct agtctccagg cacgtgtcag atatatacat cctgtgcgcg 180

acgttacgct cgacgtagcc gcc 203

<210> 3

<211> 203

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 3

ggcggcaccg atacgcgcgc ggtacgatct ggagaatccc ggtgccgagg ccgctcaatt 60

ggtcgtagac agctctagca ccgcttaaac gcacgtacgc gctgtccccc gcgttttaac 120

cgccaagggg attactccct agtctccagg cacgtgtcag atatatacat cctgttaatc 180

gacgcgatat cgcgcgtgcc gcc 203

<210> 4

<211> 203

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 4

ggcggcatat cgcgcgtcgt atcgcggtct ggagaatccc ggtgccgagg ccgctcaatt 60

ggtcgtagac agctctagca ccgcttaaac gcacgtacgc gctgtccccc gcgttttaac 120

cgccaagggg attactccct agtctccagg cacgtgtcag atatatacat cctgttcgta 180

tcgcgccgcg tattcgggcc gcc 203

<210> 5

<211> 203

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 5

ggcggcccgc gcgatattac gcgcgaatct ggagaatccc ggtgccgagg ccgctcaatt 60

ggtcgtagac agctctagca ccgcttaaac gcacgtacgc gctgtccccc gcgttttaac 120

cgccaagggg attactccct agtctccagg cacgtgtcag atatatacat cctgtacgaa 180

cgtcgatcgt cgattcggcc gcc 203

<210> 6

<211> 203

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 6

ggcggccgac gaacggttcg tacgcgagct ggagaatccc ggtgccgagg ccgctcaatt 60

ggtcgtagac agctctagca ccgcttaaac gcacgtacgc gctgtccccc gcgttttaac 120

cgccaagggg attactccct agtctccagg cacgtgtcag atatatacat cctgttcgcg 180

tacgaatcgc gtaatcggcc gcc 203

<210> 7

<211> 203

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 7

ggcggccgcg taatacgccg cgatacgact ggagaatccc ggtgccgagg ccgctcaatt 60

ggtcgtagac agctctagca ccgcttaaac gcacgtacgc gctgtccccc gcgttttaac 120

cgccaagggg attactccct agtctccagg cacgtgtcag atatatacat cctgtaacgc 180

gtatcgcgcg taacgcggcc gcc 203

<210> 8

<211> 203

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 8

ggcggccgta cgacgctcgc gatatccgct ggagaatccc ggtgccgagg ccgctcaatt 60

ggtcgtagac agctctagca ccgcttaaac gcacgtacgc gctgtccccc gcgttttaac 120

cgccaagggg attactccct agtctccagg cacgtgtcag atatatacat cctgtcgacg 180

ttaacgcgtt acgcgtcgcc gcc 203

<210> 9

<211> 203

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 9

ggcggcgcgt tcgacgggtc gcgaactact ggagaatccc ggtgccgagg ccgctcaatt 60

ggtcgtagac agctctagca ccgcttaaac gcacgtacgc gctgtccccc gcgttttaac 120

cgccaagggg attactccct agtctccagg cacgtgtcag atatatacat cctgtgtcgc 180

gaactacgtc gttcgacgcc gcc 203

<210> 10

<211> 203

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 10

ggcggctacg ctcggactcg cgcgatgact ggagaatccc ggtgccgagg ccgctcaatt 60

ggtcgtagac agctctagca ccgcttaaac gcacgtacgc gctgtccccc gcgttttaac 120

cgccaagggg attactccct agtctccagg cacgtgtcag atatatacat cctgtcgatc 180

gtcgcatcgg tacgctagcc gcc 203

<210> 11

<211> 203

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 11

ggcggctatt atgcgcgacc cgcgtacgct ggagaatccc ggtgccgagg ccgctcaatt 60

ggtcgtagac agctctagca ccgcttaaac gcacgtacgc gctgtccccc gcgttttaac 120

cgccaagggg attactccct agtctccagg cacgtgtcag atatatacat cctgtcgtac 180

cgcgatccga cgatcgagcc gcc 203

<210> 12

<211> 203

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 12

ggcggctcgc gaccgtacga atttcgcgct ggagaatccc ggtgccgagg ccgctcaatt 60

ggtcgtagac agctctagca ccgcttaaac gcacgtacgc gctgtccccc gcgttttaac 120

cgccaagggg attactccct agtctccagg cacgtgtcag atatatacat cctgtcgcgt 180

caatcgcgat tacgcgagcc gcc 203

<210> 13

<211> 203

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 13

ggcggctcgt acgaccgcgc gtatcgggct ggagaatccc ggtgccgagg ccgctcaatt 60

ggtcgtagac agctctagca ccgcttaaac gcacgtacgc gctgtccccc gcgttttaac 120

cgccaagggg attactccct agtctccagg cacgtgtcag atatatacat cctgtgcgat 180

cgtacgcgcg acgttaagcc gcc 203

<210> 14

<211> 203

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 14

ggcggcccgc gcgatattac gcgcgaatct ggagaatccc ggtgccgagg ccgctcaatt 60

ggtcgtagac agctctagca ccgcttaaac gcacgtacgc gctgtccccc gcgttttaac 120

cgccaagggg attactccct agtctccagg cacgtgtcag atatatacat cctgtcgacg 180

ttaacgcgtt acgcgtcgcc gcc 203

<210> 15

<211> 203

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 15

ggcggccgta cgacgctcgc gatatccgct ggagaatccc ggtgccgagg ccgctcaatt 60

ggtcgtagac agctctagca ccgcttaaac gcacgtacgc gctgtccccc gcgttttaac 120

cgccaagggg attactccct agtctccagg cacgtgtcag atatatacat cctgtacgaa 180

cgtcgatcgt cgattcggcc gcc 203

<210> 16

<211> 147

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 16

ctggagaatc ccggtgccga ggccgctcaa ttggtcgtag acagctctag caccgcttaa 60

acgcacgtac gcgctgtccc ccgcgtttta accgccaagg ggattactcc ctagtctcca 120

ggctattatg cgcgcgatac gcgtttc 147

<210> 17

<211> 147

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 17

ctggagaatc ccggtgccga ggccgctcaa ttggtcgtag acagctctag caccgcttaa 60

acgcacgtac gcgctgtccc ccgcgtttta accgccaagg ggattactcc ctagtctcca 120

ggccgcgcat aataatcgcg cgatttc 147

<210> 18

<211> 147

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 18

ctggagaatc ccggtgccga ggccgctcaa ttggtcgtag acagctctag caccgcttaa 60

acgcacgtac gcgctgtccc ccgcgtttta accgccaagg ggattactcc ctagtctcca 120

ggcatatcgc gcgttcgacg ttcgttc 147

<210> 19

<211> 147

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 19

ctggagaatc ccggtgccga ggccgctcaa ttggtcgtag acagctctag caccgcttaa 60

acgcacgtac gcgctgtccc ccgcgtttta accgccaagg ggattactcc ctagtctcca 120

ggcacgcgcg atattatcgc gtcgttc 147

<210> 20

<211> 147

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 20

ctggagaatc ccggtgccga ggccgctcaa ttggtcgtag acagctctag caccgcttaa 60

acgcacgtac gcgctgtccc ccgcgtttta accgccaagg ggattactcc ctagtctcca 120

ggctcgtcga cgatcgtcga atcgttc 147

<210> 21

<211> 147

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 21

ctggagaatc ccggtgccga ggccgctcaa ttggtcgtag acagctctag caccgcttaa 60

acgcacgtac gcgctgtccc ccgcgtttta accgccaagg ggattactcc ctagtctcca 120

ggctcgtcga ttcgacgcga atcgttc 147

<210> 22

<211> 147

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 22

ctggagaatc ccggtgccga ggccgctcaa ttggtcgtag acagctctag caccgcttaa 60

acgcacgtac gcgctgtccc ccgcgtttta accgccaagg ggattactcc ctagtctcca 120

ggctacgcga ttcgtcgttt cgcgttc 147

<210> 23

<211> 147

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 23

ctggagaatc ccggtgccga ggccgctcaa ttggtcgtag acagctctag caccgcttaa 60

acgcacgtac gcgctgtccc ccgcgtttta accgccaagg ggattactcc ctagtctcca 120

ggctatacgc gtcgacgatt cgcgttc 147

<210> 24

<211> 147

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 24

ctggagaatc ccggtgccga ggccgctcaa ttggtcgtag acagctctag caccgcttaa 60

acgcacgtac gcgctgtccc ccgcgtttta accgccaagg ggattactcc ctagtctcca 120

ggctcgcgta atcgtttcga cgcgttc 147

<210> 25

<211> 147

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 25

ctggagaatc ccggtgccga ggccgctcaa ttggtcgtag acagctctag caccgcttaa 60

acgcacgtac gcgctgtccc ccgcgtttta accgccaagg ggattactcc ctagtctcca 120

ggcttaacgt cgcgcgttcg aacgttc 147

<210> 26

<211> 147

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 26

ctggagaatc ccggtgccga ggccgctcaa ttggtcgtag acagctctag caccgcttaa 60

acgcacgtac gcgctgtccc ccgcgtttta accgccaagg ggattactcc ctagtctcca 120

ggccgtatta cgcgaatcgc gcgattc 147

<210> 27

<211> 147

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 27

ctggagaatc ccggtgccga ggccgctcaa ttggtcgtag acagctctag caccgcttaa 60

acgcacgtac gcgctgtccc ccgcgtttta accgccaagg ggattactcc ctagtctcca 120

ggctcgatta cgcgtcgcgc gtaattc 147

<210> 28

<211> 147

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 28

ctggagaatc ccggtgccga ggccgctcaa ttggtcgtag acagctctag caccgcttaa 60

acgcacgtac gcgctgtccc ccgcgtttta accgccaagg ggattactcc ctagtctcca 120

ggccgtttcg tacgcgcgac gtaattc 147

<210> 29

<211> 147

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 29

ctggagaatc ccggtgccga ggccgctcaa ttggtcgtag acagctctag caccgcttaa 60

acgcacgtac gcgctgtccc ccgcgtttta accgccaagg ggattactcc ctagtctcca 120

ggctcgcgta tacgtacgcg cgaattc 147

<210> 30

<211> 147

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 30

ctggagaatc ccggtgccga ggccgctcaa ttggtcgtag acagctctag caccgcttaa 60

acgcacgtac gcgctgtccc ccgcgtttta accgccaagg ggattactcc ctagtctcca 120

ggccgcgtaa tacgcgcgaa attcgtc 147

<210> 31

<211> 147

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 31

ctggagaatc ccggtgccga ggccgctcaa ttggtcgtag acagctctag caccgcttaa 60

acgcacgtac gcgctgtccc ccgcgtttta accgccaagg ggattactcc ctagtctcca 120

ggcgatagtc gacgttatcg cgtcgtc 147

<210> 32

<211> 147

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 32

ctggagaatc ccggtgccga ggccgctcaa ttggtcgtag acagctctag caccgcttaa 60

acgcacgtac gcgctgtccc ccgcgtttta accgccaagg ggattactcc ctagtctcca 120

ggccgtacga aacgcgttaa cgtcgtc 147

<210> 33

<211> 147

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 33

ctggagaatc ccggtgccga ggccgctcaa ttggtcgtag acagctctag caccgcttaa 60

acgcacgtac gcgctgtccc ccgcgtttta accgccaagg ggattactcc ctagtctcca 120

ggccgtcgac tatctcgtcg tatcgtc 147

<210> 34

<211> 147

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 34

ctggagaatc ccggtgccga ggccgctcaa ttggtcgtag acagctctag caccgcttaa 60

acgcacgtac gcgctgtccc ccgcgtttta accgccaagg ggattactcc ctagtctcca 120

ggcttacgcg taccaacgcg tatcgtc 147

<210> 35

<211> 147

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 35

ctggagaatc ccggtgccga ggccgctcaa ttggtcgtag acagctctag caccgcttaa 60

acgcacgtac gcgctgtccc ccgcgtttta accgccaagg ggattactcc ctagtctcca 120

ggccgaatcg cgtattacgc gatcgtc 147

<210> 36

<211> 147

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 36

ctggagaatc ccggtgccga ggccgctcaa ttggtcgtag acagctctag caccgcttaa 60

acgcacgtac gcgctgtccc ccgcgtttta accgccaagg ggattactcc ctagtctcca 120

ggctcggtac gctatcgtac gatcgtc 147

<210> 37

<211> 147

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 37

ctggagaatc ccggtgccga ggccgctcaa ttggtcgtag acagctctag caccgcttaa 60

acgcacgtac gcgctgtccc ccgcgtttta accgccaagg ggattactcc ctagtctcca 120

ggccgacgcg tatacgaatt tcgcgtc 147

<210> 38

<211> 147

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 38

ctggagaatc ccggtgccga ggccgctcaa ttggtcgtag acagctctag caccgcttaa 60

acgcacgtac gcgctgtccc ccgcgtttta accgccaagg ggattactcc ctagtctcca 120

ggctcgacgc gataattacg tcgcgtc 147

<210> 39

<211> 147

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 39

ctggagaatc ccggtgccga ggccgctcaa ttggtcgtag acagctctag caccgcttaa 60

acgcacgtac gcgctgtccc ccgcgtttta accgccaagg ggattactcc ctagtctcca 120

ggctcgcgcg aatattcgta tcgcgtc 147

<210> 40

<211> 147

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 40

ctggagaatc ccggtgccga ggccgctcaa ttggtcgtag acagctctag caccgcttaa 60

acgcacgtac gcgctgtccc ccgcgtttta accgccaagg ggattactcc ctagtctcca 120

ggctatcgcg tcgagtgata tcgcgtc 147

<210> 41

<211> 147

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 41

ctggagaatc ccggtgccga ggccgctcaa ttggtcgtag acagctctag caccgcttaa 60

acgcacgtac gcgctgtccc ccgcgtttta accgccaagg ggattactcc ctagtctcca 120

ggccgcgtaa tcgatacgtt acgcgtc 147

<210> 42

<211> 147

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 42

ctggagaatc ccggtgccga ggccgctcaa ttggtcgtag acagctctag caccgcttaa 60

acgcacgtac gcgctgtccc ccgcgtttta accgccaagg ggattactcc ctagtctcca 120

ggcttacgtc gcgataatcg acgcgtc 147

<210> 43

<211> 147

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 43

ctggagaatc ccggtgccga ggccgctcaa ttggtcgtag acagctctag caccgcttaa 60

acgcacgtac gcgctgtccc ccgcgtttta accgccaagg ggattactcc ctagtctcca 120

ggctattcgc gcgatcgcga ttacgtc 147

<210> 44

<211> 147

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 44

ctggagaatc ccggtgccga ggccgctcaa ttggtcgtag acagctctag caccgcttaa 60

acgcacgtac gcgctgtccc ccgcgtttta accgccaagg ggattactcc ctagtctcca 120

ggccgattac gcgaacgatt cgacgtc 147

<210> 45

<211> 147

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 45

ctggagaatc ccggtgccga ggccgctcaa ttggtcgtag acagctctag caccgcttaa 60

acgcacgtac gcgctgtccc ccgcgtttta accgccaagg ggattactcc ctagtctcca 120

ggccgtatac gcgattaacg cgacgtc 147

<210> 46

<211> 147

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 46

ctggagaatc ccggtgccga ggccgctcaa ttggtcgtag acagctctag caccgcttaa 60

acgcacgtac gcgctgtccc ccgcgtttta accgccaagg ggattactcc ctagtctcca 120

ggctagcgta ccgacgacgt taacgtc 147

<210> 47

<211> 147

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 47

ctggagaatc ccggtgccga ggccgctcaa ttggtcgtag acagctctag caccgcttaa 60

acgcacgtac gcgctgtccc ccgcgtttta accgccaagg ggattactcc ctagtctcca 120

ggcatcgtcg acgaacgttc gaacgtc 147

<210> 48

<211> 147

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 48

ctggagaatc ccggtgccga ggccgctcaa ttggtcgtag acagctctag caccgcttaa 60

acgcacgtac gcgctgtccc ccgcgtttta accgccaagg ggattactcc ctagtctcca 120

ggccgaatcg acgatagttc gcgactc 147

<210> 49

<211> 147

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 49

ctggagaatc ccggtgccga ggccgctcaa ttggtcgtag acagctctag caccgcttaa 60

acgcacgtac gcgctgtccc ccgcgtttta accgccaagg ggattactcc ctagtctcca 120

ggccgcgacg ttaacgcgat atcactc 147

<210> 50

<211> 147

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 50

ctggagaatc ccggtgccga ggccgctcaa ttggtcgtag acagctctag caccgcttaa 60

acgcacgtac gcgctgtccc ccgcgtttta accgccaagg ggattactcc ctagtctcca 120

ggcggtacgc gtaacgcgtc gattatc 147

<210> 51

<211> 147

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 51

ctggagaatc ccggtgccga ggccgctcaa ttggtcgtag acagctctag caccgcttaa 60

acgcacgtac gcgctgtccc ccgcgtttta accgccaagg ggattactcc ctagtctcca 120

ggctcgcgac gtaaattcgc gcgtatc 147

<210> 52

<211> 147

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 52

ctggagaatc ccggtgccga ggccgctcaa ttggtcgtag acagctctag caccgcttaa 60

acgcacgtac gcgctgtccc ccgcgtttta accgccaagg ggattactcc ctagtctcca 120

ggccgcgtat cggtcgcgta acgtatc 147

<210> 53

<211> 147

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 53

ctggagaatc ccggtgccga ggccgctcaa ttggtcgtag acagctctag caccgcttaa 60

acgcacgtac gcgctgtccc ccgcgtttta accgccaagg ggattactcc ctagtctcca 120

ggccgacgaa cggtgtcgcg aactatc 147

<210> 54

<211> 147

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 54

ctggagaatc ccggtgccga ggccgctcaa ttggtcgtag acagctctag caccgcttaa 60

acgcacgtac gcgctgtccc ccgcgtttta accgccaagg ggattactcc ctagtctcca 120

ggccgaacgg tcgtttcgcg cgatatc 147

<210> 55

<211> 147

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 55

ctggagaatc ccggtgccga ggccgctcaa ttggtcgtag acagctctag caccgcttaa 60

acgcacgtac gcgctgtccc ccgcgtttta accgccaagg ggattactcc ctagtctcca 120

ggcccgacga tcgtacgacg cgatatc 147

<210> 56

<211> 147

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 56

ctggagaatc ccggtgccga ggccgctcaa ttggtcgtag acagctctag caccgcttaa 60

acgcacgtac gcgctgtccc ccgcgtttta accgccaagg ggattactcc ctagtctcca 120

ggccgacgta ccgtttacgc gtcgatc 147

<210> 57

<211> 147

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 57

ctggagaatc ccggtgccga ggccgctcaa ttggtcgtag acagctctag caccgcttaa 60

acgcacgtac gcgctgtccc ccgcgtttta accgccaagg ggattactcc ctagtctcca 120

ggccgtacga cgctacgaac gtcgatc 147

<210> 58

<211> 147

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 58

ctggagaatc ccggtgccga ggccgctcaa ttggtcgtag acagctctag caccgcttaa 60

acgcacgtac gcgctgtccc ccgcgtttta accgccaagg ggattactcc ctagtctcca 120

ggcccgcgcg atattttcgt cgcgatc 147

<210> 59

<211> 147

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 59

ctggagaatc ccggtgccga ggccgctcaa ttggtcgtag acagctctag caccgcttaa 60

acgcacgtac gcgctgtccc ccgcgtttta accgccaagg ggattactcc ctagtctcca 120

ggctcgcgcg acatcgtaat cgcgatc 147

<210> 60

<211> 147

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 60

ctggagaatc ccggtgccga ggccgctcaa ttggtcgtag acagctctag caccgcttaa 60

acgcacgtac gcgctgtccc ccgcgtttta accgccaagg ggattactcc ctagtctcca 120

ggccgcgcga tatgattacg cgcgatc 147

<210> 61

<211> 147

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 61

ctggagaatc ccggtgccga ggccgctcaa ttggtcgtag acagctctag caccgcttaa 60

acgcacgtac gcgctgtccc ccgcgtttta accgccaagg ggattactcc ctagtctcca 120

ggccgcgtat tcggttcgta cgcgatc 147

<210> 62

<211> 147

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 62

ctggagaatc ccggtgccga ggccgctcaa ttggtcgtag acagctctag caccgcttaa 60

acgcacgtac gcgctgtccc ccgcgtttta accgccaagg ggattactcc ctagtctcca 120

ggctcgatcg tcggcgatcg tacgatc 147

<210> 63

<211> 147

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 63

ctggagaatc ccggtgccga ggccgctcaa ttggtcgtag acagctctag caccgcttaa 60

acgcacgtac gcgctgtccc ccgcgtttta accgccaagg ggattactcc ctagtctcca 120

ggcacgatcg tcggtcgttc gacgatc 147

<210> 64

<211> 147

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 64

ctggagaatc ccggtgccga ggccgctcaa ttggtcgtag acagctctag caccgcttaa 60

acgcacgtac gcgctgtccc ccgcgtttta accgccaagg ggattactcc ctagtctcca 120

ggccgacgta tcggcgatac gacgatc 147

<210> 65

<211> 147

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 65

ctggagaatc ccggtgccga ggccgctcaa ttggtcgtag acagctctag caccgcttaa 60

acgcacgtac gcgctgtccc ccgcgtttta accgccaagg ggattactcc ctagtctcca 120

ggcatatcgc gcggtcgtcg aacgatc 147

<210> 66

<211> 147

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 66

ctggagaatc ccggtgccga ggccgctcaa ttggtcgtag acagctctag caccgcttaa 60

acgcacgtac gcgctgtccc ccgcgtttta accgccaagg ggattactcc ctagtctcca 120

ggccgacgta acggacgcga aacgatc 147

<210> 67

<211> 147

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 67

ctggagaatc ccggtgccga ggccgctcaa ttggtcgtag acagctctag caccgcttaa 60

acgcacgtac gcgctgtccc ccgcgtttta accgccaagg ggattactcc ctagtctcca 120

ggcacgaccg ttcgcgtcgc gttaatc 147

<210> 68

<211> 147

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 68

ctggagaatc ccggtgccga ggccgctcaa ttggtcgtag acagctctag caccgcttaa 60

acgcacgtac gcgctgtccc ccgcgtttta accgccaagg ggattactcc ctagtctcca 120

ggccgtatcg gtcgcgatcg cgtaatc 147

<210> 69

<211> 147

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 69

ctggagaatc ccggtgccga ggccgctcaa ttggtcgtag acagctctag caccgcttaa 60

acgcacgtac gcgctgtccc ccgcgtttta accgccaagg ggattactcc ctagtctcca 120

ggcctcgttc gtcgttcgcg cgtaatc 147

<210> 70

<211> 147

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 70

ctggagaatc ccggtgccga ggccgctcaa ttggtcgtag acagctctag caccgcttaa 60

acgcacgtac gcgctgtccc ccgcgtttta accgccaagg ggattactcc ctagtctcca 120

ggcaccgttc gtcgtcgacg cgtaatc 147

<210> 71

<211> 147

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 71

ctggagaatc ccggtgccga ggccgctcaa ttggtcgtag acagctctag caccgcttaa 60

acgcacgtac gcgctgtccc ccgcgtttta accgccaagg ggattactcc ctagtctcca 120

ggctacgtcc gtcgcgacgc gataatc 147

<210> 72

<211> 147

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 72

ctggagaatc ccggtgccga ggccgctcaa ttggtcgtag acagctctag caccgcttaa 60

acgcacgtac gcgctgtccc ccgcgtttta accgccaagg ggattactcc ctagtctcca 120

ggcccgttac gtcgtatcgc gcgaatc 147

<210> 73

<211> 147

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 73

ctggagaatc ccggtgccga ggccgctcaa ttggtcgtag acagctctag caccgcttaa 60

acgcacgtac gcgctgtccc ccgcgtttta accgccaagg ggattactcc ctagtctcca 120

ggcacggtac gtcgttacgc gcgaatc 147

<210> 74

<211> 147

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 74

ctggagaatc ccggtgccga ggccgctcaa ttggtcgtag acagctctag caccgcttaa 60

acgcacgtac gcgctgtccc ccgcgtttta accgccaagg ggattactcc ctagtctcca 120

ggcccgatac gtcgtcgcgt acgaatc 147

<210> 75

<211> 147

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 75

ctggagaatc ccggtgccga ggccgctcaa ttggtcgtag acagctctag caccgcttaa 60

acgcacgtac gcgctgtccc ccgcgtttta accgccaagg ggattactcc ctagtctcca 120

ggctcgcacg atcgcgcgat acgaatc 147

<210> 76

<211> 147

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 76

ctggagaatc ccggtgccga ggccgctcaa ttggtcgtag acagctctag caccgcttaa 60

acgcacgtac gcgctgtccc ccgcgtttta accgccaagg ggattactcc ctagtctcca 120

ggctcgccga atcgacgcgt cgaaatc 147

<210> 77

<211> 147

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 77

ctggagaatc ccggtgccga ggccgctcaa ttggtcgtag acagctctag caccgcttaa 60

acgcacgtac gcgctgtccc ccgcgtttta accgccaagg ggattactcc ctagtctcca 120

ggctatgcgt cgcgtcgcga cgaaatc 147

<210> 78

<211> 147

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 78

ctggagaatc ccggtgccga ggccgctcaa ttggtcgtag acagctctag caccgcttaa 60

acgcacgtac gcgctgtccc ccgcgtttta accgccaagg ggattactcc ctagtctcca 120

ggccatatcg cgcgcgtatc gcggttc 147

<210> 79

<211> 147

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 79

ctggagaatc ccggtgccga ggccgctcaa ttggtcgtag acagctctag caccgcttaa 60

acgcacgtac gcgctgtccc ccgcgtttta accgccaagg ggattactcc ctagtctcca 120

ggccgtatag cgcgccgtac gtcgttc 147

<210> 80

<211> 147

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 80

ctggagaatc ccggtgccga ggccgctcaa ttggtcgtag acagctctag caccgcttaa 60

acgcacgtac gcgctgtccc ccgcgtttta accgccaagg ggattactcc ctagtctcca 120

ggcaccgata cgcgtagcga cgcgttc 147

<210> 81

<211> 147

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 81

ctggagaatc ccggtgccga ggccgctcaa ttggtcgtag acagctctag caccgcttaa 60

acgcacgtac gcgctgtccc ccgcgtttta accgccaagg ggattactcc ctagtctcca 120

ggcccgaata cgcgtcgacg accgttc 147

<210> 82

<211> 147

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 82

ctggagaatc ccggtgccga ggccgctcaa ttggtcgtag acagctctag caccgcttaa 60

acgcacgtac gcgctgtccc ccgcgtttta accgccaagg ggattactcc ctagtctcca 120

ggctcgtacg accgcggtcg aacgttc 147

<210> 83

<211> 147

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 83

ctggagaatc ccggtgccga ggccgctcaa ttggtcgtag acagctctag caccgcttaa 60

acgcacgtac gcgctgtccc ccgcgtttta accgccaagg ggattactcc ctagtctcca 120

ggcagcgtcg tacgtcgcga cgagttc 147

<210> 84

<211> 147

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 84

ctggagaatc ccggtgccga ggccgctcaa ttggtcgtag acagctctag caccgcttaa 60

acgcacgtac gcgctgtccc ccgcgtttta accgccaagg ggattactcc ctagtctcca 120

ggccgcgcta tacgcgtacc gcgattc 147

<210> 85

<211> 147

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 85

ctggagaatc ccggtgccga ggccgctcaa ttggtcgtag acagctctag caccgcttaa 60

acgcacgtac gcgctgtccc ccgcgtttta accgccaagg ggattactcc ctagtctcca 120

ggccgaccga tacgcgcggt acgattc 147

<210> 86

<211> 147

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 86

ctggagaatc ccggtgccga ggccgctcaa ttggtcgtag acagctctag caccgcttaa 60

acgcacgtac gcgctgtccc ccgcgtttta accgccaagg ggattactcc ctagtctcca 120

ggcttcgagc gacgcggcgt acgattc 147

<210> 87

<211> 147

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 87

ctggagaatc ccggtgccga ggccgctcaa ttggtcgtag acagctctag caccgcttaa 60

acgcacgtac gcgctgtccc ccgcgtttta accgccaagg ggattactcc ctagtctcca 120

ggcgtcgaac gacgcggtcg acgattc 147

<210> 88

<211> 147

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 88

ctggagaatc ccggtgccga ggccgctcaa ttggtcgtag acagctctag caccgcttaa 60

acgcacgtac gcgctgtccc ccgcgtttta accgccaagg ggattactcc ctagtctcca 120

ggcgacgcgt aacgccgcgc gtaattc 147

<210> 89

<211> 147

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 89

ctggagaatc ccggtgccga ggccgctcaa ttggtcgtag acagctctag caccgcttaa 60

acgcacgtac gcgctgtccc ccgcgtttta accgccaagg ggattactcc ctagtctcca 120

ggctcgacgc gtagcgcgac gcaattc 147

<210> 90

<211> 147

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 90

ctggagaatc ccggtgccga ggccgctcaa ttggtcgtag acagctctag caccgcttaa 60

acgcacgtac gcgctgtccc ccgcgtttta accgccaagg ggattactcc ctagtctcca 120

ggccgacgaa cgagtcgtat cgcggtc 147

<210> 91

<211> 147

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 91

ctggagaatc ccggtgccga ggccgctcaa ttggtcgtag acagctctag caccgcttaa 60

acgcacgtac gcgctgtccc ccgcgtttta accgccaagg ggattactcc ctagtctcca 120

ggccgttacg cgtcttatcg cgcggtc 147

<210> 92

<211> 147

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 92

ctggagaatc ccggtgccga ggccgctcaa ttggtcgtag acagctctag caccgcttaa 60

acgcacgtac gcgctgtccc ccgcgtttta accgccaagg ggattactcc ctagtctcca 120

ggctaacgtc gcgcattacg cgcggtc 147

<210> 93

<211> 147

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 93

ctggagaatc ccggtgccga ggccgctcaa ttggtcgtag acagctctag caccgcttaa 60

acgcacgtac gcgctgtccc ccgcgtttta accgccaagg ggattactcc ctagtctcca 120

ggctacgctc ggactatacg cgcggtc 147

<210> 94

<211> 147

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 94

ctggagaatc ccggtgccga ggccgctcaa ttggtcgtag acagctctag caccgcttaa 60

acgcacgtac gcgctgtccc ccgcgtttta accgccaagg ggattactcc ctagtctcca 120

ggccgtcgtt cgacacgacg tacggtc 147

<210> 95

<211> 147

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 95

ctggagaatc ccggtgccga ggccgctcaa ttggtcgtag acagctctag caccgcttaa 60

acgcacgtac gcgctgtccc ccgcgtttta accgccaagg ggattactcc ctagtctcca 120

ggcgcgcgac gttacgattc gacggtc 147

<210> 96

<211> 147

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 96

ctggagaatc ccggtgccga ggccgctcaa ttggtcgtag acagctctag caccgcttaa 60

acgcacgtac gcgctgtccc ccgcgtttta accgccaagg ggattactcc ctagtctcca 120

ggctgtcgcg cgtatacgct cgtcgtc 147

<210> 97

<211> 147

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 97

ctggagaatc ccggtgccga ggccgctcaa ttggtcgtag acagctctag caccgcttaa 60

acgcacgtac gcgctgtccc ccgcgtttta accgccaagg ggattactcc ctagtctcca 120

ggcgtccgag cgtagtatcg cgtcgtc 147

<210> 98

<211> 147

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 98

ctggagaatc ccggtgccga ggccgctcaa ttggtcgtag acagctctag caccgcttaa 60

acgcacgtac gcgctgtccc ccgcgtttta accgccaagg ggattactcc ctagtctcca 120

ggctcgcgac cgtagttacg cgtcgtc 147

<210> 99

<211> 147

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 99

ctggagaatc ccggtgccga ggccgctcaa ttggtcgtag acagctctag caccgcttaa 60

acgcacgtac gcgctgtccc ccgcgtttta accgccaagg ggattactcc ctagtctcca 120

ggccgacgga cgtacgtatc cgtcgtc 147

<210> 100

<211> 147

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 100

ctggagaatc ccggtgccga ggccgctcaa ttggtcgtag acagctctag caccgcttaa 60

acgcacgtac gcgctgtccc ccgcgtttta accgccaagg ggattactcc ctagtctcca 120

ggccgcgacg catagcgtta cgtcgtc 147

<210> 101

<211> 147

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 101

ctggagaatc ccggtgccga ggccgctcaa ttggtcgtag acagctctag caccgcttaa 60

acgcacgtac gcgctgtccc ccgcgtttta accgccaagg ggattactcc ctagtctcca 120

ggcctacgcg tcgacgcgtt agtcgtc 147

<210> 102

<211> 147

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 102

ctggagaatc ccggtgccga ggccgctcaa ttggtcgtag acagctctag caccgcttaa 60

acgcacgtac gcgctgtccc ccgcgtttta accgccaagg ggattactcc ctagtctcca 120

ggcccgacga tcgatcggcg tatcgtc 147

<210> 103

<211> 147

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 103

ctggagaatc ccggtgccga ggccgctcaa ttggtcgtag acagctctag caccgcttaa 60

acgcacgtac gcgctgtccc ccgcgtttta accgccaagg ggattactcc ctagtctcca 120

ggccgatcgt gcgacgcgac tatcgtc 147

<210> 104

<211> 147

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 104

ctggagaatc ccggtgccga ggccgctcaa ttggtcgtag acagctctag caccgcttaa 60

acgcacgtac gcgctgtccc ccgcgtttta accgccaagg ggattactcc ctagtctcca 120

ggccgattcg gcgatgcgac gatcgtc 147

<210> 105

<211> 147

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 105

ctggagaatc ccggtgccga ggccgctcaa ttggtcgtag acagctctag caccgcttaa 60

acgcacgtac gcgctgtccc ccgcgtttta accgccaagg ggattactcc ctagtctcca 120

ggctacggtc gcgaccgtcg aatcgtc 147

<210> 106

<211> 147

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 106

ctggagaatc ccggtgccga ggccgctcaa ttggtcgtag acagctctag caccgcttaa 60

acgcacgtac gcgctgtccc ccgcgtttta accgccaagg ggattactcc ctagtctcca 120

ggcatgtcgc gcgacgcgtc aatcgtc 147

<210> 107

<211> 147

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 107

ctggagaatc ccggtgccga ggccgctcaa ttggtcgtag acagctctag caccgcttaa 60

acgcacgtac gcgctgtccc ccgcgtttta accgccaagg ggattactcc ctagtctcca 120

ggccggtcgt acgacgcgat atgcgtc 147

<210> 108

<211> 147

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 108

ctggagaatc ccggtgccga ggccgctcaa ttggtcgtag acagctctag caccgcttaa 60

acgcacgtac gcgctgtccc ccgcgtttta accgccaagg ggattactcc ctagtctcca 120

ggctacgcgc gacacgtaat cggcgtc 147

<210> 109

<211> 147

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 109

ctggagaatc ccggtgccga ggccgctcaa ttggtcgtag acagctctag caccgcttaa 60

acgcacgtac gcgctgtccc ccgcgtttta accgccaagg ggattactcc ctagtctcca 120

ggccgtcgct cgaatatcgg tcgcgtc 147

<210> 110

<211> 147

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 110

ctggagaatc ccggtgccga ggccgctcaa ttggtcgtag acagctctag caccgcttaa 60

acgcacgtac gcgctgtccc ccgcgtttta accgccaagg ggattactcc ctagtctcca 120

ggcgcgttcg acggattgcg tcgcgtc 147

<210> 111

<211> 147

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 111

ctggagaatc ccggtgccga ggccgctcaa ttggtcgtag acagctctag caccgcttaa 60

acgcacgtac gcgctgtccc ccgcgtttta accgccaagg ggattactcc ctagtctcca 120

ggccgcgtta cgcgcgatag tcgcgtc 147

<210> 112

<211> 147

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 112

ctggagaatc ccggtgccga ggccgctcaa ttggtcgtag acagctctag caccgcttaa 60

acgcacgtac gcgctgtccc ccgcgtttta accgccaagg ggattactcc ctagtctcca 120

ggccgcgtaa cgcggtcgta tcgcgtc 147

<210> 113

<211> 147

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 113

ctggagaatc ccggtgccga ggccgctcaa ttggtcgtag acagctctag caccgcttaa 60

acgcacgtac gcgctgtccc ccgcgtttta accgccaagg ggattactcc ctagtctcca 120

ggctcggtac gcgccggata tcgcgtc 147

<210> 114

<211> 147

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 114

ctggagaatc ccggtgccga ggccgctcaa ttggtcgtag acagctctag caccgcttaa 60

acgcacgtac gcgctgtccc ccgcgtttta accgccaagg ggattactcc ctagtctcca 120

ggcccgtcga acgccgcata tcgcgtc 147

<210> 115

<211> 147

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 115

ctggagaatc ccggtgccga ggccgctcaa ttggtcgtag acagctctag caccgcttaa 60

acgcacgtac gcgctgtccc ccgcgtttta accgccaagg ggattactcc ctagtctcca 120

ggcgcgcgta ccgataccga tcgcgtc 147

Claims

1.一种检测和定量受试者生物样品染色质内特异性基因组位点核心组蛋白表位处表观遗传修饰或突变的方法，所述方法包括：

a)从受试者分离生物样品；

b)从所述生物样品的染色质制备天然核小体文库，其中所述文库包括核小体，所述核小体包括具有表位的核心组蛋白及多核苷酸，所述多核苷酸包括指示基因组位点的核苷酸序列；

c)向文库中加入标准物，建立掺杂文库；其中所述标准物包括重组核小体，其包括：(i)具有表位的标准组蛋白或组蛋白片段和(ii)标准多核苷酸，其包括核小体定位序列和条形码标识序列，其中所述标准组蛋白或组蛋白片段和所述标准多核苷酸形成稳定的蛋白质-DNA结合；

f)将掺杂文库输入数量中与被捕获的标准物结合的条形码标识序列的数量与和标准物结合的给定核苷酸序列的数量进行比较，确定表位的标准物捕获效率；

g)将相对基因组丰度与标准物捕获效率进行比较，确定基因组位点处核心组蛋白表位的密度；从而，检测和定量表位处的表观遗传修饰或突变。

2.一种测定和定量患有疾病或病症的受试者生物样品染色质中特异性基因组位点表观遗传或突变状态的方法，所述方法包括：

a)从受试者分离生物样品；

g)将相对基因组丰度与标准物捕获效率进行比较，确定基因组位点处核心组蛋白表位的密度；从而测定和定量基因组位点表观遗传或突变的状态。

3.一种监测受试者生物样品染色质中特异性基因组位点表观遗传或突变状态随时间变化的方法，所述方法包括：

a)从受试者分离生物样品；

g)将相对基因组丰度与标准物捕获效率进行比较，确定基因组位点处核心组蛋白表位的密度；

h)重复步骤a)至g)至少一次；及

4.一种监测患有与表观遗传修饰或突变有关的疾病或病症的受试者表观遗传治疗或突变治疗有效性的方法，所述方法包括监测受试者生物样品染色质中特异性基因组位点表观遗传或突变状态随时间变化的情况，所述方法包括：

a)从受试者分离生物样品；

从而监测受试者表观遗传治疗或突变治疗的有效性。

5.一种根据受试者生物样品染色质中特异性基因组位点表观遗传或突变状态的情况，选择患有与表观遗传修饰或突变有关的疾病或病症的受试者合适治疗的方法，所述方法包括：

a)从受试者分离生物样品；

6.一种根据受试者生物样品染色质中特异性基因组位点表观遗传或突变状态的情况，确定患有与表观遗传修饰或突变有关的疾病或病症的受试者预后的方法，所述方法包括：

a)从受试者分离生物样品；

e)将掺杂文库输入数量中与被捕获的含表位天然核小体结合的给定核苷酸序列的数量和与天然核小体结合的给定核苷酸序列的数量进行比较，确定表位的相对基因组丰度；

7.一种根据受试者生物样品染色质中特异性基因组位点表观遗传或突变状态的情况，鉴定与表观遗传修饰或突变有关的疾病或病症的生物标记的方法，所述方法包括：

a)从受试者分离生物样品；

从而鉴定表观遗传修饰或突变相关疾病或病症的生物标记。

8.一种筛选修饰受试者生物样品染色质中特异性基因组位点表观遗传或突变状态的试剂的方法，所述方法包括在存在和不存在所述试剂的条件下测定基因组位点的表观遗传或突变状态；

其中所述测定基因组位点的表观遗传或突变状态包括：

a)从受试者分离生物样品；

其中在存在和不存在所述试剂的条件下基因组位点表观遗传或突变状态发生变化，则表明所述试剂修饰基因组位点的表观遗传或突变状态。

9.根据权利要求1-8任一项所述的方法，其中所述生物样品包括细胞，所述染色质是从所述细胞分离得到的。

10.根据权利要求9所述的方法，其中所述细胞是来自受与组蛋白翻译后修饰或DNA修饰变化有关的疾病或病症影响的组织或器官的细胞。

11.根据权利要求9所述的方法，其中所述细胞是来自受与组蛋白突变有关的疾病或病症影响的组织或器官的细胞。

12.根据权利要求1-11任一项所述的方法，其中所述生物样品是活检样品。

13.根据权利要求9所述的方法，其中所述细胞不是来自受与组蛋白翻译后修饰或DNA修饰变化有关的疾病或病症影响的组织或器官的细胞。

14.根据权利要求9所述的方法，其中所述细胞不是来自受与突变有关的疾病或病症影响的组织或器官的细胞。

15.根据权利要求1-14任一项所述的方法，其中所述生物样品包括外周血单核细胞。

16.根据权利要求1-8任一项所述的方法，其中所述生物样品包括循环核小体。

17.根据权利要求16所述的方法，其中所述循环核小体来自血细胞。

18.根据权利要求16所述的方法，其中所述细胞是来自受与组蛋白翻译后修饰或DNA修饰变化有关的疾病或病症影响的组织或器官的细胞。

19.根据权利要求16所述的方法，其中所述循环核小体来自受与突变有关的疾病或病症影响的组织或器官的细胞。

20.根据权利要求16所述的方法，其中所述生物样品是血浆、尿液、唾液、粪便、淋巴液或脑脊髓液。

21.根据权利要求1-20任一项所述的方法，其中所述受试者是人类。

22.根据权利要求1-21任一项所述的方法，其中所述确定标准物捕获效率包括将条形码标识符序列的捕获数量与重组核小体的输入数量之比进行比较。

23.根据权利要求1-22任一项所述的方法，其中所述确定相对基因组丰度包括将天然核小体核苷酸序列的捕获数量与天然核小体核苷酸序列的输入数量之比进行比较。

24.根据权利要求1-23任一项所述的方法，其中所述亲和试剂是靶向表位的抗体。

25.根据权利要求1-24任一项所述的方法，其中将多个标准物添加到文库中，每个标准物包括重组的核小体，其包括(i)具有表位的标准组蛋白或组蛋白片段，和(ii)包括核小体定位序列和条形码标识符序列的标准多核苷酸，其中条形码标识符序列编码指示添加到文库中的标准物浓度的浓度参数，并且其中将相当浓度的标准物添加到文库中。

26.根据权利要求1-24任一项所述的方法，其中将多个标准物添加到文库中，每个标准物包括重组的核小体，其包括(i)具有表位的标准组蛋白或组蛋白片段，和(ii)包括核小体定位序列和条形码标识符序列的标准多核苷酸，其中条形码标识符序列编码指示添加到文库中的标准物浓度的浓度参数，并且其中将至少两个不同浓度的标准物添加到文库中。

27.根据权利要求26所述的方法，其中将至少六个不同浓度的标准物添加到文库中。

28.根据权利要求25-27任一项所述的方法，其中所述多个标准物可以进一步包括包含重组核小体的标准物，所述核小体包含(i)一个或多个脱靶表位和(ii)编码脱靶表位一致性的标准分子条形码和指示脱靶表位的浓度参数。

29.根据权利要求25-27任一项所述的方法，进一步包括根据脱靶表位的一种或多种捕获效率来确定亲和试剂的脱靶捕获特异性，并根据脱靶捕获特异性来校准基因组位点核心组蛋白的表位密度。

30.根据权利要求1-29任一项所述的方法，其中所述表位是翻译后修饰或蛋白质亚型。

31.根据权利要求1-30任一项所述的方法，其中所述条形码序列是细胞基因组中不存在的序列。

32.根据权利要求1-31任一项所述的方法，其中至少一种包括指示基因组位点的核苷酸序列的多核苷酸和标准多核苷酸的丰度采用选自PCR、RT-PCR、ddPCR、下一代测序、杂交、放射自显影、荧光标记、光密度和插入式荧光探针方法测定。

33.根据权利要求1-32任一项所述的方法，其中所述核心组蛋白的表位包含至少一种翻译后氨基酸修饰，所述修饰选自丝氨酸和丙氨酸的N-乙酰化；丝氨酸、苏氨酸和酪氨酸的磷酸化；赖氨酸的N-巴豆酰化、N-酰化；赖氨酸的N6-甲基化、N6，N6-二甲基化、N6，N6，N6-三甲基化；精氨酸的ω-N-甲基化、对称-二甲基化、不对称-二甲基化；精氨酸的瓜氨酸化；赖氨酸的泛素化；赖氨酸的类泛素化；丝氨酸和苏氨酸的O-甲基化；精氨酸、天冬氨酸和谷氨酸的ADP-核糖基化。

34.根据权利要求1-32任一项所述的方法，其中所述核心组蛋白的表位包括至少一种选自H3K4M、H3K9M、H3K27M和H3K36M的致癌突变。

35.根据权利要求1-34任一项所述的方法，其中所述标准多核苷酸是双链多核苷酸。

36.根据权利要求35所述的方法，其中所述双链多核苷酸包括选自SEQ ID NOS:1-115的核苷酸序列。

37.根据权利要求1-36任一项所述的方法，其中所述条形码标识符序列包括选自核苷酸条形码序列分子、锁核酸序列和DNA序列的分子。

38.根据权利要求1-37任一项所述的方法，其中所述与表观遗传修饰或突变相关的疾病或病症可以是癌症、中枢神经系统(CNS)疾病、自身免疫性疾病、炎症性疾病或感染性疾病。

39.根据权利要求1-38任一项所述的方法，其中所述天然核小体文库包括核小体，所述每个核小体包括核心组蛋白及多核苷酸，所述多核苷酸包括指示其原基因组位点的核苷酸序列，所述方法包括：

确定掺杂文库中基因组位点核心组蛋白的数量；和

确定掺杂文库中标准物的数量。

40.根据权利要求39所述的方法，其中确定掺杂文库中基因组位点处核心组蛋白的数量包括：

确定回收的包括第二表位的核小体中多核苷酸的数量。

41.根据权利要求39所述的方法，其中确定掺杂文库中标准物的数量包括：

确定回收的包括第二表位的重组核小体中标准物分子的数量。

42.根据权利要求41所述的方法，其中所述亲和试剂是靶向表位的抗体，其中所述第二亲和试剂是靶向第二表位的抗体。

43.一种检测和定量受试者生物样品染色质内特异性基因组位点核心元件表位处表观遗传修饰或突变的方法，所述方法包括：

a)从受试者分离生物样品；

c)透化处理细胞、细胞核、细胞器或组织；

b.DNA分子，包括：

i.核小体定位序列，

ii.DNA条形码；

iii.核酸酶或转座酶识别序列；及

f)加入与核酸酶或转座酶结合的亲和试剂-结合试剂；

h)分离切割的DNA；及

i)鉴定切割的DNA；及

44.一种测定和定量患有疾病或病症的受试者生物样品染色质中特异性基因组位点核心元件表位的表观遗传或突变状态的方法，所述方法包括：

a)从受试者分离生物样品；

c)透化处理细胞、细胞核、细胞器或组织；

b.DNA分子，包括：

i.核小体定位序列，

ii.DNA条形码；

iii.核酸酶或转座酶识别序列；及

f)加入与核酸酶或转座酶结合的亲和试剂-结合试剂；

h)分离切割的DNA；及

i)鉴定切割的DNA；及

从而测定和定量基因组位点表观遗传或突变的状态。

45.一种监测受试者生物样品染色质中特异性基因组位点核心元件表位的表观遗传或突变状态随时间变化的方法，所述方法包括：

a)从受试者分离生物样品；

c)透化处理细胞、细胞核、细胞器或组织；

b.DNA分子，包括：

i.核小体定位序列，

ii.DNA条形码；

iii.核酸酶或转座酶识别序列；及

f)加入与核酸酶或转座酶结合的亲和试剂-结合试剂；

h)分离切割的DNA；及

i)鉴定切割的DNA；

k)重复步骤a)至j)至少一次；

46.一种监测患有与表观遗传修饰或突变有关的疾病或病症的受试者表观遗传治疗或突变治疗有效性的方法，所述方法包括监测受试者生物样品染色质中特异性基因组位点核心元件表位的表观遗传或突变状态随时间变化的情况，所述方法包括：

a)从受试者分离生物样品；

c)透化处理细胞、细胞核、细胞器或组织；

b.DNA分子，包括：

i.核小体定位序列，

ii.DNA条形码；

iii.核酸酶或转座酶识别序列；及

f)加入与核酸酶或转座酶结合的亲和试剂-结合试剂；

h)分离切割的DNA；及

i)鉴定切割的DNA；

k)重复步骤a)至j)至少一次；

从而监测受试者表观遗传治疗或突变治疗的有效性。

47.一种根据受试者生物样品染色质中特异性基因组位点核心元件表位的表观遗传或突变状态的情况，选择患有与表观遗传修饰或突变有关的疾病或病症的受试者合适治疗的方法，所述方法包括：

a)从受试者分离生物样品；

c)透化处理细胞、细胞核、细胞器或组织；

b.DNA分子，包括：

i.核小体定位序列，

ii.DNA条形码；

iii.核酸酶或转座酶识别序列；及

f)加入与核酸酶或转座酶结合的亲和试剂-结合试剂；

h)分离切割的DNA；及

i)鉴定切割的DNA；

48.一种根据受试者生物样品染色质中特异性基因组位点核心元件表位的表观遗传或突变状态的情况，选择患有与表观遗传修饰或突变有关的疾病或病症的受试者预后的方法，所述方法包括：

a)从受试者分离生物样品；

c)透化处理细胞、细胞核、细胞器或组织；

b.DNA分子，包括：

i.核小体定位序列，

ii.DNA条形码；

iii.核酸酶或转座酶识别序列；及

f)加入与核酸酶或转座酶结合的亲和试剂-结合试剂；

h)分离切割的DNA；及

i)鉴定切割的DNA；

49.一种根据受试者生物样品染色质中特异性基因组位点核心元件表位的表观遗传或突变状态的情况，鉴定与表观遗传修饰或突变有关的疾病或病症的生物标记的方法，所述方法包括：

a)从受试者分离生物样品；

c)透化处理细胞、细胞核、细胞器或组织；

b.DNA分子，包括：

i.核小体定位序列，

ii.DNA条形码；

iii.核酸酶或转座酶识别序列；及

f)加入与核酸酶或转座酶结合的亲和试剂-结合试剂；

h)分离切割的DNA；及

i)鉴定切割的DNA；

从而鉴定表观遗传修饰或突变相关疾病或病症的生物标记。

50.一种筛选修饰受试者生物样品染色质中特异性基因组位点核心元件表位的表观遗传或突变状态的试剂的方法，所述方法包括在存在和不存在所述试剂的条件下测定基因组位点的表观遗传或突变状态；

其中所述测定基因组位点的表观遗传或突变状态包括：

a)从受试者分离生物样品；

c)透化处理细胞、细胞核、细胞器或组织；

b.DNA分子，包括：

i.核小体定位序列，

ii.DNA条形码；

iii.核酸酶或转座酶识别序列；及

f)加入与核酸酶或转座酶结合的亲和试剂-结合试剂；

h)分离切割的DNA；及

i)鉴定切割的DNA；及

51.一种试剂盒，包括一组核小体标准物，所述组包括两个或多个核小体，所述核小体包括表观遗传修饰或疾病-相关组蛋白突变。

52.根据权利要求51所述的试剂盒，其中所述组包括核小体，所述核小体包括两个或多个不同的甲基化赖氨酸修饰。

53.根据权利要求51所述的试剂盒，其中所述组包括核小体，所述核小体包括两个或多个不同的酰化赖氨酸修饰。

54.根据权利要求51所述的试剂盒，其中所述组包括核小体，所述核小体包括两个或多个不同的甲基化精氨酸修饰。

55.根据权利要求51所述的试剂盒，其中所述组包括核小体，所述核小体包括两个或多个不同的选自H3K4M、H3K9M、H3K27M、H3K34R、H3K34V、H3K34W、H3K36M及它们的任何组合的疾病-相关组蛋白突变。