CN109689890B - 用于子宫腺肌症检测的生物标志物组合及其应用 - Google Patents

用于子宫腺肌症检测的生物标志物组合及其应用 Download PDF

Info

Publication number
CN109689890B
CN109689890B CN201780047953.5A CN201780047953A CN109689890B CN 109689890 B CN109689890 B CN 109689890B CN 201780047953 A CN201780047953 A CN 201780047953A CN 109689890 B CN109689890 B CN 109689890B
Authority
CN
China
Prior art keywords
adenomyosis
seq
otu
marker
biomarker
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201780047953.5A
Other languages
English (en)
Other versions
CN109689890A (zh
Inventor
贾慧珏
钟焕姿
宋晓蕾
王子榕
陈晨
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
BGI Shenzhen Co Ltd
Original Assignee
BGI Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by BGI Shenzhen Co Ltd filed Critical BGI Shenzhen Co Ltd
Publication of CN109689890A publication Critical patent/CN109689890A/zh
Application granted granted Critical
Publication of CN109689890B publication Critical patent/CN109689890B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/136Screening for pharmacological compounds

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Zoology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Analytical Chemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Immunology (AREA)
  • Biomedical Technology (AREA)
  • Pathology (AREA)
  • Plant Pathology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

提供用于子宫腺肌症检测或患病风险评估的生物标志物组合及应用。包括四十四条核酸中的至少一条,四十四条核酸分别为Seq ID No.1至Seq ID No.44所示序列,或者分别为与Seq ID No.1至Seq ID No.44所示序列具有97%以上相似性的序列。

Description

用于子宫腺肌症检测的生物标志物组合及其应用
技术领域
本申请涉及生物标志物领域,特别是涉及一种用于子宫腺肌症检测或患病风险评估的生物标志物组合及其应用。
背景技术
子宫腺肌症是子宫的内膜和腺体侵入了子宫肌层内引起的症状。正常情况下,子宫内膜应在子宫肌层下面,它们之间有界限分隔,当子宫内膜和表浅的肌肉层受到损伤,如分娩、多次人工流产和刮宫等,子宫内膜就会乘虚而入,它们在子宫肌层里生长发育,并刺激周围的肌细胞增生,形成子宫腺肌症。子宫肌层内的子宫内膜可以和正常的子宫内膜一样,随月经周期变化而出现周期性充血、水肿,甚至出血,引起强烈的子宫收缩而出现剧烈下腹痛,同时患者子宫均匀性增大、质硬、月经过多、经期过长,严重的会导致患者出现贫血。
目前子宫腺肌症的治疗方法主要有以下几种:1、手术切除子宫;2、保守手术治疗,3、中医调理治疗。三种治疗方法各有利弊。以前,子宫腺肌症多发生于40岁以上的经产妇,但近年来逐渐成年轻化趋势,这可能与剖宫产、人工流产等手术的增多有关。
临床上对子宫肌腺症的诊断,主要依赖症状、内诊和超音波检查。超音波扫描可以看见子宫整个肿大起来,子宫壁,尤其常见的是后壁,会超过二点五公分以上,如果超过二点五公分以上的厚度,几乎可以肯定为异常。假如有某一处聚集成一团,可能是肌瘤或腺瘤,也可用超音波辨别,因为腺瘤没有一层荚膜包在外围,而肌瘤则有,并且腺瘤的超音波回音比肌瘤强。另外,使用肿瘤指数CA125也可协助诊断。但是,以上方法都不能做到子宫腺肌症的早期检测或患病风险评估。
因此,寻找敏感、特异的子宫腺肌症的生物标志物是目前急需解决的问题。
发明内容
本申请的目的是提供一种用于子宫腺肌症检测或患病风险评估的生物标志物组合,及其在子宫腺肌症检测试剂盒、检测工具或药物筛选等方面的应用。
为了实现上述目的,本申请采用了以下技术方案:
本申请的一方面公开了一种用于子宫腺肌症检测或患病风险评估的生物标志物组合,该生物标志物组合包括四十四条核酸中的至少一条,四十四条核酸分别为Seq IDNo.1至Seq ID No.44所示序列,或者分别为与Seq ID No.1至Seq ID No.44所示序列具有97%以上相似性的序列。
需要说明的是,本申请的四十四条核酸是经过研究得出的,和子宫腺肌症有关联的核酸序列,其中每条核酸序列都与子宫腺肌症有关联性,因此,在不考虑判断准确性的情况下或者对此要求较低的情况下,可以单独或者组合用于子宫腺肌症检测或者患病风险评估。但是,本申请的一种优选方案中,不仅四十四条核酸一起使用,而且,还将四十四条核酸按照特定的规律进行分类,分成多个标志物组,各个标志物组一起用于子宫腺肌症检测或者患病风险评估,这将在后面的优选技术方案中详细描述。
还需要说明的是,本申请的四十四条核酸是根据97%以上相似性进行聚类分析,然后从每个分类单元(缩写OTU)中选取最具代表性的序列作为种子序列,其中与子宫腺肌症具有关联性的四十四个种子序列,即组成本申请的生物标志物组合;因此,本申请的生物标志物组合中,四十四条核酸不仅限于Seq ID No.1至Seq ID No.44所示序列,还可以是与Seq ID No.1至Seq ID No.44所示序列具有97%以上相似性的序列。
需要补充说明的是,本申请的用于子宫腺肌症检测或患病风险评估的生物标志物组合,并不是直接根据检测生物标志物组合的有或者无进行子宫腺肌症检测或患病风险评估的,而是,在检测到生物标志物组合后,通过随机森林模型进行判断,根据随机森林模型输出的概率判断待测对象是否患有子宫腺肌症或评估待测对象患子宫腺肌症的风险,这将在后面的技术方案中详细说明。
优选的,本申请的另一面公开了一种用于子宫腺肌症检测或患病风险评估的生物标志物组合,该生物标志物组合包括第一标志物组、第二标志物组和第三标志物组中的至少一组;第一标志物组由十八条核酸组成,十八条核酸分别为Seq ID No.1至Seq ID No.18所示序列,或者分别为与Seq ID No.1至Seq ID No.18所示序列具有97%以上相似性的序列;第二标志物组由二十二条核酸组成,二十二条核酸分别为Seq ID No.1、Seq ID No.4、Seq ID No.5、Seq ID No.7、Seq ID No.10、Seq ID No.11、Seq ID No.13、Seq ID No.15、Seq ID No.18至Seq ID No.31所示序列,或者分别为与Seq ID No.1、Seq ID No.4、Seq IDNo.5、Seq ID No.7、Seq ID No.10、Seq ID No.11、Seq ID No.13、Seq ID No.15、Seq IDNo.18至Seq ID No.31所示序列具有97%以上相似性的序列;第三标志物组由十八条核酸组成,这十八条核酸分别为Seq ID No.1、Seq ID No.2、Seq ID No.13、Seq ID No.19、SeqID No.28、Seq ID No.32至Seq ID No.44所示序列,或者分别为与Seq ID No.1、Seq IDNo.2、Seq ID No.13、Seq ID No.19、Seq ID No.28、Seq ID No.32至Seq ID No.44所示序列具有97%以上相似性的序列。
需要说明的是,本申请的优选方案中,将四十四条核酸可重复选择的分为三个标志物组,即第一标志物组、第二标志物组和第三标志物组;通过三个标志物组的综合判断,可以大大提高本申请的生物标志物组合检测子宫腺肌症或者评估患病风险的准确性。
优选的,第一标志物组为CL标志物组,用于对来自阴道下1/3的样品进行子宫腺肌症检测或患病风险评估。
优选的,第二标志物组为CU标志物组,用于对来自阴道后穹窿的样品进行子宫腺肌症检测或患病风险评估。
优选的,第三标志物组为CV标志物组,用于对来自宫颈管的样品进行子宫腺肌症检测或患病风险评估。
需要说明的是,本申请的生物标志物组合中的四十四条核酸实际上代表的是阴道下1/3、阴道后穹窿和宫颈管三个部位的28种微生物;本申请通过对阴道下1/3、阴道后穹窿和宫颈管三个部位的28种微生物的四十四条核酸进行检测,并对其相对丰度与子宫腺肌症的关系进行统计分析,建立随机森林模型,以此判断待测对象是否患有子宫腺肌症或是否具有患子宫腺肌症的风险。因此,三个标志物组,实际上就是分别对应三个采样部位;来自于三个部位的样品,分别对应各自的标志物组,独立进行分析判断。只是,根据三者的结果进行综合判断,能够提高本申请的生物标志物组合检测子宫腺肌症或者评估患病风险的准确性。
还需要说明的是,在阴道下1/3、阴道后穹窿和宫颈管这三个部位中,其微生物数量远不止28个种,28种微生物的核酸也远不止本申请所记载的44个;但是,本申请根据随机森林模型从中筛选出28种微生物的四十四条核酸,以作为子宫腺肌症检测的生物标志物,为子宫腺肌症的检测和评估提供了一条新的途径。
需要补充说明的是,三个标志物组中,CL标志物组即阴道下1/3样品的标志物组,阴道下1/3缩写为CL;CU标志物组即阴道后穹窿样品的标志物组,阴道后穹窿缩写为CU;CV标志物组即宫颈管样品的标志物组,宫颈管缩写为CV。
本申请的另一面公开了一种用于子宫腺肌症检测或患病风险评估的试剂盒,该剂盒中包含用于检测本申请的生物标志物组合的引物对,引物对的正向引物为SEQ ID No.45所示序列,反向引物为SEQ ID No.46所示序列。
需要说明的是,本申请的生物标志物组合,可以作为一个标准参考存在于试剂盒中,而引物对则是直接用于PCR扩增待测样品中的生物标志物组合的。
本申请的另一面公开了本申请的生物标志物组合在子宫腺肌症药物筛选或者在制备子宫腺肌症检测或患病风险评估的试剂盒或检测工具中的应用。
可以理解,本申请的生物标志物组合本身就是针对子宫腺肌症而研究的,当然可以用于子宫腺肌症的检测或风险评估;而本申请的生物标志物组合也可以整合到一些专门用于子宫腺肌症检测的试剂盒或工具中,以方便子宫腺肌症的检测和评估,只要采用了本申请的生物标志物组合,都在本申请的保护范围内。与此同时,由于本申请的生物标志物组合可以检测子宫腺肌症或者对子宫腺肌症进行患病风险评估;当然,可以对比检测用药前和用药后的子宫腺肌症患病情况或者患病风险变化,从而判断所用药物是否有效,以达到药物筛选的目的。
本申请的再一面公开了一种子宫腺肌症的检测方法,包括以下步骤,
(1)对待测对象进行样品采集,检测所采集的样品中本申请的生物标志物组合,并分析生物标志物组合中各核酸的水平;
(2)将步骤(1)测得的各核酸的水平与参考数据集或参考值进行比较,获得检测结果;
优选的,各核酸的水平为各核酸的相对丰度;参考数据集或参考值为来源于子宫腺肌症患者和非子宫腺肌症对照的生物标志物组合中各核酸的水平。
更优选的,步骤(2)中的参考数据集或参考值为表5、表6或表7中的至少一组;将各核酸的水平与参考数据集或参考值进行比较获得检测结果,具体包括,利用多元统计模型计算得出患病概率,优选地,多元统计模型为随机森林模型。
更优选的,步骤(1)中对待测对象进行样品采集,包括采集待测对象阴道下1/3样品、阴道后穹窿样品和宫颈管样品。
需要说明的是,本申请的生物标志物组合是经过研究得出的,和子宫腺肌症有关联的核酸,因此,通过分析待测对象不同部位的采集样品中,相应生物标志物组合的水平,即相对丰度,可以检测待测对象是否患病或判断其患病风险。
本申请的再一面公开了一种通过检测生物标志物判断子宫腺肌症的方法在制备子宫腺肌症检测或患病风险评估试剂盒或工具中的应用;其中,生物标志物为本申请的生物标志物组合;
通过检测生物标志物判断子宫腺肌症的方法包括以下步骤,
(1)对待测对象进行样品采集,检测所采集的样品中本申请的生物标志物组合,并分析生物标志物组合中各核酸的水平;
(2)将步骤(1)测得的各核酸的水平与参考数据集或参考值进行比较,获得检测结果;
优选的,各核酸的水平为各核酸的相对丰度;参考数据集或参考值为来源于子宫腺肌症患者和非子宫腺肌症对照的生物标志物组合中各核酸的水平。
更优选的,步骤(2)中的参考数据集或参考值为表5、表6或表7中的至少一组;将各核酸的水平与参考数据集或参考值进行比较获得检测结果,具体包括,利用多元统计模型计算得出患病概率,优选地,多元统计模型为随机森林模型。
本申请的再一面公开了一种筛选治疗子宫腺肌症的候选药物的方法,包括以下步骤,
1)分别测定用药前和用药后的样品中本申请的生物标志物组合,并分析生物标志物组合中各核酸的水平;
2)根据比较用药前和用药后的样品中各核酸的水平,判断候选药物;
步骤2)中,比较用药前和用药后的样品中各核酸的水平,具体包括,利用多元统计模型计算得出患病概率,优选地,多元统计模型为随机森林模型。
本申请的再一面公开了一种女性生殖道内微生物群的检测方法,包括以下步骤,
(1)采集待测对象生殖道内微生物样品,检测所采集的样品中本申请的生物标志物组合,并分析生物标志物组合中各核酸的水平;
(2)将步骤(1)测得的各核酸的水平与参考数据集或参考值进行比较,获得检测结果;
优选的,各核酸的水平为各核酸的相对丰度;参考数据集或参考值为来源于子宫腺肌症患者和非子宫腺肌症对照的生物标志物组合中各核酸的水平。
优选的,步骤(2)中的参考数据集或参考值为表5、表6或表7中的至少一组;将各核酸的水平与参考数据集或参考值进行比较获得检测结果,具体包括,利用多元统计模型计算得出患病概率,更优选地,多元统计模型为随机森林模型。
优选的,步骤(1)中采集待测对象生殖道内微生物样品,具体包括采集待测对象阴道下1/3样品、阴道后穹窿样品和宫颈管样品。其中,生殖道内微生物样品的采集可以采用常规的尼龙绒屑拭子,在此不做具体限定。
需要说明的是,本申请的生物标志物组合,实际上就是根据女性生殖道内微生物群DNA与子宫腺肌症之间的关系而得出的,即本申请的生物标志物实际上就是女性生殖道内能够体现子宫腺肌症状态的微生物OTU;因此,本申请提出了一种女性生殖道内微生物群检测方法,通过微生物群的检测为子宫腺肌症或其患病风险提供判断和评估依据。
本申请的再一面公开了一种制备子宫腺肌症生物标志物组合的方法,包括以下步骤,
(1)分别对子宫腺肌症病患和非病患进行生殖道内微生物样品采集,对所有采集的样品分别进行16S测序;
(2)将16S测序结果进行聚类分析,获得OTU单元以及每个OTU的种子序列,并计算每个OTU单元的相对丰度;
(3)利用随机森林模型对每个OTU单元的相对丰度与子宫腺肌症状态进行拟合,并进行5次十折交叉验证,得到最优的OTU组合,最优OTU组合中各OTU的种子序列,即组成子宫腺肌症的生物标志物组合。
优选的,步骤(1)中,生殖道内微生物样品采集,具体包括采集待测对象阴道下1/3样品、阴道后穹窿样品和宫颈管样品。
需要说明的是,本申请子宫腺肌症生物标志物组合的制备方法,其关键在于利用随机森林模型对生殖道内微生物群DNA与子宫腺肌症的关联进行拟合、验证,最终得到能够对子宫腺肌症患病或风险进行评估的生物标志物组合。可以理解,本申请的制备方法或其基本思路,不只限于制备子宫腺肌症的生物标志物组合;还可以用于制备类似的与生殖道内微生物群DNA存在关联的病症的生物标志物组合,例如子宫内膜异位症的生物标志物组合。
由于采用以上技术方案,本申请的有益效果在于:
本申请的用于子宫腺肌症检测的生物标志物组合,为子宫腺肌症的检测或风险评估提供了一条新的途径,能够用于子宫腺肌症的早期诊断,避免了依赖症状、内诊或超音波检查等常规检测对子宫腺肌症诊断或治疗的延误。本申请的其他主要优点包括:
(a)本申请的生物标志物用于子宫腺肌症的检测或患病风险评估,具有高灵敏性、高特异性的优点,具有重要的应用价值。
(b)生殖道样品作为生物标志物检测样本具有取材方便、操作步骤简单和可连续体外检测等优点。
(c)本申请的生物标志物用于子宫腺肌症的检测或患病风险评估具有重复性好的特点。
附图说明
图1是本申请实施例中基于阴道下1/3处CL的标志物组鉴别子宫腺肌症的结果图,图中,a为随着OTU数量的增加,对随机森林鉴别子宫腺肌症进行5次10折交叉验证的错误率分布情况,b为经过交叉验证过的组合的接收者操作曲线(缩写ROC曲线),曲线下面积(缩写AUC)为0.8668,阴影面积代表95%置信区间,对角线代表AUC为0.5的曲线;
图2是本申请实施例中基于阴道后穹窿CU的标志物组鉴别子宫腺肌症的结果图,图中,a为随着OTU数量的增加,对随机森林鉴别子宫腺肌症进行5次10折交叉验证的错误率分布情况,b为经过交叉验证过的组合的ROC曲线,曲线下面积为0.8404,阴影面积代表95%置信区间,对角线代表AUC为0.5的曲线;
图3是本申请实施例中基于宫颈管CV标志物组鉴别子宫腺肌症的结果图,图中,a为随着OTU数量的增加,对随机森林鉴别子宫腺肌症进行5次10折交叉验证的错误率分布情况,b为经过交叉验证过的组合的ROC曲线,曲线下面积为0.8369,阴影面积代表95%置信区间,对角线代表AUC为0.5的曲线;
图4是本申请实施例中阴道下1/3处CL标志物组在第二群体中对子宫腺肌症进行鉴别的ROC曲线;
图5是本申请实施例中阴道后穹窿CU标志物组在第二群体中对子宫腺肌症进行鉴别的ROC曲线;
图6是本申请实施例中宫颈管CV标志物组在第二群体中对子宫腺肌症进行鉴别的ROC曲线;
图中,变量数量是指OTU数量,其中,灵敏性=真阳性/(真阳性+假阴性);特异度=真阴性/(真阴性+假阳性)。
具体实施方式
本申请的生物标志物,是根据采集对象三个部位的微生物群DNA与子宫腺肌症之间的关系而得出的,本申请的生物标志物实际上就是这三个部位的能够体现子宫腺肌症状态的微生物OTU。具体的,本申请的一种制备方法中,这种对应关系或者生物标志物的获得,是以OTU种子序列的相对丰度为一个对象,子宫腺肌症状态(患病或非患病)为第二个对象,通过随机森林模型对两者进行拟合,最终通过5次十折交叉验证而得出的。本申请通过严格的计算和试验研究,最终获得了三个部位的28种微生物的四十四条核酸作为本申请的生物标志物。
本申请的一种实现方式中,三个部位的标志物组可以独立的对子宫腺肌症患病或风险进行评估,但是,结合三个部位的概率,判断待测对象是否患有子宫腺肌症或是否具有患子宫腺肌症的风险,这样准确性会更高。
本申请所用术语是本领域普通技术人员通常理解的含义。为了更好地理解本申请,对一些定义和相关术语的解释如下:
本申请的“子宫腺肌症”,是子宫内膜腺体和间质侵入子宫肌层形成弥漫或局限性的病变,与子宫内膜异位症一样,属于妇科常见病和疑难病。
本申请的生物标志物质的水平通过相对丰度指示。
在本申请的一个实施方式中,参考值是指健康对照的参考值或正常值。本领域的技术人员清楚,在样品数量足够多情况下,每个生物标志物的正常值,即绝对值,的范围可以通过检验和计算方法得到。
本申请的“生物标志物”,也称为“生物学标志物”,是指个体的生物状态的可测量指标。这样的生物标记物可以是在个体中的任何物质,只要它们与被检个体的特定生物状态,例如疾病,有关系即可。这样的生物标记物可以是,例如,核酸标志物(例如DNA)、蛋白质标志物、细胞因子标记物、趋化因子标记物、碳水化合物标志物、抗原标志物、抗体标志物、物种标志物(种/属的标记)和功能标志物(KO/OG标记)等。本申请的生物标志物具体的为DNA核酸标志物。
本申请的“OTU”是指操作分类单元(operational taxonomic units缩写OTU),是在系统发生学研究或群体遗传学研究中,为了便于进行分析,人为给某一个分类单元,如品系、种、属、分组等,设置的同一标志。本申请中按照97%的相似性阈值将序列划分为一个OTU,由此使得三个部位的样品分别可以获得多个OTU,每一个OTU被视为一个微生物物种。样品中的微生物多样性和不同微生物的丰度都是基于对OTU的分析。
本申请中提到的“个体”指动物,特别是哺乳动物,如灵长类动物,本申请的实施例中所指为人。
下面通过具体实施例和附图对本申请作进一步详细说明。以下实施例仅对本申请进行进一步说明,不应理解为对本申请的限制。
实施例
1.材料与方法
1.1样品收集
本例的样品采集由深圳北大医院妇产科医生协助进行。排除炎症病例,研究对象均为非经期、非妊娠期、非哺乳期女性,无内分泌和自身免疫性疾病,肝肾功能正常。取样前一段时间没有使用激素及抗生素,没有进行阴道用药、阴道灌洗及宫颈治疗,取样前48小时内没有进行性生活。根据以上标准,本例筛选出95例育龄女性,作为第一群体。所有符合以上标准的个体都进行详细的表型信息登记,以了解其病史、家族史、用药史及生活习惯等,并且均签署了知情同意书。
下生殖道采样是在个体入院后,不经过消毒处理,排空小便后,在妇科检查床采集阴道下1/3(缩写CL)、阴道后穹窿(缩写CU)、宫颈管(缩写CV)三个部位的分泌物样品。具体的,95个采集对象的样品编号及采样信息为,编号C033、C038、C043、C051、C057、C062、C063、C065、T023、T069、T078、T089、T092、T095的十四个采集对象为子宫腺肌症患者,十四个采集对象都采集了CL、CU和CV三个部位的样品;编号C023、C026、C028、C035、C039、C040、C041、C042、C045、C047、C048、C050、C053、C055、C056、C058、C059、C060、C064、C066、C067、C068、T022、T024、T025、T026、T027、T028、T029、T030、T031、T032、T033、T035、T036、T038、T039、T040、T041、T042、T043、T044、T045、T046、T047、T048、T049、T051、T052、T053、T054、T055、T056、T057、T058、T059、T060、T061、T062、T063、T064、T065、T066、T067、T068、T070、T071、T072、T073、T074、T075、T076、T084、T085、T086、T087、T088、T090、T091、T093、T094的八十一个采集对象为非子宫腺肌症患者,八十一个采集对象中,除了T048以外其它都是采集了CL、CU和CV三个部位的样品,T048只采集了CU和CV两个部位的样品,没有采集CL样品。
样品采集是利用尼龙绒屑拭子进行样品收集,尼龙绒屑拭子购自晨阳全球集团CY-93050和CY-98000两种型号。取样后将拭子头用液氮进行速冻,并保存于-80℃,用干冰运送至深圳华大基因研究院进行后续的试验。
1.2DNA提取与16S测序
本例利用QIAamp DNA Mini Kit试剂盒(购自QIAGEN)进行DNA提取。具体提取步骤参照生产厂商提供的说明书进行。采用16S rRNA基因V4-V5高变区特异引物进行扩增,两条引物分别为V4-515F和V5-907R,V4-515F为Seq ID No.45所示序列,V5-907R为Seq IDNo.46所示序列。
Seq ID No.45:5’-GTGCCAGCMGCCGCGGTAA-3’
Seq ID No.46:5’-CCGTCAATTCMTTTRAGT-3’
PCR程序如下,94℃变性3min;然后进入25个循环:94℃变性45s,50℃退火60s,72℃延伸90s;循环结束后,72℃延伸10min。得到的PCR产物利用AMPure Beads(Axygen)进行纯化,测序采用芯片泳道测序的方法,将多个样品混合后测序。所以文库构建需要在各样品的引物序列外端连接10bp的barcode序列后,添加接头序列。通过对每个样品添加不同的barcode序列,即样本识别序列,区分不同样本。文库构建完成后,通过Ion torrent PGM测序平台,进行V5-V4反向测序,以上文库构建和测序等由深圳华大基因进行。
1.3 16S测序数据处理
利用Mothur软件(V1.33.3)从PGM系统中提取原始数据并进行预处理,高质量序列的标准包括:1)长度大于200bp;2)与简并PCR错配碱基少于2个;3)平均质量分数大于25。基于16S rRNA基因序列,利用QIIME的uclust方法对OTU进行聚类,相似阈值设置为97%。选取每个OTU的种子序列(Seed sequence),利用Greengene数据库中的参照基因信息gg_13_8_otus进行注释。计算每个样本中每一个OTU的相对丰度,其中某一OTU的相对丰度为某个样本中该OTU的丰度与该样本中所有OTU丰度之和的比值。
1.4不同位点样品间微生物群一致性分析
基于OTU的存在或缺失,本例利用Sorenson指数(
Figure GPA0000262700710000122
-Dice指数)来测量同一个体不同位点样品微生物群的相似性,计算方法如下:
Figure GPA0000262700710000121
其中A和B分别代表样品A和B中OTU的数目,C代表两个样品中共有的OTU数目。QS是相似性指数,取值范围为0~1。本例中分别计算了CL和CU的相似性指数,CL和CV的相似性指数,以及CU和CV的相似性指数。相似性指数约接近1,表示两个采样部位的微生物群的相似性越高。
1.5随机森林分类器
为了建立一个能够鉴别异常状态样品的模型,对于每个采样部位,利用R软件(3.1.2RC)中randomForest工具包对每个样品的OTU的相对丰度与子宫腺肌症状态进行拟合,采用默认参数。其中,每个样品的OTU是至少存在于10%的样品中的OTU,也就是说,剔除在各个部位的所有待测样品中只有在不到10%的样品中才能检出的OTU。之后进行5次10折交叉验证,将5次10折交叉验证的误差曲线进行平均,将平均后曲线的最低误差加上该点的标准误差作为可接受误差的域值。在分类误差小于域值的各组OTU中,其中,OTU数目最少的为最优OTU组合,作为鉴别子宫腺肌症的生物标志物组合。
1.6生物标志物验证
为了验证本例得到的生物标志物,本例另外采用了独立的受试群体,即第二群体进行验证。第二群体中,对于CL和CU,各有4位子宫腺肌症患者和36位非子宫腺肌症个体;对于CV,有4位腺肌症患者和37位非腺肌症个体。
2.实验结果
2.1同一个体内上下生殖道微生物结构特征及变化趋势
为了探索生殖道不同区域微生物群之间的关系,本例计算了同一个体的样品之间的距离。相对于下阴道1/3(CL)样品而言,从阴道后穹窿(CU)、宫颈管(CV)粘液到子宫和腹腔液的加权UniFrac距离依次增加,这也再一次指明随着解剖学结构由下至上,女性生殖道的群落结构呈现连续变化性。
同一个体中的不同部位样品呈现高度相关性,不同部位样品之间的Sorenson指数与它们的解剖学结构相一致。宫颈(CV)粘液与腹腔液样本具有显著的相关性,平均Sorenson指数为0.255,表明在普通人群中可以通过分析易取得的宫颈粘液样本来评价宫腔和腹腔的健康状况。
此外,本例还分别通过阴道、宫腔底部对宫颈粘液取样,发现两种途径取样取得样品的细菌分布显示出高度的相似性,进一步表明可以通过分析易获得的宫颈管样本来评价宫腔微生物的情况。
2.2与疾病相关的微生物
为了得到用来鉴别子宫腺肌症的OTU生物标志物,本例建立随机森林模型,具体步骤为:(1)以OTU相对丰度作为输入特征,设计基于第一群体的随机森林模型;(2)对于随机森林模型,设计10折交叉验证算法,把第一群体分为子宫腺肌症个体与非子宫腺肌症个体两类,并分别得到随机森林模型的ROC曲线,以各ROC曲线下面积AUC值作为评价指标。
本例利用随机森林模型,并结合10折交叉验证,得到了各个部位最优的生物标志物,如表1所示,用于鉴别子宫腺肌症。表2至表4分别为三个部位的标志物组在样品中的富集信息,表5至表7分别为三个部位的标志物组在第一群体样品的相对丰度信息。本例中,三个部位的生物标志物,鉴别子宫腺肌症的结果,如图1至图3所示,图1为阴道下1/3处(CL)的标志物组鉴别子宫腺肌症,图2为阴道后穹窿(CU)的标志物组鉴别子宫腺肌症,图3为宫颈管(CV)的标志物组鉴别子宫腺肌症。
表1生物标志物及其所属的各个部位
Figure GPA0000262700710000131
Figure GPA0000262700710000141
表1中,CL、CU、CV三个部位的标记物可以单独分别做判断,“√”是表示针对该部位进行判断时所需用到的生物标志物,“--”表示不需要用到的。
在进行样品检测时,要计算各部位的“√”的OTU的相对丰度,将相对丰度输入随机森林模型,得到结果,判断是否为子宫腺肌症。
表2 CL中标志物组各OTU丰度信息
Figure GPA0000262700710000151
表3 CU中标志物组各OTU丰度信息
Figure GPA0000262700710000152
Figure GPA0000262700710000161
表4 CV中标志物组各OTU丰度信息
Figure GPA0000262700710000162
表2至表4中,子宫腺肌症组是指第一群体的95个采集对象中患有子宫腺肌症的样品,对照组是指第一群体的95个采集对象中没有患子宫腺肌症的样品。
表5 CL中标志物组各OTU在第一群体中的丰度信息
Figure GPA0000262700710000163
Figure GPA0000262700710000171
Figure GPA0000262700710000181
Figure GPA0000262700710000191
表6 CU中标志物组各OTU在第一群体中的丰度信息
Figure GPA0000262700710000192
Figure GPA0000262700710000201
Figure GPA0000262700710000211
Figure GPA0000262700710000221
Figure GPA0000262700710000231
Figure GPA0000262700710000241
表7 CV中标志物组各OTU在第一群体中的丰度信息
Figure GPA0000262700710000242
Figure GPA0000262700710000251
Figure GPA0000262700710000261
Figure GPA0000262700710000271
图1为阴道下1/3处(CL)的标志物组鉴别子宫腺肌症,图中,a图为随着OTU数量的增加,对随机森林鉴别子宫腺肌症进行5次10折交叉验证的错误率分布情况,该模型用样品中OTU的相对丰度进行训练,总计采用了14位子宫腺肌症个体和80位非子宫腺肌症个体的CL样品,黑色线代表5次试验的平均值,灰色线则分别代表5次试验,黑色竖线代表最佳组合中OTU数目;b图为经过交叉验证过的组合的接收者操作曲线,曲线下面积AUC为0.8668,阴影面积代表95%置信区间,对角线代表AUC为0.5的曲线。
图2为阴道后穹窿(CU)的标志物组鉴别子宫腺肌症,图中,a图为随着OTU数量的增加,对随机森林鉴别子宫腺肌症进行5次10折交叉验证的错误率分布情况,该模型用样品中OTU的相对丰度进行训练,总计采用了14位子宫腺肌症个体和81位非子宫腺肌症个体的CU样品,黑色线代表5次试验的平均值,灰色线分别为5次试验,黑色竖线代表最佳组合中OTU数目;b图为经过交叉验证过的组合的接收者操作曲线,曲线下面积AUC为0.8404,阴影面积代表95%置信区间,对角线代表AUC为0.5的曲线。
图3为宫颈管(CV)的标志物组鉴别子宫腺肌症,图中,a图为随着OTU数量的增加,对随机森林鉴别子宫腺肌症进行5次10折交叉验证的错误率分布情况,该模型用样品中OTU的相对丰度进行训练,总计采用了14位子宫腺肌症个体和81位非子宫腺肌症个体的CV样品,黑色线代表5次试验的平均值,灰色线分别为5次试验,黑色竖线代表最佳组合中OTU数目;b图为经过交叉验证过的组合的接收者操作曲线,曲线下面积AUC为0.8369,阴影面积代表95%置信区间,对角线代表AUC为0.5的曲线。
由图1至图3的结果可以看出,三个不同位点的OTU生物标志物组能够鉴别子宫腺肌症个体和非子宫腺肌症个体;ROC的曲线下面积AUC值分别为0.8668(CL),0.8404(CU)和0.8369(CV)。其中,AUC是曲线下面积,该值越大,即越接近1,表示判断能力越强,即判断越准确。
2.3生物标志物验证
将随机森林得到的OTU生物标志物在第二群体样品中进行验证,结果如表8、表9和表10所示。表8至表10中,样品编号例如C002CL、C002CU、C002CV,分别表示采集自同样一个C002采样对象的CL、CU、CV三个部位的样品。表8至表10为三个标志物组预测个体患有子宫腺肌症的概率,由此得到的ROC曲线依序为图4至图6。表8至表10中,概率>0.5认为通过该部位的标志物组判断个体具有患子宫腺肌症的风险或者患有子宫腺肌症。
表8 CL部位的CL标志物组预测第二群体样品患有子宫腺肌症的概率
样品编号 实际是否子宫腺肌症(N:否;Y是) 概率
C001CL N 0445
C002CL N 0.168
C003CL Y 0.289
C004CL N 0.011
C005CL N 0.358
C007CL N 0.166
C008CL N 0.000
C009CL N 0.095
C011CL N 0.447
C012CL Y 0.550
C014CL N 0.477
C016CL N 0.311
C018CL N 0.213
C019CL Y 0.855
C020CL N 0.132
C021CL N 0.376
T000CL N 0.117
T001CL N 0.109
T003CL N 0.526
T005CL N 0.570
T006CL N 0.079
T007CL N 0.013
T008CL N 0.382
T009CL N 0.055
T010CL N 0.038
T011CL N 0.195
T012CL N 0.147
T013CL N 0.016
T014CL N 0.348
T015CL Y 0.540
T016CL N 0.352
T017CL N 0.394
T018CL N 0.053
T019CL N 0.159
T020CL N 0.766
T021CL N 0.061
T080CL N 0.006
T081CL N 0.532
T082CL N 0.089
T083CL N 0.228
表9 CU部位的CU标志物组预测第二群体样品患有子宫腺肌症的概率
样品编号 实际是否子宫腺肌症(N:否;Y是) 概率
C001CU N 0.495
C002CU N 0.074
C003CU Y 0.316
C004CU N 0.040
C005CU N 0.302
C007CU N 0.000
C008CU N 0.033
C009CU N 0.083
C011CU N 0.427
C012CU Y 0.234
C014CU N 0.244
C016CU N 0.346
C018CU N 0.489
C019CU Y 0.798
C020CU N 0.012
C021CU N 0.069
T000CU N 0.077
T001CU N 0.017
T002CU N 0.097
T003CU N 0.274
T005CU N 0.201
T006CU N 0.163
T007CU N 0.071
T008CU N 0.244
T009CU N 0.061
T010CU N 0.001
T011CU N 0.172
T013CU N 0.090
T014CU N 0.027
T015CU Y 0.240
T016CU N 0.000
T017CU N 0.000
T018CU N 0.076
T019CU N 0.056
T020CU N 0.701
T021CU N 0.020
T080CU N 0.007
T081CU N 0.150
T082CU N 0.136
T083CU N 0.017
表10 CV部位的CV标志物组预测第二群体样品患有子宫腺肌症的概率
Figure GPA0000262700710000291
Figure GPA0000262700710000301
图4的结果显示CL部位基于CL标志物组判断子宫腺肌症概率,其AUC值为0.8750;图5的结果显示CU部位基于CU标志物组判断子宫腺肌症概率,其AUC值为0.840;图6的结果显示CV部位基于CV标志物组判断子宫腺肌症概率,其AUC值为0.9189;可见,这三个标志物组具有较高的鉴别能力,能够用于子宫腺肌症的检测,该结果与表8至表10的结果相符。表8至表10的结果中,三个标志物组预测的概率,其中至少一个大于0.5,则判断个体具有患子宫腺肌症的风险或者患有子宫腺肌症,由此获得的判断结果,与实际情况相符。
以上内容是结合具体的实施方式对本申请所作的进一步详细说明,不能认定本申请的具体实施只局限于这些说明。对于本申请所属技术领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干简单推演或替换。
SEQUENCE LISTING
<110> 深圳华大生命科学研究院
<120> 用于子宫腺肌症检测的生物标志物组合及其应用
<130> 16I23215
<160> 46
<170> PatentIn version 3.5
<210> 1
<211> 213
<212> DNA
<213> Acinetobacter sp.
<400> 1
atgcgtagag atctggagga ataccgatgg cgaaggcagc catctggcct aatactgacg 60
ctgaggtacg aaagcatggg gagcaaacag gattagatac cctggtagtc catgccgtaa 120
acgatgtcta ctagccgttg gggcctttga ggctttagtg gcgcagctaa cgcgataagt 180
agaccgcctg gggagtacgg tcgcaagact aaa 213
<210> 2
<211> 208
<212> DNA
<213> Anaerococcus sp.
<400> 2
atgcgcagat attaggaaga ataccggtgg cgaaggcgac tttctggtca tcatctgacg 60
ctgaggtacg aaagcgtggg tagcaaacag gattagatac cctggtagtc cacgctgtaa 120
acgatgagtg ttaggttctt ggaataatct gggagccgca gctaacgcat taaacactcc 180
gcctggggag tacgcacgca agtgtgaa 208
<210> 3
<211> 210
<212> DNA
<213> Finegoldia sp.
<400> 3
atacgtagat attaggagga ataccagtag cgaaggcgac tttctggaca caaactgacg 60
ctgaggtacg aaagcgtggg gagcaaacag gattagatac cctggtagtc cacgccgtaa 120
acgatgaatg ctaggtgttg ggggtcaaac ctcggtgccg aagttaacac attaagcatt 180
ccgcctgggg agtacgcacg caagtgtgaa 210
<210> 4
<211> 212
<212> DNA
<213> Ochrobactrum sp.
<400> 4
attcgtagat attcggagga acaccagtgg cgaaggcggc tcactggacc attactgacg 60
ctgaggtgcg aaagcgtggg gagcaaacag gattagatac cctggtagtc cacgccgtaa 120
acgatgaatg ttagccgttg gggagtttac tcttcggtgg cgcagctaac gcattaaaca 180
ttccgcctgg ggagtacggt cgcaagatta aa 212
<210> 5
<211> 214
<212> DNA
<213> Lactobacillus crispatus
<400> 5
atgcgtagat atatggaaga acaccagtgg cgaaggcggc tctctggtct gcaactgacg 60
ctgaggctcg aaagcatggg tagcgaacag gattagatac cctggtagtc catgccgtaa 120
acgatgagtg ctaagtgttg ggaggtttcc gcctctcagt gctgcagcta acgcattaag 180
cactccgcct ggggagtacg accgcaaggt tgaa 214
<210> 6
<211> 213
<212> DNA
<213> Lactobacillus iners
<400> 6
atgcgtagat atatggaaga acaccggtgg cgaggcggct ctctggtctg ttactgacgc 60
tgaggctcgg aagcatgggc agcgaacagg attagatacc ctggtagtcc atgccgtaaa 120
cgatgagtgc taagtgttgg gaggtttccg cctctcagtg ctgcagctaa cgcattaagc 180
actccgcctg gggagtacga ccgcaaggtt gaa 213
<210> 7
<211> 211
<212> DNA
<213> Lactobacillus sp.
<400> 7
atgcgtagat atatggagaa caccagtggc gaggcggctc tctggtctgc aactgacgct 60
gaggctcgaa gcatgggtag cgaacaggat tagataccct ggtagtccat gccgtaaacg 120
atgagtgcta agtgttggga ggtttccgcc tctcagtgct gcagctaacg cattaagcac 180
tccgcctggg gagtacgacc gcaaggttga a 211
<210> 8
<211> 214
<212> DNA
<213> Ruminococcaceae
<400> 8
atgcgtagat attgggagga acaccagtgg cgaaggcggc ctgctggaca ttaactgacg 60
ctgaggcgcg aaagcgtggg gagcaaacag gattagatac cctggtagtc cacgccgtaa 120
acgatggata ctaggtgtgg gaggtattga ccccttccgt gccggagtta acacaataag 180
tatcccacct ggggagtacg gccgcaaggt tgaa 214
<210> 9
<211> 215
<212> DNA
<213> Lactobacillus sp.
<400> 9
atgcgtagat atatggaaga acaccagtgg cgaaggcggc tctctggtct gcaactgacg 60
ctgaggctcg aaagcatggg tagcgaacag gattagatca ccctggttgt ccatgccgta 120
aacgatgagt gctaagtgtt gggaggtttc cgcctctcag tgctgcagct aacgcattaa 180
gcactccgcc tggggagtac gaccgcaagg ttgaa 215
<210> 10
<211> 210
<212> DNA
<213> Peptoniphilus sp.
<400> 10
atgcgtagat attaggagga ataccggtgg cgaaggcgac ttgctggact tcaactgacg 60
ctgaggaacg aaagcgtggg tagcaaacag gattagatac cctggtagtc cacgccgtaa 120
acgatgagtg ctaggtgtcg ggggtcaaac ctcggtgccg tcgttaacac actaagcact 180
ccgcctgggg agtacgtgcg caagcatgaa 210
<210> 11
<211> 215
<212> DNA
<213> Bifidobacteriaceae
<400> 11
atgtgtagat atcgggaaga acaccaatgg cgaaggcagg tctctgggct gttactgacg 60
ctgagaagcg aaagcgtggg ggagcgaaca ggattagata ccctggtagt ccacgccgta 120
aacggtggac gctggatgtg gggcccattc cacgggttcc gtgtcggagc taacgcgtta 180
agcgtcccgc ctggggagta cggccgcaag ctaaa 215
<210> 12
<211> 213
<212> DNA
<213> Staphylococcus sp.
<400> 12
atgcgcagag atatggagga acaccagtgg cgaaggcgac tttctggtct gtaactgacg 60
ctgatgtgcg aagcgtgggg atcaaacagg attagatacc ctggtagtcc acgccgtaaa 120
cgatgagtgc taagtgttag ggggtttccg ccccttagtg ctgcagctaa cgcattaagc 180
actccgcctg gggagtacga ccgcaaggtt gaa 213
<210> 13
<211> 212
<212> DNA
<213> Comamonadaceae
<400> 13
atgcgtagat atgcggagga acaccgatgg cgaaggcaat cccctgggcc tgtactgacg 60
ctcatgcacg aaagcgtggg gagcaaacag gattagatac cctggtagtc cacgccctaa 120
acgatgtcaa ctggttgttg ggtcttcact gactcagtaa cgaagctaac gcgtgaagtt 180
gaccgcctgg ggagtacggc cgcaaggttg aa 212
<210> 14
<211> 206
<212> DNA
<213> Peptoniphilus sp.
<400> 14
atgcgtagat attaaaaaga ataccggtgg cgaaggcgac ttactgggct cattctgacg 60
ctgaggaacg aaagcgtggg tagcaaacag gattagatac cctggtagtc cacgctgtaa 120
acgatgagtg ctaggtatcg gaataattcg gtgccgcagt taacacatta agcactccgc 180
ctggggagta cgtgcgcaag catgaa 206
<210> 15
<211> 215
<212> DNA
<213> Lactobacillus iners
<400> 15
atgcgtagga tatatggaag aacaccggtg gcgaaggcgg ctctctggtc tgttactgac 60
gctgaggctc gaaagcatgg gtagcgaaca ggattagata ccctggtagt ccatgccgta 120
aacgatgagt gctaagtgtt gggaggtttc cgcctctcag tgctgcagct aacgcattaa 180
gcactccgtc tggggagtac gaccgcaagg ttgaa 215
<210> 16
<211> 214
<212> DNA
<213> Lactobacillus iners
<400> 16
atgcgtagat atatggaaga acaccggtgg gcgaggcggc tctctggtct gttactgacg 60
ctgaggctcg aaagcatggg tagcgaacag gattagatac cctggtagtc catgccgtaa 120
acgatgagtg ctaagtgttg ggaggtttcc gcctctcagt gctgcagcta acgcattaag 180
cactccgcct ggggagtacg accgcaaggt tgaa 214
<210> 17
<211> 215
<212> DNA
<213> Bifidobacteriaceae
<400> 17
atgtgtagat atcgggaaga acaccaatgg cgaaggcagg tctctgggct gttactgacg 60
ctgagaagcg aaagcgtggg gagcgaacag gattagatac cctggtagtc cacgccgtaa 120
acggtggacg ctggatgtgg ggcccattcc acgggttctg tgtcggagct aacgcgttaa 180
gcgtcccgcc tggggagtac ggccgcaagg ctaaa 215
<210> 18
<211> 212
<212> DNA
<213> Lactobacillus iners
<400> 18
atgcgtagat atatggaaga acaccggtgg cgaggcggct ctctggtctg ttactgacgc 60
tgaggctcga aagcatgggt agcgaacagg attagatacc ctggtagtcc ataccgtaaa 120
cgatgagtgc taagtgtggg aggtttccgc ctctcagtgc tgcagctaac gcattaagca 180
ctccgcctgg ggagtacgac cgcaaggttg aa 212
<210> 19
<211> 213
<212> DNA
<213> Enterobacteriaceae
<400> 19
atgcgtagag atctggagga ataccggtgg cgaaggcggc cccctggacg aagactgacg 60
ctcaggtgcg aaagcgtggg gagcaaacag gattagatac cctggtagtc cacgccgtaa 120
acgatgtcga cttggaggtt gtgcccttga ggcgtggctt ccggagctaa cgcgttaagt 180
cgaccgcctg gggagtacgg ccgcaaggtt aaa 213
<210> 20
<211> 212
<212> DNA
<213> Delftia sp.
<400> 20
atgcgtagat atgcggagga acaccgatgg cgaaggcaat cccctggacc tgtactgacg 60
ctcatgcacg aaagcgtggg gagcaaacag gattagatac cctggtagtc cacgccctaa 120
acgatgtcaa ctggttgttg ggaattagtt ttctcagtaa cgaagctaac gcgtgaagtt 180
gaccgcctgg ggagtacggc cgcaaggttg aa 212
<210> 21
<211> 214
<212> DNA
<213> Vagococcus sp.
<400> 21
atgcgtagat atatggagga acaccagtgg cgaaggcgac tctctggtct gtaactgaca 60
ctgaggctcg aaagcgtggg gagcaaacag gattagatac cctggtagtc cacgccgtaa 120
acgatgagtg ctaagtgttg gagggtttcc gcccttcagt gctgcagtta acgcattaag 180
cactccgcct ggggagtacg gtcgcaagac tgaa 214
<210> 22
<211> 214
<212> DNA
<213> Corynebacterium sp.
<400> 22
atgcgcagat atcaggagga acaccgatgg cgaaggcagg tctctgggca gtaactgacg 60
ctgaggagcg aaagcatggg tagcgaacag gattagatac cctggtagtc catgccgtaa 120
acggtgggcg ctaggtgtag ggggcttcca cgtcttctgt gccgtagcta acgcattaag 180
cgccccgcct ggggagtacg gccgcaaggc taaa 214
<210> 23
<211> 212
<212> DNA
<213> Pseudomonas viridiflava
<400> 23
atgcgtagat ataggaagga acaccagtgg cgaaggcgac cacctggctc atactgacac 60
tgaggtgcga aagcgtgggg agcaaacagg attagatacc ctggtagtcc acgccgtaaa 120
cgatgtcaac tagccgttgg aatccttgag attttagtgg cgcagctaac gcattaagtt 180
gaccgcctgg ggagtacggc cgcaaggtta aa 212
<210> 24
<211> 213
<212> DNA
<213> Shewanella sp.
<400> 24
atgcgtagag atctggagga ataccggtgg cgaaggcggc cccctggaca aagactgacg 60
ctcaggcacg aaagcgtggg gagcaaacag gattagatac cctggtagtc cacgccgtaa 120
acgatgtcta ctcggagttt ggtgtcttga acactgggct ctcaagctaa cgcattaagt 180
agaccgcctg gggagtacgg ccgcaaggtt aaa 213
<210> 25
<211> 215
<212> DNA
<213> Lactobacillus iners
<400> 25
atgcgtagat atatggaaga acaccggtgg cgaggcggct ctctggtctg ttactgacgc 60
tgaggctcga aaagcatggg tagcgaaaca ggattagata ccctggtagt ccatgccgta 120
aacgatgagt gctaagtgtt gggaggtttc cgcctctcag tgctgcagct aacgcattaa 180
gcactccgcc tggggagtac gaccgcaagg ttgaa 215
<210> 26
<211> 212
<212> DNA
<213> Paracoccus sp.
<400> 26
attcgtagat attcggagga acaccagtgg cgaaggcggc tcactggctc gatactgacg 60
ctgaggtgcg aaagcgtggg gagcaaacag gattagatac cctggtagtc cacgccgtaa 120
acgatgaatg ccagacgtcg ggcagcatgc tgttcggtgt cacacctaac ggattaagca 180
ttccgcctgg ggagtacggt cgcaagatta aa 212
<210> 27
<211> 215
<212> DNA
<213> Lactobacillus sp.
<400> 27
atgcgtagat atatggaaga acaccagtgg cgaaggcggc tctctggtct gtaactgacg 60
ctgaggctcg aaagcatggg gtagcgaaca ggattagata ccctggtagt ccatgccgta 120
aacgatgagt gctaagtgtt gggaggtttc cgcctctcag tgctgcagct aacgcattaa 180
gcactccgcc tggggagtac gaccgcaagg ttgaa 215
<210> 28
<211> 211
<212> DNA
<213> Pseudomonas sp.
<400> 28
atgcgtagat ataggaagga acaccagtgg cgaggcgacc acctggactg atactgacac 60
tgaggtgcga aagcgtgggg agcaaacagg attagatacc ctggtagtcc acgccgtaaa 120
cgatgtcaac tagccgttgg gagcttgagc tcttagtggc gcagctaacg cattaagttg 180
accgcctggg gagtacggcc gcaaggttaa a 211
<210> 29
<211> 214
<212> DNA
<213> Lactobacillus iners
<400> 29
atgcgtagat atatggaaga acaccggtgg cgaaggcggc tctctggtct gttactgacg 60
ctgaggctcg aaagcatggg tagcgaacag gattagatac cctggtagtc catgccgtaa 120
acgatgagtg ctaagtgttg ggaggtttcc gcctctcagt gctgcagcca acgcattaag 180
cactccgcct ggggagtacg atcgcaagat tgaa 214
<210> 30
<211> 213
<212> DNA
<213> Lactobacillus iners
<400> 30
atgcgtagat atatggaaga caccggtggc gaaggcggct ctctggtctg ttactgacgc 60
tgaggctcga aagcatgggt agcgaacagg attagatacc ctggtagtcc atgccgtaaa 120
cgatgagtgc taagtgttgg agggtttccg cctctcagtg ctgcagctaa cgcattaagc 180
actccgcctg gggagtacga ccgcaaggtt gaa 213
<210> 31
<211> 213
<212> DNA
<213> Lactobacillus iners
<400> 31
atgcgtagat atatggaaga acaccggtgg cgaggcggct ctctggtctg ttactgacgc 60
tgaggctcga aagcatgggt agcgaacagg attagatacc ctggtagtcc atgccgtaaa 120
cgatgagtgc taagtgttgg gaggtttccg cctctcagtg ctgcagctaa cgcattaagc 180
actccgcctg gggagtacga ccgcaaggtt gaa 213
<210> 32
<211> 213
<212> DNA
<213> Stenotrophomonas sp.
<400> 32
atgcgtagag atcaggagga acatccatgg cgaaggcagc tacctggacc aacattgaca 60
ctgaggcacg aaagcgtggg gagcaaacag gattagatac cctggtagtc cacgccctaa 120
acgatgcgaa ctggatgttg ggtgcaattt ggcacgcagt atcgaagcta acgcgttaag 180
ttcgcgcctg gggagtacgg tcgcaagact gaa 213
<210> 33
<211> 212
<212> DNA
<213> Pseudochrobactrum sp.
<400> 33
attcgtagat attcgcagga acaccagtgg cgaaggcggc ttactggtcc attactgacg 60
ctgaggtgcg aaagcgtggg gagcaaacag gattagatac cctggtagtc cacgccgtaa 120
acgatgaatg ttagccgtcg gggtgtttac acttcggtgg cgcagctaac gcattaaaca 180
ttccgcctgg ggagtacggt cgcaagatta aa 212
<210> 34
<211> 213
<212> DNA
<213> Oxalobacteraceae
<400> 34
atgcgtagag atgtggagga acaccgatgg cgaaggcagc cccctgggtc aagattgacg 60
ctcatgcacg aaagcgtggg gagcaaacag gattagatac cctggtagtc cacgccctaa 120
acgatgtcta ctagttgtcg ggtttttaat taacttggta acgcagctaa cgcgtgaagt 180
agaccgcctg gggagtacgg tcgcaagatt aaa 213
<210> 35
<211> 214
<212> DNA
<213> Pseudomonas sp.
<400> 35
atgcgtagat ataggaagga acaccagtgg cgaaggcgac cacctggact gatactgaca 60
ctgaggtgcg aaagcgtggg ggagcaaaca ggattagata ccctggtagt ccacgccgta 120
aacgatgtca actagccgtt gggagccttg agctcttagt ggcgcagcta acgcattaag 180
ttgaccgcct ggggagtacg gccgcaaggt taaa 214
<210> 36
<211> 213
<212> DNA
<213> Pseudomonas sp.
<400> 36
atgcgtagat ataggaagga acaccagtgg cgagggcgac cacctggact gatactgacg 60
ctgaggtgcg aaagcgtggg gagcaaacag gattagatac cctggtagtc cacgccgtaa 120
acgatgtcaa ctagccgttg ggagccttga gctcttagtg gcgcagctaa cgcattaagt 180
tgaccgcctg gggagtacgg ccgcaaggtt aaa 213
<210> 37
<211> 214
<212> DNA
<213> Corynebacterium sp.
<400> 37
atgcgcagat atcaggagga acaccgatgg cgaaggcagg tctctgggca gtaactgacg 60
ctgaggagcg aaagcatggg tagcgaacag gattagatac cctggtagtc catgccgtaa 120
acggtgggcg ctaggtgtga gtcccttcca cggggttcgt gccgtagcta acgcattaag 180
cgccccgcct ggggagtacg gccgcaaggc taaa 214
<210> 38
<211> 215
<212> DNA
<213> Micrococcus luteus
<400> 38
atgcgcagat atcaggagga acaccgatgg cgaaggcagg tctctgggct gtaactgacg 60
ctgaggagcg aaagcatggg gagcgaacag gattagatac cctggtagtc catgccgtaa 120
acgttgggca ctaggtgtgg ggaccattcc acggtttccg cgccgcagct aacgcattaa 180
gtgccccgcc tggggagtac ggccgcaagg ctaaa 215
<210> 39
<211> 213
<212> DNA
<213> Tissierellaceae
<400> 39
atgcgtagat attaggagga ataccagtgg cgaaggcgac ttttctggac ttatactgac 60
actgaggaac gaaagcgtgg ggagcaaaca ggattagata ccctggtagt ccacgccgta 120
aacgatgagt gctaggtgtt ggggggtcaa acctcggtgc cgcagctaac gcattaagca 180
ctccgcctgg gggagtacgt acgcaagtat gaa 213
<210> 40
<211> 213
<212> DNA
<213> Paenibacillus sp.
<400> 40
atgcgtagag atgtggagga acaccagtgg cgaggcgact ttctgggctg taactgacgc 60
tgaggcgcga aagcgtgggg agcaaacagg attagatacc ctggtagtcc acgccgtaaa 120
cgatgaatgc taggtgttag gggtttcgat acccttggtg ccgaagttaa cacaataagc 180
attccgcctg gggagtacgc tcgcaagagt gaa 213
<210> 41
<211> 213
<212> DNA
<213> Shewanella sp.
<400> 41
atgcgtagag atctggagga ataccggtgg cgaaggcggc cccctggaca aagactgacg 60
ctcatgcacg aaagcgtggg gagcaaacag gattagatac cctggtagtc cacgccgtaa 120
acgatgtcta ctcggagttt ggtgtcttga acactgggct ctcaagctaa cgcattaagt 180
agaccgcctg gggagtacgg ccgcaaggtt aaa 213
<210> 42
<211> 213
<212> DNA
<213> Pseudomonas fragi
<400> 42
atgcgtagat ataggaagga acaccagtgg cgaaggcgac tacctggact gatactgaca 60
ctgaggtgcg aaagcgtggg gagcaaacag gattagatac cctggtagtc cacgccgtaa 120
acgatgtcaa ctagccgttg ggagtcttga actcttagtg gcgcagctaa cgcattaagt 180
tgaccgcctg gggagtacgg ccgcaaggtt aaa 213
<210> 43
<211> 214
<212> DNA
<213> Vagococcus sp.
<400> 43
atgcgtagat atatggagga acaccagtgg cgaaggcgac tctctggtct gtaattgacg 60
ctgaggctcg aaagcgtggg gagcaaacag gattagatac cctggtagtc cacgccgtaa 120
acgatgagtg ctaagtgttg gagggtttcc gcccttcagt gctgcagtta acgcattaag 180
cactccgcct ggggagtacg gccgcaaggc tgaa 214
<210> 44
<211> 213
<212> DNA
<213> Sphingobium sp.
<400> 44
attcgtagat attcggaaga acaccagtgg cgaaggcggc tcactggaca ggtattgacg 60
ctgaggtgcg aaagcgtggg gagcaaacag gattagatac cctggtagtc cacgccgtaa 120
acgatgataa ctagctgccg gggcacatgg tgtttcggtg gcgcagctaa cgcattaagt 180
tatccgcctg gggagtacgg tcgcaagatt aaa 213
<210> 45
<211> 19
<212> DNA
<213> 人工序列
<400> 45
gtgccagcmg ccgcggtaa 19
<210> 46
<211> 18
<212> DNA
<213> 人工序列
<400> 46
ccgtcaattc mtttragt 18

Claims (6)

1.一种用于子宫腺肌症检测或患病风险评估的生物标志物组合物,其特征在于:所述生物标志物组合物包括第一标志物组、第二标志物组和第三标志物组中的任一组或任两组;
所述第一标志物组由十八条核酸组成,十八条核酸分别为Seq ID No.1至Seq IDNo.18所示序列;
所述第二标志物组由二十二条核酸组成,二十二条核酸分别为Seq ID No.1、Seq IDNo.4、Seq ID No.5、Seq ID No.7、Seq ID No.10、Seq ID No.11、Seq ID No.13、Seq IDNo.15、Seq ID No.18至Seq ID No.31所示序列;
所述第三标志物组由十八条核酸组成,这十八条核酸分别为Seq ID No.1、Seq IDNo.2、Seq ID No.13、Seq ID No.19、Seq ID No.28、Seq ID No.32至Seq ID No.44所示序列。
2.根据权利要求1所述的生物标志物组合物,其特征在于:所述第一标志物组为CL标志物组,用于对来自阴道下1/3的样品进行子宫腺肌症检测或患病风险评估。
3.根据权利要求1所述的生物标志物组合物,其特征在于:所述第二标志物组为CU标志物组,用于对来自阴道后穹窿的样品进行子宫腺肌症检测或患病风险评估。
4.根据权利要求1所述的生物标志物组合物,其特征在于:所述第三标志物组为CV标志物组,用于对来自宫颈管的样品进行子宫腺肌症检测或患病风险评估。
5.根据权利要求1-4任一项所述的生物标志物组合物在制备子宫腺肌症检测或患病风险评估的试剂盒或检测工具中的应用。
6.一种制备子宫腺肌症生物标志物组合的方法,其特征在于:包括以下步骤,
(1)分别对子宫腺肌症病患和非病患进行生殖道内微生物样品采集,对所有采集的样品分别进行16S测序,所述生殖道内微生物样品采集,具体包括采集待测对象阴道下1/3样品、阴道后穹窿样品和宫颈管样品;
(2)将16S测序结果进行聚类分析,获得OTU单元以及每个OTU的种子序列,并计算每个OTU单元的相对丰度;
(3)利用随机森林模型对每个OTU单元的相对丰度与子宫腺肌症状态进行拟合,并进行5次十折交叉验证,得到最优的OTU组合,最优OTU组合中各OTU的种子序列,即组成子宫腺肌症的生物标志物组合。
CN201780047953.5A 2016-09-19 2017-08-07 用于子宫腺肌症检测的生物标志物组合及其应用 Active CN109689890B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN201610831104.6A CN107858415B (zh) 2016-09-19 2016-09-19 用于子宫腺肌症检测的生物标志物组合及其应用
CN2016108311046 2016-09-19
PCT/CN2017/096248 WO2018049946A1 (zh) 2016-09-19 2017-08-07 用于子宫腺肌症检测的生物标志物组合及其应用

Publications (2)

Publication Number Publication Date
CN109689890A CN109689890A (zh) 2019-04-26
CN109689890B true CN109689890B (zh) 2022-03-25

Family

ID=61619297

Family Applications (2)

Application Number Title Priority Date Filing Date
CN201610831104.6A Active CN107858415B (zh) 2016-09-19 2016-09-19 用于子宫腺肌症检测的生物标志物组合及其应用
CN201780047953.5A Active CN109689890B (zh) 2016-09-19 2017-08-07 用于子宫腺肌症检测的生物标志物组合及其应用

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CN201610831104.6A Active CN107858415B (zh) 2016-09-19 2016-09-19 用于子宫腺肌症检测的生物标志物组合及其应用

Country Status (2)

Country Link
CN (2) CN107858415B (zh)
WO (1) WO2018049946A1 (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2020366233A1 (en) * 2019-10-16 2022-05-26 Icahn School Of Medicine At Mount Sinai Systems and methods for detecting a disease condition
CN115404274A (zh) * 2022-11-01 2022-11-29 广东省生殖科学研究所(广东省生殖医院) 一种甲基化位点在子宫内膜异位症诊断和分型中的应用

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020173464A1 (en) * 2000-12-01 2002-11-21 King George L. Modulation of pericyte proliferation
CN1823274A (zh) * 2003-07-14 2006-08-23 株式会社白丽高科 子宫内膜异位相关疾病的诊断方法
JPWO2006051986A1 (ja) * 2004-11-15 2008-05-29 株式会社ピリオドック アロマターゼ活性の測定方法及びそれに用いる測定キット
WO2006091254A1 (en) * 2005-02-18 2006-08-31 The Government Of The United States Of America, As Represented By The Secretary, Department Of Health And Human Services Identification of molecular diagnostic markers for endometriosis in blood lymphocytes
WO2006106912A1 (ja) * 2005-03-31 2006-10-12 Chugai Seiyaku Kabushiki Kaisha 癌関連抗原アナログペプチド、およびその利用
KR20090029184A (ko) * 2006-04-07 2009-03-20 더 가브먼트 오브 더 유나이티드 스테이츠 오브 아메리카, 리프리젠티드 바이 더 세크러테리, 디파트먼트 오브 헬쓰 앤드 휴먼 서비씨즈 항체 조성물 및 신생물성 질병의 치료 방법
CN101210929A (zh) * 2006-12-29 2008-07-02 中国医学科学院北京协和医院 检测子宫内膜异位症血浆标志蛋白质的方法
EP2764118A1 (en) * 2011-10-05 2014-08-13 University of Bremen Wnt4 and med12 for use in the diagnosis and treatment of tumor diseases
CN105988002B (zh) * 2015-03-03 2021-01-19 江苏太和吉英医药科技有限公司 Mst1和磷酸化mst1作为子宫内膜容受性检测的方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
intra-uterine microbial colonization and occurrence of endometritis in women with endometriosis;Khaleque Newaz Khan等;《human reproduction》;20140908;第29卷(第11期);第2446-2456页 *
variable associated with vaginal discharge after ultrasound-guided percutaneous microwave ablation for adenomyosis;Rui-Fang Xu等;《international journal of hyperthermia》;20160418;第32卷(第5期);第504-510页 *

Also Published As

Publication number Publication date
WO2018049946A1 (zh) 2018-03-22
CN107858415A (zh) 2018-03-30
CN109689890A (zh) 2019-04-26
CN107858415B (zh) 2021-05-28

Similar Documents

Publication Publication Date Title
Schmidt et al. The prognostic impact of functional imaging with 123I-mIBG in patients with stage 4 neuroblastoma> 1 year of age on a high-risk treatment protocol: results of the German Neuroblastoma Trial NB97
WO2015018308A1 (en) Biomarkers for colorectal cancer
WO2016049932A1 (en) Biomarkers for obesity related diseases
WO2020244017A1 (zh) 一种基于肠道菌群的精神分裂症生物标志物组合、其应用及mOTU筛选方法
JP2019511922A (ja) 早産転帰に対する早期リスク評価のための方法及びシステム
Cartwright et al. Multicenter study establishing the clinical validity of a nucleic-acid amplification–based assay for the diagnosis of bacterial vaginosis
WO2016112488A1 (en) Biomarkers for colorectal cancer related diseases
CN109715828B (zh) 用于子宫内膜异位症检测的生物标志物组合及其应用
CN109689890B (zh) 用于子宫腺肌症检测的生物标志物组合及其应用
CN110904213A (zh) 一种基于肠道菌群的溃疡性结肠炎生物标志物及其应用
CN111334590A (zh) 一种鉴别结直肠癌的试剂盒及其应用
CN111020020A (zh) 一种精神分裂症的生物标志物组合、其应用及metaphlan2筛选方法
CN114182007A (zh) 白塞病标志基因及其应用
CN112384634B (zh) 骨质疏松生物标志物及其用途
US20210310078A1 (en) Method for early diagnosis of breast cancer and monitoring after treatment using liquid biopsy multi-cancer gene biomarkers
Karpurmath et al. Halving Time of BCR-ABL1 in Chronic Myeloid Leukemia: Is It Better Than Day-90 Value—A Multicenter Study From South India
WO2016049927A1 (en) Biomarkers for obesity related diseases
CN113122640A (zh) Cep63和fosl2的dna拷贝数变异在膀胱尿路上皮癌诊断中的应用
RU2763707C1 (ru) Способ прогнозирования преждевременного разрыва плодных оболочек в сроке от 22 до 28 недель беременности
JP2011004743A (ja) 関節リウマチ患者におけるインフリキシマブ薬効の有効性を判別する方法
Li et al. Clinical indicators and reproductive tract microbiota abnormalities indicate the occurrence of endometriosis
WO2016049917A1 (en) Biomarkers for obesity related diseases
JP2019176754A (ja) 排卵障害の検査方法
Kraus et al. Identification of CD24, a Novel Biomarker for the Early Detection of Colorectal Cancer (CRC), Using Peripheral Blood Mononuclear Cells
CN114262743A (zh) 中风标志微生物及其应用

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant