CN105671177B - 强直性脊柱炎标志物及应用 - Google Patents

强直性脊柱炎标志物及应用 Download PDF

Info

Publication number
CN105671177B
CN105671177B CN201610158147.2A CN201610158147A CN105671177B CN 105671177 B CN105671177 B CN 105671177B CN 201610158147 A CN201610158147 A CN 201610158147A CN 105671177 B CN105671177 B CN 105671177B
Authority
CN
China
Prior art keywords
abundance
ankylosing spondylitis
marker
control group
microorganism
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201610158147.2A
Other languages
English (en)
Other versions
CN105671177A (zh
Inventor
郑智俊
张林爽
吴春燕
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Realbio Technology Co ltd
Original Assignee
Shanghai Realbio Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Realbio Technology Co ltd filed Critical Shanghai Realbio Technology Co ltd
Priority to CN201610158147.2A priority Critical patent/CN105671177B/zh
Publication of CN105671177A publication Critical patent/CN105671177A/zh
Application granted granted Critical
Publication of CN105671177B publication Critical patent/CN105671177B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K45/00Medicinal preparations containing active ingredients not provided for in groups A61K31/00 - A61K41/00
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/136Screening for pharmacological compounds

Landscapes

  • Chemical & Material Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • General Health & Medical Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Pathology (AREA)
  • Molecular Biology (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Veterinary Medicine (AREA)
  • Biotechnology (AREA)
  • Immunology (AREA)
  • Microbiology (AREA)
  • Animal Behavior & Ethology (AREA)
  • Medicinal Chemistry (AREA)
  • Public Health (AREA)
  • Epidemiology (AREA)
  • Biochemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Medicines Containing Material From Animals Or Micro-Organisms (AREA)

Abstract

本发明公开了一种强直性脊柱炎标志物,包括以下微生物中的至少两种:双歧杆菌株Bifidobacterium_pseudocatenulatum_DSM_20438、双歧杆菌Bifidobacterium、梭菌Clostridiales、产气柯林斯菌株Collinsella_aerofaciens_ATCC_25986和瘤胃球菌株Ruminococcus_5_1_39BFAA。本发明还公开一种利用强直性脊柱炎标志物确定个体状态的方法及装置。相较于健康群体,所称的强直性脊柱炎标志物在强直性脊柱炎患者群体中显著富集,能够作为健康群体和强直性脊柱炎患者群体的区分标志。

Description

强直性脊柱炎标志物及应用
技术领域
本发明涉及生物标志物领域,具体的,本发明涉及强直性脊柱炎生物标志物及其应用,更具体的,本发明涉及一种强直性脊柱炎标志物、强直性脊柱炎标志物的用途、一种利用强直性脊柱炎标志物确定个体的状态的方法、一种利用强直性脊柱炎标志物确定个体的状态的装置、一种利用强直性脊柱炎标志物对多个个体进行分类的方法、一种治疗强直性脊柱炎的药物以及一种制备治疗强直性脊柱炎药物的方法。
背景技术
强直性脊柱炎(Ankylosing spondylitis,AS)是一种主要侵犯脊柱,并累及骶髂关节和周围关节的慢性进行性炎性疾病。起病多为15~30岁的男性,现在研究显示,该病男女之比为2:1~3:1,强直性脊柱炎的病因目前尚未完全明确,近年来研究结果表明该病与遗传素质、感染及免疫等因素有关。
强直性脊柱炎一般起病比较隐匿,早期可无任何临床症状,有些病人在早期可表现出轻度的全身症状,如乏力、消瘦、长期或间断低热、厌食、轻度贫血等。由于病情较轻,病人大多不能早期发现,致使病情延误,失去最佳治疗时机。
强直性脊柱炎与人体白细胞抗原HLA-B27密切相关,据流行病学调查,强直性脊柱炎病人HLA-B27阳性率高达90%~96%,而普通人群HLA-27阳性率仅4%~9%;HLA-B27阳性者强直性脊柱炎发病率约为10%~20%,而普通人群发病为1‰~2‰,相差约100倍。虽然HLA-B27检测对强直性脊柱炎的诊断有一定的帮助,但绝大部分的患者还要通过病史、体征和X线检查作出诊断。目前,强直性脊柱炎的早期诊断主要是用CT、放射性核扫描、磁共振等影像学进行检查,检查过程较复杂。
随着人体基因组测序完成及高通量测序技术的高速发展,基因筛查成为强直性脊柱炎诊断的方向,对于发现强直性脊柱炎潜在人群很有优势。研究表明超过70%的强直性脊柱炎患者患有肠道炎症,这些患者中5~10%肠道炎症很严重,可能会发展为临床上的炎症性肠病(IBD)或克罗恩氏病(CD)(Mielants et al.,1985)。克罗恩氏病(CD)的一些标记基因与强直性脊柱炎相关联(Parkes et al.,2013),说明两种疾病可能有类似发病机制,可能与肠道失调相关。有研究表明与强直性脊柱炎相关的多基因在肠道免疫中起重要作用,如涉及到白介素IL-23途径的基因对肠道健康的调节起重要作用(Wellcome et al.,2007)。与健康对照相比,强直性脊柱炎患者及其直系亲属肠道通透性增加,再次说明肠道微生物在强直性脊柱炎中的重要作用(Mielants et al.,1991)。到目前为止,还没有强直性脊柱炎患者肠道微生物标记物的相关报道。
发明内容
本发明旨在至少在一定程度上解决上述技术问题之一或至少提供一种商业选择。
依据本发明的第一方面,提供一种强直性脊柱炎标志物,所述标志物包括以下微生物中的至少两种:双歧杆菌株Bifidobacterium_pseudocatenulatum_DSM_20438、双歧杆菌Bifidobacterium、梭菌Clostridiales、产气柯林斯菌株Collinsella_aerofaciens_ATCC_25986和瘤胃球菌株Ruminococcus_5_1_39BFAA。
上述本发明一方面提供的强直性脊柱炎标志物是发明人通过对大量患强直性脊柱炎个体和大量健康对照个体的粪便样本中的微生物的丰度的差异比较分析、以及验证,而确定下来的,明确了肠道微生物中强直性脊柱炎相关的微生物标志物。利用所称的强直性脊柱炎标志物,能够确定个体处于患有强直性脊柱炎状态的概率高低或者处于健康状态的概率高低,能够用于非侵入性的早期发现或辅助检测强直性脊柱炎。
依据本发明的第二方面,本发明提供上述强直性脊柱炎标志物在制备治疗强直性脊柱炎的药物和/或在制备功能性食品中的用途。
上述强直性脊柱炎标志物是发明人通过差异比较分析各种肠道微生物在强直性脊柱炎疾病组和健康组的粪便样本中的丰度,以及经过大量已知状态的粪便样本的验证,而确定下来的。相较于在健康群体组,所称强直性脊柱炎标志物在强直性脊柱炎患者中显著富集,所称显著富集是指与在健康组中的丰度相比,上述强直性脊柱炎标志物所包含的各种微生物在疾病组中的丰度均具有统计意义地高于或者明显地、实质性地高于在健康组中的丰度。能够使其丰度减小的物质能够用于治疗强直性脊柱炎或者益于强直性脊柱炎患者服用,能够使其丰度减少的物质不限于治疗强直性脊柱炎的药物和有益肠道菌群平衡的功能性食品,上述本发明一方面提供的强直性脊柱炎标志物能够用于制备治疗强直性脊柱炎的药物和/或用于制备益于平衡肠道菌群的功能性食品、保健药等。
依据本发明的第三方面,提供一种利用上述强直性脊柱炎标志物确定个体的状态的方法,该方法包括:(1)确定所述个体的粪便样本中的所述强直性脊柱炎标志物中的各种微生物的丰度;(2)分别将(1)中确定的强直性脊柱炎标志物中的各种微生物的丰度与其在对照组中的丰度进行比较,依据获得的比较结果确定所述个体的状态,所述对照组由一组或多组相同状态的个体的粪便样本组成,所述状态包括患有强直性脊柱炎和不患有强直性脊柱炎。所称强直性脊柱炎标志物是发明人通过差异比较分析各种肠道微生物在强直性脊柱炎疾病组和健康组的粪便样本中的丰度,以及经过大量已知状态的粪便样本的验证,而确定下来的。
上述本发明这一方面的方法基于检测个体的粪便样本中的强直性脊柱炎标志物中的各种微生物的丰度,分别将检测确定的各种微生物的丰度与其在对照组中丰度进行比较,依据获得的比较结果能够确定个体为强直性脊柱炎个体或者为健康个体的概率。为早期发现强直性脊柱炎提供一种非侵入性的辅助检测方法。
上述本发明的这一方面的利用强直性脊柱炎标志物确定个体的状态的方法的全部或部分步骤,可以利用包含可拆分的相应单元功能模块的装置/系统来施行,或者将方法程序化、存储于机器可读介质,利用机器运行该可读介质来实现。
依据本发明的第四方面,提供一种利用上述强直性脊柱炎标志物确定个体的状态的装置,该装置用以实施本发明一方面的利用强直性脊柱炎标志物确定个体的状态的方法的全部或部分步骤,该装置包括:数据输入单元,用于输入数据;数据输出单元,用于输出数据;处理器,用于执行可执行程序,执行所述可执行程序包括完成上述利用强直性脊柱炎确定个体的状态的方法的所有或部分步骤;存储单元,与所述数据输入单元、所述数据输出单元和所述处理器相连,用于存储数据,其中包括所述可执行程序。上述对本发明一方面的利用强直性脊柱炎标志物确定个体的状态的方法的技术特征和优点的描述,同样适用本发明这一方面的装置,在此不再赘述。
依据本发明的第五方面,提供一种利用上述强直性脊柱炎标志物确定个体状态的系统,该装置用以实施本发明一方面的利用强直性脊柱炎标志物确定个体的状态的方法的全部或部分步骤,该系统包括:微生物丰度确定单元,用于确定所述个体的粪便样本中的所述强直性脊柱炎标志物中的各种微生物的丰度;个体状态确定单元,用于分别将来自所述微生物丰度确定单元的所述强直性脊柱炎标志物中的各种微生物的丰度与其在对照组中的丰度进行比较,依据获得的比较结果确定所述个体的状态,所述对照组由一组或多组相同状态的个体的粪便样本组成,所述状态包括患有强直性脊柱炎和不患有强直性脊柱炎。上述对本发明一方面的利用强直性脊柱炎标志物确定个体的状态的方法的技术特征和优点的描述,同样适用本发明这一方面的系统,在此不再赘述。
依据本发明的第六方面,提供一种利用上述强直性脊柱炎标志物对多个个体进行分类的方法,该方法包括:分别利用上述本发明一方面的确定个体状态的方法确定各个个体的状态;依据获得的各个个体的状态对所述各个个体进行分类。该方法能够依据个体的状态的不同区分开多个个体或者区分开多个未知的粪便样本,便于归类、标记管理。另外,上述对本发明一方面的利用强直性脊柱炎标志物确定个体的状态的方法的技术特征和优点的描述,同样适用本发明这一方面的方法,在此不再赘述。
依据本发明的第七方面,提供一种治疗强直性脊柱炎的药物,所述药物促使上述强直性脊柱炎标志物中的各种微生物的丰度减少。所称强直性脊柱炎标志物是发明人通过差异分析各种肠道微生物在强直性脊柱炎疾病组和健康组的粪便样本中的丰度,以及经过大量已知状态的粪便样本的验证,而确定下来的。相较于在健康群体组,所称强直性脊柱炎标志物在强直性脊柱炎疾病组中显著富集,所称显著富集是指与在健康组中的丰度相比,上述强直性脊柱炎标志物所包含的各种微生物在疾病组中的丰度均具有统计意义地高于或者明显地、实质性地高于在健康组中的丰度。能够使其丰度减少的物质能够用于治疗强直性脊柱炎或者益于强直性脊柱炎患者服用,能够使其丰度减少的物质可以作为治疗强直性脊柱炎的药物。
利用本发明这一方面的药物或者功能性食品,合理有效地应用确定的强直性脊柱炎微生物标志物,扶持肠道有益菌的生长和/或抑制肠道潜在致病菌,对于辅助降低血内毒素水平和/或减轻强直性脊柱炎的临床症状具有重要意义。
依据本发明的第八方面,本发明提供一种制备或筛选上述本发明一方面的治疗强直性脊柱炎的药物的方法,该方法包括制备或者筛选能够促使上述本发明一方面的强直性脊柱炎标志物中的各个微生物的丰度减少的物质作为所述药物的步骤。
利用本发明这一方面的生产或筛选治疗强直性脊柱炎的药物的方法,通过合理有效地应用确定的强直性脊柱炎生物标志物进行筛选,能够获得能扶持肠道有益菌的生长和/或抑制肠道潜在致病菌的药物,对于辅助降低血内毒素水平和/或减轻强直性脊柱炎的临床症状具有重要意义。
附图说明
本发明的上述和/或附加的方面和优点从结合下面附图对实施方式的描述中将变得明显和容易理解,其中:
图1是本发明的实施例中的筛选鉴定强直性脊柱炎标志物的试验分析流程示意图。
图2是本发明的实施例中的聚类结果示意图。
图3是本发明的实施例中的强直性脊柱炎标志物验证结果的示意图。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中,自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能理解为对本发明的限制。需要说明的,本文中所使用的术语“第一”或者“第二”等仅为方便描述,不能理解为指示或暗示相对重要性,也不能理解为之间有先后顺序关系。
在本发明的描述中,除非另有说明,“多个”的含义是两个或两个以上。在本文中,除非另有明确的规定和限定,术语“相连”、“连接”等术语应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。
生物学标志物是从生物学介质中可以检测到的细胞、生物化学或分子改变。生物学介质包括各种体液、组织、细胞、粪便、头发、呼气等。
所称的某种微生物的丰度指在某一微生物群体中该种微生物的丰富程度,例如在肠道微生物群体中该种微生物的丰富程度,可表示为该种微生物在该群体中的含量。
所称序列的一致性(identity)和序列的相似度(similarity)分别指序列间相同或相似的程度。
根据本发明的一个实施方式提供的一种强直性脊柱炎生物标志物,检测该生物标志物的变化可以确定个体患有强直性脊柱炎的相对概率高低。所述强直性脊柱炎标志物包括以下微生物中的至少两种:双歧杆菌株Bifidobacterium_pseudocatenulatum_DSM_20438、双歧杆菌Bifidobacterium、梭菌Clostridiales、产气柯林斯菌株Collinsella_aerofaciens_ATCC_25986和瘤胃球菌株Ruminococcus_5_1_39BFAA。
所称的强直性脊柱炎标志物是发明人通过对大量强直性脊柱炎个体和大量健康对照个体的粪便样本中的微生物的丰度进行差异比较分析、以及验证,而确定下来的,明确了肠道微生物中强直性脊柱炎相关的微生物标志物。利用所称的强直性脊柱炎标志物,能够确定个体处于患有强直性脊柱炎状态的概率或者处于健康状态的概率,能够用于非侵入性的早期发现、辅助检测强直性脊柱炎等。
根据本发明的实施例,所称强直性脊柱炎标志物由双歧杆菌株Bifidobacterium_pseudocatenulatum_DSM_20438、双歧杆菌Bifidobacterium、梭菌Clostridiales、产气柯林斯菌株Collinsella_aerofaciens_ATCC_25986和瘤胃球菌株Ruminococcus_5_1_39BFAA中的任意两种、任意三种、任意四种或者全部物种组成。
根据本发明的实施例,所称强直性脊柱炎标志物包括双歧杆菌株Bifidobacterium_pseudocatenulatum_DSM_20438和产气柯林斯菌株Collinsella_aerofaciens_ATCC_25986;任选的还包括双歧杆菌Bifidobacterium、梭菌Clostridiales、和瘤胃球菌株Ruminococcus_5_1_39BFAA中的至少一种。
根据本发明的实施例,所称强直性脊柱炎标志物包括双歧杆菌株Bifidobacterium_pseudocatenulatum_DSM_20438和双歧杆菌Bifidobacterium;任选的,还包括梭菌Clostridiales、产气柯林斯菌株Collinsella_aerofaciens_ATCC_25986和瘤胃球菌株Ruminococcus_5_1_39BFAA中的至少一种。
根据本发明的实施例,所称强直性脊柱炎标志物包括双歧杆菌株Bifidobacterium_pseudocatenulatum_DSM_20438、和瘤胃球菌株Ruminococcus_5_1_39BFAA;任选的,还包括双歧杆菌Bifidobacterium、梭菌Clostridiales和产气柯林斯菌株Collinsella_aerofaciens_ATCC_25986中的至少一种。
根据本发明的实施例,所称强直性脊柱炎标志物包括梭菌Clostridiales和产气柯林斯菌株Collinsella_aerofaciens_ATCC_25986;任选的还包括霍氏双歧杆菌株Bifidobacterium_pseudocatenulatum_DSM_20438、双歧杆菌Bifidobacterium和瘤胃球菌株Ruminococcus_5_1_39BFAA中的至少一种。
根据本发明的实施例,所称强直性脊柱炎标志物包括梭菌Clostridiales和瘤胃球菌株Ruminococcus_5_1_39BFAA;任选的还包括双歧杆菌株Bifidobacterium_pseudocatenulatum_DSM_20438、双歧杆菌Bifidobacterium和产气柯林斯菌株Collinsella_aerofaciens_ATCC_25986中的至少一种。
根据本发明的实施例,所称强直性脊柱炎标志物包括产气柯林斯菌株Collinsella_aerofaciens_ATCC_25986和瘤胃球菌株Ruminococcus_5_1_39BFAA;任选的还包括双歧杆菌株Bifidobacterium_pseudocatenulatum_DSM_20438、双歧杆菌Bifidobacterium和梭菌Clostridiales中的至少一种。
根据本发明一个实施方式提供的上述任一强直性脊柱炎标志物在制备治疗强直性脊柱炎的药物和/或在制备功能性食品中的用途。所强直性脊柱炎标志物是发明人通过差异比较分析各种肠道微生物在强直性脊柱炎疾病组和健康组的粪便样本中的丰度,以及经过大量已知状态的粪便样本的验证,而确定下来的。相较于在健康群体组,所称强直性脊柱炎标志物在强直性脊柱炎疾病组中显著富集,所称显著富集是指与在健康组中的丰度相比,上述强直性脊柱炎标志物所包含的各种微生物在疾病组中的丰度均具有统计意义地高于或者明显地、实质性地高于在健康组中的丰度。
能够使所称强直性脊柱炎标志物丰度减小的物质能够用于治疗强直性脊柱炎或者益于强直性脊柱炎患者服用,能够使所称强直性脊柱炎标志物丰度减小的物质不限于治疗强直性脊柱炎的药物和有益肠道菌群平衡的功能性食品,该实施方式提供的强直性脊柱炎标志物能够用于制备治疗强直性脊柱炎的药物和/或用于制备益于平衡肠道菌群的功能性食品、保健药等。
根据本发明的另一个实施方式提供的一种利用上述任一实施例中的强直性脊柱炎标志物确定个体的状态的方法,该方法包括以下步骤(1)和(2):
(1)确定待测个体中的强直性脊柱炎标志物的丰度。
确定待测个体的粪便样本中的强直性脊柱炎标志物中的各种微生物的丰度。
根据本发明的实施例,进行以下以完成该步骤:获得所述个体的粪便样本中的核酸序列的测序数据,所述测序数据包括多个读段;组装所述读段,获得基因集,所述基因集包括多个组装片段,所述基因集中的组装片段为非冗余序列;确定所述强直性脊柱炎标志物中的各种微生物包含的组装片段;依据所述测序数据,分别确定所述基因集中的各个组装片段的丰度,其中包括,分别确定所述强直性脊柱炎标志物中的各种微生物包含的组装片段的丰度;分别依据所述确定的组装片段的丰度,确定所述强直性脊柱炎标志物中的各种微生物的丰度。
所称的测序数据通过对样本中的核酸序列进行测序得来,测序依据所选的测序平台的不同,可选择但不限于半导体测序技术平台比如PGM、Ion Proton、BGISEQ-100平台,合成边测序的技术平台比如Illumina公司的Hiseq、Miseq序列平台以及单分子实时测序平台比如PacBio序列平台。测序方式可以选择单端测序,也可以选择双末端测序,获得的下机数据是测读出来的片段,称为读段(reads)。
所称的组装可以利用已知序列组装方法或软件进行,例如利用SOAPdenovo、velvet等。
所称的确定强直性脊柱炎标志物中的各种微生物包含的组装片段,根据本发明的一个实施例,是通过将基因集中的组装片段与微生物参考序列进行Blat比对,依据与某种微生物参考序列的相似程度来判断组装片段是否来自该种微生物。所称参考序列指预先确定的序列,可以是预先获得的待测样本所属或者所包含的生物类别的任意参考模板,例如,若目标是待测样本中的微生物,参考序列可选择NCBI数据库中的各种微生物的参考基因组和/或HMP、MetaHIT项目公开的DACC肠道基因组,进一步地,也可以预先配置包含更多参考序列的资源库,例如依据待测样本来源的个体的状态、地域等因素选择或是测定组装出更接近的序列作为参考序列。根据本发明的一个实施例,确定强直性脊柱炎标志物中的各种微生物包含的组装片段包括:将所述基因集中的组装片段分别与所述各种微生物的参考序列进行比对,确定与一种微生物的参考序列的相似性大于或者等于90%的组装片段来自该种微生物。更严格地,确定与一种微生物的参考序列的相似性大于或者等于95%的组装片段来自该种微生物。
根据本发明的一个实施例,所称依据测序数据,分别确定所述基因集中的各个组装片段的丰度,包括:分别将所述测序数据中的读段比对到所述各个组装片段上,基于获得的比对结果,利用以下公式确定组装片段的丰度:组装片段G的丰度Ab(G)=Ab(UG)+Ab(MG),其中,Ab(UG)=UG/lG,UG为唯一比对上组装片段G的读段数目,lG为组装片段G的长度,
Figure BDA0000944962830000081
MG为非唯一比对上该组装片段G的读段的数目,i表示非唯一比对上该组装片段G的读段的编号,Coi为非唯一比对上组装片段G的读段i对应的丰度系数,
Figure BDA0000944962830000082
N为非唯一比对上该组装片段G的读段比对上的组装片段的总数目,j为非唯一比对上该组装片段G的读段比对上的组装片段的编号,Uj为唯一比对上组装片段j的读段数目。
比对可以利用已知比对软件进行,例如SOAP、BWA和TeraMap等,在比对过程中,一般对比对参数进行设置,设置一个或者一对读段(reads)最多允许有s个碱基错配(mismatch),例如设置s≤2,若reads中有超过s个碱基发生错配,则视为该reads无法比对到(比对上)该组装片段上。所称的获得的比对结果包含各条读段与各组装片段的比对情况,包括读段是否能够比对上某一条或某些组装片段、只唯一比对到一条组装片段还是比对到多条组装片段、比对到组装片段的位置、比对到组装片段的唯一位置还是多个位置等信息。根据本发明的一个实施例,利用SOAPalign 2.21进行比对,设置参数为–r 2–m 100–x1000。reads与基因集比对,比对上的可以被分为两部分:a)唯一比对上一条组装片段的读段,称这些读段为Unique reads(U);b)比对上多个组装片段,称这些读段为Multiplereads(M)。对于给定的组装片段G,即基因集中的基因G,其丰度为Ab(G),与Unique reads和Multiple reads相关,上述公式中的Ab(U)和Ab(M)分别为该组装片段G的Unique reads和Multiple reads的丰度。每个multiple reads,有特有的基因丰度系数Co,假设一条multiple reads比对上N个组装片段,可以利用下列公式计算该条multiple reads的Co:
Figure BDA0000944962830000083
即对于这类multiple reads,把其所比对上的N个基因(即基因集中的组装片段)的unique reads的丰度之和作为分母。
根据本发明的一个实施例,所称的分别依据所述确定的组装片段的丰度,确定所述强直性脊柱炎标志物中的各种微生物的丰度的步骤中,微生物的丰度为该种微生物包含的所有组装片段的丰度的中位数或者平均数。
(2)丰度比较,以确定个体状态。
分别将(1)中确定的强直性脊柱炎标志物中的各种微生物的丰度与其在对照组中的丰度进行比较,依据获得的比较结果确定所述个体的状态,所述对照组由一组或多组相同状态的个体的粪便样本组成,所述状态包括患有强直性脊柱炎状态和健康状态。所称强直性脊柱炎标志物是发明人通过差异比较分析各种肠道微生物在强直性脊柱炎疾病组和健康组的粪便样本中的丰度,以及经过大量已知状态的粪便样本的验证,而确定下来的。
根据本发明的实施例,对照组由多个患强直性脊柱炎的个体的粪便样本组成,该步骤(2)包括:当步骤(1)中确定的强直性脊柱炎标志物中的各种微生物的丰度都与其在对照组中的丰度无差异,确定所述个体的状态为患有强直性脊柱炎。
所称无差异为步骤(1)中确定的强直性脊柱炎标志物中的各种微生物的丰度都落入其在对照组中的丰度的第一预定置信区间。所称的置信区间是指由样本统计量所构造的总体参数的估计区间。在统计学中,一个概率样本的置信区间(Confidence interval)是对这个样本的某个总体参数的区间估计。置信区间展现的是这个参数的真实值有一定概率落在测量结果的周围的程度。置信区间给出的是被测量参数的测量值的可信程度,即前面所要求的“一定概率”。这个概率被称为置信水平。
根据本发明的实施例,所称第一预定置信区间为95%置信区间;当所述强直性脊柱炎标志物中的微生物包括双歧杆菌株Bifidobacterium_pseudocatenulatum_DSM_20438,所述双歧杆菌株Bifidobacterium_pseudocatenulatum_DSM_20438在对照组中的丰度的第一预定置信区间为1.06E-06~6.76E-06,当所述强直性脊柱炎标志物中的微生物包括双歧杆菌Bifidobacterium,所述双歧杆菌Bifidobacterium在对照组中的丰度的第一预定置信区间为9.06E-07~3.22E-06,当所述强直性脊柱炎标志物中的微生物包括梭菌Clostridiales,所述梭菌Clostridiales在对照组中的丰度的第一预定置信区间为1.57E-06~3.21E-06,当所述强直性脊柱炎标志物中的微生物包括产气柯林斯菌株Collinsella_aerofaciens_ATCC_25986,所述产气柯林斯菌株Collinsella_aerofaciens_ATCC_25986在对照组中的丰度的第一预定置信区间为5.63E-07~1.08E-06,当所述强直性脊柱炎标志物中的微生物包括瘤胃球菌株Ruminococcus_5_1_39BFAA,所述瘤胃球菌株Ruminococcus_5_1_39BFAA在对照组中的丰度的第一预定置信区间为1.60E-06~3.11E-06。
根据本发明的实施例,对照组由多个健康个体的粪便样本组成,该步骤(2)包括:当步骤(1)中确定的强直性脊柱炎标志物中的各种微生物的丰度都与其在对照组中的丰度无差异,确定所述个体的状态为没有患强直性脊柱炎。所称无差异为(1)中确定的强直性脊柱炎标志物中的各种微生物的丰度都落入其在对照组中的丰度的第二预定置信区间。
根据本发明的一个实施例,所称的第二预定也取95%的概率,即第二预定置信区间为95%置信区间,当所述强直性脊柱炎标志物中的微生物包括双歧杆菌株Bifidobacterium_pseudocatenulatum_DSM_20438,所述双歧杆菌株Bifidobacterium_pseudocatenulatum_DSM_20438在对照组中的丰度的第二预定置信区间为1.80E-07~5.68E-07,当所述强直性脊柱炎标志物中的微生物包括双歧杆菌Bifidobacterium,所述双歧杆菌Bifidobacterium在对照组中的丰度的第二预定置信区间为6.47E-08~2.60E-07,当所述强直性脊柱炎标志物中的微生物包括梭菌Clostridiales,所述梭菌Clostridiales在对照组中的丰度的第二预定置信区间为4.93E-07~8.20E-07,当所述强直性脊柱炎标志物中的微生物包括产气柯林斯菌株Collinsella_aerofaciens_ATCC_25986,所述产气柯林斯菌株Collinsella_aerofaciens_ATCC_25986在对照组中的丰度的第二预定置信区间为1.07E-07~2.21E-07,当所述强直性脊柱炎标志物中的微生物包括瘤胃球菌株Ruminococcus_5_1_39BFAA,所述瘤胃球菌株Ruminococcus_5_1_39BFAA在对照组中的丰度的第二预定置信区间为6.00E-07~9.32E-07。
需要说明的是,根据目的或要求不同,可能对确定个体状态结果的可信程度有不同的要求,本领域技术人员可以选择不同的显著性水平(α),即选择不同的可能犯错误的概率,如此,确定的个体的状态的可信程度为1-α。例如,利用该实施例确定个体处于所确定出的状态95%是可靠的。
该方法基于检测个体的粪便样本中的强直性脊柱炎标志物中的各种微生物的丰度,分别将检测确定的各种微生物的丰度与其在对照组中丰度进行比较,依据获得的比较结果能够确定个体为强直性脊柱炎个体或者为健康个体的概率。为早期发现强直性脊柱炎提供一种非侵入性的辅助检测或者辅助干预治疗的方法。
以上任一实施例中的利用强直性脊柱炎标志物确定个体的状态的方法的全部或部分步骤,可以利用包含可拆分的相应单元功能模块的装置/系统来施行,或者将方法程序化、存储于机器可读介质,利用机器运行该可读介质来实现。
根据本发明的一个实施方式提供的一种利用上述本发明任一实施例中的强直性脊柱炎标志物确定个体的状态的装置,该装置用以实施上述本发明任一实施例中的利用强直性脊柱炎标志物确定个体的状态的方法的全部或部分步骤,该装置包括:数据输入单元,用于输入数据;数据输出单元,用于输出数据;处理器,用于执行可执行程序,执行所述可执行程序包括完成上述本发明人一实施例中的确定个体的状态的方法;存储单元,与所述数据输入单元、所述数据输出单元和所述处理器相连,用于存储数据,其中包括所述可执行程序。上述对本发明任一实施例中的利用强直性脊柱炎标志物确定个体的状态的方法的技术特征和优点的描述,同样适用本发明这一方面的装置,在此不再赘述。
根据本发明的一个实施方式提供的一种利用上述本发明任一实施例中的强直性脊柱炎标志物确定个体的状态的系统,该装置用以实施上述本发明任一实施例中的利用强直性脊柱炎标志物确定个体的状态的方法的全部或部分步骤,该系统包括:微生物丰度确定单元,用于确定所述个体的粪便样本中的所述强直性脊柱炎标志物中的各种微生物的丰度;个体状态确定单元,用于分别将来自所述微生物丰度确定单元的所述强直性脊柱炎标志物中的各种微生物的丰度与其在对照组中的丰度进行比较,依据获得的比较结果确定所述个体的状态,所述对照组由一组或多组相同状态的个体的粪便样本组成,所述状态包括患有强直性脊柱炎和不患有强直性脊柱炎。上述对本发明任一实施例中的利用强直性脊柱炎标志物确定个体的状态的方法的技术特征和优点的描述,同样适用本发明这一方面的系统。
根据本发明的实施例,所述微生物丰度确定单元用于进行以下:获得所述个体的粪便样本中的核酸序列的测序数据,所述测序数据包括多个读段;组装所述读段,获得基因集,所述基因集包括多个组装片段,所述基因集中的组装片段为非冗余序列;确定所述强直性脊柱炎标志物中的各种微生物包含的组装片段;依据所述测序数据,分别确定所述基因集中的各个组装片段的丰度,其中包括,分别确定所述强直性脊柱炎标志物中的各种微生物包含的组装片段的丰度;分别依据所述确定的组装片段的丰度,确定所述强直性脊柱炎标志物中的各种微生物的丰度。
根据本发明的实施例,所述确定强直性脊柱炎标志物中的各种微生物包含的组装片段,包括:将所述基因集中的组装片段分别与所述各种微生物的参考序列进行比对,确定与一种微生物的参考序列的相似性大于或者等于90%的组装片段来自该种微生物。
根据本发明的实施例,所述依据测序数据,分别确定所述基因集中的各个组装片段的丰度,包括:分别将所述测序数据中的读段比对到所述各个组装片段上,基于获得的比对结果,利用以下公式确定组装片段的丰度:组装片段G的丰度Ab(G)=Ab(UG)+Ab(MG),其中,Ab(UG)=UG/lG,UG为唯一比对上组装片段G的读段数目,lG为组装片段G的长度,
Figure BDA0000944962830000111
MG为非唯一比对上该组装片段G的读段的数目,i表示非唯一比对上该组装片段G的读段的编号,Coi为非唯一比对上组装片段G的读段i对应的丰度系数,
Figure BDA0000944962830000121
N为非唯一比对上该组装片段G的读段比对上的组装片段的总数目,j为非唯一比对上该组装片段G的读段比对上的组装片段的编号,Uj为唯一比对上组装片段j的读段数目。
根据本发明的实施例,微生物的丰度为该种微生物包含的所有组装片段的丰度的中位数或者平均数。
根据本发明的实施例,所述个体状态确定单元中的对照组包括多个患强直性脊柱炎的个体的粪便样本,所述个体状态确定单元用于进行以下:当来自所述微生物丰度确定单元的所述强直性脊柱炎标志物中的各种微生物的丰度都与其在对照组中的丰度无差异,确定所述个体的状态为患有强直性脊柱炎。
根据本发明的实施例,所述无差异为来自所述微生物丰度确定单元的强直性脊柱炎标志物中的各种微生物的丰度落入其在对照组中的丰度的第一预定置信区间,任选的所述第一预定置信区间为95%置信区间,当所述强直性脊柱炎标志物中的微生物包括双歧杆菌株Bifidobacterium_pseudocatenulatum_DSM_20438,所述双歧杆菌株Bifidobacterium_pseudocatenulatum_DSM_20438在对照组中的丰度的第一预定置信区间为1.06E-06~6.76E-06,当所述强直性脊柱炎标志物中的微生物包括双歧杆菌Bifidobacterium,所述双歧杆菌Bifidobacterium在对照组中的丰度的第一预定置信区间为9.06E-07~3.22E-06,当所述强直性脊柱炎标志物中的微生物包括梭菌Clostridiales,所述梭菌Clostridiales在对照组中的丰度的第一预定置信区间为1.57E-06~3.21E-06,当所述强直性脊柱炎标志物中的微生物包括产气柯林斯菌株Collinsella_aerofaciens_ATCC_25986,所述产气柯林斯菌株Collinsella_aerofaciens_ATCC_25986在对照组中的丰度的第一预定置信区间为5.63E-07~1.08E-06,当所述强直性脊柱炎标志物中的微生物包括瘤胃球菌株Ruminococcus_5_1_39BFAA,所述瘤胃球菌株Ruminococcus_5_1_39BFAA在对照组中的丰度的第一预定置信区间为1.60E-06~3.11E-06。
根据本发明的实施例,所述个体状态确定单元中的对照组包括多个健康个体的粪便样本,所述个体状态确定单元用于进行以下:当来自所述微生物丰度确定单元的所述强直性脊柱炎标志物中的各种微生物的丰度都与其在对照组中的丰度无差异,确定所述个体的状态为没有患强直性脊柱炎。
根据本发明的实施例,所述无差异为来自所述微生物丰度确定单元的强直性脊柱炎标志物中的各种微生物的丰度落入其在对照组中的丰度的第二预定置信区间,任选的所述第二预定置信区间为95%置信区间,当所述强直性脊柱炎标志物中的微生物包括双歧杆菌株Bifidobacterium_pseudocatenulatum_DSM_20438,所述双歧杆菌株Bifidobacterium_pseudocatenulatum_DSM_20438在对照组中的丰度的第二预定置信区间为1.80E-07~5.68E-07,当所述强直性脊柱炎标志物中的微生物包括双歧杆菌Bifidobacterium,所述双歧杆菌Bifidobacterium在对照组中的丰度的第二预定置信区间为6.47E-08~2.60E-07,当所述强直性脊柱炎标志物中的微生物包括梭菌Clostridiales,所述梭菌Clostridiales在对照组中的丰度的第二预定置信区间为4.93E-07~8.20E-07,当所述强直性脊柱炎标志物中的微生物包括产气柯林斯菌株Collinsella_aerofaciens_ATCC_25986,所述产气柯林斯菌株Collinsella_aerofaciens_ATCC_25986在对照组中的丰度的第二预定置信区间为1.07E-07~2.21E-07,当所述强直性脊柱炎标志物中的微生物包括瘤胃球菌株Ruminococcus_5_1_39BFAA,所述瘤胃球菌株Ruminococcus_5_1_39BFAA在对照组中的丰度的第二预定置信区间为6.00E-07~9.32E-07。
根据本发明的另一个实施方式提供的一种利用上述本发明任一实施例的强直性脊柱炎标志物对多个个体进行分类的方法,该方法包括:分别利用上述本发明任一实施例中的确定个体的状态的方法确定各个个体的状态;依据获得的各个个体的状态对各个个体进行分类。该方法能够依据个体的状态的不同区分开多个个体或者区分开多个未知的粪便样本,便于归类、标记管理。另外,上述对本发明任一实施例中的利用强直性脊柱炎标志物确定个体的状态的方法的技术特征和优点的描述,同样适用本发明这一方面的方法,在此不再赘述。
根据本发明的又一个实施方式提供的一种治疗强直性脊柱炎的药物,所述药物能够促使上述本发明任一实施例中的强直性脊柱炎标志物中的各个微生物的丰度减少。所称强直性脊柱炎标志物是发明人通过差异分析各种肠道微生物在强直性脊柱炎疾病组和健康组的粪便样本中的丰度,以及经过大量已知状态的粪便样本的验证,而确定下来的。相较于在健康群体组,所称强直性脊柱炎标志物在强直性脊柱炎疾病组中显著富集,所称显著富集是指与在健康组中的丰度相比,上述强直性脊柱炎标志物所包含的各种微生物在疾病组中的丰度均具有统计意义地高于或者明显地、实质性地高于在健康组中的丰度。能够使其丰度减少的物质能够用于治疗强直性脊柱炎或者益于强直性脊柱炎患者服用,能够使其丰度减少的物质可以作为治疗强直性脊柱炎的药物。
利用这一实施方式的药物或者功能性食品,合理有效地应用确定的强直性脊柱炎微生物标志物,扶持肠道有益菌的生长和/或抑制肠道潜在致病菌,可以阻止肠道屏障的缺损,改善并恢复肠道微生态结构,对于辅助降低血内毒素水平和/或减轻强直性脊柱炎的临床症状具有重要意义。
根据本发明的又一个实施方式,提供一种制备或筛选上述实施方式中的治疗强直性脊柱炎的药物的方法,该方法包括制备或者筛选能够促使上述本发明任一实施例中的强直性脊柱炎标志物中的各个微生物的丰度减少的物质作为所述药物的步骤。
利用本发明该实施方式中的生产或筛选治疗强直性脊柱炎的药物的方法,通过合理有效地应用确定的强直性脊柱炎生物标志物进行筛选,能够获得能扶持肠道有益菌的生长和/或抑制肠道潜在致病菌的药物,可以阻止肠道屏障的缺损,改善并恢复肠道微生态结构,对于辅助降低血内毒素水平和/或减轻强直性脊柱炎的临床症状具有重要意义。
以下结合具体实施例对本发明的方法和/或装置进行详细的描述。除另有交待,以下实施例中涉及的未特别交待的试剂、序列(接头、标签和引物)、软件及仪器,都是常规市售产品或者开源的,例如购买Illumina的转录组文库构建试剂盒。
以下实施例包括第一阶段和第二阶段,即对应发现阶段和验证阶段。发现阶段包括:基于分析比较83个AS患者以及73个健康对照组的肠道微生物成分及功能改变,以确定物种标志物;验证阶段包括:利用24个AS患者及31个健康对照组验证第一阶段结果的准确性。
实施例1
该示例中,发明人从73个强直性脊柱炎患者、83个健康对照的粪便样品开展整个肠道菌群微生物的关联分析研究描述粪便微生物群落及功能成分特征。总的来说,发明人下载约428.09Gb高质量的测序数据(LC健康人)以及实验测序得到的293Gb高质量测序数据构建了强直性脊柱炎参照基因集,并且和下载的LC基因集、IGC基因集构建一个更加完整的基因集。定量宏基因组分析显示在大量的病人及健康对照组中,23,709个基因呈现显著差异(fdr<0.001)。一大部分的基因可以归类为29个代表细菌物种的基因簇(Metagenomicspecies,MGS),其中大肠患者组中主要富集的是6个MGS,健康组中主要富集的是23个MGS。
1、测序数据的获取
1.1样本收集和DNA提取
强直性脊柱炎患者来自杭州浙江中医药大学附属医院,实验共采集了73个中国强直性脊柱炎患者的粪便样品,其中每个个体的新鲜粪便样品分成200mg/份,共5份,立即-80℃冰箱冷冻保存。
73个中国强直性脊柱炎患者的粪便样品中提取总DNA。苯酚三氯甲烷处理提取DNA方法提取DNA。
1.2构建文库及测序,以及参照数据下载
DNA建库按仪器制造商(Illumina)的操作指南进行。对文库进行PE100bp测序。Illumina HiSeq2000(Illumina,San Diego,CA)平台对73个样品的文库进行测序。每个样本平均产生4.03Gb(sd.±0.64Gb)高质量测序结果,总计293Gb测序数据量。
从EBI下载83个健康中国人的测序数据,accession号:ERP005860。
参照图1的实验流程,鉴定强直性脊柱炎的相关生物标志物,其中省略的步骤或者细节为本领域技术人员所熟知,几个重要步骤介绍如下面步骤所述。
2、生物标志物的鉴定
2.1测序数据的基本处理
1)测序数据经过质控:获得实验集156个样品与验证集55个样品的测序数据以后,对其进行过滤,质控按以下标准进行:a)去除低质量碱基(Q20)大于50%的reads;b)移除大于5个N碱基的reads;c)移除尾部低质量(Q20)和N碱基。丢失成对reads的序列被认为是单条reads用于组装。
2)同样处理下载的健康人数据。
3)LC基因集获自Qin,N.et al.Alterations of the human gut microbiome inliver cirrho sis.Nature 513,59-64(2014).,从ftp://climb.genomics.cn/pub/10.5524/100001_101000/100064/1.GeneCatalogs/IGC.fa.gz下载得到IGC基因集。
2.2获得强直性脊柱炎微生物组基因集
宏基因组生物标志物主体是基因和相对应的功能,因此需要对测序序列进行组装和基因预测,去冗余,构建非冗余参考基因集。用SOAPdenovo软件将所有样品reads组装成contigs(组装片段或者称为重叠群)。最终产生737万contigs(最小片段长度为500bp)。这些contigs总长13.38Gb,N50长度为1,075~40,644bp,平均长度为7,022bp。
为了预测156个样本的每个样本微生物基因,发明人采用人体消化道元基因组学项目(MetaHIT)中的方法。MetaGeneMark程序从预测到14,888,074个长度大于100bp的开放阅读框(ORFs)。预测的ORFs总长为11,136,246,978bp,占contigs总长度的83.20%。通过去除多余ORFs来建立非冗余“AS基因集”,定义配对后序列的一致性(identity)超过95%且序列覆盖度(coverage)超过90%的短ORFs为相同的序列,去除多余ORFs即去冗余,即对于相同的序列随机保留其中一条。最终的非冗余强直性脊柱炎基因集包含1039万个ORFs,平均长度747bp。
下载的基因集为IGC和LC的基因集,IGC基因集包含9,879,896个基因,总长度为7,436,156,055bp,平均长度为753bp;LC基因集包含2,688,468个基因,总长度为2,017,496,337bp,平均长度为750bp。
2.3基因丰度分析
利用SOAPalign 2.21将经2.1步骤处理后的成对的paired-end reads比对(匹配)到2.2中的非冗余参考基因集,参数为–r 2–m 100–x 1000。Reads与非冗余参考基因集比对,可能被分为两部分:a)Unique reads(U):reads只与非冗余基因集中的一个基因比对上;这些reads被定义为unique reads。b)Multiple reads(M):如果reads比对上非冗余基因集中的一个以上的基因,定义为multiple reads。
对于给定的基因G,其丰度为Ab(G),与U reads和M reads相关,丰度的计算方式如下:
Figure BDA0000944962830000161
Ab(U)和Ab(M)分别为该基因G的unique reads和multiple reads的丰度,l表示基因G的长度。每个multiple reads,有特有基因丰度系数Co;假设某一multiple reads比对上N个基因,按以下方法计算该条multiple reads的Co:
Figure BDA0000944962830000162
即对于multiple reads,发明人把其所比对上的N个genes的unique reads丰度之和作为分母。
2.4关联分析/筛选物种标记物
为了研究正常人(83例)与强直性脊柱炎患者(73例)的肠道宏基因组学的相关性,在合并后的基因集中做了一个相关性的研究。基于156个样本以及已经发表的IGC和LC的合并基因集上鉴定不同丰度的基因,通过结合Benjamini Hochberg的多重检验的Wilcoxon秩和检验进行检验。使用阈值(fdr<0.001)发现在健康组和强直性脊柱炎组之间的显著差异基因有23,709个。其中6,238个基因在强直性脊柱炎病人中更富集,17,471个基因在健康组富集。
为了探索及理解与强直性脊柱炎相关的物种标记物,根据丰度表将上述基因进行分组。同个个体中同一物种的基因丰度相似,而不同个体的同一物种基因差异显著,所以同一物种的基因可以通过丰度相关有效聚类。由此产生的簇表示宏基因组物种(MGS)。为了从结构上整体上分析大量的宏基因组数据,减少信息量进行分类描述,首先用所有个体的基因丰度计算不同基因两两斯皮尔曼相关系数,将给定阈值的相关基因聚类(第一次聚类)。将同一物种的基因归为一类,设定了阈值为rho>0.8。
为了矫正第一次分类的部分丢失,进行了第二次聚类分类,这次分类使用的是每个第一聚类获得的簇中相关性最好的前25个基因丰度的平均值。如果平均值之间的斯皮尔曼相关系数大于0.9,就将这两个簇合并。
上面过程用的分别是6,238个强直性脊柱炎病人基因以及17,471健康人群基因。健康人群17,471基因中的5,291基因第一次聚类得53个簇,每个簇包含25-772个基因,第二次聚类形成23个簇,每个簇包含26-1630个基因。强直性脊柱炎患者6,238基因中的2,594个基因第一次聚类成18个簇,每个簇包含26-845个基因,第二次聚类形成5个簇,每个簇包含44-955个基因,如图2所示。
为了证明一个簇中的基因属于一个基因组,即来自相同物种且与MGS分类注释一致,对6006个基因组已知微生物基因组作为参考序列对各簇中的基因进行blat分析,已知微生物基因组来自第三版的NCBI中的有效参考基因组和HMP、MetaHIT的DACC肠道基因组。一个簇中,当blat后有大于90%基因比对到基因组上,比对上的部分占较短ORF的90%,相似度达到95%,将该簇(MGS)分配到该基因组。由此将14个健康和5个强直性脊柱炎MGS归类到菌株水平,如表1所示,表中的前五个为疾病组的5个MGS,其余全部为健康组的MGS。标记基因均匀注释验证了聚类质量,适用于整个MGS基因。
表1
Figure BDA0000944962830000171
Figure BDA0000944962830000181
23,709个显著差异基因部分聚类成28个MGS。其中23个MGS包含健康个体17,471个基因,5个MGS包含强直性脊柱炎患者的6,238个基因。健康人与强直性脊柱炎患者28个MGS的丰度存在显著差异,部分结果如表2所示。
表2
Figure BDA0000944962830000182
Figure BDA0000944962830000191
实施例2
取显著性水平α=0.05,验证结果如表3所示,实施例1确定的显著富集在健康人群中的标志物,部分标志物在验证组中的健康组和疾病组的丰度的差异也具有显著性(P<0.05),如图3所示。
表3
Figure BDA0000944962830000192
Figure BDA0000944962830000201
健康人群中的23个MGS中的6个在验证集得到了高质量的验证(p<0.05),其中有2个注释上了物种,即编号为H_7和H_13的那两个MGS,如表4所示,发明人将该注释上物种的2个MGS进行统计,它们分别为属于拟杆菌中的拟杆菌目(Bacteroidales)和拟杆菌属(Bacteroides)。拟杆菌存在于人体肠道中,主要是帮助分解食物以提供人体所需的营养和能量。
表4
MGS Genes Taxonomic signment Level p
H_7 131 拟杆菌目Bacteroidales Order 0.00771
H_13 85 拟杆菌属Bacteroides Genus 0.0298
强直性脊柱炎患者中的5个MGS在验证集中都得到高质量的验证(p_values<0.05),如表5所示,富集物种分别为双歧杆菌株(Bifidobacterium_pseudocatenulatum_DSM_20438)、瘤胃球菌株(Ruminococcus_5_1_39BFAA)、双歧杆菌(Bifidobacterium)、梭菌(Clostridiales)和产气柯林斯菌株(Collinsella_aerofaciens_ATCC_25986)。瘤胃球菌主要起降解纤维的作用。
表5
Figure BDA0000944962830000202
实施例3
利用45个粪便样本进行样本来源的个体状态的检测。
参照实施例2的方法确定各粪便样本中的表5的五种菌属的丰度,判断各样本中的这五种菌株丰度是否落入实施例2确定出的疾病组或者健康组的95%的置信区间,判定五种菌种的丰度均落入疾病组的对应区间的样本所对应的个体的状态为强直性脊柱炎患者,判定五种菌种的丰度均落入健康组的对应区间的样本所对应的个体的状态为非强直性脊柱炎患者。
能对其中的41个样本进行个体状态判断,而且检测结果显示,对41个样本中的38个样本对应个体的状态的判断,与记录的该样本来源个体的状态一致。
另外,发明人还利用表4中的2个物种作为标志物对大量强直性脊柱炎患者的粪便样本进行状态验证检测,其中利用该示例的方法能判定出状态的与记录的状态95%以上一致。
另外,较佳的,发明人发现对表4和表5中的物种联合检测,例如检测表5中的物种标志物被富集,同时表4中物种标记物不被富集,能够更准确的判断发现强直性脊柱炎患者或易感人群。
在利用标志物治疗强直性脊柱炎的方案中,发明人发现使表5中的物种标志物生长得到抑制或者清除,同时使表4中物种标记物被富集,治疗效果极佳。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
尽管已经示出和描述了本发明的实施例,本领域的普通技术人员可以理解:在不脱离本发明的原理和宗旨的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由权利要求及其等同物限定。

Claims (16)

1.一种强直性脊柱炎标志物,其特征在于,所述标志物包括:
双歧杆菌株Bifidobacterium_pseudocatenulatum_DSM_20438、产气柯林斯菌株Collinsella_aerofaciens_ATCC_25986、双歧杆菌Bifidobacterium、梭菌Clostridiales和瘤胃球菌株Ruminococcus_5_1_39BFAA。
2.权利要求1的强直性脊柱炎标志物在制备诊断强直性脊柱炎的药物中的用途。
3.权利要求1的强直性脊柱炎标志物在制备确定个体患有强直性脊柱炎和不患有强直性脊柱炎的状态的装置中的用途,其特征在于,所述装置包括:
数据输入单元,用于输入数据;
数据输出单元,用于输出数据;
处理器,用于执行可执行程序,执行所述可执行程序包括完成如下方法:
(1)确定所述个体的粪便样本中的所述强直性脊柱炎标志物中的各种微生物的丰度;
(2)分别将(1)中确定的强直性脊柱炎标志物中的各种微生物的丰度与其在对照组中的丰度进行比较,依据获得的比较结果确定所述个体的状态,
所述对照组由一组或多组相同状态的个体的粪便样本组成,
以及
存储单元,所述存储单元与所述数据输入单元、所述数据输出单元和所述处理器相连,用于存储数据,其中包括所述可执行程序。
4.根据权利要求3所述的用途,其特征在于,所述(1)包括:
获得所述个体的粪便样本中的核酸序列的测序数据,所述测序数据包括多个读段;
组装所述读段,获得基因集,所述基因集包括多个组装片段,所述基因集中的组装片段为非冗余序列;
确定所述强直性脊柱炎标志物中的各种微生物包含的组装片段;
依据所述测序数据,分别确定所述基因集中的各个组装片段的丰度,其中包括,分别确定所述强直性脊柱炎标志物中的各种微生物包含的组装片段的丰度;
分别依据所述确定的组装片段的丰度,确定所述强直性脊柱炎标志物中的各种微生物的丰度。
5.根据权利要求4所述的用途,其特征在于,所述确定强直性脊柱炎标志物中的各种微生物包含的组装片段,包括:
将所述基因集中的组装片段分别与所述各种微生物的参考序列进行比对,确定与一种微生物的参考序列的相似性大于或者等于90%的组装片段来自该种微生物。
6.根据权利要求4所述的用途,其特征在于,所述依据测序数据,分别确定所述基因集中的各个组装片段的丰度,包括:
分别将所述测序数据中的读段比对到所述各个组装片段上,
基于获得的比对结果,利用以下公式确定组装片段的丰度:
组装片段G的丰度Ab(G)=Ab(UG)+Ab(MG),其中,
Ab(UG)=UG/lG,UG为唯一比对上组装片段G的读段数目,lG为组装片段G的长度,
Figure FDA0002461141230000021
MG为非唯一比对上该组装片段G的读段的数目,
i表示非唯一比对上该组装片段G的读段的编号,
Coi为非唯一比对上组装片段G的读段i对应的丰度系数,
Figure FDA0002461141230000022
N为非唯一比对上该组装片段G的读段比对上的组装片段的总数目,
j为非唯一比对上该组装片段G的读段比对上的组装片段的编号,
Uj为唯一比对上组装片段j的读段数目。
7.根据权利要求6所述的用途,其特征在于,微生物的丰度为该种微生物包含的所有组装片段的丰度的中位数或者平均数。
8.根据权利要求3所述的用途,其特征在于,所述(2)中的对照组包括多个患强直性脊柱炎的个体的粪便样本,所述(2)包括:
当所述(1)中确定的强直性脊柱炎标志物中的各种微生物的丰度都与其在对照组中的丰度无差异,确定所述个体的状态为患有强直性脊柱炎;所述无差异为所述(1)中确定的强直性脊柱炎标志物中的各种微生物的丰度落入其在对照组中的丰度的第一预定置信区间,所述第一预定置信区间为95%置信区间,
所述双歧杆菌株Bifidobacterium_pseudocatenulatum_DSM_20438在对照组中的丰度的第一预定置信区间为1.06E-06~6.76E-06,
所述双歧杆菌Bifidobacterium在对照组中的丰度的第一预定置信区间为9.06E-07~3.22E-06,
所述梭菌Clostridiales在对照组中的丰度的第一预定置信区间为1.57E-06~3.21E-06,
所述产气柯林斯菌株Collinsella_aerofaciens_ATCC_25986在对照组中的丰度的第一预定置信区间为5.63E-07~1.08E-06,
所述瘤胃球菌株Ruminococcus_5_1_39BFAA在对照组中的丰度的第一预定置信区间为1.60E-06~3.11E-06。
9.根据权利要求3所述的用途,其特征在于,所述(2)中的对照组包括多个健康个体的粪便样本,所述(2)包括:
当所述(1)中确定的强直性脊柱炎标志物中的各种微生物的丰度都与其在对照组中的丰度无差异,确定所述个体的状态为没有患强直性脊柱炎;所述无差异为所述(1)中确定的强直性脊柱炎标志物中的各种微生物的丰度落入其在对照组中的丰度的第二预定置信区间,所述第二预定置信区间为95%置信区间,
所述双歧杆菌株Bifidobacterium_pseudocatenulatum_DSM_20438在对照组中的丰度的第二预定置信区间为1.80E-07~5.68E-07,
所述双歧杆菌Bifidobacterium在对照组中的丰度的第二预定置信区间为6.47E-08~2.60E-07,
所述梭菌Clostridiales在对照组中的丰度的第二预定置信区间为4.93E-07~8.20E-07,
所述产气柯林斯菌株Collinsella_aerofaciens_ATCC_25986在对照组中的丰度的第二预定置信区间为1.07E-07~2.21E-07,
所述瘤胃球菌株Ruminococcus_5_1_39BFAA在对照组中的丰度的第二预定置信区间为6.00E-07~9.32E-07。
10.权利要求1的强直性脊柱炎标志物在制备确定个体患有强直性脊柱炎和不患有强直性脊柱炎状态的系统中的用途,其特征在于,所述系统包括:
微生物丰度确定单元,用于确定所述个体的粪便样本中的所述强直性脊柱炎标志物中的各种微生物的丰度;
个体状态确定单元,用于分别将来自所述微生物丰度确定单元的所述强直性脊柱炎标志物中的各种微生物的丰度与其在对照组中的丰度进行比较,依据获得的比较结果确定所述个体的状态,
所述对照组由一组或多组相同状态的个体的粪便样本组成。
11.权利要求10的用途,其特征在于,所述微生物丰度确定单元用于进行以下步骤:
获得所述个体的粪便样本中的核酸序列的测序数据,所述测序数据包括多个读段;
组装所述读段,获得基因集,所述基因集包括多个组装片段,所述基因集中的组装片段为非冗余序列;
确定所述强直性脊柱炎标志物中的各种微生物包含的组装片段;
依据所述测序数据,分别确定所述基因集中的各个组装片段的丰度,其中包括,分别确定所述强直性脊柱炎标志物中的各种微生物包含的组装片段的丰度;
分别依据所述确定的组装片段的丰度,确定所述强直性脊柱炎标志物中的各种微生物的丰度。
12.权利要求11的用途,其特征在于,所述确定强直性脊柱炎标志物中的各种微生物包含的组装片段,包括:
将所述基因集中的组装片段分别与所述各种微生物的参考序列进行比对,确定与一种微生物的参考序列的相似性大于或者等于90%的组装片段来自该种微生物。
13.权利要求11的用途,其特征在于,所述依据测序数据,分别确定所述基因集中的各个组装片段的丰度,包括:
分别将所述测序数据中的读段比对到所述各个组装片段上,
基于获得的比对结果,利用以下公式确定组装片段的丰度:
组装片段G的丰度Ab(G)=Ab(UG)+Ab(MG),其中,
Ab(UG)=UG/lG,UG为唯一比对上组装片段G的读段数目,lG为组装片段G的长度,
Figure FDA0002461141230000041
MG为非唯一比对上该组装片段G的读段的数目,
i表示非唯一比对上该组装片段G的读段的编号,
Coi为非唯一比对上组装片段G的读段i对应的丰度系数,
Figure FDA0002461141230000042
N为非唯一比对上该组装片段G的读段比对上的组装片段的总数目,
j为非唯一比对上该组装片段G的读段比对上的组装片段的编号,
Uj为唯一比对上组装片段j的读段数目。
14.根据权利要求13所述的用途,其特征在于,所述微生物的丰度为该种微生物包含的所有组装片段的丰度的中位数或者平均数。
15.根据权利要求10所述的用途,其特征在于,所述个体状态确定单元中的对照组包括多个患强直性脊柱炎的个体的粪便样本,所述个体状态确定单元用于进行以下步骤:
当来自所述微生物丰度确定单元的所述强直性脊柱炎标志物中的各种微生物的丰度都与其在对照组中的丰度无差异,确定所述个体的状态为患有强直性脊柱炎;
所述无差异为来自所述微生物丰度确定单元的强直性脊柱炎标志物中的各种微生物的丰度落入其在对照组中的丰度的第一预定置信区间,所述第一预定置信区间为95%置信区间,
所述双歧杆菌株Bifidobacterium_pseudocatenulatum_DSM_20438在对照组中的丰度的第一预定置信区间为1.06E-06~6.76E-06,
所述双歧杆菌Bifidobacterium在对照组中的丰度的第一预定置信区间为9.06E-07~3.22E-06,
所述梭菌Clostridiales在对照组中的丰度的第一预定置信区间为1.57E-06~3.21E-06,
所述产气柯林斯菌株Collinsella_aerofaciens_ATCC_25986在对照组中的丰度的第一预定置信区间为5.63E-07~1.08E-06,
所述瘤胃球菌株Ruminococcus_5_1_39BFAA在对照组中的丰度的第一预定置信区间为1.60E-06~3.11E-06。
16.根据权利要求10所述的用途,其特征在于,所述个体状态确定单元中的对照组包括多个健康个体的粪便样本,所述个体状态确定单元用于进行以下步骤:
当来自所述微生物丰度确定单元的所述强直性脊柱炎标志物中的各种微生物的丰度都与其在对照组中的丰度无差异,确定所述个体的状态为没有患强直性脊柱炎;所述无差异为来自所述微生物丰度确定单元的强直性脊柱炎标志物中的各种微生物的丰度落入其在对照组中的丰度的第二预定置信区间,所述第二预定置信区间为95%置信区间,
所述双歧杆菌株Bifidobacterium_pseudocatenulatum_DSM_20438在对照组中的丰度的第二预定置信区间为1.80E-07~5.68E-07,
所述双歧杆菌Bifidobacterium在对照组中的丰度的第二预定置信区间为6.47E-08~2.60E-07,
所述梭菌Clostridiales在对照组中的丰度的第二预定置信区间为4.93E-07~8.20E-07,
所述产气柯林斯菌株Collinsella_aerofaciens_ATCC_25986在对照组中的丰度的第二预定置信区间为1.07E-07~2.21E-07。
CN201610158147.2A 2016-03-18 2016-03-18 强直性脊柱炎标志物及应用 Active CN105671177B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610158147.2A CN105671177B (zh) 2016-03-18 2016-03-18 强直性脊柱炎标志物及应用

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610158147.2A CN105671177B (zh) 2016-03-18 2016-03-18 强直性脊柱炎标志物及应用

Publications (2)

Publication Number Publication Date
CN105671177A CN105671177A (zh) 2016-06-15
CN105671177B true CN105671177B (zh) 2020-06-23

Family

ID=56311030

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610158147.2A Active CN105671177B (zh) 2016-03-18 2016-03-18 强直性脊柱炎标志物及应用

Country Status (1)

Country Link
CN (1) CN105671177B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108148906A (zh) * 2018-02-23 2018-06-12 古洁若 一种强直性脊柱炎肠道微生物标志物及其应用
CN114703269A (zh) * 2021-12-31 2022-07-05 上海锐翌医学检验实验室有限公司 慢性阻塞性肺病标志基因及其应用

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2002007741A1 (en) * 2000-07-25 2002-01-31 Borody Thomas J Probiotic recolonisation therapy
CN105296590A (zh) * 2015-09-30 2016-02-03 上海锐翌生物科技有限公司 大肠癌标志物及其应用

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2002007741A1 (en) * 2000-07-25 2002-01-31 Borody Thomas J Probiotic recolonisation therapy
CN105296590A (zh) * 2015-09-30 2016-02-03 上海锐翌生物科技有限公司 大肠癌标志物及其应用

Also Published As

Publication number Publication date
CN105671177A (zh) 2016-06-15

Similar Documents

Publication Publication Date Title
CN107217089B (zh) 确定个体状态的方法及装置
CN107217088B (zh) 强直性脊柱炎微生物标志物
CN105296590A (zh) 大肠癌标志物及其应用
WO2014019180A1 (zh) 确定异常状态生物标记物的方法及系统
CN105132518A (zh) 大肠癌标志物及其应用
CN110838365A (zh) 肠易激综合症相关菌群标志物及其试剂盒
CN113913490B (zh) 非酒精性脂肪肝标志微生物及其应用
CN114182007B (zh) 白塞病标志基因及其应用
CN109072306A (zh) 分离的核酸及应用
CN105671177B (zh) 强直性脊柱炎标志物及应用
CN116656851B (zh) 一种生物标志物及其在慢性阻塞性肺疾病诊断方面的应用
CN107217086B (zh) 疾病标志物及应用
CN105733988B (zh) 组合物及应用
CN109072278A (zh) 分离的核酸及应用
CN114836508A (zh) 慢性阻塞性肺病标志微生物及其应用
CN114381493A (zh) 炎症性肠病标志微生物及其应用
CN113999922A (zh) 急性腹泻标志微生物及其应用
CN113930479B (zh) 系统性红斑狼疮标志微生物及其应用
CN114317784B (zh) 白塞病标志微生物及其应用
CN114517235A (zh) 肌痛性脑脊髓炎标志基因及其应用
CN114317718A (zh) 类风湿性关节炎标志ko及其应用
CN114317717A (zh) 儿童克罗恩病标志基因及其应用
CN114292933A (zh) 格雷夫斯病标志基因及其应用
CN114317674A (zh) 类风湿性关节炎标志微生物及其应用
CN114292932A (zh) 慢性传输便秘标志ko及其应用

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information

Address after: Room 202-3 and 302, Building No. 138, Xinjunhuan Road, Minhang District, Shanghai, 20114

Applicant after: SHANGHAI RUIYI BIOTECHNOLOGY CO., LTD.

Address before: Room 119, 1st floor, 3058 Pusan Road, Pudong New Area, Shanghai 200050

Applicant before: SHANGHAI RUIYI BIOTECHNOLOGY CO., LTD.

CB02 Change of applicant information
GR01 Patent grant
GR01 Patent grant