CN114292932A - 慢性传输便秘标志ko及其应用 - Google Patents

慢性传输便秘标志ko及其应用 Download PDF

Info

Publication number
CN114292932A
CN114292932A CN202111666825.3A CN202111666825A CN114292932A CN 114292932 A CN114292932 A CN 114292932A CN 202111666825 A CN202111666825 A CN 202111666825A CN 114292932 A CN114292932 A CN 114292932A
Authority
CN
China
Prior art keywords
gene
abundance
chronic
gene cluster
constipation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111666825.3A
Other languages
English (en)
Inventor
郑智俊
秦楠
刘强
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Jinyi Biotechnology Co ltd
Original Assignee
Shanghai Jinyi Biotechnology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Jinyi Biotechnology Co ltd filed Critical Shanghai Jinyi Biotechnology Co ltd
Priority to CN202111666825.3A priority Critical patent/CN114292932A/zh
Publication of CN114292932A publication Critical patent/CN114292932A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明提出了一种慢性传输便秘标志KO及其应用,该慢性传输便秘标志KO包括第一基因簇集合,因此,进一步提出了一种试剂盒,包括适于检测第一基因簇集合中的至少一个基因簇的试剂,所述第一基因簇集合由K03205、K03382、K03696、K07138、K11261、K13787和K17898组成。本发明提出的基因簇相较于健康个体,在慢性传输便秘患者群体中显著富集,能够准确区分健康群体和慢性传输便秘患者群体,可以作为检测和/或治疗慢性传输便秘的来源于肠道微生物的KO标志物。

Description

慢性传输便秘标志KO及其应用
技术领域
本发明涉及生物技术领域,具体的,本发明涉及慢性传输便秘标志KO及其应用,更具体的,本发明涉及一种试剂盒、试剂在制备试剂盒中的用途、用于预防或者治疗慢性传输便秘的药物组合物或者食品组合物、确定个体是否患有慢性传输便秘的方法、确定个体是否患有慢性传输便秘的装置、一种装置、一种筛选药物的方法。
背景技术
慢性传输便秘(Slow Transit Constipation,STC)是传输比较慢的一种便秘,由于大肠功能紊乱,传导失常而导致排便周期延长和排便困难,属于慢性、原发性、功能性、结肠性和传输缓慢性便秘。现在医学病理上没有完全明确导致该疾病发生的原因,可能与肠神经系统、中枢神经及自主神经系统调节功能障碍,激素水平异常等有关,目前达成共识的是长期不良的生活习惯,比如居无规律、饮食过于精细、减肥、节食、缺少锻炼导致肠道受刺激不足,排便动作缺乏,粪便在肠腔内滞留时间过久,而形成慢传输型便秘。
KEGG Orthology简称KO,是KEGG数据库中的同源功能基因。该数据库中的每一条记录用K number唯一标识。基于同源基因具有相似功能的假设,把基因的功能进行了扩充。对于某个物种中功能研究的很清楚的基因,在不同的物种间搜寻该基因的同源基因,将这些同源基因定义为一个KEGG Orthology,用该基因的功能作为该KEGG Orthology的功能。
发明内容
本发明旨在至少在一定程度上解决上述技术问题之一或至少提供一种商业选择。
依据本发明的第一方面,提供一种试剂盒,包括适于检测第一基因簇集合中至少一个基因簇的试剂,所述第一基因簇集合由K03205、K03382、K03696、K07138、K11261、K13787和K17898组成。根据本发明具体实施例的试剂盒,可以准确的检测生物样品中是否含有所述第一基因簇集合中的至少一种基因簇,更进一步地,也可以准确区分或诊断慢性传输便秘患者和健康个体。
在本发明的第二方面,本发明提出了试剂在制备试剂盒中的用途,所述试剂适于检测第一基因簇集合中的至少一个基因簇。根据本发明的实施例,所述试剂盒用于诊断慢性传输便秘或检测慢性传输便秘的治疗效果,所述第一基因簇集合由K03205、K03382、K03696、K07138、K11261、K13787和K17898组成。根据本发明具体实施例,所述试剂可以准确的检测第一基因簇集合中的至少一个基因簇,因此,包含所述试剂的所述试剂盒同样可以准确的检测所述第一基因簇集合中的至少一个基因簇,所述试剂盒可用于科学研究,对生物样本中的第一基因簇集合中的至少一个基因簇进行检测;此外,所述试剂盒,可以准确的区分慢性传输便秘患者和健康个体,由此,可以有效的在早期进行慢性传输便秘诊断,或用于检测治疗过程中慢性传输便秘的变化。
在本发明的第三方面,本发明提出了一种用于预防或者治疗慢性传输便秘的药物组合物或者食品组合物。根据本发明的实施例,含有提高所述第二基因簇集合中的至少一个基因簇的丰度的物质,所述第二基因簇集合由K06518和K07444组成。根据本发明实施例的慢性传输便秘标志基因簇中第二基因簇集合的基因簇可以非侵入性的在早期发现或辅助检测慢性传输便秘,确定个体患有慢性传输便秘的概率高低或者个体处于健康状态的概率高低;同时,提高慢性传输便秘高风险人群或已慢性传输便秘患者肠道内微生物的所述第二基因簇集合中的各种基因簇的丰度,可以降低患慢性传输便秘的概率或减缓、治愈慢性传输便秘,因此,所述包含提高所述第二基因簇集合中的至少一种基因簇丰度的药物或者食品组合物能够有效预防或治疗慢性传输便秘。
在本发明的第四方面,本发明提出了一种确定个体是否患有慢性传输便秘的方法。根据本发明的实施例,包括:(1)确定所述个体的粪便样本中标志基因簇的丰度,所述标志基因簇包括第一基因簇集合和第二基因簇集合中的至少一个基因簇;(2)将步骤(1)中得到的所述丰度与预定的阈值进行比较,以便确定所述个体是否患有慢性传输便秘;其中,所述第一基因簇集合由K03205、K03382、K03696、K07138、K11261、K13787和K17898组成;所述第二基因簇集合由K06518和K07444组成。根据本发明实施例的方法可以依据个体的粪便样本中的所述标志基因簇的丰度确定个体是否患有慢性传输便秘,所述标志基因簇是发明人对大量已知状态的粪便样本进行验证,通过差异比较分析各种肠道微生物的基因在慢性传输便秘组和健康组粪便样本中的丰度并对所述基因进行KEGG分析,而确定下来的。
在本发明的第五方面,本发明提出了一种确定个体是否患有慢性传输便秘的装置。根据本发明的实施例,包括:丰度确定单元,用于确定所述个体的粪便样本中标志基因簇的丰度,所述标志基因簇包括第一基因簇集合和第二基因簇集合中的至少一个基因簇;比较单元,用于将所得到的所述丰度与预定的阈值进行比较,以便确定所述个体是否患有慢性传输便秘;其中,所述第一基因簇集合由K03205、K03382、K03696、K07138、K11261、K13787和K17898组成;所述第二基因簇集合由K06518和K07444组成。所述标志基因簇是发明人通过差异比较分析各种肠道基因在慢性传输便秘患者和健康人群的粪便样本中的丰度后对肠道基因进行KEGG分析,并经过大量已知状态的粪便样本的验证而确定下来的,根据本发明实施例的装置可以准确确定个体是否为慢性传输便秘的高风险人群或慢性传输便秘患者。
在本发明的第六方面,本发明提出了一种装置。根据本发明的实施例,包括:计算机可读存储介质,其上存储有计算机程序,所述程序用于执行第四方面所述的方法;以及一个或者多个处理器,用于执行所述计算机可读存储介质中的程序。根据本发明实施例的装置可以准确确定个体是否为慢性传输便秘的高风险人群或慢性传输便秘患者。
在本发明的第七方面,本发明提出了一种筛选药物的方法。根据本发明的实施例,所述药物用于治疗或者预防慢性传输便秘,所述方法包括:将候选药物施用于受试者,检测施用前后,所述受试者粪便中标志基因簇的丰度,所述标志基因簇包括第一基因簇集合和第二基因簇集合中的至少一个基因簇,其中,满足下列条件至少之一的候选药物适于用于治疗或者预防慢性传输便秘:(1)进行所述施用后,所述第一基因簇集合中的至少一个基因簇的所述丰度降低;和(2)进行所述施用后,所述第二基因簇集合中的至少一个基因簇的所述丰度升高;其中,所述第一基因簇集合由K03205、K03382、K03696、K07138、K11261、K13787和K17898组成;所述第二基因簇集合由K06518和K07444组成。根据本发明实施例的方法可以生产或筛选出降低所述标志基因簇中第一基因簇集合中各个基因簇丰度,和/或升高肠道标志基因簇中第二基因簇集合中的各种基因簇丰度的药物,对于辅助减轻慢性传输便秘的临床症状具有重要意义。
附图说明
本发明的上述和/或附加的方面和优点从结合下面附图对实施方式的描述中将变得明显和容易理解,其中:
图1是本发明的实施例中的筛选鉴定慢性传输便秘标志KO的试验分析流程示意图。
图2是本发明的实施例中的标志基因作为诊断指标的AUC评价结果示意图,其中,Specificity表示特异度,即预测为阳性且实际为阳性,真阳性,纵坐标Sensitivity表示敏感度,即真阴性,CI(Confidence interval)表示置信区间:
2-A为第一期90个样品数据ROC曲线下AUC值和置信区间结果图;
2-B为第二期28个样品数据ROC曲线下AUC值和置信区间结果图。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中,自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能理解为对本发明的限制。需要说明的,本文中所使用的术语“第一”或者“第二”等仅为方便描述,不能理解为指示或暗示相对重要性,也不能理解为之间有先后顺序关系。
在本发明的描述中,除非另有说明,“多个”的含义是两个或两个以上。在本文中,除非另有明确的规定和限定,术语“相连”、“连接”等术语应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。
生物学标志物是从生物学介质中可以检测到的细胞、生物化学或分子改变。生物学介质包括各种体液、组织、细胞、粪便、头发、呼气等。
本文中,所称的某种“基因的丰度”指基因组中该基因的拷贝数量,基因丰度高也即这个基因的数量多。例如在肠道微生物群体基因组中该种基因的拷贝数量,可表示为该种基因在该群体中的含量。
本文中,所称“KEGG Orthology”,简称KO,指的是KEGG数据库中的同源功能基因集合。KEGG数据库中的每一条记录用K number唯一标识,如本申请第一基因簇集合中的K03205是该数据库中唯一存在的,可以通过其代码在KEGG数据库中查询其具体信息。基于同源基因具有相似功能的假设,把基因的功能进行了扩充。对于某个物种中功能研究的很清楚的基因,在不同的物种间搜寻该基因的同源基因,将这些同源基因定义为一个KEGGOrthology,用该基因的功能作为该KEGG Orthology的功能。
本文中,所称“基因簇”,即KO,指的是KEGG数据库中的同源功能基因集合。
本文中,所述“基因簇集合”是指上述“基因簇”的集合。
根据本发明的一个实施方式提供的一种试剂盒,包括适于检测第一基因簇集合中的至少一个基因簇的试剂,所述第一基因簇集合由K03205、K03382、K03696、K07138、K11261、K13787和K17898组成。
根据本发明的一个具体的实施方案,所述试剂盒进一步包括适于检测第二基因簇集合中的至少一个基因簇的试剂,所述第二基因簇集合由K06518和K07444组成。
根据本发明的具体实施例,所述试剂盒包括适于检测所述第一基因簇集合中全部所述基因簇的试剂。
根据本发明的具体实施例,所述试剂盒包括适于检测所述第二基因簇集合中全部所述基因簇的试剂。
根据本发明的具体实施例,所述标志基因簇是发明人通过对大量患慢性传输便秘个体和大量健康个体的粪便样本中的微生物基因的丰度进行KEGG分析、差异比较分析,以及在已知状态的大量个体中进行验证,而确定下来的,明确了肠道的微生物中慢性传输便秘相关的标志基因簇。利用包含检测所述标志基因簇的试剂的试剂盒能够准确检测生物样品中是否含有所述基因簇,更进一步地,也可以准确确定个体处于患有慢性传输便秘状态的概率高低或者处于健康状态的概率高低,能够用于非侵入性的早期发现或辅助检测慢性传输便秘。
根据本发明的具体实施例,所述适于检测所述第一基因簇集合或第二基因簇集合的试剂不受特别限制,任何可以直接或间接检测所述标志基因簇中任何一个基因簇的丰度的试剂均包含在本发明的范围内,如:利用PCR技术、高通量测序等方法直接进行检测时使用的试剂,或通过Western Blot技术检测所述基因对应的蛋白的含量间接获得所述基因簇丰度时所使用的试剂等。
根据本发明提供的试剂在制备试剂盒中的用途,所述试剂适于检测第一基因簇集合中的至少一个基因簇,所述试剂盒用于诊断慢性传输便秘或者检测慢性传输便秘的治疗效果,所述第一基因簇集合由K03205、K03382、K03696、K07138、K11261、K13787和K17898组成。
根据本发明的具体实施例,所述标志基因簇是发明人通过对大量患慢性传输便秘个体和大量健康对照个体的粪便样本中的微生物的基因的丰度进行KEGG分析后,对获得的KO标志物进行差异比较分析,以及对大量已知状态的个体进行验证,而确定下来的,明确了肠道的微生物中慢性传输便秘相关的标志基因簇(标志KO)。利用检测所述标志基因的试剂能够确定个体患有慢性传输便秘的概率高低或者处于健康状态的概率高低,能够用于非侵入性的早期发现或辅助检测慢性传输便秘。
根据本发明一些具体的实施例,所述试剂进一步适于检测第二基因簇集合中的至少一个基因簇,所述第二基因簇集合由K06518和K07444组成。
根据本发明的具体实施例,所述适于检测所述第一基因簇集合或第二基因簇集合的试剂不受特别限制,任何可以直接或间接检测所述标志基因的丰度的试剂均包含在本发明的范围内,如:利用PCR技术、高通量测序等方法直接进行检测时使用的试剂,或通过Western Blot技术检测所述基因对应的蛋白的含量间接获得所述基因簇丰度时所使用的试剂等。
根据本发明提供的一种用于预防或者治疗慢性传输便秘的药物组合物或者食品组合物,含有提高第二基因簇集合中的至少一个基因簇丰度的物质,所述第二基因簇集合由K06518和K07444组成。
上述标志基因是发明人通过差异比较分析各种肠道基因在慢性传输便秘疾病组和健康组的粪便样本中的丰度后,对其进行KEGG分析,并经过大量已知状态的粪便样本的验证,而确定下来的。所述标志基因簇中的第二基因簇集合中的基因簇相较于慢性传输便秘患者群体,在健康群体组中显著富集,所述显著富集是指与在慢性传输便秘患者组中的丰度相比,上述基因簇在健康组中的丰度均具有统计意义地高于或者明显地、实质性地高于在慢性传输便秘患者组中的丰度;能够使该部分基因簇丰度提高的物质能够用于治疗慢性传输便秘或者益于慢性传输便秘患者服用,所述物质不受特别限制,能够使其丰度提高的物质包括但不限于治疗慢性传输便秘的药物和有益于治疗或缓解慢性传输便秘的功能性食品。因此,该实施例提供的能够使所述第二基因簇集合中的基因簇丰度提高的物质能够用于制备治疗慢性传输便秘的药物和/或用于制备益于治疗或缓解慢性传输便秘的功能性食品、保健药等,所述药物或食品可有效治疗或缓解慢性传输便秘。
根据本发明提供的一种确定个体是否患有慢性传输便秘的方法,包括步骤(1)和(2)。
(1)确定所述个体的粪便样本中的标志基因簇的丰度。
所述标志基因包括第一基因簇集合和第二基因簇集合中的至少一个基因簇。其中,所述第一基因簇集合由以下基因组成:C03_GI_0051440、C03_GI_0051466、C05_GI_0017028、C50_GI_0345131、C64_GI_0032728、G38_GI_0125251,其中,所述第一基因簇集合由K03205、K03382、K03696、K07138、K11261、K13787和K17898组成;所述第二基因簇集合由K06518和K07444组成。
根据本发明的一些具体的实施例,步骤(1)进一步包括:获得所述个体的粪便样本中的核酸测序数据;将所述测序数据与参考基因组进行比对;基于所述比对的结果,确定基因的丰度;基于所述基因的丰度,以获得所述标志基因簇的丰度。
根据本发明的具体实施例,在步骤(1)中,按照下列公式确定所述基因的丰度:Ab(G)=Ab(UG)+Ab(MG),其中,G表示基因的编号,Ab(G)表示基因G的丰度,Ab(UG)表示所述测序数据与所述基因G的参考序列唯一比对的读段的丰度,Ab(MG)表示所述测序数据与所述基因G的参考序列非唯一比对读段的丰度;Ab(UG)=UG/lG,其中,UG表示所述测序数据中与所述基因G的参考基因唯一比对的读段数目,lG表示所述基因G的参考基因长度;
Figure BDA0003451347590000051
其中,MG为所述测序数据中与所述基因G的参考基因非唯一比对的读段的数目,i表示所述非唯一比对读段的编号,Coi为所述第i读段对应的丰度系数;
Figure BDA0003451347590000052
其中,Coi,G表示针对所述标志基因G,所述非唯一比对的读段i的丰度系数,N为所述非唯一比对的读段i能够比对的基因的总数,j表示所述非唯一比对的读段i能够比对的基因的编号。上述丰度确定公式,基于比对结果中的唯一和非唯一比对上组装序列的读段对该组装序列的丰度的贡献情况,充分利用测序数据的同时确定的丰度十分准确。
所述的测序数据通过对样本中的核酸序列进行测序得来,测序依据所选的测序平台的不同,可选择但不限于半导体测序技术平台比如PGM、Ion Proton、BGISEQ-100平台,合成边测序的技术平台,比如Illumina公司的Hiseq、Miseq序列平台以及单分子实时测序平台,比如PacBio序列平台。测序方式可以选择单端测序,也可以选择双末端测序,获得的下机数据是测读出来的片段,称为读段(reads)。
比对可以利用已知比对软件进行,例如SOAP、BWA和TeraMap等,在比对过程中,一般对比对参数进行设置,设置一个或者一对读段(reads)最多允许有s个碱基错配(mismatch),例如设置s≤2,若reads中有超过s个碱基发生错配,则视为该reads无法比对到(比对上)该组装片段上。所述的获得的比对结果包含各条读段与各参考基因的比对情况,包括读段是否能够比对上某个或某些基因的参考序列、只唯一比对到一种基因还是比对到多种基因的参考序列、比对到基因组的位置、比对到基因组的唯一位置还是多个位置等信息。
reads与参考基因组比对,比对上的可以被分为两部分:a)Unique reads(U):唯一比对上一个基因的序列;称这些reads为unique reads。即,如果reads比对上的序列均来自同一基因,定义这些reads为unique reads;b)Multiple reads(M):比对上一个以上基因的序列,定义为multiple reads。即,如果reads比对上的序列来自至少两种基因,定义这些reads为multiple reads。
所述参考基因组指预先确定的该基因的序列,可以是预先获得的待测样本所属或者所包含的生物类别的任意参考模板,例如,目标是待测样本中的基因,参考序列可选择NCBI数据库中的各种基因的参考序列,进一步地,也可以预先配置包含更多参考序列的资源库,例如依据待测样本来源的个体的状态、地域等因素选择或是测定组装出更接近的序列作为参考序列。根据本发明的一个实施例,各种基因的参考基因是由发明人进行构建的。
根据本发明的具体实施例,在步骤(1)中,基于所述基因的丰度,按照下列公式确定所述基因簇的丰度:
Figure BDA0003451347590000061
其中,
Ab(KOy)表示第y个KO(基因簇)的丰度,
Ab(Gx)表示第x个基因的丰度。
(2)丰度比较,以确定个体是否患有慢性传输便秘。
根据本发明的一个实施例,将步骤(1)中得到的所述丰度与预定的阈值进行比较,以便确定所述个体是否患有慢性传输便秘。
根据本发明的一些具体实施例,所述阈值为预先设定的。将标志物中的各种基因簇在对健康个体以及患病个体中的丰度预先测定保存,用以作为设定阈值的依据。所述阈值可以为一数值或者数值范围,基于已知患病或健康状态个体中的标志基因的丰度均值,该基因簇对应的阈值可以设为该基因簇丰度均值的95%的置信区间(Confidenceinterval)。
所述的置信区间是指由样本统计量所构造的总体参数的估计区间。在统计学中,一个概率样本的置信区间是对这个样本的某个总体参数的区间估计。置信区间展现的是这个参数的真实值有一定概率落在测量结果的周围的程度。置信区间给出的是被测量参数的测量值的可信程度,即前面所要求的“一定概率”,这个概率被称为置信水平。
根据本发明的一些具体实施例,当步骤(1)中确定的标志基因簇的丰度达到所述患慢性传输便秘丰度阈值,未达到所述不患慢性传输便秘丰度阈值时,确定所述个体患有慢性传输便秘,当(1)中确定的标志基因簇的丰度达到不患慢性传输便秘丰度阈值,未达到患慢性传输便秘丰度阈值时,确定所述个体不患慢性传输便秘。
需要说明的是,根据目的或要求不同,可能对确定个体状态结果的可信程度有不同的要求,本领域技术人员可以选择不同的显著性水平或阈值。
该方法基于检测个体的粪便样本中的标志基因簇中的各种基因簇的丰度,分别将检测确定的各种基因簇的丰度与其阈值进行比较,依据获得的比较结果能够确定个体为慢性传输便秘个体或者为健康个体的概率。为早期发现慢性传输便秘提供一种非侵入性的辅助检测或者辅助干预治疗的方法。
以上任一实施例中的利用标志基因簇确定个体是否患有慢性传输便秘的方法的全部或部分步骤,可以利用包含可拆分的相应单元功能模块的装置/系统来施行,或者将方法程序化、存储于机器可读介质,利用机器运行该可读介质来实现。
根据本发明提供的一种确定个体是否患有慢性传输便秘的装置,该装置包括:丰度确定单元,用于确定所述个体的粪便样本中标志基因簇的丰度,所述标志基因包括第一基因簇集合和第二基因簇集合中的至少一个基因簇;比较单元,用于将所得到的所述丰度与预定的阈值进行比较,以便确定所述个体是否患有慢性传输便秘;其中,所述第一基因簇集合由K03205、K03382、K03696、K07138、K11261、K13787和K17898组成;所述第二基因簇集合由K06518和K07444组成。上述对本发明任一实施例的利用标志基因簇确定个体是否患有慢性传输便秘的方法的技术特征和优点的描述,同样适用本发明这一方面的装置,在此不再赘述。
根据本发明的实施例,所述丰度确定单元适于通过下列步骤确定所述丰度:获得所述个体的粪便样本中的核酸测序数据;将所述测序数据与参考基因组进行比对;基于所述比对的结果,确定基因的丰度;基于所述基因的丰度,确定所述标志基因簇的丰度。
所述的测序数据通过对样本中的核酸序列进行测序得来,测序依据所选的测序平台的不同,可选择但不限于半导体测序技术平台比如PGM、Ion Proton、BGISEQ-100平台,合成边测序的技术平台,比如Illumina公司的Hiseq、Miseq序列平台以及单分子实时测序平台,比如PacBio序列平台。测序方式可以选择单端测序,也可以选择双末端测序,获得的下机数据是测读出来的片段,称为读段(reads)。
比对可以利用已知比对软件进行,例如SOAP、BWA和TeraMap等,在比对过程中,一般对比对参数进行设置,设置一个或者一对读段(reads)最多允许有s个碱基错配(mismatch),例如设置s≤2,若reads中有超过s个碱基发生错配,则视为该reads无法比对到(比对上)该组装片段上。所述的获得的比对结果包含各条读段与各参考基因的比对情况,包括读段是否能够比对上某个或某些基因的参考序列、只唯一比对到一种基因还是比对到多种基因的参考序列、比对到基因组的位置、比对到基因组的唯一位置还是多个位置等信息。
reads与参考基因组比对,比对上的可以被分为两部分:a)Unique reads(U):唯一比对上一个基因的序列;称这些reads为unique reads。即,如果reads比对上的序列均来自同一基因,定义这些reads为unique reads;b)Multiple reads(M):比对上一个以上基因的序列,定义为multiple reads。即,如果reads比对上的序列来自至少两种基因,定义这些reads为multiple reads。
所述参考基因组指预先确定的该基因的序列,可以是预先获得的待测样本所属或者所包含的生物类别的任意参考模板,例如,目标是待测样本中的基因,参考序列可选择NCBI数据库中的各种基因的参考序列,进一步地,也可以预先配置包含更多参考序列的资源库,例如依据待测样本来源的个体的状态、地域等因素选择或是测定组装出更接近的序列作为参考序列。根据本发明的一个实施例,各种基因的参考基因是由发明人进行构建的。
根据本发明的一个实施例,按照下列公式确定所述标志基因的丰度:Ab(G)=Ab(UG)+Ab(MG),其中,G表示基因的编号,Ab(G)表示基因G的丰度,Ab(UG)表示所述测序数据与所述基因G的参考序列唯一比对的读段的丰度,Ab(MG)表示所述测序数据与所述基因G的参考序列非唯一比对读段的丰度;Ab(UG)=UG/lG,其中,UG表示所述测序数据中与所述基因G的参考基因唯一比对的读段数目,lG表示所述基因G的参考基因长度;
Figure BDA0003451347590000081
其中,MG为所述测序数据中与所述基因G的参考基因非唯一比对的读段的数目,i表示所述非唯一比对读段的编号,Coi为所述第i读段对应的丰度系数;
Figure BDA0003451347590000082
其中,Coi,G表示针对所述标志基因G,所述非唯一比对的读段i的丰度系数,N为所述非唯一比对的读段i能够比对的基因的总数,j表示所述非唯一比对的读段i能够比对的基因的编号。基于比对结果中的唯一和非唯一比对上组装序列的读段对该组装序列的丰度的贡献情况,充分利用测序数据的同时确定的丰度十分准确。
根据本发明的一个实施例,基于上述基因的丰度,按照下列公式确定所述标志基因簇的丰度:
Figure BDA0003451347590000083
其中,Ab(KOy)表示第y个KO(基因簇)的丰度,Ab(Gx)表示第x个基因的丰度。
上述对本发明任一实施例的利用标志基因确定个体是否患有慢性传输便秘的方法的技术特征和优点的描述,同样适用本发明这一方面的装置,在此不再赘述。
根据本发明的又一个实施例提供的一种装置,包括:计算机可读存储介质,其上存储有计算机程序,所述程序用于执行前面所述的一种确定个体是否患有慢性传输便秘方法;以及一个或者多个处理器,用于执行所述计算机可读存储介质中的程序。
根据本发明的又一个实施例提供的一种筛选药物的方法,所述药物用于治疗或者预防慢性传输便秘,所述方法包括:将候选药物施用于受试者,检测施用前后,所述受试者粪便中标志基因簇的丰度,所述标志基因簇包括第一基因簇集合和第二基因簇集合中的至少一个基因簇,其中,满足下列条件至少之一的候选药物适于用于治疗或者预防慢性传输便秘:(1)进行所述施用后,所述第一基因簇集合中的至少一种基因簇的所述丰度降低;和(2)进行所述施用后,所述第二基因簇集合中的至少一种基因簇的所述丰度升高;其中,所述第一基因簇集合由K03205、K03382、K03696、K07138、K11261、K13787和K17898组成;所述第二基因簇集合由K06518和K07444组成。
利用本发明这一方面的生产或筛选治疗慢性传输便秘的药物的方法,通过合理有效地应用确定的慢性传输便秘标志基因簇进行筛选,能够获得提高肠道微生物的有益基因簇的丰度和/或降低肠道微生物潜在的致病基因簇的丰度的药物。
以下结合具体实施例对本发明的方法和/或装置进行详细的描述。除另有交待,以下实施例中涉及的未特别交待的试剂、序列、软件及仪器,都是常规市售产品。
以下实施例包括第一阶段和第二阶段,即对应发现阶段和验证阶段。发现阶段包括:基于分析比较40个慢性传输便秘患者及50个健康个体的肠道微生物基因成分及功能改变,以确定KO标志物;验证阶段包括:利用12个慢性传输便秘患者及16个健康个体验证第一阶段结果的准确性。
实施例1生物标志物的鉴定
该实施例中,发明人从40个慢性传输便秘患者、50个健康个体的粪便样品开展整个肠道菌群微生物基因、代谢物的关联分析研究描述粪便微生物群落及功能成分特征。总的来说,发明人通过实验测序得到的1584.5Gb高质量测序数据。经过高通量测序及KEGG分析,发明人得到9个与慢性传输便秘疾病密切相关的微生物KO标志物,其中,7个KO标志物在慢性传输便秘病人的肠道微生物中富集,2个KO标志物在健康人的肠道微生物中富集。
1、测序数据的获取
1.1样本收集和DNA提取
实验共采集了40个中国慢性传输便秘患者和50个健康人的粪便样品,慢性传输便秘患者来自于同济大学附属第十人民医院,健康个体来自同济大学附属第十人民医院,其中,每个个体的新鲜粪便样品分成200mg/份,共5份,立即-80℃冰箱冷冻保存。苯酚三氯甲烷处理提取DNA方法提取DNA,具体的实验操作为常规操作。
1.2构建文库及测序,以及参照数据下载
DNA建库按仪器制造商(Illumina)的操作指南进行。对文库进行PE2*150bp测序。Illumina HiSeq2500(Illumina,San Diego,CA)平台对上述90个样品的文库进行测序。每个样本平均产生13.428Gb高质量测序结果。
参照图1的实验流程,鉴定慢性传输便秘的相关KO标志物,其中省略的步骤或者细节为本领域技术人员所熟知,几个重要步骤介绍如下面步骤所述。
2、生物标志物的鉴定
2.1测序数据的基本处理
测序数据经过质控:获得第一阶段的90个样品的测序数据以后,对其进行过滤,质控按以下标准进行:a)去除低质量碱基(Q20)大于50%的reads;b)移除大于3个N碱基的reads;c)移除10个尾部低质量(Q20)和N碱基。丢失成对reads的序列被认为是单条reads用于组装。
2.2基因丰度分析
利用SOAPalign 2.21将经过上步骤处理的paired-end clean reads比对(匹配)到冗余基因集,这里,所称的冗余基因集来自通过上步骤处理的paired-end clean reads通过组装、预测、基因预测得到的冗余基因集构造的。比对参数为–r2–m100–x1000。reads与冗余基因集进行比对,比对上的可以被分为两部分:a)Unique reads(U):唯一比对上基因集的一个基因;称这些reads为unique reads。即,如果reads只比对上基因集某一个基因,定义这些reads为unique reads。b)Multiple reads(M):比对上基因集的一个以上的基因,定义为multiple reads。即,如果reads比对上至少两个不同的基因,定义这些reads为multiple reads。
对于基因G,其丰度为Ab(G),与特有的U reads和共享的M reads相关,丰度的计算方式如下:
Ab(G)=Ab(UG)+Ab(MG),
其中,G表示基因的编号,Ab(G)表示基因G的丰度,Ab(UG)表示所述测序数据与所述基因G的参考序列唯一比对的读段的丰度,Ab(MG)表示所述测序数据与所述基因G的参考序列非唯一比对读段的丰度;
Ab(UG)=UG/lG
其中,UG表示所述测序数据中与所述基因G的参考基因唯一比对的读段数目,lG表示所述基因G的参考基因长度;
Figure BDA0003451347590000101
其中,MG为所述测序数据中与所述基因G的参考基因非唯一比对的读段的数目,i表示所述非唯一比对读段的编号,Coi为所述第i读段对应的丰度系数;
Figure BDA0003451347590000102
其中,Coi,G表示针对所述标志基因G,所述非唯一比对的读段i的丰度系数,N为所述非唯一比对的读段i能够比对的基因的总数,j表示所述非唯一比对的读段i能够比对的基因的编号。
对于这些reads,发明人以加和的N个基因的unique reads的丰度作为标准。即对于multiple reads,发明人把其所比对上的N个基因的unique reads丰度之和作为分母。
每个样品中计算得到的基因丰度值,全部除以每个样品的丰度总数后,得到归一化后的基因丰度表。
2.3KO丰度表
发明人首先将所有基因和KEGG数据库进行blat比对,通过比对结果得到每个基因对应的KEGG Orthology信息;其次根据属于同一个KEGG Orthology的基因列表,将上一步2.2得到的基因丰度表进行如下处理:属于同一个KEGG Orthology的基因丰度进行累加,从而得到一个KO丰度表,简言之就是将同属于一个KO的基因的丰度进行累加得到KO丰度表,计算公式如下:
Figure BDA0003451347590000103
其中,
Ab(KOy)表示第y个KO(基因簇)的丰度,
Ab(Gx)表示第x个基因的丰度。
2.4关联分析/筛选微生物KO标志物
为了获得与慢性传输便秘疾病密切相关的肠道微生物KO标志物,发明人利用慢性传输便秘患者组(40例)与健康人组(50例)两组肠道微生物KO丰度数据,在KO级别做了一个与疾病相关性的研究。
基于上述步骤2.3得到的KO丰度表,发明人设置标准如下:(1)通过结合BenjaminiHochberg的多重检验的Wilcoxon秩和检验进行检验,得到每个KO标志物和慢性传输便秘人和健康人样本间的相关性p值和q值;(3)使用一个严格的阈值q_values<0.001。然后,发明人得到9个与慢性传输便秘疾病密切相关的肠道微生物基因。其中在慢性传输便秘(STC)患者中富集的有7个基因,在健康人(Healthy control)中富集的有2个基因。这9个微生物基因标志物如下表1所示。
表1
Figure BDA0003451347590000111
实施例2微生物KO标志物的验证
为了证实实施例1中的分析结果,进一步比较验证群体中的16个健康人及12个慢性传输便秘患者的KO丰度,并对最终微生物微生物KO标志物根据验证情况做出筛选。验证群体来源、测序数据的获得与处理均参照实施例1进行。每个样本平均产生13.428Gb高质量测序结果,实施例1和实施例2获得的118个个体的测序数据共计1584.5Gb。
验证结果如下:上述富集在健康人群中的2个微生物KO标记物在验证数据集中的q值和p值情况如下表2所示。
表2
Figure BDA0003451347590000112
对于上述富集在慢性传输便秘患者中的7个微生物KO标志物在验证数据集中的q值和p值情况如下表3所示。
表3
Figure BDA0003451347590000113
Figure BDA0003451347590000121
发明人认为,可以将从健康人富集的2个微生物KO标志物,作为慢性传输便秘疾病患病的反向指标,或作为治疗慢性传输便秘进行研发的微生物制剂药物基因成分,或作为检测慢性传输便秘、监测慢性传输便秘治疗进程的恢复指标;将慢性传输便秘患者富集的7个微生物KO标志物,作为慢性传输便秘疾病患病的正向指标,特别用于慢性传输便秘疾病非创伤式的检测和诊断。
微生物KO标志物可以选自慢传输便秘患者富集的KO标记物中的一种或者多种。优选的,对于慢传输便秘患者或易感人群,应该检测到表3中KO标记物被富集。表2中的KO标志物不被富集。
治疗方案中,优选的,使表3中的KO标志物生长得到抑制或者清除,使表2中KO标记物被富集。
发明人利用这9个微生物基因标志物,构建一个综合指标,估计ROC(Receiver-operating characteristic)曲线下面积AUC,AUC越大,表示诊断能力越高,评价综合得分对应其对慢性传输便秘的诊断能力。通过对一期(第一阶段)的90个样品和二期(第二阶段)的28个样品进行评测,具体情况如图2所示,都表现出了很好的诊断能力,在一期得到AUC=95.7%,如图2a所示,置信区间为92.19%-99.21%;二期得到AUC=82.29%(二期评价AUC在75%以上为良好),如图2b所示,置信区间为64.45%-100%。
上述微生物标志KO可通过以下链接查询其具体信息如下:
https://www.genome.jp/entry/ko:K03205。
https://www.genome.jp/entry/ko:K03382。
https://www.genome.jp/entry/ko:K03696。
https://www.genome.jp/entry/ko:K07138。
https://www.genome.jp/entry/ko:K11261。
https://www.genome.jp/entry/ko:K13787。
https://www.genome.jp/entry/ko:K17898。
https://www.genome.jp/entry/ko:K06518。
https://www.genome.jp/entry/ko:K07444。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
尽管已经示出和描述了本发明的实施例,本领域的普通技术人员可以理解:在不脱离本发明的原理和宗旨的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由权利要求及其等同物限定。

Claims (13)

1.一种试剂盒,其特征在于,包括适于检测第一基因簇集合中至少一个基因簇的试剂,所述第一基因簇集合由K03205、K03382、K03696、K07138、K11261、K13787和K17898组成。
2.根据权利要求1所述的试剂盒,其特征在于,进一步包括适于检测第二基因簇集合中至少一个基因簇的试剂,所述第二基因簇集合由K06518和K07444组成。
3.根据权利要求1所述的试剂盒,其特征在于,包括适于检测全部所述第一基因簇集合的试剂。
4.根据权利要求2所述的试剂盒,其特征在于,包括适于检测全部所述第二基因簇集合的试剂。
5.试剂在制备试剂盒中的用途,所述试剂适于检测第一基因簇集合中的至少一个基因簇,所述试剂盒用于诊断慢性传输便秘或者检测慢性传输便秘的治疗效果,所述第一基因簇集合由K03205、K03382、K03696、K07138、K11261、K13787和K17898组成。
6.根据权利要求5所述的用途,其特征在于,所述试剂进一步适于检测第二基因簇集合中的至少一个基因簇,所述第二基因簇集合由K06518和K07444组成。
7.一种用于预防或者治疗慢性传输便秘的药物组合物或者食品组合物,其特征在于,含有提高第二基因簇集合中的至少一个基因簇的丰度的物质,所述第二基因簇集合由K06518和K07444组成。
8.一种确定个体是否患有慢性传输便秘的方法,其特征在于,包括:
(1)确定所述个体的粪便样本中标志基因簇的丰度,所述标志基因簇包括第一基因簇集合和第二基因簇集合中的至少一个基因簇;
(2)将步骤(1)中得到的所述丰度与预定的阈值进行比较,以便确定所述个体是否患有慢性传输便秘;
其中,所述第一基因簇集合由K03205、K03382、K03696、K07138、K11261、K13787和K17898组成;
所述第二基因簇集合由K06518和K07444组成。
9.根据权利要求8所述的方法,其特征在于,步骤(1)进一步包括:
获得所述个体的粪便样本中的核酸测序数据;
将所述测序数据与参考基因组进行比对;
基于所述比对的结果,确定基因的丰度;
基于所述基因的丰度,确定所述标志基因簇的丰度。
10.一种确定个体是否患有慢性传输便秘的装置,其特征在于,包括:
丰度确定单元,用于确定所述个体的粪便样本中标志基因簇的丰度,所述标志基因包括第一基因簇集合和第二基因簇集合中的至少一个基因簇;
比较单元,用于将所得到的所述丰度与预定的阈值进行比较,以便确定所述个体是否患有慢性传输便秘;
其中,所述第一基因簇集合由K03205、K03382、K03696、K07138、K11261、K13787和K17898组成;
所述第二基因簇集合由K06518和K07444组成。
11.根据权利要求10所述的装置,其特征在于,所述丰度确定单元适于通过下列步骤确定所述丰度:
获得所述个体的粪便样本中的核酸测序数据;
将所述测序数据与参考基因组进行比对;
基于所述比对的结果,确定基因的丰度;
基于所述基因的丰度,以获得所述标志基因簇的丰度。
12.一种装置,其特征在于,包括:
计算机可读存储介质,其上存储有计算机程序,所述程序用于执行权利要求8或9所述的方法;
以及一个或者多个处理器,用于执行所述计算机可读存储介质中的程序。
13.一种筛选药物的方法,其特征在于,所述药物用于治疗或者预防慢性传输便秘,所述方法包括:
将候选药物施用于受试者,
检测施用前后,所述受试者粪便中标志基因簇的丰度,所述标志基因簇KO包括第一基因簇集合和第二基因簇集合中的至少一个基因簇,
其中,满足下列条件至少之一的候选药物适于用于治疗或者预防慢性传输便秘:
(1)进行所述施用后,所述第一基因簇集合中的至少一个基因簇的所述丰度降低;和
(2)进行所述施用后,所述第二基因簇集合中的至少一个基因簇的所述丰度升高;
其中,所述第一基因簇集合由K03205、K03382、K03696、K07138、K11261、K13787和K17898组成;
所述第二基因簇集合由K06518和K07444组成。
CN202111666825.3A 2021-12-31 2021-12-31 慢性传输便秘标志ko及其应用 Pending CN114292932A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111666825.3A CN114292932A (zh) 2021-12-31 2021-12-31 慢性传输便秘标志ko及其应用

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111666825.3A CN114292932A (zh) 2021-12-31 2021-12-31 慢性传输便秘标志ko及其应用

Publications (1)

Publication Number Publication Date
CN114292932A true CN114292932A (zh) 2022-04-08

Family

ID=80973797

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111666825.3A Pending CN114292932A (zh) 2021-12-31 2021-12-31 慢性传输便秘标志ko及其应用

Country Status (1)

Country Link
CN (1) CN114292932A (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104195145A (zh) * 2014-07-15 2014-12-10 浙江大学 肝硬化的生物标志物及其应用
CN105132518A (zh) * 2015-09-30 2015-12-09 上海锐翌生物科技有限公司 大肠癌标志物及其应用
CN107217088A (zh) * 2016-03-22 2017-09-29 浙江中医药大学 强直性脊柱炎微生物标志物
CN107217086A (zh) * 2016-03-22 2017-09-29 浙江中医药大学 疾病标志物及应用
CN114182007A (zh) * 2021-12-08 2022-03-15 上海锐翌医学检验实验室有限公司 白塞病标志基因及其应用

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104195145A (zh) * 2014-07-15 2014-12-10 浙江大学 肝硬化的生物标志物及其应用
CN105132518A (zh) * 2015-09-30 2015-12-09 上海锐翌生物科技有限公司 大肠癌标志物及其应用
CN107217088A (zh) * 2016-03-22 2017-09-29 浙江中医药大学 强直性脊柱炎微生物标志物
CN107217086A (zh) * 2016-03-22 2017-09-29 浙江中医药大学 疾病标志物及应用
CN114182007A (zh) * 2021-12-08 2022-03-15 上海锐翌医学检验实验室有限公司 白塞病标志基因及其应用

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
HONGLING TIAN等: "Gut Metagenome as a Potential Diagnostic and Predictive Biomarker in Slow Transit Constipation", 《FRONTIERS IN MEDICINE》, vol. 8, pages 1 - 10 *

Similar Documents

Publication Publication Date Title
CN107217089B (zh) 确定个体状态的方法及装置
CN105296590A (zh) 大肠癌标志物及其应用
CN107217088B (zh) 强直性脊柱炎微生物标志物
CN105132518A (zh) 大肠癌标志物及其应用
CN114182007B (zh) 白塞病标志基因及其应用
CN113913490B (zh) 非酒精性脂肪肝标志微生物及其应用
WO2017156739A1 (zh) 分离的核酸及应用
CN105733988B (zh) 组合物及应用
CN107217086B (zh) 疾病标志物及应用
CN105671177B (zh) 强直性脊柱炎标志物及应用
CN113999922B (zh) 急性腹泻标志微生物及其应用
WO2017156764A1 (zh) 分离的核酸及应用
CN114292932A (zh) 慢性传输便秘标志ko及其应用
CN114836508A (zh) 慢性阻塞性肺病标志微生物及其应用
CN114381493A (zh) 炎症性肠病标志微生物及其应用
CN114317718A (zh) 类风湿性关节炎标志ko及其应用
CN114317531B (zh) 小柳-原田综合症标志基因及其应用
CN113930479B (zh) 系统性红斑狼疮标志微生物及其应用
CN114262743B (zh) 中风标志微生物及其应用
CN114317674B (zh) 类风湿性关节炎标志微生物及其应用
CN114317784B (zh) 白塞病标志微生物及其应用
CN114317716A (zh) 痛风症标志基因及其应用
CN114107484B (zh) 溃疡性结肠炎标志基因及其应用
CN114517227A (zh) 急性腹泻标志基因及其应用
CN114317717A (zh) 儿童克罗恩病标志基因及其应用

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination