CN114317531A - 小柳-原田综合症标志基因及其应用 - Google Patents
小柳-原田综合症标志基因及其应用 Download PDFInfo
- Publication number
- CN114317531A CN114317531A CN202111666817.9A CN202111666817A CN114317531A CN 114317531 A CN114317531 A CN 114317531A CN 202111666817 A CN202111666817 A CN 202111666817A CN 114317531 A CN114317531 A CN 114317531A
- Authority
- CN
- China
- Prior art keywords
- genes
- gene
- seq
- gene set
- syndrome
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本发明公开了一种小柳‑原田综合症基因标志物及其应用,该小柳‑原田综合症基因标志物包括第一基因集中的至少之一,因此,进一步提出了一种试剂盒,该试剂盒包括适于检测第一基因集中的至少一种基因的试剂,所述第一基因集由以下基因组成:BA15_GI_0053852、VA1_GI_0075627、BA16_GI_0058798、BA20_GI_0078082、VA34_GI_0040061、N29_GI_0014293和BA20_GI_0050287。其中,所述第一基因集中的基因与SEQ ID NO:1‑7所示的核酸序列一一对应,所述第一基因集中的基因与其对应的SEQ ID NO:1‑7中的序列具有不小于90%的同一性。本发明提出的基因相较于健康个体,在小柳‑原田综合症患者群体中显著富集,能够作为健康群体和小柳‑原田综合症患者群体的区分标志,可以作为检测和/或治疗小柳‑原田综合症的标志物。
Description
技术领域
本发明涉及生物技术领域,具体的,本发明涉及小柳-原田综合症标志基因及其应用,更具体的,本发明涉及一种试剂盒、试剂在制备试剂盒中的用途、用于预防或者治疗小柳-原田综合症的药物组合物或者食品组合物、确定个体是否患有小柳-原田综合症方法、确定个体是否患有小柳-原田综合症的装置、一种装置、一种筛选药物的方法。
背景技术
小柳-原田综合症(Vogt-Koyanagi-Harada,VKH)又称葡萄膜大脑炎(Uveoencephalitis)综合征,也称色素膜脑膜炎或眼-脑-耳-皮综合征。是一种自身免疫反应引起的攻击黑色素细胞抗原的致盲眼病,往往还会侵袭耳、脑(脊)膜、毛发以及皮肤等器官。起病多发于青壮年,发病率与性别无明显的关系,黄种人种较为常见。小柳-原田综合症的病因前尚未完全明确,文献报告有内分泌学说、病毒学说和免疫学说等三种学说。
小柳-原田综合症一般起病比较隐匿,临床上一般分为三期,分别是前驱期、眼病期、恢复期。前驱期有感冒样的症状,如发热、头痛、耳鸣、听力异常、颈项僵硬、头皮过敏等。由于病情较轻,病人大多会误,致使病情延误,失去最佳治疗时机。
小柳-原田综合症的诊断标准定为:①病前无眼球外伤或手术史;②临床与实验室排除了其他病因的葡萄膜炎;③双眼累及具有小柳-原田综合症的急性或慢性期,眼前节或后节的表现;④有神经、耳部症状或脑脊液细胞增多;⑤皮肤、毛发改变。虽然临床表现加上器械检查可以对病做出正确诊断,但是大部分需要患者还要通过病史、眼科常规检查、造影、光学成像等作出诊断。目前,小柳-原田综合症的早期诊断主要是用血常规、超声显微镜、眼底血管造影、X射线检查等技术进行检查,检查过程较复杂。
随着人体基因组测序完成及高通量测序技术的高速发展,基因筛查成为小柳-原田综合症诊断的方向,对于发现小柳-原田综合症潜在人群很有优势。有研究表明与小柳-原田综合症相关的多基因在肠道免疫中起重要作用,如TLR受体能够识别病原微生物配体,随即引发自身免疫反应响应。途径的基因对肠道健康的调节起重要作用(Kawai T et al.,2010)。到目前为止,还没有小柳-原田综合症患者基因标记物的相关报道。
发明内容
本发明旨在至少在一定程度上解决上述技术问题之一或至少提供一种商业选择。
依据本发明的第一方面,提供一种试剂盒,包括适于检测第一基因集中至少一种基因的试剂,所述第一基因集由以下基因组成:BA15_GI_0053852、VA1_GI_0075627、BA16_GI_0058798、BA20_GI_0078082、VA34_GI_0040061、N29_GI_0014293和BA20_GI_0050287,其中,所述第一基因集中的基因与SEQ ID NO:1-7所示的核酸序列一一对应,所述第一基因集中的基因与其对应的SEQ ID NO:1-7中的核酸序列具有不小于90%的同一性。根据本发明具体实施例的试剂盒,包含可以准确的检测第一基因集中的至少一种基因的试剂,因此,可以准确检测生物样品中是否包含第一基因集中的至少一种基因的试剂,更进一步地,可以准确区分或诊断小柳-原田综合症患者和健康个体。
在本发明的第二方面,本发明提出了试剂在制备试剂盒中的用途,所述试剂适于检测第一基因集中的至少一种基因。根据本发明的实施例,所述试剂盒用于诊断小柳-原田综合症或检测小柳-原田综合症的治疗效果,所述第一基因集由以下基因组成:BA15_GI_0053852、VA1_GI_0075627、BA16_GI_0058798、BA20_GI_0078082、VA34_GI_0040061、N29_GI_0014293和BA20_GI_0050287,其中,所述第一基因集中的基因与SEQ ID NO:1-7所示的核酸序列一一对应,所述第一基因集中的基因与其对应的SEQ ID NO:1-7中的核酸序列具有不小于90%的同一性。根据本发明具体实施例的试剂制备的试剂盒,可以准确的检测生物样品中是否包含所述第一基因集中的至少一种基因,极准确的区分小柳-原田综合症患者和健康个体,由此,可以有效的在早期进行小柳-原田综合症诊断,或用于检测治疗过程中小柳-原田综合症的变化。
在本发明的第三方面,本发明提出了一种用于预防或者治疗小柳-原田综合症的药物组合物或者食品组合物。根据本发明的实施例,含有提高所述第二基因集中的至少一种基因丰度的物质,所述第二基因集由以下基因组成:N58_GI_0017314和N44_GI_0089468,其中,所述第二基因集中的基因与SEQ ID NO:8、9所示的核酸序列一一对应,所述第二基因集中的基因与其对应的SEQ ID NO:8、9中的核酸序列具有不小于90%的同一性。根据本发明实施例的小柳-原田综合症标志基因中第二基因集的基因可以非侵入性的在早期发现或辅助检测小柳-原田综合症,确定个体患有小柳-原田综合症的概率高低或者个体处于健康状态的概率高低;同时,提高小柳-原田综合症高风险人群或已小柳-原田综合症患者肠道内的所述第二基因集中的各种基因的丰度,可以降低患小柳-原田综合症的概率或减缓、治愈小柳-原田综合症,因此,所述包含提高所述第二基因集中的至少一种基因丰度的药物或者食品组合物能够有效预防或治疗小柳-原田综合症。
在本发明的第四方面,本发明提出了一种确定个体是否患有小柳-原田综合症的方法。根据本发明的实施例,包括:(1)确定所述个体的粪便样本中标志基因的丰度,所述标志基因包括第一基因集和第二基因集中的至少一种基因;(2)将步骤(1)中得到的所述丰度与预定的阈值进行比较,以便确定所述个体是否患有小柳-原田综合症;其中,所述第一基因集由以下基因组成:BA15_GI_0053852、VA1_GI_0075627、BA16_GI_0058798、BA20_GI_0078082、VA34_GI_0040061、N29_GI_0014293和BA20_GI_0050287,其中,所述第一基因集中的基因与SEQ ID NO:1-7所示的核酸序列一一对应,所述第一基因集中的基因与其对应的SEQ ID NO:1-7中的核酸序列具有不小于90%的同一性,所述第二基因集由以下基因组成:N58_GI_0017314和N44_GI_0089468,其中,所述第二基因集中的基因与SEQ ID NO:8、9所示的核酸序列一一对应,所述第二基因集中的基因与其对应的SEQ ID NO:8、9中的核酸序列具有不小于90%的同一性。根据本发明实施例的方法可以依据个体的粪便样本中的所述标志基因的丰度确定个体是否患有小柳-原田综合症,所述标志基因是发明人对大量已知状态的粪便样本进行验证,通过差异比较分析各种肠道微生物基因在小柳-原田综合症组和健康组粪便样本中的丰度,而确定下来的。
在本发明的第五方面,本发明提出了一种确定个体是否患有小柳-原田综合症的装置。根据本发明的实施例,包括:丰度确定单元,用于确定所述个体的粪便样本中标志基因的丰度,所述标志基因包括第一基因集和第二基因集中的至少一种基因;比较单元,用于将所得到的所述丰度与预定的阈值进行比较,以便确定所述个体是否患有小柳-原田综合症;其中,所述第一基因集由以下基因组成:BA15_GI_0053852、VA1_GI_0075627、BA16_GI_0058798、BA20_GI_0078082、VA34_GI_0040061、N29_GI_0014293和BA20_GI_0050287,其中,所述第一基因集中的基因与SEQ ID NO:1-7所示的核酸序列一一对应,所述第一基因集中的基因与其对应的SEQ ID NO:1-7中的核酸序列具有不小于90%的同一性,所述第二基因集由以下基因组成:N58_GI_0017314和N44_GI_0089468,其中,所述第二基因集中的基因与SEQ ID NO:8、9所示的核酸序列一一对应,所述第二基因集中的基因与其对应的SEQ IDNO:8、9中的核酸序列具有不小于90%的同一性。所述标志基因是发明人通过差异比较分析各种肠道内的微生物基因在小柳-原田综合症患者和健康人群的粪便样本中的丰度并经过分析,和对大量已知状态的粪便样本的验证而确定下来的,根据本发明实施例的装置可以准确确定个体是否为小柳-原田综合症的高风险人群或小柳-原田综合症患者。
在本发明的第六方面,本发明提出了一种装置。根据本发明的实施例,包括:计算机可读存储介质,其上存储有计算机程序,所述程序用于执行第四方面所述的方法;以及一个或者多个处理器,用于执行所述计算机可读存储介质中的程序。根据本发明实施例的装置可以准确确定个体是否为小柳-原田综合症的高风险人群或小柳-原田综合症患者。
在本发明的第七方面,本发明提出了一种筛选药物的方法。根据本发明的实施例,所述药物用于治疗或者预防小柳-原田综合症,所述方法包括:将候选药物施用于受试者,检测施用前后,所述受试者粪便中标志基因的丰度,所述标志基因包括第一基因集和第二基因集中的至少一种基因,其中,满足下列条件至少之一的候选药物适于用于治疗或者预防小柳-原田综合症:(1)进行所述施用后,所述第一基因集中的至少一种基因的所述丰度降低;和(2)进行所述施用后,所述第二基因集中的至少一种基因的所述丰度升高;其中,所述第一基因集由以下基因组成:BA15_GI_0053852、VA1_GI_0075627、BA16_GI_0058798、BA20_GI_0078082、VA34_GI_0040061、N29_GI_0014293和BA20_GI_0050287,其中,所述第一基因集中的基因与SEQ ID NO:1-7所示的核酸序列一一对应,所述第一基因集中的基因与其对应的SEQ ID NO:1-7中的核酸序列具有不小于90%的同一性;所述第二基因集由以下基因组成:N58_GI_0017314和N44_GI_0089468,其中,所述第二基因集中的基因与SEQ IDNO:8、9所示的核酸序列一一对应,所述第二基因集中的基因与其对应的SEQ ID NO:8、9中的核酸序列具有不小于90%的同一性。根据本发明实施例的方法可以生产或筛选出降低所述标志基因中第一基因集中各种基因丰度,和/或升高肠道内微生物标志基因中第二基因集中的各种基因丰度的药物,对于辅助减轻小柳-原田综合症的临床症状具有重要意义。
附图说明
本发明的上述和/或附加的方面和优点从结合下面附图对实施方式的描述中将变得明显和容易理解,其中:
图1是本发明的实施例中的筛选鉴定小柳-原田综合症标志基因的试验分析流程示意图;以及
图2是本发明的实施例中的标志基因作为诊断指标的AUC评价结果示意图,其中:
2-A为第一期74个样品数据ROC曲线下AUC值和置信区间结果图;
2-B为第二期33个样品数据ROC曲线下AUC值和置信区间结果图。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中,自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能理解为对本发明的限制。需要说明的,本文中所使用的术语“第一”或者“第二”等仅为方便描述,不能理解为指示或暗示相对重要性,也不能理解为之间有先后顺序关系。
在本发明的描述中,除非另有说明,“多个”的含义是两个或两个以上。在本文中,除非另有明确的规定和限定,术语“相连”、“连接”等术语应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。
生物学标志物是从生物学介质中可以检测到的细胞、生物化学或分子改变。生物学介质包括各种组织、粪便、体液、细胞、呼气、头发等。
所称的丰度指在某一核酸序列群体中该种序列的丰富程度。例如在一组核酸序列中某种核酸序的丰富程度,可表示为该种核酸序列的数目占该组序列的总数的比例。
同一性,本发明,为了比较两个或更多个核苷酸序列,可以通过将[第一序列中与相应位置的核苷酸相同的核苷酸的数目相除]来计算第一序列和第二序列之间的“序列同一性”的百分比。第二个序列中的核苷酸]减去[第一个序列中核苷酸的总数],然后乘以[100%],其中第二个核苷酸序列中每个核苷酸的缺失,插入,取代或添加-相对于第一核苷酸序列-被认为是单个核苷酸(位置)上的差异。
或者,可以使用标准设置,使用用于序列比对的已知计算机算法,例如NCBI Blastv2.0,计算两个或多个核苷酸序列之间的序列同一性程度。
用于确定序列同一性程度的一些其他技术,计算机算法和设置例如在WO 04/037999,EP 0 967 284,EP 1 085 089,WO 00/55318,WO 00/78972,WO 98/49185和GB2357768-A。
需要说明的是,本申请中所述的“标志基因”的长度不受特别限制,可以为完整基因,也可以为基因的编码区或非编码区,更进一步地,根据不同的实验目的,可以选择相关的任意长度的核酸片段作为标志基因。
根据本发明的一个实施方式提供的一种试剂盒,包括适于检测第一基因集中的至少一个基因的试剂,所述第一基因集由以下基因组成:BA15_GI_0053852、VA1_GI_0075627、BA16_GI_0058798、BA20_GI_0078082、VA34_GI_0040061、N29_GI_0014293和BA20_GI_0050287,其中,所述第一基因集中的基因与SEQ ID NO:1-7所示的核酸序列一一对应,所述第一基因集中的基因与其对应的SEQ ID NO:1-7中的核酸序列具有不小于90%的同一性。
根据本发明的一个具体的实施方案,所述试剂盒进一步包括适于检测第二基因集中的至少一个基因的试剂,所述第二基因集由以下基因组成:N58_GI_0017314、N44_GI_0089468,其中,所述第二基因集中的基因与SEQ ID NO:8、9所示的核酸序列一一对应,所述第二基因集中的基因与其对应的SEQ ID NO:8、9中的核酸序列具有不小于90%的同一性。
根据本发明的具体实施例,所述试剂盒包括适于检测所述第一基因集中全部所述基因的试剂。
根据本发明的具体实施例,所述试剂盒包括适于检测所述第二基因集中全部所述基因的试剂。
根据本发明的具体实施例,所述标志基因是发明人通过对大量患小柳-原田综合症个体和大量健康对照个体的粪便样本中的微生物的丰度的差异比较分析、以及验证,而确定下来的,明确了肠道微生物基因中与小柳-原田综合症相关的标志基因。利用包含检测所述标志基因的试剂的试剂盒能够准确检测生物样品中是否包含所述基因集中的至少一种基因,更进一步地,确定个体处于患有小柳-原田综合症状态的概率高低或者处于健康状态的概率高低,能够用于非侵入性的早期发现或辅助检测小柳-原田综合症。
根据本发明的具体实施例,所述适于检测所述第一基因集中至少一个基因和第二基因集中至少一个基因的试剂不受特别限制,任何可以检测所述标志基因的试剂均包含在本发明的范围内,如:利用PCR技术、高通量测序等方法进行检测时使用的试剂。
根据本发明提供的试剂在制备试剂盒中的用途,所述试剂适于检测第一基因集中的至少一种基因,所述试剂盒用于诊断小柳-原田综合症或者检测小柳-原田综合症的治疗效果,所述第一基因集由以下基因组成:BA15_GI_0053852、VA1_GI_0075627、BA16_GI_0058798、BA20_GI_0078082、VA34_GI_0040061、N29_GI_0014293和BA20_GI_0050287,其中,所述第一基因集中的基因与SEQ ID NO:1-7所示的核酸序列一一对应,所述第一基因集中的基因与其对应的SEQ ID NO:1-7中的核酸序列具有不小于90%的同一性。
根据本发明的具体实施例,所述标志基因是发明人通过对大量患小柳-原田综合症个体和大量健康对照个体的粪便样本中的微生物的丰度进行差异比较分析、以及对大量已知状态的粪便样本中的微生物基因的丰度进行验证,而确定下来的,明确了肠道微生物基因中小柳-原田综合症相关的基因标志物。利用检测所述标志基因的试剂能够确定个体患有小柳-原田综合症的概率高低或者处于健康状态的概率高低,能够用于非侵入性的早期发现或辅助检测小柳-原田综合症。
根据本发明一些具体的实施例,所述试剂进一步适于检测第二基因集中的至少一种基因,所述第二基因集由以下基因组成:N58_GI_0017314和N44_GI_0089468,其中,所述第二基因集中的基因与SEQ ID NO:8、9所示的核酸序列一一对应,所述第二基因集中的基因与其对应的SEQ ID NO:8、9中的核酸序列具有不小于90%的同一性。
根据本发明的具体实施例,所述适于检测所述第一基因集中的至少一个基因和第二基因集中的至少一个基因的试剂不受特别限制,可以检测所述微生物基因的试剂均包含在本发明的范围内,如:利用PCR技术、高通量测序等方法进行检测时使用的试剂。
根据本发明提供的一种用于预防或者治疗小柳-原田综合症的药物组合物或者食品组合物,含有提高第二基因集中的至少一种基因丰度的物质,所述第二基因集由以下基因组成:N58_GI_0017314和N44_GI_0089468,其中,所述第二基因集中的基因与SEQ ID NO:8、9所示的核酸序列一一对应,所述第二基因集中的基因与其对应的SEQ ID NO:8、9中的核酸序列具有不小于90%的同一性。
上述标志基因是发明人通过差异比较分析各种肠道微生物基因在小柳-原田综合症疾病组和健康组的粪便样本中的丰度,以及经过大量已知状态的粪便样本的验证,而确定下来的。所述标志基因中的第二基因集中的基因相较于小柳-原田综合症患者群体,在健康群体组中显著富集,所述显著富集是指与在小柳-原田综合症患者组中的丰度相比,上述基因在健康组中的丰度均具有统计意义地高于或者明显地、实质性地高于在小柳-原田综合症患者组中的丰度;能够使该部分基因丰度提高的物质能够用于治疗小柳-原田综合症或者益于小柳-原田综合症患者服用,能够使其丰度提高的物质不限于治疗小柳-原田综合症的药物和功能性食品。该实施例提供的能够使所述第二基因集中的基因丰度提高的物质能够用于制备治疗小柳-原田综合症的药物和/或用于制备功能性食品、保健药等,所述药物或食品可有效治疗或缓解小柳-原田综合症。
根据本发明提供的一种确定个体是否患有小柳-原田综合症的方法,包括步骤(1)和(2)。
(1)确定所述个体的粪便样本中的标志基因的丰度。
所述标志基因包括第一基因集和第二基因集中的至少一种基因。其中,所述第一基因集由以下基因组成:BA15_GI_0053852、VA1_GI_0075627、BA16_GI_0058798、BA20_GI_0078082、VA34_GI_0040061、N29_GI_0014293和BA20_GI_0050287,所述第一基因集中的基因与SEQ ID NO:1-7所示的核酸序列一一对应,所述第一基因集中的基因与其对应的SEQID NO:1-7中的核酸序列具有不小于90%的同一性;所述第二基因集由以下基因组成:N58_GI_0017314和N44_GI_0089468,所述第二基因集中的基因与SEQ ID NO:8、9所示的核酸序列一一对应,所述第二基因集中的基因与其对应的SEQ ID NO:8、9中的核酸序列具有不小于90%的同一性。
根据本发明的一些具体的实施例,步骤(1)进一步包括:获得所述个体的粪便样本中的核酸测序数据;将所述测序数据与参考基因组进行比对;基于所述比对的结果,确定所述标志基因的丰度。
根据本发明的具体实施例,在步骤(1)中,按照下列公式确定所述标志基因的丰度:Ab(G)=Ab(UG)+Ab(MG),其中,G表示基因的编号,Ab(G)表示基因G的丰度,Ab(UG)表示所述测序数据与所述基因G的参考序列唯一比对的读段的丰度,Ab(MG)表示所述测序数据与所述基因G的参考序列非唯一比对读段的丰度;Ab(UG)=UG/lG,其中,UG表示所述测序数据中与所述基因G的参考基因唯一比对的读段数目,lG表示所述基因G的参考基因长度;其中,MG为所述测序数据中与所述基因G的参考基因非唯一比对的读段的数目,i表示所述非唯一比对读段的编号,Coi为所述第i读段对应的丰度系数;其中,Coi,G表示针对所述标志基因G,所述非唯一比对的读段i的丰度系数,N为所述非唯一比对的读段i能够比对的基因的总数,j表示所述非唯一比对的读段i能够比对的基因的编号。上述丰度确定公式,基于比对结果中的唯一和非唯一比对上组装序列的读段对该组装序列的丰度的贡献情况,充分利用测序数据的同时确定的丰度十分准确。。
所述的测序数据通过对样本中的核酸序列进行测序得来,测序依据所选的测序平台的不同,可选择但不限于半导体测序技术平台比如PGM、Ion Proton、BGISEQ-100平台,合成边测序的技术平台,比如Illumina公司的Hiseq、Miseq序列平台以及单分子实时测序平台,比如PacBio序列平台。测序方式可以选择单端测序,也可以选择双末端测序,获得的下机数据是测读出来的片段,称为读段(reads)。
比对可以利用已知比对软件进行,例如SOAP、BWA和TeraMap等,在比对过程中,一般对比对参数进行设置,设置一个或者一对读段(reads)最多允许有s个碱基错配(mismatch),例如设置s≤2,若reads中有超过s个碱基发生错配,则视为该reads无法比对到(比对上)该组装片段上。所述的获得的比对结果包含各条读段与各参考基因的比对情况,包括读段是否能够比对上某个或某些基因的参考序列、只唯一比对到一种基因还是比对到多种基因的参考序列、比对到基因组的位置、比对到基因组的唯一位置还是多个位置等信息。
reads与参考基因组比对,比对上的可以被分为两部分:a)Unique reads(U):唯一比对上一个基因的序列;称这些reads为unique reads。即,如果reads比对上的序列均来自同一基因,定义这些reads为unique reads;b)Multiple reads(M):比对上一个以上基因的序列,定义为multiple reads。即,如果reads比对上的序列来自至少两种基因,定义这些reads为multiple reads。
(2)丰度比较,以确定个体是否患有小柳-原田综合症。
根据本发明的一个实施例,将步骤(1)中得到的所述丰度与预定的阈值进行比较,以便确定所述个体是否患有小柳-原田综合症。
根据本发明的一些具体实施例,所述阈值为预先设定的。将基因标志物中的各种基因在健康个体以及患病个体中的丰度进行预先测定并保存,用以作为设定阈值的依据。所述阈值可以为一数值或者数值范围,基于已知患病或健康状态个体中的标志基因的丰度均值,该基因对应的阈值可以设为该基因丰度均值的95%的置信区间(Confidenceinterval)。
所述的置信区间是指由样本统计量所构造的总体参数的估计区间。在统计学中,一个概率样本的置信区间是对这个样本的某个总体参数的区间估计。置信区间展现的是这个参数的真实值有一定概率落在测量结果的周围的程度。置信区间给出的是被测量参数的测量值的可信程度,即前面所要求的“一定概率”,这个概率被称为置信水平。
根据本发明的一些具体实施例,当步骤(1)中确定的标志基因的丰度达到所述患小柳-原田综合症丰度阈值,未达到所述不患小柳-原田综合症丰度阈值时,确定所述个体患有小柳-原田综合症,当(1)中确定的标志基因的丰度达到不患小柳-原田综合症丰度阈值,未达到患小柳-原田综合症丰度阈值时,确定所述个体不患小柳-原田综合症。
需要说明的是,根据目的或要求不同,可能对确定个体状态结果的可信程度有不同的要求,本领域技术人员可以选择不同的显著性水平或阈值。
该方法基于检测个体的粪便样本中的标志基因中的各种基因的丰度,将分别将检测确定的各种基因的丰度与其阈值进行比较,依据获得的比较结果能够确定个体为小柳-原田综合症个体或者为健康个体的概率。为早期发现小柳-原田综合症提供一种非侵入性的辅助检测或者辅助干预治疗的方法。
以上任一实施例中的利用标志基因确定个体是否患有小柳-原田综合症的方法的全部或部分步骤,可以利用包含可拆分的相应单元功能模块的装置/系统来施行,或者将方法程序化、存储于机器可读介质,利用机器运行该可读介质来实现。
根据本发明提供的一种确定个体是否患有小柳-原田综合症的装置,该装置包括:丰度确定单元,用于确定所述个体的粪便样本中标志基因的丰度,所述标志基因包括第一基因集和第二基因集中的至少一种基因;比较单元,用于将所得到的所述丰度与预定的阈值进行比较,以便确定所述个体是否患有小柳-原田综合症;其中,所述第一基因集由以下基因组成:BA15_GI_0053852、VA1_GI_0075627、BA16_GI_0058798、BA20_GI_0078082、VA34_GI_0040061、N29_GI_0014293和BA20_GI_0050287,所述第一基因集中的基因与SEQ ID NO:1-7所示的核酸序列一一对应,所述第一基因集中的基因与其对应的SEQ ID NO:1-7中的核酸序列具有不小于90%的同一性,所述第二基因集由以下基因组成:N58_GI_0017314和N44_GI_0089468,所述第二基因集中的基因与SEQ ID NO:8、9所示的核酸序列一一对应,所述第二基因集中的基因与其对应的SEQ ID NO:8、9中的核酸序列具有不小于90%的同一性。上述对本发明任一实施例的利用标志基因确定个体是否患有小柳-原田综合症的方法的技术特征和优点的描述,同样适用本发明这一方面的装置,在此不再赘述。
根据本发明的实施例,所述丰度确定单元适于通过下列步骤确定所述丰度:获得所述个体的粪便样本中的核酸测序数据;将所述测序数据与参考基因组进行比对;基于所述比对的结果,确定所述标志基因的丰度。
所述的测序数据通过对样本中的核酸序列进行测序得来,测序依据所选的测序平台的不同,可选择但不限于半导体测序技术平台比如PGM、Ion Proton、BGISEQ-100平台,合成边测序的技术平台,比如Illumina公司的Hiseq、Miseq序列平台以及单分子实时测序平台,比如PacBio序列平台。测序方式可以选择单端测序,也可以选择双末端测序,获得的下机数据是测读出来的片段,称为读段(reads)。
比对可以利用已知比对软件进行,例如SOAP、BWA和TeraMap等,在比对过程中,一般对比对参数进行设置,设置一个或者一对读段(reads)最多允许有s个碱基错配(mismatch),例如设置s≤2,若reads中有超过s个碱基发生错配,则视为该reads无法比对到(比对上)该组装片段上。所述的获得的比对结果包含各条读段与各参考基因的比对情况,包括读段是否能够比对上某个或某些基因的参考序列、只唯一比对到一种基因还是比对到多种基因的参考序列、比对到基因组的位置、比对到基因组的唯一位置还是多个位置等信息。
reads与参考基因组比对,比对上的可以被分为两部分:a)Unique reads(U):唯一比对上一个基因的序列;称这些reads为unique reads。即,如果reads比对上的序列均来自同一基因,定义这些reads为unique reads;b)Multiple reads(M):比对上一个以上基因的序列,定义为multiple reads。即,如果reads比对上的序列来自至少两种基因,定义这些reads为multiple reads。
根据本发明的一个实施例,按照下列公式确定所述标志基因的丰度:Ab(G)=Ab(UG)+Ab(MG),其中,G表示基因的编号,Ab(G)表示基因G的丰度,Ab(UG)表示所述测序数据与所述基因G的参考序列唯一比对的读段的丰度,Ab(MG)表示所述测序数据与所述基因G的参考序列非唯一比对读段的丰度;Ab(UG)=UG/lG,其中,UG表示所述测序数据中与所述基因G的参考基因唯一比对的读段数目,lG表示所述基因G的参考基因长度;其中,MG为所述测序数据中与所述基因G的参考基因非唯一比对的读段的数目,i表示所述非唯一比对读段的编号,Coi为所述第i读段对应的丰度系数;其中,Coi,G表示针对所述标志基因G,所述非唯一比对的读段i的丰度系数,N为所述非唯一比对的读段i能够比对的基因的总数,j表示所述非唯一比对的读段i能够比对的基因的编号。上述丰度确定公式,基于比对结果中的唯一和非唯一比对上组装序列的读段对该组装序列的丰度的贡献情况,充分利用测序数据的同时确定的丰度十分准确。上述对本发明任一实施例的利用标志基因确定个体是否患有白塞病的方法的技术特征和优点的描述,同样适用本发明这一方面的装置,在此不再赘述。
根据本发明的又一个实施例提供的一种装置,包括:计算机可读存储介质,其上存储有计算机程序,所述程序用于执行前面所述的一种确定个体是否患有小柳-原田综合症方法;以及一个或者多个处理器,用于执行所述计算机可读存储介质中的程序。
根据本发明的又一个实施例提供的一种筛选药物的方法,所述药物用于治疗或者预防小柳-原田综合症,所述方法包括:将候选药物施用于受试者,检测施用前后,所述受试者粪便中标志基因的丰度,所述标志基因包括第一基因集和第二基因集中的至少一种基因,其中,满足下列条件至少之一的候选药物适于用于治疗或者预防小柳-原田综合症:(1)进行所述施用后,所述第一基因集中的至少一种基因的所述丰度降低;和(2)进行所述施用后,所述第二基因集中的至少一种基因的所述丰度升高;其中,所述第一基因集由以下基因组成:BA15_GI_0053852、VA1_GI_0075627、BA16_GI_0058798、BA20_GI_0078082、VA34_GI_0040061、N29_GI_0014293和BA20_GI_0050287,所述第一基因集中的基因与SEQ ID NO:1-7所示的核酸序列一一对应,所述第一基因集中的基因与其对应的SEQ ID NO:1-7中的核酸序列具有不小于90%的同一性,所述第二基因集由以下基因组成:N58_GI_0017314和N44_GI_0089468,所述第二基因集中的基因与SEQ ID NO:8、9所示的核酸序列一一对应,所述第二基因集中的基因与其对应的SEQ ID NO:8、9中的核酸序列具有不小于90%的同一性。
利用本发明这一方面的筛选治疗小柳-原田综合症的药物的方法,通过合理有效地应用确定的小柳-原田综合症标志基因进行筛选,能够获得提高肠道有益基因的丰度和/或降低肠道潜在致病基因的丰度的药物。
以下结合具体实施例对本发明的方法和/或装置进行详细的描述。除另有交待,以下实施例中涉及的未特别交待的试剂、序列、软件及仪器,都是常规市售产品。
以下实施例包括第一阶段和第二阶段,即对应发现阶段和验证阶段。
实施例1生物标志物的鉴定
该示例中,发明人通过对38个小柳-原田综合症患者和36个健康对照的粪便样品进行研究,开展整个肠道微生物基因的关联分析、研究描述粪便微生物基因分布特征,从而获得粪便中基因成分。发明人通过实验测序得到约190.2Gb高质量健康人(LC)数据以及201.6Gb高质量小柳-原田综合症患者(AS)测序数据构建了小柳-原田综合症参照基因集,并和IGC基因集构建一个更加完整的基因集。宏基因组分析显示,168个基因与小柳-原田综合症密切相关,其中38个微生物基因在健康人的肠道中富集,130个基因在小柳-原田综合症病人的肠道微生物中富集。
1、测序数据的获取
1.1样本收集和DNA提取
小柳-原田综合症患者来自重庆医科大学附属第一医院,实验共采集了38个小柳-原田综合症患者的粪便样品和36个健康对照个体的粪便样品,其中每个个体的新鲜粪便样品分成200mg/份,共5份,立即于-80℃冰箱冷冻保存。
将获得的38个小柳-原田综合症患者的粪便样品和36个健康对照的粪便样品提取总DNA。使用苯酚三氯甲烷处理提取DNA方法提取DNA,具体操作步骤或者细节为本领域技术人员所熟知,此处不再进行赘述。
1.2构建文库及测序
DNA建库按仪器制造商(Illumina)的操作指南进行。对文库进行PE150 bp测序。Illumina HiSeq2000(Illumina,San Diego,CA)平台对74个样品的文库进行测序。每个样本平均产生5.3Gb(sd.±0.74Gb)高质量测序结果,总计392Gb测序数据量。
参照图1的实验流程,鉴定小柳-原田综合症的相关基因标志物,其中省略的步骤或者细节为本领域技术人员所熟知,几个重要步骤介绍如下面步骤所述。
2、生物标志物的鉴定
2.1测序数据的基本处理
1)测序数据经过质控:获得第一阶段的74个粪便样品的测序数据以后,对其进行过滤,质控按以下标准进行:a)去除低质量碱基(Q20)大于50%的reads;b)移除大于5个N碱基的reads;c)移除尾部低质量(Q20)和N碱基。丢失成对reads的序列被认为是单条reads用于组装,并进行基因预测。
2)从ftp://climb.genomics.cn/pub/10.5524/100001_101000/100064/1.GeneCatalogs/IGC.fa.gz下载得到IGC基因集。
2.2基因丰度分析
利用SOAPdenovo 2.04将经过上步骤处理的paired-end clean reads分别进行组装。将Kmers设为51、59及63,并筛选最优的组装结果。再使用基于从头预测的MetaGeneMark3.26对组装结果进行基因的预测,设置参数-k-r-a-d-f G。对多个样本样本进行比较分析时,就需要将每个样本通过基因预测软件预测的基因构建一个非冗余的基因集。由于测序数据有限会导致一些低丰度微生物不能被检测到,另外就是进行基因集预测时的错误,所以整合已知的公共基因集,例如HMP基因集、MetaHIT基因集、9.9M IGC基因集等,保证基因集的完整性,将有利于优化自身数据分析得到的基因集合。发明人使用cd-hit4.5.7软件构建非冗余基因集,设置参数-G 0-n 8-aS 0.9-c 0.95-M 0-g 1。Reads与非冗余基因集的比对结果,可分为两部分:a)Unique reads(U):reads只比对上一个基因的序列;这些reads被定义为unique reads。即,如果这些序列来自同一基因,发明人将这些reads定义为unique reads。b)Multiple reads(M):如果reads比对上两个及两个以上基因的序列,定义为multiple reads。即,如果比对上的序列来自不同基因,发明人定义这些reads为multiple reads。
对于基因G,其丰度为Ab(G),与特有的U reads和共享的M reads相关,丰度的计算方式如下:
Ab(G)=Ab(UG)+Ab(MG),
其中,G表示基因的编号,Ab(G)表示基因G的丰度,Ab(UG)表示所述测序数据与所述基因G的参考序列唯一比对的读段的丰度,Ab(MG)表示所述测序数据与所述基因G的参考序列非唯一比对读段的丰度;
Ab(UG)=UG/lG,
其中,UG表示所述测序数据中与所述基因G的参考基因唯一比对的读段数目,lG表示所述基因G的参考基因长度;
其中,MG为所述测序数据中与所述基因G的参考基因非唯一比对的读段的数目,i表示所述非唯一比对读段的编号,Coi为所述第i读段对应的丰度系数;
其中,Coi,G表示针对所述标志基因G,所述非唯一比对的读段i的丰度系数,N为所述非唯一比对的读段i能够比对的基因的总数,j表示所述非唯一比对的读段i能够比对的基因的编号。
对于这些reads,发明人以加和的N个基因的unique reads的丰度作为标准。即对于multiple reads,发明人把其所比对上的N个基因的unique reads丰度之和作为分母。
2.3关联分析/筛选基因标记物
为了获得与小柳-原田综合症密切相关的基因标记物,发明人利用小柳-原田综合症患者组(38例)与健康人组(36例)两组肠道微生物基因丰度数据,在微生物的基因层面进行小柳-原田综合症相关性研究。
基于上步骤得到的基因丰度表,发明人设置标准如下:(1)小柳-原田综合症患者组或健康人组基因丰度的中位数必须大于0.000001;(2)通过结合Benjamini Hochberg的多重检验的Wilcoxon秩和检验进行检验,得到每个基因和小柳-原田综合症的相关性p值;(3)使用一个相对严格的阈值(p_values<0.01)。然后,发明人得到168个与小柳-原田综合症密切相关的肠道基因标志物。其中在小柳-原田综合症(AS)患者中富集的有130个基因,在健康人(HD)中富集的有38个基因。这168个基因标记物中的p值最小的top20如下表1所示。
表1
基因分类(Taxonomy) | p值(p_values) | 富集人群(enrich) |
VA34_GI_0040061 | 0.000425954 | AS |
BA10_GI_0013173 | 0.000500304 | AS |
VA25_GI_0016190 | 0.000711441 | AS |
N32_GI_0030737 | 0.00076899 | AS |
BA17_GI_0002745 | 0.000912023 | AS |
VA1_GI_0075627 | 0.000941149 | AS |
N56_GI_0042330 | 0.001007127 | AS |
VA22_GI_0039179 | 0.001068463 | AS |
VA16_GI_0029542 | 0.001099109 | AS |
BA16_GI_0028069 | 0.001125695 | AS |
BA20_GI_0045187 | 0.000203995 | HD |
BA20_GI_0083501 | 0.001606097 | HD |
N27_GI_0098854 | 0.002030412 | HD |
BA15_GI_0007653 | 0.00216033 | HD |
BA15_GI_0000750 | 0.002573261 | HD |
N44_GI_0089468 | 0.002604852 | HD |
BA19_GI_0001358 | 0.00285332 | HD |
BA11_GI_0010089 | 0.00318234 | HD |
BA15_GI_0011964 | 0.003456418 | HD |
BA15_GI_0006265 | 0.003789653 | HD |
实施例2基因标记物的验证
为了证实实施例1中的分析结果可以用以作为小柳-原田综合症基因标志物,进一步比较验证群体中的17个小柳-原田综合症患者及16个健康人的粪便中基因丰度,并对获得的基因标记物根据验证情况进行筛选。验证群体测序数据的获得与处理,均参照实施例1进行。
验证结果如下:上述富集在健康人群中的38个基因中,2个在验证集中得到高质量的验证(p_values<0.05),验证群体中在健康人富集的基因标志物的p值如下表2所示。
表2
基因(Taxonomy) | p值(p_values) | 富集的群体(enrich) |
N58_GI_0017314 | 0.0394674348322114 | HD |
N44_GI_0089468 | 0.046499251279071 | HD |
对于上述富集在小柳-原田综合症患者中的130个基因,其中7个在验证集中得到高质量的验证(p_values<0.05),验证群体中小柳-原田综合症患者富集的基因的p值情况如下表3所示,分别为BA15_GI_0053852、VA1_GI_0075627、BA16_GI_0058798、BA20_GI_0078082、VA34_GI_0040061、N29_GI_0014293和BA20_GI_0050287。
表3
基因(Taxonomy) | p值(p_values) | 富集的群体(enrich) |
BA15_GI_0053852 | 0.01357467 | AS |
VA1_GI_0075627 | 0.02225647 | AS |
BA16_GI_0058798 | 0.026482727 | AS |
BA20_GI_0078082 | 0.030888433 | AS |
VA34_GI_0040061 | 0.033045066 | AS |
BA20_GI_0050287 | 0.039028045 | AS |
N29_GI_0014293 | 0.039139052 | AS |
发明人认为,可以将从健康人富集的2个基因标记物,作为小柳-原田综合症患病的反向指标,或作为研发治疗小柳-原田综合症的相关基因制剂的药物成分,或作为检测小柳-原田综合症、监测小柳-原田综合症进程的恢复指标;将小柳-原田综合症患者富集的7个基因标记物,作为小柳-原田综合症患病的正向指标,用于小柳-原田综合症简便、非创伤式的检测和诊断。
发明人利用这9个微生物的基因标记物,构建一个综合指标,估计ROC(Receiver-operating characteristic)曲线下面积AUC,AUC值越大,表示诊断能力越高,通过AUC值反映小柳-原田综合症的诊断能力。分别对一期(第一阶段)的74个样品和二期(第二阶段)的33个样品进行评测,具体情况如图2所示,两者均表现出了很好的诊断能力,在一期得到AUC=84.6%,如图2a所示,置信区间为69.2%-100%;二期得到AUC=80.0%,如图2b所示,置信区间为50.3%-100%。
上述基因集中基因的分别包括如下所示的核苷酸序列:
BA15_GI_0053852:
ATGGGCGGAATAATGATGGAAGGAGTGACAGTTCATCCCCTGAAGCATATTGTCGTACCCAAAGGGGATATTTATCATGCTTTAAAATCTACTGATGAAGGTTATGTCGGATTTGGTGAGGCTTATTTCTCACAGATAGAACACGGTGCAGCCAAAGGCTGGAAACGCCATAACCGCATGACCTTGAATCTGGTTGTGCCCGTCGGTGCTGTCAAGTTCGTAATCTATGATGACCGTGAGGGCAGTCCCACCCGTGGGCAGTTTGAAGAAATAACCCTGTCACCTGAAAGCTGCTATCAGCGGCTTACTGTAGCTCCCGGACTATGGATGGCCTTTTATGGAGAGGGGGAGGGCATATCCATGCTGATGGATATCATACCTGAACCTCATGATCCTTCGGAAGCAAGCCGGATGGAGCTGGAGGCGATAGACTATAAATTTTAA(SEQID NO:1)。
VA1_GI_0075627
GCTAACAATAGGATTAATTTTATGGGCTATATTCAACCTTTTGATCGTAATCAACTGACTCTTCCCGAGTCTTTAGATTCTTATATCTCTTGTGAGAACCCAGTTCGTCTGATTGATGTTTTTGTCGATCAGTTTATCAAATTGCACCCTGATTTTTCCTCTTATAAAGGTAACAGTCCTACGGGCCGTTCTGCTTATAGCTTTGGTACTTTACTCAAGCTGTATGTCTACGGCTATTTAAACAGTATCAGTTCTTCCCGTAAACTGGAGCGCGAGACTCTGCGTAATATGGAGTTGATCTGGCTTCTGGGTAATCTCCATCCCGATCATAAGACTATTGCCGATTTCCGTTCCAAACAAACTTCGGGCATCCATGAATGTTGCCTTGATTTCCGCCGCTTTCTGGTCAGTTCCGGTTATATTTCAGGCAAACTGGTAGCTGTTGACGGCAGTAAAATCAAAGCCAATACCAATCGTGACGGTCTTACTTTAGATGGTATTAATCGACAGTTAGCCTTGTTGGATACCCGTTTAGAGAAGTATCTGCACCAGCTTAATGAAAATGATCTGGTGGAAACAGCCCAGGAACAATTATCCGAACTCTCGGACGAGCTCGGTGTGGAGAGCTCCCTACTGGAGAAGATAGCCCGTTTGAGCCAACAGGTTGAAGAACTTCAGGCGGAAAAACAGCGTATGCTGGATGAAGGTTCCCAAAGAAGCTTTCCCTCTGACCGCGAAGCTCGCCTGATGAAGACCCGTAACGGTTTTCTTCCGGCTTACAATGTCCAATCAGTGGTAGATTCCCAACATCACCTGATAGGTGCCATGCAGGTTACCGACCACCCGAATGACTTTGAAGACCTTCAACCTTCGATTCATGCCATGCAGGAAGACCTTCAGGTAGAAGTAGCCCAAGCCGTTGCCGACACCGGTTATGCCAATGAAGAACAAATCCTGGCCCTTGAAGAAGAAGGCAAAGTGATTGCCGTTCCTTTCAATGAAGGAGACCATTCTCCTAAAGAAGATCGGGAGCACGGAATCTTTTTTACCTATGATGCAGACAATGACTATTATATATGCTCCCAAGAAAAAATATTACCTATTAAAGACAGGCAAGTTCGTAAACATGGAAAGCTTTATAGAAAATATCAGGGAAGAGACTGCAAGGGTTGTCCTCTGATAAAGTTCTGCACCACATCAAAAAAAGGCCGGATTATCTACCGAAGGGCAGATGCAGAACCCATAAGACAGTATATGAAGAAGTGTAAGGGGATGAAATACAAAGCGCTTATACGGTTACGAAAAGCATTGGTAGAACACCCCTTCGGAACTCTTAAATACTGGATGGGGCAAATACCACTCCTACTCAGAGGAAAGGAAAAGGTACAGGCTGAAATAGATTTGTACGCAACATGCTATAACCTAAAAAGGGTGACTAACATTCAAAGCATACAGGTACTATTGCAACAAGTCCACTATTGGGGTATTAAGTATACCTAA(SEQ ID NO:2)。
BA16_GI_0058798
ATGCGCAGTACATTCAAGCTCTTATTCTACATCAACCGTAACAAAGTGAAATCGGACGGCACGACCGCCGTCCTCTGCCGGATCAGCATTGACGGCAAGAAGTCAGCCGTTGCCACCGGCATCTATTGCAGGCCGGAGGACTGGGACAGCAAGAAGTGTGAGATCAGAACAGTCAGGGAAAACAACCGCCTCGCCGGTTTCCGTGACCAGCTGGAAAAGGCATACGATAATCTGCTGAAGCATCAGGGAGTGGTCACGGCCGAACTGCTCAAGGCCACCGTGTCAGGTGCCAATTCCGTGCCGGAATACCTCCTGCAGGCCGGAGAGGTGGAACGCGAACGTTTGAGAATCCGCTCGGCAGAAATCAACTCCACCTCGACCTACCGCCAGTCGAAGAGCACGCAGCTCAATCTCAGACAGTTCATCGAATCCCGCGGAATGAAGGACATCGCCTTTTCGGACATCACCGAGGAGTTCGCCGAATCGTTCAAGGTCTTTCTTAAGAAGGAGCTGGGCTACAGGAACAGCCACGTGAACCACTGTCTGTGCTGGCTCAACCGGCTCATCTACATCGCCGTGGACCGGGAGATATTGAGAGCCAACCCGATAGAGGATGTGGCATATGAAAAGAAAGAACCGTTAAAGCTAAGGCACATCAGCCGGGGTGAGTTGAAGCGGATGATGGAAACCCCGCTGCCCGACCCGATGATGGAGCTTGCACGCAGGACGTTCATCTTCTCCTCGCTGACCGGTCTGGCCTATGCGGACACGAGAGCACTCCATCCCCGGCACATCGGAAAGACCTCGGAAGGAAGAAAATATATCCGCGTCTGCCGGGCCAAGACGGACGTGGAGGCGTTCATCCCGCTGCATCCCATAGCCGAACAGATACTGGAACTTTACAACACCACGGATGACGACAGACCGGTATTCCCGCTGCCGGTCCGCGACGTCCTCTGGTACGAGGTACATGGAATGGGCGTGGCATTGGGCATGAAGGAGAACCTGTCCTACCACATGGCCCGCCATTCGTTCGGAACCCTGATGCTGTCCTCCGGCATCCCGATAGAGAGCATCGCCAAGATGATGGGCCATACGAACATCAACAGTACGCAGGTCTATGCACAGGTTACCGACCGGAAGATATCCGGTGACATGGACCAGCTGATGAAAAGAAGACAGAAAGGGGATACGGTCCTTCTGACGGAAATGTCCGAATAA(SEQ ID NO:3)。
BA20_GI_0078082
ATGTTAGCCTATACTTATATCAAGAATGGCACGTTCCAGATGATGGAGAAACCCGTGCCGGAAATAAAAGATCCGCGTGATGCTGTGGTACGCGTCACACTGGGGAGTATCTGTACCAGCGATTTGCATATCAAGCATGGAAGTGTACCCCGTGCCGTACCCGGTATTACAGTCGGTCATGAAATGGTGGGTATTGTCGAACGGGTAGGAGAGAAGGTCACTTCCGTAAAGCCTGGCGACCGTGTGACGGTCAACGTGGAGACCTTTTGTGGAGAGTGCTTTTTCTGTCGTCATGGATATGTAAACAATTGCGAAGACGAGCAGGGAGGCTGGGCATTGGGATGCCGCATCGACGGAGGACAGGCAGAATATGTGCGTGTCCCTTATGCCGATCAGGGGTTGAACCGTATTCCCGAGGGAGTAAGCGATGAGCAGGCACTTTTTGTAGGTGATATTCTTGCCACTGGTTTTTGGGCAGCACGTATCTCCGAGATTTCGTCCGACGATACGGTGCTCATTATCGGAGCCGGTCCTACAGGTATATGCACCTTGCTGTGTACCATGCTGAAACATCCCCGGCGTATCGTTGTATGCGAAAAGTCGGAAGAGCGTATCCGCTTTGTACACGAGCATTATCCGGAAGTAATCGTGGTGCGCCCCGAAGAATGTGTCGAACAGATACGCAAGCTCAGTTCACATGGAGGAGCCGATGTCGTCATCGAAGTTGCAGGAGCGGAAGATACCTTCCGGCTGGCGTGGGAATGTGCCCGTCCGAATGCCATCGTTACCATCGTGGCACTTTATGATCGCCCCCAGCAACTTCCATTGCCCGATATGTACGGAAAGAACCTGACTTTCAAGACCGGTGGTGTAGACGGATGCGACTGTGCAGAGATTCTTCGCCTGATAGCCGAAGGCAAGATTGATACGACACCACTCATTACCCACCGTTTTCCGCTTGACAAGATAGAAGAAGCATACCGTATTTTTGAGAACCGGCAGGATGGAGTCATCAAAGTAGCCATTACGGAGAAAGCAATGTAA(SEQ ID NO:4)。
VA34_GI_0040061
GTGGAACACAAACATCACAAAGTAGTTTCTGAGAATGCTTCCGTCTCGTTTTTATGTGTAGATTTTCCTTTTGCACCACAGGCCTCAAAGCCCTCCAAATGTCCACTTGCAGATTCTAGAAAAAGAGGGTTTCAGAGCTGCTCTGTCAAGAGGAAAGTTCAATTCTTGAAGTGGAACACAAACATCACAAAGCAGTTTCTGAGAATGCTTCTGTTTAGTTTTTCTGTGAAGATGAACCCGTTTCCAACGAAATCTTCACAGAGGTCCACATATCCACTTGCAGAATCCAAAGAAAGAGAGTTTCAAAACTGCTCCATCAGCAGGATTGTTCACCTCTGTGAGTTGAATGCAGTCACCACAGGAAACATTCTGAGAATGCTTCTGTCTAGGTTTGATGTGAAGATATACCCGTTTCGAAGGAAGGCCACAAAGTGGTCCAAATATCCACTTGCAGATTCTACAAAAAGAGTGTTTGAAAGCTGA(SEQ ID NO:5)。
N29_GI_0014293
ATGACAAACGGCTGTCCGGCGGGAGGTCTGGATTCTCCCCGACGTTGCCGGGATTGTGATATATCAGGTCATGGAGATATTGGCAGACTGCATTATCGGGATAATGACATACCAAGTTACGGATATTGTGATAGATTATGTCGTTGGAGTGTGGAAGTTGCCATAGGGAGGCTCTTTCAGCAAACGGAAGTACGGAAGGTACAGATATTATTGCAGCCATCATCAACAAAGACCGGAACATCACATTGGGAGAACGGTGCTTATCTGCGATATGATTATCATTTCCTCCAGTCATTTTGTATTGAAAGACCGGGAAAAAGTGGTGACGGGTTTGTAACTCTTTATATTTGTAGCTTTGCTATCGACCAGGGCAATGAATAG(SEQ ID NO:6)。
BA20_GI_0050287
ATGAAGTTTATCCATATTATCTGCCTTTCGCTGGCGCTATCAGCCAGCAGTTTAAGTGCAACGGTATCGGCACAGACCGGAACCGGATATTTTTTGCATACCGTGACAAAAGGACAAAGCCTGTACTCCATTGCCAGCATGTATCACATTTCGGTTGACGACATTGTACGCCTGAACCCGGGAAGCAAGGAACAAATACGTGCCGGACAAGCGTTGAAAATTCCACAGGCACAATACTCCAATGAGGACGGAAAACAGTTCCATACGATACAGGCAGGAGAAACATTATATCAGCTGACACTGAAATACCACGTAACGGCCCAGGCTATTTGCAAAGCCAATCCGGGATTAAGTGCCGAAAACTTCCGTATCGGTCAGGTTATTGTCATTCCGGCACAGGATAATACACCCGCTCAGACAGAACAAACTGCTCAAGCAGAGCCGGCAGTAAAGAAAAACGAGTGGAGGGATATGCACAAGGTAGCCCGAAAGGAAACGATTTTCAGCATCAGCCAGCAATATGGCATCACACAGGAAGAACTTATTGCAGCCAATCCGGAATTAAAGAACGGAAAGCTGAAGAAAGGAAGCTTCCTTTTCATTCCTTACCCTAAATCACAGGAAACAGGAAAGACAGCACCGTCTTCACAGGCAGCTCCCAGCAACGAAGAACTCTTCAAAGAAAATTCTATCAGCAAAAAGCAGATAAATACCATAAAAGTTGCTCTGATGTTACCTTTTACATCTACCAGTCAGGATGAACAGTCACGCATGGTAGAGTTTTACGAAGGTTTTCTTATGGCTATTGATAGCCTGAAACATCAAGGAGTATCTGCCGATATTTACACCTACGATACCAAAGGAACCACAGCCGGCACGAATGCAATCTTATCCCAGAGCAAGCTGAAGGATATGGACATCATTTTGGGTCCGGCACACCAGTCATCCATCGCTTCTGTCGCAGCCTTTGCCGACAAGAACAATATCCGTCTGGTAGTTCCTTTCTCTCCTAAAGTAGATCAGGTATTTACCAATCCGAATATCTATCAGGTCAATACCCCACAGTCTTATCTTTATTCAAAGGTATACGAACATTTTATCCGGAAATTCGGAAAAACCAATGTCATTTTCGTTGACGATGGCAGCGGAGATAAGGAAAAAGCCGAATTCATTAAAGGTATGAAGAATGAATTGAAAGACAACAACGTCAGATTCAAGCAGATACAGCTAGCCGGAGATATTGATCCGAACAAAGTGATTGCCGCCATGGACACCCTGCAGGAAAACATCTTTATTCCGACTTCAGGACGAAGCTCAGCATTGACACGCGTACTGCCTCACCTGACTCTTGTCCGCCGCGAGCATCCGCATTTCGACATGCACCTGTTCGGCTATCCTGAATGGCAGACTTATACACAGGATTTCCTGGCAAACTTTTATGAGTTGGATACCTATTTCTACTCATCGTTCTATACCAACAACCTGTTTCCGGCTGCCATCAATTTCACCCAGTCATACCGCCGCTGGTACAGCAAGGATATGTCGAATACTTATCCTAAATATGGCATGCTAGGATTCGACGTGGGATATTTCTTCCTGAAAGGTCTGTCGCAGCAAGGCAACAAGCTGGAAGAAAATCTAAACCGCGTACAGGTAACTCCGATACAGACCGGATTCTGCTTCGAACGCGTCAATAACTGGGGAGGGTTCATCAACCGTAAAGTATTCTTTGTACATTTCACAAAAGATTACGAACTGATTAAACTTGATTTCGAATAA(SEQ ID NO:7)。
N58_GI_0017314GGAATATATGAAATGATAATCCTCAATCATACCACAAAATATTTGTTTATAGAATGGGATGACGGATGGAACACGGATTTTTTTACTTTACCTGTCATTGGGTTTGCAAGTACAAATTTAAATTTTAAGTCCGTTTTTGTCCGCTTCGTCCGTGTAGTTCGCATTCCATCCCCCCGTTTTATAAATTTCCATTTATCATCCGGTGGTATGATTGCGGATAATCATTTCAAATAA(SEQ ID NO:8)。
N44_GI_0089468
ATGCCATCCGGATCACACCATGCTTTCCCTGCCGAAAAGATGCCGAAACGCAAAAAGCCCCCGGAGAGCCTTTGGGTAGCACTGCTCCCCTGTCATATACTCATCCTGCCACAGACTACCTTTTTCTACAAGCAGAAAACGATTCTGAACCCTCTTTCCCCGTTCATATTGTATGGGAGAACGGTTTTGGAGGTGTTCCGTATGCTGTTGACCCTGCTGCAATTTTTTGCATCCAAATTCCTCGTGCTTGCGCTCCATCTGGAAGCGGGCAGTTTCCCCCGCCCGCTCAGCCCACAGGAAGAGATCCGGACTTTCGCCGCCCTGCGGGCCGGCGATTCATCCGCCCGGGAAAAGCTCATCCGCCACAATCTGCGCTTAGTGGCGCACATCGCAAAGAAATACTATGCTCTCCCCTCTGAGCAGGACGATTTGATTTCCATCGGCACCATTGGCCTGATGAAAGCCGTGGACACCTTCGACTCCACCCGCCGGGCGCGCTTCTCCACTTATGCCAGCCGGTGCATCGAAAACGAGCTCCGGATGCACTTCCGGCGGGAGCGGAAGAACGCCCCCACCCTCTCGCTCCAGGAGACTCTTGATGCCGGAAAAGAAGACTCTGCCCTCACCCTCGCCGATGTGCTGCAGGACGGCTTCTGCATGGAGGACAGCTGTGAAAAGCAGGACGACGCCCAG(SEQ ID NO:9)。
BA15_GI_0007653
GTGAAACAATTTATTATGATGAAATCTTTAATAATCACCTTATTATGTAGTTTTTGTCTATCAACTACTAATGCGCAAAGTTATTTCCGCCAGTGTGGTATCCAACTACTTACCAAACAAAACGGATTGAGCAACAATACATTGACTGGAATTTATCAGGATAAAGCCGGCTTTTTATGGTTAGGAACCGATGTTGGACTAAGCCGCTATGACGGAATACATTTTCATAATTACAATCTGATTGATAAAGAGCCACGTGCCTTAACTCATTTATATGAAACATCAAACAATCTGCTATGGTCTCATATCGCCAATTTAAACCAAATAGCCTGTTTTGACAAGATGCGTGGAATCTATATGCCACTTATCTCACCTACTCCTGAGGTATTGCAAGATATACAGGATATATGTGTACTGCAAGACAAATTATATGCCTTGACCTCCAATGCCATAGTAGAGTTAAATATGGAGAAAAATGCAGATGAAATAAGACTGACTGCCCAACTGCTTATAGATATAAAAACAAAAGTCCTAGGACTTTATAATAACGAAGATATTTTATGCGCACTGACAGCAGAGAATCAAATCTTGCTTTATAACGTTTCCGATAAAAGTAGCGAGCATATAAATGGAACCGATCTAGGTATTGTGAAAGCCGACAACATTGAAAAAATACATATATATAATGATAATGTGTGGATTTGTGACCAAACCGAAGGAATCATCTGTTATAATACAAACACTAAAACATCACGCACACTGAATGATAACAGCCAGTCATCCTTCATTCAAAAAGATATACGCGATATAATCCAAATAGATAAGACCACATTCATTATAGCCACATGGAGTTCACTGTCAGCCATAAGATTTGAAACGGACAACTACCTCCAGTCACCATTCCACATTGTAGATCTGACCCAACATGATTCTTACTATGCCCCCATCCTCAAAAACAGAATTACCGACATTCATTTTGACAAGTCCAACAATGTGCTTTGGGTAGGAACTTTCGGCAGAGGATTGCTGAAACTGAATCTCAAAGGAAACGATATCAACCGTATCCCGTTGAACGATGAAATAAGATATGTGAATAGTATAGCACAAGATGCCGACGGATACATCTGGCTGGTCACCGAAAAAGATGGCATATATAAAAGTACAGAAAATAAGATCTCTCCTAATCTGCACTTTTCCTTATGGGAGAAAAGTCACAAGAATAATCATTATTGCCTGCACAAAGATCGCAATGGAGGATTATGGTTCGGCGATGACAAAGGAAACATCCTTTGGGTAAATCCTACTACCGGTGAAACGGTGATTCACCAACTAAACCCCGAAACAGCAGACTCTGCTGTAACTGCTTCTATCTTGAAACTATATCTAAACTCACAAAACCATTTATGGATTGCCACCGAAAAAGGAATAATGGTCTATAACCATCAGACACACGAATGCATAGCAGCACAACCTTATACGAAAGAATTCAAAAAAATAACCGCTATATGTGAAGATGGAGATGGAACCATGTGGCTAGGTACTGAAAAAGGAATACACCGTGCCAGCCGTAAAGGAAAACAAATAAAATTCACCGGTGGTTATGAAAAGGCAAGAAACCTGACACCCGGAAAAGTATTGGCACTTTATCTGAATAACTATAACCAATTGCTTATCTCATACACTGATAAAATTATCCAAATAGACGGAAAAGAGAAAACCATATCCTCTATCATGATCTTACAAAAAGACTTGCCTAACGGACACATAAGCTGTATGATAGATGATAAGAACGGAAATACCTGGCTGGGAAGCAATGCTGGTTTTATCACATTGAATAACAAGAACAATGCATCATATACCTACGCATTACCGGAAAGTTATTACGATGTATGTCGGCTGAATGACGGGAAATTGCTATGGGCGAACTCTACAGGATTACTCTATTTTGAACCGCGCACTTTAAAAGAAAGTTCAAGTAACTGCCAATTCCATATCTCCGATATAGATATTAATTACAATAAAGTAGAAATAGGAGAAAAAATAAACGGACAAGTCATTCTGGACAAACCTGCGTACCTGATAGAACATTTATCTTTAGACTACAATAACAACAACCTGATTCTCTATTTAAGTGATCTGAAATACGGAACCTCGCCCAACACAGTGAAATATCGCCTGTTACCCACAGAAGAAAAATGGAATACGAATTATGACGATCATATAAAACTCAGCAATATCCCTCCTGGGAAATATGTACTGGAAATACGCTCGTCTTATCCGTTGGAAGAAAATAAACAAATAACCCGGTTATCTATCAATGTAAATAGATATTGGGCTGCAACCGGATGGGCCATCGCTGCATACATCCTGGCTATTATCATTATTTCTTTGCTTACATGGATGTACTTTAACCGGAAATTACAGAAACGGCAAGTTTACAAGGCCAAAGAAGTGAAACTGAAAGAAAAGCTGGAAGAAGAAACGGAAATAAGAAAAGAAGAAGAGAAAAACCATCAATTGCGTGACCAAATCAGATATATGCTGGCACAGGAATTACGCACCCCGTTATCACTCATCACCGCTCCGTTAAAAGAAATGATTACTAATACAGCCTTCCCGGAATCATTCCTGCAAAAAGCAAAAATGGCCTATCGGAATTCAATCAGCCTGCAAGACATTTGTAACCAGCTATTGAATATTCATCAGCAAGAAAGTTACAGTCCTAAATTGAATGTGGCCCCTTATCCTGCCAGCGTGATAGCCGACACTGTAGTGCGTGCATCTCACGAACTACTGAACGTCAGTCCCATTAACCTGCATTATGACAAAGACAACAAAATAAATACGGAAATATGGATTGACCGGAAAAAGATAATCTTTATTCTAAGCAATATATTATCCAATGCCTACCGGCATATCTCGTATTCCGGTTCCATCCACTTTACTGTAAACACCAGTACTATCAACGGAAAAGATTTCTGCCTTTTTACTATAGAGGATGACGGGAAAGAAATGATAGAAGAGTCCTCTGTCATCTTCCTTGGATCGGACAATTACAATCCTCCAAGCAACCGGCTACATCCCGAATTAGGCATTGAAATTATGAAAACGACAATACTAGCCCACCACGGCGATATCCAAATCACTCAAGAAAAAAACAAAGGAACCCGAGTTGTTCTTTATATCCCTCTAGGTAAACAACATTTGAAAAATGATGAAAACGTATGTTTCATCGAACCCGAAACAATAATGGAAGATTCAGATAAAGCAATGATTACTGCAGAGGATAAAAGACAACAGGAAATAGCAAACAGTATAACCGCCAAACCTATTGACAACCCCGAAACCAAATACAAACTACTGGTTGTTGAGGACCATGCAGATATCCGCCTCTATCTGAGAGTATTATTTTCTGCCACCTATAATATTATTATGGCGGAAAATGGGGAAGAAGGAGTAAGAATGGCACGTAAAGAAATACCGGATCTTGTAATAACGGATGTCATGATGCCTGTCATGAACGGTTTTGAATGTTGCCGTATCCTGAAAGAAGATCTAAAAACTTGCCATATCCCTATTATTCTGCTGACAGCTTTGACAGATGATGAAAATATAGTGAAAGGAATAGAATTAGGAGCTGATGACTATATTCTGAAGCCGTTCAATCCGGAGATTCTCCGCACTAAAGTAAAACGTTTAATAAAAAGCCGGACTGAACTGAAACGGATTTATACCAAACTACTAATGCCTTCCATCACCGTCAACGGCTCGCAAGAAGAGAATACGGAAACAATCATCATAGAAGACCCGTTCATCACACAAATTCTGAATATTGTAAATGAGAACCTGCAAAACCCGGAATTCAATGTGAAAAAACTGGCCGAAATGCTGAACATGAGTCAACCTACCCTTTACAGAAAAGTAAAACAACTCACTAATTTCACTATCATAGAATTAGTAAGAGGAGTCCGGTTAAAACGTTCTGCCGAATTACTGAGAAGCCGCAAATACAATGTTCAGGAGGTAGCCGAAATGGTTGGTTATAATGACATCCCCACCTTCAGAAAGCATTTTGTCGATTTCTATGGCACCACTCCCTCTACATTTAATAGTAAAGAAGATACGGAAGATAAAAAATAA(SEQ ID NO:10)。
VA25_GI_0016190
ATGAAGAGAATAATTATCAGTTTTATCGCTTTCTTTCTCTTGCTCTGCATCCCAATGGCGATGCAGAGCAAGAGAAGCACTCCTATCTTACTCGATGACGACAACACTGCTACCGGGATTCATGGTTATGTAGAAGATTCATTGACCCATAACCGTCTAGCCAACGTCTCCATCACGCTGCTCCGCAATGGCAAACCCTTGAAGTTTACAAGAACAAAGGAGGACGGAACCTTCGTGCTTTCTATCACCGAAAAGCAAGCCAACGACAAACTGCAGGCCACGTTTATGGGGTATAAAAAGACAAAAACATCGATTTCATCGGGAAAAGAAACCATCATCAGTATGGCTTCAACAGCTTTTGTTTTGAAGGAAGTACAAGTAAAAGGCTCTCGTATCACGGGTCGAGACACCATTTCTTTCGACCTCACCCGCTTTGCCAACGAACGAGATAACTCACTGAAAGATGTACTGAAAAAGCTGCCAGGCGTGGATATAGAGAAGAATGGTCGTATCAACTACAATGGTAAGCCCATCAACCGATTCACTGTGGAAGGTCTCGACCTGACCGGTGGCAAATATAACCAACTAGAGGAGAACATCAAGGCAAAAGACGTAAAAAAGGCCGAAGTCATCGAGCATGACCAACCTATCAAGGCGCTCCAAAGCAAGACCTTTACGGATAATGTAGCGATGAACATCGCCCTGAAGGATAGTGCCCGCGACAAACTGATGCCCACCCTCAAGCTCTACATGCTCGCAGGGCATCCGTCCCACGTAGGCGGAAGCATCAATATCATGCAAATTGGCAAGAAGAAACAGATGATGTATGATGCAGAATACGACAGAACAGGTAAAAATCTCGGCTATGCACTTAACCAACTTGCATCTTACAGCAATCGTCTGGCTCCAGCCTCCCTTCCATCATGGGTATCGGTGCCATCGCTTGACGCTCCTATCGACGAAGAACGCCTGCGCTTCAACACCTCGCAAAAATACTCCATCAACCATATCAAGAAGAACAAGGACGATACAGAGACTCGCATAGAAGCCAACTATCTTCGTACGGTAACCAGACAAGAGCGAGAGAACATGAGTATCTACGACCTCGGCGGCGAAGCTCCCACAGTTACCACGGAGCACAACCACAAGACGATGATCAGCGATGCCTTCAATCTGCAATGGGAGAACAAGGTAAACAAGGCTGAGCATTATGGCAACGAGAGCATCAGCCTCAGCACAGCACAAAGCGACGGTTTGTCAAACATCAACGACACGCTTACCCAACGTGTCCGCATCCCAAAGCTCGACCTATCGGCAAGTATCTACCGCCTCTTCGTCTTCAAGAAAAGTCAACTCTCTTGGCGTAGCACTGCCGACTATCACCATGGTGTGGCGGACCTCTACGTTAACGACGAGCGGAATCGCATCCGCACCAACCTTTGGCATACTGCCCACGCCTTACAGTGGATGAAGAATCGCTTCCACTGGACACAGGAATATAGAATGAGTATCGACCTCAACAACATCTATGCGAAATATCAGGAAAGAAGCGATGAAATCGGCAAAAACAGTCTTAACATCACAGGGAAGTTCACCCCTTACTGGCAATACAAGACCGAGACGTTCCGTATGTCGTTCTCTCCCGATTTCATCTGGGAACGCTTCACCTATCCACAGAAGACTCTACTTACCGTATCACCCTACCTTTACTTATATAAGAAATTGGATTTCCGTAGAGAGTTGACTATCTACACAGGATACAGCACTGGAACAGGCAATGCCACCAACTACGCCATGAAGCAATATCGTCAAAGTTATCGCTCTTGGTACGCTTCGAGCGACATCATTCCGATAACTCGCTCTCTTTATGGCAAGTTGAGTTACGACTACAAGCGCCCTATCAAGGAAATCTTCTTCAGCGCATCGGTCAATGCCAGCAAAAACTGGATGAACACGGCATCCGACCTACGCATCGAGGATGGCAAATACTATACCTCATTATATAAGCAGGACAGCAAGAGCAACAACCTAGGGGCATCACTCTACATATCGAAGGGCTTCTACGACCTTCATCTGAAGACCCGCCTGGAGGGCAGTTACAACTACAGCAAGGGTGAGCAATACAGCAGCGGCAAAGCCATCAGCTACACCGCAGACAACTATACTGTGAAGCCTAGCATCGACTTCTCGCCGTCCTGGTGTGCCTTTAGCTATGAGGGAGAATTCTCTTTTTACAACTCGAAACGTCAAAAAATGGCGAAATCATCGTTATTTAATTGGCACCAAAGCGTATCTGCCACCGCTACCATCAGCCATGTGGACCTCTCCTTCTCGCTCGTACATTATCACAATGAGCTGCAAGAGAGCAACCACCTAAACACCCTTCTTGGCGATGCCTCGGCAGTTTGGAGAATGAAAAAGCTCCGCCTTTCAGCAGAGCTTCGAAACCTTTTCAACAAGAAGAACTATATGGAAACCATCTATAGCGGCATCAGTACATTGACCGACAGCTATCATCTTCGCCCTCGCGAACTGATGATTTCCGCCCAGTATTCCTTCTAA(SEQ ID NO:11)。
BA16_GI_0028069
ATGATACGAGATATTATAAATCAAAATGAAGAAGCGCAACCTACTGACAGAACGTTAGGATTGCTACACCGGGACTTTCCGCAATGTTTCAATGCAGAAGGCAAATTTGATATAGCTGCTTTTCGTGAGCTACTAACTGACAAAGTAGACCTTATAAAGGAAGGTAGCGGCTTTAACTTTCTTGGCAAGAACTATGCCAGTCTGTTGGCCTCGATGGATACGACTACCGTATTAGTGCCCGATCTGGAACATAACAGCAAGCCGGAGAATATAAATAGTCAGAATGTGTATATCAGCGGCGACAATCTTGACGCGCTGAAGCATCTGGTAAAGTCGTATGCCGGTAGAGTGAAATGCATTTATATAGATCCACCCTATAATACAGGTACTGACGGATTTGTATATAATGACAAATTCAACTTTACAGTGGAAGAATTGCAAGAGAAATTGAGCATCGGTGAGGAACAAGCAAACCGTATTCTTGCAATGACAACCCGTGGTGCTGCTTCGCACTCAGCATGGCTTACCTTCATGATGCCCCGTCTGCAATACGCTAAAGACTTGCTCTCTGACGATGGAGTGATTTTTATCTCTATCGACGATAATGAGCAGGCTAACTTGAAGTTGCTGTGCGACCATGTGTTTGGAGAGGAAAATTTTGTGGCTCTATTCCCATGGCGGAAAAGAACGGCAAAGTCAGATGTTCCATTCGGAGTATCAAAAGATTACGAATGGATAGTATCATACGCCAGAACAGATTCTTTTTTGGCTGGTATCGATGGAAAGGGAAGAAAATATTACGAAACAGAAGATTTTCCCGGACAACCTTGGAGAGTGCATGATTTGACAAAGCAGACTACTGCATCGGAACGCCCCAACAGTTTTTTCACAATAAGGAACCCTCAAAACGGTAAAGAATATCCAGCAAACCCGAAACGTACTTGGTGCATTACACAGGACACATTTGATTCTTATTATGCACAAAAAAGAATCGTATTCCCCGGTGATTACGATTTCCTAAAAATAGATAAGCCCGTGCTCCGCTATTGGAAAGACAATGATATGCAAAAGGCTGGTGACCGCTTCGGACAATATGCCGTCAGCACTCATCTTCCATCCCATATCGGCATGAGCCAAGACGGAACAAAGGATTTAGACGAGCTTTTCAATGCCAAGATTTTCAGTTTTCCAAAACCTGTAAGTCTCATAAAACACCTTATAGATGGAGCTGTAGAAAAGGACAAAGATGAACCGATCATCATACTCGACTTTTTCTCCGGCTCGGGCACCACCGCACAAGCCGTAATGGAACTAAACAGTGTGGAAGATGGTTATAACTTACAGTACATCCTTGTACAATTGCCCGAAAAAATAAAACCAAACACAGAGGCATACAAAGAGAAGTATAAGACTATCGACCAAATCGGCCAAGAGCGTATCCGCCGTGCAGCAGCCAAGATAAAGTCGGAAAACCATGCCGATATAGATTATGGCTTCAAGCACTACACACTCCAGGAGCCGGACGAAAACACGCTTGACCGCATGGAAAAGTTTGTTCCGACTGATGCTTTTGGCAATGATTTAGTGAAAGCTTTCGGTAAAGAAACGGTTCTTGCCACATACGCCGTGCGCGACGGTTACGGACTGACACCGAAAATAGAACCGGTAAAGTTTGGCAACTATACAGCTTGGCTCTGCGGCAAACATCTCTATATGATAGACCAAGGGTTTGATATACTGGGAGATGATTTGACAGAGCTGGTTGATAAATACAACAAAGACCATTCGTTCACAGCCGATACCGTCGTTATCTTCGGTTATAGTTTTAACTTCGGCCAGACGGACGCCATAAAGAAAAATTTGGGTGCCATCACCGACCGCAGCCGCATAAATATAGATATTCGCTACTAA(SEQ ID NO:12)。
BA19_GI_0001358
ATGATCATTATGAAAACAAAATTTTATTATTATATAAGCATATTATTTCTTTGTTTATGTCATGTCTCTTGTGAAGACTTTCTAGAAGAAACTAATAAAAGTGGATTGACAACGGATCCATTTATGAAAACGAAAGTTGGAATAGAGAGTGCGTTGAATTCCTGTTATTCGGGTGCAAGGACATTTTATGGTCAGGAAGATGGTTTTGGTATGACAGAATCTGGTACTGATTTGTTTTTGCGTGGGGGAGATAATAAAGCAAATCAATTGGCTGATTATACTATTGACTTAAATGGCTCCCAATCAACTATCGGAAATGTTTGGAAAAATCTTTATTTGTCATTAAGTGCTTGTAATCAGACTATTTCTTTGTTGCCAAGTGAAGTATTGACCGAAGCTGAAAATAAGTCATTTGAAGGCCAGGCTAAGTTTTGGAGAGCCTTCTATTTGTGGTTGATAACAGAAACTTGGGGAGACGTGGTATTGAACACAGAACCTATAACGGGTGCTGTTACTGAAGCACACCGTTCGTCTGTAGAAGATTTTTATAAAGTTATTTTTGATGATTTAGATGTGGCTGTCAATCAACTGGCACCAGGCAAATCAACAGATGGTAGAATAACTCAGGATGTAGCTAAAGCTTTTAAAGCAAGAGCTTGTTTGACCAGAGCTTGTGCAACGGGCGAGGCTTCGCTTTATGCTGAGGCCGCTATGTTGGCAAAGGATATTATCAATAGTCAACGCTATTCTTTCTATACTGATTATAGTGATATGTGGGATATTGCCAATTGTGATGGAGGTACAAACAAAGAAGCAATTTTTTCTATAAATTACACCAACTCAGAATTAGAAAATAATGCTTTTGATGCTACTGCTACTAATTCGGGTAATAAAGGGATTGTTGATTTTGTAATGAAATATGATAAGGAAGCCGGAATGGAACGCGATGTCTTGAATGCTCGTCCTTTCCAAAGATATATGCCGTCCAGGTATTTGCTGCAATTATATAATGAGAATATAGATCAGCGTTATAAAGTGACGTTTAAAGATGCCTGGTACGCAAACAAGAATCCGTTATCTGAGAGTGATTTAAAAGTTTATCCTTTAATGGCTACAGGAGATACGGCCATATATATCATGAAAACGGCTGCTACTGATTCACAAAAAGTATGGGCGTCAAAGCGGTATCGTTTGCTGGATGTTAATGACGTGTACACTTCGGAAGGTAAAGCTATCTTAAGGTCGCAATTTGTAGAAATGCATAAGTTTGCCGATCCTACGGCGGTTTATAATCAGGATTGGTGTCAACGGGATGCATTTGTCATTCGTTTGCCGGAAATGTATTTTATTGCAGCCGAAGCGATGCTGCAAACGAATAAACAGGAAGCAGTGGATTTGATGAATGAATTTTTGATGAAACGTGCAATACCAAGTAAAGAAAATGACATGAGAATTACTGAATCGGAACTGACTATCGATTTTATTTTAGATGAGAGGGCTAGGGAATTGTGTGGAGAACAAATACGTTGGTTTGATTTAAAACGAACTAAAAAGTTAGTTGAATACGTTAAGTTGCATAATATGGATGCAAAAGATAATATTCAAGAATATCATATGCTACGTCCGATACCCCAAAATCAATTGGATGCGGTGACTAATAAAGATGAATTCACTCAAAATCCCGGATATACAAAATAA(SEQ ID NO:13)。
BA20_GI_0083501
ATGAATAAATTATATAAATGGTGTTTGCTTAGCTGTATAGCAGCAACCTTGAGTTCATGTGATGATTTTCTGACAGAGGAAAATCCCAGTGGATTGACCGCTGATACTTTTTATAAGACTGCATCGGGTGCAGAAGCCTTGATTAATTCATGTTACACACCGTTGCGTTTCTGGTATGGACAGGAATATGCCACATCAATGACAGAGTTGGGAACGGATATATTTACTCGGGGAAATGGTTGTGCCGATGCTGAACTTTCCGATTATAACTCGTCATTACAAGGTTCCAGCAATGCGATAACTAAAGAGTGGGAACGTTTGTATTCGGCATTGAATACTTGTAACACTGCCTTGAACCGTTTGCCAGGATCCGAACTTTCAGCTTCGGTTAAAGATATCCGTATGGGGGAAGCCTATTTCTTGCGGGCTCTTTATCTGTGGCATATTGTAGAGACATGGGGAGGTGTTTATTTATCGACAGAAGAATGTACCGAGCCGTCAGGCTACGTTTACCGTTCGTCCGAAGAGGATTTTTATACTCAGATTATAGCTGATTTAAAAGAGGCGATGGCTAAATTGCCAGTTTCCACTTCCGACTATGGACGTGCTACTAAAGGTGCGGCCGAAGCGTTTCTGGCACGCGTTTATCTGTATAATAAAAATTATGAGGAAGCATTGAAATATGCCCGTAATGTCATTAACAATTATGATTATAGTTTGGCAAAAGATTATTCGGACCTTTGTGATATTTATAAATGTAATGATGTAAAAGAGAATGTGTTTGTTTGTATGTACACGAAGAGTGAGATATTCGGAACTTCCATTGAAGAAGGTCCTGATGGGAACCCCATCATTTGGAGAACACCGGGTAATAACCCTTCACATTTGTTGTGGGTGATGTGCTATGATCAGGTACTCGATAAAGACGGTAAGAAACCTGTTACGCGCTCCATAGAATATGGTCGCAGTTTTAACAGATATATGCCTACGCTGTATTATCTGAATCTGTTCGATGAAAAGATGGATGCCCGTTATGATGATGTGTTCCAGCAGGCATGGATTTGTAACAATACGAACAGTGCTTATATCTCACCGGGAGATACGGCTATTTTCTTTACTAAATATAGTGTGCCCGATGCAGAGGAAGCTAAACACAATTATATTACCATAGACAAGGATTTTGTTTACAATGCCGATGGTTCTATCAAAAATAGGGTTCAGAATGTGACTTTCAAAAAATTCCTTGATCCGTCTCGTGAGTCTGTGAATTATACGGGAAGTGTGAGACATGGTGTGGTCATTCGTCTTGCTGAGTTATATCTGATAGCTGCTGAGGCTGAATTATTCTTGAACGATAATGTCTCTGGAGCATCTTATATCAATGAGGTAAGAAGGAGAGCCGCTATTCCTGGAAAGGAAGCCGCTATGGAGATAAAGCCGGAACAGTTGACATTAGATTTTATTTTGGATGAACGGGCCCGTGAGTTGGGAGGAGAGCAGCAACGTTGGTTCGATTTGAAGCGTACTGATAAGCTGCTGGAAAGAGTAAAAGCATACAATCCGGATGCGAAAGTGAATATAAAAGAGCATCATTTGCTACGTCCTATTCCTCAGACTCAATTGGATGCCATTATCAATAAAGATGAGTTTGGGCAAAATGCCGGTTACAATTAA(SEQ ID NO:14)。
N56_GI_0042330
ATGCCTAACAGACCTTTGAAAATGAATAAATTACGCACGATCATTCGATTGTACACCGATCGCGTTGGTTTAAGGGCTATCGCCGAGATGGCCCGCACTTCGCGCAACACGGTAAAAAAGTATGTCAACAAGTGGAACACCCTCAGCCTTACCTATAAGGAGTTCCTTTCCAAGAGCGATGCCGAGCTTTACGCTCTGTTCTGCATCGAGGAGACTCCGGTGGAGTCCAATCCCCGTATAGACGCCCTTGAGGCTTTTCTTCCTTCTGCCAGCAAAGAGATGGGGCGTAAGGGTATGACCAGCCACAAGCAATGGGAGCGTTATCGCGCAGCCCATCCGGACGGTTACAGTCTGACGCAGTTCCGTGTCGCCTTGCGTCGCTACGAACGCATCAGCAACCCGTCGATGCGTATGGAGCATAAGGCAGGGGATAAGTTGTTCGTGGACTATACGGGCAGCAAGCTGTGGATCTACCCTCCGGGTGAACAACCCCGCGAAGTGGAGGTGTTCGTGGCGATCCTGGGATGCAGTCTGCTGACCTATGTGGAAGCTGTCGAGAGTCAGCGCAAGGAAGACTTTATCTCGGCCTGCGAGAACGCCTTTTATTATTATGGCGGCGTACCCAAAGCTATCGTTCCGGATAACCTGAAGAGCGCGGTTACGAAAGCCAGCCGTTATGAAGCGATTCTGAACACGGAGTTCGAGCGGTTCGGCGAACACTATGGCGTGACGGTATATCCTACCCGGGCCCGCAGTCCCAAGGATAAGGCCCATGTCGAGAATGCGGTTAAGCTTACCTACAAGGATATCTTTACTGTCATCGAGCCGTTACACTGTCCCGATCTGCGGTCACTTAACATAGCTATCCGTGCGGCTCTTGAGAAACATAACAACCAGAACCGTCCGCGGCGCAACTACTCCCGTCGGGATTACTTCGAGGATGTAGAACAGGAAGCTCTCGGGCCTCTGAACCCGATCCGTTACCAGATGAAGAAGCATATCGTCACTACGGTCGATAAATACGGTTATGCGCGCCTACACGAAGACATCCACTACTACAGCGTTCCACACACCTACATCGGCAAGAAAGTACAGTTGTCCTATACGGTGGCCGACGTGGAGATCCGCTACAACTACGACATCATAGCCCATCATACCCGCGACCGCCATAACTACCGCTACACTACCGTTACCGAACACCTTTGTCCAAAGCATCGCGCGGTGATGGAGTGGTCGCCGGAGCGGTTCCTCCAGCAGGCTGCCGCCATACATGAAGACGTGGAGCATTATATCCGCAGGATACTGGAGAAGACCCGCTATCAGGATCAGGCCAACAAGATATGTTCGGGCATCCTGAACTTCGCCCGTAAAGTGGGGCCCGACCGTCTGGCAGCGGCCTGCCGACTGGCCGACAGTTACGGCAAGTACAGTTTCCGGGAGATACAGGATATACTTCAGAATAAATCCGAGGCGATAGACCTTCCGGAGGAGCCTGCCGATATGCCTGAACACGAGAACATCAGAGGCAAAGAGTACTATAAATAA(SEQ ID NO:15)。
BA15_GI_0011964
ATGAAAAAGAAAATCATTTTCTGTTTATTATCCCTTTCATTGATGATTGCCGGATGCCAATCAAATGAAATAGAGGATATAACACCCCCTAGTAAGGAAGTACAACTATCACCAGAAGAGCTATTAAGCATCAGATACAAAAGTTCTCCGGAACTTAGCCAAACTGAGGTATTCAATTTATTGACAACCTTCCAAAGCAGTGAACTAAAAAATAATGCCCATTCACGTATTACTTTTCAGCCTAACATCTTTCAGATAAAAGAGAAATACTATTTATCTAAAAACAAAGCAGATGCCAGGAATATTGAAAGTACAGAGGAACAAATACCTATCTATAAAATAGAATTCACATCAGAAACAGGCACAGGAATGGCTGTTGTTTCGGGAGATAGAAGAGCCCCACACATCCTTGCATATATAGACAACATCAAGGAAAACCAGGATTCTCTTTACACAAGTCCCAACGCTTTGCTTCAATGGAGCGAAATGTACATCCGCAATGAAGTTACCAAATTTGATGAGATTAAAGATTCATTGTATGAATCTGCTGTTTTGAAAATATCCAAAGAACTATACATAACATCCAAAGACATCGATTATGAAGCAATCAAGAATCAAATTATCATAAACAACAGCTCTATCAGCCGCTCTAAACCTATAACAGAAGTTCCTTCCAATCTAAAGGTCAAAGTTGCAGTATTTCCTATGTGTCCTGTGGCATGGGGACAATGGGAACCTTATAATTGTATGTTACCAAAAGCCAATTGTGATAGGTATGGTCCGGGATGGTCAGAATATACAAATTATCCTGTAGGCTATGGAGCAATTGTGGTAGCGCATATTCTAGCTAGTTTGGAGCCAACGATGAGACCAGCCAGCCTACAAATAAATTGGAGTTATTTGACTGAAAATAAAGAAATCAAAGCACCAGATTATTTTAACTCCGGTGATCCTTTAGCTAAAAGAGAAATGGTAGGCAGGCTATTCAAAAATATCTATGATTATACAAAATCTTCTGTAGTCAAAGACTCAAAAGGAATTGTTACGGGGACAACTTGTTTAATGTCTGATGTGGAGAATTATTTGGCAAGTTACTTCAATTATAGCAAAAAGACATCATGGAATATCAATACTGTCAAGAATTCCTTAAAAGCAACTAAACCTGTATTAATATACGGCAAACCTGACAATATAGCTACCGATGGAGTCACCCCATTCATTCTTGATGGAATAAAAGAATGCTATGGTAGGATAGACAATGTTCCTTCCGATGTGGACGTATGCTATTTACACGCTAATTTTGGCTTCGGAAACGGTTATCAGGATGGCTACTATTTAATGGATATAAAAACATCGACAATAACTTTTGAAACTGCCATTCCACTAATTTTCAAAGACAATGCTATGACCATAATGGCAGACTTCAGAAAAAAATAA(SEQ ID NO:16)。
BA10_GI_0013173
ATGGATGCGCTTGAAATTTGTAACAAGCTACGCTCGGAGGCTTCGGGCGTAGCCACTTCTGGAATTCCGCTTGACGTATTCCCCCAGAAGATGCAGCAGATGATTCTTGATTTGGCAAGGACGGAGAACTATTCCATTGAGTTTACCGCTACTTCCCTTATATCCGCTATGGCAGCAGCCGTCGGCAACTCCTGCTATATCCGGATTAAAGGCAATTGGATTACTTCACCTATCCTATATGTCATTCTTGTTGGCAGACCAGGAGTCGGCAAGACTCCACCTTTGAACTTTGCCTACAAGCCGTTGCACGACATTGATACTGAGGAGCACCATAAGTTCAAGGCTCTAAAGAATGAGTATGCAGCCATTGTGGAGAGGAACAAGGGCAAAAAACGGACGGAATGGGAATCGTTACCTCCTGTACCAGTCCTGCATAAGAATATCATGAATGACTTCACGCCAGAGATTCTTATGCGCAATCACGATGCCAACCTCAGAGGTGTGGCAGTTGTGGTGGATGAGATAATGGGGCTGTTCAACACCATCAACCGATACAACAACAGTTCTTTTGTACAACAGATGCTGTCGGCTCACAATGGCTTGCCAGTAGATGTATCTCGTTGTAATCTTGATTGTCCTTTACGCATTGACTATCCTTGCATACAGATTGTAGGAACTATCCAGACTGGTATTGTGCATGAACTTTATGATATGGGATTCAAGAAGAATGGTTTTCTTGACCGTTTTCTGATCACATGCCCAAAAGGTTTGAAGATTGCTCCTTGGGTTAAGGTTCCAAAACAAGATGCTGCAATCATTGAAAGACCATTCCGTGTATGGAAAGAGATCATAGACAAGGCTGTGGCTCTTCCTTTTACGGAAGGCATCTTCAATGTTCTTGACTTCTCTGATGAAGCCATTGACATATTCTATGATTGGCAGAATGAGGATATAGAACGGCAGAATGCCATTACGGATGAAAAAATGATAGACTCGCGTGCTGCAAAAGTTCCTTTGAATACGGCTCGGCTTGCCTTGATATTCCAACTGTTCCGTTGGGCTTGTGATGAGTCTCACAAGGATTTTGTTGATGCGGAGTCCGTGAATGCAGCCATACGGATGAGCGATTACTTTGAGAAGTCATACAAAAGGATGGATGACCTCGTTTTAACCGAGGCTACCGACCCTGTGAAGAAACAGGTACTTGACTCGTTGGGAAACAAGTTCGTAACTGCTGAAGCAGTAAAGGCTGGAGCGGATTTCGGTTTTGCAAGACGTACTGTCATGTATATGCTCAAAGACTTCTGTCAGAGAAACTTTATCATCAAAGACAAGCAAGGCAATTATGAGAAAGTACAGAAGTAG(SEQ ID NO:17)。
BA17_GI_0002745
ATGGAAAAAGAAACACTCTTTATCGCCTTTTCCACGCAAAAAGGCGGAGCGGGAAAAACAACGCTGACCGTGCTGGTAGCAAGTTACCTGCACTATGTGAAAGGGATGAATGTAGCGGTGGTGGATTGCGACTACCCGCAACACAGCATTGCCGAGATGAGAAAACGTGACCTGAAAACGGTCATGGAGGACGAGCATTACAAACTGATGGCGTACAGGCAACTGCAACGGATAAGGAAGAAAGCCTATCCGATAGCGGAGAGTACGGCTGAGGATGCTGTCGCAAAGGCGGACGAACTGCTGGAAAAGATGCCGGAAACGGACATCGTGTTCTTCGACCTGCCGGGCACGGTAAACAGTACGGGCGTGTTGAACACGCTGGCGAACATGGACTATGTCTTTTCCCCCATTGCCGCCGACAGGGTGGTAATGGAAAGCACACTCCGCTTTGCGAGCCGGCTGAATGACACGCTGATCGCTACGGGCAAGACGAATATCAAAGGTCTGTACCTTCTGTGGAACATGGTGGACGGCCGGGAGAAATCGGAACTGTACAAGGTGTACGAACAGGTGATCGGCGAGCTGGGACTGAAAGTGCTGAATACCTTCCTGCCGGACAGCAAACGGTTCCGCCGTGAGCTGACGGGGGAACATAGGGCATTGTTCCGTTCCACGCTGTTTCCTGCGGACGGTACGCTGGTCAAAGGCAGCAACCTGAAAGAGATTACGGAAGAACTGTTGTCCATTATCAAAAAGTAG(SEQ ID NO:18)。
BA15_GI_0000750
ATGAAAAAAATTATTATCATTGGCGCCACTTCCGGCATCGGACTGGAAGTGGCGCGATGCTATCTGAAAGACGGCTGGCAAGTAGGCGTGGCAGGACGTAGAGAAGAAGAACTGGAAAAAATCCGGTTATCCGCGCCCGGACAGGTATGTACTCAGACAATAGATGTCACCCGTGAGGACGCCCCTTTCTCATTGGAGCAACTGATTACTAAAATGGGAGGTATGGATGTGTTCTTGCTCAGCTCGGGCATAGGCAAACAAAATCTTTCACTTCAACCCGATATAGAATTACAAACCGCCGCCACCAATGTTTCGGGATTCATACGGATGGTCAATGCCGCCTATCACTATTTTGAGCAACGCGGGAAAGGGCATATAGCCGTAATCAGCTCCATAGCAGGCACCAAAGGGCTGGGATCCGCCCCAGCTTATTCAGCTACCAAGCGGTTTCAGAACACGTACATAAATGCATTGGAGCAATTGGCACACATGAAGAAACTAAACATCTCCTTCACCGATATCCGTCCCGGATTTGTCGCCACTCCTTTGCTGAAAGATGATAAATATCCGCTGCTGATGCATACTTCCCAAGTAGCATCTCAAATTGTAAAAGCCATTTCCCGAAGGAAAAGAGTAGCCATCATAGACTGGCGCTATCAGTTTATCGTATTCTTCTGGAAATTGATTCCCGGATGGTTATGGGTGAGGTTGCCTGTGCGGAACCAATAA(SEQ ID NO:19)。
BA15_GI_0006265
ATGACTCAGACGGATATCAAACCGTTTACTAAAGAGGATCTCGAGCAGGCAGATGTGCAGCTGCTTCGTGACGGCCGATGGGGAAATGCCCGGGTGTCAGTGGCTAACATCAATGGTAAGCGCTGGACAATCAAAGACTTTTCCGATCGCCATTGGCTTGTAAAAAACAGTTTTGCTAAGTTTGTGCTTTGGCGTGAACTGAAAGCGGTCCGCAAGCTTCACGGCCTCGAAGGCGTTCCGACGGAAGCCTTCATGGTGACGCCGCATATGCTTGCGATTGAATATATTCCCGGCCGCGTTTTAAACCGTGTTCCGAAGGAAGAGGTTTCTCCGACTTTTTTGGAAGAATGCGAGGAGATTATTCGTTCGATCCATGCCCGGCATCTGGTTCATTTGGATACCCGCGGAACCAGCAACTGGGTCATGCAGGTCAACGGAAAGCCCGCGTTGATTGATTTTCAGGCAAGCGTAGATACGCAAGGTCTTCCTCAAAAGATTCGTTCTTTTATGGAAGACATGGATATCGGCGGTGTTTATAAGAAGTGGAAGAAGTATTGCCCGGATGAGATGGGCGAGTTCCGCGAGAAGGAAAACGAACGCATTGCCAAGCTCAGAAAGCTCTGGGTCCTTCGCGGATACTTCGGCGTGAAAAAGCGCAATGCCAAACACGGCAAGCCGATTGACAACTAA(SEQ ID NO:20)。
N32_GI_0030737
ATGAGAGCGAGGACATTCCTGATCGGGATGGTGCTTGTGCTGGGCGGGAACATGGCCCGGGCTCAATGGGTGGTGACCGATCCCGGAAATCTGGCCCAAAGCATCATCAACATGTCGGACAACATCGCCCATACCTCCAAGACGGCGGTCAATACGGCCGACAATTTTGCGGAGACGGTAAAGATCTACGAGCAGGCCAAGAAGTACTATGACCAGTTGAAGGCGGTGAACAACCTGATACAAGACGCCCGCAAGGTGCGTGACATCATCCTGATGGTAGGCGACGTGTCCGACATCTATGTGACGAACTTCAAAAAGATGATGAACGACGACAACTTCTCGTCCCGCGAGCTGGACGCCATCGCCTTCGGTTACACCCGCCTGCTGGAGGAGAGCAACGGCGTGTTACAGGACCTCAAACAGGTCATCAACGTGAGCACGCTCTCCATGACCGACAAGGACCGTATGGACGTGGTGGACAACTGTTATTACGAGATGCGCCGTTACCGCAACCTGGTGAGCTATTATACTAACAAGAACATAGCCGTGAGCTATCTCCGCGCCAGGAAAAAGAACGATATGGAACGTGTGATGCGGCTCTATGGAAATGAAACCTCCAAATACTGGTAG(SEQ ID NO:21)。
BA20_GI_0045187
ATGATGCACACGTGGTTTGAATGTAAAATCCGTTATGAAAAGACAATGGATAACGGAATGAACAAGAAAGTAACAGAACCCTATCTGGTTGACGCGCTCAGCTTCACGGAAGCGGAAGCACGCATCATTGAAGAAATGACACCCTTTATTTCCGGTGAGTTTACAGTTTCCGACATTAAACGTGCCAACTATAGCGAGCTCTTTCCCTGTGAGGAAGACAGTGCCGACCGCTGGTTCAAGTGCAAGCTGTATTTCATTACCTCAGATGAAAAAAGTGGAGCAGAAAAAAAGACGGCTACCAACGTACTGGTACAAGCAGCCGACTTGCGTGATGCAGTAAATAAACTGGATGAGGGTATGAAAGGCACAATGGCCGACTACCAAATTGCATCGGTAGCGGAAACTGCCATTATGGACGTCTATCCATATGCCGCAGATGAGTCCATTACGGATACCATCAGTGAAAATGCCAATTCGCCTGTTGTACGAAATTTCATACAATCTCTCCCCGAAGGTTGCAGGACAACGATAACCGTTGGTGGGAAAAAAGTTGTAGTAGACAAGACCGGAAAAGACACCATTGTTACACCCGAAAAGCAAAGCGACAATGACACTTGA(SEQ ID NO:22)。
BA11_GI_0010089
ATGCTCATAAAACAGGTAATGGCCCGTCCTGTACCGGCTCATCCGAAGTGGAAATACAGTTTGAACAGAGAAAGTATGATACTTTTTTTTCACAAGAAAATATTATATGGCGCCAATGTGGTTTATGCGGAAGGCTGGCAACAATCAAAAAAAAGAATGGCATATTCTACCATATTTCCAGCAATCCTTTACAGAATGAAGTGTCCATATAGTCCGGCGAATTATCTGAAAGGGGATTATGAAGTTCGGGCTGTCACCATGAAGGAACAGAGGACGACAGGAGGTGAGTTGAAAAAAATGCAGTATCATACATGA(SEQ ID NO:23)。
VA16_GI_0029542
GGAAGTAGCATGGAAGGGATTATTAGCAAAGAGACGGGTAGTGTCCGCCGGTTCTTTGGCCTGCTGGATAACATCCAGACGAAGCTGGAAAGGCTTGCGGAGGATAACCGCCCCCTGTTTAACGGCGAGCGTTTTCTCTCTGACAAGGAGTTGTCGGACCTGCTAAGAATCAGCCGCAGATGCCTGCAGGATTATAGGGACCAGGGGCGTATTTCTTATATCCGGCTGGGCGGAAAAATTTTGTATAAGGTATCCGACATTGAGAAACTCCTGGAGGATAATTATCATGAGGCCCTGATATAA(SEQ ID NO:24)。
N27_GI_0098854
TGGAACCGTGACGGCAACTTCGACTATTTCTGCAATATGGAAATGGTGGAGCTGAGCCTCATCGAAGAGGCCTCCTACCGCAAGGAACTGCACGAGCTCATCCGCCAGCACTACCTGTACACCGGTTCCAAACTGGCACGCACCATGCTCGATGACTGGCCACGCTATGCCGACCAGTTCATCCAGGTAGTCCCTATCGAATACAAGAAGGTGCTGCAGGAAGAGCAGATGCGGAAACTGCAACAGAAGATTGCAGAGATGCAGAGAGACTATTAA(SEQ ID NO:25)。
VA22_GI_0039179
ATGAAGAAAAATGGTAAGAATGAAGAACTTCAGTCTCGTCGTGAGTTCTTTAAGAGAGCCGCTAAAGGTGCTCTGCCTATTTTGGCTGGTGCAGCTCTCCTGTCAAGTCCTATCTTGTCAGAAACTGCAAATGCAATGTCATGCGCAGGATGTAACAACCGTTGTATGAACAGTTGCTTCAACACATGTCATGGTACTTGTAGCAGAACTTGCTCCGGTACAAACAACAGAAACTAA(SEQ ID NO:26)。
实施例3个体状态的检测
利用45个粪便样本进行样本来源的个体状态的检测。
参照实施例2的方法确定各粪便样本中的表3的BA15_GI_0053852、VA1_GI_0075627、BA16_GI_0058798、BA20_GI_0078082、VA34_GI_0040061、N29_GI_0014293和BA20_GI_0050287的丰度,判断各样本中这7种基因的丰度是否落入各自在疾病对照组或者健康对照组的丰度的95%的置信区间,7种基因的丰度均落入疾病组对应区间的样本对应的个体的状态判定为小柳-原田综合症患者,均落入健康组对应区间的样本对应的个体的状态判定为非小柳-原田综合症患者。
结果显示,利用上述方法对45个样本进行个体状态判断,其中对30个样本个体的状态的判断,与记录的该样本来源个体的状态一致。
另外,发明人发现对表2和表3中的基因联合检测,例如检测表3中的基因标志物被富集,同时表2中基因标记物不被富集,能够更准确的判断发现小柳-原田综合症患者或易感人群。
在利用标志物治疗小柳-原田综合症的方案中,发明人发现使表3中的基因标志物丰度得到抑制或者清除,同时使表2中基因标记物被富集,治疗效果极佳。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
尽管已经示出和描述了本发明的实施例,本领域的普通技术人员可以理解:在不脱离本发明的原理和宗旨的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由权利要求及其等同物限定。
Claims (13)
1.一种试剂盒,其特征在于,包括适于检测第一基因集中的至少一个基因的试剂,所述第一基因集由以下基因组成:BA15_GI_0053852、VA1_GI_0075627、BA16_GI_0058798、BA20_GI_0078082、VA34_GI_0040061、N29_GI_0014293和BA20_GI_0050287,其中,所述第一基因集中的基因与SEQ ID NO:1-7所示的核酸序列一一对应,所述第一基因集中的基因与其对应的SEQ ID NO:1-7中的核酸序列具有不小于90%的同一性。
2.根据权利要求1所述的试剂盒,其特征在于,进一步包括适于检测第二基因集中的至少一个基因的试剂,所述第二基因集由以下基因组成:N58_GI_0017314和N44_GI_0089468,其中,所述第二基因集中的基因与SEQ ID NO:8、9所示的核酸序列一一对应,所述第二基因集中的基因与其对应的SEQ ID NO:8、9中的核酸序列具有不小于90%的同一性。
3.根据权利要求1所述的试剂盒,其特征在于,包括适于检测所述第一基因集中全部所述基因的试剂。
4.根据权利要求2所述的试剂盒,其特征在于,包括适于检测所述第二基因集中全部所述基因的试剂。
5.试剂在制备试剂盒中的用途,所述试剂适于检测第一基因集中的至少一种基因,所述试剂盒用于诊断小柳-原田综合症或者检测小柳-原田综合症的治疗效果,所述第一基因集由以下基因组成:BA15_GI_0053852、VA1_GI_0075627、BA16_GI_0058798、BA20_GI_0078082、VA34_GI_0040061、N29_GI_0014293和BA20_GI_0050287,其中,所述第一基因集中的基因与SEQ ID NO:1-7所示的核酸序列一一对应,所述第一基因集中的基因与其对应的SEQ ID NO:1-7中的核酸序列具有不小于90%的同一性。
6.根据权利要求5所述的用途,其特征在于,所述试剂进一步适于检测第二基因集中的至少一种基因,所述第二基因集由以下基因组成:N58_GI_0017314和N44_GI_0089468,其中,所述第二基因集中的基因与SEQ ID NO:8、9所示的核酸序列一一对应,所述第二基因集中的基因与其对应的SEQ ID NO:8、9中的核酸序列具有不小于90%的同一性。
7.一种用于预防或者治疗小柳-原田综合症的药物组合物或者食品组合物,其特征在于,含有提高第二基因集中的至少一种基因丰度的物质,所述第二基因集由以下基因组成:N58_GI_0017314和N44_GI_0089468,其中,所述第二基因集中的基因与SEQ ID NO:8、9所示的核酸序列一一对应,所述第二基因集中的基因与其对应的SEQ ID NO:8、9中的核酸序列具有不小于90%的同一性。
8.一种确定个体是否患有小柳-原田综合症的方法,其特征在于,包括:
(1)确定所述个体的粪便样本中标志基因的丰度,所述标志基因包括第一基因集和第二基因集中的至少一种基因;
(2)将步骤(1)中得到的所述丰度与预定的阈值进行比较,以便确定所述个体是否患有小柳-原田综合症;
其中,所述第一基因集由以下基因组成:BA15_GI_0053852、VA1_GI_0075627、BA16_GI_0058798、BA20_GI_0078082、VA34_GI_0040061、N29_GI_0014293和BA20_GI_0050287,所述第一基因集中的基因与SEQ ID NO:1-7所示的核酸序列一一对应,所述第一基因集中的基因与其对应的SEQ ID NO:1-7中的核酸序列具有不小于90%的同一性;
所述第二基因集由以下基因组成:N58_GI_0017314和N44_GI_0089468,其中,所述第二基因集中的基因与SEQ ID NO:8、9所示的核酸序列一一对应,所述第二基因集中的基因与其对应的SEQ ID NO:8、9中的核酸序列具有不小于90%的同一性。
9.根据权利要求8所述的方法,其特征在于,步骤(1)进一步包括:
获得所述个体的粪便样本中的核酸测序数据;
将所述测序数据与参考基因组进行比对;
基于所述比对的结果,确定所述标志基因的丰度。
10.一种确定个体是否患有小柳-原田综合症的装置,其特征在于,包括:
丰度确定单元,用于确定所述个体的粪便样本中标志基因的丰度,所述标志基因包括第一基因集和第二基因集中的至少一种基因;
比较单元,用于将所得到的所述丰度与预定的阈值进行比较,以便确定所述个体是否患有小柳-原田综合症;
其中,所述第一基因集由以下基因组成:BA15_GI_0053852、VA1_GI_0075627、BA16_GI_0058798、BA20_GI_0078082、VA34_GI_0040061、N29_GI_0014293和BA20_GI_0050287,其中,所述第一基因集中的基因与SEQ ID NO:1-7所示的核酸序列一一对应,所述第一基因集中的基因与其对应的SEQ ID NO:1-7中的核酸序列具有不小于90%的同一性;
所述第二基因集由以下基因组成:N58_GI_0017314和N44_GI_0089468,其中,所述第二基因集中的基因与SEQ ID NO:8、9所示的核酸序列一一对应,所述第二基因集中的基因与其对应的SEQ ID NO:8、9中的核酸序列具有不小于90%的同一性。
11.根据权利要求10所述的装置,其特征在于,所述丰度确定单元适于通过下列步骤确定所述丰度:
获得所述个体的粪便样本中的核酸测序数据;
将所述测序数据与参考基因组进行比对;
基于所述比对的结果,确定所述标志基因的丰度。
12.一种装置,其特征在于,包括:
计算机可读存储介质,其上存储有计算机程序,所述程序用于执行权利要求8或9所述的方法;
以及一个或者多个处理器,用于执行所述计算机可读存储介质中的程序。
13.一种筛选药物的方法,其特征在于,所述药物用于治疗或者预防小柳-原田综合症,所述方法包括:
将候选药物施用于受试者,
检测施用前后,所述受试者粪便中标志基因的丰度,所述标志基因包括第一基因集和第二基因集中的至少一种基因,
其中,满足下列条件至少之一的候选药物适于用于治疗或者预防小柳-原田综合症:
(1)进行所述施用后,所述第一基因集中的至少一种基因的所述丰度降低;和
(2)进行所述施用后,所述第二基因集中的至少一种基因的所述丰度升高;
其中,所述第一基因集由以下基因组成:BA15_GI_0053852、VA1_GI_0075627、BA16_GI_0058798、BA20_GI_0078082、VA34_GI_0040061、N29_GI_0014293和BA20_GI_0050287,其中,所述第一基因集中的基因与SEQ ID NO:1-7所示的核酸序列一一对应,所述第一基因集中的基因与其对应的SEQ ID NO:1-7中的核酸序列具有不小于90%的同一性;
所述第二基因集由以下基因组成:N58_GI_0017314和N44_GI_0089468,其中,所述第二基因集中的基因与SEQ ID NO:8、9所示的核酸序列一一对应,所述第二基因集中的基因与其对应的SEQ ID NO:8、9中的核酸序列具有不小于90%的同一性。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111666817.9A CN114317531A (zh) | 2021-12-31 | 2021-12-31 | 小柳-原田综合症标志基因及其应用 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111666817.9A CN114317531A (zh) | 2021-12-31 | 2021-12-31 | 小柳-原田综合症标志基因及其应用 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114317531A true CN114317531A (zh) | 2022-04-12 |
Family
ID=81021032
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111666817.9A Pending CN114317531A (zh) | 2021-12-31 | 2021-12-31 | 小柳-原田综合症标志基因及其应用 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114317531A (zh) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007295852A (ja) * | 2006-04-28 | 2007-11-15 | Osaka Univ | 疾患マーカー、dnaマイクロアレイ、薬剤スクリーニング方法及びぶどう膜炎検査方法 |
CN109880897A (zh) * | 2019-03-14 | 2019-06-14 | 重庆医科大学附属第一医院 | 用于vkh综合征的肠道微生物的标记物和筛选方法及该标记物的用途 |
-
2021
- 2021-12-31 CN CN202111666817.9A patent/CN114317531A/zh active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007295852A (ja) * | 2006-04-28 | 2007-11-15 | Osaka Univ | 疾患マーカー、dnaマイクロアレイ、薬剤スクリーニング方法及びぶどう膜炎検査方法 |
CN109880897A (zh) * | 2019-03-14 | 2019-06-14 | 重庆医科大学附属第一医院 | 用于vkh综合征的肠道微生物的标记物和筛选方法及该标记物的用途 |
Non-Patent Citations (1)
Title |
---|
ZI YE等: "Altered gut microbiome composition in patients with Vogt-Koyanagi-Harada disease", GUT MICROBES, vol. 11, no. 3, pages 539 - 555 * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107217089B (zh) | 确定个体状态的方法及装置 | |
CN107217088B (zh) | 强直性脊柱炎微生物标志物 | |
CN114182007B (zh) | 白塞病标志基因及其应用 | |
CN113913490B (zh) | 非酒精性脂肪肝标志微生物及其应用 | |
WO2017156739A1 (zh) | 分离的核酸及应用 | |
CN107217086B (zh) | 疾病标志物及应用 | |
CN105733988B (zh) | 组合物及应用 | |
CN105671177B (zh) | 强直性脊柱炎标志物及应用 | |
CN113999922B (zh) | 急性腹泻标志微生物及其应用 | |
CN114317531A (zh) | 小柳-原田综合症标志基因及其应用 | |
CN114836508A (zh) | 慢性阻塞性肺病标志微生物及其应用 | |
CN109072278A (zh) | 分离的核酸及应用 | |
CN113999923B (zh) | 小柳-原田综合症标志微生物及其应用 | |
CN114317784B (zh) | 白塞病标志微生物及其应用 | |
CN114107484B (zh) | 溃疡性结肠炎标志基因及其应用 | |
CN114317717A (zh) | 儿童克罗恩病标志基因及其应用 | |
CN113930479B (zh) | 系统性红斑狼疮标志微生物及其应用 | |
CN114317716A (zh) | 痛风症标志基因及其应用 | |
CN114292933A (zh) | 格雷夫斯病标志基因及其应用 | |
CN114292932A (zh) | 慢性传输便秘标志ko及其应用 | |
CN114517235A (zh) | 肌痛性脑脊髓炎标志基因及其应用 | |
CN114446387A (zh) | 脂肪肝标志基因及其应用 | |
CN114921538A (zh) | 龋齿标志基因及应用 | |
CN114381507B (zh) | 格雷夫斯病标志微生物及其应用 | |
CN114517227A (zh) | 急性腹泻标志基因及其应用 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |