CN114317716A - 痛风症标志基因及其应用 - Google Patents
痛风症标志基因及其应用 Download PDFInfo
- Publication number
- CN114317716A CN114317716A CN202111672769.4A CN202111672769A CN114317716A CN 114317716 A CN114317716 A CN 114317716A CN 202111672769 A CN202111672769 A CN 202111672769A CN 114317716 A CN114317716 A CN 114317716A
- Authority
- CN
- China
- Prior art keywords
- genes
- gene
- gout
- abundance
- seq
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本发明提出了一种痛风症基因标志物及其应用,该痛风症基因标志物包括第一基因集,因此,进一步提出了一种试剂盒,包括适于检测第一基因集中的至少一种基因的试剂,所述第一基因集由以下基因组成:C03_GI_0051440、C03_GI_0051466、C05_GI_0017028、C50_GI_0345131、C64_GI_0032728和G38_GI_0125251,其中,所述第一基因集中的基因与SEQ ID NO:1‑6所示的核酸序列一一对应,所述第一基因集中的基因与其对应的SEQ ID NO:1‑6中的序列具有不小于90%的同一性。本发明提出的基因相较于健康个体,在痛风症患者群体中显著富集,能够准确区分健康群体和痛风症患者群体,可以作为检测和/或治疗痛风症的标志物。
Description
技术领域
本发明涉及生物技术领域,具体的,本发明涉及痛风症标志基因及其应用,更具体的,本发明涉及一种试剂盒、试剂在制备试剂盒中的用途、用于预防或者治疗痛风症的药物组合物或者食品组合物、确定个体是否患有痛风症的方法、确定个体是否患有痛风症的装置、一种装置、一种筛选药物的方法。
背景技术
痛风症(Gout)是一种由于嘌呤生物合成代谢增加,尿酸产生过多或因尿酸排泄不良而导致血中尿酸升高,尿酸盐结晶沉积在关节滑膜、滑囊、软骨及其他组织中引起的反复发作性炎性疾病。痛风/高尿酸症(HUA)定义标准:正常嘌呤饮食状态下,非同日两次空腹血尿酸水平:男性血尿酸>420μmol/L,女性血尿酸>360μmol/L。当血尿酸水平超过关节单钠尿酸盐饱和度而析出沉积于外周关节及周围组织时(行程尿酸结石/痛风石),称为痛风。痛风、严重的高尿酸血症可并发肾脏病变,严重者可出现关节破坏、肾功能损害,常伴发高血脂症、高血压病、糖尿病、动脉硬化及冠心病等。
人体的肠道菌群不仅参与尿酸代谢,且参与炎症因子的释放,在痛风的发病过程中起着关键的作用。鉴于饮食健康与痛风发病率的紧密联系,有必要深入开展痛风肠道微生态研究,为最终的临床治疗和疾病的预防提供有益的探索。
发明内容
本发明旨在至少在一定程度上解决上述技术问题之一或至少提供一种商业选择。
依据本发明的第一方面,提供一种试剂盒,包括适于检测第一基因集中至少一种基因的试剂,所述第一基因集由以下基因组成:C03_GI_0051440、C03_GI_0051466、C05_GI_0017028、C50_GI_0345131、C64_GI_0032728和G38_GI_0125251,其中,所述第一基因集中的基因与SEQ ID NO:1-6所示的核酸序列一一对应,所述第一基因集中的基因与其对应的SEQID NO:1-6中的序列具有不小于90%的同一性。根据本发明具体实施例的试剂盒,包含可以准确的检测第一基因集中的至少一种基因的试剂,因此,所述试剂盒可以准确检测生物样品中是否含有所述第一基因集中的至少一种基因,更进一步地,所述试剂盒也可以准确区分或诊断痛风症患者和健康个体。
在本发明的第二方面,本发明提出了试剂在制备试剂盒中的用途,所述试剂适于检测第一基因集中的至少一种基因。根据本发明的实施例,所述试剂盒用于诊断痛风症或检测痛风症的治疗效果,所述第一基因集由以下基因组成:C03_GI_0051440、C03_GI_0051466、C05_GI_0017028、C50_GI_0345131、C64_GI_0032728和G38_GI_0125251,其中,所述第一基因集中的基因与SEQ ID NO:1-6所示的核酸序列一一对应,所述第一基因集中的基因与其对应的SEQ ID NO:1-6中的序列具有不小于90%的同一性。根据本发明具体实施例的试剂制备的试剂盒,可以准确的检测生物样品中是否含有所述第一基因集中的至少一种基因,更进一步地,可以极准确的区分痛风症患者和健康个体,由此,可以有效的在早期进行痛风症诊断,或用于检测治疗过程中痛风症的变化。
在本发明的第三方面,本发明提出了一种用于预防或者治疗痛风症的药物组合物或者食品组合物。根据本发明的实施例,含有提高所述第二基因集中的至少一种基因丰度的物质,所述第二基因集由以下基因组成:C01_GI_0190397、C01_GI_0232192、C01_GI_0287172、C01_GI_0341126、C02_GI_0069373、C02_GI_0069375、C04_GI_0279808、C05_GI_0096564、C07_GI_0066430、C12_GI_0283312、C16_GI_0117164、C20_GI_0172619、C47_GI_0117622、C48_GI_0078316、C53_GI_0087483、C57_GI_0218184、C60_GI_0157568、C64_GI_0070575、G20_GI_0116524、G23_GI_0141028、G49_GI_0075567、G86_GI_0088728和G89_GI_0273545,其中,所述第二基因集中的基因与SEQ ID NO:7-29所示的核酸序列一一对应,所述第二基因集中的基因与其对应的SEQ ID NO:7-29所示的核酸序列具有不小于90%的同一性。根据本发明实施例的痛风症标志基因中第二基因集的基因可以非侵入性的在早期发现或辅助检测痛风症,确定个体患有痛风症的概率高低或者个体处于健康状态的概率高低;同时,提高痛风症高风险人群或已痛风症患者肠道内微生物的所述第二基因集中的各种基因的丰度,可以降低患痛风症的概率或减缓、治愈痛风症,因此,所述包含提高所述第二基因集中的至少一种基因丰度的药物或者食品组合物能够有效预防或治疗痛风症。
在本发明的第四方面,本发明提出了一种确定个体是否患有痛风症的方法。根据本发明的实施例,包括:(1)确定所述个体的粪便样本中标志基因的丰度,所述标志基因包括第一基因集和第二基因集中的至少一种基因;(2)将步骤(1)中得到的所述丰度与预定的阈值进行比较,以便确定所述个体是否患有痛风症;其中,所述第一基因集由以下基因组成:C03_GI_0051440、C03_GI_0051466、C05_GI_0017028、C50_GI_0345131、C64_GI_0032728和G38_GI_0125251,其中,所述第一基因集中的基因与SEQ ID NO:1-6所示的核酸序列一一对应,所述第一基因集中的基因与其对应的SEQ ID NO:1-6中的序列具有不小于90%的同一性,所述第二基因集由以下基因组成:C01_GI_0190397、C01_GI_0232192、C01_GI_0287172、C01_GI_0341126、C02_GI_0069373、C02_GI_0069375、C04_GI_0279808、C05_GI_0096564、C07_GI_0066430、C12_GI_0283312、C16_GI_0117164、C20_GI_0172619、C47_GI_0117622、C48_GI_0078316、C53_GI_0087483、C57_GI_0218184、C60_GI_0157568、C64_GI_0070575、G20_GI_0116524、G23_GI_0141028、G49_GI_0075567、G86_GI_0088728和G89_GI_0273545,其中,所述第二基因集中的基因与SEQ ID NO:7-29所示的核酸序列一一对应,所述第二基因集中的基因与其对应的SEQ ID NO:7-29所示的核酸序列具有不小于90%的同一性。根据本发明实施例的方法可以依据个体的粪便样本中的所述标志基因的丰度确定个体是否患有痛风症,所述标志基因是发明人对大量已知状态的粪便样本进行验证,通过差异比较分析各种肠道微生物的基因在痛风症组和健康组粪便样本中的丰度,而确定下来的。
在本发明的第五方面,本发明提出了一种确定个体是否患有痛风症的装置。根据本发明的实施例,包括:丰度确定单元,用于确定所述个体的粪便样本中标志基因的丰度,所述标志基因包括第一基因集和第二基因集中的至少一种基因;比较单元,用于将所得到的所述丰度与预定的阈值进行比较,以便确定所述个体是否患有痛风症;其中,所述第一基因集由以下基因组成:C03_GI_0051440、C03_GI_0051466、C05_GI_0017028、C50_GI_0345131、C64_GI_0032728和G38_GI_0125251,其中,所述第一基因集中的基因与SEQ IDNO:1-6所示的核酸序列一一对应,所述第一基因集中的基因与其对应的SEQ ID NO:1-6中的序列具有不小于90%的同一性,所述第二基因集由以下基因组成:C01_GI_0190397、C01_GI_0232192、C01_GI_0287172、C01_GI_0341126、C02_GI_0069373、C02_GI_0069375、C04_GI_0279808、C05_GI_0096564、C07_GI_0066430、C12_GI_0283312、C16_GI_0117164、C20_GI_0172619、C47_GI_0117622、C48_GI_0078316、C53_GI_0087483、C57_GI_0218184、C60_GI_0157568、C64_GI_0070575、G20_GI_0116524、G23_GI_0141028、G49_GI_0075567、G86_GI_0088728和G89_GI_0273545,其中,所述第二基因集中的基因与SEQ ID NO:7-29所示的核酸序列一一对应,所述第二基因集中的基因与其对应的SEQ ID NO:7-29所示的核酸序列具有不小于90%的同一性。所述标志基因是发明人通过差异比较分析各种肠道基因在痛风症患者和健康人群的粪便样本中的丰度并经过分析和大量已知状态的粪便样本的验证而确定下来的,根据本发明实施例的装置可以准确确定个体是否为痛风症的高风险人群或痛风症患者。
在本发明的第六方面,本发明提出了一种装置。根据本发明的实施例,包括:计算机可读存储介质,其上存储有计算机程序,所述程序用于执行第四方面所述的方法;以及一个或者多个处理器,用于执行所述计算机可读存储介质中的程序。根据本发明实施例的装置可以准确确定个体是否为痛风症的高风险人群或痛风症患者。
在本发明的第七方面,本发明提出了一种筛选药物的方法。根据本发明的实施例,所述药物用于治疗或者预防痛风症,所述方法包括:将候选药物施用于受试者,检测施用前后,所述受试者粪便中标志基因的丰度,所述标志基因包括第一基因集和第二基因集中的至少一种基因,其中,满足下列条件至少之一的候选药物适于用于治疗或者预防痛风症:(1)进行所述施用后,所述第一基因集中的至少一种基因的所述丰度降低;和(2)进行所述施用后,所述第二基因集中的至少一种基因的所述丰度升高;其中,所述第一基因集由以下基因组成:C03_GI_0051440、C03_GI_0051466、C05_GI_0017028、C50_GI_0345131、C64_GI_0032728和G38_GI_0125251,其中,所述第一基因集中的基因与SEQ ID NO:1-6所示的核酸序列一一对应,所述第一基因集中的基因与其对应的SEQ ID NO:1-6中的序列具有不小于90%的同一性,所述第二基因集由以下基因组成:C01_GI_0190397、C01_GI_0232192、C01_GI_0287172、C01_GI_0341126、C02_GI_0069373、C02_GI_0069375、C04_GI_0279808、C05_GI_0096564、C07_GI_0066430、C12_GI_0283312、C16_GI_0117164、C20_GI_0172619、C47_GI_0117622、C48_GI_0078316、C53_GI_0087483、C57_GI_0218184、C60_GI_0157568、C64_GI_0070575、G20_GI_0116524、G23_GI_0141028、G49_GI_0075567、G86_GI_0088728和G89_GI_0273545,其中,所述第二基因集中的基因与SEQ ID NO:7-29所示的核酸序列一一对应,所述第二基因集中的基因与其对应的SEQ ID NO:7-29所示的核酸序列具有不小于90%的同一性。根据本发明实施例的方法可以生产或筛选出降低所述标志基因中第一基因集中各种基因丰度,和/或升高肠道标志基因中第二基因集中的各种基因丰度的药物,对于辅助减轻痛风症的临床症状具有重要意义。
附图说明
本发明的上述和/或附加的方面和优点从结合下面附图对实施方式的描述中将变得明显和容易理解,其中:
图1是本发明的实施例中的筛选鉴定痛风症标志基因的试验分析流程示意图。
图2是本发明的实施例中的标志基因作为诊断指标的AUC评价结果示意图,其中,Specificity表示特异度,即预测为阳性且实际为阳性,真阳性,纵坐标Sensitivity表示敏感度,即真阴性,CI(Confidence interval)表示置信区间:
2-A为第一期131个样品数据ROC曲线下AUC值和置信区间结果图;
2-B为第二期57个样品数据ROC曲线下AUC值和置信区间结果图。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中,自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能理解为对本发明的限制。需要说明的,本文中所使用的术语“第一”或者“第二”等仅为方便描述,不能理解为指示或暗示相对重要性,也不能理解为之间有先后顺序关系。
在本发明的描述中,除非另有说明,“多个”的含义是两个或两个以上。在本文中,除非另有明确的规定和限定,术语“相连”、“连接”等术语应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。
生物学标志物是从生物学介质中可以检测到的细胞、生物化学或分子改变。生物学介质包括各种体液、组织、细胞、粪便、头发、呼气等。
所称的某种基因的丰度指基因组中该基因的拷贝数量,基因丰度高也即这个基因的数量多。例如在肠道微生物群体基因组中该种基因的拷贝数量,可表示为该种基因在该群体中的含量。
同一性,本发明,为了比较两个或更多个核苷酸序列,可以通过将[第一序列中与相应位置的核苷酸相同的核苷酸的数目相除]来计算第一序列和第二序列之间的“序列同一性”的百分比。第二个序列中的核苷酸]减去[第一个序列中核苷酸的总数],然后乘以[100%],其中第二个核苷酸序列中每个核苷酸的缺失,插入,取代或添加-相对于第一核苷酸序列-被认为是单个核苷酸(位置)上的差异。
或者,可以使用标准设置,使用用于序列比对的已知计算机算法,例如NCBI Blastv2.0,计算两个或多个核苷酸序列之间的序列同一性程度。
用于确定序列同一性程度的一些其他技术,计算机算法和设置例如在WO 04/037999,EP 0 967 284,EP 1 085 089,WO 00/55318,WO 00/78972,WO 98/49185和GB2357768-A。
需要说明的是,本申请中所述的“标志基因”来自于肠道粪便样本中微生物,其的长度不受特别限制,可以为完整基因,也可以为基因的编码区或非编码区,更进一步地,根据不同的实验目的,可以选择相关的任意长度的核酸片段作为标志基因。
根据本发明的一个实施方式提供的一种试剂盒,包括适于检测第一基因集中的至少一个基因的试剂,所述第一基因集由以下基因组成:C03_GI_0051440、C03_GI_0051466、C05_GI_0017028、C50_GI_0345131、C64_GI_0032728和G38_GI_0125251,其中,所述第一基因集中的基因与SEQ ID NO:1-6所示的核酸序列一一对应,所述第一基因集中的基因与其对应的SEQ ID NO:1-6中的序列具有不小于90%的同一性。
根据本发明的一个具体的实施方案,所述试剂盒进一步包括适于检测第二基因集中的至少一个基因的试剂,所述第二基因集由以下基因组成:C01_GI_0190397、C01_GI_0232192、C01_GI_0287172、C01_GI_0341126、C02_GI_0069373、C02_GI_0069375、C04_GI_0279808、C05_GI_0096564、C07_GI_0066430、C12_GI_0283312、C16_GI_0117164、C20_GI_0172619、C47_GI_0117622、C48_GI_0078316、C53_GI_0087483、C57_GI_0218184、C60_GI_0157568、C64_GI_0070575、G20_GI_0116524、G23_GI_0141028、G49_GI_0075567、G86_GI_0088728和G89_GI_0273545,其中,所述第二基因集中的基因与SEQ ID NO:7-29所示的核酸序列一一对应,所述第二基因集中的基因与其对应的SEQ ID NO:7-29所示的核酸序列具有不小于90%的同一性。
根据本发明的具体实施例,所述试剂盒包括适于检测所述第一基因集中全部所述基因的试剂。
根据本发明的具体实施例,所述试剂盒包括适于检测所述第二基因集中全部所述基因的试剂。
根据本发明的具体实施例,所述标志基因是发明人通过对大量患痛风症个体和大量健康对照个体的粪便样本中的微生物的丰度的差异比较分析、以及验证,而确定下来的,明确了肠道的微生物的基因中痛风症相关的标志基因。利用包含检测所述标志基因的试剂的试剂盒能够准确检测生物样本中是否含有所述第一、第二基因集中的至少一种基因,更进一步地,可以准确确定个体处于患有痛风症状态的概率高低或者处于健康状态的概率高低,能够用于非侵入性的早期发现或辅助检测痛风症。
根据本发明的具体实施例,所述适于检测所述第一基因集或第二基因集的试剂不受特别限制,任何可以直接或间接检测所述标志基因的丰度的试剂均包含在本发明的范围内,如:利用PCR技术、高通量测序等方法直接进行检测时使用的试剂,或通过Western Blot技术检测所述基因对应的蛋白的含量间接获得所述基因丰度时所使用的试剂等。
根据本发明提供的试剂在制备试剂盒中的用途,所述试剂适于检测第一基因集中的至少一种基因,所述试剂盒用于诊断痛风症或者检测痛风症的治疗效果,所述第一基因集由以下基因组成:C03_GI_0051440、C03_GI_0051466、C05_GI_0017028、C50_GI_0345131、C64_GI_0032728和G38_GI_0125251,其中,所述第一基因集中的基因与SEQ ID NO:1-6所示的核酸序列一一对应,所述第一基因集中的基因与其对应的SEQ ID NO:1-6中的序列具有不小于90%的同一性。
根据本发明的具体实施例,所述标志基因是发明人通过对大量患痛风症个体和大量健康对照个体的粪便样本中的微生物的丰度的差异比较分析、以及验证,而确定下来的,明确了肠道的微生物基因中痛风症相关的标志基因。利用检测所述标志基因的试剂能够确定个体患有痛风症的概率高低或者处于健康状态的概率高低,能够用于非侵入性的早期发现或辅助检测痛风症。
根据本发明一些具体的实施例,所述试剂进一步适于检测第二基因集中的至少一种基因,所述第二基因集由以下基因组成:C01_GI_0190397、C01_GI_0232192、C01_GI_0287172、C01_GI_0341126、C02_GI_0069373、C02_GI_0069375、C04_GI_0279808、C05_GI_0096564、C07_GI_0066430、C12_GI_0283312、C16_GI_0117164、C20_GI_0172619、C47_GI_0117622、C48_GI_0078316、C53_GI_0087483、C57_GI_0218184、C60_GI_0157568、C64_GI_0070575、G20_GI_0116524、G23_GI_0141028、G49_GI_0075567、G86_GI_0088728和G89_GI_0273545,其中,所述第二基因集中的基因与SEQ ID NO:7-29所示的核酸序列一一对应,所述第二基因集中的基因与其对应的SEQ ID NO:7-29所示的核酸序列具有不小于90%的同一性。
根据本发明的具体实施例,所述适于检测所述第一基因集或第二基因集的试剂不受特别限制,任何可以直接或间接检测所述标志基因的丰度的试剂均包含在本发明的范围内,如:利用PCR技术、高通量测序等方法直接进行检测时使用的试剂,或通过Western Blot技术检测所述基因对应的蛋白的含量间接获得所述基因丰度时所使用的试剂等。
根据本发明提供的一种用于预防或者治疗痛风症的药物组合物或者食品组合物,含有提高第二基因集中的至少一种基因丰度的物质,所述第二基因集由以下基因组成:C01_GI_0190397、C01_GI_0232192、C01_GI_0287172、C01_GI_0341126、C02_GI_0069373、C02_GI_0069375、C04_GI_0279808、C05_GI_0096564、C07_GI_0066430、C12_GI_0283312、C16_GI_0117164、C20_GI_0172619、C47_GI_0117622、C48_GI_0078316、C53_GI_0087483、C57_GI_0218184、C60_GI_0157568、C64_GI_0070575、G20_GI_0116524、G23_GI_0141028、G49_GI_0075567、G86_GI_0088728和G89_GI_0273545,其中,所述第二基因集中的基因与SEQ ID NO:7-29所示的核酸序列一一对应,所述第二基因集中的基因与其对应的SEQ IDNO:7-29所示的核酸序列具有不小于90%的同一性。
上述标志基因是发明人通过差异比较分析各种肠道基因在痛风症疾病组和健康组的粪便样本中的丰度,以及经过大量已知状态的粪便样本的验证,而确定下来的。所述标志基因中的第二基因集中的基因相较于痛风症患者群体,在健康群体组中显著富集,所述显著富集是指与在痛风症患者组中的丰度相比,上述基因在健康组中的丰度均具有统计意义地高于或者明显地、实质性地高于在痛风症患者组中的丰度;能够使该部分基因丰度提高的物质能够用于治疗痛风症或者益于痛风症患者服用,所述物质不受特别限制,能够使其丰度提高的物质包括但不限于治疗痛风症的药物和有益于治疗或缓解痛风症的功能性食品。因此,该实施例提供的能够使所述第二基因集中的基因丰度提高的物质能够用于制备治疗痛风症的药物和/或用于制备益于治疗或缓解痛风症的功能性食品、保健药等,所述药物或食品可有效治疗或缓解痛风症。
根据本发明提供的一种确定个体是否患有痛风症的方法,包括步骤(1)和(2)。
(1)确定所述个体的粪便样本中的标志基因的丰度。
所述标志基因包括第一基因集和第二基因集中的至少一种基因。其中,所述第一基因集由以下基因组成:C03_GI_0051440、C03_GI_0051466、C05_GI_0017028、C50_GI_0345131、C64_GI_0032728和G38_GI_0125251,其中,所述第一基因集中的基因与SEQ IDNO:1-6所示的核酸序列一一对应,所述第一基因集中的基因与其对应的SEQ ID NO:1-6中的序列具有不小于90%的同一性,所述第二基因集由以下基因组成:C01_GI_0190397、C01_GI_0232192、C01_GI_0287172、C01_GI_0341126、C02_GI_0069373、C02_GI_0069375、C04_GI_0279808、C05_GI_0096564、C07_GI_0066430、C12_GI_0283312、C16_GI_0117164、C20_GI_0172619、C47_GI_0117622、C48_GI_0078316、C53_GI_0087483、C57_GI_0218184、C60_GI_0157568、C64_GI_0070575、G20_GI_0116524、G23_GI_0141028、G49_GI_0075567、G86_GI_0088728和G89_GI_0273545,其中,所述第二基因集中的基因与SEQ ID NO:7-29所示的核酸序列一一对应,所述第二基因集中的基因与其对应的SEQ ID NO:7-29所示的核酸序列具有不小于90%的同一性。
根据本发明的一些具体的实施例,步骤(1)进一步包括:获得所述个体的粪便样本中的核酸测序数据;将所述测序数据与参考基因组进行比对;基于所述比对的结果,确定所述标志基因的丰度。
根据本发明的具体实施例,在步骤(1)中,按照下列公式确定所述标志基因的丰度:Ab(G)=Ab(UG)+Ab(MG),其中,G表示基因的编号,Ab(G)表示基因G的丰度,Ab(UG)表示所述测序数据与所述基因G的参考序列唯一比对的读段的丰度,Ab(MG)表示所述测序数据与所述基因G的参考序列非唯一比对读段的丰度;Ab(UG)=UG/lG,其中,UG表示所述测序数据中与所述基因G的参考基因唯一比对的读段数目,lG表示所述基因G的参考基因长度;其中,MG为所述测序数据中与所述基因G的参考基因非唯一比对的读段的数目,i表示所述非唯一比对读段的编号,Coi为所述第i读段对应的丰度系数;其中,Coi,G表示针对所述标志基因G,所述非唯一比对的读段i的丰度系数,N为所述非唯一比对的读段i能够比对的基因的总数,j表示所述非唯一比对的读段i能够比对的基因的编号。上述丰度确定公式,基于比对结果中的唯一和非唯一比对上组装序列的读段对该组装序列的丰度的贡献情况,充分利用测序数据的同时确定的丰度十分准确。
根据本发明的具体实施方案,进行以下以完成该步骤:获得所述个体的粪便样本中的核酸序列的测序数据,所述测序数据包括多个读段;将所述读段比对至所述标志物中的各种基因的基因组,获得比对结果;依据所述比对结果,确定所述标志物中的各种基因的丰度。
所述的测序数据通过对样本中的核酸序列进行测序得来,测序依据所选的测序平台的不同,可选择但不限于半导体测序技术平台比如PGM、Ion Proton、BGISEQ-100平台,合成边测序的技术平台,比如Illumina公司的Hiseq、Miseq序列平台以及单分子实时测序平台,比如PacBio序列平台。测序方式可以选择单端测序,也可以选择双末端测序,获得的下机数据是测读出来的片段,称为读段(reads)。
比对可以利用已知比对软件进行,例如SOAP、BWA和TeraMap等,在比对过程中,一般对比对参数进行设置,设置一个或者一对读段(reads)最多允许有s个碱基错配(mismatch),例如设置s≤2,若reads中有超过s个碱基发生错配,则视为该reads无法比对到(比对上)该组装片段上。所述的获得的比对结果包含各条读段与各参考基因的比对情况,包括读段是否能够比对上某个或某些基因的参考序列、只唯一比对到一种基因还是比对到多种基因的参考序列、比对到基因组的位置、比对到基因组的唯一位置还是多个位置等信息。
reads与参考基因组比对,比对上的可以被分为两部分:a)Unique reads(U):唯一比对上一个基因的序列;称这些reads为unique reads。即,如果reads比对上的序列均来自同一基因,定义这些reads为unique reads;b)Multiple reads(M):比对上一个以上基因的序列,定义为multiple reads。即,如果reads比对上的序列来自至少两种基因,定义这些reads为multiple reads。
所述参考基因组指预先确定的该基因的序列,可以是预先获得的待测样本所属或者所包含的生物类别的任意参考模板,例如,目标是待测样本中的基因,参考序列可选择NCBI数据库中的各种基因的参考序列,进一步地,也可以预先配置包含更多参考序列的资源库,例如依据待测样本来源的个体的状态、地域等因素选择或是测定组装出更接近的序列作为参考序列。根据本发明的一个实施例,各种基因的参考基因是由发明人进行构建的。
(2)丰度比较,以确定个体是否患有痛风症。
根据本发明的一个实施例,将步骤(1)中得到的所述丰度与预定的阈值进行比较,以便确定所述个体是否患有痛风症。
根据本发明的一些具体实施例,所述阈值为预先设定的。将标志物中的各种基因在对健康个体以及患病个体中的丰度预先测定保存,用以作为设定阈值的依据。所述阈值可以为一数值或者数值范围,基于已知患病或健康状态个体中的标志基因的丰度均值,该基因对应的阈值可以设为该基因丰度均值的95%的置信区间(Confidence interval)。
所述的置信区间是指由样本统计量所构造的总体参数的估计区间。在统计学中,一个概率样本的置信区间是对这个样本的某个总体参数的区间估计。置信区间展现的是这个参数的真实值有一定概率落在测量结果的周围的程度。置信区间给出的是被测量参数的测量值的可信程度,即前面所要求的“一定概率”,这个概率被称为置信水平。
根据本发明的一些具体实施例,当步骤(1)中确定的标志基因的丰度达到所述患痛风症丰度阈值,未达到所述不患痛风症丰度阈值时,确定所述个体患有痛风症,当(1)中确定的标志基因的丰度达到不患痛风症丰度阈值,未达到患痛风症丰度阈值时,确定所述个体不患痛风症。
需要说明的是,根据目的或要求不同,可能对确定个体状态结果的可信程度有不同的要求,本领域技术人员可以选择不同的显著性水平或阈值。
该方法基于检测个体的粪便样本中的标志基因中的各种基因的丰度,分别将检测确定的各种基因的丰度与其阈值进行比较,依据获得的比较结果能够确定个体为痛风症个体或者为健康个体的概率。为早期发现痛风症提供一种非侵入性的辅助检测或者辅助干预治疗的方法。
以上任一实施例中的利用标志基因确定个体是否患有痛风症的方法的全部或部分步骤,可以利用包含可拆分的相应单元功能模块的装置/系统来施行,或者将方法程序化、存储于机器可读介质,利用机器运行该可读介质来实现。
根据本发明提供的一种确定个体是否患有痛风症的装置,该装置包括:丰度确定单元,用于确定所述个体的粪便样本中标志基因的丰度,所述标志基因包括第一基因集和第二基因集中的至少一种基因;比较单元,用于将所得到的所述丰度与预定的阈值进行比较,以便确定所述个体是否患有痛风症;其中,所述第一基因集由以下基因组成:C03_GI_0051440、C03_GI_0051466、C05_GI_0017028、C50_GI_0345131、C64_GI_0032728和G38_GI_0125251,其中,所述第一基因集中的基因与SEQ ID NO:1-6所示的核酸序列一一对应,所述第一基因集中的基因与其对应的SEQ ID NO:1-6中的序列具有不小于90%的同一性,所述第二基因集由以下基因组成:C01_GI_0190397、C01_GI_0232192、C01_GI_0287172、C01_GI_0341126、C02_GI_0069373、C02_GI_0069375、C04_GI_0279808、C05_GI_0096564、C07_GI_0066430、C12_GI_0283312、C16_GI_0117164、C20_GI_0172619、C47_GI_0117622、C48_GI_0078316、C53_GI_0087483、C57_GI_0218184、C60_GI_0157568、C64_GI_0070575、G20_GI_0116524、G23_GI_0141028、G49_GI_0075567、G86_GI_0088728和G89_GI_0273545,其中,所述第二基因集中的基因与SEQ ID NO:7-29所示的核酸序列一一对应,所述第二基因集中的基因与其对应的SEQ ID NO:7-29所示的核酸序列具有不小于90%的同一性。上述对本发明任一实施例的利用标志基因确定个体是否患有痛风症的方法的技术特征和优点的描述,同样适用本发明这一方面的装置,在此不再赘述。
根据本发明的实施例,所述丰度确定单元适于通过下列步骤确定所述丰度:获得所述个体的粪便样本中的核酸测序数据;将所述测序数据与参考基因组进行比对;基于所述比对的结果,确定所述标志基因的丰度。
所述的测序数据通过对样本中的核酸序列进行测序得来,测序依据所选的测序平台的不同,可选择但不限于半导体测序技术平台比如PGM、Ion Proton、BGISEQ-100平台,合成边测序的技术平台,比如Illumina公司的Hiseq、Miseq序列平台以及单分子实时测序平台,比如PacBio序列平台。测序方式可以选择单端测序,也可以选择双末端测序,获得的下机数据是测读出来的片段,称为读段(reads)。
比对可以利用已知比对软件进行,例如SOAP、BWA和TeraMap等,在比对过程中,一般对比对参数进行设置,设置一个或者一对读段(reads)最多允许有s个碱基错配(mismatch),例如设置s≤2,若reads中有超过s个碱基发生错配,则视为该reads无法比对到(比对上)该组装片段上。所述的获得的比对结果包含各条读段与各参考基因的比对情况,包括读段是否能够比对上某个或某些基因的参考序列、只唯一比对到一种基因还是比对到多种基因的参考序列、比对到基因组的位置、比对到基因组的唯一位置还是多个位置等信息。
reads与参考基因组比对,比对上的可以被分为两部分:a)Unique reads(U):唯一比对上一个基因的序列;称这些reads为unique reads。即,如果reads比对上的序列均来自同一基因,定义这些reads为unique reads;b)Multiple reads(M):比对上一个以上基因的序列,定义为multiple reads。即,如果reads比对上的序列来自至少两种基因,定义这些reads为multiple reads。
所述参考基因组指预先确定的该基因的序列,可以是预先获得的待测样本所属或者所包含的生物类别的任意参考模板,例如,目标是待测样本中的基因,参考序列可选择NCBI数据库中的各种基因的参考序列,进一步地,也可以预先配置包含更多参考序列的资源库,例如依据待测样本来源的个体的状态、地域等因素选择或是测定组装出更接近的序列作为参考序列。根据本发明的一个实施例,各种基因的参考基因是由发明人进行构建的。
根据本发明的一个实施例,按照下列公式确定所述标志基因的丰度:Ab(G)=Ab(UG)+Ab(MG),其中,G表示基因的编号,Ab(G)表示基因G的丰度,Ab(UG)表示所述测序数据与所述基因G的参考序列唯一比对的读段的丰度,Ab(MG)表示所述测序数据与所述基因G的参考序列非唯一比对读段的丰度;Ab(UG)=UG/lG,其中,UG表示所述测序数据中与所述基因G的参考基因唯一比对的读段数目,lG表示所述基因G的参考基因长度;其中,MG为所述测序数据中与所述基因G的参考基因非唯一比对的读段的数目,i表示所述非唯一比对读段的编号,Coi为所述第i读段对应的丰度系数;其中,Coi,G表示针对所述标志基因G,所述非唯一比对的读段i的丰度系数,N为所述非唯一比对的读段i能够比对的基因的总数,j表示所述非唯一比对的读段i能够比对的基因的编号。上述丰度确定公式,基于比对结果中的唯一和非唯一比对上组装序列的读段对该组装序列的丰度的贡献情况,充分利用测序数据的同时确定的丰度十分准确。上述对本发明任一实施例的利用标志基因确定个体是否患有痛风症的方法的技术特征和优点的描述,同样适用本发明这一方面的装置,在此不再赘述。
根据本发明的又一个实施例提供的一种装置,包括:计算机可读存储介质,其上存储有计算机程序,所述程序用于执行前面所述的一种确定个体是否患有痛风症方法;以及一个或者多个处理器,用于执行所述计算机可读存储介质中的程序。
根据本发明的又一个实施例提供的一种筛选药物的方法,所述药物用于治疗或者预防痛风症,所述方法包括:将候选药物施用于受试者,检测施用前后,所述受试者粪便中标志基因的丰度,所述标志基因包括第一基因集和第二基因集中的至少一种基因,其中,满足下列条件至少之一的候选药物适于用于治疗或者预防痛风症:(1)进行所述施用后,所述第一基因集中的至少一种基因的所述丰度降低;和(2)进行所述施用后,所述第二基因集中的至少一种基因的所述丰度升高;其中,所述第一基因集由以下基因组成:C03_GI_0051440、C03_GI_0051466、C05_GI_0017028、C50_GI_0345131、C64_GI_0032728和G38_GI_0125251,其中,所述第一基因集中的基因与SEQ ID NO:1-6所示的核酸序列一一对应,所述第一基因集中的基因与其对应的SEQ ID NO:1-6中的序列具有不小于90%的同一性,所述第二基因集由以下基因组成:C01_GI_0190397、C01_GI_0232192、C01_GI_0287172、C01_GI_0341126、C02_GI_0069373、C02_GI_0069375、C04_GI_0279808、C05_GI_0096564、C07_GI_0066430、C12_GI_0283312、C16_GI_0117164、C20_GI_0172619、C47_GI_0117622、C48_GI_0078316、C53_GI_0087483、C57_GI_0218184、C60_GI_0157568、C64_GI_0070575、G20_GI_0116524、G23_GI_0141028、G49_GI_0075567、G86_GI_0088728和G89_GI_0273545,其中,所述第二基因集中的基因与SEQ ID NO:7-29所示的核酸序列一一对应,所述第二基因集中的基因与其对应的SEQ ID NO:7-29所示的核酸序列具有不小于90%的同一性。
利用本发明这一方面的生产或筛选治疗痛风症的药物的方法,通过合理有效地应用确定的痛风症标志基因进行筛选,能够获得提高肠道微生物的有益基因的丰度和/或降低肠道微生物潜在的致病基因的丰度的药物。
以下结合具体实施例对本发明的方法和/或装置进行详细的描述。除另有交待,以下实施例中涉及的未特别交待的试剂、序列、软件及仪器,都是常规市售产品。
以下实施例包括第一阶段和第二阶段,即对应发现阶段和验证阶段。发现阶段包括:基于分析比较71个痛风症患者及60个健康个体的肠道微生物基因成分及功能改变,以确定基因标志物;验证阶段包括:利用31个痛风症患者及26个健康个体验证第一阶段结果的准确性。
实施例1生物标志物的鉴定
该示例中,发明人从71个痛风症患者、60个健康个体的粪便样品开展整个肠道菌群微生物基因的关联分析研究描述粪便微生物群落及功能成分特征。总的来说,发明人通过实验测序得到的1353Gb高质量测序数据。宏基因组分析显示,34个微生物基因与痛风症疾病密切相关,其中23个基因在健康人的肠道微生物基因集中富集,11个基因在痛风症病人的肠道微生物基因集中富集。
1、测序数据的获取
共下载了71个痛风症患者的粪便样品和60个健康人的肠道宏基因组测序数据,数据来源于https://ftp.cngb.org/pub/CNSA/data3/CNP0000284/CNS0040454。每个样本平均产生10.33Gb(sd.±1.56Gb)高质量测序结果,总计1353Gb测序数据量。
参照图1的实验流程,鉴定痛风症的相关生物标志物,其中省略的步骤或者细节为本领域技术人员所熟知,几个重要步骤介绍如下面步骤所述。
2、生物标志物的鉴定
2.1测序数据的基本处理
测序数据经过质控:获得第一阶段的131个样品的测序数据以后,对其进行过滤,质控按以下标准进行:a)去除低质量碱基(Q20)大于50%的reads;b)移除大于5个N碱基的reads;c)移除尾部低质量(Q20)和N碱基。丢失成对reads的序列被认为是单条reads用于组装。
2.2基因丰度分析
利用SOAPalign 2.21将经过上步骤处理的paired-end clean reads比对(匹配)到非冗余基因集,这里,所称的非冗余基因集来自通过上步骤处理的paired-end cleanreads通过组装、预测、基因预测得到的冗余基因集构造的。比对参数为–r 2–m 100–x1000。reads与非冗余基因集进行比对,比对上的可以被分为两部分:a)Unique reads(U):唯一比对上基因集的一个基因;称这些reads为unique reads。即,如果reads只比对上基因集某一个基因,定义这些reads为unique reads。b)Multiple reads(M):比对上基因集的一个以上的基因,定义为multiple reads。即,如果reads比对上至少两个不同的基因,定义这些reads为multiple reads。
对于基因G,其丰度为Ab(G),与特有的U reads和共享的M reads相关,丰度的计算方式如下:
Ab(G)=Ab(UG)+Ab(MG),
其中,G表示基因的编号,Ab(G)表示基因G的丰度,Ab(UG)表示所述测序数据与所述基因G的参考序列唯一比对的读段的丰度,Ab(MG)表示所述测序数据与所述基因G的参考序列非唯一比对读段的丰度;
Ab(UG)=UG/lG,
其中,UG表示所述测序数据中与所述基因G的参考基因唯一比对的读段数目,lG表示所述基因G的参考基因长度;
其中,MG为所述测序数据中与所述基因G的参考基因非唯一比对的读段的数目,i表示所述非唯一比对读段的编号,Coi为所述第i读段对应的丰度系数;
其中,Coi,G表示针对所述标志基因G,所述非唯一比对的读段i的丰度系数,N为所述非唯一比对的读段i能够比对的基因的总数,j表示所述非唯一比对的读段i能够比对的基因的编号。
对于这些reads,发明人以加和的N个基因的unique reads的丰度作为标准。即对于multiple reads,发明人把其所比对上的N个基因的unique reads丰度之和作为分母。
2.3关联分析/筛选基因标记物
为了获得与痛风症疾病密切相关的肠道微生物基因标记物,发明人利用痛风症患者组(71例)与健康人组(60例)两组肠道微生物基因丰度数据,在基因级别做了一个与疾病相关性的研究。
基于上述步骤得到的基因丰度表,发明人设置标准如下:(1)痛风症患者组或健康人组基因丰度的中位数必须大于0.000001;(2)通过结合Benjamini Hochberg的多重检验的Wilcoxon秩和检验进行检验,得到每个基因在痛风症人和健康人样本间的差异q值;(3)使用一个相对严格的阈值q值<0.05。然后,发明人得到34个与痛风症疾病密切相关的肠道微生物基因。其中在痛风症(Gout)患者中富集的有11个基因,在健康人(HD)中富集的有23个基因。这34个微生物基因标记物如下表1所示。
表1
实施例2基因标记物的验证
为了证实实施例1中的分析结果,进一步比较验证群体中的26个健康人及31个痛风症患者的基因丰度,并对最终微生物基因标记物根据验证情况做出筛选。验证群体的测序数据的获得与处理,参照实施例1进行。每个样本平均产生10.31Gb(sd.±1.73Gb)高质量测序结果,总计587Gb测序数据量。
验证结果如下:上述富集在健康人群中的23个基因均在验证集中得到高质量的验证(q值<0.05),健康人富集的微生物基因标志物验证的q值和p值情况如下表2所示。
表2
对于上述富集在痛风症患者中的11个基因,其中6个在验证集中得到高质量的验证(q值<0.05),痛风症患者富集的微生物基因标志物验证的q值和p值情况如下表3所示,分别为C03_GI_0051440、C03_GI_0051466、C05_GI_0017028、C50_GI_0345131、C64_GI_0032728和G38_GI_0125251。
表3
基因(Gene) | p值 | q值 | 富集人群 |
C03_GI_0051440 | 0.000272814 | 0.021199131 | Gout |
C03_GI_0051466 | 0.000276908 | 0.02123341 | Gout |
C05_GI_0017028 | 9.47E-05 | 0.020578043 | Gout |
C50_GI_0345131 | 0.000322296 | 0.022042733 | Gout |
C64_GI_0032728 | 0.000230732 | 0.020838442 | Gout |
G38_GI_0125251 | 0.000207062 | 0.020838442 | Gout |
发明人认为,可以将从健康人富集的23个微生物基因标记物,作为痛风症疾病患病的反向指标,或作为治疗痛风症进行研发的微生物制剂药物基因成分,或作为检测痛风症、监测痛风症治疗进程的恢复指标;将痛风症患者富集的6个微生物基因标记物,作为痛风症疾病患病的正向指标,特别用于痛风症疾病非创伤式的检测和诊断。
发明人利用这6个微生物基因标记物,构建一个综合指标,估计ROC(Receiver-operating characteristic)曲线下面积AUC,AUC越大,表示诊断能力越高,评价综合得分对应其对痛风症的诊断能力。通过对一期(第一阶段)的131个样品和二期(第二阶段)的57个样品进行评测,具体情况如图2所示,都表现出了很好的诊断能力,在一期得到AUC=82.2%,如图2a所示,置信区间为74.9%-89.6%;二期得到AUC=85.6%,如图2b所示,置信区间为75.9%-95.3%。
上述基因集中基因的具体信息如下:
C03_GI_0051440
ATGTTATCAAAACTTAAAACTTATTTAAATATGTGTATTCACCCTCGTTTAAAATATATGCCTATTTCCCTAAAATTAGCTTTTATCTACAGCATCATGCTCTGCTTAATTTTAATTGTAACTTTAAGCAGTACCTTGATTGGCATACATTACGTTCTCTTTCACGAAGCTGAAGTATCCATCAATTTATCTGCTAATTATGTAGAGAAAAAAGCTAATAATGAAACAGTGCCAGAATTACTACAAGATGTAAAAAGTTCTGCCCTTATCCCTGGCGTTGTCATGCGTGTAACAGATAGCAATAATAATATAGTTTATGATAGTTTGCCAATGTATATATCTATCAATCACGTTCAGGACTCACTTGCTAGACAAGAAGAACATCCTCAAATTGAAGATTACATTCGCAATGCATTCTTACCTGATGATTTAAAATTTGTCAATTTTAAACATTTTTGGATTTTCTATACGCAAAGAACTATTGTCAAAAACGATGAAACGTATACACTTCATTTCTTGCGAACGATTACAGCAGAAAAAGTATTTTTAGAAGAATTATCCGAAACTATTTTTTATGCTGGAATTGCAGGGGTAATAATCTCCATTATTTGCGGTTTTCTCCTCAGTAGAAGATTATTAAAACCATTAAGAGATATTACCACGACTGTAAAAAATATTGAAATTCAAGATTTAAATCAACGCATCAAAGTACAGCCAACTAGAGATGAATTAGAAGAACTTTCTAATACCTTTAATTTGATGTTAGAGCGCTTACAAAAAGGTTTTGAGCAACAGCGTCAATTCGTATCCGACGCCTCTCATGAACTTCGCACTCCTGCCACTGTAATTTGCGGTTATTCAGATATGCTCGCTCGTTGGGGTAAAGATGACCCTCAAACTGCTGATGAATGTATCACAGCTATTCATTCTGAAGCCATCAATATGCAACGTTTGATTGAAAAGCTCTTATTCTTGGCTAGAGCAGACCAAAAACGTCAAGTATTGCATAAAGAGTCATTGAATTTAAAACCTTTAATTGCCGATATTGCCAAAGATACGCAATTAATCGCACCTCAACATACTATAACTTGCACTCATAATGATGATGGATATATCTTTGCTGATGAATTAGTGATGCGTCAAATGCTTCGTATCTTTTTAGATAATAGCATAAAATACACGCCAGATGGCGGAAAAATCACCATTTCCTCAGAAAATAAAGTCAAACATATGATTGTAAAAATCTCAGATACTGGTATCGGTATCGCTAAAGATAAACAAGATAAAATCTTTGAGCGTTTTTATCGCGTAGATAGTGCTAGAACGAGAAACGGCGTCGGTGGTACAGGTCTTGGTCTTTCCATTGCCAAATGGATAGCTGATGCCCATGATATAGAAATCAGATTATCTAGCAAATTAAATAAAGGAACAACAATTATTTTAATCATTCCTAAAGATAACTAA(SEQ ID NO:1)。
C03_GI_0051466
ATGCCATTAGCTATATTGGCTGTGGGGATTATTATTTTATTTATACTTATTGTAAAGTGTAAATTAAATAGTTTTTTATCTTTAATTTTTGTAGCAATTTTTATGGGCTTTGCTTTAGGTTTACCAGTAGATGCTATCGTACCATCTATAACTAAGGGGTTAGGTGGTACATTAGGAGGTCTGGCAATAGTCGTAAGTTTTGGGGCTATGCTTGGTAAATTGATGGCTGATAGTGGGGGAGCACAAAGAATTGCCACTACATTGATTTCTATGTTCGGGGTAAAAAATGTTCGTTGGGCTGTTTGCTTAACAGGTTTTGTCGTAGGTATTGCACTTTTTTATGAAATCGGCTTTGTACTTTTAATTCCATTAGTATTTACGATTGCAGCGGAAGCAAAGGTTAATCTTTTAGAAGTTGGTATTCCGATGGCAGCTTCTTTATCTGTAGCACATGGATTTTTACCACCACATCCAGGGCCAACAGCGATTGCAGTTATTTTTAATGCAGATTTAGGGACTACTTTGATTTATGGCTTTATCATTGCAGTGCCAACAGTTATCTTAGCAGGACCACTTTATTATAATTTTGTTAAAGATTTGAAACCGGAAATTCCAAAAGGTTTATACAATCCTAAAATTTTCAAAGAAGATGAAATGCCTTCTTTTGCAATTAGTATTTTTACTGCATTAGTACCAGTAGTATTGATGGCAGCTTCTGCTATTGTAAAGATGACTTTAGATGATACGTATAGTATTTACCATATTTTAGTATTTTTAGGAAATCCAGATATAGCGCTTACTATTTCTGTAATCATTGCCATTTTTACTTTTGGCTTAAATCGTGGAAAATCCATGAAAGAAATAATGACAAGCGTAGAAGATGCCGTAAAAACTATTGCGATGATTTTACTTGTTGTTGCAGGTGGCGGTGTTTTAAAACAGATTTTAATTGATAGTGGATTGGGAACATATATCGGTAGTTTAATTCATGGTTCAGATATGTCTCCATTATTAATGGCATGGTTGATTGCTGCTGTTATCAGAACTTCTGTTGGGTCTGCAACTGTAGCAGCACTCACAGCAGGTGGTATCGTAGCACCATTAATTCCACTCACTGGTGTAAGTCCAGAACTTATGGTATTAGCAGTTGGTGCAGGTAGTGTAATTTTTAGTCCACCAAATGACCCAGGATTTTGGTTATTTAAAGAGTTCTTTGGCTTAACTATAAAGGGAACAATTCGCACATGGTGTGCTTTAGAAACTATTATTTCTGTTGCAGGTATTATTGGTGTAATGATTTTAAATGCAATCTTATTTTGA(SEQ ID NO:2)。
C05_GI_0017028
ATGAAAGAATTATTTTCTAAGCGAGCGAAAAAAATTATAACAGCTGTATCATTATCTTGTTTCTTATGCAGTCCAGTGAGTTATGTTTATAGTATGAATCAAGCTTCAGCAGCAGCTTTGAATACAAATATTGCTTATGAACAGCAATTCAATACAGTCGGCTTTGATAAAGATGATCATTGGAATAGAGGTCGCTCTGATGAGGATAAGGATTGGAAAAAACCACCTCCACCTCGCGATGATGACAGAGATGATAAGCGACCACCTCGTCCTGATAGAGACGATGATGATTGGAGTCCACCACCACCTCGTCATGATGATGATGACGATGATTGGGATAGAGATAGACCTCCACGTCATGACCGTGACGATAGAGATGACCGCGATGATGATAGCGACAAAGATTATGATAAAGGCGATATCACAGCTGCAGTATTAATCGGCGGTGTAATCGGTGCTATCATTGCTAAAAACACTTAA(SEQ ID NO:3)。
C50_GI_0345131
ATGAAGAACATTATCAATAGAATAGAGAAAGTATTGCTCCTTAGAAAGGAGGTGATCCATCCTCACGTTCCCGTACGGATACCTTGTTACGACTTCACCCCAATCGCTAATCACACCCTCGGAGCATCCCGCCTTGCGGTTAGGCCTGCTACTTCAGGTGCAACCAACTCTCGTGGTGTGACGGGCGGTGTGTACAAGACCCGAGAACGTATTCACCGCAACATAGCTGAT(SEQ ID NO:4)。
C64_GI_0032728
AAAAATGCTTTACTCAGCTCTCTTTTTTTGTATAATATAGTCGCCAAACAAAATATACAAAAGGAGATATACATGCTTTTAAAACACATATTCTCCGATATTAATATATCAAATCTTTTAACTCATGTCAAAAAATATTTTTACTATAATCATTTTCTTTACATTGAAGAGACTATTCAAAAATTTCTTGCTTGTTCAATTGATAAAGCTTTCATTGTTTATCAATGCCCTCTGTGCGGTAGCGCTCATAAATTTAAAATTTCTTGTAAATCTAGACTTTGTCCCGCATGTGGTAAAAAATATGCTGCTCTTTGGGCTGATAAAACTGCTGCTTCTCTCATTAATACTAAGCATAGAGCTATACTTTTTACCATTCCAAAAGAAATTAGGGAGTTTTTCTTTTATGATAGAACTCTTTTAACTAAACTTACATATGCTGTTAACGATATTTTTAAATATCAATTTAATAATATTAAATCTAAAAATCAAAGAGTTCATAAAATTGGTAGGTATTCTAAAAAATATTTCACTAATTCTGATATTCTTCATTATGGTCTTATTACTGTTATTCATACCTTTGGTCGTGACCTTAAATGGAATCCACATATCCATGCTATTGTTACTCTTGGTGGATTTAATAAAAATTATAAATACCTTAATAAAAAATATTTCCATGTTAATTCTATTGCTGGACAATGGAAAAAACTTGTTATTGATATTGTTAAAAGTGGTAATTATAAAAATAAAAAGCTTAAAAAGAAAGCTCAAATTATTGCTTCTTCTCTTTATAAAAAAGATACAAGATTTTTCTTTGACGTTGCTAAAAATGATTTAAATAATAATGTTTCGGCTATCAAATATATTGGGAGATATTTATCTCGCGCTCCTATCGCTGAATATAAAATACTAGATTTTTCTGACAATAAAGTTACCTTCTATTATGAAGATCTTTCTAATAATAAAGAAAAAGTTGAAATTACTATGGAAGTAGAAGAATTTCTTTCTAAATTAATTATTCATATTCCTCCTAAAAATTTTAAAATGATTAGGAGATTTGGTATTTATTCTAGAAATATAAAAAAAGAACTTAAATTTATTATCTCTAAAATAAAAAAATATAAATTACAATATACTAAAACTACATTTTATCAACTAGAAATCTGGAAAACATTTGGAATAAATCCTTTCTACTGTTTTAATTGTAAAATTAAAATGAAAGTAAGAAGAATTTCATATTTTAATATATCAAAAGGCTCCATTTGTTGGAAAGAATATTGTTGGTTGCGCTGA(SEQ ID NO:5)。
G38_GI_0125251
GGAGGTGGACTGATGAAACAACTAAAAGCATATAAATTTAGAATTTATCCAAACGAAGAACAAAAGATATTTTTTAGTAAAACTTTTGGTTGTGTTCGTCTTGTCTATAATCTTATGCTAAATGATAGAATTAAAGCATATGAAGAAAGTAAAGGTAATCCTGATAAAAAGATAAAATATCCAACTCCTGCTCAATATAAAAAAGAGTATGAATTTCTAAAAGAAGTTGATAGTCTTGCTCTTGCTAATGCTCAAATGAATTTAGACAAAGCGTATAAAAATTTTTTTAGAGATAAATCTATTGGATTTCCTAAATTCAAATCTAAGAAAAATCCTGTACAAAGCTATACAACCAATAATCAAAATGGAACTGTAAATATTTTTGAAAATTGGTTAAAAGTTCCAAAGCTTAAAGAATTAGTAAAAATTAAAGTGCATAGAAAAATAGAGGGTATAATAAAATCTGCTACTATCTCGCGTAATGGAAGTGGTAAGTATTTTATCTCTTTGCTATGTGAAACTGATATTCAAGAATTACCAAAAACTAATTCATCAGTAGGAATTGACTTAGGTATTAAAGATATGGCTATTTTATCTACTGGAGAAAAAATTGAAAATCTTAAATTTAGAAAACAATTAGAAGATAAACTAAAAAGAGAACAGAGAAAACTTTCTAAAAGACTTCTAATTGCTAAAAAAGAAAATAGAAAATTAAGCGAAGCTAAAAATTATCAAAAACAAAGAATTAAAATTGCTAAGATACACGAAAAAATTATGAATATGAGAACAGCTTTCTTAAATAAGTTAAGTACAGATATTATCAAAAATCACGATATTATCTGTATTGAAGACTTAAATACAAAAGGATTACTTCATAATCATAAATTAGCAAAATCTATATCTAATGTATCTTGGGCTAGTTTTGTAAATAAACTTGAGTATAAAGCGAAATGGTATGGTAAAGAGATAATAAAAATTGATAAATTTTATCCATCAAGTCAAATATGCTCTGTATGTGGTTATAAAGATGGCAAGAAAACTCTTGATGTAAGAGAGTGGACTTGTTCAGTTTGTCATACTCATCACGATAGAGATATAAACGCAGCTAAAAATATATTGACTGAAGGTCTAAGACTAAAACAAGCAGTCTAA(SEQ ID NO:6)。
C01_GI_0190397
ATGAAAAATCTTCGACTTTTGAAAGCGGGTGACGATATGAAAATAATTACAAGAGCAAAGTATCTCGACAGAATCATTGAACTGAATGGTACTCCTGACATCAAGATCATCACGGGCATTCGTCGATCCGGTAAGTCCAAGCTGATGCAGGCGTATATTGATTACCTGAAAAGCCATTTTGAAAATATCAATATCATCTTCATTGACTTCATGGATTTGGCGTATGAAGAAATCAAGGAATACCATGCCTTACACGCCTATGTGGAAGAACATTATCAGGAAGGTAAAACGAACTACCTGTTTGTAGACGAGGTTCAGATGTGTCCCAAGTTTGAGTTGGCAATCAACAGCCTGTACTCTAAGGGAAAATACGACATCTATGTAACCGGCTCCAACGCTTTCCTGTTGAGTGCGGATCTGGCAACTCTGTTTACCGGACGCTATATTGAAATTCATGTGTTTCCTTTCAGCTTCCAGGAATATTGCCAATATTATGATGATGTTAGTGATAAAGATAAGCTCTTTGATGATTACGCTATCAAGGGCGGTTTAGCAGGTTCTTACGCTTACAGAACCGAAAAAGACAGAACAAACTATATCAAAGAGGTCTACGAAACGATTGTTACAAGGGATTTGGTGCAGAAATATGCACTCCCGGACACGTTGGTTTTACAACGTCTGAGCGAGTTTCTTATGGATAATATCAGCAACCTGACTTCTCCTAATAAGGTCAGTCAGCTGCTGACAGCAAATGAGACTCCAACCAATCATGTAACCGTCGGCAAGTACATTAAGTATTTGTGCAATGCTTTTGTATTTTATGATATTAAGAGATACGACATCCGAGGCAAGAAATACCTTGAAAGCTCTGAAAAGTTCTATCTTTGTGACAGTGGTATTCGATATGCAATACTGGGAAGCAGAAATATGGATTACGGCAGAGTATATGAAAACATCGTTTGCATCGAGCTTCTTCGCCGTGGATACGATGTCTATGTCGGCAAGCTCTATCAAAAGGAGATCGACTTTGTTGCTCAGAGAGGCAGCGAGAAGATTTATATTCAGGTCAGCGACAACATTTCCGGACAGGAAACATTTGAGAGAGAATGCTCTCCTCTGCTTCAGATCCGAGATGCTTATCCGAAAATGATTATTGCCAGAACCAAGCATCCAAAATATAGTTATGAAGGAATCGAAATCCACGACATAGCCGATTGGTTGCTACAAGAATAA(SEQ ID NO:7)。
C01_GI_0232192
ATGGCACGAGCAAAAAACAGAGGGTATCAGCAGAGTTTCTCTCCCTCTTACACAATCCGCCGCTGGCGGCTGGGCATCTATATCCGGCTTTCAAAGGAAGATTTGAAAAAAGGAAAAGACGATAGCAACAGCGTAAAGAACCAGCGTGACCTACTGAACGATTTTTACCGACGCAACATTGACGAGTTTGAAAGTATCACGGAATATGTAGATGACGGACATACTGGAACGGACGCTAACCGTGAAGATTTTCAACGGCTCTTGGCGGATGTCATGAGTGGTAAAATCAACTGCGTTATAGTAAAAGACCTGTCCCGCTTCGCACGAAATTATAGCGATGCCGGAAGTTTGATCGACAACCTGTTTGTTCAAATGGGTGTTCGCTTTATCAGCCTTGCTGAGAATGTGGACAGCTACAAGAACCCCGACAGCGTTTCAAATATCATCGTTCCCATTACAAACGTGATGAACGATAATTACTGCTATCAGACTTCCAAAAAGATCCGGCAGGTATTTGATTACAAACGGCGCAACGGCCAGTATATCGGAGCATTTGCTCCTTACGGCTATGTAAAGCACCCAAAGGACAAGCACAGGCTGATTGTTGATCCCGATGCTGCTGAAAATGTCAAACTCATTTTCACAATGCTTATTCAAGGGTCATCAAAACGTGCTATCGCGTTGTACCTGAACGAACACGGCGTACCGAGCCCCTCGGCTTACAAGGTACAAAAGGGCTTGCCTGTTTCGACAAGAGGGTATGACGATCCTATGTGGGGAGCCCGCATGATCCACTCCATTCTTACCAATCCGACCTACACCGGGGACTTAGCCCAAGGCCGGAGCCGGGTGAAAAGCTACAAGGTACACCAGATTGAAGCTGTTCCCCGCGAGGAATGGGTGGAAGTGGCTGGAACACATGAGGCCATTATCGACTATGAAACTTTCGATAAGGTACAGGCTCTCTTACAGCGTGATACCCGTACTTCCCCGAAAGGCCGTGAGGTACATTTATTCAGCGGCTTTCTGAAATGTGCCGATTGCGGGCGGGCCATTACCCGATGCGTTAGCAAGAACAACAATGTATATTATTCTTGCTCAACCTACAAGAACCGTTCCCGGACAGCCTGCACCATGCACTCAATCAAGCATGAACGGCTGGAGGCTGCTGTTCTGTTCGCCGTACAGCATCAGGTACATTTAGCTGTTTCCTACTCAGAAATCGTAACGCAGATCAATTCCGCTCCAATCAAAAAAAGCCAGTCTTACCGACTGGACGATCTGATAGCTGCAAAAGAGCGGGAACTGATAAAGATAACACGCTACAAGCAATCTCTTTATCAGGACTGGAAAGACGGTGAAATCACCCAGCAGGAATACCGGGATATGAAGGCTGACTATGAACGGCAGACTTCTGATATTTCCGCGGTGCTTACCCGGCTGAACGCTGAACGCGCAGAACTGGCAAACGGTGTGGACAATGAGCATCCTGCACTGGTAGCCTTTATGAAGTATCAGAACATTGAAGCCCTCAACCGTGAAATCTTGGTTGAACTTGTGGACTATATCAAGGTCTATGAAAACGGCAATATCAGCGTGAAATTCAAATTTGCTGACGAGCTCCGCAAGATTGCCGAGTACATTGAAATCAACACTACGGAAGATACCGCAGTAGCGGGCTAA(SEQ ID NO:8)。
C01_GI_0287172
ATGAGCCTTGATAGGAAAATAAATCGCATTCAATTTCTCTCAGGAAATTCGCTAAAGGTTATTGCTGTACTGACAATGCTTATTGACCATCTATGTAAAATTGTGCTGCAATGGCTGCTATCAAACTACTGGGGGGCTATGGCAGATAACGGGCAAATGTCGTGGGAGAGATTCCGAGAGATAGATTATTTCATACGGTTTGATTTGCAAAGCATTGGGACGATTGCTTTTCCGCTATTCTGTTTTTTGCTGGCAGAAGGATTCCAACACACAAGAAGTAAAAAACGCTATATTGGGTTGATGCTTGCATTTGCCCTTATTTCGGAAGTTCCATTTGACATAGGTTTCTTTAGTGCGTATTCACGAATGGAAGATACATTTCCGTTTTACTTGAAGTATCAAAATGTATTTTTCACCTTGTTTTTAGGCTTATTGACATTGGTATGCCTTGAAAGATTTTCGTGTAAATCAGACCTACCGGTGGATAGAATAAAATCAGCAGTCCTGCAAGTTCTCAGTGTAGTGCTTTTTTCCGGCATTGCGGAAGGAATCCATTGTGACTACGGTATGCAGGGGATCTTATTCATATCAGCATTTTATATTTGCCGTAATCACCGAATCTATCAAGTGTTGCTGTTCCTTTTGGCTTACATGGGGACAACGGGGAATCAACCGCCTTTATGTACGCTTCTTGCCTGCTTGCTTATTCTGCTATACAACGGAAAGCGTGGTAAACTGAAGCTAAAATACTTCTTCTATGTTTTTTATCCAGCACATATCCTTGTCCTATATTTGATTCAGATAGGACTCGGAAAATACTTACTGAAATGA(SEQ ID NO:9)。
C01_GI_0341126
ATGCGTGGAAGTCAAGCCGTCTGGTGTCTTGGTACATTCTCATATCACCCCTATATTATTTTACATTTCGGGTTTGACTATGAGAACGAAACACAATTTTATGTTTTAGTAGTATTTTATTGCCCGTCGGCAAGGTTGCCGATGTTACACGGACAAGGTATAATAACAGAAAGAAAATTTGAAAACTACACTTTAATCACAAAAATCTATGATACGCTATCTTTGGAGGTGTTATTATGCAAAGGATTTTAG(SEQ ID NO:10)。
C02_GI_0069373
ATGACCCAAAAACAAAATGGTGTATTAGAATGGTTGCAGAGTTGTGAAACGCCTGCTCCATCTGAACCTAAAATTAAAGCAGTAATCGTAGCTGGAAAAAGTTACATGAATAGTTCTGAATTCAATAAAAATTCAATGCGAGATATTATATTGAACCAACTTCAATTTCTGCCGCTTTCTTTCTGGATTGTTCAAATAATACTCACTATATGTGCAGTATTATTAGCATGTATCCTGGGCCAATGGAGGGTTCCATTTTATTATCCATTGACAATCCTTGCAGTTATGGTTCCATTCCTTGCGTTATTAGGTGCAATAGAAATATCTAAAAGCAACATCTATGGTATGTGGGAAATTGAACAGTCTAGTAGAACAACGCTGGTAAAAATTGTAGCAGGTCGTATGCTGATTATTGGAGTAATCAACCTTTTCCTAATAACAGTCATTTTAATTTCAATGGCATATATTTACCAGAAATCAATGATTGAAATGGTGTTGTATGGTTTGATTCCATTTAATATTTCTTGCACTTGTTATCTTTTTATATGTGCGAAAAGCAGGACAAACGATAGCTTGTATCATTTAATCGCTTGTATGATTTTTCTTTCTGGAACATTTTCTCTTGTACTCCATCAGCGATTTATATTTGAAGCGTCTATGTTCTGGGGATGGATTGGATTTTATGTGTTATCTATTATCCTATTAGGGAAAACACTTCAACTGTACTTGAAAAAAGAAAAAATGATTGGAGAATTGATATGGAACTTACAATAA(SEQ ID NO:11)。
C02_GI_0069375
ATGAATGAAATGATAAAAGCAGAACGAAATAAAATATGTTCGAGAAAGCAAACACGAATGTTGTTTTTAGCTGGTGTGGTTCTTATCGTTGCCTATTTTTTCTTTTTTCAATTTAATTATCAAAATGTTTTCTATGATTATGACCTTGAAAAAATGGCATTAGCAAGCGGTTTTACAGCCATTGAACAACGGAAGGAAGTAGCAGAAATATTTGAAGGAAAACTCTCTCAAAATACATTACTTACTATGCAAGAAAAAATCGACCAAGCAAAACAAGCAACTGTTGGACAAGATGAAAATTCTGCTTTTTCTGCTGTTCATGTTTATCGTGACCAAGCGGCGATTCTGGAATATTTGACAAATTCTGATGGTAGTTTTAAGTCACTCGAAACAGCATATCCAAATAGTCCAACTGTGACTTTAGGATATTGCGATGGCTGGGATAAGCTATTATCTGGAATGGGGAGCATCTTGTCCATAATGATATGTTTAATTGTTGTAATCACTCTATCTCCTGTTTTCTCAGAAGAGTATGCACTTCATACAGATAGCATTATTTATTCGGCTCGGTATGGCCGAACCAAACTCACAACTTCAAAAATTATAGCGGCCTTGGAAGTTGTAATTGGCACATACCTCTTGTATTTACTGCTAAATTTAGTTCTGTATGGCTGTACCTATGGGTTACAGGGGTGGAATGTAAGCATTCAATCTTCATTACATTATGCTTCTTCAATATATAATTTGACCTTTTTGCAAATGTTCTTTATCTCTGTAATATTGAATATTTTTGGGATTGTAGCCTTGACAACTATTACATTGTTTTTAAGTGCTCAAATGAGTTCTCCTGTTACAGCGCTTATTACTTCTTGCGTCATCTGCTTCTTGCCAGTTGTGTTTGATTTTAATGATAGCCTTCCTGTTTTACAAAAAATGCAGGAAATTTGCCCGATTTTTATGCTTCATACAAACGGTATATTTTCTGATATGAAAACATATTTCGGTATGAGCCAGCCGGTCTTTATGATCATCCTTAATGTTGGATTGATATTCGTATTTTATAGACTAACAAAAAATATATCAAAGAAACATCAAGTTACGGGGTAA(SEQ ID NO:12)。
C04_GI_0279808
ATGGATTTTCTCACCGACTGGCTCACAAACTGGCTCAAAGAGCTTCTGATTGGCGGGATCATGGGAAACCTCGAAGGGCTTTTTGATACCGTCAATACCCAAGTCGGAGAGATTGCGGCACAGGTAGGGACTACCCCGGCGGCGTGGCACGCCGGGGTTTTCTCCCTGATCCGACAGCTTTCCGAAACGGTGATCCTGCCGATTGCCGGAATGGTGCTGACCTTTGTTGCCACTTATGAGCTCATACAGATGCTTTTGGAAAAGAACAATATGCACGAGGTTGACGTTGCGAACCTCTATAAATGGATGTTCAAAACAGCCTGTGCAATCCTGATCCTGTCAAACACATTCAATATCGTCATGGCCGTGTTCGATGTCTCGCAGAGCGTCATCGCGCAGGCAGGCGGGCTGATTCAAGGCTCTACCGACGTTTCGGCGGATATGCTTGCTGAACTGGAAACCTCGCTGGAGGCGATGGACTTGGGGCCGCTTTTGGGGCTGTGGCTGCAGTCTGCGCTCATTGGCTTCACGATGAAGGCGATGGGAATTATCATTTTCGTTTTGGTGTATGGCAGGATGCTGGAAATCTATCTGCTGACCAGTCTGGCCCCCATCCCCGTTGCTACGCTTTCCAACCGGGAGCTTGGTGGCACCGGGCAGAACTACATCAAGTCCCTGTTTGCCGTGGGCTTTCAAGGGCTGCTGATTCTTGTATGTGTTGCAATTTACGCAGTGCTCATTCAAGGCATCGCAACAGGCGGCGATCCCATTGGGGCGATTTGGGGAACTGTGGGCTACACGGTTCTGCTTTGCTTCATGCTCTTTAAGACCGGGAGCATTGCCCAGCGTATCTTTGGCGCTCATTAA(SEQ ID NO:13)。
C05_GI_0096564
ATGTTCTCTAATCTCATTCTTCGGAACAGTCGCCGCAGCCGAAAGGAAAACGGTCTGTTTTTCAGCTCCCTGGTGATTTCTATTGTTGCATTTTACATGATTCTTTCCATCTCCACTCAAGATGTGATGCTCTTTTTGCAGAAAATGGAGAGTGACGCAGTTGACAAACTCCTGCTTCTGATTCCTGCGTTTTATGGGATGACCCTCGGTATTCTGTTCTTTTTGATCTATTTTGCCTGCAAGTATCAGTTCGAGCGCAGACGGCATGAGTTTGGTGTTTATCTAATGTTGGGGATGCGTAGAAGTAAACTGTTTGGTATGCTTCTGGCGGAAGATTTCCTGACCAGTATTCTTGCCATGCTCATAGGCTTACCTGTGGCTGTGGTGCTTTCAGAAATTGTCAGTCTTGTCACCGCCAAGCTGGTAGGCATGGGGATCATCGGTCATCAGTTTTCTTTATCCTGGTCTGCAATTGAATGGACGCTGGCAGGATTTCTGGCAATTAAGCTGACGGCACTTCTGATTTTGAGTGGACGAATCAGCCGCCAGGAGATCGGTACTTTGCTATCCCAGCCAACGAACCGCCCCAAAAAGCAAATGCCATCTGTTATCTATGGACTGGCTGCTATATGCGGAAGTGTGATGTTGGCAGTGGCTTACTACATGGCGATTCAGGGAATTGCATGGACAAAGGTAAGTATGATGGGACTGACTTTGCTGTTGGGCATAGTTGGTACGATGCTGCTTTTCTATGGGATGCGTGCGCTGATTGCTTTGATTGTTAAGAAAGGAAAAGGAAATAAGCAGCTTCATGTATTTACCTTCCGGCAGATTCAGGAGAATGTTATTCATCAGTCAACCTCCATGGCCATCAGCTCCCTGCTGATTCTGGCGGCGCTGTGTTGTTTTGGTGCGGGCGTAGGAATTGCAGGAACGAATAGCCTGTCTTCTGGCCATGTAATCGACTATACTTTTGAAGATCATACTGCAGAAGATTCATCGCAGGTTCTTCCGAATATAAAGGCAGCCCTGAAAGAAAACGGTTTGGAAAATCAATTTTCAGAGCTTTTTGAAATGAGGGTTGGGCGTATTCGCACCACAGAAGATTATGATAATGCCTACAGCATGGACGCTGTTATGGACTCTCTTCGGAGCCTGCCCCAGTCGGAAGACCGGGATGTCCTTCTGAACAATCTTGGTTATGCCACATACCCATATTTGATTTGTTTATCGGACTATAATCGTTTGTTGGAATTGTCCGGCAAACCGGCTCTCCAATTAGGCGAAAAGGAGGCCGCTGTCTATATTGATACAGAGTTTACTACGGTAAGTCGTACCGCAATGCTGAACCAAGTATTGGCCGGACAGCCCAAGGTGGAACTGGATGGTAGTCCGATTCATCTTACAGGAGAGGTTCAGTCTGTGAATTTGGTCACGGACCGTTCTATAACCTTGTCCTTTGCATTGATTCTTCCGGATGAAGCATTCCTATATTATAGCCAGGGAATGTATGATACCTATGTCAATGCGGTGCTCAGTGAGCAGGCTCTGGATGGAAATAGCCTTATGACTGCATATTTGGATTTGAACGAGAAGCTGGACGAAACTGGCATTGAATATGAAAGCTATCTTCAGAATATAGGTCGTCAGCTTTTCTACACCATAGCATCCAGTTATATTACCCTCTATCTTGCGATTGTTTTCCTGGTAGTTGCCAACACCATCGTGGGTGTTCAGTTCCTGATGAGTCAGCAGAAAACCGGGCGCAGATACCAGACCCTGATCCGCCTGGGAGCTACTTACGAAACCCTTTGCCAGTCTGCTGGAAAGCAAATTACCTGGTTTATGGGACTTCCTGTATTGGTTGCGGCTGTCAGCAGTCTGTTTGGAGTCAGGGCGTTATTTACAGGGATACTCTCGTCCCGAACCCGTGGGACAGTGTCTGAAATGCTGCTTGTATCTGCTGCTATGATTTTACTACTTTGCGTGATAGAATATATTTATATGAGAGTGGTCAAGCGCTCCAGTGATCGGTATTTGCTGACACTGATGCAGCCGCAGAGAGAAGAATAA(SEQ ID NO:14)。
C07_GI_0066430
TTGAAAAACACAAAGAAGAAAAACGGAGCCGCCGCCAAGGGTAAAGGCCGGGCGACCCTGTCTGCCCAGCAGACAATCCCGTATCTGTCCATGCACCCGGACGGTGTGTGCAAGCTCCCGGGCGGGCTCTATACAAAAACCGTGGAATATGAGGACATCAATTACTCCGTGGCATCCACCGAGGATCAGGCTGCCATATTCAGCGGATGGAGCTCATTCCTCAACTACTTTGACAGTTCGCTGCCGTTCCAGCTTTCCTTTATCAACCGCCGTTCTCATTCCCGCAGCCGCTATCAGGTCAATATCCCGAAAGCGGATGACAACTATAACAGCGTCCGGGATGAGTTTACCGGGATGCTGAAAAATCAGATTGCCAAAAGCAATAACGGCATTGAACGCTCAAAATACATCACCTTTGGCATACCCGCCGAGGGGATTGCGGAGGCACGGCCCCGTCTGGAGCGTGTGGAGGCCGATGCCATGGGAAACTTTAAGCGACTGGGCGTTCCCTCGGAGCCGATGGACGGACGGGCCCGCCTTGCGCTGCTTCATAGCCAGATGCATCCGGGGAGCCGCGAGGCGTTCCGCTTTTCGTGGAAAGACATCCCGCAGACCGGGCTCGGCACAAAAGACTTTATTGCCCCGGGCAGTCTCGACTTCCGCCAGTCCCGAACATTCCGTATCGGCCAGTATTGGGGCGCGGTGTCCTATTTGCAGATTATGGCATCGGAGCTTTCGGATAAGCTGCTGGCGGAAATCTTGGAGCTGGATGCGGAAATGACCGTGACCATGCACATTCAGACCGTGGATCAGCTCAAGGCAATTAAGACCATCAAGGGGAAAATCTCGGACATCGGAAAAATGAAAGTAGAGGAACAGAGAAAGGCTGTGCGCTCCGGCTATGACCCGGATATTCTTCCCCCTGACCTGATCACATTCAGCAAGGACGCAGCGGAGCTTCTGGCTGATTTGCAATCCCGCAATGAGCGAATGTTTCTGCTGACCTTTACGGTGGTAAACCTTGCCCCTACTCGCCAGCGGCTGGAAAACGATGTGTTTACCGTGGGCGGCATCGCGCAGAAATACAACTGCGCTCTGCGCCGTCTGGACTGGCAACAGGAACAGGGATTTGTTTCTTCGCTGGCCCTTGGTTACAACGAGGTAGAAATCCAGCGCGGTATGACAACCAGCTCCACAGCCATCTTTATCCCCTTTATGACAAGGGAGCTCCGCATGGCGGGGCAGGCACTCTACTATGGCATGAACGCACTTTCTCACAATGTCATCATGGCTGACCGCAAAAAGCTGAAGTCGGCAAACGGGATGTATTTGGGTTCTACGGGCTCCGGCAAGAGCTTTGCTGCAAAGCGTGAGCTCTTGAATGTGTTTCTCACCATCCCGCAGGATCGGATCATCGTGGTTGACCCGATGGGCGAATACGCTCCGCTGGTGCGAAGGCTGGGCGGCCAGGTGATCGAGATTGCCCCGGACAGCCCGCACCACCTCAATCCGATGGATGTGGAGCTCAATATGGCCGCCGGAGAAAGCCCGCTTTCCATGAAGGCGGATTTTCTTTTGTCCCTATGCGAGCTGGTGGTCGGCGGCAAGGAAGGCTTGCAGCCCATTGAAAAGACGGTCATTGACCGCTGTGTGCGTTTGGTGTACCGGGAACAGGCGCTCGGACTGGAAACTGCAAAAACACCGCTGTTACAGGATTTGTACGAAGAGCTCTTACGCCAGCCGGAGCCCGAAGCCCGGCGCGTGGCAACTGCCTTAGAGCTTTATTGCACAGGCTCCCTCAATCTCTTTAACCATCCTACCAACGTCAAGACGGACAGCCGTGTGGTGTGCATCGTTCTGAAAAACATGGGCGAAAACCTTAGAAAGATTGCAATGCACATCACAAATGAGTTTGTTTCGCAGGCGGTGGATCAGAACTTCCACGAGGGTGCGGCGACTTGGTGCTACTTTGACGAGTTTCATATCCTGCTCCGCGATCCGCTGACAGCCAGCTACTTTGTGGCAGTCTGGAAAATGCTGCGTAAAAAAGGATGTGTGCCGTCTGCTTTGACGCAGAACGTCAAAGACCTTTTGGCCAGCCGGGAAATCGAGAACATTCTGGACAACACGGATTTTATGATTCTGCTTTCGCAGGCGCAGAGTGACCGTACCATTCTGGCAAAACAGCTCGGTATTTCCGAGCATCAGCTTTCCTATATCACACACAGCAATTCCGGCGAGGGGCTGTTGTTCTATGGAAATGTAACCATTCCGTTTGTGGATCGGTTCCCTCGCGGAGAAATCTATGACCTGCTGACTACCCGCCCGGAGGATATGAAGAATGAAACGAAAAACGAATAA(SEQ ID NO:15)。
C12_GI_0283312
ATGTCAGACAACCGAAAATATTATTACCTGAAACTCAAAGAAAACTATTTTGACGATGATTCCATCGTGCTGCTGGAAAGTATGCAGGATGGTGTGCTGTATTCCAACATTCTGCTCAAGCTGTATCTGAAATCGCTGAAACATGGTGGACGTCTTCAACTTGACGAGGACATTCCTTACACGGCGCAGATGATCGCCACCATTACCCGCCAGCAGATCGGCACTGTGGAGAGAGCCTTGCAGATCTTTTTGAAGCTGGGTCTTGTGGAGGTGCTGGACAGCGGCACATTCTACATGAGCAACATCGAACTTTTAATCGGCCAGTCCTCTACCGAGGCTGAGCGAAAGCGGGCTGCGAGGCTCCAAAATAAGGCTCTTTCTGCGCCCCGGACAAACGGCGGACATTTGTCCGACATTCGTCCACCAGAGATAGAGATAGAGTTAGAGAAAGAGATAGAGATAAAGAGAGAGATAGAGAAGGGACACCCCGCCCCCGCCTATGGCCGTTACCAGAATGTTTTCCTGACGGACGAGGAACTGGCAGACTTGCAGGCCAGTTTTCCCACTGTATGGGGCCAGTACATCGAAAAGCTATCCGAATACATGGCCTCTACCGGTAAGCGGTATCAGAGCCATGCCGCCACCATCCGGCGCTGGGCCGGTGAGGACGCGAAAAAGGCGGCCCCGCCCACCCGCAACCGTGATTACAGCGTAAAGGAGGATGAAACCGTATGA(SEQ ID NO:16)。
C16_GI_0117164
ATGGCAAAGGTTGAAGATTGTCCCGGTTTTGAAACCTTCGGTGCAGATGTCAAAGCCGCACGAGAGGCAAGGCGTCTGGCACGAAAAACATTGGCAGAAATGGTTGGGATTGAATGGCGGTATCTTGCCAACATTGAGAATCAAGGTGCGATTCCGAGCCTGCCCGTGATGATCCAGTTGATTAAGGTCTGCGGACTTCCCGTGGAACGGTATTTTAACCCGGAGATCATGCGGGAAGAAAGCGATCAGCGGCAGCGGGTCAGCCACAAGCTGAAGCTTTGCCCTGAAGAATACCTGCCGATTATCGAAGGTGCCATTGACGGGGCCTTAAAAATTGAAAAGCCGAATGAAGAAACGGAGGGTGTCTGA(SEQID NO:17)。
C20_GI_0172619
ATGGTTATGGCAAAAAACAAAATTGAACGTATCGACCAGGAAATTGAGAAAACCCGTGAGAAGATTGCGGAATATCAGGAAAAGCTCAAGACCCTGGAAGCACAGAAAACGGAGGCAGAGAATCTGGAAATCGTTCAGATGGTTCGTGCGTTACGCATGACTCCAGCACAGCTGAACGCTATGCTTTCCGGTGGAATGAACCACGGCAGAGATACAGCACTGTCGGAATCAAATAATCAGGAGGTTACCGCTTATGAAGAATAA(SEQ ID NO:18)。
C47_GI_0117622
TGGTGTGATTTCCTCAATTATTTTGACAGCTCGATTCATTTCCAGCTGTCTTTTTTGAACCTTGCGGCATCGGAGGAGACCTTTGCTAACTCCATTTCCATCCCGCCCCAGAGGGATGCCTTTGACAGTATCCGCGAGGAATATACCACAATGCTGCAAAATCAGCTGGCCAGAGGTAACAACGGCCTCATCAAGACCAAATACCTGACCTTTGGTATCGACGCGGACAGCATCAAAGCCGCCAAGCCCCGTCTGGAGCGTATTGAGACCGATATACTTAATAACTTCAAGCGTCTTGGTGTAGCTGCCAGAACGCTGGACGGTAAAGAAAGGCTTTCTCAGCTTCATGCGGTATTCCACATGGATGAACAACTCCCGTTTCAGTTTGAATGGGACTGGCTGGCTCCTTCCGGTCTGTCCACAAAGGATTTTATTGCACCAAGCTCCTTTGAGTTCCGCACCGGCAAGCAGTTCCGTATGGGTAAGAAATACGGGACTGTTTCTTTTTTGCAGATTCTCGCACCGGAACTGAATGACCGTTTGCTGGCTGATTTTCTGGATATGGAAAGCTCGCTCATTGTGAGTATGCACATTCAGTCGGTGGATCAGGTGAAAGCCATCAAAACGGTAAAGCGCAAGATTACCGACCTGGACCGCAGCAAGATTATATATCTATCCAATGACTTTTACGTGAATAAGTGCTGTAGGCGGGCAATGTATGAAAACTCATTCCTCCTTTATCCAAATTTTCGCTTTCTGCCTGAAGCCCCAGCTTAG(SEQ ID NO:19)。
C48_GI_0078316
ATGACATTGTTCACCGCAATAAAAAAATGGCTGCATCGGATGTTCGGGAAAACCGAGGAAAAAACTGTGCAGCCGGTAAAGACAAAGAAAAAGCTGTCCCGCGCTGATAAGAAGCAGATCGAAGAGGCCATTGCCCGCGCTAACCGCACGGACAAAAAAGGAAAATCTGCGCAGGACAGTATCCCTTATGAACGGATGTGGACGGACGGGATCTGCCGCATATCGGACAGCCACTACACAAAGACCATTCAGTTTCAGGACATCAACTATCAGCTCTCCCAAAACGAAGATAAGACGGCAATCTTTGAGGGTTGGTGTGATTTCCTCAATTATTTTGACAGCTCGATTCATTTCCAGCTGTCTTTTTTGAACCTTGCGGCATCGGAGGAGACCTTTGCTAACTCCATTTCCATCCCGCCCCAGAGGGACGCCTTTGACAGTATCCGCGAGGAATACACCACAATGCTGCAAAATCAGCTGGCCAGAGGTAACAACGGTCTCATCAAGACCAAATACCTGACCTTTGGTATCGACGCGGACAGCATCAAAGCTGCCAAGCCCCGTCTGGAGCGTATTGAGACCGATATACTTAATAACTTCAAGCGTCTTGGTGTAGCTGCCAGAACGCTGGACGGTAAAGAAAGGCTTTTTCAGCTTCATGCGGTATTCCACATGGATGAACAACTCCCGTTTCAGTTTGAATGGGACTGGCTGGCTCCTTCCGGTCTGTCCACAAAGGATTTTATTGCACCAAGCTCCTTTGAGTTCCGCACCGGCAAGCAGTTCCGTATGGGCAAGAAATACGGGGCTGTTTCTTTTTTGCAGATTCTCGCACCGGAGCTGAATGACCGTTTGCTGGCTGATTTTCTGGATATGGAAAGCTCGCTCATTGTGAGTATGCACATTCAGTCGGTGGATCAGGTGAAAGCCATCAAAACGGTAAAGCGGAAGATTACCGACCTGGACCGCAGTAAGATCGAGGAACAGAAAAAAGCAGTCCGTGCCGGATACGACATGGACATCATTCCATCTGACCTTGCTACCTACGGCAGTGAAGCGAAAAAACTCTTGCAGGATTTGCAGAGCCGCAACGAGAGAATGTTCCTTTTGACCTTTCTGGTGCTGAACACAGCGGACAATCCCCGTCAGCTTGGCAACAACATCTTTCAGGCAGGCTCTATTGCCCAGAAGTATAACTGTCAGCTGACCAGGCTGGACTTCCAGCAGGAAGAAGGGCTGATGAGCTGTCTGCCTCTGGGTCTCAATCAGATTGAGATTCAGCGAGGACTGACCACCAGTTCCACAGCTATCTTTGTGCCCTTTACTACGCAGGAACTGTTCCAGAACGGGAAAGAAGCTCTGTACTACGGCATCAATGCTCTGTCCAACAACCTCATCATGGTGGACAGAAAGCTGCTGAAAAACCCCAATGGCCTGATTCTGGGTACGCCGGGTTCCGGTAAGTCCTTCAGCGCAAAACGAGAAATTGCCAACTGCTTTTTGCTTACCAGTGATGATGTCATTATCTGTGACCCGGAAGCGGAGTACGCACCTCTTGTTGAGCGTCTGCATGGGCAGGTCATCAAGATCTCACCTACTTCAACCAACTATATCAATCCGATGGATCTGAATCTGGACTATTCGGATGATGAAAGCCCGCTGTCACTCAAGTCTGACTTTATCCTCAGCTTGTGTGAGCTGATCGTGGGCGGTAAGGAGGGCTTGCAGCCGGTGCAGAAAACCATTATTGACCGTTGTGTACGGCTGGTTTACAACGAATATCTCAATGACCCAAAGCCAGAGAATATGCCGATTTTGGAGGACCTTTATAACTTGCTGCGGGAGCAGGAAGAAAAAGAAGCTCAGTACATTGCAACGGCATTGGAAATCTATGTAACGGGTTCGTTGAATGTGTTCAATCATCAGAGCAATGTGGACATTGATAACCGGATTGTCTGCTATGACATCAAGGAACTGGGCAAGCAGCTTAAAAAAATCGGTATGCTGGTGGTTCAGGATCAGGTATGGAACCGCGTTACCATCAACCGTGCCGCCCACAAGTCCACCCGTTACTACATCGACGAGATGCACCTGCTTTTGAAGGAGGAGCAGACCGCCGCCTATACGGTGGAAATCTGGAAGCGATTCAGAAAATGGGGCGGTATTCCGACAGGTATCACCCAGAATGTCAAAGACCTTTTGAGCAGCCGCGAGGTGGAAAATATCTTTGAAAATTCCGACTTCGTGTATATGCTCAACCAGGCAGGCGGAGACCGTCAGATCCTCGCCAAGCAGCTGGGTATTTCCACACACCAATTATCTTATGTGACCCACTCCGGTGAGGGCGAGGGCCTGCTGTTTTATGGCTCTACAATCCTGCCTTTCGTGGATCACTTCCCGAAGAATACCGAGCTTTACCGCATTATGACCACCAAACCCCAGGAACTGAAAAAGAAGGAGGATGAATGA(SEQ ID NO:20)。
C53_GI_0087483
ATGGATTGGATTTTATGTGTTATCTATTATCCTATTAGGGAAAACACTTCAACTGTACTTGAAAAAAGAAAAAATGATTGGAGAATTGATATGGAACTTACAATAAATGATCTTTCAAAAGAATATGGAAGAAAAAAAGCTGTAAATCATTTCAGCGCAAAATTAACAAATGGTGTTTATGGTCTACTCGGGGCAAATGGTGCGGGCAAGACAACTTTGATGCGAATTATTTGCGATGTCCAAACTGAAACGAAAGGAGCCATTTTTTTTAACGGGAAAAACATTCATGATTTGGGCGAGAAATATCGTAATATCTTAGGCTACCTGCCACAAAATTTTGGCTATTATCCTAACTTTACAGCGTATAAATTTTTGATGTATATCTCTGCAATAAAGGGGCTGCCGCCTAAAAAAGCCCATAATCGCACAATGGAGCTGTTGCAGGTTGTTGATCTGCTCACACAGAAAAACGAAAAAATCAAAACTTTTTCCGGCGGTATGAAACAACGCTTGGGAATTGCTCAAGCATTACTAAACGATCCCCGTATTTTGATTTTGGATGAACCTACAGCTGGACTTGACCCGAAAGAGCGGGTGCGGTTTAGGAATCTGATTAGTTCTTTGGCAGAAAATAGAATTGTAATTTTGTCCACTCACATTGTTTCTGATGTTGAATATATCGCAAATGAGATTCTGATTATGAAAAATGGCGAGTTAATTCAACATGGTTCTCCAGAAGAAATTTTGAAGCCGATTGAAAAATGTGTTTGGGAATGTGATGTATCTCGAAAAGAGGCCGAAGAATTAGAATTGAACTATGTAACAGCAAATCTGAAACATAATAATGGTGCAGAACGGCTGAGGATTATTTCTCAAGAAGCACCATGCAGAACCGCTTGGAATGTTGATCCAACATTGGAAGATTTGTATTTATACTATTTTGCGGAGGTATCCGAGCATGAATGA(SEQ ID NO:21)。
C57_GI_0218184
GGCGCAGGCAGTAAAAAGCTCTGGCGAGAAAGGAGTGTAATTATCCAGCAGTATTCTATCATTTACGCTGACCCGCCGTGGCGCTACTCGGCTAAGAAAGTACAGGGCGCGGCGGAAAACCATTATCCCACTATGAGCATTGAGGAGTTATGTGCGTTGCCTGTGGCTGATCTTGCAGCCCCGGACAGCGCACTCTTTTTATGGGCCACTTTCCCGCAGCTCCCGGAGGCGCTCCGGCTGATCGAGGCTTGGGGCTTCACCTACAAAAGCGTTGCTTTCGTTTGGCTGAAAAAGAACAAGAAGGCGGATAGCTGGTTTTACGGCCTTGGCTTCTGGACAAGGAGCAATGCAGAAATCTGCCTGCTGGCAACCAAGGGACATCCAAAGCGGCAGGCTGCCAACATTCATCAATTCATCATTTCCCCGATTGAGGCCCACAGCAAAAAGCCGGACGAGGCCCGCGACAAAATTATTTCCCTGATGGGCGATCTGCCCCGCGTGGAGCTCTTTGCCAGGCAGACCCCGCCCGGCTGGGCTGTATGGGGAAATGAAGTAACACCAACCATCCCGGACTTTGGGACACATTGTCCCGAAGTACAGAAAGGAGTGTGA(SEQ ID NO:22)。
C60_GI_0157568
TACGCACTGGAGGATTACTGGGGTACAGAATGGGAGAAGCGGTATCTGGACTGCGTCAATGACCCGCGCATCGAAAAGCGCAGCGTCACCGTCAAGGACATCGTGCGGCTGGTGCTTCGCTCGGCAGTGGAGACCGGCACGCCCTTCGCCTTCAACCGCGACAGCGTAAATCGTATGAACCCAAACGGCCACACGGGAATGATCTATTGCTCCAATCTCTGCACGGAGATCGCGCAGAACATGGCGCCCATCGAGCATATCAGCACTGAGGTGCACACGGAGAACGGCGACACAGTGGTGGTGACGGCCACACGCCCAGGTGAGTTTGTGGTCTGCAACCTGGCGAGTCTGTCTCTCGGTAATCTGCCGGTGGAGGACGAGGCCTATATGGAACGCACGGTGGAAACGGCCATCCGCGCACTGGATAATGTGATCGACCTCAACTTCTACCCGCTGGAATACGCGCGGCTCACGAACCACAAATACCGCAGCATCGGCCTTGGCGTCAGCGGCTATCACCACATGCTGGCAAAGCGCGGCATCCGCTGGGAGAGCGAGGAGCATCTCGCCTTCGCCGACGCGGTGTTTGAGCGCATCAATTATGCCGCCATCCGGGCGGACACGGCACTGGCACGGGAAAAGGGCTGCTATGCGCTGTTTGAGGGCAGCGACTGGCAGACCGGCGCGTATTTTGAGAAGCGGGGCTACGCCTCCGACAAGTGGCGGGAGCTTGCCGAAACGGTGGCGGCGCAGGGAATGCGCAACGCATACCTGCTGGCCGTCGCCCCCACCTCCAGCACCTCTATCCTCTCCGGCACCTCCGCCGGGATCGACCCTGTCATGAGGCGCTTCTTTTTGGAGGAGAAGAAGGGCAGCATCCTGCCTCGCGTGGCCCCGGAGTTGTCGCTGGATACATGGTGGTACTATAAGGCGGCTCACCTCATCGACCAAAGCTGGTCGGTACGAGCCGCAGGCGTGCGCCAGAGACATATTGACCAGGCGCAGAGCATGAATCTCTATATCACCAATGACTATTCCATGCGTCAGGTGCTCAGACTGTATTTAGAGGCGTGGAGGGCCGGCGTCAAGACCATTTACTATGTCCGCAGCAAGGCCCTTGAGGTCGAGGACTGCGAAAGCTGCTCGTCATAA(SEQ ID NO:23)。
C64_GI_0070575
ATGTTTTACGCTGTTCAAAACCGGCAGTCTCGCCAAATCAGTCTTTCAGGCGCACTAAAACGGAAGGAGGTTTCCACATTGGCTTATGTACCCGTACCCAAGGACTTAACAAAAGTCAAAACAAAGGTCATGTTCAATCTGACCAAGCGGCAGCTTATCTGCTTCACGGGCGGAGCGCTTATTGGCGTACCGCTTTTCTTTTTGCTCAGAAAACCTACCGGAAACAGTGTAGCGGCTATGTGTATGATGCTGGTTATGCTGCCCTTCTTCATGCTGGCTATGTACGAAAAGCATGGACAGCCCCTGGAAAAGATCGTGGGCAACATTCTCAAAGTAGCTGTGATCCGTCCAAAGCAGCGACCTTACCAGACCAACAACTTTTATGCCGTATTAAAGCGGCAGGAAATGCTCGATAAGGAGGTGTATGACATTGTTCACCGCAATAAAAAAATGGCTGCATCGGATGTTCGGAAAAACCGAGGAAAAAACTGTGCAGCCGGTAAAGACAAAGAAAAAACTGTCCCGCGCCGATAA(SEQ ID NO:24)。
G20_GI_0116524
TTCCTTGGGAGTATGGCACACCTCGCCAGAGCAATAGTGAAAATCTTGGTCAAATTCAACTCTTACACATCCATGGCGGCTGATATAAACTTCTATGGTCTCGTCTGCGGTCAGGTAATCCGCAAAAATCTCCAGCACCTTTTCAAAGGTCAGCATCTGTTTTCACTCCTTTGCTACGCTTCTTATTCTACTCATATTATCCGGTGCGGACAGACAAAAGACAAGGATACAGACAAAAAAGAAAAAGCGGAGGAAGGTGCGGCGAAGAAAAGCCGTTCCTCCCTCCGCAAATGGAGTATCTATCCCTGTTATGAAAGTTTGGAGAGTTGGGTAAGGATTTCCTTTACACCCTCATTCGTATTCTCAAAAAGTCAAAGAAAATGGGAACGCCTATCAGCCAGCGGAAAAAACGATAAGAAAGAAAGCTGA(SEQ ID NO:25)。
G23_GI_0141028
ATGTGTCCCAAAGTCCGGGATGGTTGGTGTTACTTCATTTCCCCATACAGCCCAGCCGGGCGGGGTCTGCCTGGCAAAGAGCTCCACGCGGGGCAGATCGCCCATCAGGGAAATGATTTTGGCGCGGGCCTCGTCCGGCTTTTTGCTATGGGCTTCAATCGGGGAAATGATGAATTGATGAATGTTGGCAGCCTGCCGCTTTGGATGTCCCTTGGTTGCCAGCAGGCAGATTTCTGCATTGCCCCTTGTCCAGAAGCCAAGGCCGTAAAACCAGCTATCCGCCTTCTTGTTCTTTTTCAGCCAGACGAAAGCATCGCTTTTTTAGTTGTACCCCCACGCCTCGGACCGCCGGAGCGCCTCCGGACGCCGCTCGTCCGAACCCCACAAAAAAAGTGCTCCACCCGGGGC(SEQ ID NO:26)。
G49_GI_0075567
AAGAAATTGCTGCCCCGTATCGGCAGCCTGATTGAGTCCCCCGGCTTTTATCCCAATCTGACCGGCACAGAGAACCTGCGTATCTTTGCTACCCTGCGTGGAGTACCAAACAATCATGCCATCAAAGACGCTCTGGATTTGGTCGGGCTACCTTACAAGGATAAAAAGCTGTTTTCGCAATACTCTCTTGGCATGAAGCAGCGGTTGGCGATTGCCCTTGCAGTCATGCACGATCCGGAGCTTTTGATTTTGGATGAGCCGATCAACGGCCTCGATCCCATCGGTATTGCAGAAGTACGTTCCTTTATTCGTGAGCTTTGTGACGCGCGAGGAAAAACCATTTTGATTTCCAGTCACATTCTTTCGGAGATTTCCTTGCTGGCTGACGATATTGGAATTATCGACCACGGCGCATTGCTGGAAGAAGAAAGCCTTGCTGAGCTGGAGCAAAAAAGCAGTAAGCATATCCGTTTTACGCTTTCGGATACTGCACAGGCGGCAAGAATTTTGGAACGCAATTTCCATGAAAGCCATTTCTCCATACAGGATGACCATAATTTGCGCCTGCGCAACCTGGATCTGCCCGTTGGGAAAATTGTAACAGCCTTTGTAGAAAACGGATTGGAGGTATCGGAGGCCGCAACTTCAGAAGAAAGCCTTGAAGATTACTTCAAGCGTGTGACGGGAGGCGAGGGAATTGCTTAA(SEQ ID NO:27)。
G86_GI_0088728
AGGGGTCGTTTCATCGTTCATACCTCCGATATTTTAATAAGAAAGTTCAACCCAAACCCCACGCCCTTTCCCAGTCTTGGGAAAGGGGGCGGCTCTGGAGGATATACCCCCGCCGCTTGCCGGGGAAATAGCACAGCCGGGGCAGACCGTCAAGGGCGAGCCGCCGAAAACGGCGGTGCGCTGCACCCTTGA(SEQ ID NO:28)。
G89_GI_0273545
ATGCTGACCTTTGAAAAGATTTTGAAAGTGTTTCAGGCATATCTGGATGATGATCCACTGTATGAGGTGGTTCAGACCAGCCATGGTTATACATTGATGGCATGGGAACCCCACCGGAATGACTGGTACAGTGCTGAAATACAGAAAACCCCGGAGGATTTACGGAACGCTTTGTTAGGTACATACGCCAACTTTCTGGAAGATAAGATTACTGGAAATGACCGTGACCTGACTGTGACAGAAACCGGAGAAATCCAGCAGAGGTGCCGGGAACTTTGGGAAAAGTGCAGGGAAACATGA(SEQ ID NO:29)。
实施例3个体状态的检测
利用48个粪便样本进行样本来源的个体状态的检测。
参照实施例2的方法确定各粪便样本中的表3的C03_GI_0051440、C03_GI_0051466、C05_GI_0017028、C50_GI_0345131、C64_GI_0032728和G38_GI_0125251的丰度,判断各样本中的这6个基因丰度是否落入各自在疾病对照组或者健康对照组的丰度的95%的置信区间,判定这6个基因的丰度均落入疾病组的对应区间的样本所对应的个体的状态为痛风症患者,判定这6个基因的丰度均落入健康组的对应区间的样本所对应的个体的状态为非痛风症患者。
结果显示,利用上述方法能够对其中的46个样本进行个体状态判断,而且对这个样本中的41个样本对应个体的状态的判断,与记录的该样本来源个体的状态一致。
另外,发明人发现对表2和表3中的基因联合检测,例如检测表3中的基因标志物被富集,同时表2中基因标记物不被富集,能够更准确的判断发现痛风症患者或易感人群。
在利用标志物治疗痛风症的方案中,发明人发现使3中的基因标志物丰度得到抑制或者清除,同时使表2中基因标记物被富集,治疗效果极佳。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
尽管已经示出和描述了本发明的实施例,本领域的普通技术人员可以理解:在不脱离本发明的原理和宗旨的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由权利要求及其等同物限定。
Claims (13)
1.一种试剂盒,其特征在于,包括适于检测第一基因集中的至少一个基因的试剂,所述第一基因集由以下基因组成:C03_GI_0051440、C03_GI_0051466、C05_GI_0017028、C50_GI_0345131、C64_GI_0032728和G38_GI_0125251,其中,所述第一基因集中的基因与SEQ IDNO:1-6所示的核酸序列一一对应,所述第一基因集中的基因与其对应的SEQ ID NO:1-6中的序列具有不小于90%的同一性。
2.根据权利要求1所述的试剂盒,其特征在于,进一步包括适于检测第二基因集中的至少一个基因的试剂,所述第二基因集由以下基因组成:C01_GI_0190397、C01_GI_0232192、C01_GI_0287172、C01_GI_0341126、C02_GI_0069373、C02_GI_0069375、C04_GI_0279808、C05_GI_0096564、C07_GI_0066430、C12_GI_0283312、C16_GI_0117164、C20_GI_0172619、C47_GI_0117622、C48_GI_0078316、C53_GI_0087483、C57_GI_0218184、C60_GI_0157568、C64_GI_0070575、G20_GI_0116524、G23_GI_0141028、G49_GI_0075567、G86_GI_0088728和G89_GI_0273545,其中,所述第二基因集中的基因与SEQ ID NO:7-29所示的核酸序列一一对应,所述第二基因集中的基因与其对应的SEQ ID NO:7-29所示的核酸序列具有不小于90%的同一性。
3.根据权利要求1所述的试剂盒,其特征在于,包括适于检测所述第一基因集中全部所述基因的试剂。
4.根据权利要求2所述的试剂盒,其特征在于,包括适于检测所述第二基因集中全部所述基因的试剂。
5.试剂在制备试剂盒中的用途,所述试剂适于检测第一基因集中的至少一种基因,所述试剂盒用于诊断痛风症或者检测痛风症的治疗效果,所述第一基因集由以下基因组成:C03_GI_0051440、C03_GI_0051466、C05_GI_0017028、C50_GI_0345131、C64_GI_0032728和G38_GI_0125251,其中,所述第一基因集中的基因与SEQ ID NO:1-6所示的核酸序列一一对应,所述第一基因集中的基因与其对应的SEQ ID NO:1-6中的序列具有不小于90%的同一性。
6.根据权利要求5所述的用途,其特征在于,所述试剂进一步适于检测第二基因集中的至少一种基因,所述第二基因集由以下基因组成:C01_GI_0190397、C01_GI_0232192、C01_GI_0287172、C01_GI_0341126、C02_GI_0069373、C02_GI_0069375、C04_GI_0279808、C05_GI_0096564、C07_GI_0066430、C12_GI_0283312、C16_GI_0117164、C20_GI_0172619、C47_GI_0117622、C48_GI_0078316、C53_GI_0087483、C57_GI_0218184、C60_GI_0157568、C64_GI_0070575、G20_GI_0116524、G23_GI_0141028、G49_GI_0075567、G86_GI_0088728和G89_GI_0273545,其中,所述第二基因集中的基因与SEQ ID NO:7-29所示的核酸序列一一对应,所述第二基因集中的基因与其对应的SEQ ID NO:7-29所示的核酸序列具有不小于90%的同一性。
7.一种用于预防或者治疗痛风症的药物组合物或者食品组合物,其特征在于,含有提高第二基因集中的至少一种基因丰度的物质,所述第二基因集由以下基因组成:C01_GI_0190397、C01_GI_0232192、C01_GI_0287172、C01_GI_0341126、C02_GI_0069373、C02_GI_0069375、C04_GI_0279808、C05_GI_0096564、C07_GI_0066430、C12_GI_0283312、C16_GI_0117164、C20_GI_0172619、C47_GI_0117622、C48_GI_0078316、C53_GI_0087483、C57_GI_0218184、C60_GI_0157568、C64_GI_0070575、G20_GI_0116524、G23_GI_0141028、G49_GI_0075567、G86_GI_0088728和G89_GI_0273545,其中,所述第二基因集中的基因与SEQ IDNO:7-29所示的核酸序列一一对应,所述第二基因集中的基因与其对应的SEQ ID NO:7-29所示的核酸序列具有不小于90%的同一性。
8.一种确定个体是否患有痛风症的方法,其特征在于,包括:
(1)确定所述个体的粪便样本中标志基因的丰度,所述标志基因包括第一基因集和第二基因集中的至少一种基因;
(2)将步骤(1)中得到的所述丰度与预定的阈值进行比较,以便确定所述个体是否患有痛风症;
其中,所述第一基因集由以下基因组成:C03_GI_0051440、C03_GI_0051466、C05_GI_0017028、C50_GI_0345131、C64_GI_0032728和G38_GI_0125251,其中,所述第一基因集中的基因与SEQ ID NO:1-6所示的核酸序列一一对应,所述第一基因集中的基因与其对应的SEQID NO:1-6中的序列具有不小于90%的同一性;
所述第二基因集由以下基因组成:C01_GI_0190397、C01_GI_0232192、C01_GI_0287172、C01_GI_0341126、C02_GI_0069373、C02_GI_0069375、C04_GI_0279808、C05_GI_0096564、C07_GI_0066430、C12_GI_0283312、C16_GI_0117164、C20_GI_0172619、C47_GI_0117622、C48_GI_0078316、C53_GI_0087483、C57_GI_0218184、C60_GI_0157568、C64_GI_0070575、G20_GI_0116524、G23_GI_0141028、G49_GI_0075567、G86_GI_0088728和G89_GI_0273545,其中,所述第二基因集中的基因与SEQ ID NO:7-29所示的核酸序列一一对应,所述第二基因集中的基因与其对应的SEQ ID NO:7-29所示的核酸序列具有不小于90%的同一性。
9.根据权利要求8所述的方法,其特征在于,步骤(1)进一步包括:
获得所述个体的粪便样本中的核酸测序数据;
将所述测序数据与参考基因组进行比对;
基于所述比对的结果,确定所述标志基因的丰度。
10.一种确定个体是否患有痛风症的装置,其特征在于,包括:
丰度确定单元,用于确定所述个体的粪便样本中标志基因的丰度,所述标志基因包括第一基因集和第二基因集中的至少一种基因;
比较单元,用于将所得到的所述丰度与预定的阈值进行比较,以便确定所述个体是否患有痛风症;
其中,所述第一基因集由以下基因组成:C03_GI_0051440、C03_GI_0051466、C05_GI_0017028、C50_GI_0345131、C64_GI_0032728和G38_GI_0125251,其中,所述第一基因集中的基因与SEQ ID NO:1-6所示的核酸序列一一对应,所述第一基因集中的基因与其对应的SEQID NO:1-6中的序列具有不小于90%的同一性;
所述第二基因集由以下基因组成:C01_GI_0190397、C01_GI_0232192、C01_GI_0287172、C01_GI_0341126、C02_GI_0069373、C02_GI_0069375、C04_GI_0279808、C05_GI_0096564、C07_GI_0066430、C12_GI_0283312、C16_GI_0117164、C20_GI_0172619、C47_GI_0117622、C48_GI_0078316、C53_GI_0087483、C57_GI_0218184、C60_GI_0157568、C64_GI_0070575、G20_GI_0116524、G23_GI_0141028、G49_GI_0075567、G86_GI_0088728和G89_GI_0273545,其中,所述第二基因集中的基因与SEQ ID NO:7-29所示的核酸序列一一对应,所述第二基因集中的基因与其对应的SEQ ID NO:7-29所示的核酸序列具有不小于90%的同一性。
11.根据权利要求10所述的装置,其特征在于,所述丰度确定单元适于通过下列步骤确定所述丰度:
获得所述个体的粪便样本中的核酸测序数据;
将所述测序数据与参考基因组进行比对;
基于所述比对的结果,确定所述标志基因的丰度。
12.一种装置,其特征在于,包括:
计算机可读存储介质,其上存储有计算机程序,所述程序用于执行权利要求8或9所述的方法;
以及一个或者多个处理器,用于执行所述计算机可读存储介质中的程序。
13.一种筛选药物的方法,其特征在于,所述药物用于治疗或者预防痛风症,所述方法包括:
将候选药物施用于受试者,
检测施用前后,所述受试者粪便中标志基因的丰度,所述标志基因包括第一基因集和第二基因集中的至少一种基因,
其中,满足下列条件至少之一的候选药物适于用于治疗或者预防痛风症:
(1)进行所述施用后,所述第一基因集中的至少一种基因的所述丰度降低;和
(2)进行所述施用后,所述第二基因集中的至少一种基因的所述丰度升高;
其中,所述第一基因集由以下基因组成:C03_GI_0051440、C03_GI_0051466、C05_GI_0017028、C50_GI_0345131、C64_GI_0032728和G38_GI_0125251,其中,所述第一基因集中的基因与SEQ ID NO:1-6所示的核酸序列一一对应,所述第一基因集中的基因与其对应的SEQID NO:1-6中的序列具有不小于90%的同一性;
所述第二基因集由以下基因组成:C01_GI_0190397、C01_GI_0232192、C01_GI_0287172、C01_GI_0341126、C02_GI_0069373、C02_GI_0069375、C04_GI_0279808、C05_GI_0096564、C07_GI_0066430、C12_GI_0283312、C16_GI_0117164、C20_GI_0172619、C47_GI_0117622、C48_GI_0078316、C53_GI_0087483、C57_GI_0218184、C60_GI_0157568、C64_GI_0070575、G20_GI_0116524、G23_GI_0141028、G49_GI_0075567、G86_GI_0088728和G89_GI_0273545,其中,所述第二基因集中的基因与SEQ ID NO:7-29所示的核酸序列一一对应,所述第二基因集中的基因与其对应的SEQ ID NO:7-29所示的核酸序列具有不小于90%的同一性。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111672769.4A CN114317716A (zh) | 2021-12-31 | 2021-12-31 | 痛风症标志基因及其应用 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111672769.4A CN114317716A (zh) | 2021-12-31 | 2021-12-31 | 痛风症标志基因及其应用 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114317716A true CN114317716A (zh) | 2022-04-12 |
Family
ID=81020258
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111672769.4A Pending CN114317716A (zh) | 2021-12-31 | 2021-12-31 | 痛风症标志基因及其应用 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114317716A (zh) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2008058399A1 (en) * | 2006-11-17 | 2008-05-22 | Emerillon Therapeutics Inc. | Methods for diagnosis, prognosis or treatment of migraine and related disorders |
CN109072306A (zh) * | 2016-03-17 | 2018-12-21 | 上海锐翌生物科技有限公司 | 分离的核酸及应用 |
CN110396538A (zh) * | 2018-04-24 | 2019-11-01 | 深圳华大生命科学研究院 | 偏头痛生物标志物及其用途 |
-
2021
- 2021-12-31 CN CN202111672769.4A patent/CN114317716A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2008058399A1 (en) * | 2006-11-17 | 2008-05-22 | Emerillon Therapeutics Inc. | Methods for diagnosis, prognosis or treatment of migraine and related disorders |
CN109072306A (zh) * | 2016-03-17 | 2018-12-21 | 上海锐翌生物科技有限公司 | 分离的核酸及应用 |
CN110396538A (zh) * | 2018-04-24 | 2019-11-01 | 深圳华大生命科学研究院 | 偏头痛生物标志物及其用途 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107217089B (zh) | 确定个体状态的方法及装置 | |
CN107217088B (zh) | 强直性脊柱炎微生物标志物 | |
CN114182007B (zh) | 白塞病标志基因及其应用 | |
CN110838365A (zh) | 肠易激综合症相关菌群标志物及其试剂盒 | |
CN113913490B (zh) | 非酒精性脂肪肝标志微生物及其应用 | |
CN109072306A (zh) | 分离的核酸及应用 | |
CN105733988B (zh) | 组合物及应用 | |
CN107217086B (zh) | 疾病标志物及应用 | |
CN113999922B (zh) | 急性腹泻标志微生物及其应用 | |
CN105671177B (zh) | 强直性脊柱炎标志物及应用 | |
CN114317716A (zh) | 痛风症标志基因及其应用 | |
WO2017156764A1 (zh) | 分离的核酸及应用 | |
CN114381493A (zh) | 炎症性肠病标志微生物及其应用 | |
CN114836508A (zh) | 慢性阻塞性肺病标志微生物及其应用 | |
CN114317784B (zh) | 白塞病标志微生物及其应用 | |
CN114317718A (zh) | 类风湿性关节炎标志ko及其应用 | |
CN114292932A (zh) | 慢性传输便秘标志ko及其应用 | |
CN114317531A (zh) | 小柳-原田综合症标志基因及其应用 | |
CN114517227A (zh) | 急性腹泻标志基因及其应用 | |
CN113930479B (zh) | 系统性红斑狼疮标志微生物及其应用 | |
CN114107484B (zh) | 溃疡性结肠炎标志基因及其应用 | |
CN114317674B (zh) | 类风湿性关节炎标志微生物及其应用 | |
CN114317717A (zh) | 儿童克罗恩病标志基因及其应用 | |
CN114292933A (zh) | 格雷夫斯病标志基因及其应用 | |
CN114517235A (zh) | 肌痛性脑脊髓炎标志基因及其应用 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |