CN114517228A - 炎症性肠病标志基因及其应用 - Google Patents

炎症性肠病标志基因及其应用 Download PDF

Info

Publication number
CN114517228A
CN114517228A CN202111666810.7A CN202111666810A CN114517228A CN 114517228 A CN114517228 A CN 114517228A CN 202111666810 A CN202111666810 A CN 202111666810A CN 114517228 A CN114517228 A CN 114517228A
Authority
CN
China
Prior art keywords
genes
gene
inflammatory bowel
seq
abundance
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111666810.7A
Other languages
English (en)
Inventor
陈翔
周斌
李婷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qingdao Ruiyi Precision Medical Test Co ltd
Original Assignee
Qingdao Ruiyi Precision Medical Test Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qingdao Ruiyi Precision Medical Test Co ltd filed Critical Qingdao Ruiyi Precision Medical Test Co ltd
Priority to CN202111666810.7A priority Critical patent/CN114517228A/zh
Publication of CN114517228A publication Critical patent/CN114517228A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • AHUMAN NECESSITIES
    • A23FOODS OR FOODSTUFFS; TREATMENT THEREOF, NOT COVERED BY OTHER CLASSES
    • A23LFOODS, FOODSTUFFS, OR NON-ALCOHOLIC BEVERAGES, NOT COVERED BY SUBCLASSES A21D OR A23B-A23J; THEIR PREPARATION OR TREATMENT, e.g. COOKING, MODIFICATION OF NUTRITIVE QUALITIES, PHYSICAL TREATMENT; PRESERVATION OF FOODS OR FOODSTUFFS, IN GENERAL
    • A23L33/00Modifying nutritive qualities of foods; Dietetic products; Preparation or treatment thereof
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K49/00Preparations for testing in vivo
    • A61K49/0004Screening or testing of compounds for diagnosis of disorders, assessment of conditions, e.g. renal clearance, gastric emptying, testing for diabetes, allergy, rheuma, pancreas functions
    • A61K49/0008Screening agents using (non-human) animal models or transgenic animal models or chimeric hosts, e.g. Alzheimer disease animal model, transgenic model for heart failure
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • G16B30/10Sequence alignment; Homology search
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • G16B30/20Sequence assembly
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B50/00ICT programming tools or database systems specially adapted for bioinformatics
    • AHUMAN NECESSITIES
    • A23FOODS OR FOODSTUFFS; TREATMENT THEREOF, NOT COVERED BY OTHER CLASSES
    • A23VINDEXING SCHEME RELATING TO FOODS, FOODSTUFFS OR NON-ALCOHOLIC BEVERAGES AND LACTIC OR PROPIONIC ACID BACTERIA USED IN FOODSTUFFS OR FOOD PREPARATION
    • A23V2002/00Food compositions, function of food ingredients or processes for food or foodstuffs
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/106Pharmacogenomics, i.e. genetic variability in individual responses to drugs and drug metabolism
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/136Screening for pharmacological compounds
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/166Oligonucleotides used as internal standards, controls or normalisation probes

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Organic Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Zoology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Wood Science & Technology (AREA)
  • Biophysics (AREA)
  • Biotechnology (AREA)
  • Genetics & Genomics (AREA)
  • Biochemistry (AREA)
  • Molecular Biology (AREA)
  • Immunology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Microbiology (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Medical Informatics (AREA)
  • Evolutionary Biology (AREA)
  • Pathology (AREA)
  • Mycology (AREA)
  • Diabetes (AREA)
  • Endocrinology (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Rheumatology (AREA)
  • Toxicology (AREA)
  • Urology & Nephrology (AREA)
  • Epidemiology (AREA)
  • Animal Behavior & Ethology (AREA)
  • Public Health (AREA)
  • Veterinary Medicine (AREA)
  • Bioethics (AREA)
  • Databases & Information Systems (AREA)
  • Biomedical Technology (AREA)

Abstract

本发明提出了一种炎症性肠病基因标志物及其应用,该炎症性肠病基因标志物包括第一基因集,因此,进一步提出了一种试剂盒,包括适于检测第一基因集中的至少一种基因的试剂,所述第一基因集中的基因与SEQ ID NO:1‑16所示的核酸序列一一对应,所述第一基因集中的基因与其对应的SEQ ID NO:1‑16中的序列具有不小于90%的同一性。本发明提出的基因相较于炎症性肠病患者群体,在健康个体中显著富集,能够作为健康群体和炎症性肠病患者群体的区分标志,可以作为检测和/或治疗炎症性肠病的标志物。

Description

炎症性肠病标志基因及其应用
技术领域
本发明涉及生物技术领域,具体的,本发明涉及炎症性肠病标志基因及其应用,更具体的,本发明涉及一种试剂盒、试剂在制备试剂盒中的用途、用于预防或者治疗炎症性肠病的药物组合物或者食品组合物、确定个体是否患有炎症性肠病方法、确定个体是否患有炎症性肠病的装置、一种装置、一种筛选药物的方法。
背景技术
炎症性肠病(IBD)是一组主要影响胃肠道的慢性炎症性自身免疫性疾病。炎症性肠病的主要症状包括腹痛、腹泻、血便和粘液便。严重者可出现营养不良和肠穿孔。炎症性肠病主要包括溃疡性结肠炎(UC) 和克罗恩病(CD)两种不同的分类,它们影响着全球约500万人,目前没有可用于炎症性肠病的治愈性治疗方法。
我国炎症性肠病的患病率正在逐渐升高,这种患病率增加可能与不断变化的环境、饮食和生活方式的西方化以及由此产生的肠道微生物群的变化有关。炎症性肠病的病因是遗传、环境、饮食、感染、心理和其他因素的复杂相互作用,其致病影响被认为与肠脑对话障碍、心理社会因素以及参与该过程的肠道微生物群,包括体育活动和肥胖、压力、睡眠和吸烟在内的各种生活方式因素可能会改变患炎症性肠病的风险。
2018年发表在Science杂志的研究表明,C1orf106基因的多态性与炎症性肠病的风险增加相关。 cytohesin-1是一种控制ARF6活化的鸟嘌呤核苷酸交换因子,C1orf106通过调控cytohesin-1的泛素化降解来调节上皮细胞黏附连接的稳定性。通过限制cytohesin-1依赖性的ARF6活化,C1orf106可稳定上皮细胞黏附连接。C1orf106基因变异加速cytohesin-1的降解并缩短其半衰期,引发肠道上皮细胞屏障功能障碍,从而使炎症性肠病风险增加。
炎症性肠病治疗的主要药物是氨基水杨酸盐、糖皮质激素、免疫抑制剂和生物制剂。近几年来,氨基水杨酸盐已经被医师和患者广泛接受,免疫抑制剂的应用也趋于规范,应用生物制剂的经验也越来越多。
我国目前对炎症性肠病的诊断方法主要有血清标志物、影像学诊断以及内镜诊断。由于早期对于炎症性肠病的认识不足和我国结核病高发,炎症性肠病误诊率和漏诊率较高。近年欧美提出的一些血清标志物在中国似乎并没有获得满意的结果,如在一些国内入组病例数较多的病例对照研究中,抗中性粒细胞胞质抗体(anti-neutrophilcytoplasmic antibodies,ANCA)对溃疡性结肠炎(UC)诊断敏感度在37.9%~ 56.7%,抗酿酒酵母细胞抗体(anti-Sacc/iaroTO;yces cerevisiae,ASCA)对克罗恩病(CD)诊断敏感度为45.2%~65.5%,其敏感性均较欧美研究(ANCA为60%~80%,ASCA为55%~65%)偏低,提示东西方IBD发病机制之间可能存在不同,这也给我国的IBD基础科学研究提供了机遇,有机会找到有利于我国疾病人群诊断和鉴别诊断的指标。
发明内容
本发明旨在至少解决上述问题至少之一或者提供至少一种可选择的商业手段。
为此,在本发明的第一方面,本发明提出了一种试剂盒。根据本发明的实施例,根据本发明的实施例,包括适于检测第一基因集中的至少一种基因的试剂,所述第一基因集由以下基因组成: S100_GI_0002354、S100_GI_0002360、S100_GI_0002362、S100_GI_0002364、S100_GI_0002366、 S100_GI_0002373、S100_GI_0002377、S100_GI_0002402、S100_GI_0002408、S100_GI_0002410、 S100_GI_0008128、S100_GI_0030720、S10_GI_0005425、S186_GI_0019691、S24_GI_0044455和 S254_GI_0026483,其中,所述第一基因集中的基因与SEQ ID NO:1-16所示的核酸序列一一对应,所述第一基因集中的基因与其对应的SEQ ID NO:1-16中的序列具有不小于90%的同一性。根据本发明具体实施例的试剂盒,可以准确的检测生物样品中是否含有第一基因集中的至少一种基因,更进一步地,也可以准确区分或诊断炎症性肠病患者和健康个体。
在本发明的第二方面,本发明提出了试剂在制备试剂盒中的用途,所述试剂适于检测第一基因集中的至少一种基因。根据本发明的实施例,所述试剂盒用于诊断炎症性肠病或检测炎症性肠病的治疗效果,所述第一基因集由以下基因组成:S100_GI_0002354、S100_GI_0002360、S100_GI_0002362、 S100_GI_0002364、S100_GI_0002366、S100_GI_0002373、S100_GI_0002377、S100_GI_0002402、 S100_GI_0002408、S100_GI_0002410、S100_GI_0008128、S100_GI_0030720、S10_GI_0005425、 S186_GI_0019691、S24_GI_0044455和S254_GI_0026483,其中,所述第一基因集中的基因与SEQ ID NO: 1-16所示的核酸序列一一对应,所述第一基因集中的基因与其对应的SEQ ID NO:1-16中的序列具有不小于90%的同一性。根据本发明具体实施例的试剂制备的试剂盒,可以准确的检测生物样品中是否包含所述第一基因集中的至少一种基因,更进一步地,也可以极准确的区分炎症性肠病患者和健康个体,由此,可以有效的在早期进行炎症性肠病诊断,或用于检测治疗过程中炎症性肠病的变化。
在本发明的第三方面,本发明提出了一种用于预防或者治疗炎症性肠病的药物组合物或者食品组合物。根据本发明的实施例,含有提高所述第一基因集中的至少一种基因丰度的物质,所述第一基因集由以下基因组成:S100_GI_0002354、S100_GI_0002360、S100_GI_0002362、S100_GI_0002364、 S100_GI_0002366、S100_GI_0002373、S100_GI_0002377、S100_GI_0002402、S100_GI_0002408、 S100_GI_0002410、S100_GI_0008128、S100_GI_0030720、S10_GI_0005425、S186_GI_0019691、S24_GI_0044455和S254_GI_0026483,其中,所述第一基因集中的基因与SEQ ID NO:1-16所示的核酸序列一一对应,所述第一基因集中的基因与其对应的SEQ ID NO:1-16中的序列具有不小于90%的同一性。根据本发明实施例的炎症性肠病标志基因中第一基因集的基因可以非侵入性的在早期发现或辅助检测炎症性肠病,确定个体患有炎症性肠病的概率高低或者个体处于健康状态的概率高低;同时,提高炎症性肠病高风险人群或已炎症性肠病患者肠道内的所述第一基因集中的各种基因的丰度,可以降低患炎症性肠病的概率或减缓、治愈炎症性肠病,因此,所述包含提高所述第一基因集中的至少一种基因丰度的药物或者食品组合物能够用于平衡肠道菌群,有效预防或治疗炎症性肠病。
在本发明的第四方面,本发明提出了一种确定个体是否患有炎症性肠病的方法。根据本发明的实施例,包括:(1)确定所述个体的粪便样本中标志基因的丰度,所述标志基因包括第一基因集和第二基因集中的至少一种基因;(2)将步骤(1)中得到的所述丰度与预定的阈值进行比较,以便确定所述个体是否患有炎症性肠病;其中,所述第一基因集由以下基因组成:S100_GI_0002354、S100_GI_0002360、 S100_GI_0002362、S100_GI_0002364、S100_GI_0002366、S100_GI_0002373、S100_GI_0002377、 S100_GI_0002402、S100_GI_0002408、S100_GI_0002410、S100_GI_0008128、S100_GI_0030720、 S10_GI_0005425、S186_GI_0019691、S24_GI_0044455和S254_GI_0026483,其中,所述第一基因集中的基因与SEQID NO:1-16所示的核酸序列一一对应,所述第一基因集中的基因与其对应的SEQ ID NO:1-16中的序列具有不小于90%的同一性,所述第二基因集由以下基因组成:S100_GI_0015747、 S101_GI_0002517、S152_GI_0024776、S15_GI_0022087、S258_GI_0009120、S47_GI_0011838、 S81_GI_0011061、S103_GI_0016687、S118_GI_0008214、S257_GI_0026750和S57_GI_0025049,其中,所述第二基因集中的基因与SEQ ID NO:17-27所示的核酸序列一一对应,所述第二基因集中的基因与其对应的SEQ ID NO:17-27中的核酸序列具有不小于90%的同一性。根据本发明实施例的方法可以依据个体的粪便样本中的所述标志基因的丰度确定个体是否患有炎症性肠病,所述标志基因是发明人对大量已知状态的粪便样本进行验证,通过差异比较分析各种肠道基因在炎症性肠病组和健康组粪便样本中的丰度,而确定下来的。
在本发明的第五方面,本发明提出了一种确定个体是否患有炎症性肠病的装置。根据本发明的实施例,包括:丰度确定单元,用于确定所述个体的粪便样本中标志基因的丰度,所述标志基因包括第一基因集和第二基因集中的至少一种基因;比较单元,用于将所得到的所述丰度与预定的阈值进行比较,以便确定所述个体是否患有炎症性肠病;其中,所述第一基因集由以下基因组成:S100_GI_0002354、 S100_GI_0002360、S100_GI_0002362、S100_GI_0002364、S100_GI_0002366、S100_GI_0002373、 S100_GI_0002377、S100_GI_0002402、S100_GI_0002408、S100_GI_0002410、S100_GI_0008128、 S100_GI_0030720、S10_GI_0005425、S186_GI_0019691、S24_GI_0044455和S254_GI_0026483,其中,所述第一基因集中的基因与SEQ ID NO:1-16所示的核酸序列一一对应,所述第一基因集中的基因与其对应的SEQ ID NO:1-16中的序列具有不小于90%的同一性,所述第二基因集由以下基因组成:
S100_GI_0015747、S101_GI_0002517、S152_GI_0024776、S15_GI_0022087、S258_GI_0009120、 S47_GI_0011838、S81_GI_0011061、S103_GI_0016687、S118_GI_0008214、S257_GI_0026750和 S57_GI_0025049,其中,所述第二基因集中的基因与SEQ ID NO:17-27所示的核酸序列一一对应,所述第二基因集中的基因与其对应的SEQ ID NO:17-27中的核酸序列具有不小于90%的同一性。所述标志基因是发明人通过差异比较分析各种肠道基因在炎症性肠病患者和健康人群的粪便样本中的丰度并经过分析和大量已知状态的粪便样本的验证而确定下来的,根据本发明实施例的装置可以准确确定个体是否为炎症性肠病的高风险人群或炎症性肠病患者。
在本发明的第六方面,本发明提出了一种装置。根据本发明的实施例,包括:计算机可读存储介质,其上存储有计算机程序,所述程序用于执行第四方面所述的方法;以及一个或者多个处理器,用于执行所述计算机可读存储介质中的程序。根据本发明实施例的装置可以准确确定个体是否为炎症性肠病的高风险人群或炎症性肠病患者。
在本发明的第七方面,本发明提出了一种筛选药物的方法。根据本发明的实施例,所述药物用于治疗或者预防炎症性肠病,所述方法包括:将候选药物施用于受试者,检测施用前后,所述受试者粪便中标志基因的丰度,所述标志基因包括第一基因集和第二基因集中的至少一种基因,其中,满足下列条件至少之一的候选药物适于用于治疗或者预防炎症性肠病:(1)进行所述施用后,所述第一基因集中的至少一种基因的所述丰度升高;和(2)进行所述施用后,所述第二基因集中的至少一种基因的所述丰度降低;其中,所述第一基因集由以下基因组成:S100_GI_0002354、S100_GI_0002360、 S100_GI_0002362、S100_GI_0002364、S100_GI_0002366、S100_GI_0002373、S100_GI_0002377、 S100_GI_0002402、S100_GI_0002408、S100_GI_0002410、S100_GI_0008128、S100_GI_0030720、 S10_GI_0005425、S186_GI_0019691、S24_GI_0044455和S254_GI_0026483,其中,所述第一基因集中的基因与SEQ ID NO:1-16所示的核酸序列一一对应,所述第一基因集中的基因与其对应的SEQ ID NO: 1-16中的序列具有不小于90%的同一性,所述第二基因集由以下基因组成:S100_GI_0015747、 S101_GI_0002517、S152_GI_0024776、S15_GI_0022087、S258_GI_0009120、S47_GI_0011838、 S81_GI_0011061、S103_GI_0016687、S118_GI_0008214、S257_GI_0026750和S57_GI_0025049,其中,所述第二基因集中的基因与SEQ ID NO:17-27所示的核酸序列一一对应,所述第二基因集中的基因与其对应的SEQ ID NO:17-27中的核酸序列具有不小于90%的同一性。根据本发明实施例的方法可以生产或筛选出升高所述标志基因中第一基因集中各种基因丰度,和/或降低肠道标志基因中第二基因集中的各种基因丰度的药物,对于辅助减轻炎症性肠病的临床症状具有重要意义。
本发明的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
本发明的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解,其中:
图1是根据本发明实施例的筛选炎症性肠病标志基因的实验分析流程示意图;以及
图2是根据本发明实施例的标志基因综合指标AUC评价结果示意图,其中,Specificity表示特异度,即预测为阳性且实际为阳性,真阳性,纵坐标Sensitivity表示敏感度,即真阴性:
2-A为第一期192个样品数据ROC曲线下AUC值和置信区间结果图;
2-B为第二期102个样品数据ROC曲线下AUC值和置信区间结果图。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出。下面通过参考附图描述的实施例是示例性的,旨在用于解释本发明,而不能理解为对本发明的限制。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本发明的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。
术语“任选地”仅用于描述目的,而不能理解为指示或暗示相对重要性。由此,限定有“任选地”的特征可以明示或者隐含地包括或不包括该特征。
生物学标志物是从生物学介质中可以检测到的细胞/生物化学或分子改变。生物学介质包括各种体液、组织、细胞、粪便、头发、呼气等。
所称的丰度指在某一微生物或者核酸序列群体中该种微生物或者序列的丰富程度。例如在肠道基因群体中该种微生物的丰富程度,可表示为该种微生物在该群体中的含量;又例如在一组核酸序列中某种核酸序的丰富程度,可表示为该种核酸序列的数目占该组序列的总数的比例。
同一性,本发明,为了比较两个或更多个核苷酸序列,可以通过将[第一序列中与相应位置的核苷酸相同的核苷酸的数目相除]来计算第一序列和第二序列之间的“序列同一性”的百分比。第二个序列中的核苷酸]减去[第一个序列中核苷酸的总数],然后乘以[100%],其中第二个核苷酸序列中每个核苷酸的缺失,插入,取代或添加-相对于第一核苷酸序列-被认为是单个核苷酸(位置)上的差异。
或者,可以使用标准设置,使用用于序列比对的已知计算机算法,例如NCBI Blastv2.0,计算两个或多个核苷酸序列之间的序列同一性程度。
用于确定序列同一性程度的一些其他技术,计算机算法和设置例如在WO 04/037999,EP 0 967 284, EP 1 085 089,WO 00/55318,WO 00/78972,WO 98/49185和GB2357768-A。
需要说明的是,本申请中所述的“标志基因”的长度不受特别限制,可以为完整基因,也可以为基因的编码区或非编码区,更进一步地,根据不同的实验目的,可以选择相关的任意的核酸片段作为标志基因。
根据本发明的一个实施方式提供的一种试剂盒,包括适于检测第一基因集中的至少一个基因的试剂,所述第一基因集由以下基因组成:S100_GI_0002354、S100_GI_0002360、S100_GI_0002362、 S100_GI_0002364、S100_GI_0002366、S100_GI_0002373、S100_GI_0002377、S100_GI_0002402、 S100_GI_0002408、S100_GI_0002410、S100_GI_0008128、S100_GI_0030720、S10_GI_0005425、 S186_GI_0019691、S24_GI_0044455和S254_GI_0026483,其中,所述第一基因集中的基因与SEQ ID NO: 1-16所示的核酸序列一一对应,所述第一基因集中的基因与其对应的SEQ ID NO:1-16中的序列具有不小于90%的同一性。
根据本发明的一个具体的实施方案,所述试剂盒进一步包括适于检测第二基因集中的至少一个基因的试剂,所述第二基因集由以下基因组成:S100_GI_0015747、S101_GI_0002517、S152_GI_0024776、 S15_GI_0022087、S258_GI_0009120、S47_GI_0011838、S81_GI_0011061、S103_GI_0016687、 S118_GI_0008214、S257_GI_0026750和S57_GI_0025049,其中,所述第二基因集中的基因与SEQ ID NO: 17-27所示的核酸序列一一对应,所述第二基因集中的基因与其对应的SEQ ID NO:17-27中的核酸序列具有不小于90%的同一性。
根据本发明的具体实施例,所述试剂盒包括适于检测所述第一基因集中全部所述基因的试剂。
根据本发明的具体实施例,所述试剂盒包括适于检测所述第二基因集中全部所述基因的试剂。
根据本发明的具体实施例,所述标志基因是发明人通过对大量患炎症性肠病个体和大量健康对照个体的粪便样本中的微生物的基因丰度的差异比较分析、以及验证,而确定下来的,明确了肠道中炎症性肠病相关的标志基因。利用包含检测所述标志基因的试剂的试剂盒能够准确检测生物样品中是否包含所述第一、第二基因集中的至少一种基因,更进一步地,也可以准确确定个体处于患有炎症性肠病状态的概率高低或者处于健康状态的概率高低,能够用于非侵入性的早期发现或辅助检测炎症性肠病。
根据本发明的具体实施例,所述适于检测所述第一基因集或第二基因集的试剂不受特别限制,任何可以直接或间接检测所述标志基因的丰度的试剂均包含在本发明的范围内,如:利用PCR技术、高通量测序等方法直接进行检测时使用的试剂,或通过Western Blot技术检测所述基因对应的蛋白的含量间接获得所述基因丰度时所使用的试剂等。
根据本发明提供的试剂在制备试剂盒中的用途,所述试剂适于检测第一基因集中的至少一种基因,所述试剂盒用于诊断炎症性肠病或者检测炎症性肠病的治疗效果,所述第一基因集由以下基因组成: S100_GI_0002354、S100_GI_0002360、S100_GI_0002362、S100_GI_0002364、S100_GI_0002366、 S100_GI_0002373、S100_GI_0002377、S100_GI_0002402、S100_GI_0002408、S100_GI_0002410、 S100_GI_0008128、S100_GI_0030720、S10_GI_0005425、S186_GI_0019691、S24_GI_0044455和 S254_GI_0026483,其中,所述第一基因集中的基因与SEQ ID NO:1-16所示的核酸序列一一对应,所述第一基因集中的基因与其对应的SEQ ID NO:1-16中的序列具有不小于90%的同一性。
根据本发明的具体实施例,所述标志基因是发明人通过对大量患炎症性肠病个体和大量健康对照个体的粪便样本中的微生物基因进行差异比较分析、以及验证,而确定下来的,明确了肠道中炎症性肠病相关的微生物的基因标志物。利用检测所述标志基因的试剂能够确定个体患有炎症性肠病的概率高低或者处于健康状态的概率高低,能够用于非侵入性的早期发现或辅助检测炎症性肠病。
根据本发明一些具体的实施例,所述试剂进一步适于检测第二基因集中的至少一种基因,所述第二基因集由以下基因组成:S100_GI_0015747、S101_GI_0002517、S152_GI_0024776、S15_GI_0022087、 S258_GI_0009120、S47_GI_0011838、S81_GI_0011061、S103_GI_0016687、S118_GI_0008214、 S257_GI_0026750和S57_GI_0025049,其中,所述第二基因集中的基因与SEQ ID NO:17-27所示的核酸序列一一对应,所述第二基因集中的基因与其对应的SEQ ID NO:17-27中的核酸序列具有不小于90%的同一性。
根据本发明的具体实施例,所述适于检测所述第一基因集或第二基因集的试剂不受特别限制,任何可以直接或间接检测所述标志基因的丰度的试剂均包含在本发明的范围内,如:利用PCR技术、高通量测序等方法直接进行检测时使用的试剂,或通过Western Blot技术检测所述基因对应的蛋白的含量间接获得所述基因丰度时所使用的试剂等。
根据本发明提供的一种用于预防或者治疗炎症性肠病的药物组合物或者食品组合物,含有提高第一基因集中的至少一种基因丰度的物质,所述第一基因集由以下基因组成:S100_GI_0002354、 S100_GI_0002360、S100_GI_0002362、S100_GI_0002364、S100_GI_0002366、S100_GI_0002373、 S100_GI_0002377、S100_GI_0002402、S100_GI_0002408、S100_GI_0002410、S100_GI_0008128、 S100_GI_0030720、S10_GI_0005425、S186_GI_0019691、S24_GI_0044455和S254_GI_0026483,其中,所述第一基因集中的基因与SEQ IDNO:1-16所示的核酸序列一一对应,所述第一基因集中的基因与其对应的SEQ ID NO:1-16中的序列具有不小于90%的同一性。
上述标志基因是发明人通过差异比较分析各种肠道微生物的基因在炎症性肠病疾病组和健康组的粪便样本中的丰度,以及经过大量已知状态的粪便样本的验证,而确定下来的。所述标志基因中的第一基因集中的基因相较于炎症性肠病患者群体,在健康群体组中显著富集,所述显著富集是指与在炎症性肠病患者组中的丰度相比,上述基因在健康组中的丰度均具有统计意义地高于或者明显地、实质性地高于在炎症性肠病患者组中的丰度;能够使该部分基因丰度提高的物质能够用于治疗炎症性肠病或者益于炎症性肠病患者服用,所述物质不受特别限制,能够使其丰度提高的物质包括但不限于治疗炎症性肠病的药物和有益肠道菌群平衡的功能性食品。因此,该实施例提供的能够使所述第一基因集中的基因丰度提高的物质能够用于制备治疗炎症性肠病的药物和/或用于制备益于平衡肠道菌群的功能性食品、保健药等,所述药物或食品可有效治疗或缓解炎症性肠病。
根据本发明提供的一种确定个体是否患有炎症性肠病的方法,包括步骤(1)和(2)。
(1)确定所述个体的粪便样本中的标志基因的丰度。
所述标志基因包括第一基因集和第二基因集中的至少一种基因。其中,所述第一基因集由以下基因组成:S100_GI_0002354、S100_GI_0002360、S100_GI_0002362、S100_GI_0002364、S100_GI_0002366、 S100_GI_0002373、S100_GI_0002377、S100_GI_0002402、S100_GI_0002408、S100_GI_0002410、 S100_GI_0008128、S100_GI_0030720、S10_GI_0005425、S186_GI_0019691、S24_GI_0044455和 S254_GI_0026483,其中,所述第一基因集中的基因与SEQ ID NO:1-16所示的核酸序列一一对应,所述第一基因集中的基因与其对应的SEQ ID NO:1-16中的序列具有不小于90%的同一性,所述第二基因集由以下基因组成:S100_GI_0015747、S101_GI_0002517、S152_GI_0024776、S15_GI_0022087、 S258_GI_0009120、S47_GI_0011838、S81_GI_0011061、S103_GI_0016687、S118_GI_0008214、 S257_GI_0026750和S57_GI_0025049,所述第二基因集中的基因与SEQ ID NO:17-27所示的核酸序列一一对应,所述第二基因集中的基因与其对应的SEQ ID NO:17-27中的核酸序列具有不小于90%的同一性。
根据本发明的一些具体的实施例,步骤(1)进一步包括:获得所述个体的粪便样本中的核酸测序数据;将所述测序数据与参考基因组进行比对;基于所述比对的结果,确定所述标志基因的丰度。
根据本发明的具体实施例,在步骤(1)中,按照下列公式确定所述标志基因的丰度: Ab(G)=Ab(UG)+Ab(MG),其中,G表示基因的编号,Ab(G)表示基因G的丰度,Ab(UG)表示所述测序数据与所述基因G的参考序列唯一比对的读段的丰度,Ab(MG)表示所述测序数据与所述基因G 的参考序列非唯一比对读段的丰度;Ab(UG)=UG/lG,其中,UG表示所述测序数据中与所述基因G 的参考基因唯一比对的读段数目,lG表示所述基因G的参考基因长度;
Figure RE-GDA0003587165870000081
其中,MG为所述测序数据中与所述基因G的参考基因非唯一比对的读段的数目,i表示所述非唯一比对读段的编号,Coi为所述第i读段对应的丰度系数;
Figure RE-GDA0003587165870000082
其中,Coi,G表示针对所述标志基因G,所述非唯一比对的读段i的丰度系数,N为所述非唯一比对的读段i能够比对的基因的总数,j 表示所述非唯一比对的读段i能够比对的基因的编号。上述丰度确定公式,基于比对结果中的唯一和非唯一比对上组装序列的读段对该组装序列的丰度的贡献情况,充分利用测序数据的同时确定的丰度十分准确。
根据本发明的具体实施方案,进行以下以完成该步骤:获得所述个体的粪便样本中的核酸序列的测序数据,所述测序数据包括多个读段;将所述读段比对至所述标志物中的各种基因的基因组,获得比对结果;依据所述比对结果,确定所述标志物中的各种基因的丰度。
所述的测序数据通过对样本中的核酸序列进行测序得来,测序依据所选的测序平台的不同,可选择但不限于半导体测序技术平台比如PGM、Ion Proton、BGISEQ-100平台,合成边测序的技术平台,比如Illumina公司的Hiseq、Miseq序列平台以及单分子实时测序平台,比如PacBio序列平台。测序方式可以选择单端测序,也可以选择双末端测序,获得的下机数据是测读出来的片段,称为读段(reads)。
比对可以利用已知比对软件进行,例如SOAP、BWA和TeraMap等,在比对过程中,一般对比对参数进行设置,设置一个或者一对读段(reads)最多允许有s个碱基错配(mismatch),例如设置s≤2,若reads中有超过s个碱基发生错配,则视为该reads无法比对到(比对上)该组装片段上。所述的获得的比对结果包含各条读段与各参考基因的比对情况,包括读段是否能够比对上某个或某些基因的参考序列、只唯一比对到一种基因还是比对到多种基因的参考序列、比对到基因组的位置、比对到基因组的唯一位置还是多个位置等信息。
reads与参考基因组比对,比对上的可以被分为两部分:a)Unique reads(U):唯一比对上一个基因的序列;称这些reads为unique reads。即,如果reads比对上的序列均来自同一基因,定义这些reads 为unique reads;b)Multiple reads(M):比对上一个以上基因的序列,定义为multiple reads。即,如果 reads比对上的序列来自至少两种基因,定义这些reads为multiple reads。
所述参考基因组指预先确定的该基因的序列,可以是预先获得的待测样本所属或者所包含的生物类别的任意参考模板,例如,目标是待测样本中的基因,参考序列可选择NCBI数据库中的各种基因的参考序列,进一步地,也可以预先配置包含更多参考序列的资源库,例如依据待测样本来源的个体的状态、地域等因素选择或是测定组装出更接近的序列作为参考序列。根据本发明的一个实施例,各种基因的参考基因是由发明人进行构建的。
(2)丰度比较,以确定个体是否患有炎症性肠病。
根据本发明的一个实施例,将步骤(1)中得到的所述丰度与预定的阈值进行比较,以便确定所述个体是否患有炎症性肠病。
根据本发明的一些具体实施例,所述阈值为预先设定的。将标志物中的各种基因在对健康个体以及患病个体中的丰度预先测定保存,用以作为设定阈值的依据。所述阈值可以为一数值或者数值范围,基于已知患病或健康状态个体中的标志基因的丰度均值,该基因对应的阈值可以设为该基因丰度均值的 95%的置信区间(Confidence interval)。
所述的置信区间是指由样本统计量所构造的总体参数的估计区间。在统计学中,一个概率样本的置信区间是对这个样本的某个总体参数的区间估计。置信区间展现的是这个参数的真实值有一定概率落在测量结果的周围的程度。置信区间给出的是被测量参数的测量值的可信程度,即前面所要求的“一定概率”,这个概率被称为置信水平。
根据本发明的一些具体实施例,当步骤(1)中确定的标志基因的丰度达到所述患炎症性肠病丰度阈值,未达到所述不患炎症性肠病丰度阈值时,确定所述个体患有炎症性肠病,当(1)中确定的标志基因的丰度达到不患炎症性肠病丰度阈值,未达到患炎症性肠病丰度阈值时,确定所述个体不患炎症性肠病。
需要说明的是,根据目的或要求不同,可能对确定个体状态结果的可信程度有不同的要求,本领域技术人员可以选择不同的显著性水平或阈值。
该方法基于检测个体的粪便样本中的标志基因中的各种基因的丰度,分别将检测确定的各种基因的丰度与其阈值进行比较,依据获得的比较结果能够确定个体为炎症性肠病个体或者为健康个体的概率。为早期发现炎症性肠病提供一种非侵入性的辅助检测或者辅助干预治疗的方法。
以上任一实施例中的利用标志基因确定个体是否患有炎症性肠病的方法的全部或部分步骤,可以利用包含可拆分的相应单元功能模块的装置/系统来施行,或者将方法程序化、存储于机器可读介质,利用机器运行该可读介质来实现。
根据本发明提供的一种确定个体是否患有炎症性肠病的装置,该装置包括:丰度确定单元,用于确定所述个体的粪便样本中标志基因的丰度,所述标志基因包括第一基因集和第二基因集;比较单元,用于将所得到的所述丰度与预定的阈值进行比较,以便确定所述个体是否患有炎症性肠病;其中,所述第一基因集由以下基因组成:S100_GI_0002354、S100_GI_0002360、S100_GI_0002362、S100_GI_0002364、 S100_GI_0002366、S100_GI_0002373、S100_GI_0002377、S100_GI_0002402、S100_GI_0002408、 S100_GI_0002410、S100_GI_0008128、S100_GI_0030720、S10_GI_0005425、S186_GI_0019691、 S24_GI_0044455和S254_GI_0026483,其中,所述第一基因集中的基因与SEQ ID NO:1-16所示的核酸序列一一对应,所述第一基因集中的基因与其对应的SEQ ID NO:1-16中的序列具有不小于90%的同一性,所述第二基因集由以下基因组成:S100_GI_0015747、S101_GI_0002517、S152_GI_0024776、 S15_GI_0022087、S258_GI_0009120、S47_GI_0011838、S81_GI_0011061、S103_GI_0016687、 S118_GI_0008214、S257_GI_0026750和S57_GI_0025049,所述第二基因集中的基因与SEQ ID NO:17-27 所示的核酸序列一一对应,所述第二基因集中的基因与其对应的SEQ ID NO:17-27中的核酸序列具有不小于90%的同一性。上述对本发明任一实施例的利用标志基因确定个体是否患有炎症性肠病的方法的技术特征和优点的描述,同样适用本发明这一方面的装置,在此不再赘述。
根据本发明的实施例,所述丰度确定单元适于通过下列步骤确定所述丰度:获得所述个体的粪便样本中的核酸测序数据;将所述测序数据与参考基因组进行比对;基于所述比对的结果,确定所述标志基因的丰度。
所述的测序数据通过对样本中的核酸序列进行测序得来,测序依据所选的测序平台的不同,可选择但不限于半导体测序技术平台比如PGM、Ion Proton、BGISEQ-100平台,合成边测序的技术平台,比如Illumina公司的Hiseq、Miseq序列平台以及单分子实时测序平台,比如PacBio序列平台。测序方式可以选择单端测序,也可以选择双末端测序,获得的下机数据是测读出来的片段,称为读段(reads)。
比对可以利用已知比对软件进行,例如SOAP、BWA和TeraMap等,在比对过程中,一般对比对参数进行设置,设置一个或者一对读段(reads)最多允许有s个碱基错配(mismatch),例如设置s≤2,若reads中有超过s个碱基发生错配,则视为该reads无法比对到(比对上)该组装片段上。所述的获得的比对结果包含各条读段与各参考基因的比对情况,包括读段是否能够比对上某个或某些基因的参考序列、只唯一比对到一种基因还是比对到多种基因的参考序列、比对到基因组的位置、比对到基因组的唯一位置还是多个位置等信息。
所述参考基因组指预先确定的该基因的序列,可以是预先获得的待测样本所属或者所包含的生物类别的任意参考模板,例如,目标是待测样本中的基因,参考序列可选择NCBI数据库中的各种基因的参考序列,进一步地,也可以预先配置包含更多参考序列的资源库,例如依据待测样本来源的个体的状态、地域等因素选择或是测定组装出更接近的序列作为参考序列。根据本发明的一个实施例,各种基因的参考基因是由发明人进行构建的。
reads与参考基因组比对,比对上的可以被分为两部分:a)Unique reads(U):唯一比对上一个基因的序列;称这些reads为unique reads。即,如果reads比对上的序列均来自同一基因,定义这些reads 为unique reads;b)Multiple reads(M):比对上一个以上基因的序列,定义为multiple reads。即,如果 reads比对上的序列来自至少两种基因,定义这些reads为multiple reads。
所述参考基因组指预先确定的该基因的序列,可以是预先获得的待测样本所属或者所包含的生物类别的任意参考模板,例如,目标是待测样本中的基因,参考序列可选择NCBI数据库中的各种基因的参考序列,进一步地,也可以预先配置包含更多参考序列的资源库,例如依据待测样本来源的个体的状态、地域等因素选择或是测定组装出更接近的序列作为参考序列。根据本发明的一个实施例,各种基因的参考基因是由发明人进行构建的。
根据本发明的一个实施例,按照下列公式确定所述标志基因的丰度:Ab(G)=Ab(UG)+Ab(MG),其中,G表示基因的编号,Ab(G)表示基因G的丰度,Ab(UG)表示所述测序数据与所述基因G的参考序列唯一比对的读段的丰度,Ab(MG)表示所述测序数据与所述基因G的参考序列非唯一比对读段的丰度;Ab(UG)=UG/lG,其中,UG表示所述测序数据中与所述基因G的参考基因唯一比对的读段数目, lG表示所述基因G的参考基因长度;
Figure RE-GDA0003587165870000111
其中,MG为所述测序数据中与所述基因G的参考基因非唯一比对的读段的数目,i表示所述非唯一比对读段的编号,Coi为所述第i读段对应的丰度系数;
Figure RE-GDA0003587165870000112
其中,Coi,G表示针对所述标志基因G,所述非唯一比对的读段i 的丰度系数,N为所述非唯一比对的读段i能够比对的基因的总数,j表示所述非唯一比对的读段i能够比对的基因的编号。上述丰度确定公式,基于比对结果中的唯一和非唯一比对上组装序列的读段对该组装序列的丰度的贡献情况,充分利用测序数据的同时确定的丰度十分准确。上述对本发明任一实施例的利用标志基因确定个体是否患有炎症性肠病的方法的技术特征和优点的描述,同样适用本发明这一方面的装置,在此不再赘述。
根据本发明的又一个实施例提供的一种装置,包括:计算机可读存储介质,其上存储有计算机程序,所述程序用于执行前面所述的一种确定个体是否患有炎症性肠病方法;以及一个或者多个处理器,用于执行所述计算机可读存储介质中的程序。
根据本发明的又一个实施例提供的一种筛选药物的方法,所述药物用于治疗或者预防炎症性肠病,所述方法包括:将候选药物施用于受试者,检测施用前后,所述受试者粪便中标志基因的丰度,所述标志基因包括第一基因集和第二基因集中的至少一种基因,其中,满足下列条件至少之一的候选药物适于用于治疗或者预防炎症性肠病:(1)进行所述施用后,所述第一基因集中的至少一种基因的所述丰度升高;和(2)进行所述施用后,所述第二基因集中的至少一种基因的所述丰度降低;其中,所述第一基因集由以下基因组成:S100_GI_0002354、S100_GI_0002360、S100_GI_0002362、S100_GI_0002364、 S100_GI_0002366、S100_GI_0002373、S100_GI_0002377、S100_GI_0002402、S100_GI_0002408、S100_GI_0002410、S100_GI_0008128、S100_GI_0030720、S10_GI_0005425、S186_GI_0019691、 S24_GI_0044455和S254_GI_0026483,其中,所述第一基因集中的基因与SEQ IDNO:1-16所示的核酸序列一一对应,所述第一基因集中的基因与其对应的SEQ ID NO:1-16中的序列具有不小于90%的同一性,所述第二基因集由以下基因组成:S100_GI_0015747、S101_GI_0002517、S152_GI_0024776、 S15_GI_0022087、S258_GI_0009120、S47_GI_0011838、S81_GI_0011061、S103_GI_0016687、 S118_GI_0008214、S257_GI_0026750和S57_GI_0025049,所述第二基因集中的基因与SEQ ID NO:17-27 所示的核酸序列一一对应,所述第二基因集中的基因与其对应的SEQ ID NO:17-27中的核酸序列具有不小于90%的同一性。
利用本发明这一方面的生产或筛选治疗炎症性肠病的药物的方法,通过合理有效地应用确定的炎症性肠病标志基因进行筛选,能够获得提高肠道有益基因的丰度和/或降低肠道潜在致病基因的丰度的药物。
下面将对实施例作具体介绍。以下实施例中涉及的未特别交待的试剂、序列、软件及仪器,都是常规市售产品。
实施例1生物标志物的鉴定
本实施例中,发明人通过对202个炎症性肠病患者和92个健康对照的粪便样品进行研究,从而获得肠道菌群基因群落及功能成分特征。总的来说,发明人下载约150.09Gb高质量的测序数据(健康人) 以及实验测序得到的470Gb高质量测序数据构建了炎症性肠炎参照基因集,并且和下载的LC基因集、IGC基因集构建一个更加完整的基因集。宏基因组分析显示,27个基因与炎症性肠炎疾病密切相关,其中16个基因在健康人的肠道基因中富集,11个基因在炎症性肠炎病人的肠道基因中富集。
1、测序数据的获取
炎症性肠炎疾病和正常对照样本取自已发表的文章公开数据集:PRJNA398089。
参照图1所示的实验流程,鉴定炎症性肠病的相关基因标志物,其中省略的步骤或者细节为本领域技术人员所熟知,几个重要步骤介绍如下面所述。
2、基因丰度分析
2.1序列优化统计
1)首先进行第一期测序,本期测序采集131个样品的数据,获得第一期的131个样品的测序数据以后,对其进行过滤,质控按以下标准进行:a)移除大于5个N碱基的reads;b)去除低质量碱基(Q20) 大于50%的reads;c)移除尾部低质量(Q20)和N碱基。丢失成对的reads序列被认为是单条reads用于组装,并进行基因预测。
2)采用1)所述方法同样处理下载的健康人数据。
3)LC基因集获自 Qin,N.et al.Alterations of the human gut microbiome inliver cirrhosis.Nature 513,59-64(2014).,从 ftp://climb.genomics.cn/pub/10.5524/100001_101000/100064/1.GeneCatalogs/IGC.fa.gz下载得到IGC基因集。
2.2基因丰度分析
SOAPalign 2.21用于匹配针对冗余基因组的paired-end clean reads,这里,所称的冗余基因组来自来自于利用样本数据及IGC基因集构建的非冗余基因序列集,比对参数为–r 2–m 200–x 1000。Reads与冗余基因组的比对结果,可分为两部分:a)Unique reads(U):reads只比对上一个基因的序列;这些reads 被定义为unique reads。即,如果这些序列来自同一基因,发明人将这些reads定义为unique reads。b) Multiple reads(M):如果reads比对上两个及两个以上基因的序列,定义为multiple reads。即,如果比对上的序列来自不同基因,发明人定义这些reads为multiple reads。
对于给定的基因G,其丰度为Ab(S),与U reads和M reads相关,丰度的计算方式如下:
Ab(G)=Ab(UG)+Ab(MG),
其中,G表示基因的编号,Ab(G)表示基因G的丰度,Ab(UG)表示所述测序数据与所述基因G的参考序列唯一比对的读段的丰度,Ab(MG)表示所述测序数据与所述基因G的参考序列非唯一比对读段的丰度;
Ab(UG)=UG/lG
其中,UG表示所述测序数据中与所述基因G的参考基因唯一比对的读段数目,lG表示所述基因G 的参考基因长度;
Figure RE-GDA0003587165870000131
其中,MG为所述测序数据中与所述基因G的参考基因非唯一比对的读段的数目,i表示所述非唯一比对读段的编号,Coi为所述第i读段对应的丰度系数;
Figure RE-GDA0003587165870000132
其中,Coi,G表示针对所述标志基因G,所述非唯一比对的读段i的丰度系数,N为所述非唯一比对的读段i能够比对的基因的总数,j表示所述非唯一比对的读段i能够比对的基因的编号。
对于这些reads,发明人以加和的N个基因的unique reads的丰度作为标准,即对于multiple reads,发明人把其所比对上的N个基因的unique reads丰度之和作为分母。
2.3筛选基因基因标记物
为了获得与炎症性肠病疾病密切相关的基因标记物,发明人利用炎症性肠病患者组(131例) 与健康人组(61例)两组粪便基因丰度数据,在基因层面做了一个与疾病相关性的研究。
基于得到的基因丰度表,发明人设置标准如下:(1)炎症性肠病患者组或健康人组基因丰度的中位数必须大于0.00001;(2)通过结合Benjamini Hochberg的多重检验的Wilcoxon秩和检验进行检验,得到每个基因和炎症性肠病疾病的相关性p值;(3)使用一个相对严格的阈值(p值< 1e-6,fdr值<0.0005)。利用上述参数进行筛选后,发明人得到27个与炎症性肠病疾病密切相关的肠道微生物基因标志物,其中,在炎症性肠病(IBD)患者中富集的基因有11个,在健康人 (Ccontrol)中富集的有16个基因,这27个基因标记物如表1所示。
表1:
基因 P值 Fdr值 富集人群
S100_GI_0002354 1.56E-07 0.000143398 control
S100_GI_0002360 3.14E-07 0.000143398 control
S100_GI_0002362 4.76E-07 0.000143398 control
S100_GI_0002364 3.64E-07 0.000143398 control
S100_GI_0002366 6.60E-07 0.000163836 control
S100_GI_0002373 7.99E-08 0.000111871 control
S100_GI_0002377 1.92E-07 0.000143398 control
S100_GI_0002402 9.09E-07 0.000194334 control
S100_GI_0002408 3.74E-07 0.000143398 control
S100_GI_0002410 6.45E-07 0.000163836 control
S100_GI_0008128 7.75E-07 0.000180729 control
S100_GI_0015747 6.73E-07 0.000163836 IBD
S100_GI_0030720 1.41E-08 4.62E-05 control
S101_GI_0002517 3.53E-07 0.000143398 IBD
S10_GI_0005425 2.47E-08 4.62E-05 control
S152_GI_0024776 4.87E-07 0.000143398 IBD
S15_GI_0022087 4.43E-07 0.000143398 IBD
S186_GI_0019691 4.38E-07 0.000143398 control
S24_GI_0044455 5.29E-07 0.000148072 control
S254_GI_0026483 2.32E-08 4.62E-05 control
S258_GI_0009120 2.90E-07 0.000143398 IBD
S47_GI_0011838 4.59E-07 0.000143398 IBD
S81_GI_0011061 9.51E-07 0.000194334 IBD
S103_GI_0016687 1.11E-07 0.000124394 IBD
S118_GI_0008214 4.04E-07 0.000143398 IBD
S257_GI_0026750 4.42E-07 0.000143398 IBD
S57_GI_0025049 8.49E-07 0.000190113 IBD
实施例2基因标记物的验证
为了验证实施例1中的发现,发明人进一步分析验证群体中的31个健康人及71个炎症性肠病患者的粪便样本中的所述27个基因的丰度,并根据验证情况对所述27个基因做出删选,验证群体的DNA提取、测序以及基因丰度的分析参照实施例1进行。
验证结果如下:对于上述富集在健康人群中的16个基因均在验证集中得到高质量的验证(p 值<0.05),验证群体中在健康人富集的基因标志物的p值如表2所示。
表2:
基因名称 p值 fdr值 富集人群
S100_GI_0002354 1.56E-07 0.000143398 control
S100_GI_0002360 3.14E-07 0.000143398 control
S100_GI_0002362 4.76E-07 0.000143398 control
S100_GI_0002364 3.64E-07 0.000143398 control
S100_GI_0002366 6.60E-07 0.000163836 control
S100_GI_0002373 7.99E-08 0.000111871 control
S100_GI_0002377 1.92E-07 0.000143398 control
S100_GI_0002402 9.09E-07 0.000194334 control
S100_GI_0002408 3.74E-07 0.000143398 control
S100_GI_0002410 6.45E-07 0.000163836 control
S100_GI_0008128 7.75E-07 0.000180729 control
S100_GI_0030720 1.41E-08 4.62E-05 control
S10_GI_0005425 2.47E-08 4.62E-05 control
S186_GI_0019691 4.38E-07 0.000143398 control
S24_GI_0044455 5.29E-07 0.000148072 control
S254_GI_0026483 2.32E-08 4.62E-05 control
对于上述富集在炎症性肠病患者中11个基因均在验证集中得到高质量的验证(p值<0.05),炎症性肠病患者富集的肠道微生物基因标志物验证的p值和q值如表3所示。
表3:
基因名称 p值 fdr值 富集人群
S100_GI_0015747 6.73E-07 0.000163836 IBD
S101_GI_0002517 3.53E-07 0.000143398 IBD
S152_GI_0024776 4.87E-07 0.000143398 IBD
S15_GI_0022087 4.43E-07 0.000143398 IBD
S258_GI_0009120 2.90E-07 0.000143398 IBD
S47_GI_0011838 4.59E-07 0.000143398 IBD
S81_GI_0011061 9.51E-07 0.000194334 IBD
S103_GI_0016687 1.11E-07 0.000124394 IBD
S118_GI_0008214 4.04E-07 0.000143398 IBD
S257_GI_0026750 4.42E-07 0.000143398 IBD
S57_GI_0025049 8.49E-07 0.000190113 IBD
发明人认为,可以将从健康人富集的16个基因标记物,作为炎症性肠病疾病患病的反向指标,或作为治疗炎症性肠病进行研发的基因制剂药物菌群成分,或作为检测炎症性肠病、监测炎症性肠病治疗进程的指标;将炎症性肠病患者富集的11个基因标记物,作为炎症性肠病疾病患病的正向指标,特别用于炎症性肠病疾病简单、非创伤式的检测和诊断。
发明人利用这27个基因标记物,构建一个综合指标,估计ROC(Receiver-operating characteristic)曲线下面积AUC,AUC越大,表示诊断能力越高,评价综合得分对应其对炎症性肠病的诊断能力。通过对一期(第一阶段)的192个样品和二期(第二阶段)的102个样品进行评测,具体情况如图2所示,都表现出了很好的诊断能力,在一期得到AUC=81.7%,如图2-A所示,置信区间为72.55%-90.88%;二期得到AUC=90.2%,如图2-B所示,置信区间为85.71%-94.69%。
上述基因集中基因的具体信息如下:
S100_GI_0002354
ATGACAAGCGGAGAAAAGGCTCTTTATCATTCCATTATAGAGCAGTTAAAAGATAAGGAA CTTTCCGATAGCCAAAAAGACAATTTTGTGAAAAAGCTGGATGAACTGTTCAAAAGTATG AATGACCAATCAAAAGAATTTCAATTAAACTCAATTTTATGA(SEQ ID NO:1)。
S100_GI_0002360
ATGAATGGTTACAATTCCGGAACTGAGCCTTGCTGGATGCCATTGATGGAACTCATCGAA ACATGCCTGTTCGACATCATTCACACAGAAGATACAACCGGACGATTCATTCGTCTGTAT GGAGCAGGTGACTATTGGCACGCATTCGAAGAATCCGCCTACCAATTGAGTCAGCTGTTC GTGACACACGATGTAACTGTACTCAGGCATAAAGTTTACCCATTTCCCGTTTTAATGGTC AGCATCTCGGATGACGAACTCCAGGCTTACGGCAAAAATCACATCTTCAGAAAGAAAGTA TCAGGGTACAGGGAACTTGTTGGGATAGGAATCTCGATGAAGCGGTACAAGGAATGGCAC AAAAAAGAGGTGATGAAATTCTCTTCTCTTCCATGA(SEQ ID NO:2)。
S100_GI_0002362
TTGCAGGGTAACTCGTATGTCACGGTGCCGGAGGTTGCCGACTCCTGCGGGCTTTCCTAT ACCGGACTGGAACAGCACCTGTTGTTCTACCATAAGGATCTGGTGAAGCGGCGCATCAGG ATACGCAAGAAGGCTCTCCGACGGCAGCGGAAAGGGGAAATCACCGGTCGGGGTACCGTG CACGCCCCCTCTCCGGAGTTGGTGGAGAAGTATGCCGAAGCGGTGCATCTGTATGCCACG ACACCCATGTCGGCCGCACGGATAGCCGGGAAGACGGGAGTGTCGAAGAAGGGATTCTAC GAGCACCTGCAAAGGTGGCATCTGGACCTGGTATGCAGGCGGAAGAATATCCCCTACGAG GAAGGGCGGCTAGTGGACTGGTCTAAAGTCCGGAAATACAACCCCGCGACAAAGGCCAAA TATGCCGAAGCCATCCGCCGGCTGAAAGAAAGCGGGCTGCCGACGGCACAGGTCGCCGCC GAGTTCGGGCTGCAACCCGAAGCGTTCCGCAGCTACCTGAAGGAACACGAGCCGGAACTG TATGCCCGGAAGGGAATGGTCAGGACGGATACGGGCGGCGCGGTGTCCCGCCGCAGCATG GAGAAATACAGCGAGGCCATGCACCTGTACGGCACGACAACCGAAAGCGTGAAGTCGTTG GCCAGGCGGTTCGGGTTCAACGACTGCTCGTTCGGGCAGTTCATCAGAAGGAATTTCCCC GAACTGGTCGAAAAGCACAACGAAATCGTCCAGAAAAAAGGAAAACAAAATAAATAA(SEQ ID NO:3)。
S100_GI_0002364
ATGAAGATGCTGAATCATACTTTTTTCGCCTGTCTTTTGGGCATGAGTCTCGTTTCCTGT TCACATGCCCAACAGCAGAAAACCAAGGAATTCCGTCTGCCCGACGTGCCTGTCACGCTG ACGGCGCCTGAAGACAGGGCGGCGTACTTGTCCCTGCATTACTGGGACCACTTCGATTTT GCCGATACGTCGCTCATCTCCCGTCCTGAAATCACCGAGCAGGCCTTTGTCGATTTCCTC GGCATCCTGCCCTATACCGACCGGGCACAGGCTGCCATCGATACTCTTTTCCGCCGCGCC GCAACCGGACAGGAGATGCTGTATCACTTCATCGGGCTGAGTGACAAGTACCTCTACGAG CCCAATTCGCCCATGCATGACGAGGAACTGCATATCCTCGTATTGCGGGCACTGCTGGAC AACCCCTGCCTGTCCGATACGGACAAGATACGTCCCCGCTACCTGTTGGAAATAGCCATG AAGAACCGTCCGGGAGACGTGGCGGCGGATTTCACCGTCACTTGCCGGGACGGCAGGCGC AGGCAGCTCTCCGGCATAAAGGCCGACTACGTGCTGGTTTACTTCAACGACCCCGATTGC GAGGACTGCCGCCGGGTGAAGGAATTGCTCACCCTGTCCCCGGTTGTGAACGACCTGTTG GAGTCCGGCCGTCTGAAACTCCTCTCCGTGTGTGTGGAGGGCAAGACCCCCGCGTGGGAA AAGGCGGAATTTCCCGCCGGTTGGATAGATGGTTATGATGCCGATCAGCGGCTTACCCGC GAACAGGTGTACGACCTCAAGGCGATGCCCACCCTTTACCTGCTCGATGCGGAAAAACGG GTGATACTCAAGGACGCTTCGTTCGAGCAGGTGGAAGAACGGTTGTCCTGA(SEQ ID NO:4)。
S100_GI_0002366
ATGATGATTTGTTGTGCGGCGGCATGGCTTCTTGCCGCTTGCAGCAAAGATGACGATCTC CCCGGCGGGCAGACAGGAGGTAACGGCAACAGCATTATCCTCGACATCTCGTCGGGAGCG TTGCCGGTGAGTCGTGCTACCGTACCGGCCGAAGGGGCGGAGGTCGCAGTGAGCCATATC GACGTGCTGATTTTCAACGATACCGACGAGAAAACGAAGGTGTGGAGCGACCGGGTGAAC GCGTCAGCCAATGAAACGGGACGGATTACACTGCCCGTAAAACGGTCGTCTTTTACGGAA AATGAGAGGTATTGGGTGTATCTGATCGCCAACAGCACCCACCCGGAAAAGGATTTTGAA AACCTCGCGAACCTGAACGCCTTGAAGGCGATGACGCAGGAGGACGAGAACATTCACCTG ACAGGGAAAGACATTGAAGGTGTCCCGGGAACATTCCTCATGGACGGCATAGCCTATCCC GAAGGGAACGATGAACCGGCGGTTGCTGCTCCGGTCGTCCTCTACGACGGCTCGCAAGGG AATGACACGCGGCTGGCGGTCACGCTGCGCAGGGCAGCGGCAAAAGTCGTGGTGACCATC AACAAAGGCCAAGACGTGACTTTTGATTCCAAAGGCATAGGTTACTACCTGCGCAATATG CCCTATACCACATCGGTAGTGGCGGGTGCGGACGGTGCGGCAAAGCTGAGGAATACCGCC CAGACCTCCGGCGGCTATCTTGAGTGGACGGCGAACAAAATTACCGTAACGGCTTACATG TATGCCCATGCTTGGGACAATGGAAGTTCCATGGAGCAGGAAGTGCGCCTGGTGATGAAC ATTCCCCTGACTTACCAGAAGGATACCGACCCGCAACTGCGTCCCGATAACTACTACCAG ATTCCTGTCTGTAACGGCAAGGCCCTGAACCGCAACACCTGCTACAGGGTAACGGCAACG GTCAATGCCCCCGGAGCGGAAAATCCCTCCACACCGGTGCAGTTGACGGATTTGAAATAT ACCGTGGAGAATTGGATAGACGAGACGGTAAATGTCGGAGGCGGGGACCGCCCGACTTTC CTTGTGCTCAACCGGTACGACCTGGAAATGCACAACAAGGAGGACGACCGCACCAGCCTG ATCTTCACCTCCTCGTCGGAAGTGACGGCACAGATTACCCGGGTTTACTATATAGACAAG TTCGGAAGGGAACAGAACTTGGAGAAAAGATACCCCGATAATCCAAACGATAACGAATGG GGAGTGAGTACCGGATACAGATGGCGCAGCCATGGCAACATCCTCATTACTCCCGACAAG GGGCTCAACGGCAAGCTGGATGTACACAGCGACCTCCCCAGGAACAATACGATACGTTAT ATCGAAGTCCGGGTAACAAATGAGGACGGCAACGAACGTACCGTAACCATTGAGCAGTAT CCGTTGGAATATATCACGAATATCCAGGGGTGGTACTCGTACCGCGATGATTTCAAGAAT TCAGATCCTAACCCGACTACCTATGAATATGTAGGTGATAAAATTACCGGAATCGCCCTT GCCACCAGAAATATCTCCAGTTGGAACGGAGAATATAGATACCTAACGGGGACAGATGGT TTATTTGGAGGTCCTCCGGACGGATTCTTCGTTTCAAAAGTAGCAAAATTGAGGAATGAT GGAAGCGGACAGTCTGATTTATATGAATACTATTACACATCAAACTCAAACAGACTTCGG GAATCCCGCTATAGCGAAATTAACGGCAGAATGTACACCATTGTATTGACAGGGACATCC AGTGAATATACTCTTGGCCGTCCACGTATGGTCCAGGATACATACCATCCGGAACTTATG GTTACGGATCCGGGACAGGACAATGCCCAATTGGTCTCGCCGTCATTCATGATAGGTTCC TGTGTAGGCGAATTCCAAGTTGGAGGAGGAAACCTGAAGCTGGACGGGAGTGACAACAGT GTCCGCGTTGCACGCGAGCACTGCGCGCATTATGTAGAAACGTATAAAGACCCGAAAACC GATAGGACGGTTACCTTGGATGACTGGCGCCTGCCCACAGAAGCCGAACTTAAAATCATT TTTAAATTCCAGGGCTCGAAAGACCAGGATGCAGACGCCATAGACTACCGCTTGAACGGACAGTACTATTACAGCGCAAGCGGAAGATTTTATAATGAGAAATACACCGTTAGCGGTACC GGAGTGGCCTGTGTACGCGATGCCTACGGTAAAAAGGAATAA(SEQ ID NO:5)。
S100_GI_0002373
ATGAATAGGCTGGACAAAACACTTCTGATAACCGTGCTGCTGCTCGGCGGCATCCTCTGG TTGCAGCACCGGTGGACAATACGCCTCACGGAAGAACGCGACCGTTTCCGCATGAACAGC ACAGCCCTGCTTTCCGATGTGAAGCGGATGCGGACCGATTCAGCGACGATGGCCCTCGAT GCCAAGGCACTGCGGCTGACCATAGACGAGTATGAGGAGTTCCGTGCCGAGGATGCCGAA ACCATCAGGCGGCTCGGCGTGAAAATCAGGAATCTCGAAGCGGCGGCCCGGCATGAGGTC GAGGTGAAAGCACCGATAGACGCCGCCGTCCGCGACACGCTCATTGTCCGTGATACCGTC CCGCTACTGCGGCAGAAAGTGGAGATGGTCACGCCGCATATACATTTTAGCGGACTGATT GAAGAGAACCGTCTCAAAGGTGACATAAAGATACCCGTGACGCTTAACCAGGCTGTATGG GTGGAATACAAGGGATGGTGGTTCTGGAAGAGGGTCAAAGCTATCCGTCAGACCATATCC AGCAACAACCCGTATGTGGAAATCAGGTATTCGGAATATATAAAGATAGACAAAAAATGA(SEQ ID NO:6)。
S100_GI_0002377
ATGTCAGACAAGATAGCGAACACGCAGGATAGGCCGGAAGAGAAACCGCTCACGGAGCAG GAGCTGCAATTCTGCAACCTCTATGTGAACGGCGGGCTGGAGTATGCCGGACGGCCGAAA AAATGCTTTGTGGAGGTATTCGGTGAGGATACGGTGAAGAATCCGTACGCTTCGGCCAAT TACCTGATGAACAAACCGCATGTGCTGGCGCATATCAAGGCGCTGCTCTCCTCGGAACGG TTCGAGATGGAGACGATGGCCGTGAAGCTGCAGGTGGCCGAGACCCTCAAGGCCGTCATG GACGAGACGGCCACTTCGGACTATACCGACCGTTTCGGAGTGCCGCTTTCCCCTGCGCCG CTCAGGGCCGTGTCGGTCAATGCCGCCAAGGCGCTGATGGATATCTTCCCCATCAGGCAC AAGGAGGAGAACCGCCTGCGCATCGAGGGCAGTGACGGCAATGTCATCTTCAATGTGATC GTACCCCAAAACCCTATGACAGATGGTGAAAAGGAAACATAA(SEQ ID NO:7)。
S100_GI_0002402
ATGAACATCACCAACGTAACGGTAACCAAGGTTGCCGAAGAGAGCACGGAGAATGCCGAC TACCAGTTGGAATATTCCATCGTCAATGACGCGCTGACCCGCGTCCACGCCTCCATCCGC AAGAAGGATACGGATGGCTCGGGGAACGCTCCGCAGATAGGTATCATCTACATGGAACAA GGCGTTATTTCATGCAACATTCCTATGGGAGAGCCGCTTGCACCCCTGTTTCATGATTTC GATACCATGATCGACGAAATAAAAAAGAGTAACGTACAAAATGCATAA(SEQID NO:8)。
S100_GI_0002408
ATGGGCAGGATACGACACCTATACCATCTCATCTTCGTTACCAAAGGACGCAAGATGACG ATTCCGACAACGGGAAAAGGATTGATGCTCGAGCGGATGACACGGATTTTTACAGGGAAA GGTTGCCGCGTACATGCCGCCAATGCCTTTCTCAACCACGTGCATGTACTTGTCGAGATT CCGAATTCCGGGGATTTCAGCAAGATCGTGAACAAGGTGAAAGGCGCCACGGGAACGGTA TACCAGAAAACCCCGGAATATGCCGACTTCTCCGGTTGGGCTGCCGGATTCGACTCGTTC AGCGTGTCGTTCAGCGACCTTCACCGGCTCAGACGGCACATCGAGGAGCAGCATACAATC CATCAGGAGATCTCGTTCGAGGAAGAATACGGACAACTGCTTGAAGAGAATGGGTTCGAC CCGCATCAAACGTCCGTGCCGGCATCCTCCACGGTACATTTTTCCGCGAATACCCACCCT AAAAACGGAATCAAATGA(SEQ ID NO:9)。
S100_GI_0002410
ATGAAAGTATTAAAGAATTTGAGCCTGATGGTGCTGCTTGCGCTGGCATTTGCAGGCTGT CGTGGCAAGAGTTCCCAACTTGCCGATTTCAACAAACAGCTTTACGCTCCCGAATATGCC TCGGGATTCAAGATTGAAAGAGCAGACGGCAGACAGAGCGTGCTGGTTTCCGTCATGAAT CCGTGGCAGGGCGCGGATAGCGTCACCACCCGGTTGTTCATCTCCCGTAACGGGGAACCC GTTCCCGAGGGTTTCGACGGGCAGGTCCTCGAAGGGGATGCGCAGCGCATCGTGGCGATG TCCTCGACCCATATCGCCATGCTCGACGCCATCGGCGAGACGGCACGTGTGGTCGGCGTT TCGGGACTCGACTATATCTCCAATCCCGACATTCAGGCACGCCGCGACAGCATCGGCGAC GTGGGTTACGAGGGAAATATCAATTATGAACTTCTGTTGTCGCTCGACCCTGACCTTGTG CTGCTTTTCGGCGTGAACGGGGCCAGTGCGATGGAGAGCAAACTCAAGGAGCTCGGCATC CCGTTCATGTATGTCGGCGATTATCTCGAAGAATCTCCGCTGGGCAAAGCCGAATGGCTG GTGGCGCTTTCGGAGGTCGTCGGGAAACGCGCGAAGGGCGAAAAGGTATTCGCGGATATT CCGATCCGATACAATGCGCTGAAACAGAAAGTGTCCGGTGCCGTTCTCGATGCCCCGTCG GTCATGCTCAATACGCCCTACGGCGATTCGTGGTTCATGCCCTCGACGGAAAACTATGCC GTGCGGCTGATTACCGACGCCGGAGGCGACTACATCTACAAGAAGAACACGGGCAACTCT TCGACGCCTATCGACTTGGAGGAGGCATACCTGCTCGCTTCGGAGGCCGATATGTGGCTG AACGTCGGCATGGCGAACACACTCGACGAACTGAAAGCCGCCTGCCCGAAGTTCGCCGAT ACCCGCTGCGTCCGAAACGGCTATGTCTATAACAACAACGCCCGCACCAATGCCGCCGGA GGCAACGACTACTACGAATCGGCCGTCGTGAATCCCGACCTTCTTCTGCGCGACCTCGTG AAGATATTCCACCCCGAGTTGGTCGAAGAAGATTTCGTATACTACAAACAACTGAAATAG(SEQ ID NO:10)。
S100_GI_0008128
GTGTGGCATTTCCTGCCACGCGCCCAAAAATTTGCCGTGCATTTCACCCTGCACGGCAAA ATTTTTCGTAACTTTGTCGCACTTAAAACGTACCCCATAGCAGGCTATCCAAATGAGCGC ATTTTCGGCATATCGTGTATCGGCTTACTCACGCATCACTCGTGTCGTGGCTCTGCGCTG CTTTACTCCAATTTCGGCAAGACGCTTCTCTGGCACGTCCCGGATCTTTCCCAATCCGGC AGCTAA(SEQ ID NO:11)。
S100_GI_0030720
ATGATTAGGTATATTGAAAAAGGCGACATATTCCGTATTGATGGAGTGAGCAGTTATGCG CATGGTTGTAATTGTGCCGGTGCAATGGGTAAAGGCATTGCCGTACAGTTCAAAAGCAAA TATCCAGATATGTATCTTGAATATAAGCAGTTGTGCAAAGAAAATAAGTTTTGCCCCGGT GATGTTTTTGATTATGATTATGGCAATGGACATATATATAACCTTGGTACTCAAGCAACG TGGCGAACACGAGCTAAAATAGAGTATATCGAAAAGGCACTGATACAGATGCTTGAGTTA GCCAGTGGTGATAATGTAACGGCAATAGCCTTACCTGCAATCGGTGCTGGATTAGGAGGA TTAAAATGGGATGATGTAAAAGCAATTATAGAGACAGTTTCAAATGATTATCCTAATGTT GATTTGTATGTAGTTGAAACTTATCAAAGCGAATAA(SEQ ID NO:12)。
S10_GI_0005425
ATGTCATTATTGCACGGAACGGAAGAGGTGCGCGCACTGCATGCCTCTACCTGTTATGGA ATGGAAAGATATAGAAATGGTGCGCTTGATGAAACGGAAAGCCGGTCCCGCCAATCTTCA TTTAATATCCGGACATGGCCGGATAAGTCATCGGTAATGCAGAATTGTTGCAATGTTTCC TGTTCGGCGCAGGCTGCCGGAAACAACCGTATAGCTGTACAGATGGCAGGATTTACCGGC ACAATGGGTCTGGCGGATGTCAAATCTGTGGATTGGATGGTTTTCCAAACTACTGTTCTG GACCAGGCCCACTCGTGCCCGTTATAA(SEQ ID NO:13)。
S186_GI_0019691
CCTTTAATGAGGATTATCCACCGAACATTAGTTGCGGTCAAAAACGAAATAAAAATGAAT GTAATATCAGAAAAAGAATATTCGTTTTCAAATGCGCTTTTTTGGAACGTAATGTTACAT CATCATATTCGAGCCTTTGATGAAGAAAGGGATGCGAATTTTGATGAAGTATGGGATGAA GAACTTATACCAACATTGTTGGATGAAAAGAAGTACAAGAAATATTGGTGTTGGCTATCT CAAATTGATTTGAAAACATCCGAAAATCAAGGTGAAATAGAAAACCCAAGAACTCTAACA CTTCCTATCGGCAGCGATATTGTATTGACAATAGAATTTCATCCTTGCTGTACATATTAT TTTTTGAATGACACTTTAATCGGGGAAGTTAGTGGCAACTTTCACTTGAAGTATCTCACA TATTCGGAATTAATGAGGATTACAAAAGAGAAATATGGAGATGTACTGTTCCATTTACTC TTACCTTTGTCTGCAATCAGGGAACAAGAAAAAGACATAGCACTTAATGAAATAATCCAA CGATTGCAACAAATTCCCTTATTCAAGGAACATTCCGCATATATAGGTAAATGTATCTTG AATGGATTATTAATATCCAACTCTGACATACAAGAAATTCCCAAGATAGGAACGATATGT ACAAGCAATAATTCATATAGAAATGCTTTGGTATATGATGATGAAAGGCAGGAAATAAAGGAGCTAAATATCCTTTTATCGAGATTATAA(SEQ ID NO:14)。
S24_GI_0044455
AAAAAGCGTGAATGCCAAACTGACCAACGGGCAGGCGGAAGAGATACGGGTGAGATATTC TTCCGGCCAGGCTTCCCAGAACAGCCTGGCAAAACAGTACGGCGTCAGCCGCCAGACGGT AAGCGCGATAATACGATACAAGAAATATATACGATAATGGACGAGGAAGAAATTTGGAAA GATATTCATCATTACGAGGGAATTTATCAAGTAAGCTCCTGCGGTAGAATTAGAAGTGTC GGAAGATATGTCCGTAATGCCACATCCCAATATTGGAGGAACGGACAAATCATCAAACCG TGGGTCGGGGGTACATCCCCGTATTACAATGTTTCTTTGGCCTCTGACGGAAAAATATGT AAAAAATTAATCCATAGACTTGTCGCAGAACATTTTCTTGATGATTGGAATGCGGCAAAG GAGGTTAATCATAAGGATGGCAATAAGCACAATAATCGAAGTGACAACCTGGAAATGTGT ACCAGGCAAGAAAACGTCATGCATTCTATGGTGCATAAACTCAGGGATGATTATGGAGAG AACAGTGTGAACGCCAAACTGACAAATGAACAAGCGGATCATATCAGGCGGTTACACCGG TCGGGAGTCATGCAAAATGAACTGGCTGAACAATTCAAGGTTTGCAAACAGACGATATGC GATATCGTCCACTATAAAAAGTATAAAAAATGA(SEQ ID NO:15)。
S254_GI_0026483
GATCTCGTGCAGGTCATTCTGCACCGTGTTGAGCTGCATCATGGTCGCCTCGAACACGGA CTTGTCCAGCTTCATGGCGTTGATGCGGTCATACTGGTTCTTGATTTCCACTTCCAAACC GATACATTTGGTCTCCAGTTCTGCAATCTGGGCCGTGTTGTTCACATGCTGTATGTACAG TGTCAGCGAGAACGAAAGTACCACGACGATAATCTTGAAGTACTTCACTACAAATTCCTT GAATTGTTCCATATCATTATTCCATTAAAAGTGAGAATGCCTCCCTGA(SEQID NO:16)。
S100_GI_0015747
ATGGAATCATCAATCAAGGACAAATACATCATCTTGGGCTTTGTCGGCTTCGCCATCGTC CTAATATCTTCCATTGCCACGCTGGTAATAGCGGACAGCTTCAACCAAGACAACTTTGTC AGGTGGATAGTATTCGTATGCTGTAACCTGTTGGGATGGTTGCTCTATCTCTCCTTTCAG ACACTTATCTTTGATACATACGAAATCTACAAAATCAAGTTCGGCAAGAAAGAAACGATT GCCGAAGCCATAGAGGTGCAGGAAGAACTGTCACAAAATACACTTGAAGAAGCCACATCT GTGCCTGGACCTACATCAGTCCCTGAGCCTGTACCCGAATCATCCCCGACAAAAGAAGAG ACACTTATCCAAACACAACCGATAGAGCTTACTATCGCCCCGGATCTTCACGAAAAGAAC CGTGCCAATTACGCAAGCAGAGAGCAACGGGAAAAGGAAGAGCGCATCCGCATGGTCATG GAGTATTGCCATTATTACCTGCCTCGCATTGCCGACCAAGAAACCGTGAACCACATCTGT ACTGAGGTGGACAAATGGATGAATCTTAACACTTATACCCCGAAGCCCATACAAAGACCG TTTACCAAAGACATCAACAACATTCCACTCCGTCACTTCGTATGGAATATCTCTGAGCGT TTCCTGTACAAGAGATACTACAATGGGGATAACCGTGCCAAGTTCATCAAAGCCCTTTTC CCGAAATCGTTTGCTGATACAGACTTATCAACCATCAAGAATTTCAAGGTAGAGCCGTTA AAGACGGAAATTCCCATTGATGAACCCGAAAACGGCAAACTTGATTTCCACTATCCCGAG GATTATGTGCGGAATTAG(SEQ ID NO:17)。
S101_GI_0002517
ATGAAAGCAACCAGAAAATGCAGTTTTTGCGGCAAGTCCTTTGTAACCCGAAGCGGTATG CAAAGATATTGCAGTGAGGCTTGTCAGGCAGAAGCCAAACGAGCCAGAGTGATGCAGAAG AACAACCTCTTCAAAGTCGCCCAACCCTTGATGGAGATACAGCATCAGGAGTATCTCACC TTTTCCAAAGCAGCCATCCTCATGGGCTGTTCCCGACAGTACATTTACAAACTTGTAGCC ATCGGCAAGCTGAAAGCCTCACGCATCAGCAACCGCATGGCATTCATCCGCAGAGCCGAC ATCGAGCAGATGTTGGAGGGCAATCCCTATCACCGCATCCTGCCCGGCAACACCTCCACA CCAAGGAAATCATCTTCATCTTCCTTACCTGCCAAAAGAGAAAAAAGGGAAAAGGAAAGC GAAGAAGTGTTGGACTTCTATTCGGGCGAGGAGGTGATGTCCCTTTTTAAGGTAAAGCAG TCATGGCTTTACACTTCCGCCAAGCGTAACCATATCCCCATCTGCCGTATCGCAGGAAAG AACTATTACAGCAAGAAGCATATTGACGAGTTTTTCGGTGTGGCAGTTGATATTAGCGAA ATTACCGACTGGCTACTGACCGAGGAGGTGGAGGAACTGTTCGGCATGAAGCCGACCGCA CTCCGTGCCTACACCTATCGCCATAAGATACCCACTAAAAGAGAGTACGGGCGTACCTAT TACTCCAAATCACATTTGAACGAACTCCGCAGAACTGACCTTGTGAACGATGAACGCTAC TATACCGTTGAGCAGGTGCAGCAAATCTATGGTCTTTCGTCAGCCAACATCTGCCATATC GTCAAGGTGAAGCACATCGAAAAGATAAAGGTGGGTGTGAAAAACCTGCTTTTGCGCTCA GATGTGGAGCGTGTCATGGCTGAAAGGAACAAATAA(SEQ ID NO:18)。
S152_GI_0024776
AGATATTCTCGTCAAACAAATATAAATAATATAAACATGGAAAAAAACAGAAAAAAACAA ATCGTAGTTTTGAGTATAGCTTTAGTTTGCATTTTCATCTTGGTATTTTCATTGTTCCAT AAATCAGCGACAAAAGATAGCGCAAATCCTCCTTTAACAAATGTTTTGACTGATAGCATT TCTCAAATTGTCTCAGCTTGTCCTGGCGAAATTGGTGTGGCGGTTATTGTTAATAACAGA GATACGGTTAAGGTCAATAATAAGAGTGTTTATCCTATGATGAGTGTGTTTAAGGTTCAT CAGGCATTAGCTCTTTGTAATGACTTTGACAATAAAGGAATTTCACTTGATACCTTAGTA AATATAAATAGGGATAAACTTGACCCAAAGACTTGGAGTCCTATGCTGAAAGATTATTCA GGGCCAGTCATATCATTGACAGTGAGAGATTTGCTGCGTTATACTCTTACTCAGAGTGAC AACAATGCAAGCAACCTTATGTTTAAGGATATGGTTAATGTCGCTCAAACAGATAGTTTT ATAGCCACACTCATTCCTCGTTCAAGTTTTCAGATAGCTTATACGGAAGAGGAAATGTCG GCTGACCATAACAAGGCTTACTCTAACTATACATCTCCTCTTGGTGCTGCAATGTTGATG AATCGTTTGTTTACTGAAGGTCTTATCGATGATGAGAAACAAAGTTTCATTAAGAATACG TTAAAAGAATGCAAAACAGGTGTAGATAGGATAGCAGCTCCACTTCTTGATAAAGAAGGG GTTGTTATAGCGCATAAGACAGGTTCAGGTTATGTTAATGAAAATGGTGTTCTTGCAGCT CACAATGATGTTGCCTATATATGTCTGCCTAATAATATCAGTTATACCTTAGCGGTATTT GTTAAGGATTTCAAGGGAAATGAATCACAAGCGTCACAATATGTTGCGCATATATCAGCT GTAGTATATTCTTTATTAATGCAAACTTCAGTAAAATCTTAA(SEQ ID NO:19)。
S15_GI_0022087
CGTGTCGTGGAGATATTCACGGATATATCATTTCAGTCCTTTGCGCCAAGTCTTACAAAA GAGACGAGTACGCGAATGGAAAAATCAATTCTTACCTTCAACGACCTCCCCGAGGTTGTC GCTCAGCTTCGAGACGAAGTGATGAGCCTGAAAAGCCTGCTCGCCGAGCAGCGCAGTGTG AACAATGCCAAAACGGTGGACACCCACGTGCCCATGTCTGTGGACGAGGCAGCAGAGTAT TTAGGTATCCCTAAGGGTACGCTCTACATGAAACTGTCAGAAGGGACAATCCCTGCCACC AAGCCCGGCAAACGCTATTGCCTTTACCGTGACGAACTGGACAAGTGGCTGGAAACCGCC CGAAAGAATCCCATACCGTTGTCAGACGAGGAACTGAACAAGTCCTTATCCTCTTCCCACCGTCGCAAGCCCAACCCACGTAACTGGTGA(SEQ ID NO:20)。
S258_GI_0009120
ATGGGCAATTATTCATTACAGAAGTATAAAGGAACGGCAACACGGCATACCTGCCCCAAA TGCGGAGACAGGCATTCTTTCGTCTATTACGTGGACGAAAATAATGTGCCGTTGCATCCA TCGGTCGGCAGATGTAACCACGAAAGCGGTTGTGGGTATCACTACACTCCGAAAGAGTAT TTTCAAGAGCATCCTGAACACAGAACTACCAATGATTTCTCTTTTGACAGGCAAAGAGCA GAGCAGAAGAAAGTGAAGCAGCAAAGTAAGCCGACAGCCATCGGCTATATTCCCCCTCAC TATGTGGAGAAGTCGCAAAGCGAGCGTAGCAATTTCTTCCGTTTCCTCTTCACACTCCTT ACTTCCTACTATGGCGACAAGGCGAAAGAGGTGTTGAAGCGGTTGTTGGAGGAATACCGT TTGGGGGCTACCCGTGACGGCTCTGTTATCTTTTGGCAGATAGACAGGACGGGCAAGGTA CGCACGGGAAAGGTACGCACGGGAAAGGTGATGCAGTACAATCCCGAAGACGGACACCGT ATCAAGGGAGGACAGACATCGGCAGTGAACTGGATACACAGCATATTGAAAAAGCAGCGT GTGTTGGCAGAGGATTGGCAACTATCCCAATGCCTTTTCGGGGAACACTTGTTGAAAACG CATCCCGACAAGGTGGTGGTCTTGGTGGAATCCGAGAAGAGTGCCGTTATCGGTTCTGCT ATCTTCCCCGATTATGTATGGCTGGCTACGGGTGGTAAGAGTCAGATGAGAGAAGAGAAA CTCCGTGTACTGTCAGGGCGAACCGTGCTTCTCTTTCCCGATGCCGATGCTTATGCCGAG TGGAAACAGCGAGCCGAGAGCATGTACTTTTGTAAGGTGGTGGTTTCGGACATCATCGAA AGGAATGCCACCCCGAAACAAAAAGAAGCCCATATCGACATAGCCGATTGGATTATCTTT CAGATACGGGAGGGCAAGGTGATGAGTACAGCCAACCACTTGGTCGAGGCTGAGAGAATC CTCCAGCGGATGATAGAGAAGAATCCCGTCCTGCAAAAACTGATAGACGATTTAGACCTT GTGCTGGTCGGTGCATCTCCAATCGGCAACGATGATGAAAAACCTCCCTGA(SEQ ID NO:21)。
S47_GI_0011838
AATGATATGGAAGAGGATAAGAACTATATCAACCTGATACGTGGCGACCTCACAAAAGCA TCCCAAGCGCATAACGGTATGCCCGACAGTGTAGGCATGATGAATATCAAGACGGCAAAC CAAACCATTCTTGAAGCATCGTTATTGCCTACGCCCCGTGCGCTGTGGGACAGCTTTTGG TACGAGGGGGAACTCTCCTGCTTGTTTGCCGATTCCAACGTGGGCAAGTCCATCCTTGCC GTGCAGATAGCCGACCGCATCGCCCGAACCGACAATGTGCTGTATCTGGACTTTGAACTG TCCGAAAAGCAGTTCCAGCTCCGCTATACCAACGAGCATGGAGAGCTCTACACCTTTCCC GACAAAATCTATCGGGTGTCTATTGACTGCAACCAGCTTTTGGATGCCAACTTTGAGGAA GCTATCATAGGCGGCATTGAACAGATGGCTGTGCAGACCGACTGCAAGATTTTCATCATT GACAATCTTACCTACCTGTGTTGCGCCATGGAGAAAGGCGATGCCGCAGGACGGCTGATG ATTCAGCTGAACAATCTCAAAAAGAGATATGCGCTCTCTATCCTTGTCCTAGCACATACG CCCAAACGCTCTTTGGATTGTCCCATCACATCCAACGACCTTGCCGGAAGCAAACGGCTC TACAATTTCTTTGACAGCGTGTTCACCATTGGAAAAAGTGCCCAAGACGGAGGGCTTCGC TATGTGAAGCAGCTTAAAGTGCGCTATGGCACGTTCTCTCATGATGCGGATAATGTAATC GTTTACGAGATTGACAAGGTGGATGCTTTCTTGCAGTTCGTGTTCAGGGGCTATTCCACG GAAAAGGAACACTTGAAAAAATTGGGCGACAATGAATCAAGCCAAAGGGATTGCCAAATT CTGCAACTCTCCCAATCGGGCAAGTCCGTCAGGGAGATAGCCTCACAGGTGAATTGTGGC AAGTCCACCGTAAACCGTATCATCCAGCGCAGCAAAGAGAGTAAAAACGCAGGTGTCCCA AGTGTCCCACTGTCCCAACCCTTAGAGTGTGGGACAATGGGACAGGATGGGACAGCCGAC AATCAACCATCAAAAACGGACTAA(SEQ ID NO:22)。
S81_GI_0011061
GAGACAGGACCCGTACTTCGTAATTGCTGCGCCCATCATTCAAGACTGTCAAATCGGGTC TTTCCTGTCAAGCCAATGATGCCTATGCGTATGCCAAACACATGGATTACGGATTTCTCG TTCCGTGAACAAACACTTTATCCGCAACTCTGCTATGTGGTGTATTGGCTTAACTCCATT TCTATGGGCAACACTTTTGTTGCAGATTTCAAGCAGCTTTTATCGAAATACCCATCAGTA AGAACTCGTTTATTAGGCTTTCCTCATAATTGGGAACAAGAGCCTTTGTGGAGATAA(SEQ ID NO:23)。
S103_GI_0016687
ATGACCCACTCAGGGCGTTTCTCCCCTGAGAACCCAGAGCAAAGAGTGACCCTCTCTTTG CAATCTCCGCTTATGGGTTGCACCCCTAAGAACCCCATGCGTTTACGGACAGCGGAAAAG CAAACAATAAAGTACAAACCCAAAAAACAAGTATCTATGGCAACAAAATCAAGCATACAT ATCAAGCCCTGCAATATCGCATCGAGTGAGGCTCACAACAGGAGGACTGCCGAATACATG CGCCACATCGGAGAGTCCAGAACCTATGTGGTTCCAGAACTCTCCACCGATAATGAGCAG TGGATAAATCCCGACTTCGGCAGTCCGGATTTGCGGATGCATTATGACAATATCAGACAG ATGGTAAAGGAAAAGACCGGACGTGCCATGCAGGAAAAGGAGCGTGAACGCAAAGGCAAG AACGGTAAAATAGTCAAGATTGCGGGATGCTCCCCCATACGTGAAGGAGTGCTGCTTGTC AGGTCGGACACCACACTGGCAGACGTGCGTAAATTCGGTGAGGAGTGTCAAAGACGCTGG GGAATCACACCGCTGCAAATCTTCCTGCACAAGGATGAAGGGCATTGGCTGAACGGTCAG CCGGAAGCGGAAGACAGGGAAAGCTTCAAAGTCGGGGACAGATGGTTCAAGCCGAACTAT CATGCCCATATCGTTTTCGACTGGATGAACCACGAAACAGGAAAGAGCCGAAAGCTCAAT GACGATGACATGATGCAGATGCAGACCCTTGCATCCGACATCCTGCTGATGGAACGCGGG CAGTCAAAGGCTGTCACTGGTAAGGAGCATCTGGAACGGAACGACTTTATCATTGAGAAG CAGAAAGCTGAACTGCAACGCATGGATGCAGCCAAACGGCACAAAGAAGAACAGATAAAT CTTGCCGAGCAGGAACTGAAACAGGTGAAATCAGAAATACGCACTGACAAGTTAAAGAAG ACAGCCACCACGGCAGCGACAGCCATAACTAGTGGAGTTGCTTCTCTTTTCGGGAGTGGA AAACTGAAAGAACTGGAACGTGCCAACGAAAAACTGCAAGACGAGGTTTCAAAACGGAAC ACCAATATTGAAAAATTGCAGAGCCAAGTACAGCAGATGCAGAAACAGCATGATACGCAA ATCCACAATCTCAGAGAAATGCACAGGCAGGAACTTGACATGAAAGAAAAAGAACTGTCA CGGCTCGCCAGAATCATAGACAAGGCTTTCAGGTGGTTTCCGATGTTCAGGGAAATGCTG CGCATGGAAAAGTTTTGTGCCATGCTGGGATTCTCTAAAGAAATGACTGAAAGTCTTATA GTCAAAAAAGAAGCCCTGAAATGTAGCGGTAAAATCTATTCCGAGCAACACAGGCGGAAC TTTGATATAAAGGATGATATTTTAAGGGTGGAAAATGACCCTGACGATGAAAGCAGGCTG AACCTGACAATAAACAGGAAGCCGATTGCCGACTGGTTCAGGGAGCAATGGCACAGGCTT AGATATGGAGCAAGAGTGCCGCAACAGGAAGAAAGAAAAAGTAGAGGATTCAAATTATAA(SEQID NO:24)。
S118_GI_0008214
ATGAAAGACAGAAAGAATTCAAGTCTGTTACGTCGTTTGGAGAAGTTCCAGCGGCTTTTC TTCGTTGCTTTGTTATCCGTATTGGCTGTAGGGGCCTTTGCACAGAGCAAAACCGTTTCG GGTACTGTCCTTGACAAAACAGGTGAGTCTGTAATCGGTGCCAGTGTGGTGGTGAAAGGT ACTACCAATGGTACAATTACCGACTTTGATGGTAAGTTCACACTTCAGAATGTTCCTGAT AATGGAACGATCCAAGTAAGTTTTGTGGGGTACAAGACCGTAGATATCCAAGTGAAAGGA CAATCTACCGTTAAAATAATCTTGGAGGAGGATACCGAAACACTGGATGAAGTGGTAGTG GTTGGTTATGGTGTTCAGAAAAAAAGTGATGTGACTGGTGCTATGGCACGTGTTACGAGT AAGGTTATAGAGGATCGTCCTGTTCAAAATGCTTTGCAGGCTATGCAAGGACGTGTGACA GGTGTGGATATTACGTCTAATAATCGTCCTGGTGAGTTGGGCGATATTCGTATTCGTGGT AATCGTTCTTTAACTGCGGATAATAATCCTTTATATGTTATTGACGGAATACCTATGTCA GCAGGTTCGATTGCTGATGTTAATCCGAGTGATATTGAATCTATGGAAATTTTGAAAGAT GCTTCTGCTACCGCTATTTATGGCTCTCGTGGTGCTAATGGTGTTATCTTGGTGACAACC AAAAAAGGTAAAACGGGTAGAACTACTATTAATTATGATGGCTCATTTAGTTTTGGTTTC TTGGATTCAACAACTGATTATATGAATTCTGGTCAATTGTTGGATTATAATCGTCAGTCA GCTATTACGGGTGGTACTTATAATGGTAGATATGGTGACAACCCTGATCCTGAGCGTGAT AAAGCTTTATGGCTGAATCCCAACAATATGTCATATATGGATAAACGATTGGAAAAAGTA TATCAGCAAAATGCTGATGGAACTTATTCTTATGATCCTTCACAATTAGAAACAACTGAT TGGGGCGAATTGGTGACACGTACAGCATTTACTCATAATCATCAGATTTCTCTTTCAGCA GGAACGGAAACTTCCAAATTGTATGTATCATTGGGATATTTGGATCAGAAAGTACCTATG AAAGACCAAGATTTCAAACGTTATACAGCCAATATAAACGGTGAAATTATTCCGACTAAA TGGTTGAAAGTGGGAATGGGATTGAATGCTACTCATTCTATTAAAAATTATGGTATTGTA AGTAATACAAGTAATACAGGAGCAAAAGACTCTTATGGTTTGGCTATGGATATGATGCCA TGGGTACCGGCTTATAATGAAGATGGTTCTATACTGGAGGTTGCAAGTGCCGATGATCAG GCTTATCATAATCCTTTGAGAAATATAGATGATGCTTGGAATGAAACACGTTATTATGGC GTGAACTTCTCTTCTTATGCAGAATTGGATTTTGGACAATTTTGGGAACCTTTGAAAGGT GTAAAATGGCGTACGAATTTAGGCGCTCAATATCGTAACTCCCGTGTGGGTAGTTATTAT GGTGAGGGATATACTAATCCTTTTAAAAATCCTGCAATGGCTCCTAATGTAGCCAATAAT GAGCACAGTCAGAAGTTGTCATGGACATTGGAAAACTTGCTGTATATCAATAAAACAATA AAAGATATTCATTCGGTAAATATTACTTTGTTGCAATCAGCTGAACGTTATCGTACTGAA GGGTTGAACATGCGTGGATATGAAATCACATTTCCTTCTTCTTTGTGGTATAATATTGGT GCATCGAATAATGCAAAATATGCTCCAGGCTCCAATTTTTCTACTTGGTCAAGAGCTTCT TATATGGCACGTGTGAATTATGGATTGATGGATAAATATTTGTTGACTGTTACCGGACGA TTTGATGGCGCTTCTATGTTGGCTGCTGGAAACAAATGGGATTTCTTTCCTTCTGCTGCA TTGGCATGGCGTATGGAACAAGAGAAATGGATACAGCAAATTAATTGGATTAACCAATTA AAACTTCGTGTAGGATATGGTGTTACAGGTAATTCTGCTGTTAATCCTTATCAAACAGCA GGTTCTGTTACTTCTACCTATGCTAGCATCCCATTTGGAGTGGGCAATGTTTCGTCGAATACTATTGGTACAAAGACTAATATTATGCCTAACTATTCTTTAGGTTGGGAAAAAACTTCA TCTTTAAATGTTGGTGTTGATTTTGGAGTCTTGGAGAATCGTATTAGTGGTAGTGTTGAA TATTATATTGCTAAGACTTCTGATTTGCTGATGAATCAGTCTATTCCGGTAATTACCGGT TATGCACAAATTTTGAATAATGTAGGTAAGACAGAAAATAGAGGTTTTGAAGTTTCGTTG TCAACTGTAAATGTTAAAACAAAAGACTTCACATGGCAAACGGATTGGACTTTCTCTTTGAATAATGAAAAAATTAAAGAATTGGCCGGTGGTGCTACGTATGATTCAACAGGTCCTTGG ATGGTGGGTGAGCCTTTGAATAGTTTTTATGATTTCCAGTATGACCGCATTTGGCAAAAT ACTCAGGAGGATAATCATTTGATGGATGTTTATCGTTCTTTGGGATTGACTTTCCTTCCT GGACAATATAAGATTGTGGATCAACCATTAGTTGAAGTTCCACAAGGTACAGAAGGATCA AAGACTGTAGAAATAAAAGATGCTGCAGGTAATAAAACAGGTGAAGTTGTTTCCTATATGGATAATGGATTTGGTAAATTTGATGATAATGATAAGAAAATTTATAATAAATCTCCTAAA TGGACAGGCGGTATCAATAATTCATTTACCTATAAGAACTGGAATTTGAGCTTCTTTACT TATTTTCGATTTGGTAATACTTATTATGGTCTGACCCAGACTATTGGTCGTCGAATTGAA AAAGATACATGGTCACCAACTAATACAGATGCAAAGTTTGCTCAGCCTACTACTGCAACT CGTGAAACTAAATATGACTATGTAAGAAATTATACAAAAGGAAATATGGTTCTTATAAAGAATATAGCTTTGTCTTATACAGTTCCTCAAAGTTGGTTGAAGAAGTGTGGTGCAAGCAGT GCACAGGTATATGCTCAGGTATTGAATCCGTTCCTTTTTGGTGGAGAATTGGTTAAAGCT GGTATTAATCCGGATGATTTGACTGGTTGGGATGCAGGTAATCATATTGGTGGACAAACT AATAATACTTGTATTACTCGCAGTCTTGTTTTGGGAGTAAGATTGGGCTTCTAA(SEQ ID NO:25)。
S257_GI_0026750
TTGCACATTCTAAAAGGTGAAGATTTAACGCTTTTATTGATTATTAACTCAAAAAGGACA TCAACTTGGGTCGTTTCTTCTCTTTTCCTTGCTATTCGTTTCCGATATTCCACTTTTGTT TTGGTCTATCTCATATGTACTGCAAAGGTATTGATTTTTGTTTGA(SEQ ID NO:26)。
S57_GI_0025049
GGCTTTCAGCTTGCCGATGGCTACAAGTTTGTAAATGTACTGTCGGGAACAGCCCATGAG GATGGCTGCTTTGGAAAAGGTGAGATACTCCTGATGCTGTATCTCCATCAAGGGTTGGGC GACTTTGAAGAGGTTGTTCTTCTGCATCACTCTGGCTCGTTTGGCTTCTGCCTGACAAGC CTCACTGCAATATCTTTGCATACCGCTTCGGGTTACAAAGGACTTGCCGCAAAAACTGCA TTTTCTGGTTGCTTTCATACCGTTTTATCGTTTAATGGTTCATTTCTTCAATCCTATATC TCTGAAATGGTAAACGGATGTGAACGGAAGTCAACCATTGTCGCTTTTCTACACAGTGTG ACTGTTTCCGCATATCGGGGCGGTTATTGTCGCTTGTCGTAA(SEQ ID NO:27)。
实施例3个体状态的检测
本实施例中,发明人利用89个粪便样本进行样本来源的个体状态的检测。
参照实施例2的方法确定各粪便样本中表1所示的S100_GI_0002354、S100_GI_0002360、 S100_GI_0002362、S100_GI_0002364、S100_GI_0002366、S100_GI_0002373、S100_GI_0002377、 S100_GI_0002402、S100_GI_0002408、S100_GI_0002410、S100_GI_0008128、S100_GI_0015747、 S100_GI_0030720、S101_GI_0002517、S10_GI_0005425、S152_GI_0024776、S15_GI_0022087、 S186_GI_0019691、S24_GI_0044455、S254_GI_0026483、S258_GI_0009120、S47_GI_0011838、 S81_GI_0011061、S103_GI_0016687、S118_GI_0008214、S257_GI_0026750和S57_GI_0025049 的丰度,判断各样本中的这27种基因的丰度是否落入各自在疾病对照组或者健康对照组的丰度的 95%的置信区间,判定这27种基因的丰度均落入疾病组的对应区间的样本所对应的个体的状态为炎症性肠病患者,判定27种基因的丰度均落入健康组的对应区间的样本所对应的个体的状态为非炎症性肠病患者。
结果显示,利用本实施例所述方法能够对89样本进行个体状态判断,而且这89个粪便样本中的85个粪便样本的个体状态判断结果与记录的该样本来源个体的状态一致。
另外,发明人发现对表2和表3中的基因联合检测,例如检测表3中的基因标志物被富集,同时表2中基因标记物不被富集,能够更准确的判断发现炎症性肠病患者或易感人群。
在利用标志物治疗炎症性肠病的方案中,发明人发现使3中的基因标志物生长得到抑制或者清除,同时使表2中基因标记物被富集,治疗效果极佳。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。
SEQUENCE LISTING
<110> 青岛锐翌精准医学检验有限公司
<120> 炎症性肠病标志基因及其应用
<130> SI4210311
<160> 27
<170> PatentIn version 3.5
<210> 1
<211> 162
<212> DNA
<213> Artificial Sequence
<220>
<223> 1
<400> 1
atgacaagcg gagaaaaggc tctttatcat tccattatag agcagttaaa agataaggaa 60
ctttccgata gccaaaaaga caattttgtg aaaaagctgg atgaactgtt caaaagtatg 120
aatgaccaat caaaagaatt tcaattaaac tcaattttat ga 162
<210> 2
<211> 396
<212> DNA
<213> Artificial Sequence
<220>
<223> 2
<400> 2
atgaatggtt acaattccgg aactgagcct tgctggatgc cattgatgga actcatcgaa 60
acatgcctgt tcgacatcat tcacacagaa gatacaaccg gacgattcat tcgtctgtat 120
ggagcaggtg actattggca cgcattcgaa gaatccgcct accaattgag tcagctgttc 180
gtgacacacg atgtaactgt actcaggcat aaagtttacc catttcccgt tttaatggtc 240
agcatctcgg atgacgaact ccaggcttac ggcaaaaatc acatcttcag aaagaaagta 300
tcagggtaca gggaacttgt tgggatagga atctcgatga agcggtacaa ggaatggcac 360
aaaaaagagg tgatgaaatt ctcttctctt ccatga 396
<210> 3
<211> 777
<212> DNA
<213> Artificial Sequence
<220>
<223> 3
<400> 3
ttgcagggta actcgtatgt cacggtgccg gaggttgccg actcctgcgg gctttcctat 60
accggactgg aacagcacct gttgttctac cataaggatc tggtgaagcg gcgcatcagg 120
atacgcaaga aggctctccg acggcagcgg aaaggggaaa tcaccggtcg gggtaccgtg 180
cacgccccct ctccggagtt ggtggagaag tatgccgaag cggtgcatct gtatgccacg 240
acacccatgt cggccgcacg gatagccggg aagacgggag tgtcgaagaa gggattctac 300
gagcacctgc aaaggtggca tctggacctg gtatgcaggc ggaagaatat cccctacgag 360
gaagggcggc tagtggactg gtctaaagtc cggaaataca accccgcgac aaaggccaaa 420
tatgccgaag ccatccgccg gctgaaagaa agcgggctgc cgacggcaca ggtcgccgcc 480
gagttcgggc tgcaacccga agcgttccgc agctacctga aggaacacga gccggaactg 540
tatgcccgga agggaatggt caggacggat acgggcggcg cggtgtcccg ccgcagcatg 600
gagaaataca gcgaggccat gcacctgtac ggcacgacaa ccgaaagcgt gaagtcgttg 660
gccaggcggt tcgggttcaa cgactgctcg ttcgggcagt tcatcagaag gaatttcccc 720
gaactggtcg aaaagcacaa cgaaatcgtc cagaaaaaag gaaaacaaaa taaataa 777
<210> 4
<211> 891
<212> DNA
<213> Artificial Sequence
<220>
<223> 4
<400> 4
atgaagatgc tgaatcatac ttttttcgcc tgtcttttgg gcatgagtct cgtttcctgt 60
tcacatgccc aacagcagaa aaccaaggaa ttccgtctgc ccgacgtgcc tgtcacgctg 120
acggcgcctg aagacagggc ggcgtacttg tccctgcatt actgggacca cttcgatttt 180
gccgatacgt cgctcatctc ccgtcctgaa atcaccgagc aggcctttgt cgatttcctc 240
ggcatcctgc cctataccga ccgggcacag gctgccatcg atactctttt ccgccgcgcc 300
gcaaccggac aggagatgct gtatcacttc atcgggctga gtgacaagta cctctacgag 360
cccaattcgc ccatgcatga cgaggaactg catatcctcg tattgcgggc actgctggac 420
aacccctgcc tgtccgatac ggacaagata cgtccccgct acctgttgga aatagccatg 480
aagaaccgtc cgggagacgt ggcggcggat ttcaccgtca cttgccggga cggcaggcgc 540
aggcagctct ccggcataaa ggccgactac gtgctggttt acttcaacga ccccgattgc 600
gaggactgcc gccgggtgaa ggaattgctc accctgtccc cggttgtgaa cgacctgttg 660
gagtccggcc gtctgaaact cctctccgtg tgtgtggagg gcaagacccc cgcgtgggaa 720
aaggcggaat ttcccgccgg ttggatagat ggttatgatg ccgatcagcg gcttacccgc 780
gaacaggtgt acgacctcaa ggcgatgccc accctttacc tgctcgatgc ggaaaaacgg 840
gtgatactca aggacgcttc gttcgagcag gtggaagaac ggttgtcctg a 891
<210> 5
<211> 2262
<212> DNA
<213> Artificial Sequence
<220>
<223> 5
<400> 5
atgatgattt gttgtgcggc ggcatggctt cttgccgctt gcagcaaaga tgacgatctc 60
cccggcgggc agacaggagg taacggcaac agcattatcc tcgacatctc gtcgggagcg 120
ttgccggtga gtcgtgctac cgtaccggcc gaaggggcgg aggtcgcagt gagccatatc 180
gacgtgctga ttttcaacga taccgacgag aaaacgaagg tgtggagcga ccgggtgaac 240
gcgtcagcca atgaaacggg acggattaca ctgcccgtaa aacggtcgtc ttttacggaa 300
aatgagaggt attgggtgta tctgatcgcc aacagcaccc acccggaaaa ggattttgaa 360
aacctcgcga acctgaacgc cttgaaggcg atgacgcagg aggacgagaa cattcacctg 420
acagggaaag acattgaagg tgtcccggga acattcctca tggacggcat agcctatccc 480
gaagggaacg atgaaccggc ggttgctgct ccggtcgtcc tctacgacgg ctcgcaaggg 540
aatgacacgc ggctggcggt cacgctgcgc agggcagcgg caaaagtcgt ggtgaccatc 600
aacaaaggcc aagacgtgac ttttgattcc aaaggcatag gttactacct gcgcaatatg 660
ccctatacca catcggtagt ggcgggtgcg gacggtgcgg caaagctgag gaataccgcc 720
cagacctccg gcggctatct tgagtggacg gcgaacaaaa ttaccgtaac ggcttacatg 780
tatgcccatg cttgggacaa tggaagttcc atggagcagg aagtgcgcct ggtgatgaac 840
attcccctga cttaccagaa ggataccgac ccgcaactgc gtcccgataa ctactaccag 900
attcctgtct gtaacggcaa ggccctgaac cgcaacacct gctacagggt aacggcaacg 960
gtcaatgccc ccggagcgga aaatccctcc acaccggtgc agttgacgga tttgaaatat 1020
accgtggaga attggataga cgagacggta aatgtcggag gcggggaccg cccgactttc 1080
cttgtgctca accggtacga cctggaaatg cacaacaagg aggacgaccg caccagcctg 1140
atcttcacct cctcgtcgga agtgacggca cagattaccc gggtttacta tatagacaag 1200
ttcggaaggg aacagaactt ggagaaaaga taccccgata atccaaacga taacgaatgg 1260
ggagtgagta ccggatacag atggcgcagc catggcaaca tcctcattac tcccgacaag 1320
gggctcaacg gcaagctgga tgtacacagc gacctcccca ggaacaatac gatacgttat 1380
atcgaagtcc gggtaacaaa tgaggacggc aacgaacgta ccgtaaccat tgagcagtat 1440
ccgttggaat atatcacgaa tatccagggg tggtactcgt accgcgatga tttcaagaat 1500
tcagatccta acccgactac ctatgaatat gtaggtgata aaattaccgg aatcgccctt 1560
gccaccagaa atatctccag ttggaacgga gaatatagat acctaacggg gacagatggt 1620
ttatttggag gtcctccgga cggattcttc gtttcaaaag tagcaaaatt gaggaatgat 1680
ggaagcggac agtctgattt atatgaatac tattacacat caaactcaaa cagacttcgg 1740
gaatcccgct atagcgaaat taacggcaga atgtacacca ttgtattgac agggacatcc 1800
agtgaatata ctcttggccg tccacgtatg gtccaggata cataccatcc ggaacttatg 1860
gttacggatc cgggacagga caatgcccaa ttggtctcgc cgtcattcat gataggttcc 1920
tgtgtaggcg aattccaagt tggaggagga aacctgaagc tggacgggag tgacaacagt 1980
gtccgcgttg cacgcgagca ctgcgcgcat tatgtagaaa cgtataaaga cccgaaaacc 2040
gataggacgg ttaccttgga tgactggcgc ctgcccacag aagccgaact taaaatcatt 2100
tttaaattcc agggctcgaa agaccaggat gcagacgcca tagactaccg cttgaacgga 2160
cagtactatt acagcgcaag cggaagattt tataatgaga aatacaccgt tagcggtacc 2220
ggagtggcct gtgtacgcga tgcctacggt aaaaaggaat aa 2262
<210> 6
<211> 600
<212> DNA
<213> Artificial Sequence
<220>
<223> 6
<400> 6
atgaataggc tggacaaaac acttctgata accgtgctgc tgctcggcgg catcctctgg 60
ttgcagcacc ggtggacaat acgcctcacg gaagaacgcg accgtttccg catgaacagc 120
acagccctgc tttccgatgt gaagcggatg cggaccgatt cagcgacgat ggccctcgat 180
gccaaggcac tgcggctgac catagacgag tatgaggagt tccgtgccga ggatgccgaa 240
accatcaggc ggctcggcgt gaaaatcagg aatctcgaag cggcggcccg gcatgaggtc 300
gaggtgaaag caccgataga cgccgccgtc cgcgacacgc tcattgtccg tgataccgtc 360
ccgctactgc ggcagaaagt ggagatggtc acgccgcata tacattttag cggactgatt 420
gaagagaacc gtctcaaagg tgacataaag atacccgtga cgcttaacca ggctgtatgg 480
gtggaataca agggatggtg gttctggaag agggtcaaag ctatccgtca gaccatatcc 540
agcaacaacc cgtatgtgga aatcaggtat tcggaatata taaagataga caaaaaatga 600
<210> 7
<211> 522
<212> DNA
<213> Artificial Sequence
<220>
<223> 7
<400> 7
atgtcagaca agatagcgaa cacgcaggat aggccggaag agaaaccgct cacggagcag 60
gagctgcaat tctgcaacct ctatgtgaac ggcgggctgg agtatgccgg acggccgaaa 120
aaatgctttg tggaggtatt cggtgaggat acggtgaaga atccgtacgc ttcggccaat 180
tacctgatga acaaaccgca tgtgctggcg catatcaagg cgctgctctc ctcggaacgg 240
ttcgagatgg agacgatggc cgtgaagctg caggtggccg agaccctcaa ggccgtcatg 300
gacgagacgg ccacttcgga ctataccgac cgtttcggag tgccgctttc ccctgcgccg 360
ctcagggccg tgtcggtcaa tgccgccaag gcgctgatgg atatcttccc catcaggcac 420
aaggaggaga accgcctgcg catcgagggc agtgacggca atgtcatctt caatgtgatc 480
gtaccccaaa accctatgac agatggtgaa aaggaaacat aa 522
<210> 8
<211> 288
<212> DNA
<213> Artificial Sequence
<220>
<223> 8
<400> 8
atgaacatca ccaacgtaac ggtaaccaag gttgccgaag agagcacgga gaatgccgac 60
taccagttgg aatattccat cgtcaatgac gcgctgaccc gcgtccacgc ctccatccgc 120
aagaaggata cggatggctc ggggaacgct ccgcagatag gtatcatcta catggaacaa 180
ggcgttattt catgcaacat tcctatggga gagccgcttg cacccctgtt tcatgatttc 240
gataccatga tcgacgaaat aaaaaagagt aacgtacaaa atgcataa 288
<210> 9
<211> 498
<212> DNA
<213> Artificial Sequence
<220>
<223> 9
<400> 9
atgggcagga tacgacacct ataccatctc atcttcgtta ccaaaggacg caagatgacg 60
attccgacaa cgggaaaagg attgatgctc gagcggatga cacggatttt tacagggaaa 120
ggttgccgcg tacatgccgc caatgccttt ctcaaccacg tgcatgtact tgtcgagatt 180
ccgaattccg gggatttcag caagatcgtg aacaaggtga aaggcgccac gggaacggta 240
taccagaaaa ccccggaata tgccgacttc tccggttggg ctgccggatt cgactcgttc 300
agcgtgtcgt tcagcgacct tcaccggctc agacggcaca tcgaggagca gcatacaatc 360
catcaggaga tctcgttcga ggaagaatac ggacaactgc ttgaagagaa tgggttcgac 420
ccgcatcaaa cgtccgtgcc ggcatcctcc acggtacatt tttccgcgaa tacccaccct 480
aaaaacggaa tcaaatga 498
<210> 10
<211> 1140
<212> DNA
<213> Artificial Sequence
<220>
<223> 10
<400> 10
atgaaagtat taaagaattt gagcctgatg gtgctgcttg cgctggcatt tgcaggctgt 60
cgtggcaaga gttcccaact tgccgatttc aacaaacagc tttacgctcc cgaatatgcc 120
tcgggattca agattgaaag agcagacggc agacagagcg tgctggtttc cgtcatgaat 180
ccgtggcagg gcgcggatag cgtcaccacc cggttgttca tctcccgtaa cggggaaccc 240
gttcccgagg gtttcgacgg gcaggtcctc gaaggggatg cgcagcgcat cgtggcgatg 300
tcctcgaccc atatcgccat gctcgacgcc atcggcgaga cggcacgtgt ggtcggcgtt 360
tcgggactcg actatatctc caatcccgac attcaggcac gccgcgacag catcggcgac 420
gtgggttacg agggaaatat caattatgaa cttctgttgt cgctcgaccc tgaccttgtg 480
ctgcttttcg gcgtgaacgg ggccagtgcg atggagagca aactcaagga gctcggcatc 540
ccgttcatgt atgtcggcga ttatctcgaa gaatctccgc tgggcaaagc cgaatggctg 600
gtggcgcttt cggaggtcgt cgggaaacgc gcgaagggcg aaaaggtatt cgcggatatt 660
ccgatccgat acaatgcgct gaaacagaaa gtgtccggtg ccgttctcga tgccccgtcg 720
gtcatgctca atacgcccta cggcgattcg tggttcatgc cctcgacgga aaactatgcc 780
gtgcggctga ttaccgacgc cggaggcgac tacatctaca agaagaacac gggcaactct 840
tcgacgccta tcgacttgga ggaggcatac ctgctcgctt cggaggccga tatgtggctg 900
aacgtcggca tggcgaacac actcgacgaa ctgaaagccg cctgcccgaa gttcgccgat 960
acccgctgcg tccgaaacgg ctatgtctat aacaacaacg cccgcaccaa tgccgccgga 1020
ggcaacgact actacgaatc ggccgtcgtg aatcccgacc ttcttctgcg cgacctcgtg 1080
aagatattcc accccgagtt ggtcgaagaa gatttcgtat actacaaaca actgaaatag 1140
<210> 11
<211> 246
<212> DNA
<213> Artificial Sequence
<220>
<223> 11
<400> 11
gtgtggcatt tcctgccacg cgcccaaaaa tttgccgtgc atttcaccct gcacggcaaa 60
atttttcgta actttgtcgc acttaaaacg taccccatag caggctatcc aaatgagcgc 120
attttcggca tatcgtgtat cggcttactc acgcatcact cgtgtcgtgg ctctgcgctg 180
ctttactcca atttcggcaa gacgcttctc tggcacgtcc cggatctttc ccaatccggc 240
agctaa 246
<210> 12
<211> 456
<212> DNA
<213> Artificial Sequence
<220>
<223> 12
<400> 12
atgattaggt atattgaaaa aggcgacata ttccgtattg atggagtgag cagttatgcg 60
catggttgta attgtgccgg tgcaatgggt aaaggcattg ccgtacagtt caaaagcaaa 120
tatccagata tgtatcttga atataagcag ttgtgcaaag aaaataagtt ttgccccggt 180
gatgtttttg attatgatta tggcaatgga catatatata accttggtac tcaagcaacg 240
tggcgaacac gagctaaaat agagtatatc gaaaaggcac tgatacagat gcttgagtta 300
gccagtggtg ataatgtaac ggcaatagcc ttacctgcaa tcggtgctgg attaggagga 360
ttaaaatggg atgatgtaaa agcaattata gagacagttt caaatgatta tcctaatgtt 420
gatttgtatg tagttgaaac ttatcaaagc gaataa 456
<210> 13
<211> 327
<212> DNA
<213> Artificial Sequence
<220>
<223> 13
<400> 13
atgtcattat tgcacggaac ggaagaggtg cgcgcactgc atgcctctac ctgttatgga 60
atggaaagat atagaaatgg tgcgcttgat gaaacggaaa gccggtcccg ccaatcttca 120
tttaatatcc ggacatggcc ggataagtca tcggtaatgc agaattgttg caatgtttcc 180
tgttcggcgc aggctgccgg aaacaaccgt atagctgtac agatggcagg atttaccggc 240
acaatgggtc tggcggatgt caaatctgtg gattggatgg ttttccaaac tactgttctg 300
gaccaggccc actcgtgccc gttataa 327
<210> 14
<211> 750
<212> DNA
<213> Artificial Sequence
<220>
<223> 14
<400> 14
cctttaatga ggattatcca ccgaacatta gttgcggtca aaaacgaaat aaaaatgaat 60
gtaatatcag aaaaagaata ttcgttttca aatgcgcttt tttggaacgt aatgttacat 120
catcatattc gagcctttga tgaagaaagg gatgcgaatt ttgatgaagt atgggatgaa 180
gaacttatac caacattgtt ggatgaaaag aagtacaaga aatattggtg ttggctatct 240
caaattgatt tgaaaacatc cgaaaatcaa ggtgaaatag aaaacccaag aactctaaca 300
cttcctatcg gcagcgatat tgtattgaca atagaatttc atccttgctg tacatattat 360
tttttgaatg acactttaat cggggaagtt agtggcaact ttcacttgaa gtatctcaca 420
tattcggaat taatgaggat tacaaaagag aaatatggag atgtactgtt ccatttactc 480
ttacctttgt ctgcaatcag ggaacaagaa aaagacatag cacttaatga aataatccaa 540
cgattgcaac aaattccctt attcaaggaa cattccgcat atataggtaa atgtatcttg 600
aatggattat taatatccaa ctctgacata caagaaattc ccaagatagg aacgatatgt 660
acaagcaata attcatatag aaatgctttg gtatatgatg atgaaaggca ggaaataaag 720
gagctaaata tccttttatc gagattataa 750
<210> 15
<211> 693
<212> DNA
<213> Artificial Sequence
<220>
<223> 15
<400> 15
aaaaagcgtg aatgccaaac tgaccaacgg gcaggcggaa gagatacggg tgagatattc 60
ttccggccag gcttcccaga acagcctggc aaaacagtac ggcgtcagcc gccagacggt 120
aagcgcgata atacgataca agaaatatat acgataatgg acgaggaaga aatttggaaa 180
gatattcatc attacgaggg aatttatcaa gtaagctcct gcggtagaat tagaagtgtc 240
ggaagatatg tccgtaatgc cacatcccaa tattggagga acggacaaat catcaaaccg 300
tgggtcgggg gtacatcccc gtattacaat gtttctttgg cctctgacgg aaaaatatgt 360
aaaaaattaa tccatagact tgtcgcagaa cattttcttg atgattggaa tgcggcaaag 420
gaggttaatc ataaggatgg caataagcac aataatcgaa gtgacaacct ggaaatgtgt 480
accaggcaag aaaacgtcat gcattctatg gtgcataaac tcagggatga ttatggagag 540
aacagtgtga acgccaaact gacaaatgaa caagcggatc atatcaggcg gttacaccgg 600
tcgggagtca tgcaaaatga actggctgaa caattcaagg tttgcaaaca gacgatatgc 660
gatatcgtcc actataaaaa gtataaaaaa tga 693
<210> 16
<211> 288
<212> DNA
<213> Artificial Sequence
<220>
<223> 16
<400> 16
gatctcgtgc aggtcattct gcaccgtgtt gagctgcatc atggtcgcct cgaacacgga 60
cttgtccagc ttcatggcgt tgatgcggtc atactggttc ttgatttcca cttccaaacc 120
gatacatttg gtctccagtt ctgcaatctg ggccgtgttg ttcacatgct gtatgtacag 180
tgtcagcgag aacgaaagta ccacgacgat aatcttgaag tacttcacta caaattcctt 240
gaattgttcc atatcattat tccattaaaa gtgagaatgc ctccctga 288
<210> 17
<211> 858
<212> DNA
<213> Artificial Sequence
<220>
<223> 17
<400> 17
atggaatcat caatcaagga caaatacatc atcttgggct ttgtcggctt cgccatcgtc 60
ctaatatctt ccattgccac gctggtaata gcggacagct tcaaccaaga caactttgtc 120
aggtggatag tattcgtatg ctgtaacctg ttgggatggt tgctctatct ctcctttcag 180
acacttatct ttgatacata cgaaatctac aaaatcaagt tcggcaagaa agaaacgatt 240
gccgaagcca tagaggtgca ggaagaactg tcacaaaata cacttgaaga agccacatct 300
gtgcctggac ctacatcagt ccctgagcct gtacccgaat catccccgac aaaagaagag 360
acacttatcc aaacacaacc gatagagctt actatcgccc cggatcttca cgaaaagaac 420
cgtgccaatt acgcaagcag agagcaacgg gaaaaggaag agcgcatccg catggtcatg 480
gagtattgcc attattacct gcctcgcatt gccgaccaag aaaccgtgaa ccacatctgt 540
actgaggtgg acaaatggat gaatcttaac acttataccc cgaagcccat acaaagaccg 600
tttaccaaag acatcaacaa cattccactc cgtcacttcg tatggaatat ctctgagcgt 660
ttcctgtaca agagatacta caatggggat aaccgtgcca agttcatcaa agcccttttc 720
ccgaaatcgt ttgctgatac agacttatca accatcaaga atttcaaggt agagccgtta 780
aagacggaaa ttcccattga tgaacccgaa aacggcaaac ttgatttcca ctatcccgag 840
gattatgtgc ggaattag 858
<210> 18
<211> 936
<212> DNA
<213> Artificial Sequence
<220>
<223> 18
<400> 18
atgaaagcaa ccagaaaatg cagtttttgc ggcaagtcct ttgtaacccg aagcggtatg 60
caaagatatt gcagtgaggc ttgtcaggca gaagccaaac gagccagagt gatgcagaag 120
aacaacctct tcaaagtcgc ccaacccttg atggagatac agcatcagga gtatctcacc 180
ttttccaaag cagccatcct catgggctgt tcccgacagt acatttacaa acttgtagcc 240
atcggcaagc tgaaagcctc acgcatcagc aaccgcatgg cattcatccg cagagccgac 300
atcgagcaga tgttggaggg caatccctat caccgcatcc tgcccggcaa cacctccaca 360
ccaaggaaat catcttcatc ttccttacct gccaaaagag aaaaaaggga aaaggaaagc 420
gaagaagtgt tggacttcta ttcgggcgag gaggtgatgt ccctttttaa ggtaaagcag 480
tcatggcttt acacttccgc caagcgtaac catatcccca tctgccgtat cgcaggaaag 540
aactattaca gcaagaagca tattgacgag tttttcggtg tggcagttga tattagcgaa 600
attaccgact ggctactgac cgaggaggtg gaggaactgt tcggcatgaa gccgaccgca 660
ctccgtgcct acacctatcg ccataagata cccactaaaa gagagtacgg gcgtacctat 720
tactccaaat cacatttgaa cgaactccgc agaactgacc ttgtgaacga tgaacgctac 780
tataccgttg agcaggtgca gcaaatctat ggtctttcgt cagccaacat ctgccatatc 840
gtcaaggtga agcacatcga aaagataaag gtgggtgtga aaaacctgct tttgcgctca 900
gatgtggagc gtgtcatggc tgaaaggaac aaataa 936
<210> 19
<211> 1002
<212> DNA
<213> Artificial Sequence
<220>
<223> 19
<400> 19
agatattctc gtcaaacaaa tataaataat ataaacatgg aaaaaaacag aaaaaaacaa 60
atcgtagttt tgagtatagc tttagtttgc attttcatct tggtattttc attgttccat 120
aaatcagcga caaaagatag cgcaaatcct cctttaacaa atgttttgac tgatagcatt 180
tctcaaattg tctcagcttg tcctggcgaa attggtgtgg cggttattgt taataacaga 240
gatacggtta aggtcaataa taagagtgtt tatcctatga tgagtgtgtt taaggttcat 300
caggcattag ctctttgtaa tgactttgac aataaaggaa tttcacttga taccttagta 360
aatataaata gggataaact tgacccaaag acttggagtc ctatgctgaa agattattca 420
gggccagtca tatcattgac agtgagagat ttgctgcgtt atactcttac tcagagtgac 480
aacaatgcaa gcaaccttat gtttaaggat atggttaatg tcgctcaaac agatagtttt 540
atagccacac tcattcctcg ttcaagtttt cagatagctt atacggaaga ggaaatgtcg 600
gctgaccata acaaggctta ctctaactat acatctcctc ttggtgctgc aatgttgatg 660
aatcgtttgt ttactgaagg tcttatcgat gatgagaaac aaagtttcat taagaatacg 720
ttaaaagaat gcaaaacagg tgtagatagg atagcagctc cacttcttga taaagaaggg 780
gttgttatag cgcataagac aggttcaggt tatgttaatg aaaatggtgt tcttgcagct 840
cacaatgatg ttgcctatat atgtctgcct aataatatca gttatacctt agcggtattt 900
gttaaggatt tcaagggaaa tgaatcacaa gcgtcacaat atgttgcgca tatatcagct 960
gtagtatatt ctttattaat gcaaacttca gtaaaatctt aa 1002
<210> 20
<211> 450
<212> DNA
<213> Artificial Sequence
<220>
<223> 20
<400> 20
cgtgtcgtgg agatattcac ggatatatca tttcagtcct ttgcgccaag tcttacaaaa 60
gagacgagta cgcgaatgga aaaatcaatt cttaccttca acgacctccc cgaggttgtc 120
gctcagcttc gagacgaagt gatgagcctg aaaagcctgc tcgccgagca gcgcagtgtg 180
aacaatgcca aaacggtgga cacccacgtg cccatgtctg tggacgaggc agcagagtat 240
ttaggtatcc ctaagggtac gctctacatg aaactgtcag aagggacaat ccctgccacc 300
aagcccggca aacgctattg cctttaccgt gacgaactgg acaagtggct ggaaaccgcc 360
cgaaagaatc ccataccgtt gtcagacgag gaactgaaca agtccttatc ctcttcccac 420
cgtcgcaagc ccaacccacg taactggtga 450
<210> 21
<211> 1131
<212> DNA
<213> Artificial Sequence
<220>
<223> 21
<400> 21
atgggcaatt attcattaca gaagtataaa ggaacggcaa cacggcatac ctgccccaaa 60
tgcggagaca ggcattcttt cgtctattac gtggacgaaa ataatgtgcc gttgcatcca 120
tcggtcggca gatgtaacca cgaaagcggt tgtgggtatc actacactcc gaaagagtat 180
tttcaagagc atcctgaaca cagaactacc aatgatttct cttttgacag gcaaagagca 240
gagcagaaga aagtgaagca gcaaagtaag ccgacagcca tcggctatat tccccctcac 300
tatgtggaga agtcgcaaag cgagcgtagc aatttcttcc gtttcctctt cacactcctt 360
acttcctact atggcgacaa ggcgaaagag gtgttgaagc ggttgttgga ggaataccgt 420
ttgggggcta cccgtgacgg ctctgttatc ttttggcaga tagacaggac gggcaaggta 480
cgcacgggaa aggtacgcac gggaaaggtg atgcagtaca atcccgaaga cggacaccgt 540
atcaagggag gacagacatc ggcagtgaac tggatacaca gcatattgaa aaagcagcgt 600
gtgttggcag aggattggca actatcccaa tgccttttcg gggaacactt gttgaaaacg 660
catcccgaca aggtggtggt cttggtggaa tccgagaaga gtgccgttat cggttctgct 720
atcttccccg attatgtatg gctggctacg ggtggtaaga gtcagatgag agaagagaaa 780
ctccgtgtac tgtcagggcg aaccgtgctt ctctttcccg atgccgatgc ttatgccgag 840
tggaaacagc gagccgagag catgtacttt tgtaaggtgg tggtttcgga catcatcgaa 900
aggaatgcca ccccgaaaca aaaagaagcc catatcgaca tagccgattg gattatcttt 960
cagatacggg agggcaaggt gatgagtaca gccaaccact tggtcgaggc tgagagaatc 1020
ctccagcgga tgatagagaa gaatcccgtc ctgcaaaaac tgatagacga tttagacctt 1080
gtgctggtcg gtgcatctcc aatcggcaac gatgatgaaa aacctccctg a 1131
<210> 22
<211> 1104
<212> DNA
<213> Artificial Sequence
<220>
<223> 22
<400> 22
aatgatatgg aagaggataa gaactatatc aacctgatac gtggcgacct cacaaaagca 60
tcccaagcgc ataacggtat gcccgacagt gtaggcatga tgaatatcaa gacggcaaac 120
caaaccattc ttgaagcatc gttattgcct acgccccgtg cgctgtggga cagcttttgg 180
tacgaggggg aactctcctg cttgtttgcc gattccaacg tgggcaagtc catccttgcc 240
gtgcagatag ccgaccgcat cgcccgaacc gacaatgtgc tgtatctgga ctttgaactg 300
tccgaaaagc agttccagct ccgctatacc aacgagcatg gagagctcta cacctttccc 360
gacaaaatct atcgggtgtc tattgactgc aaccagcttt tggatgccaa ctttgaggaa 420
gctatcatag gcggcattga acagatggct gtgcagaccg actgcaagat tttcatcatt 480
gacaatctta cctacctgtg ttgcgccatg gagaaaggcg atgccgcagg acggctgatg 540
attcagctga acaatctcaa aaagagatat gcgctctcta tccttgtcct agcacatacg 600
cccaaacgct ctttggattg tcccatcaca tccaacgacc ttgccggaag caaacggctc 660
tacaatttct ttgacagcgt gttcaccatt ggaaaaagtg cccaagacgg agggcttcgc 720
tatgtgaagc agcttaaagt gcgctatggc acgttctctc atgatgcgga taatgtaatc 780
gtttacgaga ttgacaaggt ggatgctttc ttgcagttcg tgttcagggg ctattccacg 840
gaaaaggaac acttgaaaaa attgggcgac aatgaatcaa gccaaaggga ttgccaaatt 900
ctgcaactct cccaatcggg caagtccgtc agggagatag cctcacaggt gaattgtggc 960
aagtccaccg taaaccgtat catccagcgc agcaaagaga gtaaaaacgc aggtgtccca 1020
agtgtcccac tgtcccaacc cttagagtgt gggacaatgg gacaggatgg gacagccgac 1080
aatcaaccat caaaaacgga ctaa 1104
<210> 23
<211> 297
<212> DNA
<213> Artificial Sequence
<220>
<223> 23
<400> 23
gagacaggac ccgtacttcg taattgctgc gcccatcatt caagactgtc aaatcgggtc 60
tttcctgtca agccaatgat gcctatgcgt atgccaaaca catggattac ggatttctcg 120
ttccgtgaac aaacacttta tccgcaactc tgctatgtgg tgtattggct taactccatt 180
tctatgggca acacttttgt tgcagatttc aagcagcttt tatcgaaata cccatcagta 240
agaactcgtt tattaggctt tcctcataat tgggaacaag agcctttgtg gagataa 297
<210> 24
<211> 1560
<212> DNA
<213> Artificial Sequence
<220>
<223> 24
<400> 24
atgacccact cagggcgttt ctcccctgag aacccagagc aaagagtgac cctctctttg 60
caatctccgc ttatgggttg cacccctaag aaccccatgc gtttacggac agcggaaaag 120
caaacaataa agtacaaacc caaaaaacaa gtatctatgg caacaaaatc aagcatacat 180
atcaagccct gcaatatcgc atcgagtgag gctcacaaca ggaggactgc cgaatacatg 240
cgccacatcg gagagtccag aacctatgtg gttccagaac tctccaccga taatgagcag 300
tggataaatc ccgacttcgg cagtccggat ttgcggatgc attatgacaa tatcagacag 360
atggtaaagg aaaagaccgg acgtgccatg caggaaaagg agcgtgaacg caaaggcaag 420
aacggtaaaa tagtcaagat tgcgggatgc tcccccatac gtgaaggagt gctgcttgtc 480
aggtcggaca ccacactggc agacgtgcgt aaattcggtg aggagtgtca aagacgctgg 540
ggaatcacac cgctgcaaat cttcctgcac aaggatgaag ggcattggct gaacggtcag 600
ccggaagcgg aagacaggga aagcttcaaa gtcggggaca gatggttcaa gccgaactat 660
catgcccata tcgttttcga ctggatgaac cacgaaacag gaaagagccg aaagctcaat 720
gacgatgaca tgatgcagat gcagaccctt gcatccgaca tcctgctgat ggaacgcggg 780
cagtcaaagg ctgtcactgg taaggagcat ctggaacgga acgactttat cattgagaag 840
cagaaagctg aactgcaacg catggatgca gccaaacggc acaaagaaga acagataaat 900
cttgccgagc aggaactgaa acaggtgaaa tcagaaatac gcactgacaa gttaaagaag 960
acagccacca cggcagcgac agccataact agtggagttg cttctctttt cgggagtgga 1020
aaactgaaag aactggaacg tgccaacgaa aaactgcaag acgaggtttc aaaacggaac 1080
accaatattg aaaaattgca gagccaagta cagcagatgc agaaacagca tgatacgcaa 1140
atccacaatc tcagagaaat gcacaggcag gaacttgaca tgaaagaaaa agaactgtca 1200
cggctcgcca gaatcataga caaggctttc aggtggtttc cgatgttcag ggaaatgctg 1260
cgcatggaaa agttttgtgc catgctggga ttctctaaag aaatgactga aagtcttata 1320
gtcaaaaaag aagccctgaa atgtagcggt aaaatctatt ccgagcaaca caggcggaac 1380
tttgatataa aggatgatat tttaagggtg gaaaatgacc ctgacgatga aagcaggctg 1440
aacctgacaa taaacaggaa gccgattgcc gactggttca gggagcaatg gcacaggctt 1500
agatatggag caagagtgcc gcaacaggaa gaaagaaaaa gtagaggatt caaattataa 1560
<210> 25
<211> 3294
<212> DNA
<213> Artificial Sequence
<220>
<223> 25
<400> 25
atgaaagaca gaaagaattc aagtctgtta cgtcgtttgg agaagttcca gcggcttttc 60
ttcgttgctt tgttatccgt attggctgta ggggcctttg cacagagcaa aaccgtttcg 120
ggtactgtcc ttgacaaaac aggtgagtct gtaatcggtg ccagtgtggt ggtgaaaggt 180
actaccaatg gtacaattac cgactttgat ggtaagttca cacttcagaa tgttcctgat 240
aatggaacga tccaagtaag ttttgtgggg tacaagaccg tagatatcca agtgaaagga 300
caatctaccg ttaaaataat cttggaggag gataccgaaa cactggatga agtggtagtg 360
gttggttatg gtgttcagaa aaaaagtgat gtgactggtg ctatggcacg tgttacgagt 420
aaggttatag aggatcgtcc tgttcaaaat gctttgcagg ctatgcaagg acgtgtgaca 480
ggtgtggata ttacgtctaa taatcgtcct ggtgagttgg gcgatattcg tattcgtggt 540
aatcgttctt taactgcgga taataatcct ttatatgtta ttgacggaat acctatgtca 600
gcaggttcga ttgctgatgt taatccgagt gatattgaat ctatggaaat tttgaaagat 660
gcttctgcta ccgctattta tggctctcgt ggtgctaatg gtgttatctt ggtgacaacc 720
aaaaaaggta aaacgggtag aactactatt aattatgatg gctcatttag ttttggtttc 780
ttggattcaa caactgatta tatgaattct ggtcaattgt tggattataa tcgtcagtca 840
gctattacgg gtggtactta taatggtaga tatggtgaca accctgatcc tgagcgtgat 900
aaagctttat ggctgaatcc caacaatatg tcatatatgg ataaacgatt ggaaaaagta 960
tatcagcaaa atgctgatgg aacttattct tatgatcctt cacaattaga aacaactgat 1020
tggggcgaat tggtgacacg tacagcattt actcataatc atcagatttc tctttcagca 1080
ggaacggaaa cttccaaatt gtatgtatca ttgggatatt tggatcagaa agtacctatg 1140
aaagaccaag atttcaaacg ttatacagcc aatataaacg gtgaaattat tccgactaaa 1200
tggttgaaag tgggaatggg attgaatgct actcattcta ttaaaaatta tggtattgta 1260
agtaatacaa gtaatacagg agcaaaagac tcttatggtt tggctatgga tatgatgcca 1320
tgggtaccgg cttataatga agatggttct atactggagg ttgcaagtgc cgatgatcag 1380
gcttatcata atcctttgag aaatatagat gatgcttgga atgaaacacg ttattatggc 1440
gtgaacttct cttcttatgc agaattggat tttggacaat tttgggaacc tttgaaaggt 1500
gtaaaatggc gtacgaattt aggcgctcaa tatcgtaact cccgtgtggg tagttattat 1560
ggtgagggat atactaatcc ttttaaaaat cctgcaatgg ctcctaatgt agccaataat 1620
gagcacagtc agaagttgtc atggacattg gaaaacttgc tgtatatcaa taaaacaata 1680
aaagatattc attcggtaaa tattactttg ttgcaatcag ctgaacgtta tcgtactgaa 1740
gggttgaaca tgcgtggata tgaaatcaca tttccttctt ctttgtggta taatattggt 1800
gcatcgaata atgcaaaata tgctccaggc tccaattttt ctacttggtc aagagcttct 1860
tatatggcac gtgtgaatta tggattgatg gataaatatt tgttgactgt taccggacga 1920
tttgatggcg cttctatgtt ggctgctgga aacaaatggg atttctttcc ttctgctgca 1980
ttggcatggc gtatggaaca agagaaatgg atacagcaaa ttaattggat taaccaatta 2040
aaacttcgtg taggatatgg tgttacaggt aattctgctg ttaatcctta tcaaacagca 2100
ggttctgtta cttctaccta tgctagcatc ccatttggag tgggcaatgt ttcgtcgaat 2160
actattggta caaagactaa tattatgcct aactattctt taggttggga aaaaacttca 2220
tctttaaatg ttggtgttga ttttggagtc ttggagaatc gtattagtgg tagtgttgaa 2280
tattatattg ctaagacttc tgatttgctg atgaatcagt ctattccggt aattaccggt 2340
tatgcacaaa ttttgaataa tgtaggtaag acagaaaata gaggttttga agtttcgttg 2400
tcaactgtaa atgttaaaac aaaagacttc acatggcaaa cggattggac tttctctttg 2460
aataatgaaa aaattaaaga attggccggt ggtgctacgt atgattcaac aggtccttgg 2520
atggtgggtg agcctttgaa tagtttttat gatttccagt atgaccgcat ttggcaaaat 2580
actcaggagg ataatcattt gatggatgtt tatcgttctt tgggattgac tttccttcct 2640
ggacaatata agattgtgga tcaaccatta gttgaagttc cacaaggtac agaaggatca 2700
aagactgtag aaataaaaga tgctgcaggt aataaaacag gtgaagttgt ttcctatatg 2760
gataatggat ttggtaaatt tgatgataat gataagaaaa tttataataa atctcctaaa 2820
tggacaggcg gtatcaataa ttcatttacc tataagaact ggaatttgag cttctttact 2880
tattttcgat ttggtaatac ttattatggt ctgacccaga ctattggtcg tcgaattgaa 2940
aaagatacat ggtcaccaac taatacagat gcaaagtttg ctcagcctac tactgcaact 3000
cgtgaaacta aatatgacta tgtaagaaat tatacaaaag gaaatatggt tcttataaag 3060
aatatagctt tgtcttatac agttcctcaa agttggttga agaagtgtgg tgcaagcagt 3120
gcacaggtat atgctcaggt attgaatccg ttcctttttg gtggagaatt ggttaaagct 3180
ggtattaatc cggatgattt gactggttgg gatgcaggta atcatattgg tggacaaact 3240
aataatactt gtattactcg cagtcttgtt ttgggagtaa gattgggctt ctaa 3294
<210> 26
<211> 165
<212> DNA
<213> Artificial Sequence
<220>
<223> 26
<400> 26
ttgcacattc taaaaggtga agatttaacg cttttattga ttattaactc aaaaaggaca 60
tcaacttggg tcgtttcttc tcttttcctt gctattcgtt tccgatattc cacttttgtt 120
ttggtctatc tcatatgtac tgcaaaggta ttgatttttg tttga 165
<210> 27
<211> 402
<212> DNA
<213> Artificial Sequence
<220>
<223> 27
<400> 27
ggctttcagc ttgccgatgg ctacaagttt gtaaatgtac tgtcgggaac agcccatgag 60
gatggctgct ttggaaaagg tgagatactc ctgatgctgt atctccatca agggttgggc 120
gactttgaag aggttgttct tctgcatcac tctggctcgt ttggcttctg cctgacaagc 180
ctcactgcaa tatctttgca taccgcttcg ggttacaaag gacttgccgc aaaaactgca 240
ttttctggtt gctttcatac cgttttatcg tttaatggtt catttcttca atcctatatc 300
tctgaaatgg taaacggatg tgaacggaag tcaaccattg tcgcttttct acacagtgtg 360
actgtttccg catatcgggg cggttattgt cgcttgtcgt aa 402

Claims (13)

1.一种试剂盒,其特征在于,包括适于检测第一基因集中的至少一个基因的试剂,所述第一基因集由以下基因组成:S100_GI_0002354、S100_GI_0002360、S100_GI_0002362、S100_GI_0002364、S100_GI_0002366、S100_GI_0002373、S100_GI_0002377、S100_GI_0002402、S100_GI_0002408、S100_GI_0002410、S100_GI_0008128、S100_GI_0030720、S10_GI_0005425、S186_GI_0019691、S24_GI_0044455和S254_GI_0026483,其中,所述第一基因集中的基因与SEQ ID NO:1-16所示的核酸序列一一对应,所述第一基因集中的基因与其对应的SEQ ID NO:1-16中的序列具有不小于90%的同一性。
2.根据权利要求1所述的试剂盒,其特征在于,进一步包括适于检测第二基因集中的至少一个基因的试剂,所述第二基因集由以下基因组成:S100_GI_0015747、S101_GI_0002517、S152_GI_0024776、S15_GI_0022087、S258_GI_0009120、S47_GI_0011838、S81_GI_0011061、S103_GI_0016687、S118_GI_0008214、S257_GI_0026750和S57_GI_0025049,其中,所述第二基因集中的基因与SEQ ID NO:17-27所示的核酸序列一一对应,所述第二基因集中的基因与其对应的SEQ ID NO:17-27中的核酸序列具有不小于90%的同一性。
3.根据权利要求1所述的试剂盒,其特征在于,包括适于检测所述第一基因集中全部所述基因的试剂。
4.根据权利要求2所述的试剂盒,其特征在于,包括适于检测所述第二基因集中全部所述基因的试剂。
5.试剂在制备试剂盒中的用途,所述试剂适于检测第一基因集中的至少一种基因,所述试剂盒用于诊断炎症性肠病或者检测炎症性肠病的治疗效果,所述第一基因集由以下基因组成:S100_GI_0002354、S100_GI_0002360、S100_GI_0002362、S100_GI_0002364、S100_GI_0002366、S100_GI_0002373、S100_GI_0002377、S100_GI_0002402、S100_GI_0002408、S100_GI_0002410、S100_GI_0008128、S100_GI_0030720、S10_GI_0005425、S186_GI_0019691、S24_GI_0044455和S254_GI_0026483,其中,所述第一基因集中的基因与SEQ IDNO:1-16所示的核酸序列一一对应,所述第一基因集中的基因与其对应的SEQ ID NO:1-16中的序列具有不小于90%的同一性。
6.根据权利要求5所述的用途,其特征在于,所述试剂进一步适于检测第二基因集中的至少一种基因,所述第二基因集由以下基因组成:S100_GI_0015747、S101_GI_0002517、S152_GI_0024776、S15_GI_0022087、S258_GI_0009120、S47_GI_0011838、S81_GI_0011061、S103_GI_0016687、S118_GI_0008214、S257_GI_0026750和S57_GI_0025049,其中,所述第二基因集中的基因与SEQ ID NO:17-27所示的核酸序列一一对应,所述第二基因集中的基因与其对应的SEQ ID NO:17-27中的核酸序列具有不小于90%的同一性。
7.一种用于预防或者治疗炎症性肠病的药物组合物或者食品组合物,其特征在于,含有提高第一基因集中的至少一种基因丰度的物质,所述第一基因集由以下基因组成:S100_GI_0002354、S100_GI_0002360、S100_GI_0002362、S100_GI_0002364、S100_GI_0002366、S100_GI_0002373、S100_GI_0002377、S100_GI_0002402、S100_GI_0002408、S100_GI_0002410、S100_GI_0008128、S100_GI_0030720、S10_GI_0005425、S186_GI_0019691、S24_GI_0044455和S254_GI_0026483,其中,所述第一基因集中的基因与SEQ ID NO:1-16所示的核酸序列一一对应,所述第一基因集中的基因与其对应的SEQ ID NO:1-16中的序列具有不小于90%的同一性。
8.一种确定个体是否患有炎症性肠病的方法,其特征在于,包括:
(1)确定所述个体的粪便样本中标志基因的丰度,所述标志基因包括第一基因集和第二基因集中的至少一种基因;
(2)将步骤(1)中得到的所述丰度与预定的阈值进行比较,以便确定所述个体是否患有炎症性肠病;
其中,所述第一基因集由以下基因组成:S100_GI_0002354、S100_GI_0002360、S100_GI_0002362、S100_GI_0002364、S100_GI_0002366、S100_GI_0002373、S100_GI_0002377、S100_GI_0002402、S100_GI_0002408、S100_GI_0002410、S100_GI_0008128、S100_GI_0030720、S10_GI_0005425、S186_GI_0019691、S24_GI_0044455和S254_GI_0026483,其中,所述第一基因集中的基因与SEQ ID NO:1-16所示的核酸序列一一对应,所述第一基因集中的基因与其对应的SEQ ID NO:1-16中的序列具有不小于90%的同一性;
所述第二基因集由以下基因组成:S100_GI_0015747、S101_GI_0002517、S152_GI_0024776、S15_GI_0022087、S258_GI_0009120、S47_GI_0011838、S81_GI_0011061、S103_GI_0016687、S118_GI_0008214、S257_GI_0026750和S57_GI_0025049,其中,所述第二基因集中的基因与SEQ ID NO:17-27所示的核酸序列一一对应,所述第二基因集中的基因与其对应的SEQ ID NO:17-27中的核酸序列具有不小于90%的同一性。
9.根据权利要求8所述的方法,其特征在于,步骤(1)进一步包括:
获得所述个体的粪便样本中的核酸测序数据;
将所述测序数据与参考基因组进行比对;
基于所述比对的结果,确定所述标志基因的丰度。
10.一种确定个体是否患有炎症性肠病的装置,其特征在于,包括:
丰度确定单元,用于确定所述个体的粪便样本中标志基因的丰度,所述标志基因包括第一基因集和第二基因集中的至少一种基因;
比较单元,用于将所得到的所述丰度与预定的阈值进行比较,以便确定所述个体是否患有炎症性肠病;
其中,所述第一基因集由以下基因组成:S100_GI_0002354、S100_GI_0002360、S100_GI_0002362、S100_GI_0002364、S100_GI_0002366、S100_GI_0002373、S100_GI_0002377、S100_GI_0002402、S100_GI_0002408、S100_GI_0002410、S100_GI_0008128、S100_GI_0030720、S10_GI_0005425、S186_GI_0019691、S24_GI_0044455和S254_GI_0026483,所述第一基因集中的基因与SEQ ID NO:1-16所示的核酸序列一一对应,所述第一基因集中的基因与其对应的SEQ ID NO:1-16中的序列具有不小于90%的同一性;
所述第二基因集由以下基因组成:S100_GI_0015747、S101_GI_0002517、S152_GI_0024776、S15_GI_0022087、S258_GI_0009120、S47_GI_0011838、S81_GI_0011061、S103_GI_0016687、S118_GI_0008214、S257_GI_0026750和S57_GI_0025049,所述第二基因集中的基因与SEQ ID NO:17-27所示的核酸序列一一对应,所述第二基因集中的基因与其对应的SEQID NO:17-27中的核酸序列具有不小于90%的同一性。
11.根据权利要求10所述的装置,其特征在于,所述丰度确定单元适于通过下列步骤确定所述丰度:
获得所述个体的粪便样本中的核酸测序数据;
将所述测序数据与参考基因组进行比对;
基于所述比对的结果,确定所述标志基因的丰度。
12.一种装置,其特征在于,包括:
计算机可读存储介质,其上存储有计算机程序,所述程序用于执行权利要求8或9所述的方法;
以及一个或者多个处理器,用于执行所述计算机可读存储介质中的程序。
13.一种筛选药物的方法,其特征在于,所述药物用于治疗或者预防炎症性肠病,所述方法包括:
将候选药物施用于受试者,
检测施用前后,所述受试者粪便中标志基因的丰度,所述标志基因包括第一基因集和第二基因集中的至少一种基因,
其中,满足下列条件至少之一的候选药物适于用于治疗或者预防炎症性肠病:
(1)进行所述施用后,所述第一基因集中的至少一种基因的所述丰度升高;和
(2)进行所述施用后,所述第二基因集中的至少一种基因的所述丰度降低;
其中,所述第一基因集由以下基因组成:S100_GI_0002354、S100_GI_0002360、S100_GI_0002362、S100_GI_0002364、S100_GI_0002366、S100_GI_0002373、S100_GI_0002377、S100_GI_0002402、S100_GI_0002408、S100_GI_0002410、S100_GI_0008128、S100_GI_0030720、S10_GI_0005425、S186_GI_0019691、S24_GI_0044455和S254_GI_0026483,所述第一基因集中的基因与SEQ ID NO:1-16所示的核酸序列一一对应,所述第一基因集中的基因与其对应的SEQ ID NO:1-16中的序列具有不小于90%的同一性;
所述第二基因集由以下基因组成:S100_GI_0015747、S101_GI_0002517、S152_GI_0024776、S15_GI_0022087、S258_GI_0009120、S47_GI_0011838、S81_GI_0011061、S103_GI_0016687、S118_GI_0008214、S257_GI_0026750和S57_GI_0025049,所述第二基因集中的基因与SEQ ID NO:17-27所示的核酸序列一一对应,所述第二基因集中的基因与其对应的SEQID NO:17-27中的核酸序列具有不小于90%的同一性。
CN202111666810.7A 2021-12-31 2021-12-31 炎症性肠病标志基因及其应用 Pending CN114517228A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111666810.7A CN114517228A (zh) 2021-12-31 2021-12-31 炎症性肠病标志基因及其应用

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111666810.7A CN114517228A (zh) 2021-12-31 2021-12-31 炎症性肠病标志基因及其应用

Publications (1)

Publication Number Publication Date
CN114517228A true CN114517228A (zh) 2022-05-20

Family

ID=81596712

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111666810.7A Pending CN114517228A (zh) 2021-12-31 2021-12-31 炎症性肠病标志基因及其应用

Country Status (1)

Country Link
CN (1) CN114517228A (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105368944A (zh) * 2015-11-23 2016-03-02 广州基迪奥生物科技有限公司 可检测疾病的生物标志物及其用途
CN107217089A (zh) * 2016-03-22 2017-09-29 浙江中医药大学 确定个体状态的方法及装置
CN109477145A (zh) * 2016-07-05 2019-03-15 剑桥企业有限公司 炎症性肠病的生物标志物
CN113122646A (zh) * 2020-01-15 2021-07-16 中国科学院昆明动物研究所 炎性肠病特异性肠道微生物检测靶标及其应用

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105368944A (zh) * 2015-11-23 2016-03-02 广州基迪奥生物科技有限公司 可检测疾病的生物标志物及其用途
CN107217089A (zh) * 2016-03-22 2017-09-29 浙江中医药大学 确定个体状态的方法及装置
CN109477145A (zh) * 2016-07-05 2019-03-15 剑桥企业有限公司 炎症性肠病的生物标志物
CN113122646A (zh) * 2020-01-15 2021-07-16 中国科学院昆明动物研究所 炎性肠病特异性肠道微生物检测靶标及其应用

Similar Documents

Publication Publication Date Title
CN107217089B (zh) 确定个体状态的方法及装置
WO2016050110A1 (en) Biomarkers for rheumatoid arthritis and usage thereof
CN107217088B (zh) 强直性脊柱炎微生物标志物
CN114182007B (zh) 白塞病标志基因及其应用
WO2017156739A1 (zh) 分离的核酸及应用
CN113913490A (zh) 非酒精性脂肪肝标志微生物及其应用
CN105671177B (zh) 强直性脊柱炎标志物及应用
CN105733988B (zh) 组合物及应用
CN107217086B (zh) 疾病标志物及应用
CN114517228A (zh) 炎症性肠病标志基因及其应用
CN114836508A (zh) 慢性阻塞性肺病标志微生物及其应用
CN114381493A (zh) 炎症性肠病标志微生物及其应用
CN109072278A (zh) 分离的核酸及应用
CN113930479B (zh) 系统性红斑狼疮标志微生物及其应用
CN114317784B (zh) 白塞病标志微生物及其应用
CN114107484B (zh) 溃疡性结肠炎标志基因及其应用
CN114317674B (zh) 类风湿性关节炎标志微生物及其应用
CN114262743B (zh) 中风标志微生物及其应用
CN114085886B (zh) 儿童克罗恩标志微生物及其应用
CN113999923B (zh) 小柳-原田综合症标志微生物及其应用
CN114703269A (zh) 慢性阻塞性肺病标志基因及其应用
CN114703270A (zh) 精神分裂症标志基因及其应用
CN114517235A (zh) 肌痛性脑脊髓炎标志基因及其应用
CN114517227A (zh) 急性腹泻标志基因及其应用
CN114446387A (zh) 脂肪肝标志基因及其应用

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination