CN114107484A - 溃疡性结肠炎标志基因及其应用 - Google Patents
溃疡性结肠炎标志基因及其应用 Download PDFInfo
- Publication number
- CN114107484A CN114107484A CN202111494171.0A CN202111494171A CN114107484A CN 114107484 A CN114107484 A CN 114107484A CN 202111494171 A CN202111494171 A CN 202111494171A CN 114107484 A CN114107484 A CN 114107484A
- Authority
- CN
- China
- Prior art keywords
- genes
- gene
- ulcerative colitis
- abundance
- seq
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 108090000623 proteins and genes Proteins 0.000 title claims abstract description 454
- 206010009900 Colitis ulcerative Diseases 0.000 title claims abstract description 125
- 201000006704 Ulcerative Colitis Diseases 0.000 title claims abstract description 125
- 239000003550 marker Substances 0.000 title claims abstract description 66
- 239000003153 chemical reaction reagent Substances 0.000 claims abstract description 27
- 238000012163 sequencing technique Methods 0.000 claims description 53
- 238000000034 method Methods 0.000 claims description 36
- 230000002550 fecal effect Effects 0.000 claims description 21
- 239000003814 drug Substances 0.000 claims description 18
- 238000001514 detection method Methods 0.000 claims description 14
- 229940079593 drug Drugs 0.000 claims description 12
- 150000007523 nucleic acids Chemical class 0.000 claims description 12
- 238000012216 screening Methods 0.000 claims description 10
- 230000001965 increasing effect Effects 0.000 claims description 8
- 238000003745 diagnosis Methods 0.000 claims description 7
- 238000003860 storage Methods 0.000 claims description 6
- 235000013305 food Nutrition 0.000 claims description 5
- 239000000126 substance Substances 0.000 claims description 5
- 239000000203 mixture Substances 0.000 claims description 4
- 108020004707 nucleic acids Proteins 0.000 claims description 4
- 102000039446 nucleic acids Human genes 0.000 claims description 4
- 230000002829 reductive effect Effects 0.000 claims description 4
- 238000004590 computer program Methods 0.000 claims description 3
- 230000001225 therapeutic effect Effects 0.000 claims description 3
- 239000003795 chemical substances by application Substances 0.000 claims description 2
- 238000004519 manufacturing process Methods 0.000 claims description 2
- 230000002265 prevention Effects 0.000 claims description 2
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 18
- 201000010099 disease Diseases 0.000 description 13
- 230000000968 intestinal effect Effects 0.000 description 10
- 238000005516 engineering process Methods 0.000 description 9
- 239000002773 nucleotide Substances 0.000 description 8
- 125000003729 nucleotide group Chemical group 0.000 description 8
- 210000001035 gastrointestinal tract Anatomy 0.000 description 7
- 210000004400 mucous membrane Anatomy 0.000 description 6
- 238000010200 validation analysis Methods 0.000 description 6
- 108091028043 Nucleic acid sequence Proteins 0.000 description 5
- 208000025865 Ulcer Diseases 0.000 description 5
- 238000004458 analytical method Methods 0.000 description 5
- 210000001072 colon Anatomy 0.000 description 5
- 244000005700 microbiome Species 0.000 description 5
- 231100000397 ulcer Toxicity 0.000 description 5
- 230000009286 beneficial effect Effects 0.000 description 4
- 239000012634 fragment Substances 0.000 description 4
- 238000012165 high-throughput sequencing Methods 0.000 description 4
- 238000002360 preparation method Methods 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 108020004414 DNA Proteins 0.000 description 3
- 210000004027 cell Anatomy 0.000 description 3
- 238000002474 experimental method Methods 0.000 description 3
- 230000036541 health Effects 0.000 description 3
- 230000003387 muscular Effects 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 238000012795 verification Methods 0.000 description 3
- 101150072531 10 gene Proteins 0.000 description 2
- 101150033839 4 gene Proteins 0.000 description 2
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 2
- 238000007400 DNA extraction Methods 0.000 description 2
- 206010000269 abscess Diseases 0.000 description 2
- 239000000090 biomarker Substances 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 230000001684 chronic effect Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 210000000981 epithelium Anatomy 0.000 description 2
- 235000013376 functional food Nutrition 0.000 description 2
- 230000002068 genetic effect Effects 0.000 description 2
- 230000008595 infiltration Effects 0.000 description 2
- 238000001764 infiltration Methods 0.000 description 2
- 230000003902 lesion Effects 0.000 description 2
- 230000000670 limiting effect Effects 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 210000000440 neutrophil Anatomy 0.000 description 2
- 239000008194 pharmaceutical composition Substances 0.000 description 2
- 102000004169 proteins and genes Human genes 0.000 description 2
- 210000000664 rectum Anatomy 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 230000035945 sensitivity Effects 0.000 description 2
- 239000000344 soap Substances 0.000 description 2
- 241000894007 species Species 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 210000004876 tela submucosa Anatomy 0.000 description 2
- 238000001262 western blot Methods 0.000 description 2
- 101150028074 2 gene Proteins 0.000 description 1
- 101150044182 8 gene Proteins 0.000 description 1
- 208000004998 Abdominal Pain Diseases 0.000 description 1
- 241000186046 Actinomyces Species 0.000 description 1
- 108091026890 Coding region Proteins 0.000 description 1
- 206010009995 Colonic fistula Diseases 0.000 description 1
- 206010012735 Diarrhoea Diseases 0.000 description 1
- 240000008168 Ficus benjamina Species 0.000 description 1
- 208000032843 Hemorrhage Diseases 0.000 description 1
- 206010061218 Inflammation Diseases 0.000 description 1
- 206010023804 Large intestine perforation Diseases 0.000 description 1
- 238000000585 Mann–Whitney U test Methods 0.000 description 1
- 206010054949 Metaplasia Diseases 0.000 description 1
- 108700005443 Microbial Genes Proteins 0.000 description 1
- 108091092724 Noncoding DNA Proteins 0.000 description 1
- 206010030113 Oedema Diseases 0.000 description 1
- 241000283966 Pholidota <mammal> Species 0.000 description 1
- 241000194017 Streptococcus Species 0.000 description 1
- 230000001154 acute effect Effects 0.000 description 1
- 238000007792 addition Methods 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 210000000436 anus Anatomy 0.000 description 1
- 230000000740 bleeding effect Effects 0.000 description 1
- 208000027503 bloody stool Diseases 0.000 description 1
- 210000001124 body fluid Anatomy 0.000 description 1
- 239000010839 body fluid Substances 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000008576 chronic process Effects 0.000 description 1
- 230000008984 colonic lesion Effects 0.000 description 1
- 238000010835 comparative analysis Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 208000002925 dental caries Diseases 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 210000003979 eosinophil Anatomy 0.000 description 1
- 230000003628 erosive effect Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 210000003608 fece Anatomy 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000003890 fistula Effects 0.000 description 1
- 238000012268 genome sequencing Methods 0.000 description 1
- 210000004907 gland Anatomy 0.000 description 1
- 210000002175 goblet cell Anatomy 0.000 description 1
- 210000004209 hair Anatomy 0.000 description 1
- 208000035861 hematochezia Diseases 0.000 description 1
- 210000003405 ileum Anatomy 0.000 description 1
- 208000027866 inflammatory disease Diseases 0.000 description 1
- 230000002757 inflammatory effect Effects 0.000 description 1
- 230000004054 inflammatory process Effects 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 210000004347 intestinal mucosa Anatomy 0.000 description 1
- 210000002429 large intestine Anatomy 0.000 description 1
- 239000007788 liquid Substances 0.000 description 1
- 210000004698 lymphocyte Anatomy 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 210000004379 membrane Anatomy 0.000 description 1
- 239000012528 membrane Substances 0.000 description 1
- 230000015689 metaplastic ossification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 210000001616 monocyte Anatomy 0.000 description 1
- 210000004877 mucosa Anatomy 0.000 description 1
- 229910052757 nitrogen Inorganic materials 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000001717 pathogenic effect Effects 0.000 description 1
- 230000036285 pathological change Effects 0.000 description 1
- 231100000915 pathological change Toxicity 0.000 description 1
- 210000004180 plasmocyte Anatomy 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000003908 quality control method Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 231100000241 scar Toxicity 0.000 description 1
- 238000002864 sequence alignment Methods 0.000 description 1
- 208000024891 symptom Diseases 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 210000001519 tissue Anatomy 0.000 description 1
- 201000002516 toxic megacolon Diseases 0.000 description 1
- 108700026220 vif Genes Proteins 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6876—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
- C12Q1/6883—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/46—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
- C07K14/47—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B30/00—ICT specially adapted for sequence analysis involving nucleotides or amino acids
- G16B30/10—Sequence alignment; Homology search
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/136—Screening for pharmacological compounds
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/158—Expression markers
Landscapes
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Organic Chemistry (AREA)
- Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- Biophysics (AREA)
- Zoology (AREA)
- Analytical Chemistry (AREA)
- Genetics & Genomics (AREA)
- Biochemistry (AREA)
- Molecular Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Wood Science & Technology (AREA)
- Biotechnology (AREA)
- Pathology (AREA)
- Immunology (AREA)
- Microbiology (AREA)
- Medical Informatics (AREA)
- Evolutionary Biology (AREA)
- Theoretical Computer Science (AREA)
- Bioinformatics & Computational Biology (AREA)
- Spectroscopy & Molecular Physics (AREA)
- General Engineering & Computer Science (AREA)
- Toxicology (AREA)
- Gastroenterology & Hepatology (AREA)
- Medicinal Chemistry (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本发明提出了一种溃疡性结肠炎基因标志物及其应用,该溃疡性结肠炎基因标志物包括第一基因集,因此,进一步提出了一种试剂盒,包括适于检测第一基因集中的至少一种基因的试剂,所述第一基因集由以下基因组成:U105F_GI_0114579、N16F_GI_0047596、N12F_GI_0047401、N10F_GI_0062793,其中,所述第一基因集中的基因与SEQ ID NO:1‑4所示的核酸序列一一对应,所述第一基因集中的基因与其对应的SEQ ID NO:1‑4中的序列具有不小于90%的同一性。本发明提出的标志物相较于溃疡性结肠炎患者群体,在健康个体中显著富集,能够作为健康群体和溃疡性结肠炎患者群体的区分标志,可以作为检测和/或治疗溃疡性结肠炎的标志物。
Description
技术领域
本发明涉及生物技术领域,具体的,本发明涉及溃疡性结肠炎标志基因及其应用,更具体的,本发明涉及一种试剂盒、试剂在制备试剂盒中的用途、用于预防或者治疗溃疡性结肠炎的药物组合物或者食品组合物、确定个体是否患有溃疡性结肠炎方法、确定个体是否患有溃疡性结肠炎的装置、一种装置、一种筛选药物的方法。
背景技术
溃疡性结肠炎是直肠和结肠慢性非特异性炎症性疾病。病变主要限于大肠黏膜与黏膜下层。临床表现为腹泻、黏液脓血便、腹痛。病情轻重不等,多呈反复发作的慢性病程。本病可发生在任何年龄,多发于20~40岁,亦可见于儿童或老年。男女发病率无明显差别。本病在我国较欧美少见,且病情一般较轻,但近年患病率有明显增加,重症也常有报道。
病变位于大肠,呈连续性弥漫性分布。范围多自肛端直肠开始,逆行向近段发展,甚至累及全结肠及末段回肠。活动期黏膜呈弥漫性炎症反应。固有膜内弥漫性淋巴细胞、浆细胞、单核细胞等细胞浸润是UC的基本病变,活动期并有大量中性粒细胞和嗜酸性粒细胞浸润。大量中性粒细胞浸润发生在固有膜、隐窝上皮(隐窝炎)、隐窝内(隐窝脓肿)及表面上皮。当隐窝脓肿融合溃破,黏膜出现广泛的小溃疡,并可逐渐融合成大片溃疡。肉眼见黏膜弥漫性充血、水肿,表面呈细颗粒状,脆性增加、出血,糜烂及溃疡。由于结肠病变一般限于黏膜与黏膜下层,很少深入肌层,所以并发结肠穿孔、瘘管或周围脓肿少见。少数暴发型或重症患者病变涉及结肠全层,可发生中毒性巨结肠,肠壁重度充血、肠腔膨大、肠壁变薄,溃疡累及肌层至浆膜层,常并发急性穿孔。结肠炎症在反复发作的慢性过程中,黏膜不断破坏和修复,致正常结构破坏。显微镜下见隐窝结构紊乱,表现为腺体变形、排列紊乱、数目减少等萎缩改变,伴杯状细胞减少和潘氏细胞化生。可形成炎性息肉。由于溃疡愈合、瘢痕形成、黏膜肌层及肌层肥厚,使结肠变形缩短、结肠袋消失,甚至肠腔缩窄。
随着人体基因组测序完成及高通量测序技术的高速发展,基因筛查成为溃疡性结肠炎诊断的一个重要方向,可以通过粪便的样本确定是否患有溃疡性结肠炎。目前已有大量关于溃疡性结肠炎的探究,如链球菌、放线菌属的应用,但仍然需要在基因水平进行研究,从而揭示溃疡性结肠炎基因标志物。
发明内容
本发明旨在至少解决上述问题至少之一或者提供至少一种可选择的商业手段。
为此,在本发明的第一方面,本发明提出了一种试剂盒。根据本发明的实施例,根据本发明的实施例,包括适于检测第一基因集中的至少一种基因的试剂,所述第一基因集由以下基因组成:U105F_GI_0114579、N16F_GI_0047596、N12F_GI_0047401、N10F_GI_0062793,其中,所述第一基因集中的基因与SEQ ID NO:1-4所示的核酸序列一一对应,所述第一基因集中的基因与其对应的SEQ ID NO:1-4中的核酸序列具有不小于90%的同一性。根据本发明具体实施例的试剂盒,可以准确的检测第一基因集中的至少一种基因的试剂,从而准确区分或诊断溃疡性结肠炎患者和健康个体。
在本发明的第二方面,本发明提出了试剂在制备试剂盒中的用途,所述试剂适于检测第一基因集中的至少一种基因。根据本发明的实施例,所述试剂盒用于诊断溃疡性结肠炎或检测溃疡性结肠炎的治疗效果,所述第一基因集由以下基因组成:U105F_GI_0114579、N16F_GI_0047596、N12F_GI_0047401、N10F_GI_0062793,其中,所述第一基因集中的基因与SEQ ID NO:1-4所示的核酸序列一一对应,所述第一基因集中的基因与其对应的SEQ ID NO:1-4中的核酸序列具有不小于90%的同一性。根据本发明具体实施例的试剂制备的试剂盒,可以准确的检测所述第一基因集中的至少一种基因,极准确的区分溃疡性结肠炎患者和健康个体,由此,可以有效的在早期进行溃疡性结肠炎诊断,或用于检测治疗过程中溃疡性结肠炎的变化。
在本发明的第三方面,本发明提出了一种用于预防或者治疗溃疡性结肠炎的药物组合物或者食品组合物。根据本发明的实施例,含有提高所述第一基因集中的至少一种基因丰度的物质,所述第一基因集由以下基因组成:U105F_GI_0114579、N16F_GI_0047596、N12F_GI_0047401、N10F_GI_0062793,其中,所述第一基因集中的基因与SEQ ID NO:1-4所示的核酸序列一一对应,所述第一基因集中的基因与其对应的SEQ ID NO:1-4中的核酸序列具有不小于90%的同一性。根据本发明实施例的溃疡性结肠炎标志基因中第一基因集的基因可以非侵入性的在早期发现或辅助检测溃疡性结肠炎,确定个体患有溃疡性结肠炎的概率高低或者个体处于健康状态的概率高低;同时,提高溃疡性结肠炎高风险人群或已溃疡性结肠炎患者肠道内的所述第一基因集中的各种基因的丰度,可以降低患溃疡性结肠炎的概率或减缓、治愈溃疡性结肠炎,因此,所述包含提高所述第一基因集中的至少一种基因丰度的药物或者食品组合物能够用于平衡肠道菌群,有效预防或治疗溃疡性结肠炎。
在本发明的第四方面,本发明提出了一种确定个体是否患有溃疡性结肠炎的方法。根据本发明的实施例,包括:(1)确定所述个体的粪便样本中标志基因的丰度,所述标志基因包括第一基因集和第二基因集中的至少一种基因;(2)将步骤(1)中得到的所述丰度与预定的阈值进行比较,以便确定所述个体是否患有溃疡性结肠炎;其中,所述第一基因集由以下基因组成:U105F_GI_0114579、N16F_GI_0047596、N12F_GI_0047401、N10F_GI_0062793),其中,所述第一基因集中的基因与SEQ ID NO:1-4所示的核酸序列一一对应,所述第一基因集中的基因与其对应的SEQ ID NO:1-4中的核酸序列具有不小于90%的同一性,所述第二基因集由以下基因组成:U233F_GI_0063614、U229F_GI_0075263、U114F_GI_0076513、N25F_GI_0086362,其中,所述第二基因集中的基因与SEQ ID NO:5-8所示的核酸序列一一对应,所述第二基因集中的基因与其对应的SEQ ID NO:5-8中的核酸序列具有不小于90%的同一性。根据本发明实施例的方法可以依据个体的粪便样本中的所述标志基因的丰度确定个体是否患有溃疡性结肠炎,所述标志基因是发明人对大量已知状态的粪便样本进行验证,通过差异比较分析各种肠道基因在溃疡性结肠炎组和健康组粪便样本中的丰度,而确定下来的。
在本发明的第五方面,本发明提出了一种确定个体是否患有溃疡性结肠炎的装置。根据本发明的实施例,包括:丰度确定单元,用于确定所述个体的粪便样本中标志基因的丰度,所述标志基因包括第一基因集和第二基因集中的至少一种基因;比较单元,用于将所得到的所述丰度与预定的阈值进行比较,以便确定所述个体是否患有溃疡性结肠炎;其中,所述第一基因集由以下基因组成:U105F_GI_0114579、N16F_GI_0047596、N12F_GI_0047401、N10F_GI_0062793,其中,所述第一基因集中的基因与SEQ ID NO:1-4所示的核酸序列一一对应,所述第一基因集中的基因与其对应的SEQ ID NO:1-4中的核酸序列具有不小于90%的同一性,所述第二基因集由以下基因组成:U233F_GI_0063614、U229F_GI_0075263、U114F_GI_0076513、N25F_GI_0086362,其中,所述第二基因集中的基因与SEQ IDNO:5-8所示的核酸序列一一对应,所述第二基因集中的基因与其对应的SEQ ID NO:5-8中的核酸序列具有不小于90%的同一性。所述标志基因是发明人通过差异比较分析各种肠道基因在溃疡性结肠炎患者和健康人群的粪便样本中的丰度并经过分析和大量已知状态的粪便样本的验证而确定下来的,根据本发明实施例的装置可以准确确定个体是否为溃疡性结肠炎的高风险人群或溃疡性结肠炎患者。
在本发明的第六方面,本发明提出了一种装置。根据本发明的实施例,包括:计算机可读存储介质,其上存储有计算机程序,所述程序用于执行第四方面所述的方法;以及一个或者多个处理器,用于执行所述计算机可读存储介质中的程序。根据本发明实施例的装置可以准确确定个体是否为溃疡性结肠炎的高风险人群或溃疡性结肠炎患者。
在本发明的第七方面,本发明提出了一种筛选药物的方法。根据本发明的实施例,所述药物用于治疗或者预防溃疡性结肠炎,所述方法包括:将候选药物施用于受试者,检测施用前后,所述受试者粪便中标志基因的丰度,所述标志基因包括第一基因集和第二基因集中的至少一种基因,其中,满足下列条件至少之一的候选药物适于用于治疗或者预防溃疡性结肠炎:(1)进行所述施用后,所述第一基因集中的至少一种基因的所述丰度升高;和(2)进行所述施用后,所述第二基因集中的至少一种基因的所述丰度降低;其中,所述第一基因集由以下基因组成:U105F_GI_0114579、N16F_GI_0047596、N12F_GI_0047401、N10F_GI_0062793,其中,所述第一基因集中的基因与SEQ ID NO:1-4所示的核酸序列一一对应,所述第一基因集中的基因与其对应的SEQ ID NO:1-4中的核酸序列具有不小于90%的同一性,所述第二基因集由以下基因组成:U233F_GI_0063614、U229F_GI_0075263、U114F_GI_0076513、N25F_GI_0086362,其中,所述第二基因集中的基因与SEQ ID NO:5-8所示的核酸序列一一对应,所述第二基因集中的基因与其对应的SEQ ID NO:5-8中的核酸序列具有不小于90%的同一性。根据本发明实施例的方法可以生产或筛选出升高所述标志基因中第一基因集中各种基因丰度,和/或降低肠道标志基因中第二基因集中的各种基因丰度的药物,对于辅助减轻溃疡性结肠炎的临床症状具有重要意义。
本发明的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
本发明的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解,其中:
图1是根据本发明实施例的筛选溃疡性结肠炎标志基因的实验分析流程示意图;以及
图2是根据本发明实施例的标志基因综合指标AUC评价结果示意图,其中,Specificity表示特异度,即预测为阳性且实际为阳性,真阳性,纵坐标Sensitivity表示敏感度,即真阴性:
2-A为第一期29个样品数据ROC曲线下AUC值和置信区间结果图;
2-B为第二期11个样品数据ROC曲线下AUC值和置信区间结果图。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出。下面通过参考附图描述的实施例是示例性的,旨在用于解释本发明,而不能理解为对本发明的限制。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本发明的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。
术语“任选地”仅用于描述目的,而不能理解为指示或暗示相对重要性。由此,限定有“任选地”的特征可以明示或者隐含地包括或不包括该特征。
生物学标志物是从生物学介质中可以检测到的细胞/生物化学或分子改变。生物学介质包括各种体液、组织、细胞、粪便、头发、呼气等。
所称的丰度指在某一微生物或者核酸序列群体中该种微生物或者序列的丰富程度。例如在肠道基因群体中该种微生物的丰富程度,可表示为该种微生物在该群体中的含量;又例如在一组核酸序列中某种核酸序的丰富程度,可表示为该种核酸序列的数目占该组序列的总数的比例。
同一性,本发明,为了比较两个或更多个核苷酸序列,可以通过将[第一序列中与相应位置的核苷酸相同的核苷酸的数目相除]来计算第一序列和第二序列之间的“序列同一性”的百分比。第二个序列中的核苷酸]减去[第一个序列中核苷酸的总数],然后乘以[100%],其中第二个核苷酸序列中每个核苷酸的缺失,插入,取代或添加-相对于第一核苷酸序列-被认为是单个核苷酸(位置)上的差异。
或者,可以使用标准设置,使用用于序列比对的已知计算机算法,例如NCBI Blastv2.0,计算两个或多个核苷酸序列之间的序列同一性程度。
用于确定序列同一性程度的一些其他技术,计算机算法和设置例如在WO 04/037999,EP 0 967 284,EP 1 085 089,WO 00/55318,WO 00/78972,WO 98/49185和GB2357768-A。
需要说明的是,本申请中所述的“标志基因”的长度不受特别限制,可以为完整基因,也可以为基因的编码区或非编码区,更进一步地,根据不同的实验目的,可以选择相关的任意的核酸片段作为标志基因。
根据本发明的一个实施方式提供的一种试剂盒,包括适于检测第一基因集中的至少一个基因的试剂,所述第一基因集由以下基因组成:U105F_GI_0114579、N16F_GI_0047596、N12F_GI_0047401、N10F_GI_0062793,其中,所述第一基因集中的基因与SEQ IDNO:1-4所示的核酸序列一一对应,所述第一基因集中的基因与其对应的SEQ ID NO:1-4中的核酸序列具有不小于90%的同一性。
U105F_GI_0114579
ATTAGCCTGTTTTTTGAAAAATCCGGCATAACCATAGTAGAAAGCGTCAAACACCTGCCAATCACAGCGGGTGTTTCGTGTTTTCTGAATACTATGAACGGAGGTTTTTCTATGACAATTTATGAAACCATCAAGGCGGCAATCAGCGTAAAGCAAGCCGCCAAACACTACGGGCTGAATGTCAACCGCAACGGTATGGCTTGCTGTTCGTTCCACAACGACAGGCATCCGAGCTTGAAGCTGAATGAGGACTATTTTTTCTGCTTCAGCTGCGGAGCCAAGGGGGATGTAATCGACCTTGTGGCAAGGCTGTTCGATCTGAGCAGTTATGAAGCAGTGCAAAAACTGGCTGCGGACTTTGAGCTTGACCCGAAACCGCCCACTGCCGCAGCTATGGTCAAGCCGAAGCGTCCTTATATCCGTCAGTTCCGGGAGGATGAAATGTTGTTCAGTATGCTAAGAAAGCAAATGAAACGGGGAAGCTGTATGAAGAGGATCTTGCAGAAATAA(SEQ ID NO:1)。
N16F_GI_0047596
GAAACCATGAGAACAGTAGATGTAGCTACTTTGACGCAAAATATCAAAGAAATGTGCATAGAGGCCAATCATTTCTTATCTGAGGACATGAAGACGGCATTTACAAAAGCGGAACAGCAGGAAAAAGCACCTTTGGGGAAGCAGATCCTGCAACAGTTGCAGCAGAATATGGATATTGCAGGCAAGGACATGATTCCCATCTGTCAGGATACCGGAATGGCGGTTGTATTTCTGGAAGTGGGTCAGGATGTGCATCTGACAGGGGGCAATGTGGAAGATGCCGTCAACGAAGGTGTCAGACAGGGATATGTGGACGGTTATCTGCGAAAATCTGTGGTGAAGGATCCCATTTACCGGGAGAATACGAAGGATAATACACCCGCGATCATTCATTATAGTATTGTTCCGGGGGATCGTGTCAGGATAACCGTGGCACCAAAGGGATTTGGCAGTGAGAATATGAGCAGAGTATTTATGCTCAAGCCAGCAGACGGAATAGAAGGCGTGAAGAACGCAATCCTGACGGCGGTAAAGGATGCAGGACCGAATGCGTGCCCTCCTATGGTGGTCGGAGTGGGCATTGGCGGTACTTTTGAAAAATGTGCATTGATGGCGAAGAAAGCATTGACACGTCCGGTGGATGAACATTCGGAGATACCCTATGTGAGGGAACTGGAAGAAGAGCTGCTGGAGAAGATTAATAAAACAGGCATCGGACCGGGAGGACTGGGCGGATCAACCACAGCACTGGCGGTCAATATTAATACATATCCCACACATATAGCGGGATTGCCGGTAGCTGTAAACATCTGTTGCCATGTCAATAGGCATGCAGTTAGAGAGATTTGA(SEQ ID NO:2)。
N12F_GI_0047401
ATGACAAAAGAATGCAAACAACAATTTACACTTCGGATTACACAGGCGAATTCCACGCAGTTGATCGTGATCCTGTATGAAATGACCTTACAATATCTGGCAGACGGAGAGCAGGCAGTAGATGATGCCGGACTGGTGGAAGCTGTTCATAGAGCCAGGGGATGTATCAAAGAGCTCCTGAACTCTCTGCACAGAGAATACAGCCCGGCAGGAGAGCTTTCCAGACTGTACCTGTTCTGCCTTCGCAGACTTGCTGTATGTGAAGTCCGCAGAGACCGCACAATATTGGAAGAGATTCGCAAAGTGATCGCACCTCTCTGCGATGCGTACAGGCAGATCCAGGATCAGGATACTTCCGGCCCGGTGATGAACAATTCTCAGACAGTATATGCCGGACTGACTTACGGCAGGAACCAGTTAACCGAAAACATGGCTGACCAGGGCACGAATCGGGGAATGCTGGTATAG(SEQ ID NO:3)。
N10F_GI_0062793
AAGGAGGCAGGGAAAGTGGTAGCACAAATACTTGCAGTAATCATATTTCTGGCGATGTTTGTACTGATCGTCCTGGAAGTATGGGAGAGACACATTATCACATTGGGCTGCGGTCTGCTGACACTGGTACTGGTATTCGGACTGGGAATGCACAGTATGAGCGCAGTGCTGGAGACTTTGAACTTAGGCAGCTTTTTCACAAGTCATTTCTGGTACACGGCGGGACAGTCCGCAGAGGCTTCCAGTGGTATCAACTGGGAGACCATCGTGTTCGTAGCAGGAATGATGATCATGGTAGAGGGAATGGCCCGGGTGGGATTCTTCCGCTGGCTGTGCATGCGCCTTGCCAAGATGGTCAAGTATAAGGTTGTACCGCTGTTTGTCACCTTTATGGTATTATCCGGTATTCTGGCAATGTTCATTGACAGTATTACCGTAATCCTGTTCCTGGCAGCCGTTACCATTGAACTGTCACAACTGTTGAAATTCAATCCGGTGCCTATGATTCTGGCAGAAGTGTTCTGTGCGAATCTGGGAGGATCCGCTACCATGTGCGGAGATCCCCCCAATATCATCATCGGTACTTCCCTGGGATATTCCTTCACGGATTTCCTGACCAATACCGGTGTGATCGCAGGTGTATCCCTGATCGTGGTCATATTGTATTTCTATCTGGTATTCCACAAGGAACTGCGAGCCAGCGAGGCTGCTGCAGCAGGCAGCAACCAGGCCTACCCGGATCCTTCCGAGGCCATTACCGACAAAAAGGGATTTATTATCAGCACTGTTATCTTCCTGTGTGCAGTAGTACTGCTGGTGACCCATGCACAGACTGGACTGACCGTATCCTGCATCGGTGTATTCATCTCCATCGTGACATTGATCGCTGCAGGCAAAGATGCGCTGAAGCTGATCAGACAGATTGATTACAAGACGCTGCTGTTCTTCATCGGACTGTTTATGGTCGTAGGTGGCCTGGAGCAGACAGGTATCCTGAAAGTCATGGCGAACTTCATCGGAGATATCAGTAACGGCAATCTGATGCTGATGATCGCCATTATTCTGTGGATCTCCGCCATCGCCAGCGCCTTCGTGGATAATATTCCTTTTGCGGCTACCATGATCCCTATTATCAGCAGTCTGTCCGCTACCCAGGGTGTGGAGCTGTCCATTCTGGCATGGGCACTGGCTATGGGAACCGATATTGGAGGAAGCGCAACTCCCATCGGAGCTTCTGCCAACGTAGTAGGTATCGCCACCGCAGCGAAAGCCGGTCATATGATTAAGTGGGGAAAATATTGCAAAGTTATGGCACCTGCGACTATAATAGTAGTAGGGATCTCTATGCTGATGATCTATGCAAGATATCTGTAA(SEQ ID NO:4)。
根据本发明的一个具体的实施方案,所述试剂盒进一步包括适于检测第二基因集中的至少一个基因的试剂,所述第二基因集由以下基因组成:U233F_GI_0063614、U229F_GI_0075263、U114F_GI_0076513、N25F_GI_0086362,其中,所述第二基因集中的基因与SEQID NO:5-8所示的核酸序列一一对应,所述第二基因集中的基因与其对应的SEQ ID NO:5-8中的核酸序列具有不小于90%的同一性。
U233F_GI_0063614
ATGGAATTGAATGGAATCATCAAATGGACTCGAATGGAATCATCATCAAGTGGAATCAAATGGAATCATCGAATGGACACGAATCAAATCATCGTTGAATGGAATCGAATGGAATCATCGAATGGACTCGAAGGGAATCATTATCGAATGGAATTGAATGAAATCATAATCGAATGGAGTCGAATGGAATCATCATCGAAAGGAGTTGAATGGAAACATCACGGAATGGTATCAAATGAAATCACCGAATTGAATCAAATGGAATGA(SEQ ID NO:5)。
U229F_GI_0075263
ATGAAAAGCAACGTGAAACTCTGGGAGTTGAACACAAACATCACAGAGAAGTTTCGGAGAATGCTTCTGTTTAGTTATTATGTGAAGATATTCCCGCTTCCAAAGACATCTTCGGAGAGGGCCACATATCCACTTGCAGATTCCCCAACAAGAGAGTTTCAACAACGCTCTTTCCATAGGAGGCTTCAACTCTGTGAGTTGAATGCAATCATCACAGAGAAGTTTCTGAGAAGGCTTCTGTCTAGATTTTATGCGAAGATGTACCCGTTTCGAACGAAGGCCACAGAGTGGTCCAAATATCCACTTGCAGATCCTACAAAAAGAGTGTTTCAAACCTGA(SEQ ID NO:6)。
U114F_GI_0076513
ATGCATCTGTATAGTTTTGATGAGAAGATGATTCCGTTTCCAACGAAATCTTCAAAGAGGGCTACATGTCCCCTTGCAGATGCTACAGAAAGAGAGTTTCAAAACTGCGCTCTCAAAAGGAGTGTTCAACTCCGTGAGTTGAATGCAGTCATCACAGAGAAGCTTCTGAGAATGCTTCTGTCTAGATGTCATGTGAAGATATACCCGTTTCGAACGAAGGACACAGAGTGGTCCAAATATCCACTTGTAGATCCTGCAACAAGAGTGTTTCAAACGTGA(SEQ ID NO:7)。
N25F_GI_0086362
ATGGAATGGAATGGAATGGAATGGAATGGAATCGAAAGGAATGGAATGGAATCAACTGGAATGGAATGGAATGGAATGGAATGGAATGGAAAGGAATGGAATCGAATAGAATGGAATTGTATTAATTGGAATGGAAAGGAAAGCAATGGATTGAAATGGAAGGGAATGGAATGGAAAGGAATCAAACCGAGTGGAATAGAATGGCATGGAATGGAATGTAATCAACCAGAGTGGAATGGAATGGAATGGAATTGA(SEQ ID NO:8)。
根据本发明的具体实施例,所述试剂盒包括适于检测所述第一基因集中全部所述基因的试剂。
根据本发明的具体实施例,所述试剂盒包括适于检测所述第二基因集中全部所述基因的试剂。
根据本发明的具体实施例,所述标志基因是发明人通过对大量患溃疡性结肠炎个体和大量健康对照个体的粪便样本中的微生物的基因丰度的差异比较分析、以及验证,而确定下来的,明确了肠道中溃疡性结肠炎相关的标志基因。利用包含检测所述标志基因的试剂的试剂盒能够确定个体处于患有溃疡性结肠炎状态的概率高低或者处于健康状态的概率高低,能够用于非侵入性的早期发现或辅助检测溃疡性结肠炎。
根据本发明的具体实施例,所述适于检测所述第一基因集或第二基因集的试剂不受特别限制,任何可以直接或间接检测所述标志基因的丰度的试剂均包含在本发明的范围内,如:利用PCR技术、高通量测序等方法直接进行检测时使用的试剂,或通过Western Blot技术检测所述基因对应的蛋白的含量间接获得所述基因丰度时所使用的试剂等。
根据本发明提供的试剂在制备试剂盒中的用途,所述试剂适于检测第一基因集中的至少一种基因,所述试剂盒用于诊断溃疡性结肠炎或者检测溃疡性结肠炎的治疗效果,所述第一基因集由以下基因组成:U105F_GI_0114579、N16F_GI_0047596、N12F_GI_0047401、N10F_GI_0062793,其中,所述第一基因集中的基因与SEQ ID NO:1-4所示的核酸序列一一对应,所述第一基因集中的基因与其对应的SEQ ID NO:1-4中的核酸序列具有不小于90%的同一性。
根据本发明的具体实施例,所述标志基因是发明人通过对大量患溃疡性结肠炎个体和大量健康对照个体的粪便样本中的微生物基因进行差异比较分析、以及验证,而确定下来的,明确了肠道中溃疡性结肠炎相关的微生物的基因标志物。利用检测所述标志基因的试剂能够确定个体患有溃疡性结肠炎的概率高低或者处于健康状态的概率高低,能够用于非侵入性的早期发现或辅助检测溃疡性结肠炎。
根据本发明一些具体的实施例,所述试剂进一步适于检测第二基因集中的至少一种基因,所述第二基因集由以下基因组成:U233F_GI_0063614、U229F_GI_0075263、U114F_GI_0076513、N25F_GI_0086362,其中,所述第二基因集中的基因与SEQ ID NO:5-8所示的核酸序列一一对应,所述第二基因集中的基因与其对应的SEQ ID NO:5-8中的核酸序列具有不小于90%的同一性。
根据本发明的具体实施例,所述适于检测所述第一基因集或第二基因集的试剂不受特别限制,任何可以直接或间接检测所述标志基因的丰度的试剂均包含在本发明的范围内,如:利用PCR技术、高通量测序等方法直接进行检测时使用的试剂,或通过Western Blot技术检测所述基因对应的蛋白的含量间接获得所述基因丰度时所使用的试剂等。
根据本发明提供的一种用于预防或者治疗溃疡性结肠炎的药物组合物或者食品组合物,含有提高第一基因集中的至少一种基因丰度的物质,所述第一基因集由以下基因组成:U105F_GI_0114579、N16F_GI_0047596、N12F_GI_0047401、N10F_GI_0062793,其中,所述第一基因集中的基因与SEQ ID NO:1-4所示的核酸序列一一对应,所述第一基因集中的基因与其对应的SEQ ID NO:1-4中的核酸序列具有不小于90%的同一性。
上述标志基因是发明人通过差异比较分析各种肠道微生物的基因在溃疡性结肠炎疾病组和健康组的粪便样本中的丰度,以及经过大量已知状态的粪便样本的验证,而确定下来的。所述标志基因中的第一基因集中的基因相较于溃疡性结肠炎患者群体,在健康群体组中显著富集,所述显著富集是指与在溃疡性结肠炎患者组中的丰度相比,上述基因在健康组中的丰度均具有统计意义地高于或者明显地、实质性地高于在溃疡性结肠炎患者组中的丰度;能够使该部分基因丰度提高的物质能够用于治疗溃疡性结肠炎或者益于溃疡性结肠炎患者服用,所述物质不受特别限制,能够使其丰度提高的物质包括但不限于治疗溃疡性结肠炎的药物和有益肠道菌群平衡的功能性食品。因此,该实施例提供的能够使所述第一基因集中的基因丰度提高的物质能够用于制备治疗溃疡性结肠炎的药物和/或用于制备益于平衡肠道菌群的功能性食品、保健药等,所述药物或食品可有效治疗或缓解溃疡性结肠炎。
根据本发明提供的一种确定个体是否患有溃疡性结肠炎的方法,包括步骤(1)和(2)。
(1)确定所述个体的粪便样本中的标志基因的丰度。
所述标志基因包括第一基因集和第二基因集中的至少一种基因。其中,所述第一基因集由以下基因组成:U105F_GI_0114579、N16F_GI_0047596、N12F_GI_0047401、N10F_GI_0062793,其中,所述第一基因集中的基因与SEQ ID NO:1-4所示的核酸序列一一对应,所述第一基因集中的基因与其对应的SEQ ID NO:1-4中的核酸序列具有不小于90%的同一性,所述第二基因集由以下基因组成:U233F_GI_0063614、U229F_GI_0075263、U114F_GI_0076513、N25F_GI_0086362,其中,所述第二基因集中的基因与SEQ ID NO:5-8所示的核酸序列一一对应,所述第二基因集中的基因与其对应的SEQ ID NO:5-8中的核酸序列具有不小于90%的同一性。
根据本发明的一些具体的实施例,步骤(1)进一步包括:获得所述个体的粪便样本中的核酸测序数据;将所述测序数据与参考基因组进行比对;基于所述比对的结果,确定所述标志基因的丰度。
根据本发明的具体实施例,在步骤(1)中,按照下列公式确定所述标志基因的丰度:Ab(G)=Ab(UG)+Ab(MG),其中,G表示基因的编号,Ab(G)表示基因G的丰度,Ab(UG)表示所述测序数据与所述基因G的参考序列唯一比对的读段的丰度,Ab(MG)表示所述测序数据与所述基因G的参考序列非唯一比对读段的丰度;Ab(UG)=UG/lG,其中,UG表示所述测序数据中与所述基因G的参考基因唯一比对的读段数目,lG表示所述基因G的参考基因长度;其中,MG为所述测序数据中与所述基因G的参考基因非唯一比对的读段的数目,i表示所述非唯一比对读段的编号,Coi为所述第i读段对应的丰度系数;其中,Coi,G表示针对所述标志基因G,所述非唯一比对的读段i的丰度系数,N为所述非唯一比对的读段i能够比对的基因的总数,j表示所述非唯一比对的读段i能够比对的基因的编号。上述丰度确定公式,基于比对结果中的唯一和非唯一比对上组装序列的读段对该组装序列的丰度的贡献情况,充分利用测序数据的同时确定的丰度十分准确。
根据本发明的具体实施方案,进行以下以完成该步骤:获得所述个体的粪便样本中的核酸序列的测序数据,所述测序数据包括多个读段;将所述读段比对至所述标志物中的各种基因的基因组,获得比对结果;依据所述比对结果,确定所述标志物中的各种基因的丰度。
所述的测序数据通过对样本中的核酸序列进行测序得来,测序依据所选的测序平台的不同,可选择但不限于半导体测序技术平台比如PGM、Ion Proton、BGISEQ-100平台,合成边测序的技术平台,比如Illumina公司的Hiseq、Miseq序列平台以及单分子实时测序平台,比如PacBio序列平台。测序方式可以选择单端测序,也可以选择双末端测序,获得的下机数据是测读出来的片段,称为读段(reads)。
比对可以利用已知比对软件进行,例如SOAP、BWA和TeraMap等,在比对过程中,一般对比对参数进行设置,设置一个或者一对读段(reads)最多允许有s个碱基错配(mismatch),例如设置s≤2,若reads中有超过s个碱基发生错配,则视为该reads无法比对到(比对上)该组装片段上。所述的获得的比对结果包含各条读段与各参考基因的比对情况,包括读段是否能够比对上某个或某些基因的参考序列、只唯一比对到一种基因还是比对到多种基因的参考序列、比对到基因组的位置、比对到基因组的唯一位置还是多个位置等信息。
reads与参考基因组比对,比对上的可以被分为两部分:a)Unique reads(U):唯一比对上一个基因的序列;称这些reads为unique reads。即,如果reads比对上的序列均来自同一基因,定义这些reads为unique reads;b)Multiple reads(M):比对上一个以上基因的序列,定义为multiple reads。即,如果reads比对上的序列来自至少两种基因,定义这些reads为multiple reads。
所述参考基因组指预先确定的该基因的序列,可以是预先获得的待测样本所属或者所包含的生物类别的任意参考模板,例如,目标是待测样本中的基因,参考序列可选择NCBI数据库中的各种基因的参考序列,进一步地,也可以预先配置包含更多参考序列的资源库,例如依据待测样本来源的个体的状态、地域等因素选择或是测定组装出更接近的序列作为参考序列。根据本发明的一个实施例,各种基因的参考基因是由发明人进行构建的。
(2)丰度比较,以确定个体是否患有溃疡性结肠炎。
根据本发明的一个实施例,将步骤(1)中得到的所述丰度与预定的阈值进行比较,以便确定所述个体是否患有溃疡性结肠炎。
根据本发明的一些具体实施例,所述阈值为预先设定的。将标志物中的各种基因在对健康个体以及患病个体中的丰度预先测定保存,用以作为设定阈值的依据。所述阈值可以为一数值或者数值范围,基于已知患病或健康状态个体中的标志基因的丰度均值,该基因对应的阈值可以设为该基因丰度均值的95%的置信区间(Confidence interval)。
所述的置信区间是指由样本统计量所构造的总体参数的估计区间。在统计学中,一个概率样本的置信区间是对这个样本的某个总体参数的区间估计。置信区间展现的是这个参数的真实值有一定概率落在测量结果的周围的程度。置信区间给出的是被测量参数的测量值的可信程度,即前面所要求的“一定概率”,这个概率被称为置信水平。
根据本发明的一些具体实施例,当步骤(1)中确定的标志基因的丰度达到所述患溃疡性结肠炎丰度阈值,未达到所述不患溃疡性结肠炎丰度阈值时,确定所述个体患有溃疡性结肠炎,当(1)中确定的标志基因的丰度达到不患溃疡性结肠炎丰度阈值,未达到患溃疡性结肠炎丰度阈值时,确定所述个体不患溃疡性结肠炎。
需要说明的是,根据目的或要求不同,可能对确定个体状态结果的可信程度有不同的要求,本领域技术人员可以选择不同的显著性水平或阈值。
该方法基于检测个体的粪便样本中的标志基因中的各种基因的丰度,分别将检测确定的各种基因的丰度与其阈值进行比较,依据获得的比较结果能够确定个体为溃疡性结肠炎个体或者为健康个体的概率。为早期发现溃疡性结肠炎提供一种非侵入性的辅助检测或者辅助干预治疗的方法。
以上任一实施例中的利用标志基因确定个体是否患有溃疡性结肠炎的方法的全部或部分步骤,可以利用包含可拆分的相应单元功能模块的装置/系统来施行,或者将方法程序化、存储于机器可读介质,利用机器运行该可读介质来实现。
根据本发明提供的一种确定个体是否患有溃疡性结肠炎的装置,该装置包括:丰度确定单元,用于确定所述个体的粪便样本中标志基因的丰度,所述标志基因包括第一基因集和第二基因集;比较单元,用于将所得到的所述丰度与预定的阈值进行比较,以便确定所述个体是否患有溃疡性结肠炎;其中,所述第一基因集由以下基因组成:U105F_GI_0114579、N16F_GI_0047596、N12F_GI_0047401、N10F_GI_0062793,其中,所述第一基因集中的基因与SEQ ID NO:1-4所示的核酸序列一一对应,所述第一基因集中的基因与其对应的SEQ ID NO:1-4中的核酸序列具有不小于90%的同一性,所述第二基因集由以下基因组成:U233F_GI_0063614、U229F_GI_0075263、U114F_GI_0076513、N25F_GI_0086362,其中,所述第二基因集中的基因与SEQ ID NO:5-8所示的核酸序列一一对应,所述第二基因集中的基因与其对应的SEQ ID NO:5-8中的核酸序列具有不小于90%的同一性。上述对本发明任一实施例的利用标志基因确定个体是否患有溃疡性结肠炎的方法的技术特征和优点的描述,同样适用本发明这一方面的装置,在此不再赘述。
根据本发明的实施例,所述丰度确定单元适于通过下列步骤确定所述丰度:获得所述个体的粪便样本中的核酸测序数据;将所述测序数据与参考基因组进行比对;基于所述比对的结果,确定所述标志基因的丰度。
所述的测序数据通过对样本中的核酸序列进行测序得来,测序依据所选的测序平台的不同,可选择但不限于半导体测序技术平台比如PGM、Ion Proton、BGISEQ-100平台,合成边测序的技术平台,比如Illumina公司的Hiseq、Miseq序列平台以及单分子实时测序平台,比如PacBio序列平台。测序方式可以选择单端测序,也可以选择双末端测序,获得的下机数据是测读出来的片段,称为读段(reads)。
比对可以利用已知比对软件进行,例如SOAP、BWA和TeraMap等,在比对过程中,一般对比对参数进行设置,设置一个或者一对读段(reads)最多允许有s个碱基错配(mismatch),例如设置s≤2,若reads中有超过s个碱基发生错配,则视为该reads无法比对到(比对上)该组装片段上。所述的获得的比对结果包含各条读段与各参考基因的比对情况,包括读段是否能够比对上某个或某些基因的参考序列、只唯一比对到一种基因还是比对到多种基因的参考序列、比对到基因组的位置、比对到基因组的唯一位置还是多个位置等信息。
所述参考基因组指预先确定的该基因的序列,可以是预先获得的待测样本所属或者所包含的生物类别的任意参考模板,例如,目标是待测样本中的基因,参考序列可选择NCBI数据库中的各种基因的参考序列,进一步地,也可以预先配置包含更多参考序列的资源库,例如依据待测样本来源的个体的状态、地域等因素选择或是测定组装出更接近的序列作为参考序列。根据本发明的一个实施例,各种基因的参考基因是由发明人进行构建的。
reads与参考基因组比对,比对上的可以被分为两部分:a)Unique reads(U):唯一比对上一个基因的序列;称这些reads为unique reads。即,如果reads比对上的序列均来自同一基因,定义这些reads为unique reads;b)Multiple reads(M):比对上一个以上基因的序列,定义为multiple reads。即,如果reads比对上的序列来自至少两种基因,定义这些reads为multiple reads。
所述参考基因组指预先确定的该基因的序列,可以是预先获得的待测样本所属或者所包含的生物类别的任意参考模板,例如,目标是待测样本中的基因,参考序列可选择NCBI数据库中的各种基因的参考序列,进一步地,也可以预先配置包含更多参考序列的资源库,例如依据待测样本来源的个体的状态、地域等因素选择或是测定组装出更接近的序列作为参考序列。根据本发明的一个实施例,各种基因的参考基因是由发明人进行构建的。
根据本发明的一个实施例,按照下列公式确定所述标志基因的丰度:Ab(G)=Ab(UG)+Ab(MG),其中,G表示基因的编号,Ab(G)表示基因G的丰度,Ab(UG)表示所述测序数据与所述基因G的参考序列唯一比对的读段的丰度,Ab(MG)表示所述测序数据与所述基因G的参考序列非唯一比对读段的丰度;Ab(UG)=UG/lG,其中,UG表示所述测序数据中与所述基因G的参考基因唯一比对的读段数目,lG表示所述基因G的参考基因长度;其中,MG为所述测序数据中与所述基因G的参考基因非唯一比对的读段的数目,i表示所述非唯一比对读段的编号,Coi为所述第i读段对应的丰度系数;其中,Coi,G表示针对所述标志基因G,所述非唯一比对的读段i的丰度系数,N为所述非唯一比对的读段i能够比对的基因的总数,j表示所述非唯一比对的读段i能够比对的基因的编号。上述丰度确定公式,基于比对结果中的唯一和非唯一比对上组装序列的读段对该组装序列的丰度的贡献情况,充分利用测序数据的同时确定的丰度十分准确。上述对本发明任一实施例的利用标志基因确定个体是否患有溃疡性结肠炎的方法的技术特征和优点的描述,同样适用本发明这一方面的装置,在此不再赘述。
根据本发明的又一个实施例提供的一种装置,包括:计算机可读存储介质,其上存储有计算机程序,所述程序用于执行前面所述的一种确定个体是否患有溃疡性结肠炎方法;以及一个或者多个处理器,用于执行所述计算机可读存储介质中的程序。
根据本发明的又一个实施例提供的一种筛选药物的方法,所述药物用于治疗或者预防溃疡性结肠炎,所述方法包括:将候选药物施用于受试者,检测施用前后,所述受试者粪便中标志基因的丰度,所述标志基因包括第一基因集和第二基因集中的至少一种基因,其中,满足下列条件至少之一的候选药物适于用于治疗或者预防溃疡性结肠炎:(1)进行所述施用后,所述第一基因集中的至少一种基因的所述丰度升高;和(2)进行所述施用后,所述第二基因集中的至少一种基因的所述丰度降低;其中,所述第一基因集由以下基因组成:U105F_GI_0114579、N16F_GI_0047596、N12F_GI_0047401、N10F_GI_0062793,其中,所述第一基因集中的基因与SEQ ID NO:1-4所示的核酸序列一一对应,所述第一基因集中的基因与其对应的SEQ ID NO:1-4中的核酸序列具有不小于90%的同一性,所述第二基因集由以下基因组成:U233F_GI_0063614、U229F_GI_0075263、U114F_GI_0076513、N25F_GI_0086362,其中,所述第二基因集中的基因与SEQ ID NO:5-8所示的核酸序列一一对应,所述第二基因集中的基因与其对应的SEQ ID NO:5-8中的核酸序列具有不小于90%的同一性。
利用本发明这一方面的生产或筛选治疗溃疡性结肠炎的药物的方法,通过合理有效地应用确定的溃疡性结肠炎标志基因进行筛选,能够获得提高肠道有益基因的丰度和/或降低肠道潜在致病基因的丰度的药物。
下面将对实施例作具体介绍。以下实施例中涉及的未特别交待的试剂、序列、软件及仪器,都是常规市售产品。
实施例1生物标志物的鉴定
本实施例中,发明人通过对18个溃疡性结肠炎患者和11个健康对照的粪便样品进行研究,从而获得肠道菌群基因群落及功能成分特征。总的来说,发明人通过实验测序得到的179.9Gb高质量测序数据构建了溃疡性结肠炎患者参照基因集及1.35G高通量数据构建健康人基因集,并且IGC基因集构建一个更加完整的基因集。宏基因组分析显示,10个基因与溃疡性结肠炎疾病密切相关,其中6个基因在健康人的体内被富集,4个基因在溃疡性结肠炎病人体内被富集。
1、样本收集和DNA提取
溃疡性结肠炎患者来自浙江大学医学院附属溃疡性结肠炎医院,实验共采集了18个中国溃疡性结肠炎患者的粪便样品和11个健康对照的粪便样品,其中每个个体的新鲜粪便样品移入无菌的1.5mL Eppendorf管中,液氮速冻,80℃保存。
对18个中国溃疡性结肠炎患者的粪便样品和11个健康对照的粪便样品使用QIAamp DNAmini kit试剂盒提取总DNA,具体实验操作按照试剂盒说明书进行。
2、构建DNA文库及测序
DNA建库按仪器制造商(Illumina)的操作指南进行。对文库进行PE100 bp测序,Illumina HiSeq2000(Illumina,San Diego,CA)平台对29个样品的文库进行测序。每个样本平均产生6.2Gb高通量测序结果,总计179.9Gb测序数据量。
参照图1所示的实验流程,鉴定溃疡性结肠炎的相关基因标志物,其中省略的步骤或者细节为本领域技术人员所熟知,几个重要步骤介绍如下面所述。
3、基因基因丰度分析
3.1序列优化统计
1)首先进行第一期测序,本期测序采集29个样品的数据,获得第一期的29个样品的测序数据以后,对其进行过滤,质控按以下标准进行:a)移除大于5个N碱基的reads;b)去除低质量碱基(Q20)大于50%的reads;c)移除尾部低质量(Q20)和N碱基。丢失成对的reads序列被认为是单条reads用于组装,并进行基因预测。
2)采用1)所述方法同样处理下载的健康人数据。
3)由ftp.cngb.org/pub/SciRAID/Microbiome/humanGut_9.9M/GeneCatalog/IGC.fa.gz链接下载得到IGC基因集。
3.2基因丰度分析
SOAPalign 2.21用于匹配针对冗余基因组的paired-end clean reads,这里,所称的冗余基因组来自来自于利用样本数据及IGC基因集构建的非冗余基因序列集,比对参数为–r 2–m 200–x 1000。Reads与冗余基因组的比对结果,可分为两部分:a)Unique reads(U):reads只比对上一个基因的序列;这些reads被定义为unique reads。即,如果这些序列来自同一基因,发明人将这些reads定义为unique reads。b)Multiple reads(M):如果reads比对上两个及两个以上基因的序列,定义为multiple reads。即,如果比对上的序列来自不同基因,发明人定义这些reads为multiple reads。
对于给定的基因G,其丰度为Ab(S),与U reads和M reads相关,丰度的计算方式如下:
Ab(G)=Ab(UG)+Ab(MG),
其中,G表示基因的编号,Ab(G)表示基因G的丰度,Ab(UG)表示所述测序数据与所述基因G的参考序列唯一比对的读段的丰度,Ab(MG)表示所述测序数据与所述基因G的参考序列非唯一比对读段的丰度;
Ab(UG)=UG/lG,
其中,UG表示所述测序数据中与所述基因G的参考基因唯一比对的读段数目,lG表示所述基因G的参考基因长度;
其中,MG为所述测序数据中与所述基因G的参考基因非唯一比对的读段的数目,i表示所述非唯一比对读段的编号,Coi为所述第i读段对应的丰度系数;
其中,Coi,G表示针对所述标志基因G,所述非唯一比对的读段i的丰度系数,N为所述非唯一比对的读段i能够比对的基因的总数,j表示所述非唯一比对的读段i能够比对的基因的编号。
对于这些reads,发明人以加和的N个基因的unique reads的丰度作为标准,即对于multiple reads,发明人把其所比对上的N个基因的unique reads丰度之和作为分母。
3.3筛选基因基因标记物
为了获得与溃疡性结肠炎疾病密切相关的基因标记物,发明人利用溃疡性结肠炎患者组(16例)与健康人组(13例)两组粪便基因丰度数据,在基因层面做了一个与疾病相关性的研究。
基于得到的基因丰度表,发明人设置标准如下:(1)溃疡性结肠炎患者组或健康人组基因丰度的中位数必须大于0.00001;(2)通过结合Benjamini Hochberg的多重检验的Wilcoxon秩和检验进行检验,得到每个基因和溃疡性结肠炎疾病的相关性p值;(3)使用一个相对严格的阈值(p_values<0.01)。利用上述参数进行筛选后,发明人得到10个与溃疡性结肠炎疾病密切相关的基因标志物,其中,在溃疡性结肠炎(Caries)患者中富集的基因有4个,在健康人(Health)中富集的有6个基因,这10个基因标记物如表1所示。
表1:
实施例2基因标记物的验证
为了验证实施例1中的发现,发明人进一步分析验证群体中的6个健康人及9个溃疡性结肠炎患者的粪便样本中的所述10个基因的丰度,并根据验证情况对所述10个基因做出删选,验证群体的DNA提取、测序以及基因丰度的分析参照实施例1进行。
验证结果如下:对于上述富集在溃疡性结肠炎患者中的6个基因,上述富集在健康人群中的6个基因中,其中,4个在验证集中得到高质量的验证(p值<0.05),验证群体中在健康人富集的基因标志物的p值如表2所示。
表2:
对于上述富集在溃疡性结肠炎患者中的4个基因,上述富集在溃疡性结肠炎患者中的4个基因中均验证集中得到高质量的验证(p值<0.05),溃疡性结肠炎患者富集的基因标志物验证的p值如表3所示。
表3:
发明人认为,可以将从健康人富集的4个基因标记物,作为溃疡性结肠炎疾病患病的反向指标,或作为治疗溃疡性结肠炎进行研发的基因制剂药物菌群成分,或作为检测溃疡性结肠炎、监测溃疡性结肠炎治疗进程的指标;将溃疡性结肠炎患者富集的4个基因标记物,作为溃疡性结肠炎疾病患病的正向指标,特别用于溃疡性结肠炎疾病简单、非创伤式的检测和诊断。
发明人利用这8个基因标记物,构建一个综合指标,估计ROC(Receiver-operatingcharacteristic)曲线下面积AUC,AUC越大,表示诊断能力越高,评价综合得分对应其对溃疡性结肠炎的诊断能力。通过对一期(第一阶段)的29个样品和二期(第二阶段)的11个样品进行评测,具体情况如图2所示,都表现出了很好的诊断能力,在一期得到AUC=95%,如图2a所示,置信区间为81.1%-100.0%;二期得到AUC=94.4%,如图2b所示,置信区间为82.5%-100.0%。
上述基因集中基因的具体信息如下:
U105F_GI_0114579
ATTAGCCTGTTTTTTGAAAAATCCGGCATAACCATAGTAGAAAGCGTCAAACACCTGCCAATCACAGCGGGTGTTTCGTGTTTTCTGAATACTATGAACGGAGGTTTTTCTATGACAATTTATGAAACCATCAAGGCGGCAATCAGCGTAAAGCAAGCCGCCAAACACTACGGGCTGAATGTCAACCGCAACGGTATGGCTTGCTGTTCGTTCCACAACGACAGGCATCCGAGCTTGAAGCTGAATGAGGACTATTTTTTCTGCTTCAGCTGCGGAGCCAAGGGGGATGTAATCGACCTTGTGGCAAGGCTGTTCGATCTGAGCAGTTATGAAGCAGTGCAAAAACTGGCTGCGGACTTTGAGCTTGACCCGAAACCGCCCACTGCCGCAGCTATGGTCAAGCCGAAGCGTCCTTATATCCGTCAGTTCCGGGAGGATGAAATGTTGTTCAGTATGCTAAGAAAGCAAATGAAACGGGGAAGCTGTATGAAGAGGATCTTGCAGAAATAA(SEQ ID NO:1)。
N16F_GI_0047596
GAAACCATGAGAACAGTAGATGTAGCTACTTTGACGCAAAATATCAAAGAAATGTGCATAGAGGCCAATCATTTCTTATCTGAGGACATGAAGACGGCATTTACAAAAGCGGAACAGCAGGAAAAAGCACCTTTGGGGAAGCAGATCCTGCAACAGTTGCAGCAGAATATGGATATTGCAGGCAAGGACATGATTCCCATCTGTCAGGATACCGGAATGGCGGTTGTATTTCTGGAAGTGGGTCAGGATGTGCATCTGACAGGGGGCAATGTGGAAGATGCCGTCAACGAAGGTGTCAGACAGGGATATGTGGACGGTTATCTGCGAAAATCTGTGGTGAAGGATCCCATTTACCGGGAGAATACGAAGGATAATACACCCGCGATCATTCATTATAGTATTGTTCCGGGGGATCGTGTCAGGATAACCGTGGCACCAAAGGGATTTGGCAGTGAGAATATGAGCAGAGTATTTATGCTCAAGCCAGCAGACGGAATAGAAGGCGTGAAGAACGCAATCCTGACGGCGGTAAAGGATGCAGGACCGAATGCGTGCCCTCCTATGGTGGTCGGAGTGGGCATTGGCGGTACTTTTGAAAAATGTGCATTGATGGCGAAGAAAGCATTGACACGTCCGGTGGATGAACATTCGGAGATACCCTATGTGAGGGAACTGGAAGAAGAGCTGCTGGAGAAGATTAATAAAACAGGCATCGGACCGGGAGGACTGGGCGGATCAACCACAGCACTGGCGGTCAATATTAATACATATCCCACACATATAGCGGGATTGCCGGTAGCTGTAAACATCTGTTGCCATGTCAATAGGCATGCAGTTAGAGAGATTTGA(SEQ ID NO:2)。
N12F_GI_0047401
ATGACAAAAGAATGCAAACAACAATTTACACTTCGGATTACACAGGCGAATTCCACGCAGTTGATCGTGATCCTGTATGAAATGACCTTACAATATCTGGCAGACGGAGAGCAGGCAGTAGATGATGCCGGACTGGTGGAAGCTGTTCATAGAGCCAGGGGATGTATCAAAGAGCTCCTGAACTCTCTGCACAGAGAATACAGCCCGGCAGGAGAGCTTTCCAGACTGTACCTGTTCTGCCTTCGCAGACTTGCTGTATGTGAAGTCCGCAGAGACCGCACAATATTGGAAGAGATTCGCAAAGTGATCGCACCTCTCTGCGATGCGTACAGGCAGATCCAGGATCAGGATACTTCCGGCCCGGTGATGAACAATTCTCAGACAGTATATGCCGGACTGACTTACGGCAGGAACCAGTTAACCGAAAACATGGCTGACCAGGGCACGAATCGGGGAATGCTGGTATAG(SEQ ID NO:3)。
N10F_GI_0062793
AAGGAGGCAGGGAAAGTGGTAGCACAAATACTTGCAGTAATCATATTTCTGGCGATGTTTGTACTGATCGTCCTGGAAGTATGGGAGAGACACATTATCACATTGGGCTGCGGTCTGCTGACACTGGTACTGGTATTCGGACTGGGAATGCACAGTATGAGCGCAGTGCTGGAGACTTTGAACTTAGGCAGCTTTTTCACAAGTCATTTCTGGTACACGGCGGGACAGTCCGCAGAGGCTTCCAGTGGTATCAACTGGGAGACCATCGTGTTCGTAGCAGGAATGATGATCATGGTAGAGGGAATGGCCCGGGTGGGATTCTTCCGCTGGCTGTGCATGCGCCTTGCCAAGATGGTCAAGTATAAGGTTGTACCGCTGTTTGTCACCTTTATGGTATTATCCGGTATTCTGGCAATGTTCATTGACAGTATTACCGTAATCCTGTTCCTGGCAGCCGTTACCATTGAACTGTCACAACTGTTGAAATTCAATCCGGTGCCTATGATTCTGGCAGAAGTGTTCTGTGCGAATCTGGGAGGATCCGCTACCATGTGCGGAGATCCCCCCAATATCATCATCGGTACTTCCCTGGGATATTCCTTCACGGATTTCCTGACCAATACCGGTGTGATCGCAGGTGTATCCCTGATCGTGGTCATATTGTATTTCTATCTGGTATTCCACAAGGAACTGCGAGCCAGCGAGGCTGCTGCAGCAGGCAGCAACCAGGCCTACCCGGATCCTTCCGAGGCCATTACCGACAAAAAGGGATTTATTATCAGCACTGTTATCTTCCTGTGTGCAGTAGTACTGCTGGTGACCCATGCACAGACTGGACTGACCGTATCCTGCATCGGTGTATTCATCTCCATCGTGACATTGATCGCTGCAGGCAAAGATGCGCTGAAGCTGATCAGACAGATTGATTACAAGACGCTGCTGTTCTTCATCGGACTGTTTATGGTCGTAGGTGGCCTGGAGCAGACAGGTATCCTGAAAGTCATGGCGAACTTCATCGGAGATATCAGTAACGGCAATCTGATGCTGATGATCGCCATTATTCTGTGGATCTCCGCCATCGCCAGCGCCTTCGTGGATAATATTCCTTTTGCGGCTACCATGATCCCTATTATCAGCAGTCTGTCCGCTACCCAGGGTGTGGAGCTGTCCATTCTGGCATGGGCACTGGCTATGGGAACCGATATTGGAGGAAGCGCAACTCCCATCGGAGCTTCTGCCAACGTAGTAGGTATCGCCACCGCAGCGAAAGCCGGTCATATGATTAAGTGGGGAAAATATTGCAAAGTTATGGCACCTGCGACTATAATAGTAGTAGGGATCTCTATGCTGATGATCTATGCAAGATATCTGTAA(SEQ ID NO:4)。
U233F_GI_0063614
ATGGAATTGAATGGAATCATCAAATGGACTCGAATGGAATCATCATCAAGTGGAATCAAATGGAATCATCGAATGGACACGAATCAAATCATCGTTGAATGGAATCGAATGGAATCATCGAATGGACTCGAAGGGAATCATTATCGAATGGAATTGAATGAAATCATAATCGAATGGAGTCGAATGGAATCATCATCGAAAGGAGTTGAATGGAAACATCACGGAATGGTATCAAATGAAATCACCGAATTGAATCAAATGGAATGA(SEQ ID NO:5)。
U229F_GI_0075263
ATGAAAAGCAACGTGAAACTCTGGGAGTTGAACACAAACATCACAGAGAAGTTTCGGAGAATGCTTCTGTTTAGTTATTATGTGAAGATATTCCCGCTTCCAAAGACATCTTCGGAGAGGGCCACATATCCACTTGCAGATTCCCCAACAAGAGAGTTTCAACAACGCTCTTTCCATAGGAGGCTTCAACTCTGTGAGTTGAATGCAATCATCACAGAGAAGTTTCTGAGAAGGCTTCTGTCTAGATTTTATGCGAAGATGTACCCGTTTCGAACGAAGGCCACAGAGTGGTCCAAATATCCACTTGCAGATCCTACAAAAAGAGTGTTTCAAACCTGA(SEQ ID NO:6)。
U114F_GI_0076513
ATGCATCTGTATAGTTTTGATGAGAAGATGATTCCGTTTCCAACGAAATCTTCAAAGAGGGCTACATGTCCCCTTGCAGATGCTACAGAAAGAGAGTTTCAAAACTGCGCTCTCAAAAGGAGTGTTCAACTCCGTGAGTTGAATGCAGTCATCACAGAGAAGCTTCTGAGAATGCTTCTGTCTAGATGTCATGTGAAGATATACCCGTTTCGAACGAAGGACACAGAGTGGTCCAAATATCCACTTGTAGATCCTGCAACAAGAGTGTTTCAAACGTGA(SEQ ID NO:7)。
N25F_GI_0086362
ATGGAATGGAATGGAATGGAATGGAATGGAATCGAAAGGAATGGAATGGAATCAACTGGAATGGAATGGAATGGAATGGAATGGAATGGAAAGGAATGGAATCGAATAGAATGGAATTGTATTAATTGGAATGGAAAGGAAAGCAATGGATTGAAATGGAAGGGAATGGAATGGAAAGGAATCAAACCGAGTGGAATAGAATGGCATGGAATGGAATGTAATCAACCAGAGTGGAATGGAATGGAATGGAATTGA(SEQ ID NO:8)。
N10F_GI_0028779
CAAAAAGTGGAGGACAAACAAATGGCAAAGAAAGTTGTATTAGCAGGCGCTTGCCGTACCGCAATCGGTACCATGGGCGGAACCTTAAGCACAACTCCTGCACCGGAGCTGGGCGCAATCGTTATCAAGGAGGCTCTGAAGAGAGCAGGCGTTGCTCCCGAAGCAGTTGACCAGGTATATATGGGATGTGTAATCCAGGCTGGCCAGGGACAGAACGTAGCACGTCAGGCAGCTATCAAAGCCGGACTTCCCATCGAAGTTCCCGCAGTTACCATGAACGTGGTATGTGGTTCTGGCCTGAACTGTGTGAACCAGGCAGCACAGATGATCATGGCCGGTGATGCAGATATCGTAGTAGCAGGTGGTATGGAGAACATGTCCATGGCTCCTTACGCAATTCCTCAGGGACGTTACGGATATCGTATGGGTAACGCAACCATGGTTGATACCATGATCAAAGATGCACTTTGGGATGCTTTCAATGATTATCATATGATCAAGACCGCAGACAACATCTGCGAAGAGTGGGGACTTACCCGTGAAGAACTGGATGAGTTCGCATTAAAGAGCCAGTTAAAGGCTGAAGAAGCTCAGAAGAACGGTGCCTTCAAGGCAGAGATCGTTCCCGTAGAAGTTAAGAAGAAAAAAGAGACCATCGTATTCGATACCGATGAAGGCCCTCGTCATGGTTCTACCATCGAAGGTCTGGCTAAGCTTCGTGCCATCAATCCCGGTGGATTCGTTACCGCAGGTAACGCTTCCGGTATCAACGACGGTGCAGCAGCTATCGTTGTTATGAGCGAAGAGAAGGCTAAGGAGCTGGGCGTTAAGCCTATGGCTACTTTCGTAGCAGGCGCTCTGGCTGGTGTTCGTCCCGAGGTTATGGGTATCGGCCCTGTAGCTTCTACCAAGAAGGTAATGGCTAAGACCGGTATGAAGATCGAAGACTTCGATATCATCGAGGCTAACGAAGCATTCGCAGCACAGTCCGTAGCAGTTGGTAAGGAACTGGGCATCGATGTAGATAAGCAGCTGAACCCCAACGGCGGTGCTATCGCTCTGGGCCATCCCGTAGGAGCTTCCGGATGCCGTATTCTGGTAACTCTGCTGCATGAGATGCAGGCAAGAGGTGCCAAGACCGGTCTGGCTACTCTGTGCATCGGCGGTGGTATGGGATGCTCCACCATCGTTAAGATCGAGGACTAA(SEQ ID NO:9)。
C104F_GI_0060563
ATGCCCATCTTTTCCCATACCGTCACAGGATACCTGTTCGCCCTGCTCGCCACCGTGGTCTGGAGCGGGAATTTCGTCGTGGCCCGCGGCCTCGCTGGAGCCCTCTCTCCGGTTGAGCTGTCCTTTTGGCGCTGGAGCATCGCGTTTCTGACCATCCTCCCCTTTGCGGGCCGGAGCCTGCTGCGTTCGCTTCCCCTCGTCCGCGGCACATGGGGCAAAGTCATTCTCATGGCCCTGCTCGGCATCACCTGTTTCAACACCTTCATCTATCAGGCCGGGCATACGACCGACGCCACCAACATGTCGCTGCTCGCCACGGCCTCTCCCATCGTCATGGCCGCCATCGCGCACCTGTTCCTGCGGGAGCGGCTTTCCCGGTTCCAGTTCTTCGGGCTGTGCGGCACCCTCTGTGGGGTCATCATCCTCGTGTCGCGCGGCAGGCTCGGCACCCTTCTCGGGCTGCGCTTTGCGCAAGGCGACTTATGGATGCTCCTTTCAGTCTTCCTGTTCGCCGTCTACAGCCTTATGCTCCGCTGCCGTCCCAAGGCGTTTCCACAAAAGGCCTTTCTTGCCCTGCTCATCGGCATCGGCGTCCTCGGCCTGATCCCGCCCCTGCTTTGGCAGGCCGCCGACACCGGGCTGAGCCCGCTGGACGGCTCCATCCTCAGCGCCCTCATCTACATAGGGGTCGGGGCATCGGTCGTTTCCTTCCTCGCGTGGAGCCTCGCGATCGAACGCATCGGCATGGTCAGGGCGGGCATCATCTACAACAGCATCCCGCTGTTTGCGAGCCTTGAGGCCACATTGTTCCTGGGCGAGTCCATCACGCTTCCGCAGATGATCGGCGGAGTGCTCATCATCGGCGGCATCTGCTACGCTTCATTCGGCGATCTCTACGCGGCAAGGCGTCTTCTCAAGTAA(SEQ ID NO:10)。
实施例3个体状态的检测
本实施例中,发明人利用11个粪便样本进行样本来源的个体状态的检测。
参照实施例2的方法确定各粪便样本中表3所示的U233F_GI_0063614、U229F_GI_0075263、U114F_GI_0076513、N25F_GI_0086362的丰度,判断各样本中的这4种基因的丰度是否落入各自在疾病对照组或者健康对照组的丰度的95%的置信区间,判定这4种基因的丰度均落入疾病组的对应区间的样本所对应的个体的状态为溃疡性结肠炎患者,判定4种基因的丰度均落入健康组的对应区间的样本所对应的个体的状态为非溃疡性结肠炎患者。
结果显示,利用本实施例所述方法能够对11个粪便样本中的10个样本进行个体状态判断,这10个粪便样本的个体状态判断结果与记录的该样本来源个体的状态一致。
另外,发明人发现对表2和表3中的基因联合检测,例如检测表3中的基因标志物被富集,同时表2中基因标记物不被富集,能够更准确的判断发现溃疡性结肠炎患者或易感人群。
在利用标志物治疗溃疡性结肠炎的方案中,发明人发现使3中的基因标志物生长得到抑制或者清除,同时使表2中基因标记物被富集,治疗效果极佳。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。
Claims (13)
1.一种试剂盒,其特征在于,包括适于检测第一基因集中的至少一个基因的试剂,所述第一基因集由以下基因组成:U105F_GI_0114579、N16F_GI_0047596、N12F_GI_0047401、N10F_GI_0062793,其中,所述第一基因集中的基因与SEQ ID NO:1-4所示的核酸序列一一对应,所述第一基因集中的基因与其对应的SEQ ID NO:1-4中的核酸序列具有不小于90%的同一性。
2.根据权利要求1所述的试剂盒,其特征在于,进一步包括适于检测第二基因集中的至少一个基因的试剂,所述第二基因集由以下基因组成:U233F_GI_0063614、U229F_GI_0075263、U114F_GI_0076513、N25F_GI_0086362,其中,所述第二基因集中的基因与SEQ IDNO:5-8所示的核酸序列一一对应,所述第二基因集中的基因与其对应的SEQ ID NO:5-8中的核酸序列具有不小于90%的同一性。
3.根据权利要求1所述的试剂盒,其特征在于,包括适于检测所述第一基因集中全部所述基因的试剂。
4.根据权利要求2所述的试剂盒,其特征在于,包括适于检测所述第二基因集中全部所述基因的试剂。
5.试剂在制备试剂盒中的用途,所述试剂适于检测第一基因集中的至少一种基因,所述试剂盒用于诊断溃疡性结肠炎或者检测溃疡性结肠炎的治疗效果,所述第一基因集由以下基因组成:U105F_GI_0114579、N16F_GI_0047596、N12F_GI_0047401、N10F_GI_0062793,其中,所述第一基因集中的基因与SEQ ID NO:1-4所示的核酸序列一一对应,所述第基因集中的基因与其对应的SEQ ID NO:1-4中的核酸序列具有不小于90%的同一性。
6.根据权利要求5所述的用途,其特征在于,所述试剂进一步适于检测第二基因集中的至少一种基因,所述第二基因集由以下基因组成:U233F_GI_0063614、U229F_GI_0075263、U114F_GI_0076513、N25F_GI_0086362,其中,所述第二基因集中的基因与SEQ ID NO:5-8所示的核酸序列一一对应,所述第二基因集中的基因与其对应的SEQ ID NO:5-8中的核酸序列具有不小于90%的同一性。
7.一种用于预防或者治疗溃疡性结肠炎的药物组合物或者食品组合物,其特征在于,含有提高第一基因集中的至少一种基因丰度的物质,所述第一基因集由以下基因组成:U105F_GI_0114579、N16F_GI_0047596、N12F_GI_0047401、N10F_GI_0062793,其中,所述第一基因集中的基因与SEQ ID NO:1-4所示的核酸序列一一对应,所述第一基因集中的基因与其对应的SEQ ID NO:1-4中的核酸序列具有不小于90%的同一性。
8.一种确定个体是否患有溃疡性结肠炎的方法,其特征在于,包括:
(1)确定所述个体的粪便样本中标志基因的丰度,所述标志基因包括第一基因集和第二基因集中的至少一种基因;
(2)将步骤(1)中得到的所述丰度与预定的阈值进行比较,以便确定所述个体是否患有溃疡性结肠炎;
其中,所述第一基因集由以下基因组成:U105F_GI_0114579、N16F_GI_0047596、N12F_GI_0047401、N10F_GI_0062793,所述第一基因集中的基因与SEQ ID NO:1-4所示的核酸序列一一对应,所述第一基因集中的基因与其对应的SEQ ID NO:1-4中的核酸序列具有不小于90%的同一性;
所述第二基因集由以下基因组成:U233F_GI_0063614、U229F_GI_0075263、U114F_GI_0076513、N25F_GI_0086362,所述第二基因集中的基因与SEQ ID NO:5-8所示的核酸序列一一对应,所述第二基因集中的基因与其对应的SEQ ID NO:5-8中的核酸序列具有不小于90%的同一性。
9.根据权利要求8所述的方法,其特征在于,步骤(1)进一步包括:
获得所述个体的粪便样本中的核酸测序数据;
将所述测序数据与参考基因组进行比对;
基于所述比对的结果,确定所述标志基因的丰度。
10.一种确定个体是否患有溃疡性结肠炎的装置,其特征在于,包括:
丰度确定单元,用于确定所述个体的粪便样本中标志基因的丰度,所述标志基因包括第一基因集和第二基因集中的至少一种基因;
比较单元,用于将所得到的所述丰度与预定的阈值进行比较,以便确定所述个体是否患有溃疡性结肠炎;
其中,所述第一基因集由以下基因组成:U105F_GI_0114579、N16F_GI_0047596、N12F_GI_0047401、N10F_GI_0062793,所述第一基因集中的基因与SEQ ID NO:1-4所示的核酸序列一一对应,所述第一基因集中的基因与其对应的SEQ ID NO:1-4中的核酸序列具有不小于90%的同一性;
所述第二基因集由以下基因组成:U233F_GI_0063614、U229F_GI_0075263、U114F_GI_0076513、N25F_GI_0086362,所述第二基因集中的基因与SEQ ID NO:5-8所示的核酸序列一一对应,所述第二基因集中的基因与其对应的SEQ ID NO:5-8中的核酸序列具有不小于90%的同一性。
11.根据权利要求10所述的装置,其特征在于,所述丰度确定单元适于通过下列步骤确定所述丰度:
获得所述个体的粪便样本中的核酸测序数据;
将所述测序数据与参考基因组进行比对;
基于所述比对的结果,确定所述标志基因的丰度。
12.一种装置,其特征在于,包括:
计算机可读存储介质,其上存储有计算机程序,所述程序用于执行权利要求8或9所述的方法;
以及一个或者多个处理器,用于执行所述计算机可读存储介质中的程序。
13.一种筛选药物的方法,其特征在于,所述药物用于治疗或者预防溃疡性结肠炎,所述方法包括:
将候选药物施用于受试者,
检测施用前后,所述受试者粪便中标志基因的丰度,所述标志基因包括第一基因集和第二基因集中的至少一种基因,
其中,满足下列条件至少之一的候选药物适于用于治疗或者预防溃疡性结肠炎:
(1)进行所述施用后,所述第一基因集中的至少一种基因的所述丰度升高;和
(2)进行所述施用后,所述第二基因集中的至少一种基因的所述丰度降低;
其中,所述第一基因集由以下基因组成:U105F_GI_0114579、N16F_GI_0047596、N12F_GI_0047401、N10F_GI_0062793,所述第一基因集中的基因与SEQ ID NO:1-4所示的核酸序列一一对应,所述第一基因集中的基因与其对应的SEQ ID NO:1-4中的核酸序列具有不小于90%的同一性;
所述第二基因集由以下基因组成:U233F_GI_0063614、U229F_GI_0075263、U114F_GI_0076513、N25F_GI_0086362,所述第二基因集中的基因与SEQ ID NO:5-8所示的核酸序列一一对应,所述第二基因集中的基因与其对应的SEQ ID NO:5-8中的核酸序列具有不小于90%的同一性。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111494171.0A CN114107484B (zh) | 2021-12-08 | 2021-12-08 | 溃疡性结肠炎标志基因及其应用 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111494171.0A CN114107484B (zh) | 2021-12-08 | 2021-12-08 | 溃疡性结肠炎标志基因及其应用 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114107484A true CN114107484A (zh) | 2022-03-01 |
CN114107484B CN114107484B (zh) | 2024-03-22 |
Family
ID=80363377
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111494171.0A Active CN114107484B (zh) | 2021-12-08 | 2021-12-08 | 溃疡性结肠炎标志基因及其应用 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114107484B (zh) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110373457A (zh) * | 2019-06-20 | 2019-10-25 | 镇江市第一人民医院 | 一种用于溃疡性结肠炎诊断的mRNA标志物及其应用 |
CN110541026A (zh) * | 2019-08-17 | 2019-12-06 | 昆明医科大学第一附属医院 | 一种检测溃疡性结肠炎的生物标志物及应用 |
CN110904213A (zh) * | 2019-12-11 | 2020-03-24 | 山东大学齐鲁医院 | 一种基于肠道菌群的溃疡性结肠炎生物标志物及其应用 |
-
2021
- 2021-12-08 CN CN202111494171.0A patent/CN114107484B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110373457A (zh) * | 2019-06-20 | 2019-10-25 | 镇江市第一人民医院 | 一种用于溃疡性结肠炎诊断的mRNA标志物及其应用 |
CN110541026A (zh) * | 2019-08-17 | 2019-12-06 | 昆明医科大学第一附属医院 | 一种检测溃疡性结肠炎的生物标志物及应用 |
CN110904213A (zh) * | 2019-12-11 | 2020-03-24 | 山东大学齐鲁医院 | 一种基于肠道菌群的溃疡性结肠炎生物标志物及其应用 |
Also Published As
Publication number | Publication date |
---|---|
CN114107484B (zh) | 2024-03-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107217089B (zh) | 确定个体状态的方法及装置 | |
CN114182007B (zh) | 白塞病标志基因及其应用 | |
CN107217088B (zh) | 强直性脊柱炎微生物标志物 | |
CN110838365A (zh) | 肠易激综合症相关菌群标志物及其试剂盒 | |
CN113913490B (zh) | 非酒精性脂肪肝标志微生物及其应用 | |
WO2016008954A1 (en) | Gut bacterial species in hepatic diseases | |
CN113724862B (zh) | 一种结直肠癌生物标志物及其筛选方法和应用 | |
CN116656851B (zh) | 一种生物标志物及其在慢性阻塞性肺疾病诊断方面的应用 | |
CN113999922B (zh) | 急性腹泻标志微生物及其应用 | |
CN114107484B (zh) | 溃疡性结肠炎标志基因及其应用 | |
CN114836508A (zh) | 慢性阻塞性肺病标志微生物及其应用 | |
CN105671177B (zh) | 强直性脊柱炎标志物及应用 | |
CN107217086B (zh) | 疾病标志物及应用 | |
CN114381493A (zh) | 炎症性肠病标志微生物及其应用 | |
CN109161590A (zh) | 整合素β4基因DNA甲基化位点在制备哮喘和或COPD早期诊断的生物标志物的应用 | |
WO2017156764A1 (zh) | 分离的核酸及应用 | |
CN114317784B (zh) | 白塞病标志微生物及其应用 | |
CN114891901A (zh) | 溃疡性结肠炎标志微生物及其应用 | |
CN114317531B (zh) | 小柳-原田综合症标志基因及其应用 | |
CN113930479B (zh) | 系统性红斑狼疮标志微生物及其应用 | |
CN114317717A (zh) | 儿童克罗恩病标志基因及其应用 | |
CN114410809A (zh) | 慢传输便秘标志微生物及其应用 | |
CN114317674B (zh) | 类风湿性关节炎标志微生物及其应用 | |
CN114085886B (zh) | 儿童克罗恩标志微生物及其应用 | |
CN114381507B (zh) | 格雷夫斯病标志微生物及其应用 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |