CN112119167B - 抑郁症生物标志物及其用途 - Google Patents
抑郁症生物标志物及其用途 Download PDFInfo
- Publication number
- CN112119167B CN112119167B CN201880092712.7A CN201880092712A CN112119167B CN 112119167 B CN112119167 B CN 112119167B CN 201880092712 A CN201880092712 A CN 201880092712A CN 112119167 B CN112119167 B CN 112119167B
- Authority
- CN
- China
- Prior art keywords
- biomarker
- depression
- relative abundance
- subject
- sample
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 239000000090 biomarker Substances 0.000 title claims abstract description 137
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 claims abstract description 78
- 241000606766 Haemophilus parainfluenzae Species 0.000 claims abstract description 30
- 241000606123 Bacteroides thetaiotaomicron Species 0.000 claims abstract description 27
- 241000607598 Vibrio Species 0.000 claims abstract description 22
- 241000193403 Clostridium Species 0.000 claims abstract description 19
- 241000131009 Copris Species 0.000 claims abstract 5
- 108090000623 proteins and genes Proteins 0.000 claims description 103
- 238000012163 sequencing technique Methods 0.000 claims description 76
- 201000010099 disease Diseases 0.000 claims description 60
- 230000000994 depressogenic effect Effects 0.000 claims description 58
- 238000000034 method Methods 0.000 claims description 45
- 150000007523 nucleic acids Chemical class 0.000 claims description 38
- 230000000968 intestinal effect Effects 0.000 claims description 35
- 108020004707 nucleic acids Proteins 0.000 claims description 32
- 102000039446 nucleic acids Human genes 0.000 claims description 32
- 238000007637 random forest analysis Methods 0.000 claims description 25
- 238000003745 diagnosis Methods 0.000 claims description 12
- 238000013179 statistical model Methods 0.000 claims description 12
- 230000007423 decrease Effects 0.000 claims description 10
- 241001148134 Veillonella Species 0.000 claims description 9
- 108700005443 Microbial Genes Proteins 0.000 claims description 7
- 230000002550 fecal effect Effects 0.000 claims description 7
- 241000304137 Bacteroides thetaiotaomicron VPI-5482 Species 0.000 claims description 5
- 239000003153 chemical reaction reagent Substances 0.000 claims description 5
- 238000004590 computer program Methods 0.000 claims description 5
- 238000007671 third-generation sequencing Methods 0.000 claims description 5
- 241000162536 Alistipes shahii WAL 8301 Species 0.000 claims description 4
- 238000000926 separation method Methods 0.000 claims description 4
- 241000775133 Haemophilus parainfluenzae ATCC 33392 Species 0.000 claims description 3
- 241000162034 Veillonella dispar ATCC 17748 Species 0.000 claims description 3
- 241000961103 [Clostridium] bolteae ATCC BAA-613 Species 0.000 claims description 3
- 238000004519 manufacturing process Methods 0.000 claims description 2
- 238000004393 prognosis Methods 0.000 claims description 2
- 241000186429 Propionibacterium Species 0.000 claims 4
- 241000408655 Dispar Species 0.000 claims 2
- 241000701474 Alistipes Species 0.000 claims 1
- 241000606125 Bacteroides Species 0.000 claims 1
- 241000606790 Haemophilus Species 0.000 claims 1
- 241001533204 Veillonella dispar Species 0.000 abstract description 12
- 241000588769 Proteus <enterobacteria> Species 0.000 abstract description 2
- 240000001689 Cyanthillium cinereum Species 0.000 abstract 1
- 241000894007 species Species 0.000 description 35
- 238000012549 training Methods 0.000 description 24
- 239000003550 marker Substances 0.000 description 18
- 244000005700 microbiome Species 0.000 description 17
- 108020004414 DNA Proteins 0.000 description 15
- 239000003814 drug Substances 0.000 description 12
- 241001246487 [Clostridium] bolteae Species 0.000 description 11
- 238000012360 testing method Methods 0.000 description 11
- 238000010200 validation analysis Methods 0.000 description 11
- 238000001514 detection method Methods 0.000 description 10
- 241000385060 Prevotella copri Species 0.000 description 8
- 230000006870 function Effects 0.000 description 8
- 244000005709 gut microbiome Species 0.000 description 8
- 208000035475 disorder Diseases 0.000 description 7
- 229940079593 drug Drugs 0.000 description 7
- 238000012544 monitoring process Methods 0.000 description 7
- 238000012795 verification Methods 0.000 description 7
- 208000020401 Depressive disease Diseases 0.000 description 6
- 230000000694 effects Effects 0.000 description 6
- 230000008569 process Effects 0.000 description 6
- 230000001225 therapeutic effect Effects 0.000 description 6
- 208000002606 Paramyxoviridae Infections Diseases 0.000 description 5
- 238000004458 analytical method Methods 0.000 description 5
- 238000004364 calculation method Methods 0.000 description 5
- 238000011161 development Methods 0.000 description 5
- 206010012601 diabetes mellitus Diseases 0.000 description 5
- 238000013399 early diagnosis Methods 0.000 description 5
- 230000002068 genetic effect Effects 0.000 description 5
- 238000012165 high-throughput sequencing Methods 0.000 description 5
- 238000012216 screening Methods 0.000 description 5
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 4
- 241001148135 Veillonella parvula Species 0.000 description 4
- 229940000406 drug candidate Drugs 0.000 description 4
- 230000008451 emotion Effects 0.000 description 4
- 238000011156 evaluation Methods 0.000 description 4
- 239000012634 fragment Substances 0.000 description 4
- 238000007619 statistical method Methods 0.000 description 4
- 208000001072 type 2 diabetes mellitus Diseases 0.000 description 4
- 241000894006 Bacteria Species 0.000 description 3
- 241000233866 Fungi Species 0.000 description 3
- 238000003556 assay Methods 0.000 description 3
- 230000004071 biological effect Effects 0.000 description 3
- 238000010276 construction Methods 0.000 description 3
- 238000002790 cross-validation Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 210000001035 gastrointestinal tract Anatomy 0.000 description 3
- 239000002207 metabolite Substances 0.000 description 3
- 239000002773 nucleotide Substances 0.000 description 3
- 125000003729 nucleotide group Chemical group 0.000 description 3
- 230000002265 prevention Effects 0.000 description 3
- 238000004445 quantitative analysis Methods 0.000 description 3
- 238000012502 risk assessment Methods 0.000 description 3
- 239000007787 solid Substances 0.000 description 3
- 239000000126 substance Substances 0.000 description 3
- 241001465754 Metazoa Species 0.000 description 2
- 241001466178 Prevotella copri DSM 18205 Species 0.000 description 2
- 230000002159 abnormal effect Effects 0.000 description 2
- 238000012098 association analyses Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000012350 deep sequencing Methods 0.000 description 2
- 230000007547 defect Effects 0.000 description 2
- 238000009826 distribution Methods 0.000 description 2
- 230000004064 dysfunction Effects 0.000 description 2
- 210000003608 fece Anatomy 0.000 description 2
- 229930182851 human metabolite Natural products 0.000 description 2
- 238000007689 inspection Methods 0.000 description 2
- 230000005923 long-lasting effect Effects 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 230000002503 metabolic effect Effects 0.000 description 2
- 230000004060 metabolic process Effects 0.000 description 2
- 230000000813 microbial effect Effects 0.000 description 2
- 235000015097 nutrients Nutrition 0.000 description 2
- 238000003752 polymerase chain reaction Methods 0.000 description 2
- 230000007943 positive regulation of appetite Effects 0.000 description 2
- 238000002360 preparation method Methods 0.000 description 2
- 102000004169 proteins and genes Human genes 0.000 description 2
- 208000020016 psychiatric disease Diseases 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 230000035945 sensitivity Effects 0.000 description 2
- 208000019116 sleep disease Diseases 0.000 description 2
- 208000024891 symptom Diseases 0.000 description 2
- 238000002560 therapeutic procedure Methods 0.000 description 2
- 101150096372 1.3 gene Proteins 0.000 description 1
- 108020004465 16S ribosomal RNA Proteins 0.000 description 1
- 241000030716 Alistipes shahii Species 0.000 description 1
- 238000012935 Averaging Methods 0.000 description 1
- 102000019034 Chemokines Human genes 0.000 description 1
- 108010012236 Chemokines Proteins 0.000 description 1
- 241000186427 Cutibacterium acnes Species 0.000 description 1
- 102000004127 Cytokines Human genes 0.000 description 1
- 108090000695 Cytokines Proteins 0.000 description 1
- 238000007400 DNA extraction Methods 0.000 description 1
- 241000282412 Homo Species 0.000 description 1
- 241000124008 Mammalia Species 0.000 description 1
- 238000000585 Mann–Whitney U test Methods 0.000 description 1
- 108091028043 Nucleic acid sequence Proteins 0.000 description 1
- 208000008589 Obesity Diseases 0.000 description 1
- 241000011500 Phyllostachys praecox Species 0.000 description 1
- 201000009916 Postpartum depression Diseases 0.000 description 1
- 241000288906 Primates Species 0.000 description 1
- 241001648298 Propionivibrio Species 0.000 description 1
- 101150040974 Set gene Proteins 0.000 description 1
- 230000009102 absorption Effects 0.000 description 1
- 238000010521 absorption reaction Methods 0.000 description 1
- 230000003213 activating effect Effects 0.000 description 1
- 125000000539 amino acid group Chemical group 0.000 description 1
- 230000037354 amino acid metabolism Effects 0.000 description 1
- 239000000427 antigen Substances 0.000 description 1
- 108091007433 antigens Proteins 0.000 description 1
- 102000036639 antigens Human genes 0.000 description 1
- 238000007622 bioinformatic analysis Methods 0.000 description 1
- 230000031018 biological processes and functions Effects 0.000 description 1
- 150000001720 carbohydrates Chemical class 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 210000000349 chromosome Anatomy 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000003001 depressive effect Effects 0.000 description 1
- 230000001627 detrimental effect Effects 0.000 description 1
- 235000014113 dietary fatty acids Nutrition 0.000 description 1
- 230000004069 differentiation Effects 0.000 description 1
- 230000029087 digestion Effects 0.000 description 1
- 230000001079 digestive effect Effects 0.000 description 1
- 238000009510 drug design Methods 0.000 description 1
- 238000007877 drug screening Methods 0.000 description 1
- 239000003596 drug target Substances 0.000 description 1
- 238000004146 energy storage Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 229930195729 fatty acid Natural products 0.000 description 1
- 239000000194 fatty acid Substances 0.000 description 1
- 230000004129 fatty acid metabolism Effects 0.000 description 1
- 150000004665 fatty acids Chemical class 0.000 description 1
- 235000013305 food Nutrition 0.000 description 1
- 108091008053 gene clusters Proteins 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 230000028993 immune response Effects 0.000 description 1
- 210000000987 immune system Anatomy 0.000 description 1
- 230000036039 immunity Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 210000002490 intestinal epithelial cell Anatomy 0.000 description 1
- 238000002955 isolation Methods 0.000 description 1
- 208000024714 major depressive disease Diseases 0.000 description 1
- 230000035800 maturation Effects 0.000 description 1
- 238000002705 metabolomic analysis Methods 0.000 description 1
- 230000001431 metabolomic effect Effects 0.000 description 1
- 244000005706 microflora Species 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 230000002438 mitochondrial effect Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000010369 molecular cloning Methods 0.000 description 1
- 239000002547 new drug Substances 0.000 description 1
- 235000020824 obesity Nutrition 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 230000003647 oxidation Effects 0.000 description 1
- 238000007254 oxidation reaction Methods 0.000 description 1
- 230000036407 pain Effects 0.000 description 1
- 230000008058 pain sensation Effects 0.000 description 1
- 230000001717 pathogenic effect Effects 0.000 description 1
- 230000001575 pathological effect Effects 0.000 description 1
- 230000007170 pathology Effects 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 230000000144 pharmacologic effect Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 229940055019 propionibacterium acne Drugs 0.000 description 1
- 238000004451 qualitative analysis Methods 0.000 description 1
- 238000003908 quality control method Methods 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 238000002864 sequence alignment Methods 0.000 description 1
- 210000002966 serum Anatomy 0.000 description 1
- 239000000344 soap Substances 0.000 description 1
- ZFMRLFXUPVQYAU-UHFFFAOYSA-N sodium 5-[[4-[4-[(7-amino-1-hydroxy-3-sulfonaphthalen-2-yl)diazenyl]phenyl]phenyl]diazenyl]-2-hydroxybenzoic acid Chemical compound C1=CC(=CC=C1C2=CC=C(C=C2)N=NC3=C(C=C4C=CC(=CC4=C3O)N)S(=O)(=O)O)N=NC5=CC(=C(C=C5)O)C(=O)O.[Na+] ZFMRLFXUPVQYAU-UHFFFAOYSA-N 0.000 description 1
- 238000000528 statistical test Methods 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
- 238000010998 test method Methods 0.000 description 1
- 239000013598 vector Substances 0.000 description 1
- 239000011782 vitamin Substances 0.000 description 1
- 235000013343 vitamin Nutrition 0.000 description 1
- 229940088594 vitamin Drugs 0.000 description 1
- 229930003231 vitamin Natural products 0.000 description 1
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N33/00—Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
- G01N33/48—Biological material, e.g. blood, urine; Haemocytometers
- G01N33/50—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
- G01N33/68—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
- G01N33/6893—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids related to diseases not provided for elsewhere
- G01N33/6896—Neurological disorders, e.g. Alzheimer's disease
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P25/00—Drugs for disorders of the nervous system
- A61P25/24—Antidepressants
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/02—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving viable microorganisms
- C12Q1/04—Determining presence or kind of microorganism; Use of selective media for testing antibiotics or bacteriocides; Compositions containing a chemical indicator therefor
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6876—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
- C12Q1/6883—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6876—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
- C12Q1/6888—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms
- C12Q1/689—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms for bacteria
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N2800/00—Detection or diagnosis of diseases
- G01N2800/30—Psychoses; Psychiatry
- G01N2800/304—Mood disorders, e.g. bipolar, depression
Landscapes
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Organic Chemistry (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Analytical Chemistry (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- General Health & Medical Sciences (AREA)
- Immunology (AREA)
- Molecular Biology (AREA)
- Biochemistry (AREA)
- Microbiology (AREA)
- Biotechnology (AREA)
- Biomedical Technology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Genetics & Genomics (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Biophysics (AREA)
- Pathology (AREA)
- Medicinal Chemistry (AREA)
- Neurosurgery (AREA)
- Neurology (AREA)
- Hematology (AREA)
- Urology & Nephrology (AREA)
- Psychiatry (AREA)
- General Chemical & Material Sciences (AREA)
- General Physics & Mathematics (AREA)
- Toxicology (AREA)
- Pain & Pain Management (AREA)
- Cell Biology (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Food Science & Technology (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Pharmacology & Pharmacy (AREA)
- Animal Behavior & Ethology (AREA)
- Public Health (AREA)
- Veterinary Medicine (AREA)
Abstract
提供了一种用于抑郁症的生物标志物及其用途,其包括选自下列中的至少一种:多形拟杆菌(Bacteroides thetaiotaomicron)和/或其类似物,穗状丁酸弧菌(Butyriyibrio crossotus)和/或其类似物,Alistipes shahii和/或其类似物,鲍氏梭菌(Clostridium bo1teae)和/或其类似物,副流感嗜血杆菌(Haemophilus parainfluenzae)和/或其类似物,殊异韦荣菌(Veillonella dispar)和/或其类似物,和普氏菌(Prevotella copri)和/或其类似物。还提供了用于检测所述生物标志物的试剂盒,以及一种检测或预测对象是否患有抑郁症或相关疾病的设备。
Description
技术领域
本发明涉及生物医药领域,具体地涉及抑郁症生物标志物及其用途。具体地,本发明涉及抑郁症或相关疾病的生物标志物、诊断或预测抑郁症或相关疾病风险的方法、试剂盒及抑郁症生物标志物在制备试剂盒中的用途。
背景技术
抑郁症(英语:Depression),是最普遍的一种精神类疾病,常表现为长时间持续的抑郁情绪,并且这种情绪明显超过必要的限度,缺乏自信,避开人群,甚至有罪恶感,感到身体能量的明显降低,时间的感受力减慢,无法在任何有趣的活动中体会到快乐。这类障碍还会造成患者的躯体功能失调,如睡眠紊乱或食欲暴进或减退、痛觉等;大规模全国流行病学研究显示,中国抑郁症患者数量居世界首位。世界卫生组织(WHO)最新报告显示,2015年,全球超过3亿人受抑郁症困扰,约占全球人口的4.3%。中国抑郁症病例占全国人口的4.2%;世卫组织驻华代表处2017年3月发表的通报指出,全球平均每十个人当中就有一人在一生中至少经历一次重度抑郁症。据估计,世界各地现有3亿2200多万不同年龄的人罹患抑郁症,而中国的患者人数至少在5400万。
现有技术对抑郁的诊断主要基于医师对病人特征的判断,并没有明确的生理生化指标作为参考,而且对中国而言,地市级以上医院对抑郁症的识别率不到20%,超过80%的患者被误诊或漏诊,并且现有的诊断标准不能做到早期预警。
因此,对于抑郁症的早期诊断以及研究仍有待改进。本领域迫切需要对抑郁症生物标志物进行进一步的研究。
发明内容
本申请是基于发明人对以下事实和问题的发现和认识作出的:肠道微生物是存在于人体肠道中的微生物群落,是人体的“第二基因组”。人体肠道菌群和宿主构成一个相互关联的整体,肠道微生物不仅能降解食物中消化的营养成分、宿主维生素以及其他的一些营养物质,还能促进肠上皮细胞的分化与成熟,从而激活肠道免疫系统以及调节宿主能量存储与代谢,这些在人体的消化吸收、免疫反应、代谢活性等方面都发挥着重要的作用。因此,本发明发明人通过对抑郁症患者以及健康人群的肠道菌群以及基因序列进行分析,从而筛选出与抑郁症病相关性高的生物标志物,并且利用该标志物能够准确地诊断抑郁症或相关疾病,并且可以用于监测治疗效果。
因此,本发明目的在于提供用于评估抑郁症风险或者早期诊断抑郁症的生物标志物,以及抑郁症的诊断和患病风险评估方法,可以解决现有抑郁症诊断方法不能做到早期预警、不能预测抑郁症发病以及发展的趋势等缺点。从而可以应用于预测抑郁症发病以及发展的趋势,以及应用于疾病病理分型。
据认为,由于以下原因,抑郁症相关的生物标记物对早期诊断是有价值的。第一,本发明的标记物具有特异性和灵敏性。第二,粪便的分析保证准确性、安全性、可负担性和患者依从性。并且粪便的样本是可运输的。基于聚合酶链反应(PCR)的试验舒适且无创,所以人们会更容易参与给定的筛选程序。第三,本发明的标记物还可以用作用于对抑郁症患者进行治疗监测的工具以检测对治疗的响应。
根据本发明的第一方面,本发明提供了一种生物标志物。根据本发明的实施例,该生物标志物包括选自下列中的至少一种:
多形拟杆菌(Bacteroides thetaiotaomicron)和/或其类似物,穗状丁酸弧菌(Butyriyibrio crossotus)和/或其类似物,Alistipes shahii和/或其类似物,鲍氏梭菌(Clostridium bolteae)和/或其类似物,副流感嗜血杆菌(Haemophilus parainfluenzae)和/或其类似物,殊异韦荣菌(Veillonella dispar)和/或其类似物,和普氏菌(Prevotellacopri)和/或其类似物,所述多形拟杆菌(Bacteroides thetaiotaomicron)类似物与多形拟杆菌(Bacteroides thetaiotaomicron)的基因组序列相比,比对相似度在85%以上,所述穗状丁酸弧菌(Butyriyibrio crossotus)类似物与穗状丁酸弧菌(Butyriyibriocrossotus)的基因组序列相比,比对相似度在85%以上,所述Alistipes shahii类似物与Alistipes shahii的基因组序列相比,比对相似度在85%以上,所述鲍氏梭菌(Clostridium bolteae)类似物与鲍氏梭菌(Clostridium bolteae)的基因组序列相比,比对相似度在85%以上,所述副流感嗜血杆菌(Haemophilus parainfluenzae)类似物与副流感嗜血杆菌(Haemophilus parainfluenzae)的基因组序列相比,比对相似度在85%以上,所述殊异韦荣菌(Veillonella dispar)类似物与殊异韦荣菌(Veillonella dispar)的基因组序列相比,比对相似度在85%以上,所述普氏菌(Prevotella copri)类似物与普氏菌(Prevotella copri)的基因组序列相比,比对相似度在85%以上。这些生物标志物均可以作为抑郁症检测的生物学标记物,可以通过确定对象肠道菌群中是否存在这些标志物中的一种或者两种或者多种,从而有效地确定检测对象是否患有或者易感抑郁症(即预测患有抑郁症的风险),并且还可以进一步将这些生物标志物用于监控抑郁症患者的治疗效果。另外,当健康样本量足够多的时候,本领域技术人员还可以根据检验和计算方法,得到每个生物标志物在肠道中的正常值或者正常的范围,从而用来指示每种标志物在健康样本中的含量,由此,可以通过对样本中这些生物标志物的至少一种在肠道菌群中的含量进行检测,来确定对象是否患有或者易感抑郁症,同时可以用来监控抑郁症患者的治疗效果的效率。而且本领域技术人员可知的是,当某种未知的微生物或者某种核酸来源的某些基因序列与某种已知菌株的基因序列相比,比对相似度在85%以上的时候,即可认为该微生物与该菌株属于同一属,或者可以将基因序列归类到与该菌株同属,而同属的微生物通常具有相同或相似的功能,因此,也可以利用这些类似物作为抑郁症的标志物。
本发明中比对相似性,也可以称为比对相似度,是指序列比对过程中目标序列(待确定的序列)和参考序列(已知序列)之间相同碱基或氨基酸残基序列所占比例的大小。
根据本发明的实施例,所述生物标志物选自多形拟杆菌VPI-5482(Bacteroidesthetaiotaomicron VPI-5482),穗状丁酸弧菌DSM 2876(Butyriyibrio crossotus DSM2876),Alistipes shahii WAL 8301,鲍氏梭菌ATCC BAA-613(Clostridium bolteae ATCCBAA-613),副流感嗜血杆菌(Haemophilus parainfluenzae ATCC T3T1),副流感嗜血杆菌ATCC 33392(Haemophilus parainfluenzae ATCC 33392),殊异韦荣菌ATCC 17748(Veillonella dispar ATCC 17748),或普氏菌DSM 18205(Prevotella copri DSM 18205)中的至少一种。这些生物标志物作为多形拟杆菌(Bacteroides thetaiotaomicron),穗状丁酸弧菌(Butyriyibrio crossotus),Alistipes shahii,鲍氏梭菌(Clostridiumbolteae),副流感嗜血杆菌(Haemophilus parainfluenzae),殊异韦荣菌(Veillonelladispar)和普氏菌(Prevotella copri)的代表性菌株,均可以用来指示抑郁症或者抑郁症相关疾病的患病状态或者患病风险。
根据本发明的实施例,所述多形拟杆菌(Bacteroides thetaiotaomicron)类似物与多形拟杆菌(Bacteroides thetaiotaomicron)的基因组序列相比,比对相似度在95%以上,所述穗状丁酸弧菌(Butyriyibrio crossotus)类似物与穗状丁酸弧菌(Butyriyibriocrossotus)的基因组序列相比,比对相似度在95%以上,所述Alistipes shahii类似物与Alistipes shahii的基因组序列相比,比对相似度在95%以上,所述鲍氏梭菌(Clostridium bolteae)类似物与鲍氏梭菌(Clostridium bolteae)的基因组序列相比,比对相似度在95%以上,所述副流感嗜血杆菌(Haemophilus parainfluenzae)类似物与副流感嗜血杆菌(Haemophilus parainfluenzae)的基因组序列相比,比对相似度在95%以上,所述殊异韦荣菌(Veillonella dispar)类似物与殊异韦荣菌(Veillonella dispar)的基因组序列相比,比对相似度在95%以上,所述普氏菌(Prevotella copri)类似物与普氏菌(Prevotella copri)的基因组序列相比,比对相似度在95%以上。本领域技术人员可知的是,当某种未知微生物或者某种核酸来源的基因序列与某种已知菌株相比,比对相似度在95%以上的时候,即可以认为该微生物与该菌株同种,或者可以将基因序列归类到与该菌株同种。由此,本领域技术人员可以直接通过对检测对象中的核酸序列信息获取,然后将其与多形拟杆菌(Bacteroides thetaiotaomicron)、或者与穗状丁酸弧菌(Butyriyibriocrossotus)、或者与Alistipes shahii、或者与鲍氏梭菌(Clostridium bolteae)、或者与副流感嗜血杆菌(Haemophilus parainfluenzae)、或者与殊异韦荣菌(Veillonelladispar)、或者与普氏菌(Prevotella copri)的基因组序列进行比对,如有95%以上的序列相似性,则就可以作为检测对象是否患有抑郁症或者易感抑郁症的标志。
根据本发明的实施例,当所述各菌类似物与相应的菌的基因组序列相比,比对覆盖度在80%以上,且比对相似度在85%以上时,均可以认为这些类似物与相应菌属于同一属,可以作为抑郁症的标志物。优选地,当这些类似物与相应的菌的比对覆盖度在80%以上,且比对相似度在95%以上时,均可以认为这些类似物与相应菌同种,可以作为抑郁症的标志物。
本发明中比对覆盖度,指的是对目标序列与参考序列比对的过程中,目标序列中拿来和参考序列进行比对的序列的长度占检测序列总长度的比例。
根据本发明的第二方面,本发明提出了一种诊断对象是否患有抑郁症或相关疾病或者预测对象是否患有抑郁症或相关疾病的风险的方法。根据本发明的实施例,所述方法包括步骤:(1)从所述对象中采集样本;(2)确定步骤(1)中获得的所述样本中生物标志物的相对丰度信息,所述生物标志物为根据本发明第一方面的生物标志物;(3)将步骤(2)中所述的相对丰度信息与参考数据集或参考值进行比较。所述方法不仅仅可以用于专利法意义上的疾病诊断,同时可以用作科学研究或者其他个人遗传信息的丰富以及遗传信息库的丰富等非疾病诊断。利用检测对象中的各生物标志物的相对丰度信息与参考数据集或参考值进行比较,来确定对象是否患有抑郁症或相关疾病,或者预测其患有抑郁症或者相关疾病的风险。
本发明中所述参考数据集指的是对已确诊为患病个体和健康个体的样本进行操作,所获得的各生物标志物的相对丰度信息,用来作为每种生物标志物的相对丰度的参考。在本发明的一个实施方案中,参考数据集是指训练数据集。根据本发明,所述训练集是指和验证集具有本领域公知的含义。在本发明的一个实施方案中,所述训练集是指包含一定样本数的抑郁症受试者和非抑郁症受试者待测样本中的各生物标志物的含量的数据集合。所述验证集是用来测试训练集性能的独立数据集合。
本发明中所述参考值指的是健康对照的参考值或正常值。本领域技术人员已知,当样本容量足够大时,可利用本领域公知的检测和计算方法获得样品中每个生物标志物的正常值(绝对值)的范围。当采用测定方法检测生物标志物的水平时,可将样品中的生物标志物水平的绝对值直接与参考值进行比较,以评估患病风险以及诊断或早期诊断抑郁症或相关疾病,任选地,可以包括统计方法。
本发明中所述抑郁症相关疾病,意指与抑郁症相互关联的疾病,包括可以引发抑郁症的前期的症状或疾病,以及由抑郁症引发的后续的或者并发的症状或疾病,也包括一些单次发作抑郁症,产后抑郁等等。
根据本发明的实施例,所述方法可以进一步附加如下技术特征:
根据本发明的实施例,所述参考数据集包括来自多个抑郁症和多个健康对照的样本中的生物标志物的相对丰度信息,所述生物标志物为根据本发明第一方面的所述的生物标志物。
根据本发明的实施例,在将步骤(2)中所述的相对丰度信息与参考数据集进行比较的步骤中,还包括执行多元统计模型以获得患病概率。利用多元统计模型可以实现快速高效检测。
根据本发明的实施例,所述多元统计模型为随机森林模型。
根据本发明的实施例,所述患病概率大于阈值表明所述对象患有抑郁症或相关疾病或者有患有抑郁症或相关疾病的风险。
根据本发明的实施例,所述阈值为0.5。
根据本发明的实施例,当与参考值进行比较时,所述多形拟杆菌(Bacteroidesthetaiotaomicron)和/或其类似物,所述Alistipes shahii和/或其类似物,和所述普氏菌(Prevotella copri)和/或其类似物的减少表明所述对象患有抑郁症或相关疾病或者处于患有抑郁症或相关疾病的风险中,所述穗状丁酸弧菌(Butyriyibrio crossotus)和/或其类似物,所述鲍氏梭菌(Clostridium bolteae)和/或其类似物,所述副流感嗜血杆菌(Haemophilus parainfluenzae)和/或其类似物和所述殊异韦荣菌(Veillonella dispar)和/或其类似物的增加表明所述对象患有抑郁症或相关疾病或者处于患有抑郁症或相关疾病的风险中。
根据本发明的实施例,步骤(2)中所述生物标志物的相对丰度信息是利用测序方法得到的,进一步包括:从所述对象的所述样本中分离得到核酸样本,基于所获得的所述核酸样本,构建DNA文库,对所述DNA文库进行测序,以便获得测序结果,以及基于所述测序结果,将测序结果与参考基因集进行比对,以确定所述生物标志物的相对丰度信息。根据本发明的一种实施例,可以利用SOAP2和MAQ的至少一种将测序结果与参考基因集进行比对,由此,可以提高比对的效率,进而可以提高抑郁症检测的效率。根据本发明的实施例,可以同时对多种(至少两种)生物标志物进行检测,可以提高抑郁症检测的效率。
根据本发明的实施例,所述参考基因集包括从多个抑郁症患者和多个健康对照的样本中进行宏基因组测序,获得非冗余基因集,然后将所述非冗余基因集与肠道微生物基因集合并,得到所述参考基因集。本发明中的参考基因集可以是已有的基因集,如现有的已经公开的肠道微生物参考基因集;也可以是将多个抑郁症患者和多个健康对照的样品进行宏基因组测序,获得非冗余基因集,然后将所述非冗余基因集与肠道微生物基因集合并,得到所述参考基因集,由此获得的参考基因集信息更全面,检测结果更可靠。
本发明中所述非冗余基因集作本领域技术人员通常的理解来解释,简单来说是去除冗余基因后的剩余基因的集合。冗余基因通常指的是一条染色体上出现的一个基因的多个复份。
根据本发明的实施例,所述样本为粪便样本。
根据本发明的实施例,所述测序方法是通过第二代测序方法或第三代测序方法进行的。进行测序的手段并不受特别限制,通过二代或者三代测序的方法进行测序,可以实现快速高效的测序。
根据本发明的实施例,所述测序方法是通过选自Hiseq2000、SOLiD、454、和单分子测序装置的至少一种进行的。由此,能够利用这些测序装置的高通量、深度测序的特点,从而有利于对后续测序数据进行分析,尤其是进行统计学检验时的精确性和准确度。
根据本发明的第三方面,本发明提出了一种试剂盒,包括用于检测生物标志物的试剂,所述生物标志物包括根据本发明的第一方面的生物标志物。利用该试剂盒,可以确定这些标志物在肠道菌群中的相对丰度,由此,可以通过所得到的相对丰度值,从而确定对象是否患有或者易感抑郁症,以及用于监控抑郁症患者的治疗效果的效率。
根据本发明的实施例,所述试剂盒包括一组参考数据集或者参考值,用来作为每种生物标志物的相对丰度的参考。优选可以将参考数据集或者参考值附在物理载体上,例如光盘,如CD-ROM等。
根据本发明的实施例,所述试剂盒还包括第一计算机程序产品,该第一计算机程序产品用来执行获得所述的参考数据集或者参考值。即该第一计算机程序产品用来执行获得诊断对象是否患有抑郁或相关疾病或者预测对象是否患有抑郁或相关疾病的一组参考数据集或者参考值。
根据本发明的实施例,所述试剂盒还包括第二计算机程序产品,该第二计算机程序产品还可以用来执行根据本发明第二方面所述的诊断对象是否患有抑郁或相关疾病或者预测对象是否患有抑郁或相关疾病的风险的方法。
根据本发明的第四方面,本发明提出了生物标志物在制备试剂盒中的用途,所述试剂盒用于诊断对象是否患有抑郁症或相关疾病或者预测对象是否患有抑郁症或相关疾病的风险。根据本发明的实施例,所述诊断或预测包括以下步骤:1)从所述对象中采集样本;2)确定步骤1)中获得的所述样本中生物标志物的相对丰度信息,所述生物标志物为根据本发明的第一方面的生物标志物;3)将步骤2)中所述的相对丰度信息与参考数据集或参考值进行比较。根据所述的试剂盒,可以确定这些标志物在肠道菌群中的相对丰度,由此,可以通过所得到的相对丰度值,从而确定对象是否患有或者易感抑郁症,以及用于监控抑郁症患者的治疗效果的效率。
根据本发明的实施例,以上生物标志物在制备试剂盒中的用途,可以进一步附加如下技术特征:
根据本发明的实施例,以上用途中,所述参考数据集包括来自多个抑郁症患者和多个健康对照的样本中的生物标志物的相对丰度信息,所述生物标志物为根据本发明第一方面的所述生物标志物。
根据本发明的实施例,以上用途中,在将步骤2)中所述的相对丰度信息与参考数据集进行比较的步骤中,还包括执行多元统计模型以获得患病概率;优选地,所述多元统计模型为随机森林模型。
根据本发明的实施例,以上用途中,所述患病概率大于阈值表明所述对象患有抑郁症或相关疾病或者有患有抑郁症或相关疾病的风险;优选地,所述阈值为0.5。
根据本发明的实施例,以上用途中,当与参考值进行比较时,所述多形拟杆菌(Bacteroides thetaiotaomicron)和/或其类似物,所述Alistipes shahii和/或其类似物,和所述普氏菌(Prevotella copri)和/或其类似物的减少表明所述对象患有抑郁症或相关疾病或者处于患有抑郁症或相关疾病的风险中,所述穗状丁酸弧菌(Butyriyibriocrossotus)和/或其类似物,所述鲍氏梭菌(Clostridium bolteae)和/或其类似物,所述副流感嗜血杆菌(Haemophilus parainfluenzae)和/或其类似物和所述殊异韦荣菌(Veillonella dispar)和/或其类似物的增加表明所述对象患有抑郁症或相关疾病或者处于患有抑郁症或相关疾病的风险中。
根据本发明的实施例,以上用途中,通过测序方法得到步骤2)中所述生物标志物的相对丰度信息,进一步包括:从所述对象的所述样本中分离得到核酸样本,基于所获得的所述核酸样本,构建DNA文库,对所述DNA文库进行测序,以便获得测序结果,以及基于所述测序结果,将测序结果与参考基因集进行比对,以确定所述生物标志物的相对丰度信息。
根据本发明的实施例,以上用途中,所述参考基因集包括从多个抑郁症患者和多个健康对照的样本中进行宏基因组测序,获得非冗余基因集,然后将所述非冗余基因集与肠道微生物基因集合并,得到所述参考基因集。
根据本发明的实施例,以上用途中,所述样本为粪便样本。
根据本发明的实施例,以上用途中,所述测序方法是通过第二代测序方法或第三代测序方法进行的。
根据本发明的实施例,以上用途中,所述测序方法是通过选自Hiseq2000、SOLiD、454、和单分子测序装置的至少一种进行的。
根据本发明的第五方面,本发明提出了一种生物标志物作为靶点用于筛选治疗或者预防抑郁症或相关疾病的药物的用途。根据本发明的实施例,所述生物标志物为根据本发明的第一方面的生物标志物。根据本发明的实施例,可以利用候选药物使用前和使用后对这些生物标志物的影响,从而确定候选药物是否可以用于治疗或预防抑郁症。
根据本发明的第六方面,本发明提出了一种生物标志物在诊断对象是否患有抑郁症或相关疾病或者预测对象是否患有抑郁症或相关疾病的风险中的用途。根据本发明的实施例,所述生物标志物包括根据本发明第一方面的生物标志物。
根据本发明的第七方面,本发明提出了一种药物,所述药物用于预防或治疗抑郁症或相关疾病。根据本发明的实施例,所述药物能够使得检测对象中多形拟杆菌(Bacteroides thetaiotaomicron)和/或其类似物,Alistipes shahii和/或其类似物,普氏菌(Prevotella copri)和/或其类似物的相对丰度增加;或者所述药物能够使得穗状丁酸弧菌(Butyriyibrio crossotus)和/或其类似物,所述鲍氏梭菌(Clostridium bolteae)和/或其类似物,副流感嗜血杆菌(Haemophilus parainfluenzae)和/或其类似物、殊异韦荣菌(Veillonella dispar)和/或其类似物的相对丰度减少。
本发明所取得的有益效果为:粪便是人体的代谢产物,其内不仅包含人体的代谢产物,还包括对我们的机体代谢和免疫以及机体其他功能的变化密切相关的肠道微生物,对粪便进行研究,发现在抑郁症患者和健康人群的肠道菌群的组成上存在明显的差异,可以准确地对抑郁症患者进行患病风险评估、早期诊断。本发明通过对抑郁症患者和健康人群的肠道菌群的比较和分析,得到多种相关的肠道菌株,结合高质量的抑郁症人群和非抑郁症人群MLGs作为训练集,能够准确地对抑郁症患者进行患病风险评估、早期诊断。该方法与目前常用的诊断方法相比,具有方便、快捷的特点。
本发明的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
本发明的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解,其中:
图1示出了根据本发明一个实施例中确定对象是否患有抑郁症或相关疾病或者预测对象是否患有抑郁症或相关疾病的设备的结构示意图,其中图a为所述设备的示意图,图b为设备中的生物标志物相对丰度确定装置的示意图。
图2示出根据本发明一个实施例基因水平上抑郁症患者和健康对照MLG(metagenomic linkage group,操作分类单元)计数(p=0.004792,Wilcox test)的两组差异情况。
图3示出了根据本发明的一个实施例随机森林分类器中5次10折交叉验证的错误率分布情况图。
图4示出了根据本发明的一个实施例基于随机森林模型(8个肠道标志物)由健康对照和抑郁症病患者组成的训练集的接收者操作曲线(ROC)和曲线下面积(AUC)。
图5示出了根据本发明的一个实施例基于随机森林模型(8个肠道标志物),由健康对照和抑郁症病患者(健康:30和患病:10)组成的验证集的接收者操作曲线(ROC)和曲线下面积(AUC)。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出。下面通过参考附图描述的实施例是示例性的,旨在用于解释本发明,而不能理解为对本发明的限制。
针对现有抑郁症诊断方法不能做到早期预警、不能预测抑郁症发病以及发展的趋势等缺点,本发明提出一种用于评估抑郁症风险或者早期诊断抑郁症的生物标志物,以及抑郁症的诊断和患病风险评估方法,能预测抑郁症发病以及发展的趋势,应用于疾病病理分型。
生物标志物
根据本发明的第一方面,本发明提出了一种生物标志物。
本发明所用术语具有相关领域普通技术人员通常理解的含义。然而,为了更好地理解本发明,对一些定义和相关术语的解释如下:
根据本发明,术语“抑郁症”,是最普遍的一种精神类疾病,常表现为长时间持续的抑郁情绪,并且这种情绪明显超过必要的限度,缺乏自信,避开人群,甚至有罪恶感,感到身体能量的明显降低,时间的感受力减慢,无法在任何有趣的活动中体会到快乐。这类障碍还会造成患者的躯体功能失调,如睡眠紊乱或食欲暴进或减退、痛觉等。
根据本发明,生物标志物质的水平通过相对丰度指示。
根据本发明,术语“生物标志物”,也称为“生物学标志物”,是指个体的生物状态的可测量指标。这样的生物标记物可以是在个体中的任何物质,只要它们与被检个体的特定生物状态(例如,疾病)有关系,例如,核酸标志物(也可以称为基因标志物,例如DNA),蛋白质标志物,细胞因子标记物,趋化因子标记物,碳水化合物标志物,抗原标志物,抗体标志物,物种标志物(种/属的标记)和功能标志物(KO/OG标记)等。其中,核酸标志物的含义并不局限于现有可以表达为具有生物活性的蛋白质的基因,还包括任何核酸片段,可以为DNA,也可以为RNA,可以是经过修饰的DNA或者RNA,也可以是未经修改的DNA或者RNA,以及由它们组成的集合。在本文中核酸标志物有时也可以称为特征片段。在本发明中,生物标志物也可以用“肠道标志物”来替代,因为本发明所发现的与抑郁症密切相关的几种生物标志物均存在于受试者的肠道内。生物标记物经过测量和评估,经常用以检查正常生物过程,致病过程,或治疗干预药理响应,而且在许多科学领域都是有用的。
根据本发明的实施例,可以运用高通量测序,批量分析健康人群和抑郁症患者的粪便样本。基于高通量测序数据,对健康人群与抑郁症患者群进行比对,从而确定与抑郁症患者群相关的特异性核酸序列。简言之,其步骤如下:
样品的收集与处理:收集健康人群与抑郁症患者群的粪便样本,使用试剂盒进行DNA提取,得到核酸样本;
文库构建和测序:DNA文库构建和测序是利用高通量测序进行,以便得到粪便样品中所包含肠道微生物的核酸序列;
通过生物信息学的分析方法,确定与抑郁症患者相关的特异性肠道微生物核酸序列。首先,将测序序列(reads)与参照基因集(也称为参考基因集,可以为新构建的基因集或任何已知序列的数据库,例如,采用已知的人肠道微生物群落非冗余基因集)进行比对。接下来,基于比对结果,分别确定来自健康人群和抑郁症患者群粪便样品的核酸样本中各基因的相对丰度。通过将测序序列与参照基因集进行比对,可以将测序序列与参照基因集中的基因建立对应关系,从而针对核酸样本中的特定基因,与其相对应的测序序列的数目可以有效地反映该基因的相对丰度。由此,可以通过比对结果,按照常规的统计分析,确定在核酸样本中基因的相对丰度。最后,在确定核酸样本中各基因的相对丰度后,对来自健康人群和抑郁症患者群粪便的核酸样本中各基因的相对丰度进行统计检验,由此,可以判断在健康人群和抑郁症患者人群中是否存在相对丰度有显著差异的基因,如果存在基因是显著差异的,则该基因被当作是异常状态的生物标志物,即核酸标志物。
另外,对于已知或新构建的参照基因集,其通常包含基因物种信息和功能注释,由此,在确定基因相对丰度的基础上,可以进一步通过将基因的物种信息和功能注释进行分类,从而确定肠道菌群中各微生物的物种相对丰度和功能相对丰度,也就可以进一步确定异常状态的物种标志物和功能标志物。简言之,确定物种标志物和功能标志物的方法进一步包括:将健康人群和抑郁症患者群的测序序列与参照基因集进行比对;基于比对结果,分别确定健康人群和抑郁症病患者群的核酸样本中各基因的物种相对丰度和功能相对丰度;对来自健康人群和抑郁症病人群的核酸样本中各基因的物种相对丰度和功能相对丰度进行统计学检验;以及分别确定在健康人群和抑郁症病患者群的核酸样本之间相对丰度存在显著差异的物种标志物和功能标志物。根据本发明的实施例,可以采用对来自相同物种的基因的相对丰度和具有相同功能注释的基因的相对丰度进行统计检验,例如加和、取平均值、中位数值等,来确定功能相对丰度和物种相对丰度。
最后,确定了在健康人群和抑郁症患者群的粪便样品之间相对丰度存在显著差异的生物学标志物,即包括微生物物种:多形拟杆菌(Bacteroides thetaiotaomicron)和/或其类似物,穗状丁酸弧菌(Butyriyibrio crossotus)和/或其类似物,Alistipes shahii和/或其类似物,鲍氏梭菌(Clostridium bolteae)和/或其类似物,副流感嗜血杆菌(Haemophilus parainfluenzae)和/或其类似物,殊异韦荣菌(Veillonella dispar)和/或其类似物,和/或普氏菌(Prevotella copri)和/或其类似物。由此,通过检测上述微生物至少一种是否存在,来有效地确定对象是否患有或者易感抑郁症病,并且可以用于监控抑郁症病患者的治疗效果。在本文中所使用的术语“存在”应做广义理解,既可以指的是定性分析样本中是否含有相应的目标物,也可以指对样本中的目标物进行定量分析,并且还可以进一步将所得到的定量分析结果与参照(例如通过对具有已知状态的样本进行平行试验所得到的定量分析结果)进行统计学分析或者任何已知数学运算所得到的结果。本领域技术人员可以根据需要和试验条件进行容易的选择。根据本发明的实施例,还可以通过确定这些微生物在肠道菌群中的相对丰度,从而能够确定对象是否患有或者易感抑郁症病,以及用于监控抑郁症患者的治疗效果。
可以通过检测对象肠道菌群中是否存在上述微生物物种中的至少一种,也可以是检测对象肠道菌群中是否存在上述中的两种或者多种,即是否存在上述生物标志物组合,从而来有效地确定对象是否患有或者易感抑郁症,并且可以用于监控抑郁症患者的治疗效果。在本文中,术语“生物标志物组合”是指由两个或更多个生物标志物组成的组合。
对于物种标志物和功能标志物本领域技术人员还可以通过常规的菌种鉴别手段和生物活性检验手段来确定在肠道菌群中是否存在所述物种和功能。例如,菌种鉴别可以通过进行16s rRNA进行。
检测对象是否患有抑郁症或相关疾病或者预测对象是否患有抑郁症或相关疾病的设备
根据本发明的又一方面,本发明提出了一种检测对象中是否患有抑郁症或相关疾病或者预测对象是否患有抑郁症或相关疾病的设备,如图1所示。根据本发明的实施例,所述设备包括样本采集装置100、生物标志物相对丰度确定装置200以及患病概率确定装置300(如图1中a所示)。其中,样本采集装置适于从所述对象中采集样本;生物标志物相对丰度确定装置与所述样本采集装置相连,其适于确定所获得的样本中的生物标志物的相对丰度信息,所述生物标志物为根据本发明的第一方面的生物标志物;所述患病概率确定装置与所述生物标志物相对丰度确定装置相连,所述患病概率确定装置用于将生物标志物相对丰度确定装置中获得的生物标志物的相对丰度信息与参考数据集或参考值进行比对。
根据本发明的一种具体实施方式,所述参考数据集包括来自多个抑郁症患者和多个健康对照的样本中的根据本发明的第一方面的生物标志物的相对丰度信息。
根据本发明的一种具体实施方式,所述患病概率确定装置中还包括执行多元统计模型以获得患病概率;优选地,所述多元统计模型为随机森林模型。根据本发明的一种优选实施方式,所述患病概率大于阈值表明所述对象患有抑郁症或相关疾病或者有患有抑郁症或相关疾病的风险;优选地,所述阈值为0.5。根据本发明的一种优选实施方式,当与参考值进行比较时,所述多形拟杆菌(Bacteroides thetaiotaomicron)和/或其类似物,所述Alistipes shahii和/或其类似物,和所述普氏菌(Prevotella copri)和/或其类似物的减少表明所述对象患有抑郁症或相关疾病或者处于患有抑郁症或相关疾病的风险中,所述穗状丁酸弧菌(Butyriyibrio crossotus)和/或其类似物,所述鲍氏梭菌(Clostridiumbolteae)和/或其类似物,所述副流感嗜血杆菌(Haemophilus parainfluenzae)和/或其类似物和所述殊异韦荣菌(Veillonella dispar)和/或其类似物的增加表明所述对象患有抑郁症或相关疾病或者处于患有抑郁症或相关疾病的风险中。
根据本发明的一种具体实施方式,所述生物标志物相对丰度确定装置进一步包括:核酸样本分离单元210、测序单元220以及比对单元230(如图1中b所示)。根据本发明的实施例,核酸样本分离单元适于从所述对象的所述样本中分离得到核酸样本,测序单元与核酸样本分离单元相连,并且基于所获得的核酸样本,构建DNA文库,对所述DNA文库进行测序,以便获得测序结果,比对单元与测序单元相连,并且基于所述测序结果,将测序结果与参考基因集进行比对,以确定所述生物标志物的相对丰度信息。
根据本发明的一种具体实施方式,所述参考基因集包括从多个抑郁症患者和多个健康对照的样本中进行宏基因组测序,获得非冗余基因集,然后将所述非冗余基因集与肠道微生物基因集合并,得到所述参考基因集。
根据本发明的实施例,测序单元并不受特别限制。优选地,所述测序单元利用第二代测序方法或第三代测序方法进行。优选地,所述测序单元为选自Hiseq2000、SOLiD、454、和单分子测序装置的至少一种。由此,能够利用这些测序装置的高通量、深度测序的特点,从而有利于对后续测序数据进行分析,尤其是进行统计学检验时的精确性和准确度。
根据本发明的一个实施例,所述比对单元利用选自SOAP2和MAQ的至少一种进行所述比对。由此,可以提高比对的效率,进而可以提高检测抑郁症的效率。
另外,根据本发明的实施例,本发明还提出了一种药物筛选方法。由此,根据本发明实施例,抑郁症密切相关的标志物作为药物设计靶点来进行药物的筛选,促进新的治疗抑郁症病的药物的发现。例如,可以通过检测与候选药物接触前后,生物标志物水平的变化,来确定候选药物是否可以作为治疗或预防抑郁症病的药物。例如,检测有害生物标志物水平在接触药物候选物之后是否有所降低,有益生物标志物水平在接触药物候选物之后是否有所升高。另外,还可以通过确定药物对多形拟杆菌(Bacteroides thetaiotaomicron)和/或其类似物,穗状丁酸弧菌(Butyriyibrio crossotus)和/或其类似物,Alistipesshahii和/或其类似物,鲍氏梭菌(Clostridium bolteae)和/或其类似物,副流感嗜血杆菌(Haemophilus parainfluenzae)和/或其类似物,殊异韦荣菌(Veillonella dispar)和/或其类似物,普氏菌(Prevotella copri)和/或其类似物中的至少一种的生物活性的直接影响或间接影响来对候选化合物是否可以作为治疗或预防抑郁症的药物来进行筛选。由此,根据本发明的实施例,本发明还提出了根据抑郁症的生物标志物在筛选治疗或预防抑郁症的药物中的用途。
需要说明的是,在此提供术语的解释仅为了使本领域技术人员更好地理解本发明,并非对本发明限制。
应理解,在本发明范围内中,本发明的上述各技术特征和在下文(如实施例)中具体描述的各技术特征之间都可以互相组合,从而构成新的或优选的技术方案。限于篇幅,在此不再一一累述。
下面参考具体实施例,对本发明进行说明,需要说明的是,这些实施例仅仅是说明性的,而不能理解为对本发明的限制。
若未特别指明,实施例中所采用的技术手段为本领域技术人员所熟知的常规手段,可以参照《分子克隆实验指南》第三版或者相关产品进行,所采用的试剂和产品也均为可商业获得的。未详细描述的各种过程和方法是本领域中公知的常规方法,所用试剂的来源、商品名以及有必要列出其组成成分者,均在首次出现时标明,其后所用相同试剂如无特殊说明,均以首次标明的内容相同。
本发明采用宏基因组关联分析(MWAS)的分析方法,经测序分析粪便样本的菌群组成,功能差异;用随机森林判别模型判别抑郁症群体和非抑郁症群体,获得患病概率,用于抑郁症的患病风险评估、诊断、早期诊断或者寻找潜在药物靶点。
根据本发明,术语“MLG”是指操作分类单元(Metagenomic Linkage Group)(QinJ,Li Y,Cai Z,et al.A metagenome-wide association study of gut microbiota intype 2diabetes[J].Nature,2012,490(7418):55-60.),是在系统发生学研究或群体遗传学研究中,为了便于进行分析,人为给某一个分类单元(品系,种,属,分组等)设置的同一标志。通常按照相似性阈值将序列划分为不同的MLG,每一个MLG通常被视为一个微生物物种。若一个MLG中有超过50%的序列以95%的碱基相似性比对上已知微生物物种,则认为MLG为此已知物种;若一个MLG中有超过50%的序列以85%的碱基相似性比对上已知微生物属水平,则认为MLG为此已知物种属水平注释。
根据本发明,术语“个体”指动物,特别是哺乳动物,如灵长类动物,最好是人。
根据本发明,术语如“一”、“一个”和“这”不仅指单数的个体,而是包括可以用来说明特定实施方式的通常的一类。
在本发明中,所述的测序(二代测序)和MWAS具有本领域公知,本领域技术人员可以根据具体情况进行调整。根据本发明的实施例,可以依据文献(Wang,Jun,and HuijueJia."Metagenome-wide association studies:fine-mining the microbiome."NatureReviews Microbiology 14.8(2016):508-522.)中记载的方法进行。
在本发明中,随机森林模型和ROC曲线的使用方法为本领域所公知,本领域技术人员可以根据具体情况进行参数设置和调整。根据本发明的实施例,可以根据文献(DroganD,Dunn WB,Lin W,Buijsse B,Schulze MB,Langenberg C,Brown M,Floegel a.,DietrichS,Rolandsson O,Wedge DC,Goodacre R,Forouhi NG,Sharp SJ,Spranger J,Wareham NJ,Boeing H:Untargeted Metabolic Profiling Identifies Altered Serum Metabolitesof Type 2-Diabetes Mellitus in a Prospective,Nested Case Control Study.ClinChem 2015,61:487-497.;Mihalik SJ,Michaliszyn SF,de las Heras J,Bacha F,Lee S,Chace DH,DeJesus VR,Vockley J,Arslanian SA:Metabolomic profiling of fattyacid and amino acid metabolism in youth with obesity and type 2 diabetes:evidence for enhanced mitochondrial oxidation.Diabetes Care 2012,35:605-611.,通过引用全文并入此处)中记载的方法进行。
在本发明中,构建了抑郁症受试者和非抑郁症受试者的生物标志物的训练集,并以此为基准,对待测样本的生物标志物含量值进行评估。
本领域技术人员知晓,当进一步扩大样本量时,利用本领域公知的样本检测和计算方法,可以得出每种生物标志物在样本中的正常含量值区间(绝对数值)。可以将检测得到的生物标志物含量的绝对值与正常含量值进行比较,任选地,还可以结合统计学方法,以得出抑郁症患病风险评价、诊断以及用于监控抑郁症患者的治疗效果的效率等。
不希望受任何理论的限制,发明人指出这些生物标志物是存在于人体中的肠道菌群。通过本发明所述的方法对受试者肠道菌群进行关联分析,得到抑郁症群体的所述生物标志物在菌群检测中表现出一定的含量范围值。
实施例1
1.1样本收集
参照文献A metagenome-wide association study of gut microbiota in type2 diabetes(Qin,J.et al.Nature 490,55-60(2012))记载的方法,采集粪便样品后冷冻运输并迅速转移到-80℃保存,进行DNA提取,得到提取的DNA样本。所用到的抑郁症和非抑郁症受试者的粪便样品来自英国成年双胞胎,共计250人,然后从250个总样本中丢弃11个缺失表型的样本,所述缺失表型的样本是指根据临床检测手段不能判断患病与否的样本,剩余239个样本包括健康样本160例和抑郁症样本79例。
1.2宏基因组测序与组装
利用所提取的DNA样本构建测序文库,在Illumina HiSeq2000测序平台上进行双向(Paired-end)宏基因组测序(插入片段350bp,读长100bp)。对测序产生的数据进行过滤(quality-controlled,去除adapter污染序列、去低质量序列和去宿主基因组污染序列),并利用SOAPdenovo软件(v2.04)进行重头组装,得到组装好的组装片段(contigs)。
1.3基因集构建
对于组装好的组装片段(contigs),利用GeneMark软件(v2.7d)进行基因预测,接着利用BLAT软件进行去冗余(比对相似度(identity)在95%以上,比对的覆盖度(overlap)在90%以上,没有缺口(gaps)),得到了包含5,901,478个基因的非冗余基因集;然后参考文献An integrated catalog of reference genes in the human gut microbiome(Li J,Jia H,Cai X,et al.Nature biotechnology,2014,32(8):834-841.)中的描述,利用CD-HIT软件将粪便样品基因集进一步补充到已公开的包含9,879,896基因的肠道微生物参考基因集中(比对相似度在95%以上,比对覆盖度在90%以上),最终得到了包含11,446,577个基因的新基因集。
将上述用于“1.2宏基因组测序与组装”组装的高质量测序片段(reads)与肠道参考基因集(上述11,446,577个基因)进行比对,参照文献A metagenome-wide associationstudy of gut microbiota in type 2 diabetes(Qin,J.et al.Nature 490,55–60(2012))记载的方法,从而得到基因的相对丰度。
1.4物种分类注释与丰度计算
通过与IMG(v400)数据库进行比对,参照文献A metagenome-wide associationstudy of gut microbiota in type 2diabetes(Qin,J.et al.Nature 490,55-60(2012))记载的方法,对预测的基因进行物种分类。对于门水平的物种分类,比对的相似度65%以上,对比覆盖度在70%以上作为门水平的物种分类的临界值。对于属水平的物种分类,比对的相似度在85%以上作为属水平的物种分类的临界值。对于比对的相似度在95%以上作为种、株水平的物种分类的临界值。
然后参照文献A metagenome-wide association study of gut microbiota intype 2diabetes(Qin J,Li Y,Cai Z,et al.Nature,2012,490(7418):55-60.)记载的方法,利用基因的相对丰度计算该物种的相对丰度,并用秩和检验(Wilcoxon rank-sumtest)进行统计检验(p<0.05),确定病例与对照之间的相对丰度存在显著差异的物种。
1.5生物标志物丰度计算
根据基因相对丰度对共表达基因进行聚类(参照A metagenome-wideassociation study of gut microbiota in type 2diabetes(Qin,J.et al.Nature 490,55-60(2012)),选取聚类基因数大于50的MLGs进行物种注释;并根据对应基因丰度中位数的办法,得到对应MLGs的相对丰度,并计算病例与对照之间的相对丰度存在显著差异的MLGs。
1.6利用随机森林(ROC/AUC)筛选抑郁症发生发展的潜在生物标志物
为进一步筛选潜在疾病肠道生物标志物,本实施例构建了抑郁症受试者和非抑郁症受试者的生物标志物的训练集,并以此为基准,对待测样本的生物标志物含量值进行评估。其中,在本发明中,所述训练集和所述验证集具有本领域公知的含义。在本发明的实施方案中,训练集是指包含一定样本数的抑郁症受试者和非抑郁症受试者待测样本中的各生物标志物的含量的数据集合。验证集是用来测试训练集性能的独立数据集合。其中,非抑郁症受试者为精神状态良好的受试者,受试者可以为人或者模型动物,在本实施例中是以人为受试者进行实验的。
具体包括如下步骤:
本发明的239个样品(健康人:160和抑郁症病人:79人)中,由于患抑郁症疾病的样本过少,因此参照文献Oversampling method for imbalanced classification(Zheng Z,Cai Y,Li Y.Computing and Informatics,2016,34(5):1017-1037)采用过抽样的方法随机可放回69个患病样本,从中选取130个抑郁样品,从160个正常样本中抽取到130个正常样本,共同组成260个样本(130个抑郁症样本和130个正常人样本)作为训练集,其余样品作为验证集(10个抑郁症病人和30个正常人)。
1.6.1利用训练集数据筛选得到的生物标志物
首先,按照1.4-1.5描述的方法计算训练集中每个样本中各基因的相对丰度并对基因进行聚类。然后将训练集基因数量大于50的MLG输入随机森林(randomForest 4.6-12in R 3.2.5,RF)分类器。对分类器进行5次10折交叉验证,10次重复,利用RF模型筛选的MLG相对丰度对每一个体计算其抑郁症患病风险(图3,表2),并绘制受试者操作特征(receiver operation characteristic,ROC)曲线,并计算出曲线下面积(AUC)作为判别模型效能评价参数。选取标志物组合数<30,且判别效能最佳的组合为本发明组合。在模型中输出每个MLG的选择频率,频率越高,代表该标志物用来判别抑郁症和非抑郁症的重要性越高。
结果显示,本发明所得RF分类器包含了8个代谢物(即8个生物标志物),这8个生物标志物对应的相对丰度如表1所示,其详细信息如表2所示。图3示出了随机森林分类器中5次10折交叉验证的错误率分布情况。该模型用训练集样品(抑郁症患者130例,正常对照130例)在经MWAS流程处理得到的满足目标的MLGs相对丰度进行训练。图3中黑色粗曲线代表5次试验(细曲线代表5次试验)的平均值,竖线代表所选最佳组合中MLG数目。图4示出了基于随机森林模型(8个生物标志物)判断抑郁症患者和健康对照,训练集的接收者操作曲线(ROC)和曲线下面积(AUC),其中特异性表征的是对于不患病判对的概率,敏感性指的是对于患病判对的概率,其中,对训练集样本的判别效能为:AUC=97.32%,95%置信区间CI=95.37-99.27%(图3),结果表明该模型所得代谢物组合可作为区分抑郁症与非抑郁症的潜在生物标志物。
其中,表2中,每种标志物基因集大小代表的是每种标志物中包括的核酸序列的个数;标志物基因集注释数代表的是:其中有多少基因注释到这个标志物上;标志物最优注释表征的是根据每种标志物包括的所有基因集与IMG(v400)数据库进行比对,得到的相应的物种分类;最优注释基因比例表征的是:这个基因簇里面有多少比例的基因注释到那个物种;最优注释相似度表征的是:这些基因簇里注释到这个物种,所有基因的注释准确度的均值作为该标志物的最优注释相似度;富集方向代表的是,每种生物标志物在抑郁症患者和健康对照中的相对丰度的变化,其中D<C代表的是该生物标志物在抑郁症患者中的相对丰度小于在健康对照中的相对丰度,C<D代表的是该生物标志物在抑郁症患者中的相对丰度大于在健康对照中的相对丰度;筛选频率代表的是:进行5折10次交叉验证,该生物标志物被选择的频率;验证集AUC代表的是:代表在训练集数据得到模型下,对验证集数据的判别程度;95%置信区间(95%CI)在a到b之间,代表的是对于给出的每种生物标志物,有相应的95%的概率可以说样本介于给出的a到b之间,发生错误的概率为5%。
从表2可以看出,富集方向一栏中相比较于健康对照,抑郁症患者在Bacteroidesthetaiotaomicron VPI-5482,Alistipes shahii WAL 8301,和Prevotella copri DSM18205均表现出相对丰度减少,在Butyriyibrio crossotus DSM 2876,Clostridiumbolteae ATCC BAA-613,Haemophilus parainfluenzae ATCC T3T1,Haemophilusparainfluenzae ATCC 33392和Veillonella dispar ATCC 17748均表现出相对丰度增加。
表3:8种生物标记物结合预测训练集的患病概率
1.6.2利用验证集数据验证筛选得到的生物标志物
本发明,随即使用独立人群对该模型进行验证,患病概率(RP)≥0.5预测个体具有患抑郁症疾病风险或者患有抑郁症。首先,按照1.5描述的方法计算验证集中每个样本中各生物标志物的相对丰度。然后按照1.6.1的方法利用随机森林模型对验证集数据进行验证。其中,表4为随机森林模型验证集肠道标志物(MLG)相对丰度数据。
基于该模型:
图5示出了基于随机森林模型(8个生物标志物)判断抑郁症患者和健康对照,验证集的接收者操作曲线(ROC)和曲线下面积(AUC),其中,基于8个标记物,对独立验证集1(抑郁症=10和健康人对照=30),模型的判别AUC=89.67%(95%CI=79.93-99.4%);基于Alistipes shahii WAL 8301,验证集曲线下面积为0.8333,特异性高。
在3.2.5版本R中使用“randomForest 4.6-12 package”进行随机森林模型分类和回归。输入包括训练集数据(即训练样本中选定的MLGs标记物的相对丰度,见表1),样本疾病状态(训练样本的样本疾病状态为矢量,‘1’代表抑郁症,‘0’代表健康人),以及一个验证集(验证集中所选MLGs标记物的相对丰度,见表5)。然后,发明人利用R软件中随机森林包的随机森林函数建立分类和预测函数对验证集数据进行预测,输出即为预测结果(患病概率;阈值为0.5,如果疾病的概率≥0.5,则认为有患抑郁症的风险)。
本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本发明的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。
在本发明中,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”、“固定”等术语应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或成一体;可以是机械连接,也可以是电连接或彼此可通讯;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通或两个元件的相互作用关系,除非另有明确的限定。对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本发明中的具体含义。
在本发明中,除非另有明确的规定和限定,第一特征在第二特征“上”或“下”可以是第一和第二特征直接接触,或第一和第二特征通过中间媒介间接接触。而且,第一特征在第二特征“之上”、“上方”和“上面”可以是第一特征在第二特征正上方或斜上方,或仅仅表示第一特征水平高度高于第二特征。第一特征在第二特征“之下”、“下方”和“下面”可以是第一特征在第二特征正下方或斜下方,或仅仅表示第一特征水平高度小于第二特征。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。
Claims (31)
1.一种生物标志物,其特征在于,包括:
多形拟杆菌(Bacteroides thetaiotaomicron),Alistipes shahii,和普氏菌(Prevotella copri),穗状丁酸弧菌(Butyriyibrio crossotus),鲍氏梭菌(Clostridium bolteae),副流感嗜血杆菌(Haemophilus parainfluenzae)和殊异韦荣菌(Veillonella dispar)。
2.根据权利要求1所述的生物标志物,其特征在于,所述生物标志物包括:
多形拟杆菌VPI-5482(Bacteroides thetaiotaomicron VPI-5482),Alistipes shahii WAL 8301,普氏菌DSM 18205(Prevotella copri DSM 18205),穗状丁酸弧菌DSM2876(Butyriyibrio crossotus DSM 2876),鲍氏梭菌ATCC BAA-613(Clostridium bolteae ATCC BAA-613),副流感嗜血杆菌ATCC T3T1(Haemophilus parainfluenzae ATCCT3T1),副流感嗜血杆菌ATCC 33392(Haemophilus parainfluenzae ATCC 33392)和殊异韦荣菌ATCC 17748(Veillonella dispar ATCC 17748)。
3.一种试剂盒,其特征在于,包括用于检测权利要求1~2任一项所述的生物标志物的试剂。
4.根据权利要求3所述的试剂盒,其特征在于,所述试剂盒包括:
一组参考数据集或者参考值,所述参考数据集或者参考值用来作为每种生物标志物的相对丰度的参考。
5.根据权利要求4所述的试剂盒,其特征在于,所述试剂盒还包括第一计算机程序产品,所述第一计算机程序产品用来执行获得所述的参考数据集或者参考值。
6.根据权利要求3-5中任一项所述的试剂盒,其特征在于,所述试剂盒还包括第二计算机程序产品,所述第二计算机程序产品用来执行诊断对象是否患有抑郁症或相关疾病或者预测对象是否患有抑郁症或相关疾病的风险的方法,所述方法包括:
(1)从所述对象中采集样本;
(2)确定步骤(1)中获得的所述样本中根据权利要求1~2任一项所述的生物标志物的相对丰度信息;
(3)将步骤(2)中所述的相对丰度信息与参考数据集或参考值进行比较。
7.根据权利要求6所述的试剂盒,其特征在于,所述参考数据集包括来自多个抑郁症患者和多个健康对照的样本中的根据权利要求1~2中任一项所述的生物标志物的相对丰度信息。
8.根据权利要求6所述的试剂盒,其特征在于,在将步骤(2)中所述的相对丰度信息与参考数据集进行比较的步骤中,还包括执行多元统计模型以获得患病概率。
9.根据权利要求8所述的试剂盒,其特征在于,所述多元统计模型为随机森林模型。
10.根据权利要求8所述的试剂盒,其特征在于,所述患病概率大于阈值表明所述对象患有抑郁症或相关疾病或者有患有抑郁症或相关疾病的风险。
11.根据权利要求10所述的试剂盒,其特征在于,所述阈值为0.5。
12.根据权利要求6所述的试剂盒,其特征在于,当与参考值比较时,所述多形拟杆菌(Bacteroides thetaiotaomicron)、所述Alistipes shahii、所述普氏菌(Prevotella copri)的减少表明所述对象患有抑郁症或相关疾病或者处于患有抑郁症或相关疾病的风险中,所述穗状丁酸弧菌(Butyriyibrio crossotus)、所述鲍氏梭菌(Clostridium bolteae)、所述副流感嗜血杆菌(Haemophilus parainfluenzae)、所述殊异韦荣菌(Veillonella dispar)的增加表明所述对象患有抑郁症或相关疾病或者处于患有抑郁症或相关疾病的风险中。
13.根据权利要求6中所述的试剂盒,其特征在于,步骤(2)中所述生物标志物的相对丰度信息是利用测序方法得到的,进一步包括:
从所述对象的所述样本中分离得到核酸样本;
基于所获得的所述核酸样本,构建DNA文库,对所述DNA文库进行测序,以便获得测序结果,
以及基于所述测序结果,将测序结果与参考基因集进行比对,以确定所述生物标志物的相对丰度信息。
14.根据权利要求13所述的试剂盒,其特征在于,所述参考基因集包括从多个抑郁症患者和多个健康对照的样本中进行宏基因组测序,获得非冗余基因集,然后将所述非冗余基因集与肠道微生物基因集合并,得到所述参考基因集。
15.根据权利要求13所述的试剂盒,其特征在于,所述样本为粪便样本。
16.根据权利要求13所述的试剂盒,其特征在于,所述测序是通过第二代测序方法或第三代测序方法进行的。
17.权利要求1~2任一项所述的生物标志物在制备试剂盒中的用途,所述试剂盒用于诊断对象是否患有抑郁症或相关疾病或者预测对象是否患有抑郁症或相关疾病的风险。
18.根据权利要求17所述的用途,其特征在于,所述诊断或预测包括以下步骤:
1)从所述对象中采集样本;
2)确定步骤1)中获得的所述样本中根据权利要求1~2中任一项所述的生物标志物的相对丰度信息;
3)将步骤2)中所述的相对丰度信息与参考数据集或参考值进行比较。
19.根据权利要求18所述的用途,其特征在于,所述参考数据集包括来自多个抑郁症患者和多个健康对照的样本中的生物标志物的相对丰度信息,所述生物标志物为权利要求1~2任一项所述的生物标志物。
20.根据权利要求18所述的用途,其特征在于,在将步骤2)中所述的相对丰度信息与参考数据集进行比较的步骤中,还包括执行多元统计模型以获得患病概率。
21.根据权利要求20所述的用途,其特征在于,所述多元统计模型为随机森林模型。
22.根据权利要求20所述的用途,其特征在于,所述患病概率大于阈值表明所述对象患有抑郁症或相关疾病或者有患有抑郁症或相关疾病的风险。
23.根据权利要求22所述的用途,其特征在于,所述阈值为0.5。
24.根据权利要求18所述的用途,其特征在于,当与参考值比较时,所述多形拟杆菌(Bacteroides thetaiotaomicron)、所述Alistipes shahii、所述普氏菌(Prevotella copri)的减少表明所述对象患有抑郁症或相关疾病或者处于患有抑郁症或相关疾病的风险中,所述穗状丁酸弧菌(Butyriyibrio crossotus)、所述鲍氏梭菌(Clostridium bolteae)、所述副流感嗜血杆菌(Haemophilus parainfluenzae)、所述殊异韦荣菌(Veillonella dispar)的增加表明所述对象患有抑郁症或相关疾病或者处于患有抑郁症或相关疾病的风险中。
25.根据权利要求18-24中任一项所述的用途,其特征在于,通过测序方法得到步骤2)中所述生物标志物的相对丰度信息,进一步包括:
从所述对象的所述样本中分离得到核酸样本;
基于所获得的所述核酸样本,构建DNA文库,对所述DNA文库进行测序,以便获得测序结果,
以及基于所述测序结果,将测序结果与参考基因集进行比对,以确定所述生物标志物的相对丰度信息。
26.根据权利要求25所述的用途,其特征在于,所述参考基因集包括从多个抑郁症患者和多个健康对照的样本中进行宏基因组测序,获得非冗余基因集,然后将所述非冗余基因集与肠道微生物基因集合并,得到所述参考基因集。
27.一种检测对象是否患有抑郁症或相关疾病或者预测对象是否患有抑郁症或相关疾病的设备,其特征在于,包括:
样本采集装置,所述样本采集装置适于从所述对象中采集样本;
生物标志物相对丰度确定装置,所述生物标志物相对丰度确定装置与所述样本采集装置相连,其适于确定所获得的样本中的生物标志物的相对丰度信息,所述生物标志物包括权利要求1~2中任一项所述的生物标志物;
患病概率确定装置,所述患病概率确定装置与所述生物标志物相对丰度确定装置相连,所述患病概率确定装置用于将所述生物标志物相对丰度确定装置中获得的生物标志物的相对丰度信息与参考数据集或参考值进行比对。
28.根据权利要求27所述的设备,其特征在于,所述参考数据集包括来自多个抑郁症患者和多个健康对照的样本中的根据权利要求1~2中任一项所述的生物标志物的相对丰度信息。
29.根据权利要求27所述的设备,其特征在于,所述患病概率确定装置中还包括执行多元统计模型以获得患病概率。
30.根据权利要求27-29中任一项所述的设备,其特征在于,所述生物标志物相对丰度确定装置进一步包括:
核酸样本分离单元,所述核酸样本分离单元适于从所述对象的所述样本中分离得到核酸样本;
测序单元,所述测序单元与所述核酸样本分离单元相连,并且基于所获得的核酸样本,构建DNA文库,对所述DNA文库进行测序,以便获得测序结果;
比对单元,所述比对单元与所述测序单元相连,并且基于所述测序结果,将测序结果与参考基因集进行比对,以确定所述生物标志物的相对丰度信息。
31.根据权利要求30所述的设备,其特征在于,参考基因集包括从多个抑郁症患者和多个健康对照的样本中进行宏基因组测序,获得非冗余基因集,然后将所述非冗余基因集与肠道微生物基因集合并,得到所述参考基因集。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810371437 | 2018-04-24 | ||
CN2018103714374 | 2018-04-24 | ||
PCT/CN2018/085908 WO2019205188A1 (zh) | 2018-04-24 | 2018-05-07 | 抑郁症生物标志物及其用途 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112119167A CN112119167A (zh) | 2020-12-22 |
CN112119167B true CN112119167B (zh) | 2024-01-12 |
Family
ID=68293699
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201880092712.7A Active CN112119167B (zh) | 2018-04-24 | 2018-05-07 | 抑郁症生物标志物及其用途 |
Country Status (3)
Country | Link |
---|---|
EP (1) | EP3786305A4 (zh) |
CN (1) | CN112119167B (zh) |
WO (1) | WO2019205188A1 (zh) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111505288B (zh) * | 2020-05-15 | 2022-03-01 | 重庆医科大学 | 一种新的抑郁症生物标志物及其应用 |
CN113493849A (zh) * | 2021-09-09 | 2021-10-12 | 北京泱深生物信息技术有限公司 | 一种可用于诊断生长发育迟缓的产品 |
CN113855709B (zh) * | 2021-10-19 | 2024-02-06 | 温州医科大学附属第一医院 | 一种包含普雷沃氏菌的产品在治疗和预防抑郁症中的应用 |
CN113881610B (zh) * | 2021-12-06 | 2022-02-25 | 北京量化健康科技有限公司 | 多形拟杆菌bp8e及其应用 |
CN115094128A (zh) * | 2022-05-06 | 2022-09-23 | 四川大学华西医院 | 一种通过肠道微生物分析来诊断抗抑郁药疗效的方法 |
CN116103380A (zh) * | 2022-10-12 | 2023-05-12 | 山西医科大学第一医院 | 一种生物标志物及其筛选方法和应用 |
CN118711815A (zh) * | 2024-06-13 | 2024-09-27 | 四川大学 | 一种基于无创测量指标的抑郁合并焦虑风险的预测系统 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104195146A (zh) * | 2014-07-15 | 2014-12-10 | 浙江大学 | 肝硬化微生物标志物及应用 |
CN104540962A (zh) * | 2012-08-01 | 2015-04-22 | 深圳华大基因研究院 | 糖尿病生物标志物及其应用 |
CN104546930A (zh) * | 2014-09-30 | 2015-04-29 | 深圳华大基因科技有限公司 | 副流感嗜血杆菌在治疗或预防类风湿性关节炎或其相关疾病中的应用 |
CN105368944A (zh) * | 2015-11-23 | 2016-03-02 | 广州基迪奥生物科技有限公司 | 可检测疾病的生物标志物及其用途 |
CN106554998A (zh) * | 2016-10-18 | 2017-04-05 | 深圳市康宁医院 | 抑郁症生物标志物及其应用 |
CN107002021A (zh) * | 2014-09-30 | 2017-08-01 | 深圳华大基因科技有限公司 | 类风湿性关节炎的生物标记物及其用途 |
CN107075446A (zh) * | 2014-09-30 | 2017-08-18 | 深圳华大基因科技有限公司 | 用于肥胖症相关疾病的生物标记物 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2016049930A1 (en) * | 2014-09-30 | 2016-04-07 | Bgi Shenzhen Co., Limited | Biomarkers for rheumatoid arthritis and usage therof |
WO2016049920A1 (en) * | 2014-09-30 | 2016-04-07 | Bgi Shenzhen Co., Limited | Biomarkers for coronary artery disease |
WO2016049937A1 (en) * | 2014-09-30 | 2016-04-07 | Bgi Shenzhen Co., Limited | Biomarkers for rheumatoid arthritis and usage therof |
WO2016049918A1 (en) * | 2014-09-30 | 2016-04-07 | Bgi Shenzhen Co., Limited | Biomarkers for coronary artery disease |
EP3429604A1 (en) * | 2016-03-14 | 2019-01-23 | Holobiome, Inc. | Modulation of the gut microbiome to treat mental disorders or diseases of the central nervous system |
-
2018
- 2018-05-07 WO PCT/CN2018/085908 patent/WO2019205188A1/zh unknown
- 2018-05-07 EP EP18916665.5A patent/EP3786305A4/en active Pending
- 2018-05-07 CN CN201880092712.7A patent/CN112119167B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104540962A (zh) * | 2012-08-01 | 2015-04-22 | 深圳华大基因研究院 | 糖尿病生物标志物及其应用 |
CN104195146A (zh) * | 2014-07-15 | 2014-12-10 | 浙江大学 | 肝硬化微生物标志物及应用 |
CN104546930A (zh) * | 2014-09-30 | 2015-04-29 | 深圳华大基因科技有限公司 | 副流感嗜血杆菌在治疗或预防类风湿性关节炎或其相关疾病中的应用 |
CN107002021A (zh) * | 2014-09-30 | 2017-08-01 | 深圳华大基因科技有限公司 | 类风湿性关节炎的生物标记物及其用途 |
CN107075446A (zh) * | 2014-09-30 | 2017-08-18 | 深圳华大基因科技有限公司 | 用于肥胖症相关疾病的生物标记物 |
CN105368944A (zh) * | 2015-11-23 | 2016-03-02 | 广州基迪奥生物科技有限公司 | 可检测疾病的生物标志物及其用途 |
CN106554998A (zh) * | 2016-10-18 | 2017-04-05 | 深圳市康宁医院 | 抑郁症生物标志物及其应用 |
Non-Patent Citations (3)
Title |
---|
基于16S rRNA的肝郁血虚型失眠患者口腔微生态与中医舌象的相关性研究;刘梦;王曦廷;李峰;谭丽博;李杰;关静;;世界科学技术-中医药现代化(05);220-227 * |
益生菌剂调整肠道疾病人群菌群结构丰度水平的研究;臧凯丽;江岩;孙勇;闫亚丽;陈庆森;赵林森;赵培;崔文静;马新颖;;食品科学(13);140-150 * |
脑卒中后抑郁症患者肠道菌群的多样性分析;范文涛;闫咏梅;别玉龙;王倩;;南方医科大学学报(10);7-13 * |
Also Published As
Publication number | Publication date |
---|---|
WO2019205188A1 (zh) | 2019-10-31 |
EP3786305A1 (en) | 2021-03-03 |
EP3786305A4 (en) | 2022-07-13 |
CN112119167A (zh) | 2020-12-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112119167B (zh) | 抑郁症生物标志物及其用途 | |
WO2020244018A1 (zh) | 一种精神分裂症的小规模生物标志物组合、其应用及metaphlan2筛选方法 | |
CN105603066B (zh) | 精神障碍的肠道微生物标志物及其应用 | |
CN111430027B (zh) | 基于肠道微生物的双相情感障碍生物标志物及其筛选应用 | |
US9881135B2 (en) | Identification of a person having risk for developing type 2 diabetes | |
CN110904213B (zh) | 一种基于肠道菌群的溃疡性结肠炎生物标志物及其应用 | |
CN108350019B (zh) | 用于细菌性阴道病的源自微生物群系的诊断及治疗方法和系统 | |
CN111505288B (zh) | 一种新的抑郁症生物标志物及其应用 | |
CN108348168B (zh) | 用于湿疹的源自微生物群系的诊断及治疗方法和系统 | |
CN111020020A (zh) | 一种精神分裂症的生物标志物组合、其应用及metaphlan2筛选方法 | |
CN108348167B (zh) | 用于脑-颅面健康相关病症的源自微生物群系的诊断及治疗方法和系统 | |
CN111440884A (zh) | 源于肠道的诊断肌少症的菌群及其用途 | |
CN108348166B (zh) | 用于与抗生素使用相关的感染性疾病及其它健康状况的源自微生物群系的诊断及治疗方法和系统 | |
Clelland et al. | Utilization of never-medicated bipolar disorder patients towards development and validation of a peripheral biomarker profile | |
CN107709576A (zh) | 用于神经系统健康问题的微生物组来源的诊断和治疗的方法及系统 | |
CN107835692A (zh) | 用于皮肤系统状况的微生物组来源的表征、诊断和治疗的方法及系统 | |
CN107849616A (zh) | 用于功能特征相关的状况的微生物组来源的表征、诊断和治疗的方法及系统 | |
CN108350503B (zh) | 用于甲状腺健康问题相关病症的源自微生物群系的诊断及治疗方法和系统 | |
CN110396538B (zh) | 偏头痛生物标志物及其用途 | |
CN112384634B (zh) | 骨质疏松生物标志物及其用途 | |
Heidarzadehpilehrood et al. | A high-throughput RNA sequency of peripheral blood mononuclear cells reveals on inflammatory state in women with PCOS | |
CN113913490A (zh) | 非酒精性脂肪肝标志微生物及其应用 | |
CN111020021A (zh) | 一种基于肠道菌群的小规模精神分裂症生物标志物组合、其应用及mOTU筛选方法 | |
CN112877417A (zh) | 多囊卵巢综合征肠道菌群生物标志物筛选及其应用 | |
US10227651B2 (en) | Gene expression based biomarker system for irritable bowel syndrome (IBS) diagnosis |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
REG | Reference to a national code |
Ref country code: HK Ref legal event code: DE Ref document number: 40042727 Country of ref document: HK |
|
GR01 | Patent grant | ||
GR01 | Patent grant |