CN110408629A - 结核分枝杆菌H37Rv编码基因及其应用 - Google Patents
结核分枝杆菌H37Rv编码基因及其应用 Download PDFInfo
- Publication number
- CN110408629A CN110408629A CN201810402630.XA CN201810402630A CN110408629A CN 110408629 A CN110408629 A CN 110408629A CN 201810402630 A CN201810402630 A CN 201810402630A CN 110408629 A CN110408629 A CN 110408629A
- Authority
- CN
- China
- Prior art keywords
- mycobacterium tuberculosis
- gene
- encoding gene
- sequence
- tuberculosis h37rv
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 108090000623 proteins and genes Proteins 0.000 title claims abstract description 83
- 241001646725 Mycobacterium tuberculosis H37Rv Species 0.000 title claims abstract description 15
- 108700035964 Mycobacterium tuberculosis HsaD Proteins 0.000 title claims abstract description 14
- 241001302239 Mycobacterium tuberculosis complex Species 0.000 claims abstract description 37
- 238000001514 detection method Methods 0.000 claims abstract description 18
- 201000008827 tuberculosis Diseases 0.000 claims description 10
- 150000001413 amino acids Chemical class 0.000 claims description 9
- 230000003321 amplification Effects 0.000 claims description 8
- 238000004458 analytical method Methods 0.000 claims description 8
- 238000003199 nucleic acid amplification method Methods 0.000 claims description 7
- 241000894007 species Species 0.000 claims description 5
- 238000003745 diagnosis Methods 0.000 claims description 3
- 238000000926 separation method Methods 0.000 claims description 3
- 238000000605 extraction Methods 0.000 claims description 2
- 238000001502 gel electrophoresis Methods 0.000 claims description 2
- 238000012360 testing method Methods 0.000 claims description 2
- 101150030367 cls gene Proteins 0.000 claims 1
- 238000002372 labelling Methods 0.000 claims 1
- 239000002773 nucleotide Substances 0.000 claims 1
- 125000003729 nucleotide group Chemical group 0.000 claims 1
- 238000003752 polymerase chain reaction Methods 0.000 claims 1
- 230000020509 sex determination Effects 0.000 claims 1
- 108010033276 Peptide Fragments Proteins 0.000 description 31
- 102000007079 Peptide Fragments Human genes 0.000 description 31
- 108020004414 DNA Proteins 0.000 description 14
- 238000000034 method Methods 0.000 description 14
- 230000001580 bacterial effect Effects 0.000 description 12
- 102000004169 proteins and genes Human genes 0.000 description 9
- 241000894006 Bacteria Species 0.000 description 6
- 108091028043 Nucleic acid sequence Proteins 0.000 description 6
- 108700026244 Open Reading Frames Proteins 0.000 description 6
- 108090000765 processed proteins & peptides Proteins 0.000 description 6
- 238000012163 sequencing technique Methods 0.000 description 5
- 238000001228 spectrum Methods 0.000 description 5
- 238000006243 chemical reaction Methods 0.000 description 4
- 238000001962 electrophoresis Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 150000002500 ions Chemical class 0.000 description 4
- 238000004519 manufacturing process Methods 0.000 description 4
- 210000002345 respiratory system Anatomy 0.000 description 4
- 241000187479 Mycobacterium tuberculosis Species 0.000 description 3
- 238000012408 PCR amplification Methods 0.000 description 3
- 230000008901 benefit Effects 0.000 description 3
- 239000003153 chemical reaction reagent Substances 0.000 description 3
- 238000013461 design Methods 0.000 description 3
- 230000004069 differentiation Effects 0.000 description 3
- 239000003814 drug Substances 0.000 description 3
- 230000002068 genetic effect Effects 0.000 description 3
- 244000052769 pathogen Species 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 2
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 2
- 241000196324 Embryophyta Species 0.000 description 2
- 241000186359 Mycobacterium Species 0.000 description 2
- 206010057190 Respiratory tract infections Diseases 0.000 description 2
- 241000700605 Viruses Species 0.000 description 2
- 244000052616 bacterial pathogen Species 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 2
- 150000001875 compounds Chemical group 0.000 description 2
- 238000004925 denaturation Methods 0.000 description 2
- 230000036425 denaturation Effects 0.000 description 2
- 201000010099 disease Diseases 0.000 description 2
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 2
- 229940079593 drug Drugs 0.000 description 2
- 235000013399 edible fruits Nutrition 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 239000012634 fragment Substances 0.000 description 2
- 230000035772 mutation Effects 0.000 description 2
- 230000001717 pathogenic effect Effects 0.000 description 2
- 238000004321 preservation Methods 0.000 description 2
- 238000012797 qualification Methods 0.000 description 2
- 238000012216 screening Methods 0.000 description 2
- 230000035945 sensitivity Effects 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- 238000012795 verification Methods 0.000 description 2
- 108020004465 16S ribosomal RNA Proteins 0.000 description 1
- QUIGLPSHIFPEOV-CIUDSAMLSA-N Ala-Lys-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O QUIGLPSHIFPEOV-CIUDSAMLSA-N 0.000 description 1
- ITGFVUYOLWBPQW-KKHAAJSZSA-N Asp-Thr-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O ITGFVUYOLWBPQW-KKHAAJSZSA-N 0.000 description 1
- 108020004705 Codon Proteins 0.000 description 1
- 208000035473 Communicable disease Diseases 0.000 description 1
- 206010011409 Cross infection Diseases 0.000 description 1
- 102000004533 Endonucleases Human genes 0.000 description 1
- 108010042407 Endonucleases Proteins 0.000 description 1
- 108090000790 Enzymes Proteins 0.000 description 1
- 102000004190 Enzymes Human genes 0.000 description 1
- JSNNHGHYGYMVCK-XVKPBYJWSA-N Gly-Glu-Val Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O JSNNHGHYGYMVCK-XVKPBYJWSA-N 0.000 description 1
- 241001467553 Mycobacterium africanum Species 0.000 description 1
- 241000186366 Mycobacterium bovis Species 0.000 description 1
- 241001312372 Mycobacterium canettii Species 0.000 description 1
- 241000211133 Mycobacterium caprae Species 0.000 description 1
- 241000187919 Mycobacterium microti Species 0.000 description 1
- 241000699502 Mycobacterium mungi Species 0.000 description 1
- 241000656726 Mycobacterium orygis Species 0.000 description 1
- 241001457456 Mycobacterium pinnipedii Species 0.000 description 1
- 241001093674 Mycobacterium suricattae Species 0.000 description 1
- KZNQNBZMBZJQJO-UHFFFAOYSA-N N-glycyl-L-proline Natural products NCC(=O)N1CCCC1C(O)=O KZNQNBZMBZJQJO-UHFFFAOYSA-N 0.000 description 1
- APKRGYLBSCWJJP-FXQIFTODSA-N Pro-Ala-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(O)=O APKRGYLBSCWJJP-FXQIFTODSA-N 0.000 description 1
- 206010036790 Productive cough Diseases 0.000 description 1
- 108020005038 Terminator Codon Proteins 0.000 description 1
- ASQFIHTXXMFENG-XPUUQOCRSA-N Val-Ala-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O ASQFIHTXXMFENG-XPUUQOCRSA-N 0.000 description 1
- 239000002253 acid Substances 0.000 description 1
- 238000000246 agarose gel electrophoresis Methods 0.000 description 1
- 108010047495 alanylglycine Proteins 0.000 description 1
- 238000000137 annealing Methods 0.000 description 1
- 238000012550 audit Methods 0.000 description 1
- 230000007321 biological mechanism Effects 0.000 description 1
- 210000004369 blood Anatomy 0.000 description 1
- 239000008280 blood Substances 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 235000014113 dietary fatty acids Nutrition 0.000 description 1
- 238000006073 displacement reaction Methods 0.000 description 1
- 229930195729 fatty acid Natural products 0.000 description 1
- 239000000194 fatty acid Substances 0.000 description 1
- 150000004665 fatty acids Chemical class 0.000 description 1
- 238000010230 functional analysis Methods 0.000 description 1
- 239000000499 gel Substances 0.000 description 1
- 238000012268 genome sequencing Methods 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 208000015181 infectious disease Diseases 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 239000007788 liquid Substances 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 102000042567 non-coding RNA Human genes 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 210000000056 organ Anatomy 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 239000013641 positive control Substances 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 208000008128 pulmonary tuberculosis Diseases 0.000 description 1
- 230000000241 respiratory effect Effects 0.000 description 1
- 230000029058 respiratory gaseous exchange Effects 0.000 description 1
- 238000007894 restriction fragment length polymorphism technique Methods 0.000 description 1
- 210000003296 saliva Anatomy 0.000 description 1
- 238000010183 spectrum analysis Methods 0.000 description 1
- 210000003802 sputum Anatomy 0.000 description 1
- 208000024794 sputum Diseases 0.000 description 1
- 208000024891 symptom Diseases 0.000 description 1
- 238000013518 transcription Methods 0.000 description 1
- 230000035897 transcription Effects 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
- 238000011144 upstream manufacturing Methods 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/195—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
- C07K14/35—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria from Mycobacteriaceae (F)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N1/00—Microorganisms, e.g. protozoa; Compositions thereof; Processes of propagating, maintaining or preserving microorganisms or compositions thereof; Processes of preparing or isolating a composition containing a microorganism; Culture media therefor
- C12N1/20—Bacteria; Culture media therefor
- C12N1/205—Bacterial isolates
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/02—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving viable microorganisms
- C12Q1/04—Determining presence or kind of microorganism; Use of selective media for testing antibiotics or bacteriocides; Compositions containing a chemical indicator therefor
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6876—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
- C12Q1/6888—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms
- C12Q1/689—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms for bacteria
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12R—INDEXING SCHEME ASSOCIATED WITH SUBCLASSES C12C - C12Q, RELATING TO MICROORGANISMS
- C12R2001/00—Microorganisms ; Processes using microorganisms
- C12R2001/01—Bacteria or Actinomycetales ; using bacteria or Actinomycetales
- C12R2001/32—Mycobacterium
Landscapes
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Organic Chemistry (AREA)
- Engineering & Computer Science (AREA)
- Genetics & Genomics (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Biotechnology (AREA)
- General Health & Medical Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Molecular Biology (AREA)
- Biochemistry (AREA)
- Analytical Chemistry (AREA)
- General Engineering & Computer Science (AREA)
- Biophysics (AREA)
- Microbiology (AREA)
- Physics & Mathematics (AREA)
- Biomedical Technology (AREA)
- Immunology (AREA)
- Medicinal Chemistry (AREA)
- Gastroenterology & Hepatology (AREA)
- Plant Pathology (AREA)
- Toxicology (AREA)
- Tropical Medicine & Parasitology (AREA)
- Virology (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本发明涉及一种结核分枝杆菌H37Rv编码基因及其应用,具体涉及新的漏注释编码基因Rv3128(+|3493573‑3493707|),其可用作结核分枝杆菌复合群分子鉴定的标准基因,用于结核分枝杆菌复合群的分子鉴定及临床检测。
Description
技术领域
本发明涉及基因检测领域,具体涉及对病原菌物种进行鉴定。
背景技术
结核分枝杆菌(Mycobacterium tuberculosis,MTB)是引起人类结核病的病原菌。可入侵全身各器官,但以肺结核为最多见。结核病是至今极为重要的传染病,严重威胁人类生命健康。据WHO报道,每年约有800万新病例发生,至少有300万人死于该病。MTB的临床菌株难培养、生长缓慢、与其它分枝杆菌能交叉感染、结核病与其它呼吸道感染症状难区分等特征,给临床快速诊断和治疗带来了极大的困难。故建立快速、准确、特异、敏感、廉价的结核病检测方法,是有效治疗、控制结核病蔓延的必要前提,也是临床实验室分枝杆菌检测面临的新挑战和新任务。
结核分枝杆菌复合群(Mycobacterium tuberculosis complex,MTBC),包括M.tuberculosis、M.africanum、M.orygis、M.bovis、M.microti、M.canettii、M.caprae、M.pinnipedii、M.suricattae、M.mungi等分枝杆菌类群,这些物种均会引起人和其它生命体结核病。目前国内外对MTBC的鉴定方法主要分为以下三类:传统分离培养法;分子水平检测(IS6110、限制性片段长度多态性分析、多位点可变数目重复片段多态性分析等);菌体成分(脂肪酸、分枝菌酸)色谱分析方法。三类方法虽都有各自的优点,但也有不足之处,如传统分离培养周期长和菌体可培养率低;目前分子水平检测在特异性、灵敏性和简便性方面尚差些;菌体成分特性分析成本较高、操作复杂。
MTB H37Rv于1998年完成全基因组测序,是最早完成全图测序的MTB菌株。自此,各国研究者们基于算法优化、注释软件更新、转录组学和蛋白质组学等策略,一直在完善、补充H37Rv基因注释数据库。然而,由于MTB属于原核生物,由于原核生物基因组注释技术本身的不足,在基因组注释中尚可能
存在注释错误(过度注释、基因边界错误和ORF起始、终止位点错误、可变剪接、核糖体移位、漏注释),给深入、准确解析生物学机制带来了困扰。为解决此难题,蛋白质基因组学(Proteogenomics)虽已被用于H37Rv已注释基因的校正,然而,高比例假阳性、常规技术难以进行注释基因预测、新基因验证、新基因功能分析及其应用等是该领域所面临的难题。
总的来说,传统结核分枝杆菌复合群(MTBC)鉴定策略具有周期长、步骤繁琐、特异性和灵敏度不高等缺陷。为进一步完善对H37Rv全基因组重新注释,发现H37Rv中遗漏注释基因,确保H37Rv全基因组遗漏注释基因及其在MTBC分子鉴定中的应用技术得到有效保护,开发利用H37Rv新基因在MTBC类群中快速精准鉴别的方法势在必行。
发明内容
本发明的一个目的是提供一种结核分枝杆菌H37Rv新的编码基因,该基因为H37Rv漏注释编码基因Rv3128(+|3493573-3493707|),其可用作结核分枝杆菌复合群条形码分子标记,用于检测结核分枝杆菌复合群,其序列如SEQ ID NO.1所示。
本发明的其他目的包括提供可用于扩增上述编码基因的特异性PCR引物以及提供一种检测或鉴定样品中是否存在结合分枝杆菌复合群的检测方法;本发明还提供与上述编码基因相关的检测试剂盒和上述基因的应用。
根据本发明的一个方面,通过比较蛋白质基因组学研究技术,发现了H37Rv中一个难以被基因预测软件发现的蛋白编码序列,该基因能有效地将MTBC与同属的其它物种区分开来。该基因是一个结核分枝杆菌(Mycobacterium tuberculosis H37Rv)的遗漏注释基因,即Rv3128(+|3493573-3493707|),经NCBI-BLASTP后,数据库中没有比对到任何序列,属于功能未知蛋白。经比较基因组学研究发现该基因序列能将结核分枝杆菌复合群(MTBC)菌株与分枝杆菌属的其它种鉴别开来。
具体地,设计能对MTBC的Rv3128(+|3493573-3493707|)基因实现特异性扩增引物,即为本发明所提出的引物,引物序列为:
F:5’-TTGAGGCTGTCTCGGTAGGT-3’;
R:5’-GGGATAACGGGTTTAGATTTCG-3’。
根据待测样品中的该基因DNA序列PCR产物的有无或DNA序列的差异,可以快速准确鉴定MTBC。
根据本发明的另一个方面,基于上述结核分枝杆菌H37Rv新的标准编码基因,本发明具体地建立了检测或鉴定结核分枝杆菌复合群的方法,步骤如下:
(1)从待测样品中分离提取基因组DNA;
(2)以步骤(1)获得的DNA为模板,采用下述引物进行PCR扩增:
F:5’-TTGAGGCTGTCTCGGTAGGT-3’(SEQ ID NO.4);
R:5’-GGGATAACGGGTTTAGATTTCG-3’(SEQ ID NO.5)。
(3)对步骤(2)扩增得到的DNA产物进行凝胶电泳分析或进行测序;
(4)将步骤(3)的结果与条形码基因Rv3128(+|3493573-3493707|)进行比对,如果同源性大于99%,判定待测样品含有结核分枝杆菌复合群。
进一步地,上述检测方法,根据DNA条形码原理,初步对PCR产物进行电泳分析,如果待测菌株没有目标条带,说明该菌株不是MTBC;如果有条带,则可进一步测序验证,将测序得到系列与H37Rv的Rv3128(+|3493573-3493707|)的标准序列进行同源比较和比对,获得序列间的相似性,若序列同源性大于99%,即可判定菌株可能为MTBC;根据待鉴定鉴定菌株的DNA条形码序列与标准序列聚类情况来区分MTBC家族与非结核分枝杆菌、呼吸道常见病原菌及呼吸道常见病毒。
该检测方法即可用于对结核分枝杆菌复合群的菌种鉴定研究,也可用于临床快速检验。待测样品可以是从H37Rv菌株、其它MTBC、非结核分枝杆菌、呼吸道常见病原菌、呼吸道常见病毒菌株;或者直接使用结核病和其它呼吸道患者痰液、唾液或者血液。
在上述方法的基础上,本发明也提供检测试剂盒,试剂盒容器内装有用以检测结核分枝杆菌H37Rv新的标准编码基因的试剂,与之同时提供的可以是经政府药物管理机构审核的、有关药品或生物制品的制造、使用及销售信息。例如,采用PCR扩增后,直接检测样品中Rv3128(+|3493573-3493707|)基因的试剂,例如可含有扩增引物、dNTP、用于PCR反应的DNA聚合酶及其缓冲液、酶切反应和/或测序反应所需试剂等的一种或多种。本领域技术人员已知,以上组分仅是示意性的,例如,所述引物可以采用上述特异性PCR引物,所述的用于PCR反应的DNA聚合酶是能够用于PCR扩增的酶。本发明的编码基因的检测也可以以集成的例如基因芯片的方式提供。
有益效果:本发明提供了一种用作结核分枝杆菌复合群(Mycobacteriumtuberculosis complex,MTBC)分子鉴定的标准基因及分子鉴定方法,该基因能有效地将MTBC与同属的其它物种区分开来,应用该基因的鉴定方法克服了现有结核分枝杆菌复合群鉴定过程中的引物设计多重性、结果重复性差等缺点,具有通用、易扩增、易比对的特点,可以准确地将该类群从亲缘关系很近的其它分枝杆菌或其它呼吸道感染病菌中鉴定出来,为结核流行病学调查及临床结核病患者快速诊断、鉴别提供有力的技术手段和研究工具。
附图说明
图1:支持发现的新编码基因的肽谱匹配证据;
图2:合成肽段质谱图与原鉴定肽段质谱图对比;
图3:肽段坐落区域ORF编码的蛋白质序列对应图;下划线部分为蛋白质组学鉴定并被合成肽段验证的肽段;
图4:Rv3128(+|3493573-3493707|)标准基因序列同源性比较;
图5:H37Rv菌株Rv3128(+|3493573-3493707|)基因所对应的蛋白序列BLASTP结果;
图6:Rv3128(+|3493573-3493707|)特异引物PCR扩增产物琼脂糖凝胶电泳结果;
其中,各泳道样品具体信息见表1。
图7:Rv3128(+|3493573-3493707|)基因PCR扩增测序结果和标准序列比较。
具体实施方式
下面结合具体实施方式对本发明做进一步说明,但不限制本发明权利要求范围。本发明所用试剂均为市售。
实施例1:寻找H37Rv菌株基因组的漏注释编码基因
1.1对H37Rv菌株基因组的高覆盖蛋白质组验证
利用高覆盖蛋白质组技术对H37Rv菌株进行了蛋白质组的深度覆盖研究。基于Tuberculosis(20160307)数据库,使用pFind 3引擎对其基因组进行了注释编码基因验证。为了发现新的蛋白编码区,我们基于蛋白质基因组学技术,用pAnno软件对H37Rv在NCBI发表的全基因组(NC_000962.3)文件进行六阅读框数据库翻译,并利用这个数据库对质谱数据进行了新肽段和新蛋白质的鉴定。为了降低假阳性率,我们在数据过滤的过程中使用了3种对已注释肽段和新肽段分开估计类别FDR的过滤方法,分别是S-FDR,T-FDR I和T-FDRII。
经数据分析,我们共鉴定到3238个H37Rv已注释基因,覆盖度高达该菌株的80%以上,这是至今报道最大的H37Rv蛋白质谱数据。此外,经3种FDR≤1过滤后,我们获得新肽段。为了进一步确保新肽段质量,我们对上述过滤剩余的新肽段所对应的谱图进行了谱图质量筛选,最终保留了一些谱图质量好的肽段。为进一步排查这些谱图质量较高的肽段并非由于已注释肽段发生单个氨基酸突变所致,我们进行了氨基酸突变核查,确保这些新肽段为H37Rv新鉴定肽段。
1.2对Rv3128(+|3493573-3493707|)基因的编码蛋白和数据库验证
经过高覆盖蛋白质组验证后,我们发现一些疑似的新的漏注释肽段,对上述高可信得疑似新肽段进行肽段合成验证,据新肽段原始谱和肽段合成谱相似度打分≥0.9作为相似度阈值,经打分筛选后,有1条肽段通过验证,对应于新开放阅读框(Open ReadingFrame,ORF),即目前的H37Rv菌株的潜在漏注释基因。
其中,我们发现新的漏注释基因Rv3128(+|3493573-3493707|),经BLASTP比较,没有比对到任何序列,属于功能未知蛋白。我们检测到肽段AGEVDTVVAGPADDR(SEQ ID NO.6),且对应于新基因Rv3128(+|3493573-3493707|),如图1所示,谱图质量很好,b/y离子连续匹配,杂峰信号较低,结果很可信。
为进一步确证这个鉴定结果,我们按照我们新鉴定肽段的氨基酸序列化学合成了该肽段,并利用上述的质谱分析条件产生了该合成肽段的二级谱图。
我们对合成肽段产生的高能量碰撞MS2进行了核实,一级母离子和二级子离子均符合理论值,表明我们合成的肽段序列正确;在此基础上,我们手工检查了根据大规模蛋白质组数据鉴定到的新肽段序列的合成肽段的MS2和大规模鉴定新肽段谱图,两者几乎完全一致以子离子相似性获得的cosin值为0.95,证明我们从H37Rv中鉴定到的新肽段正确无误。(图2)。
在确认上述漏注释肽段的序列后,根据上述肽段所在的基因位置,以前一个终止密码子和后一个终止密码子包括的区域为界,得到包含上述新漏注释肽段的开放阅读框(ORF)DNA序列,如SEQ ID NO.2所示。
TAGGGCGGTGGGGATGTTAGCGAGGTAGAGCTGCTCGGTTTTCTCCTTGGCCAAGATGAGGAGTCGGTTCTGCAGGTCGGCGATTTTGCGGCCGATCTGGGCGGGGTTGAGGCTGTCTCGGTAGGTGATCAGGTCGGCCTGCTGGGCCGCGGAGAGCACCCTTGCGGCCAGTGGCCGGTCCAGCGGCGTCTGTGGGGCATCGTAGAGGCGTCGGCGGCGGCCGTCGGCGCTGCTGGCATACCCGATCGGTTTGATGGTCGGGGTGAGGTAGTTGAGGCGGTCGTTGACCAGCTTCCACATCCGGTTGAGCACGGCGCGTTCCTCGGCGGTGTCATAGCGGTAGTAGAACGCGTACTTGCGGACCAGGTGGTTGTTCTTGGACTCGATGGTGGCCTAGTGGTTTTTCTTGTACGGGCGAAAGCGGGTGAAGTAGATACCGTTGTCGCCGGCCCAGCTGATGACCGGCTTGTTGAGAAACACGGTGCCGTTGTCGAAATCTAA(SEQ ID NO.2)
该开放阅读框编码与氨基酸序列的对应关系如图3所示。
进一步翻译验证,发现真实的基因序列(SEQ ID NO.1)从上述开放阅读框DNA(SEQID NO.2)中的GTG开始,共135bp,编码44个氨基酸,其理论分子量4.48kDa,即为Rv3128(+|3493573-3493707|)基因。
GTGGTTGTTCTTGGACTCGATGGTGGCCTAGTGGTTTTTCTTGTACGGGCGAAAGCGGGTGAAGTAGATACCGTTGTCGCCGGCCCAGCTGATGACCGGCTTGTTGAGAAACACGGTGCCGTTGTCGAAATCTAA(SEQ ID NO.1)
该基因理论编码产物氨基酸序列如SEQ ID NO.3所示:
VVVLGLDGGLVVFLVRAKAGEVDTVVAGPADDRLVEKHGAVVEI(SEQ ID NO.3)
对该SEQ ID NO.3所示理论基因编码产物的氨基酸顺序进行NCBI-BLASTP分析,数据库中没有任何相似序列,属于功能未知蛋白。(见图5)。表明我们检测到的Rv3128(+|3493573-3493707|)基因产物在H37Rv菌株数据库中被遗漏注释。
我们将该Rv3128(+|3493573-3493707|)基因的DNA序列进行比较基因组本地BLAST分析,如图5所示,结果表明Rv3128(+|3493573-3493707|)基因序列属于MTBC家族特异性基因,在其它物种中没有同源性较高的序列,这表明我们在H37Rv菌株中发现的Rv3128(+|3493573-3493707|)基因序列具有较好的序列特异性,可将MTBC与同属内其它分枝杆菌及其它呼吸道感染细菌区分开。
实施例2:建立鉴定MTBC复合群的方法
(1)设计引物:
基于如SEQ ID NO.1所示的Rv3128(+|3493573-3493707|)基因的CDS序列,采用Oligo7.0设计了PCR引物,引物序列如下:
F:5’-TTGAGGCTGTCTCGGTAGGT-3’(SEQ ID NO.4);
R:5’-GGGATAACGGGTTTAGATTTCG-3’(SEQ ID NO.5)
上述引物在与Rv3128(+|3493573-3493707|)基因的位置关系如下所示,其中引物对应位置下标单划线,Rv3128基因序列为灰色背景区。
TTGAGGCTGTCTCGGTAGGTGATCAGGTCGGCCTGCTGGGCCGCGGAGAGCACCCTTGCGGCCAGTGGCCGGTCCAGCGGCGTCTGTGGGGCATCGTAGAGGCGTCGGCGGCGGCCGTCGGCGCTGCTGGCATACCCGATCGGTTTGATGGTCGGGGTGAGGTAGTTGAGGCGGTCGTTGACCAGCTTCCACATCCGGTTGAGCACGGCGCGTTCCTCGGCGGTGTCATAGCGGTAGTAGAACGCGTACTTGCGGACCAGGTGGTTGTTCTTGGACTCGATGGTGGCCTAGTGGTTTTTCTTGTACGGGCGAAAGCGGGTGAAGTAGATACCGTTGTCGCCGGCCCAGCTGATGACCGGCTTGTTGAGAAACACGGTGCCGTTGTCGAAATCTAAACCCGTTATCCC(SEQ ID NO.7)
(2)提取包括M.tuberculosis H37Rv在内的待测菌株的总DNA,40株分枝杆菌属标准菌株由中国医学细菌菌种保藏管理中心(CMCC)保藏,其余16株非结核分枝杆菌是中国人民解放军309医院临床分离株,已经完成菌种16S RNA基因测序、比对及NCBI序列提交工作,待测菌株如表1所示:
表1.选用的相关菌株
(3)扩增DNA片段,进行聚合酶链式(PCR)反应,使用上述F/R引物进行扩增。
PCR体系(25μL)为dd H2O(9.5μL)、2XTaq PCR MasterMix(TIANGEN,12.5μL)引物F(10μM,1μL)、引物R(10μM,1μL)、DNA模板(1μL);
扩增程序:94℃预变性3min、94℃变性30s、58℃退火30s、72℃延伸1min、35个循环,72℃延伸5min。
(4)扩增产物电泳检测,在琼脂糖凝胶、1×TBE电泳液中电泳检测。结果如图6所示,MTBC和阳性对照组在407bp处出现了扩增条带,且扩增结果和预期相符,特异性为98.3%。
(5)为了进一步验证扩增的DNA的序列,我们对扩增序列进行了测序并和漏注释序列比较,如图7所示,结果与预期完全相符,序列正确无误,这进一步验证了新漏注释基因的存在。
这表明基于Rv3128(+|3493573-3493707|)基因进行MTBC复合群鉴定的方法真实可靠。
SEQUENCE LISTING
<110> 北京蛋白质组研究中心
<120> 结核分枝杆菌H37Rv编码基因及其应用
<130> BJ1936-18P121911
<160> 7
<170> PatentIn version 3.3
<210> 1
<211> 135
<212> DNA
<213> Artificial
<220>
<223> 结核分枝杆菌H37Rv编码基因Rv3128(+|3493573-3493707|)
<400> 1
gtggttgttc ttggactcga tggtggccta gtggtttttc ttgtacgggc gaaagcgggt 60
gaagtagata ccgttgtcgc cggcccagct gatgaccggc ttgttgagaa acacggtgcc 120
gttgtcgaaa tctaa 135
<210> 2
<211> 501
<212> DNA
<213> Artificial
<220>
<223> 包含漏注释肽段的开放阅读框DNA序列
<400> 2
tagggcggtg gggatgttag cgaggtagag ctgctcggtt ttctccttgg ccaagatgag 60
gagtcggttc tgcaggtcgg cgattttgcg gccgatctgg gcggggttga ggctgtctcg 120
gtaggtgatc aggtcggcct gctgggccgc ggagagcacc cttgcggcca gtggccggtc 180
cagcggcgtc tgtggggcat cgtagaggcg tcggcggcgg ccgtcggcgc tgctggcata 240
cccgatcggt ttgatggtcg gggtgaggta gttgaggcgg tcgttgacca gcttccacat 300
ccggttgagc acggcgcgtt cctcggcggt gtcatagcgg tagtagaacg cgtacttgcg 360
gaccaggtgg ttgttcttgg actcgatggt ggcctagtgg tttttcttgt acgggcgaaa 420
gcgggtgaag tagataccgt tgtcgccggc ccagctgatg accggcttgt tgagaaacac 480
ggtgccgttg tcgaaatcta a 501
<210> 3
<211> 44
<212> PRT
<213> Artificial
<220>
<223> Rv3128(+|3493573-3493707|)基因理论编码产物氨基酸序列
<400> 3
Val Val Val Leu Gly Leu Asp Gly Gly Leu Val Val Phe Leu Val Arg
1 5 10 15
Ala Lys Ala Gly Glu Val Asp Thr Val Val Ala Gly Pro Ala Asp Asp
20 25 30
Arg Leu Val Glu Lys His Gly Ala Val Val Glu Ile
35 40
<210> 4
<211> 20
<212> DNA
<213> Artificial
<220>
<223> F引物序列
<400> 4
ttgaggctgt ctcggtaggt 20
<210> 5
<211> 22
<212> DNA
<213> Artificial
<220>
<223> R引物序列
<400> 5
gggataacgg gtttagattt cg 22
<210> 6
<211> 15
<212> PRT
<213> Artificial
<220>
<223> 漏注释肽段
<400> 6
Ala Gly Glu Val Asp Thr Val Val Ala Gly Pro Ala Asp Asp Arg
1 5 10 15
<210> 7
<211> 407
<212> DNA
<213> Artificial
<220>
<223> 上下游引物与Rv3128(+|3493573-3493707|)基因的整合序列演示
<400> 7
ttgaggctgt ctcggtaggt gatcaggtcg gcctgctggg ccgcggagag cacccttgcg 60
gccagtggcc ggtccagcgg cgtctgtggg gcatcgtaga ggcgtcggcg gcggccgtcg 120
gcgctgctgg catacccgat cggtttgatg gtcggggtga ggtagttgag gcggtcgttg 180
accagcttcc acatccggtt gagcacggcg cgttcctcgg cggtgtcata gcggtagtag 240
aacgcgtact tgcggaccag gtggttgttc ttggactcga tggtggccta gtggtttttc 300
ttgtacgggc gaaagcgggt gaagtagata ccgttgtcgc cggcccagct gatgaccggc 360
ttgttgagaa acacggtgcc gttgtcgaaa tctaaacccg ttatccc 407
Claims (10)
1.一种结核分枝杆菌H37Rv编码基因Rv3128(+|3493573-3493707|),所述编码基因的核苷酸序列如SEQ ID NO.1所示。
2.权利要求1所述的结核分枝杆菌H37Rv编码基因Rv3128(+|3493573-3493707|),其特征在于所述基因编码如SEQ ID NO.3序列所示的氨基酸。
3.一种条形码分子标记,用作检测和/或鉴定结核分枝杆菌复合群,其包含作为标准检测基因的权利要求1所述的结核分枝杆菌H37Rv编码基因Rv3128(+|3493573-3493707|)。
4.一种特异性PCR引物,用于扩增权利要求1所述的结核分枝杆菌H37Rv编码基因Rv3128(+|3493573-3493707|)。
5.权利要求4所述的PCR引物,其特征在于,所述引物的序列为:
F:5’-TTGAGGCTGTCTCGGTAGGT-3’;
R:5’-GGGATAACGGGTTTAGATTTCG-3’。
6.一种结核分枝杆菌复合群鉴定的检测方法,包括如下步骤:
(1)从待测样品中分离提取基因组DNA;
(2)以步骤(1)获得的DNA为模板,加入扩增引物,进行聚合酶链式反应;
(3)对步骤(2)扩增得到的DNA产物进行凝胶电泳分析或进行测序;
(4)将步骤(3)的结果与权利要求1所述的作为标准检测基因的Rv3128(+|3493573-3493707|)进行比对,根据其同源性判定待测样品中是否存在结核分枝杆菌复合群。
7.权利要求6所述的检测方法,其中步骤(2)中所述的扩增引物序列为:
F:5’-TTGAGGCTGTCTCGGTAGGT-3’;
R:5’-GGGATAACGGGTTTAGATTTCG-3’。
8.权利要求6所述的检测方法,其中在步骤(4)中,如果同源性大于99%,则判定待测样品中含有结核分枝杆菌复合群。
9.一种检测试剂盒,包含权利要求1所述的结核分枝杆菌H37Rv编码基因Rv3128(+|3493573-3493707|)和/或权利要求4所述的特异性PCR引物。
10.权利要求1所述的结核分枝杆菌H37Rv编码基因Rv3128(+|3493573-3493707|)在结核流行病学调查和/或临床结核病患者快速诊断和鉴别中的应用。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810402630.XA CN110408629B (zh) | 2018-04-28 | 2018-04-28 | 结核分枝杆菌H37Rv编码基因及其应用 |
PCT/CN2019/084041 WO2019206172A1 (zh) | 2018-04-28 | 2019-04-24 | 结核分枝杆菌H37Rv编码基因及其应用 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810402630.XA CN110408629B (zh) | 2018-04-28 | 2018-04-28 | 结核分枝杆菌H37Rv编码基因及其应用 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110408629A true CN110408629A (zh) | 2019-11-05 |
CN110408629B CN110408629B (zh) | 2020-11-20 |
Family
ID=68294820
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810402630.XA Active CN110408629B (zh) | 2018-04-28 | 2018-04-28 | 结核分枝杆菌H37Rv编码基因及其应用 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN110408629B (zh) |
WO (1) | WO2019206172A1 (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113249502A (zh) * | 2021-05-08 | 2021-08-13 | 上海康黎诊断技术有限公司 | 一种结核分枝杆菌复合菌群鉴定及耐药性检测的相关基因、方法、引物组以及试剂盒 |
CN113403327A (zh) * | 2020-03-17 | 2021-09-17 | 北京蛋白质组研究中心 | 结核分枝杆菌H37Rv新基因Rv2706及其编码蛋白和应用 |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112143795A (zh) * | 2020-09-30 | 2020-12-29 | 中国医学科学院病原生物学研究所 | Clec2b基因做为结核病鉴别诊断的应用 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2006035317A2 (en) * | 2004-09-30 | 2006-04-06 | Institut Pasteur | Immunogenic glycopeptides for diagnosing pathogenic microorganisms infections |
CN101421415A (zh) * | 2004-07-12 | 2009-04-29 | 阿维斯塔金格兰技术有限公司 | 通过比较感染性生物的临床分离物中的多态性区域构建比较数据库和鉴定致病因子 |
-
2018
- 2018-04-28 CN CN201810402630.XA patent/CN110408629B/zh active Active
-
2019
- 2019-04-24 WO PCT/CN2019/084041 patent/WO2019206172A1/zh active Application Filing
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101421415A (zh) * | 2004-07-12 | 2009-04-29 | 阿维斯塔金格兰技术有限公司 | 通过比较感染性生物的临床分离物中的多态性区域构建比较数据库和鉴定致病因子 |
WO2006035317A2 (en) * | 2004-09-30 | 2006-04-06 | Institut Pasteur | Immunogenic glycopeptides for diagnosing pathogenic microorganisms infections |
Non-Patent Citations (1)
Title |
---|
FANGBIN ZHOU等: "Protein array identification of protein markers for serodiagnosis of Mycobacterium tuberculosis infection", 《SCI REP.》 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113403327A (zh) * | 2020-03-17 | 2021-09-17 | 北京蛋白质组研究中心 | 结核分枝杆菌H37Rv新基因Rv2706及其编码蛋白和应用 |
CN113249502A (zh) * | 2021-05-08 | 2021-08-13 | 上海康黎诊断技术有限公司 | 一种结核分枝杆菌复合菌群鉴定及耐药性检测的相关基因、方法、引物组以及试剂盒 |
Also Published As
Publication number | Publication date |
---|---|
WO2019206172A1 (zh) | 2019-10-31 |
CN110408629B (zh) | 2020-11-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5317430B2 (ja) | プローブセット、プローブ担体、及び真菌の判別同定方法 | |
Jensen et al. | Candida palmioleophila: characterization of a previously overlooked pathogen and its unique susceptibility profile in comparison with five related species | |
CN110408629A (zh) | 结核分枝杆菌H37Rv编码基因及其应用 | |
CN110408630A (zh) | 结核分枝杆菌H37Rv编码基因及其应用 | |
CN115976235B (zh) | 德氏乳杆菌cicc 6047菌株的鉴定方法及其引物、试剂盒和应用 | |
KR102675157B1 (ko) | Pna 프로브를 이용한 소 결핵병 진단방법 및 키트 | |
CN105420392B (zh) | 一组与新生儿肌张力低下表型相关的基因新突变及检测试剂盒 | |
CN108165562A (zh) | 结核分枝杆菌H37Rv编码基因及其应用 | |
CN108165561A (zh) | 结核分枝杆菌H37Rv编码基因及其应用 | |
CN108004253A (zh) | 结核分枝杆菌H37Rv编码基因及其应用 | |
CN102719537A (zh) | 耐多药结核分枝杆菌非荧光dna微阵列检测方法及试剂盒 | |
CN110408632A (zh) | 结核分枝杆菌H37Rv编码基因及其应用 | |
CN108165564A (zh) | 结核分枝杆菌H37Rv编码基因及其应用 | |
CN110423835A (zh) | 用于下呼吸道病原微生物检测的引物组合物 | |
CN108165565A (zh) | 结核分枝杆菌H37Rv编码基因及其应用 | |
CN108165560A (zh) | 结核分枝杆菌H37Rv编码基因及其应用 | |
CN110343706A (zh) | 结核分枝杆菌H37Rv编码基因及其应用 | |
CN110408631A (zh) | 结核分枝杆菌H37Rv编码基因及其应用 | |
CN108165563A (zh) | 结核分枝杆菌H37Rv编码基因及其应用 | |
CN110923349B (zh) | 小肠结肠炎耶尔森氏菌的种特异性检测分子标签3283、3316及其快速检测方法 | |
CN110499380A (zh) | 一种检测黄杆菌的引物对和检测方法 | |
CN110106276A (zh) | 一种鉴别当归的试剂盒及鉴别方法 | |
KR100568702B1 (ko) | 미생물 탐지용 dna 마이크로어레이 및 이의 제조방법 | |
CN109988856A (zh) | 用于检测耶式肺孢子菌的lamp引物组合及其应用 | |
CN117230090A (zh) | 脓肿分枝杆菌编码基因及其应用 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
TR01 | Transfer of patent right |
Effective date of registration: 20240206 Address after: 100850 No. 27 Taiping Road, Beijing, Haidian District Patentee after: ACADEMY OF MILITARY MEDICAL SCIENCES Country or region after: China Address before: Building 1, No.33, kekeyuan Road, Changping District, Beijing Patentee before: BEIJING PROTEOME RESEARCH CENTER Country or region before: China |
|
TR01 | Transfer of patent right |