WO2021246045A1 - 検体中に存在する非結核性抗酸菌の種又は亜種を同定するためのシステム及び方法 - Google Patents

検体中に存在する非結核性抗酸菌の種又は亜種を同定するためのシステム及び方法 Download PDF

Info

Publication number
WO2021246045A1
WO2021246045A1 PCT/JP2021/014475 JP2021014475W WO2021246045A1 WO 2021246045 A1 WO2021246045 A1 WO 2021246045A1 JP 2021014475 W JP2021014475 W JP 2021014475W WO 2021246045 A1 WO2021246045 A1 WO 2021246045A1
Authority
WO
WIPO (PCT)
Prior art keywords
ntm
genes
sequence information
sample
database
Prior art date
Application number
PCT/JP2021/014475
Other languages
English (en)
French (fr)
Inventor
昇 中村
昇太 中村
悠希 松本
武士 金城
Original Assignee
株式会社ビケンバイオミクス
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 株式会社ビケンバイオミクス filed Critical 株式会社ビケンバイオミクス
Priority to EP21818700.3A priority Critical patent/EP4163395A1/en
Publication of WO2021246045A1 publication Critical patent/WO2021246045A1/ja

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6888Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms
    • C12Q1/689Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms for bacteria
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids

Definitions

  • the present invention relates to a system and a method for identifying a species or subspecies of nontuberculous mycobacteria present in a sample.
  • Mycobacterium is known to cause various infectious diseases, and can be broadly divided into tuberculosis bacteria that cause tuberculosis, leprosy bacteria that cause leprosy, and other nontuberculous mycobacteria (Non).
  • Non nontuberculous mycobacteria
  • NTM -Tuberculous Mycobacteria
  • NTM disease mainly caused by NTM have not yet been sufficiently established. Therefore, NTM disease is positioned as an important infectious disease in terms of public health. In recent years, an increase in the prevalence of NTM disease has been reported (see, for example, Non-Patent Document 1 and the like).
  • the first important thing in formulating a treatment policy for NTM disease is to identify the causative bacterial species / subspecies, and for that purpose, anti-acid staining methods and mass spectrometry methods have been used in the past.
  • an MLST (multi-locus sequence typing) method has been used in which DNA sequencing of a plurality of housekeeping genes in a sample is performed and compared with a DNA sequence registered in a database (.
  • Non-Patent Documents 2, 3, etc. Some methods based on genomic information have succeeded in identifying subspecies levels of bacterial species using ribosomal genes, core genomes, and whole-genome information (see, for example, Non-Patent Documents 4 to 6 and the like).
  • the present invention has been made in view of the above problems, and an object thereof is to enable accurate and rapid identification of a bacterial species and subspecies of NTM contained in a sample containing NTM. There is something in it.
  • the system according to the present invention is a system for identifying a species or subspecies of NTM present in a sample by the MLST (multi-locus sequence typing) method, and is a system for identifying the NTM present in the sample.
  • a sequencing device for obtaining sequence information of a plurality of genes in the genome sequence, a database for storing the sequence information of known NTMs, sequence information of a plurality of genes obtained by the sequencing device, and the database.
  • the species or subspecies of the NTM having the sequence information closest to the sequence information of the NTM in the sample among the known NTMs stored in the database is selected.
  • the plurality of genes are selected from 184 kinds of genes shown in Table 1.
  • the system according to the present invention as a plurality of genes necessary and sufficient for identifying a large number of NTM species or subspecies using the MLST method, desired by the MLST method using the sequence information of the above-mentioned plurality of genes.
  • the desired species or subspecies of NTM can be identified extremely accurately and quickly.
  • the plurality of genes are 30S ribosomes S1 to S21 (rpsA to U), 50S ribosomes L1 to L36 (rplA to F, I to U, rpmA to J), and 5S ribosomal RNA (rrf). It preferably contains 16S ribosomal RNA (rs), 23S ribosomal RNA (rrl), rpoB, groEL2, gyrB, inhA, tlyA, katG, pncA, erm, eis and embB.
  • the database is referred to as mlstdb. It is preferably NTM (https://github.com/ymatsumoto/mlstverse.Mycobacterium.db).
  • the software is preferably mlstverse (https://github.com/ymatsumoto/mlstverse).
  • the method according to the present invention is a method for identifying a species or subspecies of NTM present in a sample by an MLST (multi-locus sequence typing) method, in which sequencing is performed on the NTM present in the sample.
  • a step of obtaining sequence information of a plurality of genes in the genome sequence of the NTM and a step of comparing the obtained sequence information with the sequence information of the plurality of genes in a known NTM stored in a predetermined database.
  • the plurality of genes are selected from the 184 kinds of genes shown in Table 1.
  • the above-mentioned plurality of genes are used as a plurality of genes necessary and sufficient for identifying a large number of NTM species or variants using the MLST method. Since the desired NTM species or subspecies are identified by the MLST method using the sequence information of, the desired NTM species or subspecies can be identified extremely accurately and rapidly.
  • 30S ribosomal S1 to S21 (rpsA to U), 50S ribosomal L1 to L36 (rplA to F, I to U, rpmA to J), 5S ribosomal RNA (rrf), 16S ribosomal RNA (rs).
  • 23S ribosomal RNA (rrl), rpoB, groEL2, gyrB, inhA, tlyA, katG, pncA, erm, eis and embB.
  • the database is referred to as mlstdb. It is preferably NTM (https://github.com/ymatsumoto/mlstverse.Mycobacterium.db).
  • the software is preferably mlstverse (https://github.com/ymatsumoto/mlstverse).
  • the bacterial species and subspecies of NTM contained in the sample are accurately determined for the sample containing various NTMs. And it can be identified quickly.
  • the system for identifying the species or subspecies of NTM present in the sample utilizes the MLST (multi-locus sequence typing) method, and the NTM present in the sample.
  • a sequencing device for obtaining sequence information of a plurality of genes in the genome sequence of the above a database for storing sequence information of a plurality of genes in a known NTM, and sequence information of a plurality of genes obtained by the sequencing device. And the sequence information of the plurality of genes stored in the database, and among the known NTMs stored in the database, the NTM having the sequence information closest to the sequence information of the NTM in the sample. It is equipped with software for selecting species or variants. Further, the plurality of genes are characterized by being selected from 184 kinds of genes shown in Table 1 described later.
  • the method for identifying the species or subspecies of NTM present in the sample is a nontuberculous mycobacteria present in the sample by the MLST (multi-locus sequence typing) method.
  • NTM Non-Tuberculous Mycobacteria
  • It comprises a step of selecting a species or subspecies of an NTM having the sequence information closest to the sequence information of the NTM in the sample among the known NTMs stored in the database.
  • the plurality of genes are characterized by being selected from 184 kinds of genes shown in Table 1 described later.
  • the MLST method is a method used for classifying bacteria and the like.
  • the DNA base sequences of a plurality of genes of a target bacterium are determined, and the base sequence is used as the base sequence information of a plurality of genes in a known bacterium. It is a method of classifying and identifying a target bacterium by collating with a database containing.
  • essential genes such as a plurality of housekeeping genes are often used as the plurality of genes.
  • the base sequences of the seven essential genes of interest are 100% matched with the base sequences of the seven essential genes in the genotype (sequence type: ST) of a predetermined bacterial species. If it is, it is classified into the bacterial species as the same genotype. Also, if any one of the base sequences of the seven genes is different, it is classified as a subtype and classified into another species.
  • the sample is not limited to the following, but for example, a biological sample containing a body fluid such as blood or lymph obtained from a human or an animal is used.
  • the sample may be an NTM-containing solution purified from the biological sample and containing NTM in a predetermined medium.
  • the sample is preferably a solution containing only one type of NTM isolated by using a well-known bacterial isolation method such as the dilution plate method.
  • the genomic DNA of the sample is extracted before obtaining the sequence information of a plurality of genes among the genomic sequences of NTM existing in the sample.
  • the method for extracting genomic DNA is well known to those skilled in the art, and the optimum method is appropriately selected by those skilled in the art depending on the sample. Further, the obtained genomic DNA is subjected to pretreatment known to those skilled in the art such as fragmentation so that it can be sequenced by a sequencing device.
  • the sequencing device for obtaining sequence information of a plurality of genes among the genomic sequences of NTM existing in the sample is not particularly limited as long as it can determine the base sequence, but it is faster and more accurate. It is preferable that the device can determine the base sequence.
  • a sequencing device capable of simultaneously determining the base sequences of a plurality of samples or a sequencing device capable of obtaining the base sequence determination results in real time is preferable.
  • the sequencing device for example, MiSeq of Illumina, MinION of Oxford Nanopore Technologies, etc. are preferably used.
  • the database for storing the sequence information of a plurality of genes in a known NTM is not particularly limited as long as it is a published MLST database containing the base sequence information of many NTM species, but in particular, the present inventor.
  • the mlstdb. NTM https://github.com/ymatsumoto/mlstverse.Mycobacterium.db) is preferably used.
  • the NTM is constructed from the genomic information of 175 kinds of NTMs, and stores sequence information of 184 kinds of genes related to ribosomal proteins, ribosomal RNA genes, antibiotic resistance genes, pathogenic genes and the like. Specifically, the sequence type of the sequence of 184 kinds of genes corresponding to each species or subspecies of NTM is stored.
  • the 184 kinds of genes referred to here are as shown in Table 1 below.
  • the plurality of genes used in the MLST method include at least 30S ribosomes S1 to S21 (rpsA to U) and 50S ribosomes L1 to L36 (rplA to F, I to U) among the genes shown in Table 1. It is preferable to include rpmA to J), 5S ribosomal RNA (rrf), 16S ribosomal RNA (rrs), 23S ribosomal RNA (rrl), rpoB, groEL2, gyrB, inhA, tlyA, katG, pncA, erm, eis and embB. ..
  • genes characteristic of the NTM can be added, thereby improving the accuracy of identification.
  • the software for selecting the species or subspecies of the NTM having the sequence information closest to the sequence information of the NTM in the sample among the known NTMs stored in the database performs the workflow as shown in FIG.
  • the software is not limited as long as it can be used, but mlstverse (https://github.com/ymatsumoto/mlstverse) developed by the present inventors can be preferably used.
  • the software first reads sequence information in which 184 kinds of gene assemblies are mapped from the above database.
  • the database contains sequence types of 184 gene sequences corresponding to each species or subspecies of NTM, and FIG. 1 shows N sequence types.
  • the software reads the sequence information obtained by the sequencing device and compares it with each sequence of the above sequence types.
  • the software aligns the sequences to be compared and calculates the cover ratio and mean depth of each sequence. Then, in FIG. 1, 3.
  • the MLST score is calculated by the formula shown in.
  • a statistical hypothesis test is performed on the obtained data, and the variance of the results obtained by performing the Kolmogorov-Smirnov test, for example, as shown in FIG. 1, is confirmed.
  • the software determines the sequence type having the highest MLST score among the sequence types of ST1 to STN, and outputs the species or subspecies of NTM corresponding to the sequence type. At this time, a plurality of NTM species or variants and their corresponding MLST scores may be output as a list.
  • the software outputs the species or subspecies of NTM in the sample from the sequence information obtained from the sequencing device.
  • sequence information 184 kinds of genes is used, but the present invention is not limited to this, and the gene to be used can be appropriately selected from those genes.
  • the following is an example for explaining in detail the system and method for identifying the species or subspecies of NTM present in the sample according to the present invention.
  • the species and subspecies of NTM in the samples are identified by using the conventional method using the 16S ribosomal RNA gene sequence and the method according to the present invention. , The results obtained by each method were compared. The method and results are shown below.
  • the method according to this embodiment refer to Emerging Microbes & Infections, Vol.8 (1), p1043-1053.
  • sample As the sample, 29 kinds of samples isolated by a conventional method from clinical samples obtained from multiple patients at Ryukyu University Hospital were used (Fig. 2). Samples were seeded in 2% Ogawa medium and cultured at 35 ° C.
  • the sample (strain) obtained as described above was prepared as a solid medium (19 g Middlebrook 7H10 agar (BD Difco), 5.0 ml glycerol, 895 ml distilled water, 100 ml Middlebrook OADC Enrichment (BD BBL), R agar (BBL).
  • a library was prepared using the Rapid Barcoding Kit provided by Oxford Nanopore Technologies. Experimental operations were performed according to the instructions in the kit, fragmentation of genomic DNA molecules, barcoding for sample identification, and adapters for sequencing were performed to prepare a library for the MinION sequencer (Oxford Nanopore Technologies). After loading the library into MinION, a run was performed, and the sequence data was saved in the fast5 format, which is raw data, on the connected computer.
  • the output fast5 data is uploaded to a high-performance computing server, and base call processing is performed to convert it into the fastq format, which is the base sequence information.
  • the base-called sequence file is processed by mlstverse to identify the bacterial species.
  • the species name, MLST score, and statistical value for each relevant bacterial species are obtained, and the species with the highest MLST score is adopted as the identification result.
  • 16S ribosomal RNA was amplified by polymerase chain reaction (PCR) using the genomic DNA extracted from each sample as a template as described above. The following sequence was used as the primer.
  • PCR polymerase chain reaction
  • PCR was performed at 95 ° C for 3 minutes, then at 98 ° C for 20 seconds, at 60 ° C for 15 seconds and at 72 ° C for 30 seconds using 2 ⁇ KAPA HiFi HotStart ReadyMix (Roche) and the above primers of 0.3 ⁇ M. I went to the cycle. Then, the final extension reaction was carried out at 72 ° C. for 1 minute.
  • Table 2 shows the strains of the genus Mycobacterium showing 98.7% or more sequence identity.
  • Table 3 shows the results of library preparation, sequencing, and software analysis as described above using genomic DNA extracted from the 29 types of samples according to the method of the present invention.
  • Table 3 shows the corresponding bacterial species and their scores for which a high MLST score was obtained in each sample obtained by the above software analysis.
  • a high value such as 0.90 was obtained as the average value of the highest MLST scores of each of the 29 types of samples.
  • the average value of the next highest score was 0.50 or less, and a large difference was seen. Therefore, it can be said that the bacterial species with the highest score can be identified as the bacterial species in the sample.
  • sample No. As in 2 to 5, the difference in MLST score can be obtained by the subspecies (subsp.), Therefore, it can be said that the subspecies of each strain can also be identified.

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Organic Chemistry (AREA)
  • Analytical Chemistry (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Physics & Mathematics (AREA)
  • Biotechnology (AREA)
  • General Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • General Engineering & Computer Science (AREA)
  • Immunology (AREA)
  • Genetics & Genomics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Medical Informatics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

非結核性抗酸菌(Non-Tuberculous Mycobacteria:NTM)を含む検体に対して、その検体に含まれるNTMの菌種及び亜種を正確且つ迅速に同定できるようにする。本発明に係るシステムは、検体中に存在するNTMのゲノム配列のうち複数の遺伝子の配列情報を得るためのシーケンシング装置と、既知のNTMにおける複数の遺伝子の配列情報を格納するデータベースと、前記シーケンシング装置により得られた複数の遺伝子の配列情報と、前記データベースに格納された前記複数の遺伝子の配列情報とを比較して、前記データベースに格納された前記既知のNTMのうち前記検体中のNTMの配列情報に最も近い配列情報を有するNTMの種又は亜種を選択するソフトウェアとを備えている。

Description

検体中に存在する非結核性抗酸菌の種又は亜種を同定するためのシステム及び方法
 本発明は、検体中に存在する非結核性抗酸菌の種又は亜種を同定するためのシステム及び方法に関する。
 従来からマイコバクテリウム属細菌はさまざまな感染症を引き起こすことが知られており、大きく分けて結核を引き起こす結核菌、ハンセン病の原因となるらい菌、そしてそれら以外の非結核性抗酸菌(Non-Tuberculous Mycobacteria:NTM)の3つに分類される。
 上記結核やハンセン病については予防法や治療法が確立されている一方で、NTMにより主に引き起こされる呼吸器感染症(NTM症)については、予防法や治療法が未だ十分に確立されていない。このため、NTM症は、公衆衛生上、重要な感染症に位置付けられている。また、近年、NTM症の罹患率の増大が報告されている(例えば非特許文献1等を参照。)。
 NTM症の治療方針を立てる上でまず重要なことは原因菌種・亜種を同定することであり、そのために、従来は抗酸染色法や質量分析法などが用いられていた。近年では、上記同定のために、特に、検体における複数のハウスキーピング遺伝子のDNAシーケンシングを行い、データベースに登録されたDNA配列と比較するMLST(multi-locus sequence typing)法が利用されている(例えば非特許文献2、3等を参照。)。ゲノム情報に基づいたいくつかの方法では、リボソーム遺伝子やコアゲノム及び全ゲノム情報を利用して菌種の亜種レベルの同定を成功している(例えば非特許文献4~6等を参照)。
Namkoong H. et al. Emerg Infect Dis. 2016, 22, 1116-1117. Stackebrandt E. et al. Int J Syst Evol Microbiol. 1994, 44, 846-849. Enright MC. et al. Trends Microbiol. 1999, 7, 482-487. Maiden MCJ. et al. Nat Rev Microbiol. 2013, 11, 728-736. Zolfo M. et al. Nucleic Acid Res. 2016, 1, 1-10. Jolley KA. et al. BMC Bioinformatics. 2010, 11, 595.
 MLST法を用いる場合、上記の通り、検体のDNA配列とデータベースに登録された菌種のDNA配列とを比較する必要があるが、既存のデータベースは、登録されているゲノム情報が未だ十分ではなく、同定できる菌種に限りがある。また、MLSTのための検体のシーケンシング及び配列比較などのプロセスは、高価なシーケンシング装置や演算装置を使用してもかなりの時間を必要とする。従って、上記NTM症の診断のために、複数の検体に対して原因菌種・亜種を同定するためには膨大な時間を必要とし、未だ実用化が困難である。
 本発明は、前記の問題に鑑みてなされたものであり、その目的は、NTMを含む検体に対して、その検体に含まれるNTMの菌種及び亜種を正確且つ迅速に同定できるようにすることにある。
 本発明者らは、鋭意検討を行った結果、MLST法を利用して正確且つ迅速にNTMの菌種及び亜種の同定をする際の指標として有効に用いられ得る遺伝子を見出して、本発明を完成した。
 具体的に、本発明に係るシステムは、MLST(multi-locus sequence typing)法によって検体中に存在するNTMの種又は亜種を同定するためのシステムであって、前記検体中に存在するNTMのゲノム配列のうち複数の遺伝子の配列情報を得るためのシーケンシング装置と、既知のNTMの配列情報を格納するデータベースと、前記シーケンシング装置により得られた複数の遺伝子の配列情報と、前記データベースに格納された前記複数の遺伝子の配列情報とを比較して、前記データベースに格納された既知のNTMのうち前記検体中のNTMの配列情報に最も近い配列情報を有するNTMの種又は亜種を選択する演算装置とを備え、前記複数の遺伝子は、表1に示す184種の遺伝子から選択されることを特徴とする。
 本発明に係るシステムによると、MLST法を用いて数多くのNTMの種又は亜種を同定するために必要且つ十分な複数の遺伝子として、上記した複数の遺伝子の配列情報を用いてMLST法により所望のNTMの種又は亜種を同定するため、極めて正確且つ迅速に所望のNTMの種又は亜種を同定することができる。
 本発明に係るシステムにおいて、前記複数の遺伝子は、30SリボソームS1~S21(rpsA~U)、50SリボソームL1~L36(rplA~F、I~U、rpmA~J)、5SリボソームRNA(rrf)、16SリボソームRNA(rrs)、23SリボソームRNA(rrl)、rpoB、groEL2、gyrB、inhA、tlyA、katG、pncA、erm、eis及びembBを含むことが好ましい。
 本発明に係るシステムにおいて、前記データベースは、mlstdb.NTM(https://github.com/ymatsumoto/mlstverse.Mycobacterium.db)であることが好ましい。
 本発明に係るシステムにおいて、前記ソフトウェアは、mlstverse(https://github.com/ymatsumoto/mlstverse)であることが好ましい。
 本発明に係る方法は、MLST(multi-locus sequence typing)法によって検体中に存在するNTMの種又は亜種を同定する方法であって、前記検体中に存在するNTMに対して、シーケンシングを行って前記NTMのゲノム配列のうち複数の遺伝子の配列情報を得るステップと、前記得られた配列情報を、所定のデータベースに格納された既知のNTMにおける前記複数の遺伝子の配列情報と比較するステップと、前記複数の遺伝子の配列情報の比較の結果、前記データベースに格納された既知のNTMのうち前記検体中のNTMの配列情報に最も近い配列情報を有するNTMの種又は亜種を選択するステップとを備え、前記複数の遺伝子は、表1に示す184種の遺伝子から選択されることを特徴とする。
 本発明に係る方法によると、前記本発明に係るシステムと同様に、MLST法を用いて数多くのNTMの種又は亜種を同定するために必要且つ十分な複数の遺伝子として、上記した複数の遺伝子の配列情報を用いてMLST法により所望のNTMの種又は亜種を同定するため、極めて正確且つ迅速に所望のNTMの種又は亜種を同定することができる。
 本発明に係る方法において、30SリボソームS1~S21(rpsA~U)、50SリボソームL1~L36(rplA~F、I~U、rpmA~J)、5SリボソームRNA(rrf)、16SリボソームRNA(rrs)、23SリボソームRNA(rrl)、rpoB、groEL2、gyrB、inhA、tlyA、katG、pncA、erm、eis及びembBを含むことが好ましい。
 本発明に係る方法において、前記データベースは、mlstdb.NTM(https://github.com/ymatsumoto/mlstverse.Mycobacterium.db)であることが好ましい。
 本発明に係る方法において、前記ソフトウェアは、mlstverse(https://github.com/ymatsumoto/mlstverse)であることが好ましい。
 本発明に係る検体中に存在するNTMの種又は亜種を同定するためのシステム及び方法によると、種々のNTMを含む検体に対して、その検体に含まれるNTMの菌種及び亜種を正確且つ迅速に同定することができる。
本発明の一実施形態に係る検体中に存在するNTMの種又は亜種を同定するためのシステムで用いられるソフトウェアのワークフローを示す図である。 本実施例において臨床検体から単離した29種のサンプルの写真を示している。
 以下、本発明を実施するための形態を説明する。以下の好ましい実施形態の説明は、本質的に例示に過ぎず、本発明、その適用方法或いはその用途を制限することを意図するものではない。
 本発明の一実施形態に係る検体中に存在するNTMの種又は亜種を同定するためのシステムは、MLST(multi-locus sequence typing)法を利用するものであって、検体中に存在するNTMのゲノム配列のうち複数の遺伝子の配列情報を得るためのシーケンシング装置と、既知のNTMにおける複数の遺伝子の配列情報を格納するデータベースと、前記シーケンシング装置により得られた複数の遺伝子の配列情報と、前記データベースに格納された前記複数の遺伝子の配列情報とを比較して、前記データベースに格納された前記既知のNTMのうち前記検体中のNTMの配列情報に最も近い配列情報を有するNTMの種又は亜種を選択するソフトウェアとを備えている。また、前記複数の遺伝子は、後に説明する表1に示す184種の遺伝子から選択されることを特徴とする。
 また、本発明の一実施形態に係る検体中に存在するNTMの種又は亜種を同定するための方法は、MLST(multi-locus sequence typing)法によって検体中に存在する非結核性抗酸菌(Non-Tuberculous Mycobacteria:NTM)の種又は亜種を同定する方法であって、前記検体中に存在するNTMに対して、シーケンシングを行って前記NTMのゲノム配列のうち複数の遺伝子の配列情報を得るステップと、前記得られた配列情報を、所定のデータベースに格納された既知のNTMにおける前記複数の遺伝子の配列情報と比較するステップと、前記複数の遺伝子の配列情報の比較の結果、前記データベースに格納された既知のNTMのうち前記検体中のNTMの配列情報に最も近い配列情報を有するNTMの種又は亜種を選択するステップとを備えている。前記複数の遺伝子は、後に説明する表1に示す184種の遺伝子から選択されることを特徴とする。
 MLST法とは、細菌等の分類を行うために用いられる方法であって、対象の細菌の複数の遺伝子のDNA塩基配列を決定し、その塩基配列を既知の細菌における複数の遺伝子の塩基配列情報を格納するデータベースと照合することにより、対象の細菌を分類及び同定する方法である。一般には、上記複数の遺伝子として複数のハウスキーピング遺伝子等の必須遺伝子が用いられることが多い。この方法において、例えば7つの遺伝子を用いた場合、対象の7つの必須遺伝子の塩基配列が、所定の細菌種の遺伝子型(sequence type:ST)における7つの必須遺伝子の塩基配列と100%マッチすれば同一の遺伝子型として当該細菌種に分類される。また、7つの遺伝子の塩基配列のうち1つでも異なればそれは亜型であるとして別の種に分類される。
 本実施形態において、検体とは、以下のものに限られないが、例えばヒトや動物から得られた血液やリンパ液等の体液を含む生物学的サンプルが用いられる。検体は、前記生物学的サンプルから精製され、所定の媒体にNTMが含有されたNTM含有溶液であってもよい。特に、検体は、希釈平板法等の周知の細菌単離方法を利用して単離された1種のNTMのみを含む溶液であることが好ましい。
 本実施形態において、検体中に存在するNTMのゲノム配列のうち複数の遺伝子の配列情報を得る前に、検体のゲノムDNAを抽出する。ゲノムDNAの抽出方法は、当業者に周知であって、検体によって最適な方法が当業者に適宜選択される。また得られたゲノムDNAは、シーケンシング装置により配列決定できるように断片化等の当業者に周知の前処理がなされる。
 本実施形態において、検体中に存在するNTMのゲノム配列のうち複数の遺伝子の配列情報を得るためのシーケンシング装置は、塩基配列を決定できる装置であれば特に限定されないが、より高速かつ正確に塩基配列を決定できる装置であることが好ましい。例えば複数の検体の塩基配列を同時に決定できるシーケンシング装置や、リアルタイムで塩基配列の決定結果が得られるシーケンシング装置であることが好ましい。シーケンシング装置として、例えばイルミナ社のMiSeqやオックスフォードナノポアテクノロジーズ社のMinION等が好適に用いられる。
 本実施形態において、既知のNTMにおける複数の遺伝子の配列情報を格納するデータベースは、多くのNTMの種の塩基配列情報を含む公開されたMLSTデータベースであれば特に限定されないが、特に、本発明者らが構築したmlstdb.NTM(https://github.com/ymatsumoto/mlstverse.Mycobacterium.db)が好適に用いられる。mlstdb.NTMには、175種のNTMのゲノム情報から構築されたものであり、リボソームタンパク質、リボソームRNA遺伝子、抗生物質耐性遺伝子及び病原遺伝子等に関する184種の遺伝子の配列情報が格納されている。具体的には、NTMのそれぞれの種又は亜種に対応する184種の遺伝子の配列の配列型が格納されている。なお、ここでいう184種の遺伝子は下記表1に示す通りである。
Figure JPOXMLDOC01-appb-T000001
Figure JPOXMLDOC01-appb-I000002
Figure JPOXMLDOC01-appb-I000003
Figure JPOXMLDOC01-appb-I000004
Figure JPOXMLDOC01-appb-I000005
Figure JPOXMLDOC01-appb-I000006
Figure JPOXMLDOC01-appb-I000007
Figure JPOXMLDOC01-appb-I000008
Figure JPOXMLDOC01-appb-I000009
 本実施形態において、MLST法に利用される上記複数の遺伝子は、表1に示す遺伝子のうち少なくとも30SリボソームS1~S21(rpsA~U)、50SリボソームL1~L36(rplA~F、I~U、rpmA~J)、5SリボソームRNA(rrf)、16SリボソームRNA(rrs)、23SリボソームRNA(rrl)、rpoB、groEL2、gyrB、inhA、tlyA、katG、pncA、erm、eis及びembBを含むことが好ましい。同定するNTMによっては、これらの遺伝子に加えて当該NTMにおいて特徴的な遺伝子を追加することができ、そうすることにより同定の精度を向上することができる。
 本実施形態において、データベースに格納された既知のNTMのうち検体中のNTMの配列情報に最も近い配列情報を有するNTMの種又は亜種を選択するソフトウェアは、図1に示すようなワークフローを行うことができるソフトウェアであれば限定されないが、特に本発明者らにより開発されたmlstverse(https://github.com/ymatsumoto/mlstverse)が好適に用いられ得る。図1に示すように当該ソフトウェアは、まず、上記データベースから184種の遺伝子アセンブリがマップ化された配列情報を読み込む。上述の通り、データベースにはNTMのそれぞれの種又は亜種に対応する184種の遺伝子の配列の配列型が格納されており、図1ではN個の配列型が示されている。また、ソフトウェアは、上記シーケンシング装置により得られた配列情報を読み込み、上記各配列型のそれぞれの配列と比較する。ソフトウェアは、比較する配列同士をアライメントしてそれぞれの配列の被覆率(cover ratio)及び平均深度(mean depth)を算出する。続いて、図1の3.に示す数式によって、MLSTスコアを算出する。その後、得られたデータに対して統計的仮説検定を行い、例えば図1に示すように、コルモゴロフ‐スミルノフ検定を行うことにより得られた結果の分散を確認する。そして、ソフトウェアは、ST1~STNの配列型のうち最も高いMLSTスコアの配列型を決定し、その配列型に対応するNTMの種又は亜種を出力する。このときに、複数のNTMの種又は亜種とそれらに対応するMLSTスコアとをリストとして出力してもよい。
 以上のようにして、当該ソフトウェアが、シーケンシング装置から得られた配列情報から、検体中のNTMの種又は亜種を出力する。なお、上記説明では184種の遺伝子の配列情報を全て用いたが、これに限定されず、それらの遺伝子の中から用いる遺伝子を適宜選択することもできる。
 以下に、本発明に係る検体中に存在するNTMの種又は亜種を同定するためのシステム及び方法を詳細に説明するための実施例を示す。本実施例では、29検体の臨床サンプルに対して、従来の16SリボソームRNA遺伝子配列を利用した方法と、本発明に係る方法とを用いて、サンプル中のNTMの種及び亜種の同定を行い、それぞれの方法で得られた結果を比較した。以下にその方法及び結果を示す。また、本実施例に係る方法については、Emerging Microbes & Infections, Vol.8 (1), p1043-1053を参照することができる。
 (サンプル)
 サンプルは、琉球大学病院の複数の患者から得られた臨床検体から常法により単離された29種のサンプルを用いた(図2)。サンプルは2%小川培地に播種し、35℃で培養した。
 (菌株の培養及びDNAの抽出)
 上記のようにして得られたサンプル(菌株)を固形培地(19gのMiddlebrook 7H10アガー(BD Difco)、5.0mlのグリセロール、895mlの蒸留水、100mlのMiddlebrook OADC Enrichment(BD BBL)、Rアガー(10.0gのバクトペプトン,BD Difco)、5.0gの酵母エキス(BD Difco)、5.0gの麦芽エキス(BD Difco)、5.0gのカザミノ酸(BD Difco)、2.0gの牛肉エキス(BD Difco)2.0gのグリセロール、50.0mgのTween80、1.0gのMgSO4・7H2O)を用いて、インキュベートオーブン(PIC-100(アズワン))中において25℃、30℃、37℃又は45℃で3日~7週間培養した。
 その後、各菌株のゲノムDNAを、DNeasy PowerSoil Kit(Qiagen)を用いて各細菌のコロニーから抽出した。
 (ライブラリの作製及びシーケンス)
 抽出DNAに対して、Oxford Nanopore Technologies社が提供するRapid Barcoding Kitを用いたライブラリ作製を行った。当該キット内の指示書に従って実験操作を行い、ゲノムDNA分子の断片化、サンプル識別のためのバーコーディング、シーケンスのためのアダプタ付与を行い、MinIONシーケンサー(Oxford Nanopore Technologies)用のライブラリを作製した。ライブラリをMinIONにロード後にランを行い、接続されたコンピュータ上に、シーケンスデータを生データであるfast5形式で保存した。
 (ソフトウェアによる解析)
 出力されたfast5データを高性能計算サーバにアップロードし、塩基配列情報であるfastq形式へ変換するベースコール処理を行う。ベースコールされた配列ファイルに対してmlstverseによる処理を行い、菌種同定を行う。該当菌種ごとの種名とMLSTスコア、統計値が得られ、最も高いMLSTスコアを持つ種を同定結果として採用する。
 (16SリボソームRNA配列を用いた解析及びその結果)
 本発明の方法により得られた結果と比較するために、従来の16SリボソームRNA配列を用いた菌種の同定方法を以下の通りに行った。
 まず、上記の通りに各サンプルから抽出したゲノムDNAを鋳型としてポリメラーゼ連鎖反応(PCR)により16SリボソームRNAを増幅させた。プライマーは以下の配列を用いた。
27F:5’-AGAGTTTGATCMTGGCTCAG-3’)
1492R:5’-TACGGYTACCTTGTTACGACTT-3’)
337F:5’-GACTCCTACGGGAGGCWGCAG-3’)
1391R:5’-GACGGGCGGTGTGTRCA-3’)
 PCRは、2×KAPA HiFi HotStart ReadyMix(Roche)及び0.3μMの上記プライマーを用いて、95℃で3分の後、98℃で20秒、60℃で15秒及び72℃で30秒を30サイクル行った。その後、72℃で1分間の最終伸長反応を行った。得られた生成物である16SリボソームRNAの配列決定を行い、当該配列と、SILVAデータベース中のMycobacterium属の参照配列とを、blastn(blast.ddbj.nig.ac.jp/blastn?lang=ja)を利用して比較した。その結果、98.7%以上の配列同一性を示すMycobacterium属の菌種を表2に示す。
Figure JPOXMLDOC01-appb-T000010
Figure JPOXMLDOC01-appb-I000011
Figure JPOXMLDOC01-appb-I000012
Figure JPOXMLDOC01-appb-I000013
Figure JPOXMLDOC01-appb-I000014
Figure JPOXMLDOC01-appb-I000015
Figure JPOXMLDOC01-appb-I000016
 表2に示すように、従来の方法では、29種のサンプルのうちほとんどのサンプルが98.7%以上の極めて高い配列同一性を示す菌種が複数該当することとなった。すなわち、従来の方法では、サンプルに含まれる菌種を単一の菌種に同定することが困難であることが明らかとなった。
 (本発明を利用した解析結果)
 次に、上記本発明の方法に従って、上記29種のサンプルから抽出したゲノムDNAを用いて、上記説明の通りライブラリ作製、シーケンス及びソフトウェア解析を行った結果を表3に示す。表3は、上記ソフトウェア解析により得られた各サンプルにおいて高いMLSTスコアが得られた該当菌種とそのスコアを示している。
Figure JPOXMLDOC01-appb-T000017
Figure JPOXMLDOC01-appb-I000018
Figure JPOXMLDOC01-appb-I000019
Figure JPOXMLDOC01-appb-I000020
 表3に示すように、29種のサンプルのそれぞれの最も高いMLSTスコアの平均値として0.90といった高い値が得られた。その次に高いスコアの平均値は0.50以下であり、大きな差が見られた。従って、最も高いスコアが得られた菌種を、サンプル中の菌種として同定することが可能といえる。さらに、例えばサンプルNo.2~5のように、亜種(subsp.)ことでもMLSTスコアの差が得られ、従って、各菌株の亜種も同定することが可能といえる。
 以上のように、本発明によると、種々のNTMを含む検体に対して、その検体に含まれるNTMの菌種及び亜種を正確に同定することができる。

Claims (8)

  1.  MLST(multi-locus sequence typing)法によって検体中に存在する非結核性抗酸菌(Non-Tuberculous Mycobacteria:NTM)の種又は亜種を同定するためのシステムであって、
     前記検体中に存在するNTMのゲノム配列のうち複数の遺伝子の配列情報を得るためのシーケンシング装置と、
     既知のNTMにおける複数の遺伝子の配列情報を格納するデータベースと、
     前記シーケンシング装置により得られた複数の遺伝子の配列情報と、前記データベースに格納された前記複数の遺伝子の配列情報とを比較して、前記データベースに格納された前記既知のNTMのうち前記検体中のNTMの配列情報に最も近い配列情報を有するNTMの種又は亜種を選択するソフトウェアとを備え、
     前記複数の遺伝子は、表1に示す184種の遺伝子から選択されることを特徴とするシステム。
  2.  前記複数の遺伝子は、30SリボソームS1~S21(rpsA~U)、50SリボソームL1~L36(rplA~F、I~U、rpmA~J)、5SリボソームRNA(rrf)、16SリボソームRNA(rrs)、23SリボソームRNA(rrl)、rpoB、groEL2、gyrB、inhA、tlyA、katG、pncA、erm、eis及びembBを含むことを特徴とする請求項1に記載のシステム。
  3.  前記データベースは、mlstdb.NTM(https://github.com/ymatsumoto/mlstverse.Mycobacterium.db)であることを特徴とする請求項1又は2に記載のシステム。
  4.  前記ソフトウェアは、mlstverse(https://github.com/ymatsumoto/mlstverse)であることを特徴とする請求項1~3のいずれか1項に記載のシステム。
  5.  MLST(multi-locus sequence typing)法によって検体中に存在する非結核性抗酸菌(Non-Tuberculous Mycobacteria:NTM)の種又は亜種を同定する方法であって、
     前記検体中に存在するNTMに対して、シーケンシングを行って前記NTMのゲノム配列のうち複数の遺伝子の配列情報を得るステップと、
     前記得られた配列情報を、所定のデータベースに格納された既知のNTMにおける前記複数の遺伝子の配列情報と比較するステップと、
     前記複数の遺伝子の配列情報の比較の結果、前記データベースに格納された既知のNTMのうち前記検体中のNTMの配列情報に最も近い配列情報を有するNTMの種又は亜種を選択するステップとを備え、
     前記複数の遺伝子は、表1に示す184種の遺伝子から選択されることを特徴とする方法。
  6.  前記複数の遺伝子は、30SリボソームS1~S21(rpsA~U)、50SリボソームL1~L36(rplA~F、I~U、rpmA~J)、5SリボソームRNA(rrf)、16SリボソームRNA(rrs)、23SリボソームRNA(rrl)、rpoB、groEL2、gyrB、inhA、tlyA、katG、pncA、erm、eis及びembBを含むことを特徴とする請求項5に記載の方法。
  7.  前記データベースは、mlstdb.NTM(https://github.com/ymatsumoto/mlstverse.Mycobacterium.db)であることを特徴とする請求項5又は6に記載の方法。
  8.  前記ソフトウェアは、mlstverse(https://github.com/ymatsumoto/mlstverse)であることを特徴とする請求項5~7のいずれか1項に記載の方法。
PCT/JP2021/014475 2020-06-03 2021-04-05 検体中に存在する非結核性抗酸菌の種又は亜種を同定するためのシステム及び方法 WO2021246045A1 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
EP21818700.3A EP4163395A1 (en) 2020-06-03 2021-04-05 System and method for identifying species or subspecies of non-tuberculous mycobacteria present in specimen

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2020096551A JP7421800B2 (ja) 2020-06-03 2020-06-03 検体中に存在する非結核性抗酸菌の種又は亜種を同定するためのシステム及び方法
JP2020-096551 2020-06-03

Publications (1)

Publication Number Publication Date
WO2021246045A1 true WO2021246045A1 (ja) 2021-12-09

Family

ID=78830824

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2021/014475 WO2021246045A1 (ja) 2020-06-03 2021-04-05 検体中に存在する非結核性抗酸菌の種又は亜種を同定するためのシステム及び方法

Country Status (3)

Country Link
EP (1) EP4163395A1 (ja)
JP (1) JP7421800B2 (ja)
WO (1) WO2021246045A1 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2024048779A1 (ja) * 2022-09-02 2024-03-07 アサヒグループホールディングス株式会社 微生物菌種の同定方法

Non-Patent Citations (11)

* Cited by examiner, † Cited by third party
Title
EMERGING MICROBES & INFECTIONS, vol. 8, no. 1, pages 1043 - 1053
ENRIGHT MC ET AL., TRENDS MICROBIOL, vol. 7, 1999, pages 482 - 487
HASHEMI-SHAHRAKI ABDOLRAZAGH, SAEED ZAKER BOSTANABAD, PARVIN HEIDARIEH, LEONID PETROVICH TITOV, AZAR DOKHT KHOSRAVI, NASRIN SHEIKH: "Species spectrum of nontuberculous mycobacteria isolated from suspected tuberculosis patients, identification by multi locus sequence analysis", INFECTION, GENETICS AND EVOLUTION, vol. 20, 24 September 2013 (2013-09-24), pages 312 - 324, XP055880396, DOI: 10.1016/j.meegid.2013.08.027 *
JOLLEY KA ET AL., BMC BIOINFORMATICS, vol. 11, 2010, pages 595
KIM SI HYUN, SHIN JEONG HWAN: "Identification of nontuberculous mycobacteria using multilocous sequence analysis of 16S rRNA, hsp65 , and rpoB", JOURNAL OF CLINICAL LABORATORY ANALYSIS., NEW YORK, NY., US, vol. 32, no. 1, 1 January 2018 (2018-01-01), US , pages e22184, XP055880389, ISSN: 0887-8013, DOI: 10.1002/jcla.22184 *
LUO LIULIN, LI BING, CHU HAIQING, HUANG DONGDONG, ZHANG ZHEMIN, ZHANG JINGBO, GUI TAO, XU LIYUN, ZHAO LAN, SUN XIWEN, XIAO HEPING: "Characterization of Mycobacterium Abscessus Subtypes in Shanghai of China : Drug Sensitivity and Bacterial Epidemicity as well as Clinical Manifestations", MEDICINE, WILLIAMS AND WILKINS, BALTIMORE., US, vol. 95, no. 3, 1 January 2016 (2016-01-01), US , pages e2338, XP055880393, ISSN: 0025-7974, DOI: 10.1097/MD.0000000000002338 *
MAIDEN MCJ ET AL., NAT REV MICROBIOL, vol. 11, 2013, pages 728 - 736
NAMKOONG H. ET AL., EMERG INFECT DIS, vol. 22, 2016, pages 1116 - 1117
STACKEBRANDT E. ET AL., INT J SYST EVOL MICROBIOL, vol. 44, 1994, pages 846 - 849
WUZINSKI MICHELLE, BAK ANETAK, PETKAU AARON, B. DEMCZUK WALTERH, SOUALHINE HAFID, SHARMA MEENUKAUSHAL: "A multilocus sequence typing scheme for Mycobacterium abscessus complex (MAB-multilocus sequence typing) using whole-genome sequencing data", INTERNATIONAL JOURNAL OF MYCOBACTERIOLOGY, ELSEVIER, vol. 8, no. 3, 1 January 2019 (2019-01-01), pages 273, XP055880392, ISSN: 2212-5531, DOI: 10.4103/ijmy.ijmy_106_19 *
ZOLFO M. ET AL., NUCLEIC ACID RES, vol. 1, 2016, pages 1 - 10

Also Published As

Publication number Publication date
JP7421800B2 (ja) 2024-01-25
JP2021185866A (ja) 2021-12-13
EP4163395A1 (en) 2023-04-12

Similar Documents

Publication Publication Date Title
Nagy et al. MALDI-TOF MS fingerprinting facilitates rapid discrimination of phylotypes I, II and III of Propionibacterium acnes
Simner et al. Mycobacterium: laboratory characteristics of slowly growing mycobacteria
Robles-Sikisaka et al. Association between living environment and human oral viral ecology
EP3051450A1 (en) Method of typing nucleic acid or amino acid sequences based on sequence analysis
EP3887551A1 (en) Tuberculosis resistance prediction method
Minnikin et al. Molecular biomarkers for ancient tuberculosis
Culot et al. Isolation of Harveyi clade Vibrio spp. collected in aquaculture farms: How can the identification issue be addressed?
Teng et al. MALDI-TOF MS for identification of Tsukamurella species: Tsukamurella tyrosinosolvens as the predominant species associated with ocular infections
WO2021246045A1 (ja) 検体中に存在する非結核性抗酸菌の種又は亜種を同定するためのシステム及び方法
Amlerova et al. Genotyping of Mycobacterium tuberculosis using whole genome sequencing
Stefan et al. Detection of 16S rRNA and KPC genes from complex matrix utilizing a molecular inversion probe assay for next-generation sequencing
Pinevich et al. Testing culture purity in prokaryotes: criteria and challenges
Galata et al. Comparing genome versus proteome-based identification of clinical bacterial isolates
Phelippeau et al. Respiratory tract isolation of Mycobacterium europaeum following influenza infection in an immunocompromised patient: a case report
Macedo Tuberculosis: new era for diagnosis and surveillance using whole-genome sequencing-based approaches
Goig Applied genomics for tuberculosis diagnosis and surveillance
US20240229162A1 (en) System and method for identifying species or subspecies of non-tuberculous mycobacteria present in specimen
del Carpio-Sanz et al. Differentiation Of M. Tuberculosis Complex By PCR In Clinical Samples
Chisompola et al. Drug resistant tuberculosis cases from the Copperbelt province and Northern regions of Zambia: Genetic diversity, demographic and clinical characteristics
Culbreath et al. Application of identification of bacteria by DNA target sequencing in a clinical microbiology laboratory
Shan et al. Application of multiple-locus variable number tandem repeat analysis to identify outbreak-associated Neisseria meningitides serogroup C sequence type 4821 in China
Mlambo Molecular and epidemiological characterization of multidrug-resistant Mycobacterium tuberculosis isolates in Johannesburg, South Africa
Wain et al. Current and new approaches to typing of Salmonella.
Rajwani Genetic mechanism of enhanced virulence in mycobacterium tuberculosis strain isolated from patient with tuberculosis meningitis
Shapovalova et al. Modern technologies for studying the genome of mycobacteria

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 21818700

Country of ref document: EP

Kind code of ref document: A1

WWE Wipo information: entry into national phase

Ref document number: 18000403

Country of ref document: US

NENP Non-entry into the national phase

Ref country code: DE

ENP Entry into the national phase

Ref document number: 2021818700

Country of ref document: EP

Effective date: 20230103