WO2023042673A1 - 膜小胞の検出方法、バイオマーカー配列の探索方法、膜小胞検出装置、バイオマーカー配列探索装置、プログラム、コンピュータ、及び、疾病バイオマーカーの探索方法 - Google Patents

膜小胞の検出方法、バイオマーカー配列の探索方法、膜小胞検出装置、バイオマーカー配列探索装置、プログラム、コンピュータ、及び、疾病バイオマーカーの探索方法 Download PDF

Info

Publication number
WO2023042673A1
WO2023042673A1 PCT/JP2022/032952 JP2022032952W WO2023042673A1 WO 2023042673 A1 WO2023042673 A1 WO 2023042673A1 JP 2022032952 W JP2022032952 W JP 2022032952W WO 2023042673 A1 WO2023042673 A1 WO 2023042673A1
Authority
WO
WIPO (PCT)
Prior art keywords
sequence
biomarker
host cell
sequences
membrane vesicles
Prior art date
Application number
PCT/JP2022/032952
Other languages
English (en)
French (fr)
Inventor
章玄 岡本
壮太朗 高野
Original Assignee
国立研究開発法人物質・材料研究機構
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 国立研究開発法人物質・材料研究機構 filed Critical 国立研究開発法人物質・材料研究機構
Priority to JP2023548403A priority Critical patent/JPWO2023042673A1/ja
Publication of WO2023042673A1 publication Critical patent/WO2023042673A1/ja

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12MAPPARATUS FOR ENZYMOLOGY OR MICROBIOLOGY; APPARATUS FOR CULTURING MICROORGANISMS FOR PRODUCING BIOMASS, FOR GROWING CELLS OR FOR OBTAINING FERMENTATION OR METABOLIC PRODUCTS, i.e. BIOREACTORS OR FERMENTERS
    • C12M1/00Apparatus for enzymology or microbiology
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/02Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving viable microorganisms
    • C12Q1/04Determining presence or kind of microorganism; Use of selective media for testing antibiotics or bacteriocides; Compositions containing a chemical indicator therefor
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/6851Quantitative amplification
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/686Polymerase chain reaction [PCR]

Definitions

  • the present invention relates to a membrane vesicle detection method, a biomarker sequence search method, a membrane vesicle detection device, a biomarker sequence search device, a program, a computer, and a disease biomarker search method.
  • membrane vesicles secreted from cells have attracted attention as one of the factors that mediate pathogens and various diseases. , heart disease, and even cranial nerve diseases such as Alzheimer's disease. Therefore, techniques for sequencing and quantifying nucleic acids contained in membrane vesicles contained in body fluids and the like are desired.
  • Patent Document 1 describes a method for sequencing nucleic acids in exosomes and extracellular endoplasmic reticulum, "a method for sequencing nucleic acids from a biological sample: (a) a biological sample; (b) contacting the solid capture surface with the biological sample under conditions sufficient to retain cell-free DNA and extracellular vesicles from the biological sample on or within the capture surface; (c) contacting the lysis reagent with the capture surface while the cell-free DNA and extracellular vesicles are present on or within the capture surface, thereby removing DNA and RNA from the capture surface; (d) extracting DNA, RNA, or both from said homogenate; (e) selectively ribosomes from said homogenate or from extracted DNA, extracted RNA, or both (f) reverse transcribing the RNA into cDNA; (g) double stranded from the extracted DNA, the reverse transcribed cDNA, or both the extracted DNA and the reverse transcribed cDNA; constructing a DNA library;
  • an object of the present invention is to provide a method for detecting membrane vesicles that can easily quantify membrane vesicles in a biological sample.
  • Another object of the present invention is to provide a biomarker sequence search method, a membrane vesicle detection device, a biomarker sequence search device, a program, a computer, and a disease biomarker search method.
  • the biological sample is obtained from a subject, and the procedure separates and obtains the membrane vesicles from the biological sample before obtaining the base sequence of the membrane vesicles.
  • the type and amount of membrane vesicles contained in a biological sample are highly likely to reflect the physical condition of the subject from whom the biological sample was collected. In other words, if the subject suffers from a certain disease (if the subject is a patient of the disease), there is a high possibility that the biological sample contains membrane vesicles that correspond to the disease and its progression. .
  • a biomarker sequence searched using membrane vesicles isolated from such a biological sample can be used as a marker for diagnosing the subject's physical condition (the type of disease and the progress of the disease). It is more useful, and the detected membrane vesicles can be used as a standard for their quantitative evaluation. The above also applies to [6] described later.
  • [4] Obtaining the base sequence of the membrane vesicles produced by the host cell, mapping the base sequence to the reference sequence derived from the host cell, and detecting the frequency of detection in the mapped region and performing a homology search using the frequent region as a query sequence, and the frequent region having lower similarity to the detected homologous sequence derived from other than the host cell is selected as a biomarker candidate. Selecting as a sequence, aligning the biomarker candidate sequence with the homologous sequence to detect regions with sequence conservation lower than the reference, and making this a biomarker sequence, and the biomarker sequence detecting said membrane vesicles in a biological sample by quantitative polymerase chain reaction using primers designed to be included in one amplification product.
  • the biological sample is obtained from a subject, and separating and obtaining the membrane vesicles from the biological sample before obtaining the base sequence of the membrane vesicles.
  • the biological sample is saliva, blood, serum, plasma, buffy coat, lymph, interstitial fluid, body cavity fluid, digestive fluid, sweat, urine, nasal discharge, tears, semen, vaginal fluid, amniotic fluid,
  • the membrane according to any one of [1] to [6], which is at least one selected from the group consisting of milk, sputum, surgical cleaning fluid, feces, skin or body mucous membrane swabs, and swabs.
  • a method for detecting cysts When the biological sample is selected from the above, there is a higher probability that membrane vesicles are contained in the biological sample. Also, if the subject is suffering from some disease, the above types of biological samples are more likely to contain membrane vesicles characteristic of that disease. Therefore, when the biological sample is selected from the above, the method for detecting membrane vesicles of the present invention exhibits superior effects as a liquid biopsy method.
  • biomarker sequence search method The type and amount of membrane vesicles contained in a biological sample are highly likely to reflect the physical condition of the subject from whom the biological sample was collected. In other words, if the target suffers from a certain disease, there is a high possibility that the biological sample contains membrane vesicles that correspond to the disease and its progress.
  • a biomarker sequence searched using membrane vesicles isolated from such a biological sample can be used as a marker for diagnosing the subject's physical condition (the type of disease and the progress of the disease). more useful.
  • the biological sample is saliva, blood, serum, plasma, buffy coat, lymph, interstitial fluid, body cavity fluid, digestive fluid, sweat, urine, nasal discharge, tears, semen, vaginal fluid, amniotic fluid,
  • the biological sample is selected from the above, there is a higher probability that membrane vesicles are contained in the biological sample.
  • the above types of biological samples are more likely to contain membrane vesicles characteristic of that disease. Therefore, when the biological sample is selected from above, the resulting biomarker sequences are preferably applicable by liquid biopsy methods.
  • a nucleotide sequence analyzer for obtaining the nucleotide sequence of membrane vesicles produced by host cells and primers designed to include a biomarker sequence that is part of the above nucleotide sequence in one amplification product a quantitative PCR device for detecting the membrane vesicles in a biological sample by a quantitative polymerase chain reaction;
  • a map part that maps a base sequence to a reference sequence derived from the host cell, a frequent region selection part that selects a frequent region whose detection frequency exceeds a standard from the mapped regions, and the frequent region as a query sequence.
  • a biomarker candidate sequence selection unit that performs a homology search and selects the frequent region having lower similarity than the reference with the homologous sequence derived from the detected host cell as a biomarker candidate sequence
  • the biomarker a biomarker sequencing unit that aligns candidate sequences with the homologous sequences, detects regions with sequence conservation lower than the reference, and uses the biomarker sequences as the biomarker sequences.
  • a membrane vesicle detection device having a base sequence analysis device, a quantitative PCR device, and a control device that is a computer controls the base sequence analysis device to control the base sequence analysis device to control the membrane produced by the host cell.
  • a base sequence analysis device for obtaining the base sequence of membrane vesicles produced by the host cell, and a control device, wherein the control device converts the base sequence to a reference sequence derived from the host cell A map part to be mapped, a frequent region selection part that selects a frequent region whose detection frequency exceeds a reference from the mapped region, and a homology search is performed using the frequent region as a query sequence, and the detected host
  • a biomarker candidate sequence selection unit that selects, as a biomarker candidate sequence, the frequent region that has lower similarity to a homologous sequence derived from a cell than a reference, and the biomarker candidate sequence is aligned with the homologous sequence
  • a biomarker sequence search device comprising: a biomarker sequencing unit that detects a region with sequence conservation lower than a reference and defines this as a biomarker sequence.
  • the control device of the biomarker sequence search device having a base sequence analysis device and a control device that is a computer controls the base sequence analysis device to control the base sequence of the membrane vesicles produced by the host cell mapping the base sequence to a reference sequence derived from the host cell; selecting frequent regions whose detection frequency exceeds a standard from the mapped regions; and querying the frequent regions.
  • performing a homology search selecting the frequent region having lower similarity than the reference with the detected homologous sequence derived from the host cell as a biomarker candidate sequence, and the biomarker candidate sequence , aligning the homologous sequences, detecting regions with lower sequence conservation than the reference, and using them as biomarker sequences.
  • a computer for searching for biomarker sequences wherein a map portion for mapping the base sequence of membrane vesicles produced by host cells to a reference sequence derived from the host cells, and detection of the mapped regions
  • a frequent region selection unit that selects a frequent region whose frequency exceeds the standard, and a homology search is performed using the frequent region as a query sequence.
  • a biomarker candidate sequence selection unit that selects the low frequency region as a biomarker candidate sequence, and the biomarker candidate sequence is aligned with the homologous sequence to detect regions with sequence conservation lower than the reference, and the biomarker candidate sequence a biomarker sequencing portion as a marker sequence.
  • a method of searching for a disease biomarker comprising: aligning to detect a region with lower sequence conservation than a reference, and using this as a disease biomarker. According to the disease biomarker search method described above, a sequence specific to membrane vesicles contained in a biological sample obtained from a patient with a target disease can be identified. A disease biomarker identified by the above method can be used for in vitro diagnosis such as liquid biopsy.
  • a method for detecting membrane vesicles that can easily quantify membrane vesicles in a biological sample can be provided.
  • a biomarker sequence searching method, a membrane vesicle detecting device, a biomarker sequence searching device, a program, a computer, and a disease biomarker can also be provided.
  • FIG. 1 is a flow chart of a biomarker sequence search method used in the membrane vesicle detection method of the present invention.
  • 1 is a flow chart showing specific procedures of a method for detecting membrane vesicles of the present invention.
  • FIG. 4 is a flow chart of a membrane vesicle detection method in another embodiment (modification) of the membrane vesicle detection method of the present invention.
  • FIG. 1 is a hardware configuration diagram in an embodiment of a membrane vesicle detection device of the present invention;
  • FIG. 1 is a functional block diagram of an embodiment of a membrane vesicle detection device of the present invention;
  • FIG. 4 is an operation flow of a controller of the membrane vesicle detection device;
  • FIG. 10 is a hardware configuration diagram of a membrane vesicle detection device according to a second embodiment;
  • FIG. 10 is a functional block diagram of a membrane vesicle detection device according to a second embodiment;
  • FIG. 10 is an operation flow diagram in the second embodiment of the membrane vesicle detection device;
  • 1 is a hardware configuration diagram in an embodiment of a biomarker sequence search device of the present invention;
  • FIG. 1 is a functional block diagram of an embodiment of a biomarker sequence searching device of the present invention;
  • FIG. 2 is an operation flow diagram in an embodiment of the biomarker sequence searching device of the present invention;
  • 1 is a hardware configuration diagram in an embodiment of a computer of the present invention;
  • FIG. 1 is a functional block diagram of a computer embodiment of the present invention;
  • FIG. 4 is a flow diagram of biomarker sequence search processing by a processor in a computer embodiment of the present invention. This is the result of mapping the nucleotide sequence in the membrane vesicle particles to the reference sequence.
  • the vertical axis in FIG. 16 is the result of changing the number of membrane vesicle particles to the "detection frequency", that is, the total number of membrane vesicle particles having the sequence in that region.
  • a homology search was performed using the screened frequent regions as queries, and the functional information tagged to each protein sequence information on the matched database was extracted by the analysis algorithm, and was detected at a statistically significant high frequency. It is a list of the results of detecting gene functions.
  • FIG. Fig. 3 shows the result of comparison of base sequence profiles of membrane vesicles in a healthy subject sample and a periodontal disease patient sample (derived from bacteria).
  • Fig. 3 shows the results of comparison of base sequence profiles of membrane vesicles in a healthy subject sample and a periodontal disease patient sample (virus-derived). It is a figure showing the determination procedure of the area
  • nucleic acid and “polynucleotide” refer to a polymeric form of nucleotides of any length, either ribonucleotides or deoxyribonucleotides. This term refers only to the primary structure of the molecule. Thus, the term includes double- and single-stranded DNA and RNA.
  • membrane vesicles refers, as one form, to “outer membrane vesicles (OMV; outer Membrane Vesicle).
  • OMV outer Membrane Vesicle
  • the size is not particularly limited, it is often 10 to 1000 nm, often 10 to 300 nm for Gram-negative bacteria, and 50 to 150 nm for Gram-positive bacteria.
  • membrane vesicles include outer membrane vesicles produced by host bacteria, "exosomes” produced and released by animal cells through the endocytic pathway, and “apoptotic bodies” produced by apoptosis.
  • the term "host cell” means a cell that produces membrane vesicles to be analyzed.
  • the term "host bacterium” means a bacterium that produces membrane vesicles to be analyzed. do.
  • Host cells are not particularly limited, and may be prokaryotic cells, eukaryotic cells, or archaeal cells, and are not particularly limited. Examples include bacteria, archaea, yeast, plant cells, insect cells, and animal cells (eg, human cells, non-human cells, non-mammalian vertebrate cells, invertebrate cells, etc.).
  • the host cells may be in a virus-infected state.
  • Membrane vesicles produced from such host cells sometimes contain virus-derived nucleotide sequences (eg, virus-derived DNA).
  • virus-derived nucleotide sequences eg, virus-derived DNA
  • host cells and virus-infected host cells are simply referred to as "host cells” without distinguishing between them.
  • a cell infected with a virus is sometimes referred to as a "host,” but as used herein, the term “host” consistently means a cell that produced (does) membrane vesicles,
  • the term “host cell” is used without distinguishing between the presence or absence of
  • detection of membrane vesicles means at least determination of the presence or absence of membrane vesicles, and preferably includes quantification of membrane vesicles.
  • single particle analysis means a method of isolating cells (bacteria) and membrane vesicles one by one and analyzing their nucleotide sequences, and is also called “single cell analysis”. means a method called
  • biological sample means a specimen that may contain biological substances such as nucleic acids and proteins.
  • a biological sample includes, for example, a bodily fluid taken from a subject.
  • a biological sample can be a liquid or solid isolated from anywhere within a subject's body, such as a peripheral location.
  • biological samples include saliva, blood, serum, plasma, buffy coat, lymph, interstitial fluid, body cavity fluid, digestive fluid, sweat, urine, nasal discharge, tears, semen, vaginal fluid, amniotic fluid, milk. , sputum, surgical washes, feces, swabs of skin or body mucous membranes, swabs, etc., or a combination thereof, with saliva being preferred.
  • One of the excellent features of the method for detecting membrane vesicles of the present invention is that accurate test results (membrane presence or absence of vesicles, and the amount of membrane vesicles). From this point of view, the amount of biological sample required for detection of membrane vesicles may be small.
  • a certain amount of membrane vesicles is required in the sample. A certain amount of each is required, and as a result, a large amount of specimen is required.
  • the method for detecting membrane vesicles of the present invention selects a part of the frequent region in membrane vesicles as a biomarker sequence, and quantitative PCR (qPCR, PCR is "Polymerase Chain Reaction”). abbreviation). Therefore, the amount of membrane vesicles contained in the biological sample is much smaller than in conventional methods.
  • the biological sample may be 0.01-30 mL. This amount is also affected by the type of biological sample, eg, serum or plasma may be 0.01-5 mL, and urine may be 1-30 mL.
  • subject means a human or animal.
  • the subject is a human or animal with a disease (hereinafter also referred to as "specific disease") related to the onset, progression, etc., or expected to be related to the presence of specific host cells. is preferred.
  • a disease hereinafter also referred to as "specific disease”
  • the amount of membrane vesicles detected may provide information for judging the progress of the specific disease.
  • the "specific disease” is not particularly limited, but bacterial and/or viral infections are preferred, and periodontal disease is more preferred.
  • a primer designed to contain a biomarker sequence which is part of the base sequence of a membrane vesicle produced by a host cell, is included in one amplification product.
  • the biomarker sequence is obtained by the following steps; obtaining the base sequence of the membrane vesicles produced by the host cell mapping the base sequence to a reference sequence derived from the host cell, selecting a frequent region whose detection frequency exceeds a standard from the mapped regions, and performing a homology search using the frequent region as a query sequence.
  • FIG. 1 is a flow chart of the biomarker sequence search method used in this method.
  • step S11 a biological sample is taken from a subject.
  • the resulting biological sample contains host cells (typically host bacteria or virus-infected host cells). ) are likely to include membrane vesicles that are closely related to the progression of specific diseases.
  • membrane vesicles produced by a given host cell may vary depending on the growth environment, etc. There are still many unclear points about which types of membrane vesicles are produced. On the other hand, membrane vesicles isolated and obtained from a biological sample of a subject with a specific disease are highly likely to contain membrane vesicles associated with the progression of the specific disease.
  • frequently occurring sequence regions are selected from the entirety of a plurality of membrane vesicles, and the selected biomarker sequences are used to detect membrane vesicles.
  • the method for detecting membrane vesicles of the present invention even if the expression conditions and functions of individual membrane vesicles are unknown, specific membrane vesicles corresponding to biomarker sequences contained in biological samples are detected. can. This indicates the possibility that membrane vesicles can be used as a marker for judging the degree of progress of a specific disease by this method.
  • the method for detecting membrane vesicles of the present invention can be used as a liquid biopsy method. This point will be specifically described in the later examples.
  • this search method may not have step S11.
  • the biological sample may typically be a cell group containing host cells, a culture medium of host cells, or the like.
  • step S11 may be omitted, and the subsequent step S12 may be performed.
  • membrane vesicles are separated and obtained from the biological sample. Separating and obtaining membrane vesicles from a biological sample makes it easier to more accurately obtain base sequences derived from membrane vesicles (in other words, inside membrane vesicles).
  • nucleic acids of membrane vesicles are highly likely to be indicators for selectively analyzing specific diseases. Attempting to directly extract this from a biological sample without a separation operation may result in, for example, contamination with nucleic acid molecules other than membrane vesicles, which may reduce the yield and integrity of nucleic acids derived from membrane vesicles. easily damaged.
  • the separation and acquisition of membrane vesicles leads to the concentration of nucleic acids, which contributes to the improvement of detection sensitivity, and at the same time removes contaminants that may hinder subsequent processes (e.g., amplification reaction). It works and is preferable.
  • the method for separating and obtaining membrane vesicles from a biological sample is not particularly limited, and known methods can be used as appropriate. A specific method is described, for example, in paragraph 0076 of Japanese Patent Publication No. 2019-513391.
  • the host cell is a bacterium and the biological sample is a suspension containing a bacterial group containing (or not containing) the host bacterium and membrane vesicles
  • membrane vesicles will be described.
  • coarse separation can be performed by removing the cells from the suspension.
  • the centrifugation supernatant by filtering the separated centrifugation supernatant using a membrane filter (for example, pore size 0.1 to 0.9 ⁇ m), the cells remaining in the supernatant can be easily removed. Since the centrifugation supernatant may contain contaminants such as proteins in addition to bacterial bodies, for example, after concentration with a 100-200 kDa cut-off filter, membrane vesicles are precipitated and collected by ultracentrifugation. method can also be used.
  • a membrane filter for example, pore size 0.1 to 0.9 ⁇ m
  • the precipitate thus obtained may contain structures such as bacterial groups (e.g., pili and flagella).
  • a method of further purification using density gradient centrifugation using sucrose or the like may also be used.
  • nucleic acid components not derived from membrane vesicles are often attached to the surface of membrane vesicles. Therefore, the separated and obtained membrane vesicles may be further acted with a nucleolytic enzyme to degrade these nucleic acid components.
  • a nucleolytic enzyme can be used as such enzymes, and examples thereof include deoxyribonuclease and the like.
  • the culture solution is placed in a centrifuge tube with a volume of 1-100 mL and centrifuged at 3000-9000 rpm and 1-20° C. for 1-30 minutes.
  • the sediment is discarded, the supernatant is passed through a 0.1-0.9 ⁇ m filter, stored in a separate centrifuge tube, and stored at 1-10°C.
  • the supernatant is added to an ultracentrifugation tube and ultracentrifuged, for example, at a centrifugal force of 150,000 to 300,000 xg at 1 to 10°C for 1 to 3 hours.
  • the supernatant is discarded and the sedimented membrane vesicles (OMVs) are resuspended in a buffer (eg, PBS buffer at pH 7.4) and stored at 1-10°C.
  • a buffer eg, PBS buffer at pH 7.4
  • this ultracentrifugation step may be repeated multiple times.
  • Deoxyribonuclease may be added to this suspension to degrade the nucleic acid attached to the membrane vesicles. By performing deoxyribonuclease treatment, contamination with contaminants (nucleic acid components) is suppressed, so more accurate measurement can be performed.
  • the amount of deoxyribonuclease to be added is not particularly limited, for example, 10 ⁇ L of the above suspension is diluted 10-fold, and 2 ⁇ L of DNase (2000 U) is added thereto.
  • the suspension may be diluted in order to adjust the number (concentration) of membrane vesicles contained per unit amount of the suspension. Diluting the suspension to adjust the concentration of membrane vesicles makes it less likely that a single droplet will entrap more than one membrane vesicle. In other words, it becomes easier to more reliably enclose each individual in the droplet.
  • the concentration of membrane vesicles is diluted to an appropriate concentration while observing the concentration of membrane vesicles in the suspension by a dynamic light scattering method or the like.
  • a method for observing the concentration of membrane vesicles particles are irradiated with a laser beam, and the Brownian motion of each particle is tracked from the scattered light (tracking method). and the number are preferred.
  • step S13 the base sequence (originating from the membrane vesicle) of the separated and obtained membrane vesicle is obtained.
  • a method for obtaining a base sequence derived from membrane vesicles is not particularly limited, and known methods can be applied. Typically, membrane vesicles are lysed to extract polynucleotides, followed by amplification if necessary, library preparation, sequencing, and analysis to obtain base sequences. In this case, the method for obtaining the base sequence of membrane vesicles is not particularly limited, and known methods such as single particle analysis and shotgun metagenomic analysis can be used.
  • step S14 the obtained base sequence is mapped to the host cell-derived reference sequence.
  • Mapping can be performed using known mapping software. Examples of such software include "Bowtie2" and "BWA".
  • the degree of matching of the obtained base sequence to the reference sequence is not particularly limited, but is 80% or more when the maximum value of the mapping quality score provided by the software (for example, as a SAM file) is 100%. It is preferably 90% or more, more preferably 95% or more.
  • the reference sequence is preferably, for example, a host cell genome sequence or a nucleic acid sequence derived from a virus that has infected the host cell.
  • the virus-derived nucleic acid sequence may be a viral genome (DNA or RNA).
  • the host cells of membrane vesicles isolated and obtained from the biological sample may be unknown.
  • host cells are known as long as they are membrane vesicles isolated from host cell culture media or the like.
  • mapping may be performed using host cell genome nucleotide sequences and/or virus genome sequences recorded in public databases or the like as reference sequences.
  • the host cell is a cell having the mapped (as one form, the highest degree of identity) sequence region in the genome, or the cell infected with the virus having the mapped sequence region in the genome is the host cell. It can be determined that they are cells. Examples of databases that can be used include NCBI RefSeq, NCBI GenBank, UCSC Genome Browser, GRCh37 reference primary assembly, and JRGv2.
  • host cell genome sequences and virus genome sequences may be obtained from the databases described above.
  • a polynucleotide is extracted from the residue (residue) after membrane vesicles are separated and acquired from the biological sample, and its nucleotide sequence is determined. It may be analyzed and used as a reference sequence.
  • the reference sequence may contain a sequence other than the genome sequence of the host cell. It suffices if it contains a virus-derived sequence, and even if other base sequences are contained, there is almost no effect on subsequent steps.
  • the base sequence of membrane vesicles is mapped to the genome sequence of the host cell (or the genome sequence of the virus that infected the host cell) with a high degree of concordance.
  • mapping may be performed on the basis of a predetermined unit. For example, mapping may be performed in units of protein-coding regions of the base sequences inside membrane vesicles. In this case, for the base sequence derived from membrane vesicles, for example, the protein coding region is predicted and detected using a software tool for genome annotation such as "prokka", and for each region, the host cell genome base A homology search may be performed using the sequence as a reference, and mapping may be performed.
  • a frequently appearing area whose detection frequency exceeds a reference is selected from the mapped areas.
  • the method for selecting the frequent regions is not particularly limited. For each region, the number of membrane vesicles having the sequence of that region may be integrated to obtain the detection frequency for each region.
  • each mapped region has the sequence of that region. It can be obtained by accumulating the number of sequence reads that were previously read.
  • step S14 when mapping is performed with reference to the protein coding region, the above region may be the protein coding sequence. That is, the frequency of detection may be calculated for each protein-coding sequence.
  • the standard for the detection frequency is not particularly limited as long as a frequently occurring region can be identified in each region mapped by a base sequence derived from a membrane vesicle in the reference sequence. It is preferably predetermined based on the significance level.
  • a statistical test is performed to determine whether the detection frequency of the target protein coding region is equivalent to the detection frequency of other protein coding regions.
  • the significance probability (p-value) obtained by this statistical test is compared with a predetermined significance level. In this case, a significance level of 0.01 or the like is set in advance, and if the p-value is less than this value, it can be determined as "frequently occurring beyond the standard".
  • step S16 a homology search is performed using the frequent region as a query sequence, and a frequent region having lower similarity to the detected homologous sequence derived from a host cell than the reference is selected as a biomarker candidate sequence.
  • a frequent region is a region that is specifically detected at a high frequency in a nucleotide sequence derived from membrane vesicles produced from host cells. Among these frequent regions, host cell-specific ones are selected and used as biomarker candidate sequences.
  • the base length of each sequence will be explained.
  • the base sequence of membrane vesicles is several thousand to tens of thousands of bp. are short and biomarker sequences are even shorter, in one form 50-250 bp.
  • the base length of the biomarker candidate sequence is selected from the frequent region, it may be equivalent to the frequent region as one form. As one form, it is 1000 bp or more.
  • homology search is not particularly limited, it is preferable to use the genome sequence of each cell in the public database already described as a reference.
  • the software tool used for homology search is not particularly limited, and known tools can be used, including, but not limited to, "diamond” and the like.
  • Biomarker candidate sequences preferably have low similarity with homologous sequences. The lower the similarity, the more likely biomarker sequences will be discovered. As one method for selecting such biomarker candidate sequences, when each frequent region is aligned with homologous sequences detected by homology search, the sequence with the lowest alignment score is designated as the biomarker candidate sequence. method.
  • the above homologous sequences exclude sequences derived from host cells.
  • the alignment scores of the homologous sequences with the highest rank are summed and used as an index.
  • the index may be compared for each frequent region, and a frequent region that meets a predetermined criterion may be taken as a biomarker candidate sequence.
  • Predetermined criteria include, for example, the ranking of scores. Specifically, when arranging the alignment score of each frequent region to a homologous sequence (or the total value of the alignment scores up to a certain rank in descending order from the highest alignment score), the frequent regions up to a predetermined rank as a biomarker candidate sequence.
  • biomarker candidate sequences selected in this way are regions (sequences) that have a significantly high detection frequency and low similarity to the reference with respect to the base sequences derived from membrane vesicles.
  • step S17 the biomarker candidate sequences are aligned with the above-mentioned homologous sequences to detect regions with sequence conservation lower than the standard, and these regions are defined as biomarker sequences.
  • biomarker candidate sequences By aligning the biomarker candidate sequences with homologous sequences (derived from other than the host cell), regions with particularly low sequence conservation (specifically, about 50 to 250 bp) are detected and identified as biomarker sequences. do.
  • Algorithms used for alignment are not particularly limited, and include ⁇ BLAST'', ⁇ ClustalW'', ⁇ Kaalign'', ⁇ MAFFT'', ⁇ MUSCLE'', and ⁇ T-Coffee'', all of which are known.
  • the criterion for sequence conservation is not particularly limited, but in one form, when multiple homologous sequences are aligned, the entropy based on the frequency of appearance of 4 bases of ATGC is calculated for each position on the sequence, and this is used as sequence conservation.
  • a method using as a degree is mentioned. This value is calculated for 50 to 250 consecutive bases, and if the average exceeds a predetermined range, that region is used as a biomarker sequence.
  • the biomarker sequence thus determined is a region that is frequently detected in the base sequence of membrane vesicles in a biological sample and is host cell-specific. By doing so, the amount of membrane vesicles in the biological sample can be quantified.
  • vesicles can be detected by the biomarker sequences described above, they are applicable to liquid biopsy methods.
  • FIG. 2 is a flow chart showing specific procedures of the method for detecting membrane vesicles of the present invention.
  • steps S11 to S17 are the same as the method of searching for biomarker sequences already described, and thus description thereof is omitted.
  • step S18 In the method for detecting membrane vesicles, based on the information on the biomarker sequences selected in step S17, primers (pairs) designed to include the biomarker sequences in one amplification product are used in step S18.
  • a step of detecting membrane vesicles by quantitative PCR may further include a step of reverse transcription, and the quantitative PCR may be quantitative reverse transcription PCR.
  • Target sequences amplified by quantitative PCR can typically be detected using fluorescent dyes.
  • fluorescent dyes There are at least two general methods of doing so.
  • One method uses a fluorescent dye that binds to double-stranded DNA (eg, "SYBR Green I” (trade name), "TB Green (trade name)", etc.). Accumulation of amplification product by PCR causes more dye to bind to this amplification product, increasing fluorescent signal output in proportion to the amount of amplification product produced.
  • a second method uses fluorogenic probes that are oligonucleotides, modified to contain a fluorescent reporter dye and a quencher dye at the 5' and 3' ends, respectively. It is.
  • the fluorescent probe emits a fluorescent signal proportional to the amount of amplification product produced.
  • fluorescent dyes examples include “6-FAM”, “HEX”, “TET”, “TAMRA”, “JOE”, “ROX”, “Cyanine 3”, “Cyanine 5”, “Cyanine 5.5”, “Cal Fluor Gold 540”, “Cal Fluor Orange 560”, “Cal Fluor Red 590”, “Quasar 570”, “Quasar 670”, “TxRd (Sulforhodamine 101-X)” (all trade names).
  • quencher dyes examples include “6-FAM”, “HEX”, “TET”, “TAMRA”, “JOE”, “ROX”, “Cyanine 3”, “Cyanine 5”, “Cyanine 5.5”, “Cal Fluor Gold 540”, “Cal Fluor Orange 560”, “Cal Fluor Red 590”, “Quasar 570”, “Quasar 670”, “TxRd (Sulforhodamine 101-X)” (all trade names).
  • quencher dyes examples include “TAMRA”, “DA
  • a method for designing primers (pairs) used in quantitative PCR is not particularly limited, and known methods can be used. In particular, it can be easily designed using a computer-processed algorithm. Such algorithms include “Primer-BLAST”, “DINAMelt”, and the like. In addition to the above, primers can also be selected according to guidelines known to those skilled in the art.
  • the forward primer and the reverse primer for quantitative PCR may each have a base length of 18 to 25 (preferably 20 to 24), and may have a Tm of 57 to 61 ° C.,
  • the GC content may be 40-60%.
  • the base length of the amplification product (amplification product) is not particularly limited, but one form includes 50 to 250 bp.
  • the annealing region of the fluorescent probe preferably does not overlap with the primer annealing region, and is designed to anneal to the sequence between the annealing regions of the primer pair. is preferred.
  • the nucleotide distance between the end of the forward primer and the start of the probe is preferably 0-60 base pairs (bp) apart.
  • Probes for quantitative PCR may have a melting temperature (Tm) about 5-10° C. above the melting temperature of the primers, where thermal cycling decreases from the denaturation temperature to the annealing and extension temperature.
  • Tm melting temperature
  • the fluorescent probe anneals to the sequence of interest before either primer anneals.
  • the Tm of the fluorescent probe is not particularly limited, but may be 55 to 80° C. in one form.
  • the base length of the probe is not particularly limited, but may be, for example, 8-45 bp. More specifically, TaqMan probes may be 20-30 bases long.
  • the fluorescent signal output increases proportionally as the amount of amplified product increases.
  • Determination of the amount of membrane vesicles in a biological sample was first performed in parallel using serial dilutions of a biological sample containing the amount of membrane vesicles and a standard sample containing biomarker sequences of known concentration. It can be performed by PCR.
  • a standard curve is generated from the serially diluted samples that relates the copy number of the biomarker sequence to the cycle number at which fluorescence above background is first detected. By determining the cycle data of the biological sample and comparing it to the standard curve, the copy number of the biomarker sequence (or its complementary sequence) in the biological sample can be calculated.
  • a biomarker sequence is further included in one PCR amplification product. It may further have a step S19 of designing and synthesizing primers.
  • the method of designing and synthesizing primers is not particularly limited, and in addition to the methods already described, known methods can be used, and an automatic nucleic acid synthesizer described later may also be used.
  • FIG. 3 is a flow chart of the method for detecting membrane vesicles in the modified example.
  • membrane vesicles in biological samples can be easily quantified.
  • a first embodiment of the apparatus of the present invention comprises a nucleotide sequence analyzer for obtaining the nucleotide sequence of membrane vesicles produced by host cells, and a biomarker sequence that is part of the nucleotide sequence into one amplification product.
  • a quantitative PCR device for detecting said membrane vesicles in a biological sample by quantitative polymerase chain reaction using primers designed to contain; and a controller, said controller comprising: A mapping unit that maps the base sequence obtained by the base sequence analysis device to a reference sequence derived from the host cell, and a frequent region selection that selects a frequent region whose detection frequency exceeds a standard from the mapped regions. and the frequent region as a query sequence, performing a homology search, and selecting the frequent region having lower similarity than the reference with the detected homologous sequence derived from the host cell as a biomarker candidate sequence.
  • a marker candidate sequence selection unit a marker candidate sequence selection unit; and a biomarker sequence determination unit that aligns the biomarker candidate sequence with the homologous sequence, detects regions with sequence conservation lower than the reference, and uses the biomarker sequence as the biomarker sequence.
  • membrane vesicle detection device a marker candidate sequence selection unit.
  • FIG. 4 is a hardware configuration diagram of this device.
  • the membrane vesicle detection device 20 has a base sequence analysis device 21, a quantitative PCR device 22, and a control device 23, and the control device 23 can control the base sequence analysis device 21 and the quantitative PCR device 22.
  • Each device exchanges data with each other via the bus.
  • the base sequence analysis device 21 includes a pretreatment device 28 capable of extracting nucleic acids, fragmenting DNA, selecting fragment lengths, and amplifying the separated and obtained membrane vesicles, and a sequencer 29 performing sequence analysis. It has Controller 23 is a computer comprising processor 24 , storage device 25 , display device 26 and input device 27 .
  • the processor 24 is, for example, a microprocessor, processor core, multiprocessor, ASIC (application-specific integrated circuit), FPGA (field programmable gate array), and GPGPU (general-purpose computing on graphics processing units).
  • ASIC application-specific integrated circuit
  • FPGA field programmable gate array
  • GPGPU general-purpose computing on graphics processing units
  • the storage device 25 has a function of temporarily and/or non-temporarily storing various programs and data, and provides a working area for the processor 24 .
  • the storage device 25 is, for example, ROM (Read Only Memory), RAM (Random Access Memory), HDD (Hard Disk Drive), flash memory, SSD (Solid State Drive), and the like.
  • the display device 26 can display analysis results, sample names, operating procedures, and the like.
  • the display device 26 may be a liquid crystal display, an organic EL (Electro Luminescence) display, or the like.
  • the display device 26 may be configured integrally with the input device 27 .
  • the display device 26 is a touch panel display, and the form which provides GUI(Graphical User Interface) is mentioned.
  • the input device 27 can accept inputs such as measurement conditions and specimen names, and can accept inputs of instructions to the membrane vesicle detection device 20 .
  • the input device 27 may be a keyboard, mouse, scanner, touch panel, or the like.
  • the base sequence analysis device 21 is a device that obtains base sequences derived from the separated and obtained membrane vesicles.
  • the base sequence analysis device 21 includes a pretreatment device 28 for pretreatment of the separated and obtained membrane vesicles, and a sequencer 29 for sequence analysis.
  • the pretreatment device 28 performs nucleic acid extraction from membrane vesicles, reverse transcription if necessary, fragmentation of the purified DNA (or cDNA), selection of the DNA chain length to be applied to the sequencer 29, and if necessary It is a device configured to automatically amplify DNA, and a commercially available product can be incorporated into this device for use.
  • Such pretreatment equipment includes the "Biomek” pretreatment system from Beckman Coulter and the "Bravo" NGS automation system from Agilent. Note that the base sequence analysis device 21 may not have the pretreatment device 28 .
  • the sequencer 29 is not particularly limited, and any known next-generation sequencer can be used without particular limitation.
  • a quantitative PCR device for detecting membrane vesicles in a biological sample by quantitative polymerase chain reaction using primers (pairs) designed to contain the biomarker sequences of membrane vesicles in one amplification product.
  • a known real-time PCR device can be used without any particular limitation. Examples of such devices include “AriaMx” manufactured by Agilent, “qTOWER 3 " manufactured by Analytik Jena, “QIAquant” manufactured by Qiagen, and “QuantStudio” manufactured by Thermo Fisher.
  • FIG. 5 is a functional block diagram of this device.
  • the membrane vesicle detection device 20 includes a base sequence analysis device 21, a quantitative PCR device 22, and a control device 23.
  • the control device 23 includes a map unit 31, a frequent region selection unit 32, a biomarker candidate sequence selection unit 33, and a biomarker sequencing unit 34 .
  • the map unit 31 is a function realized by executing the program stored in the storage device 25 by the processor 24 of the control device 23 .
  • the map unit 31 acquires the base sequences of membrane vesicles obtained by the base sequence analyzer 21 from a public database or the like via a network using the input device 27 or the communication function (not shown) of the control device 23 ( 35) map to a reference sequence (or a collection of sequences containing it) derived from a host cell that has been tested.
  • the mapping method has already been explained in the membrane vesicle detection method of the present invention.
  • the frequently-appearing region selection unit 32 is a function realized by executing a program stored in the storage device 25 by the processor 24 of the control device 23 .
  • the region mapped to the genome sequence of the host cell by the mapping unit 31 is selected by the frequent region selection unit 32 as a frequent region whose detection frequency exceeds the reference.
  • the detection frequency criteria may be set in advance and stored in the storage device 25 .
  • the method for selecting the frequent regions is as already described in the description of the first embodiment of the method for detecting membrane vesicles of the present invention.
  • the biomarker candidate sequence selection unit 33 is a function realized by executing the program stored in the storage device 25 by the processor 24 of the control device 23 .
  • the biomarker candidate sequence selection unit 33 uses the frequently occurring region as a query sequence, and the input device 27 or the communication function of the control device 23 via a network from a public database etc. (36) of cells other than host cells.
  • a homology search is performed using the genome sequence as a reference, and the frequent regions with lower similarity to the detected homologous sequences derived from non-host cells are selected as biomarker candidate sequences.
  • the method for selecting biomarker candidate sequences is as already described in the description of the first embodiment of the method for detecting membrane vesicles of the present invention.
  • the biomarker sequencing unit 34 is a function realized by executing the program stored in the storage device 25 by the processor 24 of the control device 23 .
  • the biomarker sequence determination unit 34 aligns the biomarker candidate sequences selected by the biomarker candidate sequence selection unit 33 with the homologous sequences, detects regions with sequence conservation lower than the reference, and identifies them as biomarker sequences. be an array.
  • the biomarker sequence determination method is as already described in the description of the first embodiment of the membrane vesicle detection method of the present invention.
  • the quantitative PCR device 22 uses primers designed to include the biomarker sequence (or its complementary sequence) determined by the biomarker sequence determination unit 34 in one amplification product, and performs membrane subdivision in the biological sample. Detect cells. That is, the presence, absence and/or amount of biomarkers in the original biological sample is determined by detecting amplification of the biomarker sequences determined by biomarker sequencer 34 .
  • FIG. 6 is an operation flow of the control device 23 of the membrane vesicle detection device 20.
  • the controller 23 controls the nucleotide sequence analyzer 21 to obtain the nucleotide sequence of membrane vesicles produced by the host cell (step S41).
  • control device 23 first controls the pretreatment device 28 to separate and obtain membrane vesicles from the biological sample, and performs pretreatment such as extraction of nucleic acid components.
  • the controller 23 controls the sequencer 29 to acquire the base sequence derived from the membrane vesicle.
  • the membrane vesicle detection device may not have the pretreatment device 28.
  • the sequencer 29 may be controlled to acquire the base sequence derived from the membrane vesicles for the pretreated sample. good.
  • control device 23 controls the mapping unit 31 to map the base sequence obtained by the base sequence analysis device 21 to the reference sequence derived from the host cell (step S42).
  • control device 23 maps the base sequence derived from the membrane vesicle to the reference sequence derived from the host cell obtained (35) from a public database or the like.
  • control device 23 controls the frequent region selection unit 32 to select frequent regions whose detection frequency exceeds the reference from the regions mapped to the reference array (step S43).
  • control device 23 controls the biomarker candidate sequence selection unit 33 to use the frequent regions selected by the frequent region selection unit 32 as a query sequence by the input device 27 or the communication function of the control device 23.
  • a homology search is performed on sequences derived from non-host cells obtained from public databases etc. via networks (36), and the similarity with the detected homologous sequences derived from non-host cells is higher than the standard. Low frequency regions are selected as biomarker candidate sequences (step S44).
  • control device 23 controls the biomarker sequence determination unit 34 to select the biomarker candidate sequences selected by the biomarker candidate sequence selection unit 33 as homologous sequences derived from other than the host cell detected by the homology search. By aligning the sequences, regions with sequence conservation lower than the standard are detected and used as biomarker sequences (step S45).
  • control device 23 controls the quantitative PCR device 22 to include the biomarker sequence (or its complementary sequence) in one amplification product using primers designed based on the biomarker sequence.
  • Membrane vesicles in the biological sample are detected by quantitative polymerase chain reaction using the designed primers (step S46).
  • a second embodiment of the membrane vesicle detection device of the present invention comprises a nucleotide sequence analysis device for obtaining the nucleotide sequence of membrane vesicles produced by host cells, and a biomarker sequence that is part of the nucleotide sequence.
  • a nucleic acid synthesizer for designing and synthesizing primers (pairs) to be included in one amplification product, and a quantitative PCR device for detecting the membrane vesicles in a biological sample by quantitative polymerase chain reaction using the primers.
  • control device includes a map unit for mapping the base sequence obtained by the base sequence analysis device to a reference sequence derived from the host cell; , a frequent region selection unit that selects a frequent region whose detection frequency exceeds a standard, and a homology search is performed using the frequent region as a query sequence, and the similarity of the detected homologous sequence derived from other than the host cell is the criterion.
  • a biomarker candidate sequence selection unit that selects the lower frequency region as a biomarker candidate sequence, and the biomarker candidate sequence is aligned with the homologous sequence to detect regions with sequence conservation lower than the reference,
  • a membrane vesicle detection device comprising: a biomarker sequence determination unit that is the biomarker sequence.
  • This device is the same as that of the first embodiment except that it has a nucleic acid synthesis device, so the above differences will be mainly described below.
  • FIG. 7 is a hardware configuration diagram of this device.
  • FIG. 8 is a functional block diagram of this device.
  • FIG. 9 is an operation flow chart of the control device of this device.
  • the membrane vesicle detection device 50 has a nucleic acid synthesis device 51 . Based on the biomarker sequences determined by the biomarker sequencing unit 34, the nucleic acid synthesizer 51 designs and synthesizes primers (pairs) that include the biomarker sequences (or their complementary sequences) in one amplification product. . Furthermore, a fluorescent probe may also be synthesized together if necessary.
  • RNA synthesizer As such a nucleic acid synthesizer, a known one can be used. An RNA synthesizer and the like are included.
  • the operation flow of the control device 23 differs from the operation flow of the control device of the first embodiment in that it has the following two steps instead of step S46.
  • control device 23 controls the nucleic acid synthesizer 51, and based on the biomarker sequence determined by the biomarker sequence determination unit 34, this biomarker sequence (or its complementary sequence) is 1 It has a step of designing and synthesizing primers (and probes if necessary) to be included in one amplification product (step S47).
  • control device 23 controls the quantitative PCR device 22 to use primers synthesized by the nucleic acid synthesizer (and, if necessary, probes synthesized) to detect membrane size in the biological sample.
  • the point is that it has a step of detecting cells (step S48).
  • this device has a nucleic acid synthesizer 51, biomarker sequence determination, primer synthesis, and detection of membrane vesicles by quantitative PCR can be automatically performed. Can be easily quantified.
  • An embodiment of the biomarker sequence search device of the present invention comprises a base sequence analysis device for obtaining the base sequence of membrane vesicles produced by host cells, and a control device, wherein the control device comprises the base sequence to a reference sequence derived from the host cell, a frequent region selection unit that selects a frequent region whose detection frequency exceeds a reference from the mapped region, and the frequent region as a query sequence, homologous a biomarker candidate sequence selection unit that performs a gender search and selects, as a biomarker candidate sequence, the frequent region having lower similarity than a reference with homologous sequences derived from the detected host cell, and the biomarker candidate sequence; is aligned with the homologous sequences, a region with sequence conservation lower than the reference is detected, and a biomarker sequencing unit that uses this as a biomarker sequence.
  • FIG. 10 is a hardware configuration diagram of this device.
  • FIG. 11 is a functional block diagram of this device.
  • FIG. 12 is an operation flow chart of the control device of this device.
  • the biomarker sequence search device 30 is the hardware configuration of the first embodiment of the membrane vesicle detection device already described, excluding the quantitative PCR device.
  • the configuration of the device other than the above and the functions of the respective parts are the same as those of the membrane vesicle detection device of the first embodiment, and the description thereof will be omitted.
  • control Apparatus 23 controls quantitative PCR apparatus 22 to generate a biological sample by quantitative polymerase chain reaction using primers designed to include the biomarker sequence (or its complementary sequence) in one amplification product.
  • control Apparatus 23 controls quantitative PCR apparatus 22 to generate a biological sample by quantitative polymerase chain reaction using primers designed to include the biomarker sequence (or its complementary sequence) in one amplification product.
  • the only difference is that there is no step of detecting membrane vesicles in ), and the other steps are the same.
  • the computer of the present invention is a computer that searches for biomarker sequences, and includes a map portion that maps the base sequence of a membrane vesicle produced by a host cell to a reference sequence derived from the host cell, and the mapped region.
  • a frequent region selection part that selects a frequent region whose detection frequency exceeds a standard, and a homology search is performed using the frequent region as a query sequence, and the similarity between the detected homologous sequence derived from the host cell and the
  • a biomarker candidate sequence selection unit that selects the frequency region lower than the reference as a biomarker candidate sequence, and aligns the biomarker candidate sequence with the homologous sequence to detect regions with sequence conservation lower than the reference.
  • a biomarker sequencing unit wherein the biomarker sequence is the above biomarker sequence.
  • FIG. 13 is a hardware configuration diagram of this computer.
  • the computer 60 includes at least a processor 24, a storage device 25, a display device 26, and an input device 27, and may further include a communication device (not shown).
  • the processor 24 is, for example, a microprocessor, processor core, multiprocessor, ASIC (application-specific integrated circuit), FPGA (field programmable gate array), and GPGPU (general-purpose computing on graphics processing units).
  • ASIC application-specific integrated circuit
  • FPGA field programmable gate array
  • GPGPU general-purpose computing on graphics processing units
  • the storage device 25 has a function of temporarily and/or non-temporarily storing various programs and data, and provides a working area for the processor 24 .
  • the storage device 25 is, for example, ROM (Read Only Memory), RAM (Random Access Memory), HDD (Hard Disk Drive), flash memory, SSD (Solid State Drive), and the like.
  • the display device 26 can display analysis results, sample names, operating procedures, and the like.
  • the display device 26 may be a liquid crystal display, an organic EL (Electro Luminescence) display, or the like.
  • the display device 26 may be configured integrally with the input device 27 .
  • the display device 26 is a touch panel display, and the form which provides GUI(Graphical User Interface) is mentioned.
  • the input device 27 can accept inputs such as measurement conditions and specimen names, and can accept inputs of instructions to the membrane vesicle detection device 20 .
  • the input device 27 may be a keyboard, mouse, scanner, touch panel, or the like.
  • FIG. 14 is a functional block diagram of this computer.
  • the computer 60 has a map section 31 , a frequent region selection section 32 , a biomarker candidate sequence selection section 33 and a biomarker sequence determination section 34 .
  • the map unit 31 is a function realized by the processor 24 executing a program stored in the storage device 25 .
  • the map unit 31 uses the input device 27 or a communication function (not shown) to input (61) the base sequence of a membrane vesicle from the outside via a network, and similarly acquires (35) from a public database or the like the host Map to the cell's genomic sequence (or collection of sequences containing it).
  • the mapping method has already been explained in the membrane vesicle detection method of the present invention.
  • the frequently-appearing area selection unit 32 is a function realized by the processor 24 executing a program stored in the storage device 25 .
  • regions mapped by the mapping unit 31 to reference sequences derived from host cells are selected by the frequent region selection unit 32 as frequent regions whose detection frequency exceeds the reference.
  • the detection frequency criteria may be set in advance and stored in the storage device 25 .
  • the method for selecting the frequent regions is as already described in the description of the first embodiment of the method for detecting membrane vesicles of the present invention.
  • the biomarker candidate sequence selection unit 33 is a function realized by the processor 24 executing a program stored in the storage device 25 .
  • the biomarker candidate sequence selection unit 33 uses the frequent region as a query sequence, and acquires (36) from a public database or the like via a network using the input device 27 or a communication function. A homology search is performed, and the frequent regions with lower similarity than the standard to the detected homologous sequences derived from non-host cells are selected as biomarker candidate sequences.
  • the method for selecting biomarker candidate sequences is as already described in the description of the first embodiment of the method for detecting membrane vesicles of the present invention.
  • the biomarker sequencing unit 34 is a function realized by the processor 24 executing a program stored in the storage device 25.
  • the biomarker sequence determination unit 34 aligns the biomarker candidate sequences selected by the biomarker candidate sequence selection unit 33 with the homologous sequences, detects regions with sequence conservation lower than the reference, and identifies them as biomarker sequences. be an array.
  • the biomarker sequence determination method is as already described in the description of the first embodiment of the membrane vesicle detection method of the present invention.
  • FIG. 15 is a flowchart of biomarker sequence search processing by the processor of this computer.
  • the processor 24 causes the mapping unit 31 to map the base sequence of the membrane vesicle obtained from the outside to the reference sequence derived from the host cell (step S71).
  • the processor 24 uses a host cell genome sequence obtained (35) from a public database or the like as a reference sequence, and maps base sequences derived from membrane vesicles to this.
  • the processor 24 performs a process of selecting a frequent region whose detection frequency exceeds the reference from among the regions mapped to the genome sequence of the host cell by the frequent region selection unit 32 (step S72).
  • the processor 24 causes the biomarker candidate sequence selection unit 33 to use the frequent regions selected by the frequent region selection unit 32 as a query sequence from the public database or the like via the input device 27 or the communication function.
  • a homology search is performed (using this as a reference) against a sequence derived from a cell other than the host cell (e.g., a genome sequence of a cell other than the host cell), and the detected homology derived from a cell other than the host cell
  • a process of selecting frequent regions with sequence similarity lower than the reference as biomarker candidate sequences is performed (step S73).
  • the processor 24 causes the biomarker sequence determination unit 34 to align the biomarker candidate sequences selected by the biomarker candidate sequence selection unit 33 with the homologous sequences detected by the homology search and derived from other than the host cell. Then, a region with sequence conservation lower than the standard is detected and used as a biomarker sequence (step S74).
  • the disease biomarker search method of the present invention is one of the application examples of using the biomarker sequence search method described above to search for biomarkers for detecting specific diseases.
  • FIG. 19 is a flow diagram of the disease biomarker search method of the present invention. The method for searching for the above-described disease biomarkers will be described in detail below with reference to the flowchart of FIG. 19 .
  • step S81 a base sequence of a first membrane vesicle obtained from a first biological sample collected from a diseased patient and a known cell base sequence or a known virus genome sequence to determine the host cell of the first membrane vesicle, "host cell A”.
  • the “disease” is not particularly limited in its type, but is preferably the above-mentioned "specific disease", typically more preferably a disease caused by bacteria and / or viruses, bacteria and / or , viral infections are more preferred. As one form, periodontal disease is preferred.
  • the first biological sample collected from a diseased patient is not particularly limited, but for example, saliva, blood, serum, plasma, buffy coat, lymph, interstitial fluid, body cavity fluid, digestive fluid, sweat, urine , nasal discharge, tears, semen, vaginal fluid, amniotic fluid, milk, sputum, surgical cleaning fluid, feces, and swabs of skin or body mucosa, and at least one selected from the group consisting of swabs. more preferred.
  • the method for collecting them is not particularly limited, and they may be collected by a known method.
  • the first biological sample may be a single sample collected from a single patient, or multiple samples (multiple types of samples, multiple collection times) sample), and single/multiple samples collected from a plurality of patients (patient group).
  • samples collected from a plurality of patients are preferable from the standpoint of being able to more accurately determine the "host cell C" described later, that is, to be specific to a patient group.
  • the samples collected from a plurality of patients may be used as they are and step S81 may be performed multiple times, or the samples collected from a plurality of patients may be mixed and used as a new first biological sample.
  • step S81 may be implemented.
  • This step may further include the step of isolating membrane vesicles contained in the first biological sample collected from the patient (group) and acquiring the base sequence of the membrane vesicles.
  • a method for separating membrane vesicles from a biological sample and obtaining the base sequence thereof the same method as steps S11 to S13 in the biomarker sequence searching method flow (FIG. 1) described above can be applied.
  • the host cell of the first membrane vesicle contained in the first biological sample collected from the diseased patient is unknown.
  • the base sequence of the first membrane vesicle is compared with the base sequence of a known cell or the genome sequence of a known virus, and the host cell of the first membrane vesicle, the "host Cell A" is identified.
  • the "host cell A” may be the cell itself or a virus-infected cell.
  • the number of the first membrane vesicles may be one, or two or more. Moreover, when there are two or more types, they may be produced by one type of host cell, or may be produced by two or more types of host cells. Therefore, host cell A may be of one type or two or more types.
  • the method of comparing the base sequence of the first membrane vesicle with the base sequence of known cells or the genome sequence of known viruses is not particularly limited. or a known viral genome sequence as a reference, and performing homology search by BLAST or the like.
  • the same method as in step 14 of the biomarker sequence searching method flow (FIG. 1) described above can be applied.
  • the method of arranging the data acquired in the process of performing this step is not particularly limited.
  • the above table may further include base length data for each host cell, and such data can be visualized by a heat map or the like (eg, FIG. 21).
  • step S82 the base sequence of a second membrane vesicle obtained from a second biological sample collected from a healthy subject and the base sequence of a known cell or the genome of a known virus A comparison with the sequence determines the host cell for the second membrane vesicle, "Host Cell B.”
  • the "host cell B” may be the cell itself or a virus-infected cell.
  • Each procedure in this step is the same as step S81 except that the second biological sample is used instead of the first biological sample, and the preferred form is also the same.
  • step S83 host cell A and host cell B are compared to identify "host cell C" as a host cell having a high abundance ratio in the first biological sample.
  • the "abundance ratio” is defined as the number ratio of membrane vesicles when individual membrane vesicles contained in a biological sample are attributed to host cells or viruses that have infected host cells. As one form, it is preferably defined as the number of membrane vesicles attributed to a certain host cell (virus) with respect to the total number of membrane vesicles detected from a certain biological sample. It should be noted that the sequences of individual membrane vesicles are not necessarily attributed to one type of host cell (virus), and may be attributed to two or more types of host cells. may be calculated as
  • the abundance ratio is large may be the highest abundance ratio, or may be the abundance ratio equal to or higher than a predetermined reference value.
  • the above comparison identifies "host cell C", which is the host cell of membrane vesicles more frequently detected in the first biological sample. Host cell C is contained within host cell A. Host cell C is preferably not contained in host cell B. When host cell C is contained in host cell B, the abundance ratio of host cell C in the second biological sample is preferably equal to or less than a predetermined reference value.
  • Specific comparison methods for selecting host cell C include, for example, the following methods. First, host cells (or viruses) of membrane vesicles contained in each sample are grouped by closely related species to identify a group of host cells (or viruses) specific to the first membrane vesicle. Next, there is a method of comparing abundance ratios (attribution frequency of membrane vesicle units) within the specified group, and defining host cells whose abundance ratios are equal to or higher than a predetermined standard as "host cells C". . Examples of grouping methods include, for example, a method of grouping by "phylum” if host cells are bacteria, and a method of grouping by "family” if host cells are viruses. Since the method for searching biomarkers for this disease has this step, it is possible to search for markers with higher specificity.
  • step S84 the base sequence of the membrane vesicles produced by the host cell C is used as a reference sequence derived from the host cell C (typically, the genome sequence of the host cell C, or viral genome sequence). Furthermore, in step S85, among the mapped areas, areas whose detection frequency exceeds the reference are selected.
  • the "membrane vesicles produced by host cell C" used in the above steps are typically determined to be produced by host cell C among the membrane vesicles obtained from the first biological sample. can be anything.
  • the present inventors have found that even if the number of host cells C is one, the number of membrane vesicles produced from the host cells C is not limited to one, but may be two or more. ing. In steps S84 and S85 described above, regions that are frequently detected in membrane vesicles produced from the host cell C, which may be of a plurality of types, are identified.
  • step S84 is the same as step S14 of the already described biomarker sequence search method flow (Fig. 1), and the preferred embodiment is also the same.
  • step S85 is the same as step S15 in the flow (FIG. 1) of the biomarker sequence search method already described, and the preferred embodiment is also the same.
  • step S86 a homology search is performed using the frequent region as a query sequence, and the detected "frequent region" having lower similarity to the homologous sequence derived from "other than host cell C" than the reference is a biomarker candidate. Selected as an array.
  • This step is the same as step S16 in the flow (FIG. 1) of the biomarker sequence search method already described, and the preferred embodiment is also the same.
  • a sequence having particularly low similarity to the reference or the like is selected from among the "frequent regions" specified in step S15.
  • step S87 host cell D, which is a closely related species of host cell C, is selected from among host cells B. Then, in step S88, the base sequence of a membrane vesicle derived from host cell D or a fragment thereof is selected. is mapped to a reference sequence (a reference sequence derived from host cell C), and then, as step S89, the mapped regions are excluded from the biomarker candidate sequences.
  • the host cell D is a closely related species of the host cell C (a specific host cell among the host cells A of the first membrane vesicle contained in the first biological sample collected from the patient) and a host cell contained in host cell B (the host cell of the second membrane vesicle contained in the second biological sample collected from a healthy subject).
  • Membrane vesicles of host cell C and host cell D which is a closely related species thereof, may have a common region in their base sequences. Especially at the fragment (eg sequence read) level, it is speculated that there is a common region.
  • the base sequence of membrane vesicles of host cell D is mapped to a reference sequence derived from host cell C, that is, the genome sequence of host cell C or the genome sequence of a virus that has infected host cell C. be done. Then, if there is a region in the mapped region that overlaps with the biomarker candidate sequence, this region is excluded from the biomarker candidate sequence. This further increases the specificity of the biomarker candidate sequences. Note that the above steps S87 to S89 may not be provided.
  • the range of closely related species should be selected as appropriate. For example, as one form, if the host cell is a bacterium, the method is performed for each "phylum" of the taxonomic class. method of doing so.
  • step S90 the biomarker candidate sequences are aligned with homologous sequences to detect regions with sequence conservation lower than the reference, and these regions are used as disease biomarkers.
  • Step S90 is the same as S17 in the already described biomarker sequence search method flow (FIG. 1), and the preferred embodiment is also the same.
  • the disease biomarker thus determined is a region that is frequently detected in the base sequence of membrane vesicles in biological samples collected from diseased patients and is specific to host cell C. Therefore, by quantifying the disease biomarkers in the membrane vesicles, information such as the progress of the disease can be obtained.
  • Streptococcus mutans (NG8) was used as the bacterial strain, which was cultured at 37° C. using DSMZ medium or Gifu medium.
  • a N 2 /CO 2 (80:20 v/v) gas mixture was first filled for 20 minutes into vials containing bacterial strains and medium. Thereafter, culture was continued until the optical density (OD600) of the culture medium reached 1.0. After incubation, the bacterial strain culture was centrifuged at 7800 rpm for 10 minutes at 4°C. The supernatant containing membrane vesicles was passed through a 0.22 ⁇ m filter to remove cell debris, and membrane vesicles were purified from the filtered supernatant.
  • the filtered supernatant was ultracentrifuged at 126,000 xg and 4°C for 2 hours. After ultracentrifugation, the supernatant was removed and the pelleted membrane vesicles were resuspended and stored at 4°C in phosphate-buffered saline (PBS). Further membrane vesicle purification was performed using an iodoxanol (OptiPrep) density gradient. A 60% iodoxanol stock solution was diluted with PBS to 35%, 30%, 25%, 20%, 15%, 10%. The stored suspension containing membrane vesicles was ultracentrifuged at 140,000 xg for 2 hours at 4°C.
  • PBS phosphate-buffered saline
  • the resulting pellet was resuspended in a 35% iodoxanol solution.
  • the six iodoxanol solutions prepared were filled into ultracentrifuge tubes in ascending order of density. At this time, the 35% suspension containing membrane vesicles was placed at the bottom and the 10% solution was placed at the top in a 7 mL ultracentrifugation tube. The tube was ultracentrifuged at 140,000 xg at 4°C for 16 hours using a swing rotor. After ultracentrifugation, 1 mL fractions were collected from each layer and stored in separate Eppendorf tubes.
  • fractions contained in each obtained fraction were measured using a nanoparticle tracking device, and the fraction containing the largest number of particles with a diameter of about 100 to 200 nm was defined as "membrane vesicles are concentrated. Fraction” and used for further analysis.
  • a DNA fragment derived from membrane vesicles was analyzed using a next-generation sequencer to obtain a short-read nucleotide sequence. Sequences with low sequence quality among these short read base sequences (about 150 bp) are identified as fastp (Chen et al., fastp: an ultra-fast all-in-one FASTQ preprocessor. Bioinformatics 34, 17, 2018) removed using
  • Protein coding regions (CDS) in the base sequence inside each membrane vesicle are predicted and detected using prokka (Seemann, Prokka: rapid prokaryotic genome annotation. Bioinformatics, 30, 14, 2014), and one of those CDS For one, a homology search was performed using the reference genome (Streptococcus mutans strain NG8 NZ_CP013237.1) of a cultured bacterial strain registered with NCBI as a reference sequence to detect the mapped region on the genome.
  • prokka Seemann, Prokka: rapid prokaryotic genome annotation. Bioinformatics, 30, 14, 2014
  • FIG. 16 shows the results of mapping the base sequences in the membrane vesicle particles to the reference sequences.
  • 96 membrane vesicle particles were analyzed, and the region where the nucleotide sequence contained in each particle was mapped to the reference sequence is shown in black.
  • FIG. 17 shows the result of changing the vertical axis in FIG. 16 from the number of membrane vesicle particles to the "detection frequency", that is, the total number of membrane vesicle particles having the sequence in that region. From the above results, it can be seen that there is a region that many membrane vesicle particles have in common.
  • a homology search is performed using the protein sequences registered in the Swiss-Prot database as a reference sequence for the screened frequent regions (using diamond), and the functional information tagged to each protein sequence information on the matching database ( Gene Ontology) was extracted by an analysis algorithm, and gene functions that were detected at a statistically significant high frequency were detected (Hyper-geometric distribution test: p-value ⁇ 0.05).
  • Fig. 18 is a list of the above gene functions.
  • the term “SM bacteria” indicates the results for the above Streptococcus mutans bacteria.
  • PAO and PG bacteria are Pseudomonas aeruginosa PAO1 and Porphyromonas gingivalis W83 (PG), respectively. ) function.
  • a homology search (diamond) was performed using the frequently occurring region as a query sequence and the biological protein sequence (nr) covering all domains registered in NCBI as a reference sequence.
  • the sum of the alignment scores (Max Score) of the top 20 protein coding sequences excluding sequences derived from the same strain is calculated, and only the sequence with the lowest value is bio It was selected as a marker candidate sequence.
  • the nucleotide sequences of this biomarker candidate sequence and their homologous sequences (the top 20 protein-coding sequences described above) were aligned using MAFFT. As a result of alignment, when a region with low sequence conservation was detected over about 100 bases, that region was defined as a biomarker sequence.
  • sequences of about 18 to 25 bases at both ends of the base sequences with the lowest sequence conservation are used as primer sequences.
  • Tm values were separately calculated by TmCalculator, and sequence lengths suitable for detection by qPCR were adjusted.
  • saliva was obtained from each of three healthy subjects and six periodontal disease patients. Patients with periodontal disease were classified into stage III, grade C (periodontal disease classification by the American Society of Periodontology and the European Federation of Periodontal Diseases). These patients had been antibiotic-free for 3 months, were non-smokers, and had no diabetes or other systemic disease. Saliva collection was performed using Saliva Collection Aid (Salimetrics LLC. Carlsbad, Calif.). A healthy subject sample was prepared by mixing samples from 3 healthy subjects, and a periodontal disease patient sample 1 and a periodontal disease patient sample 2 were prepared by mixing 3 samples from 6 periodontal disease patients. , was used for subsequent analysis.
  • the healthy subject sample, the periodontal disease patient sample 1, and the periodontal disease patient sample 2 may be collectively referred to as "saliva samples”.
  • the separated membrane vesicle sample was treated with deoxyribonuclease (DNase) to degrade nucleic acid components outside the membrane vesicles. Specifically, 2 ⁇ L of DNase (13 units (U)/ ⁇ L) was added to 100 ⁇ L of the purified membrane vesicle sample, and the mixture was treated at 37° C. for 30 minutes and at 80° C. for 10 minutes.
  • DNase deoxyribonuclease
  • the membrane vesicle sample was diluted and the membrane vesicle concentration was adjusted to a concentration of 40000 particles/ ⁇ L.
  • the particles are irradiated with a laser beam, and the Brownian motion of each particle is tracked from the scattered light (tracking method).
  • a method of calculating the diameter and the number was adopted. Zetaview (DKSH, Germany) was used for measurements and calculations.
  • Membrane vesicles after encapsulation were dissolved by adding the following reagents. 50 U/ ⁇ L Ready-lyse Lysozyme Solution (Epicentre), 2 U/mL Zymolyase (Zymo research), 22 U/mL lysostaphin (MERCK), 250 U/mL mutanolysin (MERCK), This treatment was performed overnight at 37° C. in DPBS (Dulbecco's Phosphate-Buffered Saline).
  • DPBS Dynabecco's Phosphate-Buffered Saline
  • the DNA in the gel beads after dissolution was amplified using the REPLI-g Single Cell Kit (QIAGEN). After DNA amplification, the gel bead DNA molecules were stained with a nucleic acid staining reagent (1 ⁇ SYBR Green), and the gel beads in which fluorescence above a certain level was observed were sorted by a cell sorter (FACSMelody cell sorter (BD Bioscience)) into a 96-well plate. Separately collected one gel bead each time.
  • a nucleic acid staining reagent 1 ⁇ SYBR Green
  • CDS Protein coding regions in the base sequence inside each membrane vesicle are predicted and detected using prokka (Seemann, Prokka: rapid prokaryotic genome annotation. Bioinformatics, 30, 14, 2014), and one of those CDS For one, a homology search was performed using the NCBI full protein sequence nr database and the GTDB database as references, and it was determined that the bacterium that had the highest number of CDS regions in the genome with the highest degree of matching was the host bacterium for that particle. .
  • FIG. 20 shows the results of comparison of base sequence profiles of membrane vesicles in healthy subject samples and periodontal disease patient samples. Based on the information of the detected nucleotide sequences, we identified the taxonomic group of bacteria from which the nucleotide sequences inside each membrane vesicle were derived.
  • FIG. 20 is a heat map representing the frequency of the length of the detected DNA region when each bacterial strain is divided into the phylum level and the genus level (genus). It was found that TM7x-derived nucleotide sequences belonging to the phylum Patescibacteria were frequently detected in periodontal disease patient samples.
  • bacterial strain A Panecibacteria TM7x sp900555265 with the highest detection count (large abundance ratio) was selected as a membrane vesicle host bacterial strain peculiar to periodontal disease patients.
  • FIG. 21 shows the results, showing the region length of the virus-derived base sequence detected in each membrane vesicle for each species.
  • virus type B Podviridae ctUiB3
  • biomarker candidate sequences are subjected to a homology search against contigs obtained from membrane vesicles of healthy subjects, and the sum of the alignment scores (Max Score) of the top 20 protein coding sequences is calculated. The sequence with the smallest value of was selected.
  • a membrane vesicle-derived sequence read whose host is a bacterial strain belonging to the same taxonomic group (phylum level) as the bacterial strain A is obtained. mapped against the genome.
  • the final biomarker sequences for periodontal disease detection were obtained by excluding the regions detected in the sequence reading of these healthy subject-derived membrane vesicles from the biomarker candidate sequences.
  • FIG. 22 is a diagram showing a procedure for determining regions (biomarker sequences) specifically detected in periodontal disease patients.
  • FIG. 22(A) shows the result of mapping the base sequence inside the membrane vesicles determined to be derived from TM7x sp900555265 among the membrane vesicles derived from the periodontal disease patient sample to the reference sequence (genomic sequence of TM7x sp900555265). It is a figure showing an example.
  • the vertical axis of FIG. 22(A) represents individual membrane vesicles, and the horizontal axis represents the position on the genome sequence.
  • the heat map of FIG. 22(B) represents the genomic regions detected with high frequency in FIG. 22(A).
  • the horizontal axis represents the position on the genome sequence.
  • membrane vesicles determined to be derived from the phylum Patescibacteria which contain TM7x sp900555265 among membrane vesicles derived from healthy subjects, are mapped to the reference sequence (genomic sequence of TM7x sp900555265). It is.
  • the vertical axis and horizontal axis are the same as in FIG. 22(A).
  • the heat map of FIG. 22(D) represents the genomic regions detected with high frequency in FIG. 22(C).
  • the horizontal axis represents the position on the genome sequence.
  • FIG. 22(E) is a map of genomic regions specifically detected in periodontal disease patients from the comparison of FIG. 22(B) and FIG. 22(D). Each of these becomes a biomarker sequence.
  • membrane vesicle-derived sequence reads containing virus-derived CDS belonging to the same taxonomic group (family level) as virus B among the virus-derived sequences detected in healthy subjects were compared to the virus B genome. and mapped. Since no region was detected by sequence reading of membrane vesicles derived from healthy subjects, the biomarker candidate sequences obtained above were used as biomarker sequences as they were. A continuous DNA region of 1000 bp or more among these sequences was targeted.
  • FIG. 23 is a diagram showing a procedure for determining regions (biomarker sequences) specifically detected in periodontal disease patients.
  • FIG. 23(B) shows that among the membrane vesicles derived from the periodontal disease patient sample, the base sequence inside the membrane vesicles containing the CDS region determined to be derived from PodviridaectUiB3 is mapped to the reference sequence (genome sequence of ctUiB3).
  • FIG. 10 is a diagram showing an example of a result of The vertical axis of FIG. 23(B) represents individual membrane vesicles, and the horizontal axis represents the position on the genome sequence.
  • FIG. 23(A) represents the detection frequency for each region
  • the heat map of FIG. 23(C) represents the genomic regions detected with high frequency in FIG. 23(A). In both cases, the horizontal axis represents the position on the genome sequence. This genomic region becomes the biomarker sequence.
  • selection of primer sequences and oligonucleotide probe sequences From the obtained biomarker sequences, multiple sequences of about 100 bp suitable for detection by qPCR using a probe method (5'-nuclease method) were selected.
  • the Primer Quest (registered trademark) Tool https://sg.idtdna.com/pages/tools/primerquest) provided by Integrated DNA Technologies was used. Using.
  • membrane vesicles secreted by bacteria have attracted attention as one of the factors that mediate pathogenic bacteria and various diseases. , heart disease, and even cranial nerve diseases such as Alzheimer's disease.
  • the identification/detection technology of blood membrane vesicles which have a strong influence on various diseases, will be the basis for innovative disease prevention/diagnosis technology.
  • Specific pathogenic bacterial species and diseases can be easily detected by performing (q) PCR tests (or RT-qPCR) using the bacterial membrane vesicle marker sequences identified by the present invention as indicators. becomes.

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biochemistry (AREA)
  • Genetics & Genomics (AREA)
  • General Health & Medical Sciences (AREA)
  • Microbiology (AREA)
  • Biophysics (AREA)
  • Analytical Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Immunology (AREA)
  • Molecular Biology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Toxicology (AREA)
  • Medicinal Chemistry (AREA)
  • Biomedical Technology (AREA)
  • Sustainable Development (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本発明の膜小胞の検出方法は、宿主細胞が産生した膜小胞の塩基配列の一部であるバイオマーカー配列を1つの増幅産物に含むように設計されたプライマーを用いて、qPCRによって、試料中の膜小胞を検出することを含み、バイオマーカー配列は、以下の手順;宿主細胞が産生した膜小胞の塩基配列を得て、塩基配列を宿主細胞に由来するリファレンス配列にマップさせ、マップされた領域のうち、検出頻度が基準を超える頻出領域を選択し、頻出領域をクエリー配列として相同性検索を行い、検出された宿主細胞以外に由来する相同配列との類似性が基準よりも低い頻出領域をバイオマーカー候補配列として選択し、バイオマーカー候補配列を、相同配列にアラインメントして、配列保存性が基準よりも低い領域を検出し、これをバイオマーカー配列とすること、によって選択されたものである。これにより、生物学的試料における膜小胞を簡便に定量できる。

Description

膜小胞の検出方法、バイオマーカー配列の探索方法、膜小胞検出装置、バイオマーカー配列探索装置、プログラム、コンピュータ、及び、疾病バイオマーカーの探索方法
 本発明は、膜小胞の検出方法、バイオマーカー配列の探索方法、膜小胞検出装置、バイオマーカー配列探索装置、プログラム、コンピュータ、及び、疾病バイオマーカーの探索方法に関する。
 近年、病原体と各種疾患を媒介する因子の一つとして、細胞から分泌される膜小胞が注目を集めており、これらが血中へと移行し全身へと運ばれることで、消化器系疾患、心疾患、ひいてはアルツハイマー症等の脳神経疾患に至る幅広い疾患に影響を及ぼす可能性が指摘されている。
 そのため、体液等に含まれる膜小胞に含まれる核酸の配列決定やその定量の技術が求められている。
 このような技術として、特許文献1には、エクソソームや細胞外小胞体の核酸の配列決定のための方法として、「生体サンプルからの核酸を配列決定する方法であって:(a)生体サンプルを準備し;(b)固形物捕捉表面と該生体サンプルとを、その捕捉表面上または表面内にその生体サンプルからの無細胞DNAおよび細胞外小胞体を保持するのに十分な条件下で接触させ;(c)溶解試薬と該捕捉表面とを、該無細胞DNAおよび細胞外小胞体が該捕捉表面上または表面内に存在している間に接触させ、それにより、その捕捉表面からDNAおよびRNAを放出させ、ホモジネートを作り出し;(d)該ホモジネートからDNA、RNA、またはその両方を抽出し;(e)該ホモジネートから、または抽出されたDNA、抽出されたRNAもしくはその両方から選択的にリボソームDNAまたはRNA配列を取り除き;(f)該RNAをcDNAに逆転写し;(g)該抽出されたDNA、逆転写されたcDNA、または抽出されたDNAと逆転写されたcDNAの両方から二本鎖DNAライブラリを構築し;(h)任意で、DNA、RNA、またはDNAとRNAの両方をライブラリから増幅し;cDNAまたは二本鎖DNAライブラリから核酸配列を選択的に濃度を高め;そして、(i)該cDNA、二本鎖DNA、またはcDNAと二本鎖DNAの両方を含むライブラリを配列決定すること、を含む方法。」が記載されている。
特表2019-535307号公報
 特許文献1に記載された方法によれば、検体に含まれる細胞外小胞体の核酸配列を決定することはできるものの、手順が煩雑であり、また、検体に含まれる膜小胞の定量を行うことは難しく、膜小胞を指標とした疾病の診断技術(リキッドバイオプシー等)への応用は難しかった。
 そこで、本発明は、生物学的試料における膜小胞を簡便に定量できる、膜小胞の検出方法の提供を課題とする。また、本発明は、バイオマーカー配列の探索方法、膜小胞検出装置、バイオマーカー配列探索装置、プログラム、コンピュータ、及び、疾病バイオマーカーの探索方法の提供も課題とする。
 本発明者らは、上記課題を達成すべく鋭意検討した結果、以下の構成により上記課題を達成することができることを見出した。
 [1] 宿主細胞が産生した膜小胞の塩基配列の一部であるバイオマーカー配列を1つの増幅産物に含むように設計されたプライマーを用いて、定量ポリメラーゼ連鎖反応によって、生物学的試料における上記膜小胞を検出することを含み、上記バイオマーカー配列は、以下の手順;上記宿主細胞が産生した上記膜小胞の塩基配列を得ること、上記塩基配列を上記宿主細胞に由来するリファレンス配列にマップさせること、上記マップされた領域のうち、検出頻度が基準を超える頻出領域を選択すること、上記頻出領域をクエリー配列として相同性検索を行い、検出された上記宿主細胞以外に由来する相同配列との類似性が基準よりも低い上記頻出領域をバイオマーカー候補配列として選択すること、上記バイオマーカー候補配列を、上記相同配列にアラインメントして、配列保存性が基準よりも低い領域を検出し、これを上記バイオマーカー配列とすること、によって選択されたものである、膜小胞の検出方法。
 [2] 上記リファレンス配列が、前記宿主細胞のゲノム配列、又は、上記宿主細胞に感染したウイルス由来の核酸配列である、[1]に記載の膜小胞の検出方法。
 [3] 上記生物学的試料が対象から採取されたものであり、上記手順が、上記膜小胞の塩基配列を得ることの前に、上記生物学的試料から上記膜小胞を分離取得すること、を更に含む、[1]又は[2]に記載の膜小胞の検出方法。
 生物学的試料に含まれる膜小胞の種類や量は、その生物学的試料が採取された対象の身体状態を反映している可能性が高い。つまり、対象がある疾病にり患していれば(対象が当該疾病の患者であれば)、その疾病や進行の具合に応じた膜小胞が生物学的試料に含まれている可能性が高い。このような生物学的試料から分離取得された膜小胞を用いて探索されたバイオマーカー配列は、対象の身体状態(り患している疾病の種類や進行の具合)の診断のためのマーカーとしてより有用であり、検出された膜小胞はその定量評価の基準として用いることができる。上記は後述する[6]についても同様である。
 [4] 宿主細胞が産生した膜小胞の塩基配列を得ることと、上記塩基配列を上記宿主細胞に由来するリファレンス配列にマップさせることと、上記マップされた領域のうち、検出頻度が基準を超える頻出領域を選択することと、上記頻出領域をクエリー配列として相同性検索を行い、検出された上記宿主細胞以外に由来する相同配列との類似性が基準よりも低い上記頻出領域をバイオマーカー候補配列として選択することと、上記バイオマーカー候補配列を、上記相同配列にアラインメントして、配列保存性が基準よりも低い領域を検出し、これをバイオマーカー配列とすることと、上記バイオマーカー配列を1つの増幅産物に含むように設計されたプライマーを用いて、定量ポリメラーゼ連鎖反応によって、生物学的試料における上記膜小胞を検出することと、を含む膜小胞の検出方法。
 [5] 上記リファレンス配列が、上記宿主細胞のゲノム配列、又は、上記宿主細胞に感染したウイルス由来の核酸配列である、[4]に記載の膜小胞の検出方法。
 [6] 上記生物学的試料が、対象から採取されたものであり、上記膜小胞の塩基配列を得ることの前に、上記生物学的試料から上記膜小胞を分離取得すること、を更に含む、[4]又は[5]に記載の膜小胞の検出方法。
 [7] 上記生物学的試料が、唾液、血液、血清、血しょう、バフィーコート、リンパ液、間質液、体腔液、消化液、汗、尿、鼻汁、涙液、精液、膣液、羊水、乳汁、喀痰、手術洗浄液、糞便、並びに、皮膚又は身体粘膜の拭い液、及び、スワブからなる群より選択される少なくとも1種である、[1]~[6]のいずれかに記載の膜小胞の検出方法。
 生物学的試料が上記から選択される場合、生物学的試料中に膜小胞が含まれる可能性がより高い。また、対象が何らかの疾病にり患している場合、上記の種類の生物学的試料に、その疾病に特有の膜小胞が含まれる可能性がより高い。そのため、生物学的試料が上記から選択される場合、本発明の膜小胞の検出方法はリキッドバイオプシー方法としてより優れた効果を発揮する。
 [8] 上記バイオマーカー候補配列の選択が、上記相同配列へのアラインメントスコアが最小となった配列を選択することである、[1]~[7]のいずれかに記載の膜小胞の検出方法。
 バイオマーカー候補配列として、上記の配列を選択することにより、その配列中に、配列保存性の低い領域であるバイオマーカー配列が含まれる可能性がより高くなり、より効率的にバイオマーカー配列が探索できる。ひいては、より効率的に膜小胞が検出できる。
 [9] 上記頻出領域が、タンパク質コード領域である、[1]~[8]のいずれかに記載の膜小胞の検出方法。
 頻出領域をタンパク質コード領域とすると、その後の工程におけるマッピング等がよりスムーズに実施できる。
 [10] 上記定量ポリメラーゼ連鎖反応が、リアルタイムポリメラーゼ連鎖反応である、[1]~[9]のいずれかに記載の膜小胞の検出方法。
 上記膜小胞の検出方法によれば、生物学的試料中の膜小胞の量をより正確かつ迅速に定量できる。
 [11] 上記検出頻度の基準が、統計的検定の有意水準に基づいて予め定められた基準である、[1]~[10]のいずれかに記載の膜小胞の検出方法。
 上記膜小胞の検出方法によれば、より簡便に頻出領域を選択することができる。
 [12] 宿主細胞が産生した膜小胞の塩基配列を得ることと、上記塩基配列を上記宿主細胞に由来するリファレンス配列にマップさせることと、上記マップされた領域のうち、検出頻度が基準を超える頻出領域を選択することと、上記頻出領域をクエリー配列として相同性検索を行い、検出された上記宿主細胞以外に由来する相同配列との類似性が基準よりも低い上記頻出領域をバイオマーカー候補配列として選択することと、上記バイオマーカー候補配列を、上記相同配列にアラインメントして、配列保存性が基準よりも低い領域を検出し、これをバイオマーカー配列とすることと、を含む、バイオマーカー配列の探索方法。
 [13] 上記リファレンス配列が、上記宿主細胞のゲノム配列、又は、上記宿主細胞に感染したウイルス由来の核酸配列である、[12]に記載のバイオマーカー配列の探索方法。
 [14] 上記膜小胞の塩基配列を得ることの前に、対象から採取された生物学的試料から上記膜小胞を分離取得すること、を更に含む、[12]又は[13]に記載のバイオマーカー配列の探索方法。
 生物学的試料に含まれる膜小胞の種類や量は、その生物学的試料が採取された対象の身体状態を反映している可能性が高い。つまり、対象がある疾病にり患していれば、その疾病や進行の具合に応じた膜小胞が生物学的試料に含まれている可能性が高い。このような生物学的試料から分離取得された膜小胞を用いて探索されたバイオマーカー配列は、対象の身体状態(り患している疾病の種類や進行の具合)の診断のためのマーカーとしてより有用である。
 [15] 上記生物学的試料が、唾液、血液、血清、血しょう、バフィーコート、リンパ液、間質液、体腔液、消化液、汗、尿、鼻汁、涙液、精液、膣液、羊水、乳汁、喀痰、手術洗浄液、糞便、並びに、皮膚又は身体粘膜の拭い液、及び、スワブからなる群より選択される少なくとも1種である、[12]に記載のバイオマーカー配列の探索方法。
 生物学的試料が上記から選択される場合、生物学的試料中に膜小胞が含まれる可能性がより高い。また、対象が何らかの疾病にり患している場合、上記の種類の生物学的試料に、その疾病に特有の膜小胞が含まれる可能性がより高い。そのため、生物学的試料が上記から選択される場合、得られるバイオマーカー配列は、リキッドバイオプシー方法により好ましく適用できる。
 [16] 上記バイオマーカー候補配列の選択が、上記相同配列へのアラインメントスコアが最小となった配列を選択することである、[12]~[15]のいずれかに記載のバイオマーカー配列の探索方法。
 [17] 上記頻出領域が、タンパク質コード領域である、[12]~[16]のいずれかに記載のバイオマーカー配列の探索方法。
 [18] 上記検出頻度の基準が、統計的検定の有意水準に基づいて予め定められた基準である、[12]~[17]のいずれかに記載のバイオマーカー配列の探索方法。
 [19] 宿主細胞が産生した膜小胞の塩基配列を得るための塩基配列解析装置と、上記塩基配列の一部であるバイオマーカー配列を1つの増幅産物に含むように設計されたプライマーを用いて、定量ポリメラーゼ連鎖反応によって、生物学的試料における上記膜小胞を検出するための定量PCR装置と、制御装置と、を有し、上記制御装置は、上記塩基配列解析装置によって取得された上記塩基配列を上記宿主細胞に由来するリファレンス配列にマップさせるマップ部と、上記マップされた領域のうち、検出頻度が基準を超える頻出領域を選択する頻出領域選択部と、上記頻出領域をクエリー配列として、相同性検索を行い、検出された上記宿主細胞以外に由来する相同配列との類似性が基準よりも低い上記頻出領域をバイオマーカー候補配列として選択するバイオマーカー候補配列選択部と、上記バイオマーカー候補配列を、上記相同配列にアラインメントして、配列保存性が基準よりも低い領域を検出し、上記バイオマーカー配列とするバイオマーカー配列決定部と、を有する、膜小胞検出装置。
 [20] 塩基配列解析装置と、定量PCR装置と、コンピュータである制御装置と、を有する膜小胞検出装置の上記制御装置に、上記塩基配列解析装置を制御して、宿主細胞が産生した膜小胞の塩基配列を得る段階と、上記塩基配列を上記宿主細胞に由来するリファレンス配列にマップさせる段階と、上記マップされた領域のうち、検出頻度が基準を超える頻出領域を選択する段階と、上記頻出領域をクエリー配列として、相同性検索を行い、検出された上記宿主細胞以外に由来する相同配列との類似性が基準よりも低い上記頻出領域をバイオマーカー候補配列として選択する段階と、上記バイオマーカー候補配列を、上記相同配列にアラインメントして、配列保存性が基準よりも低い領域を検出し、これをバイオマーカー配列とする段階と、上記定量PCR装置を制御して、上記バイオマーカー配列を1つの増幅産物に含むように設計されたプライマーを用いて、定量的ポリメラーゼ連鎖反応によって、生物学的試料における上記膜小胞を検出する段階と、を実行させるプログラム。
 [21] 宿主細胞が産生した膜小胞の塩基配列を得るための塩基配列解析装置と、制御装置と、を有し、上記制御装置は、上記塩基配列を上記宿主細胞に由来するリファレンス配列にマップさせるマップ部と、上記マップされた領域のうち、検出頻度が基準を超える頻出領域を選択する頻出領域選択部と、上記頻出領域をクエリー配列として、相同性検索を行い、検出された上記宿主細胞以外に由来する相同配列との類似性が基準よりも低い上記頻出領域をバイオマーカー候補配列として選択するバイオマーカー候補配列選択部と、上記バイオマーカー候補配列を、上記相同配列にアラインメントして、配列保存性が基準よりも低い領域を検出し、これをバイオマーカー配列とするバイオマーカー配列決定部と、を有する、バイオマーカー配列探索装置。
 [22] 塩基配列解析装置と、コンピュータである制御装置と、を有するバイオマーカー配列探索装置の上記制御装置に、上記塩基配列解析装置を制御して、宿主細胞が産生した膜小胞の塩基配列を得る段階と、上記塩基配列を上記宿主細胞に由来するリファレンス配列にマップさせる段階と、上記マップされた領域のうち、検出頻度が基準を超える頻出領域を選択する段階と、上記頻出領域をクエリー配列として、相同性検索を行い、検出された上記宿主細胞以外に由来する相同配列との類似性が基準よりも低い上記頻出領域をバイオマーカー候補配列として選択する段階と、上記バイオマーカー候補配列を、上記相同配列にアラインメントして、配列保存性が基準よりも低い領域を検出し、これをバイオマーカー配列とする段階と、を実行させるプログラム。
 [23] バイオマーカー配列を探索するコンピュータであって、宿主細胞が産生した膜小胞の塩基配列を上記宿主細胞に由来するリファレンス配列にマップさせるマップ部と、上記マップされた領域のうち、検出頻度が基準を超える頻出領域を選択する頻出領域選択部と、上記頻出領域をクエリー配列として、相同性検索を行い、検出された上記宿主細胞以外に由来する相同配列との類似性が基準よりも低い上記頻出領域をバイオマーカー候補配列として選択するバイオマーカー候補配列選択部と、上記バイオマーカー候補配列を、上記相同配列にアラインメントして、配列保存性が基準よりも低い領域を検出し、上記バイオマーカー配列とするバイオマーカー配列決定部と、を有するコンピュータ。
 [24] コンピュータに、宿主細胞が産生した膜小胞の塩基配列を上記宿主細胞に由来するリファレンス配列にマップさせる段階と、上記マップされた領域のうち、検出頻度が基準を超える頻出領域を選択する段階と、上記頻出領域をクエリー配列として相同性検索を行い、検出された上記宿主細胞以外に由来する相同配列との類似性が基準よりも低い上記頻出領域をバイオマーカー候補配列として選択する段階と、上記バイオマーカー候補配列を、上記相同配列にアラインメントして、配列保存性が基準よりも低い領域を検出し、これをバイオマーカー配列とする段階と、を実行させるプログラム。
 [25] 疾病の患者から採取された第1の生物学的試料から得られた、第1の膜小胞の塩基配列と、既知の細胞の塩基配列又は既知のウイルスのゲノム配列とを比較して、上記第1の膜小胞の宿主細胞である、宿主細胞Aを決定することと、健常者から採取された第2の生物学的試料から得られた、第2の膜小胞の塩基配列と、既知の細胞の塩基配列又は既知のウイルスのゲノム配列とを比較して、上記第2の膜小胞の宿主細胞である、宿主細胞Bを決定することと、上記宿主細胞Aと、上記宿主細胞Bとの比較により、上記第1の生物学的試料における存在量比が大きい上記宿主細胞である、宿主細胞Cを特定することと、上記宿主細胞Cが産生した膜小胞の塩基配列を上記宿主細胞Cに由来するリファレンス配列にマップさせることと、上記マップされた領域のうち、検出頻度が基準を超える頻出領域を選択することと、上記頻出領域をクエリー配列として相同性検索を行い、検出された上記宿主細胞C以外に由来する相同配列との類似性が、基準よりも低い上記頻出領域をバイオマーカー候補配列として選択することと、上記バイオマーカー候補配列を、上記相同配列にアラインメントして、配列保存性が基準よりも低い領域を検出し、これを疾病バイオマーカーとすることと、を含む疾病バイオマーカーの探索方法。
 上記疾病バイオマーカーの探索方法によれば、対象の疾病の患者から取得された生物学的試料の含まれる膜小胞に特異的な配列を特定できる。上記方法により特定された疾病バイオマーカーは、リキッドバイオプシー等の体外診断に利用できる。
 [26] 上記宿主細胞Bのうち、上記宿主細胞Cの近縁種である宿主細胞Dを選択することと、上記宿主細胞Dに由来する膜小胞の塩基配列又はその断片を、上記リファレンス配列にマップさせることと、上記マップされた領域を上記バイオマーカー候補配列から除外することと、を更に含む、[25]に記載の疾病バイオマーカーの探索方法。
 上記疾病バイオマーカーの探索方法では、健常者から採取された生物学的試料に含まる膜小胞に由来する配列領域が、バイオマーカー候補配列から除外されるため、得られる疾病バイオマーカーの特異性がより向上する。
 本発明によれば、生物学的試料における膜小胞を簡便に定量できる、膜小胞の検出方法が提供できる。また、本発明によれば、バイオマーカー配列の探索方法、膜小胞検出装置、バイオマーカー配列探索装置、プログラム、コンピュータ、及び、疾病バイオマーカーも提供できる。
本発明の膜小胞の検出方法において用いられるバイオマーカー配列の探索方法のフローチャートである。 本発明の膜小胞の検出方法の具体的な手順を示すフローチャートである。 本発明の膜小胞の検出方法の他の実施の形態(変形例)における膜小胞の検出方法のフローチャートである。 本発明の膜小胞検出装置の実施形態におけるハードウェア構成図である。 本発明の膜小胞検出装置の実施形態における機能ブロック図である。 膜小胞検出装置の制御装置の動作フローである。 膜小胞検出装置の第2の実施形態におけるハードウェア構成図である。 膜小胞検出装置の第2の実施形態における機能ブロック図である。 膜小胞検出装置の第2の実施形態における動作フロー図である。 本発明のバイオマーカー配列探索装置の実施形態におけるハードウェア構成図である。 本発明のバイオマーカー配列探索装置の実施形態における機能ブロック図である。 本発明のバイオマーカー配列探索装置の実施形態における動作フロー図である。 本発明のコンピュータの実施形態におけるハードウェア構成図である。 本発明のコンピュータの実施形態における機能ブロック図である。 本発明のコンピュータの実施形態におけるプロセッサによるバイオマーカー配列の探索処理のフロー図である。 膜小胞粒子内の塩基配列を参照配列にマップした結果である。 図16における縦軸を膜小胞粒子数から、「検出頻度」すなわち、その領域の配列を有していた膜小胞粒子数の合計に変更した結果である。 スクリーニングされた頻出領域をクエリーとして相同性検索を行い、マッチしたデータベース上の各タンパク質配列情報にタグ付けされている機能情報を、解析アルゴリズムによって抽出し、統計的に有意に高頻度で検出された遺伝子機能を検出した結果の一覧である。 本発明の疾病バイオマーカーの探索方法のフロー図である。 健常者サンプルと、歯周病患者サンプル内の膜小胞の塩基配列のプロファイルの比較結果である(細菌由来)。 健常者サンプルと、歯周病患者サンプル内の膜小胞の塩基配列のプロファイルの比較結果である(ウイルス由来)。 歯周病患者に特異的に検出される領域(バイオマーカー配列)の決定手順を表す図である。 歯周病患者に特異的に検出される領域(バイオマーカー配列)の決定手順を表す図である。
 以下、本発明について詳細に説明する。
 以下に記載する構成要件の説明は、本発明の代表的な実施形態に基づいてなされることがあるが、本発明はそのような実施形態に制限されるものではない。
 なお、本明細書において、「~」を用いて表される数値範囲は、「~」の前後に記載される数値を下限値及び上限値として含む範囲を意味する。
[用語の説明]
 本明細書において、「核酸」「ポリヌクレオチド」は、リボヌクレオチド又はデオキシリボヌクレオチドのいずれかの、任意の長さのヌクレオチドのポリマー形態を指す。この用語は上記分子の一次構造のみを指す。従って、この用語は二本鎖と一本鎖のDNA、及び、RNAを含む。
 本明細書における「膜小胞」は、一形態として、宿主細胞の細胞膜の一部が菌体外にくびり取られるようにして産生されたマイクロベシクルである「外膜小胞(OMV;outer membrane vesicle)」を指す。その大きさは、特に制限されないが、10~1000nmである場合が多く、グラム陰性細菌では10~300nmであることが多く、グラム陽性細菌では50~150nmであることが多い。
 また、「膜小胞」には、宿主細菌により産生される外膜小胞、動物細胞によりエンドサイトーシス経路により産生、放出される「エクソソーム」、及び、アポトーシスによって生ずる「アポトーシス小体」も含まれる。
 本明細書において「宿主細胞」とは、分析対象となる膜小胞を産生した細胞を意味し、例えば、「宿主細菌」という場合には、分析対象となる膜小胞を産生した細菌を意味する。宿主細胞としては特に制限されず、原核細胞、真核細胞、又は、古細菌のいずれの細胞であってもよく、特に限定されない。例えば、細菌、古細菌、酵母、植物細胞、昆虫細胞、及び、動物細胞(例えば、ヒト細胞、非ヒト細胞、非哺乳動物脊椎動物細胞、及び、無脊椎動物細胞等)等が挙げられる。
 また、宿主細胞はウイルス感染した状態であってもよい。このような宿主細胞から産生される膜小胞には、ウイルス由来の塩基配列(例えば、ウイルス由来のDNA)が含まれることがある。本明細書では、宿主細胞、及び、ウイルスに感染した宿主細胞を区別せず、単に「宿主細胞」という。一般に、ウイルスが感染する細胞は、「宿主」と呼ばれることがあるが、本明細書においては、「宿主」は、膜小胞を産生した(する)細胞を一貫して意味し、ウイルスの感染の有無を区別せずに「宿主細胞」ということとする。
 本明細書において「膜小胞の検出」とは、少なくとも膜小胞の存否の判定を意味し、膜小胞の定量を含むことが好ましい。
 本明細書において、「単一粒子解析」とは、細胞(細菌)、及び、膜小胞等を1個体ずつ分離してその塩基配列を解析する方法を意味し、「シングルセル解析」等とも称される方法を意味する。
 本明細書において、「生物学的試料」とは、核酸、及び、タンパク質等の生物学的物質を含み得る検体を意味する。一形態として、生物学的試料は、対象からの採取された体液等を含む。生物学的試料は対象の体内の任意の場所、例えば末梢位置から単離された液体又は固体であってよい。
 生物学的試料の例としては、唾液、血液、血清、血しょう、バフィーコート、リンパ液、間質液、体腔液、消化液、汗、尿、鼻汁、涙液、精液、膣液、羊水、乳汁、喀痰、手術洗浄液、糞便、並びに、皮膚又は身体粘膜の拭い液、及び、スワブ等、又は、これらの組み合わせが挙げられ、一形態として、唾液が好ましい。
 本発明の膜小胞の検出方法の優れた特徴点の一つとして、生物学的試料の量が少なくても(すなわち、含まれる膜小胞の量が少なくても)正確な検査結果(膜小胞の存否、及び、膜小胞の量)が得られるという点がある。この観点から、膜小胞の検出のために必要な生物学的試料の量は、少量でもよい。
 膜小胞の核酸成分を分析することで検体中の膜小胞の存否を判別する方法では、検体中において一定程度の膜小胞の量が必要で、それも特定の種類の膜小胞がそれぞれ一定程度の量が必要で、結果として、多量の検体を必要としていた。
 詳しくは後述するが、本発明の膜小胞の検出方法は、膜小胞における頻出領域の一部をバイオマーカー配列として選択し、それを定量PCR(qPCR、PCRは、「Polymerase Chain Reaction」の略)によって定量するという特徴を有する。そのため、生物学的試料中に含まれる膜小胞の量は従来の方法よりも格段に少なくて済む。
 具体的には、生物学的試料は、0.01~30mLであってよい。この量は、生物学的試料の種類にも影響を受け、例えば、血清、血しょうであれば、0.01~5mLであってよく、尿であれば、1~30mLであってよい。
 本明細書において、「対象」とは、ヒト又は動物を意味する。一形態として、対象は、特定の宿主細胞の存在が発症、及び、進行等に関連する、又は、関連すると予想される疾病(以下、「特定疾病」ともいう)を持つヒト又は動物であることが好ましい。特定疾病を有するヒト又は動物を対象とすることにより、検出される膜小胞の量によって、上記特定疾病の進行状態等を判断するための情報を提供できることがある。
 なお、「特定疾病」としては特に限定されないが、細菌、及び/又は、ウイルス感染症が好ましく、歯周病がより好ましい。
[膜小胞の検出方法]
 次に、本発明の膜小胞の検出方法について説明する。
 本発明の膜小胞の検出方法の第1の実施形態は、宿主細胞が産生した膜小胞の塩基配列の一部であるバイオマーカー配列を1つの増幅産物に含むように設計されたプライマーを用いて、定量ポリメラーゼ連鎖反応によって、生物学的試料における上記膜小胞を検出することを含み、上記バイオマーカー配列は、以下の手順;上記宿主細胞が産生した上記膜小胞の塩基配列を得ること、上記塩基配列を上記宿主細胞に由来するリファレンス配列にマップさせること、上記マップされた領域のうち、検出頻度が基準を超える頻出領域を選択すること、上記頻出領域をクエリー配列として相同性検索を行い、検出された上記宿主細胞以外に由来する相同配列との類似性が基準よりも低い上記頻出領域をバイオマーカー候補配列として選択すること、上記バイオマーカー候補配列を、上記相同配列にアラインメントして、配列保存性が基準よりも低い領域を検出し、これを上記バイオマーカー配列とすること、によって選択されたものである、膜小胞の検出方法である。
 まず、本方法において用いられるバイオマーカー配列について説明する。
 図1は、本方法に用いられるバイオマーカー配列の探索方法のフローチャートである。
 まず、ステップS11において、対象から生物学的試料が採取される。このとき、対象が特定疾病を有していると(対象が特定疾病の患者だと)、得られる生物学的試料には、宿主細胞(典型的には宿主細菌、又は、ウイルス感染した宿主細胞)が産生し得る膜小胞のうち、特定疾病の進行等に関連が深い膜小胞が含まれる可能性が高い。
 図1に示したフローによってバイオマーカー配列を探索する際、特定疾病を有する対象の生物学的試料を採取して使用することは、特定疾病に関連する可能性の高い膜小胞の存否や量を検出するためのバイオマーカー配列が取得できるという点で優れている。
 一般に、ある宿主細胞が産生する膜小胞の種類は、その生育環境等に応じて、種類やその量が変わる場合があると考えられているが、ある宿主細胞がどのような条件でどのような種類の膜小胞を産生するのかは、依然として不明な点も多い。
 一方で、特定疾病を有する対象の生物学的試料から分離取得された膜小胞の中には、特定疾病の進行等に関連する膜小胞が含まれる可能性が高い。
 図1に示したフローに従って、複数の膜小胞の全体から頻出の配列領域を選択し、ここから選び出されたバイオマーカー配列を、膜小胞の検出に用いる点に、本発明の特徴の一つがある。本発明の膜小胞の検出方法によれば、個々の膜小胞の発現条件や機能が不明だったとしても、生物学的試料に含まれるバイオマーカー配列に対応する特定の膜小胞を検出できる。これは、本方法によって、膜小胞が特定の疾病の進行度合い等を判断するためのマーカーとして利用できる可能性を示している。本発明の膜小胞の検出方法は、リキッドバイオプシー方法として使用できる。この点は、後段の実施例で具体的に説明する。
 一方で、本探索方法は、ステップS11を有していなくてもよい。その場合、生物学的試料は、典型的には宿主細胞を含む細胞群、又は、宿主細胞の培養液等であってよい。この場合、ステップS11を省略し、後段のステップS12を実施すればよい。
 次に、ステップS12において、生物学的試料から膜小胞が分離取得される。生物学的試料から膜小胞を分離取得することにより、膜小胞に由来する(言い換えれば、膜小胞内部の)塩基配列をより正確に取得しやすくなる。
 既に申し述べたとおり、膜小胞の(膜小胞に由来する)核酸は、特定疾病を選択的に分析するための指標になる可能性が高い。これを、分離操作なしに生物学的試料から直接抽出しようとすると、例えば、膜小胞以外の核酸分子が混入してしまうこともあり、膜小胞に由来する核酸の収率や完全性が損なわれ易い。
 また、膜小胞を分離取得することは、核酸を濃縮することにもつながり、検出感度の向上にも寄与し、同時に、後工程(例えば増幅反応)を阻害するような汚染物質等を除去する作用もあり、好ましい。
 生物学的試料から膜小胞を分離取得する方法としては特に制限されず、公知の方法が適宜使用できる。具体的な方法としては、例えば、特表2019-513391号公報の0076段落等に記載されている。
 例えば、宿主細胞が細菌である場合であって、生物学的試料が宿主細菌を含む、(又は、含まない)細菌群と、膜小胞とを含む懸濁液である場合に、膜小胞を分離取得する方法の一例を説明する。まず、遠心分離によって、懸濁液から菌体を取り除くことにより粗分離できる。
 次に、分離した遠心上清をメンブランフィルター(例えば、孔径0.1~0.9μm)を用いてろ過すれば、上清に残留する菌体を容易に除去することができる。
 遠心上清には、細菌体以外にもタンパク質等の夾雑物質が含まれている場合があるので、例えば、100~200kDaカットオフフィルタで濃縮した後、超遠心によって膜小胞を沈殿させて回収する方法も使用できる。
 また、このようにして得られた沈殿物には、細菌群等の構造体(例えば、せん毛、及び、べん毛等)が含まれていることがあり、これらを除去するために、例えば、スクロース等を用いた密度勾配遠心法を用いて、更に精製する方法を用いてもよい。
 また、本発明者らは、膜小胞の表面には、膜小胞に由来しない核酸成分が付着している場合が多いことを知見している。そこで、分離取得された膜小胞に更に核酸分解酵素を作用させ、これらの核酸成分を分解してもよい。このような酵素としては、公知のものを使用でき、例えば、デオキシリボヌクレアーゼ等が挙げられる。
 より具体的に、単一細胞株の培養液から膜小胞を分離取得する方法について説明する。
 まず、所定の条件で所望の増殖相が達成されたら、培養液を容量が1~100mLの遠心管に入れ、3000~9000rpm、1~20℃で、1~30分間遠心する。
 上清と沈殿物とに分離できたら沈殿物を廃棄し、上清を0.1~0.9μmのフィルターに通し、別の遠心管に収容し、1~10℃で保存する。
 次に、上清を超遠心チューブに加え、例えば、遠心力として150,000~300,000×gで、1~10℃で1~3時間超遠心する。超遠心後、上清を破棄し、沈殿した膜小胞(OMV)を緩衝液(例えば、pH7.4のPBSバッファー)に再懸濁し、1~10℃で保存する。更に、この超遠心の工程を複数回繰り返してもよい。
 この懸濁液に対して、デオキシリボヌクレアーゼ(DNase)を加えて、膜小胞に付着した核酸を分解処理してもよい。デオキシリボヌクレアーゼ処理を行うことで、夾雑物質(核酸成分)の混入が抑制されるため、より精度の高い測定ができる。
 デオキシリボヌクレアーゼの添加量としては特に制限されないが、例えば、上記懸濁液の10μLを10倍希釈して、そこへ2μLのDNase(2000U)を添加する方法が挙げられる。
 また、懸濁液の単位量あたりに含まれる膜小胞の数(濃度)を調整するために、懸濁液を希釈してもよい。懸濁液を希釈して、膜小胞の濃度を調整することで、1つの液滴に膜小胞の2つ以上が封入される可能性がより低くなる。言い換えれば、より確実に1個体ずつを液滴中に封入しやすくなる。
 懸濁液の希釈の方法としては特に制限されないが、例えば、膜小胞の濃度を動的光散乱法等により懸濁液中の膜小胞の濃度を観察しながら、適当な濃度に希釈する方法が挙げられる。
 膜小胞の濃度の観察方法としては、粒子にレーザを照射し、その散乱光から各粒子のブラウン運動を追跡し(トラッキング法)、その拡散速度から、Stokes-Einsteinの式に基づき粒子の径と個数とを計算する方法が好ましい。
 次に、ステップS13において、分離取得された膜小胞の(膜小胞に由来する)塩基配列を得る。膜小胞に由来する塩基配列を取得する方法は特に制限されず、公知の方法が適用できる。
 典型的には、膜小胞を溶解させて、ポリヌクレオチドを抽出し、その後、必要に応じて増幅操作を行い、ライブラリ調製、シークエンス、及び、解析を行い、塩基配列を取得すればよい。
 この際、膜小胞の塩基配列を得る方法は特に制限されず、単一粒子解析、及び、ショットガンメタゲノム解析等の公知の方法が使用できる。
 次に、ステップS14において、取得された塩基配列を宿主細胞に由来するリファレンス配列にマップ(マッピング)させる。マッピングは、公知のマッピングソフトウエアを用いて行うことができる。このようなソフトウェアとしては、「Bowtie2」、「BWA」等が挙げられる。
 取得された塩基配列のリファレンス配列への一致度としては特に制限されないが、ソフトウェアによって(例えばSAMファイルとして)提供されるマッピングクオリティスコアの最大値を100%としたとき、80%以上であることが好ましく、90%以上であることがより好ましく、95%以上であることが更に好ましい。
 リファレンス配列としては、例えば、宿主細胞のゲノム配列、又は、宿主細胞に感染したウイルス由来の核酸配列であることが好ましい。なお、ウイルス由来の核酸配列は、ウイルスゲノム(DNA又はRNA)であってもよい。
 なお、生物学的試料を対象から取得した場合、その生物学的試料から分離取得された膜小胞の宿主細胞は未知である場合もある。一方、宿主細胞の培養液等から分離取得された膜小胞であれば、宿主細胞は既知である。
 宿主細胞が未知である場合、公共データベース等に収録された宿主細胞のゲノムの塩基配列、及び/又は、ウイルスのゲノム配列をリファレンス配列としてマッピングを行えばよい。これにより、マップされた(一形態として、一致度の最も高い)配列領域をゲノムに有する細胞が宿主細胞であるか、又は、マップされた配列領域をゲノムに有するウイルス、に感染した細胞が宿主細胞であると判断することができる。
 使用できるデータベースの例としては、NCBI RefSeq、NCBI GenBank、UCSC Genome Browser、GRCh37 reference primary assembly、及び、JRGv2等が挙げられる。
 一方、宿主細胞が既知である場合、それに由来する塩基配列をリファレンス配列とすればよい。この場合、宿主細胞のゲノム配列、ウイルスゲノムの配列を上述のデータベースから取得してもよい。
 他の形態として、生物学的試料に宿主細胞が含まれている場合は、生物学的試料から膜小胞を分離取得した後の残さ(残渣)から、ポリヌクレオチドを抽出し、その塩基配列を解析して、リファレンス配列としてもよい。この場合、上記リファレンス配列には、宿主細胞のゲノム配列以外の配列が含まれている可能性もあるが、本探索方法においては、リファレンス配列には宿主細胞のゲノムの塩基配列、及び/又は、ウイルス由来の配列が含まれていればよく、他の塩基配列が含まれていても後の工程には影響は殆どない。リファレンス配列として公共データベースを用いた場合と同様で、膜小胞の塩基配列は高い一致度で宿主細胞のゲノム配列(又は宿主細胞に感染したウイルスのゲノム配列)にマップされるからである。
 また、マッピングは、所定の単位を基準として実施してもよい。例えば、膜小胞内部の塩基配列のうちタンパク質コード領域を単位としてマッピングを実施してもよい。
 この場合、膜小胞に由来する塩基配列について、例えば、ゲノムアノテーションのためのソフトウェアツールである「prokka」等を用いてタンパク質コード領域を予測・検出し、各領域について、宿主細胞のゲノムの塩基配列をリファレンスとして相同性検索を行い、マッピングを行えばよい。
 次に、ステップS15として、マップされた領域のうち、検出頻度が基準を超える頻出領域が選択される。頻出領域の選択の方法は特に制限されないが、例えば、膜小胞に由来する塩基配列を単一粒子解析で個別に得た場合、各膜小胞、宿主細胞のゲノム配列のうち、マップされた領域ごとに、その領域の配列を有していた膜小胞の数を積算し、領域ごとの検出頻度とすればよい。
 一方、生物学的試料から分離取得した膜小胞を個々に分離することなく、ショットガンメタゲノム解析等により塩基配列を取得した場合には、マップされた領域ごとに、その領域の配列を有していたシークエンスリードの数を積算する等して求めればよい。
 ステップS14において、タンパク質コード領域を基準としてマッピングを行っていた場合、上記領域は、タンパク質コード配列としてもよい。すなわち、タンパク質コード配列ごとに、検出頻度を計算してもよい。
 検出頻度の基準は、リファレンス配列において膜小胞に由来する塩基配列がマップした各領域において、頻出である領域が判別できれば、特に制限されないが、一実施形態として、上記基準は、統計的検定の有意水準に基づいて予め定められたものであることが好ましい。
 例えば、タンパク質コード領域を単位としてマッピングした場合には、対象となるタンパク質コード領域の検出頻度が、他のタンパク質コード領域の検出頻度と同等であるかについて、統計的検定を行う。この統計的検定により得られた有意確率(p値)を、予め定められた有意水準と比較する。この場合、有意水準を0.01等として予め設定しておき、p値がこの値未満である場合、「基準を超えて頻出」と判定することができる。
 次に、ステップS16として、頻出領域をクエリー配列として、相同性検索を行い、検出された宿主細胞以外に由来する相同配列との類似性が基準よりも低い頻出領域をバイオマーカー候補配列として選択する。
 頻出領域は、宿主細胞から産生された膜小胞に由来する塩基配列のうち、検出頻度が特異的に高い領域である。この頻出領域のうちで宿主細胞に特異的なものを選択し、バイオマーカー候補配列とする。
 ここで、各配列の塩基長について説明すると、膜小胞の塩基配列は、一形態として、数千~数万bp、頻出領域は、マッピングの方法等により異なるが、膜小胞の塩基配列よりは短く、バイオマーカー配列は、更に短く、一形態として、50~250bpである。
 なお、バイオマーカー候補配列の塩基長は、頻出領域から選択されるため、一形態として、頻出領域と同等であってよい。一形態として1000bp以上である。
 相同性検索の方法としては特に制限されないが、すでに説明した公共データベースの各細胞のゲノムの配列をリファレンスとすることが好ましい。相同性検索に使用するソフトウェアツールとしては特に制限されず、公知のものを使用することができ、これに限定されるものではないが、「diamond」等が利用できる。
 バイオマーカー候補配列は、相同配列との間で類似性が低いことが好ましい。類似性が低いことで、バイオマーカー配列が発見できる可能性がより高まる。
 このようなバイオマーカー候補配列を選択する方法の一形態として、各頻出領域について、相同性検索で検出された相同配列にアラインメントしたとき、そのアラインメントスコアが最小となったものをバイオマーカー候補配列とする方法が挙げられる。なお、上記相同配列からは、宿主細胞に由来する配列は除かれる。
 一形態について説明すれば、検出した相同配列(宿主細胞に由来するものを除く)をアラインメントスコアの高い順に並べたとき、順位の高い相同配列について、そのアラインメントスコアを合計し、それを指標とする方法が挙げられる。
 その指標を、各頻出領域について比較し、所定の基準に合致する頻出領域をバイオマーカー候補配列とすればよい。
 所定の基準としては、例えば、スコアの順位が挙げられる。具体的には、各頻出領域の相同配列へのアラインメントスコア(又は、アラインメントスコアが高い方から順に一定の順位までのアラインメントスコアの合計値)を小さい順に並べたとき、所定の順位までの頻出領域をバイオマーカー候補配列とする等が挙げられる。
 このようにして選択されたバイオマーカー候補配列は、膜小胞に由来する塩基配列に対して、有意に検出頻度が高く、リファレンスに対して類似性が低い領域(配列)である。
 次に、ステップS17として、バイオマーカー候補配列を、上記相同配列にアラインメントして、配列保存性が基準よりも低い領域を検出し、これをバイオマーカー配列とする。
 バイオマーカー候補配列を(宿主細胞以外に由来する)相同配列にアラインメントすることで、配列保存性の特に低い領域(具体的には、50~250bp程度)を検出して、これをバイオマーカー配列とする。
 アラインメントに使用するアルゴリズムは特に制限されず、「BLAST」、「ClustalW」、「Kalign」、「MAFFT」、「MUSCLE」、及び、「T-Coffee」等が挙げられ、いずれも公知である。
 配列保存性の基準としては特に制限されないが、一形態として、相同配列をマルチプルアラインメントした場合に、配列上の位置ごとに、ATGCの4塩基の出現頻度に基づくエントロピーを計算し、これを配列保存度として用いる方法が挙げられる。
 連続する50~250塩基に対してこの値を計算し、その平均が所定の範囲以上を超えた場合に、その領域をバイオマーカー配列とする形態が挙げられる。
 このように決定されたバイオマーカー配列は、生物学的試料における膜小胞の塩基配列のうち、高頻度に検出され、かつ、宿主細胞に特異的な領域であるので、このバイオマーカー配列を定量することで、生物学的試料中における膜小胞の量を定量することができる。
 また、生物学的試料が対象から採取された場合、対象を適切に選択することで(例えば、特定の疾病の罹患者等)、その対象の身体、及び、疾病の進行状況の指標となり得る膜小胞を、上記バイオマーカー配列によって検出できるため、リキッドバイオプシー方法に応用可能である。
 次に、上記バイオマーカー配列を用いて、生物学的試料における膜小胞を検出する方法について説明する。図2は、本発明の膜小胞の検出方法の具体的な手順を示すフローチャートである。
 図2において、ステップS11~ステップS17はすでに説明したバイオマーカー配列の探索方法と同様のため、説明を省略する。
 膜小胞の検出方法は、ステップS17で選択されたバイオマーカー配列の情報をもとに、ステップS18として、バイオマーカー配列を1つの増幅産物に含むように設計されたプライマー(対)を用いて定量PCRによって膜小胞を検出する工程を有する。
 なお、ステップS18は、更に、逆転写の工程を有していてもよく、定量PCRは、定量的逆転写PCRであってもよい。
 定量PCRによって増幅した標的配列は、典型的には蛍光色素を用いて検出することができる。その方法には、少なくとも2種の一般的な方法が存在する。1つの方法は、二本鎖DNAに結合する蛍光色素(例えば「SYBR Green I」(商品名)、「TB Green(商品名)」等)を使用するものである。
 PCRによる増幅産物の蓄積によって、この増幅産物により多くの色素が結合し、増幅産物の生成量に比例して蛍光シグナル出力が増加する。
 第2の方法は、オリゴヌクレオチドである蛍光発生プローブであって、5′末端、及び、3′末端にそれぞれ蛍光レポーター色素、及び、クエンチャー色素を含むように修飾された蛍光発生プローブを使用するものである。蛍光プローブは、増幅産物の生成量に比例した蛍光シグナルを放出する。
 蛍光色素としては、「6-FAM」、「HEX」、「TET」、「TAMRA」、「JOE」、「ROX」、「Cyanine 3」、「Cyanine 5」、「Cyanine 5.5」、「Cal Fluor Gold 540」、「Cal Fluor Orange 560」、「Cal Fluor Red 590」、「Quasar 570」、「Quasar 670」、「TxRd(Sulforhodamine 101-X)」(いずれも商品名)等が挙げられる。
 クエンチャー色素としては、「TAMRA」、「DABCYL dT」、「BHQ-1」、「BHQ-2」、「BHQ-3」、「OQ」、「Iowa Black FQ」、「Iowa Black RQ」(いずれも商品名)等が挙げられる。
 これらの2つの方法の違いは、前者が配列に関係なく全ての二本鎖DNA(例えば、非特異的な反応生成物)を検出するのに対して、後者の蛍光発生プローブアプローチは対象配列に特異的であるということである。本発明の膜小胞の検出方法には、いずれの方法も適用できる。
 定量PCRに用いるプライマー(対)の設計方法は特に制限されず、公知の方法を用いることがでる。特に、コンピュータにより処理されるアルゴリズムを用いることで容易に設計できる。このようなアルゴリズムとしては、「Primer-BLAST」、「DINAMelt」等が挙げられる。
 また、上記以外にも当業者にとって公知のガイドラインに従ってプライマーを選択することもできる。
 一形態として、定量PCR用のフォワードプライマーとリバースプライマーとはそれぞれ、18~25個の塩基長(好ましくは20~24個)であってもよく、Tmは57~61℃であってもよく、GC含有量は40~60%であってもよい。
 増幅産物(増幅産物)の塩基長は特に制限されないが、一形態として、50~250bpが挙げられる。
 定量PCRにおいて、蛍光プローブを使用する場合、蛍光プローブのアニールする領域は、プライマーがアニールする領域と重複しないことが好ましく、プライマー対のアニールする領域の間の配列にアニールするように設計されることが好ましい。一形態として、フォワードプライマーの末端と、プローブの開始との間のヌクレオチドの距離は、0~60個の塩基対(bp)離れていることが好ましい。
 定量PCR用のプローブは、プライマーの融解温度を約5~10℃超える融解温度(Tm)を有していてもよく、この場合、熱サイクルが変性温度からアニール、及び、伸長温度へと下がると、蛍光プローブは、いずれかのプライマーがアニールする前に対象配列にアニールする。蛍光プローブのTmは、特に制限されないが、一形態として、55~80℃であってよい。
 プローブの塩基長は特に制限されないが、例えば、8~45bpであってよい。より具体的には、TaqManプローブであれば20~30個の塩基長であってもよい。
 PCRが進行すると、増幅産物の量が増加するに伴い、蛍光シグナル出力が比例的に増加する。生物学的試料中における膜小胞の量の測定は、まず、膜小胞の量が道である生物学的試料と、既知濃度のバイオマーカー配列を含むスタンダード試料の段階希釈とを使用するパラレルPCRによって実施できる。
 段階希釈試料から、バイオマーカー配列のコピー数と、バックグラウンドを超える蛍光が最初に検出されるサイクル数とを関連付ける標準曲線が得られる。
 生物学的試料のサイクルデータを決定して標準曲線と比較すれば、生物学的試料中のバイオマーカー配列(又はその相補的配列)のコピー数を算出できる。
 標準物質中のバイオマーカー配列の濃度(コピー数)を例えば、吸光度等により定量することによって、標準曲線から、生物学的試料中におけるバイオマーカー配列の濃度の絶対定量ができる。
 なお、本発明の膜小胞の検出方法の他の実施の形態(変形例)としては、上記ステップS17と、ステップS18との間に更に、バイオマーカー配列を1つのPCR増幅産物に含むようにプライマーを設計し、合成するステップS19を更に有していてもよい。プライマーの設計、合成方法は特に制限されず、既に述べたもののほか、公知の方法を用いることができ、後述する核酸自動合成装置を用いてもよい。図3は、上記変形例における膜小胞の検出方法のフローチャートである。
 このように、本方法によれば、生物学的試料における膜小胞を簡便に定量できる。
[膜小胞検出装置]
 次に、本発明の膜小胞検出装置について説明する。
 本発明の装置の第1の実施形態は、宿主細胞が産生した膜小胞の塩基配列を得るための塩基配列解析装置と、上記塩基配列の一部であるバイオマーカー配列を1つの増幅産物に含むように設計されたプライマーを用いて、定量的ポリメラーゼ連鎖反応によって、生物学的試料における上記膜小胞を検出するための定量PCR装置と、制御装置と、を有し、上記制御装置は、上記塩基配列解析装置によって取得された上記塩基配列を上記宿主細胞に由来するリファレンス配列にマップさせるマップ部と、上記マップされた領域のうち、検出頻度が基準を超える頻出領域を選択する頻出領域選択部と、上記頻出領域をクエリー配列として、相同性検索を行い、検出された上記宿主細胞以外に由来する相同配列との類似性が基準よりも低い上記頻出領域をバイオマーカー候補配列として選択するバイオマーカー候補配列選択部と、上記バイオマーカー候補配列を、上記相同配列にアラインメントして、配列保存性が基準よりも低い領域を検出し、上記バイオマーカー配列とするバイオマーカー配列決定部と、を有する、膜小胞検出装置である。
 上記装置について、図面を参照しながら詳述する。図4は本装置のハードウェア構成図である。
 膜小胞検出装置20は、塩基配列解析装置21と、定量PCR装置22と、制御装置23とを有しており、制御装置23により、塩基配列解析装置21と、定量PCR装置22を制御できるよう、各装置はバスを介して相互にデータを授受する。
 塩基配列解析装置21は、分離取得された膜小胞から、核酸の抽出、DNAの断片化、断片の鎖長選択、及び、増幅を実施できる前処理装置28と、配列解析を行うシークエンサ29とを備えている。
 制御装置23は、プロセッサ24、記憶デバイス25、表示デバイス26、及び、入力デバイス27を備えるコンピュータである。
 プロセッサ24は、例えば、マイクロプロセッサ、プロセッサコア、マルチプロセッサ、ASIC(application-specific integrated circuit)、FPGA(field programmable gate array)、及び、GPGPU(General-purpose computing on graphics processing units)等である。
 記憶デバイス25は、各種プログラム、及び、データを一時的に、及び/又は、非一時的に記憶する機能を有し、プロセッサ24の作業エリアを提供する。
 記憶デバイス25は、例えば、ROM(Read Only Memory)、RAM(Random Access Memory)、HDD(Hard Disk Drive)、フラッシュメモリ、及び、SSD(Solid State Drive)等である。
 表示デバイス26は、解析結果、検体名、及び、操作手順等を表示できる。表示デバイス26は、液晶ディスプレイ、及び、有機EL(Electro Luminescence)ディスプレイ等でよい。
 また、表示デバイス26は、入力デバイス27と一体として構成されていてもよい。この場合、表示デバイス26がタッチパネルディスプレイであって、GUI(Graphical User Interface)を提供する形態が挙げられる。
 入力デバイス27は、測定条件、及び、検体名等の入力を受け付け、また、膜小胞検出装置20への指示の入力を受け付けることができる。入力デバイス27は、キーボード、マウス、スキャナ、及び、タッチパネル等でよい。
 塩基配列解析装置21は、分離取得された膜小胞に由来する塩基配列を取得する装置である。塩基配列解析装置21は、分離取得された膜小胞の前処理を行う前処理装置28と、配列解析を行うシークエンサ29とを備えている。
 前処理装置28は、膜小胞からの核酸の抽出、必要に応じて逆転写、精製したDNA(又はcDNA)の断片化、シークエンサ29に適用するDNA鎖長の選択、及び、必要に応じたDNAの増幅を自動的に行うことができるように構成された装置であり、市販のものを本装置に組み込んで使うこともできる。このような前処理装置としては、ベックマン・コールター製の「Biomek」前処理システム、及び、アジレント製の「Bravo」NGS自動化システム等が挙げられる。なお、塩基配列解析装置21は、前処理装置28を有していなくてもよい。
 シークエンサ29としては、特に制限されず、公知の次世代シークエンサを特に制限なく使用できる。
 定量PCR装置は、膜小胞のバイオマーカー配列を1つの増幅産物に含むように設計されたプライマー(対)を用いて定量的ポリメラーゼ連鎖反応によって、生物学的試料における膜小胞を検出するための装置であり、公知のリアルタイムPCR装置が特に制限なく使用可能である。
 このような装置としては、例えば、アジレント製の「AriaMx」、アナリティクイエナ製の「qTOWER」、キアゲン製の「QIAquant」、及び、サーモフィッシャー製の「QuantStudio」等が挙げられる。
 図5は、本装置の機能ブロック図である。膜小胞検出装置20は、塩基配列解析装置21、定量PCR装置22、及び、制御装置23を備え、制御装置23は、マップ部31、頻出領域選択部32、バイオマーカー候補配列選択部33、及び、バイオマーカー配列決定部34を有している。
 マップ部31は、記憶デバイス25に記憶されたプログラムを制御装置23のプロセッサ24が実行して実現される機能である。マップ部31は、塩基配列解析装置21で取得された膜小胞の塩基配列を、入力デバイス27、又は、制御装置23が有する通信機能(図示しない)によってネットワークを介して公共データベース等から取得(35)された宿主細胞に由来するリファレンス配列(又はこれを含む配列の集合)にマップさせる。マップの方法については、本発明の膜小胞の検出方法においてすでに説明したとおりである。
 頻出領域選択部32は、記憶デバイス25に記憶されたプログラムを制御装置23のプロセッサ24が実行して実現される機能である。膜小胞に由来する塩基配列のうち、マップ部31によって、宿主細胞のゲノム配列にマップされた領域について、頻出領域選択部32によって、検出頻度が基準を超える頻出領域として選択される。検出頻度の基準については、予め設定され、記憶デバイス25に記憶されていてもよい。頻出領域の選択方法は、本発明の膜小胞の検出方法の第1の実施形態の説明において既に述べたとおりである。
 バイオマーカー候補配列選択部33は、記憶デバイス25に記憶されたプログラムを制御装置23のプロセッサ24が実行して実現される機能である。バイオマーカー候補配列選択部33は、頻出領域をクエリー配列として、入力デバイス27、又は、制御装置23が有する通信機能によってネットワークを介して公共データベース等から取得(36)された宿主細胞以外の細胞のゲノム配列をリファレンスとして、相同性検索を行い、検出された宿主細胞以外に由来する相同配列との類似性が基準よりも低い前記頻出領域をバイオマーカー候補配列として選択する。バイオマーカー候補配列の選択方法は、本発明の膜小胞の検出方法の第1の実施形態の説明において既に述べたとおりである。
 バイオマーカー配列決定部34は、記憶デバイス25に記憶されたプログラムを制御装置23のプロセッサ24が実行して実現される機能である。バイオマーカー配列決定部34は、バイオマーカー候補配列選択部33によって選択されたバイオマーカー候補配列について、上記相同配列にアラインメントして、配列保存性が基準よりも低い領域を検出し、これをバイオマーカー配列とする。バイオマーカー配列の決定方法は、本発明の膜小胞の検出方法の第1の実施形態の説明において既に述べたとおりである。
 定量PCR装置22は、バイオマーカー配列決定部34によって決定されたバイオマーカー配列(又はその相補的配列)を1つの増幅産物に含むように設計されたプライマーを用いて、生物学的試料における膜小胞を検出する。すなわち、バイオマーカー配列決定部34によって決定されたバイオマーカー配列の増幅を検出することによって、当初の生物学的試料におけるバイオマーカーの存否、及び/又は、量を測定する。
 次に、膜小胞検出装置の動作について説明する。図6は、膜小胞検出装置20の制御装置23の動作フローである。
 まず、制御装置23は、塩基配列解析装置21を制御して、宿主細胞が産生した膜小胞の塩基配列を得る(ステップS41)。
 具体的には、制御装置23はまず、前処理装置28を制御して、生物学的試料から膜小胞を分離取得させ、核酸成分の抽出等の前処理を実施する。次いで、制御装置23はシークエンサ29を制御して、膜小胞に由来する塩基配列を取得する。
 なお、膜小胞検出装置は前処理装置28を有していなくてもよく、この場合、前処理済みの検体について、シークエンサ29を制御して膜小胞に由来する塩基配列を取得する形態でもよい。
 次に、制御装置23は、マップ部31を制御し、塩基配列解析装置21によって得られた塩基配列を宿主細胞に由来するリファレンス配列にマップさせる(ステップS42)。一形態として、制御装置23は、公共データベース等から取得(35)された宿主細胞に由来するリファレンス配列に、膜小胞に由来する塩基配列をマッピングする。
 次に、制御装置23は、頻出領域選択部32を制御して、リファレンス配列にマップされた領域のうち、検出頻度が基準を超える頻出領域を選択する(ステップS43)。
 次に、制御装置23は、バイオマーカー候補配列選択部33を制御して、頻出領域選択部32によって選択された頻出領域をクエリー配列として、入力デバイス27、又は、制御装置23が有する通信機能によってネットワークを介して公共データベース等から取得(36)された宿主細胞以外に由来する配列に対して、相同性検索を行い、検出された宿主細胞以外に由来する相同配列との類似性が基準よりも低い頻出領域をバイオマーカー候補配列として選択する(ステップS44)。
 次に、制御装置23は、バイオマーカー配列決定部34を制御して、バイオマーカー候補配列選択部33によって選択されたバイオマーカー候補配列を、相同性検索により検出された宿主細胞以外に由来する相同配列にアラインメントして、配列保存性が基準よりも低い領域を検出し、これをバイオマーカー配列とする(ステップS45)。
 次に、制御装置23は、定量PCR装置22を制御して、バイオマーカー配列に基づいて設計されたプライマーを用いて、バイオマーカー配列(又はその相補的配列)を1つの増幅産物に含むように設計されたプライマーを用いて、定量的ポリメラーゼ連鎖反応によって、生物学的試料における膜小胞を検出する(ステップS46)。
 本装置によれば、生物学的試料における膜小胞を簡便に定量することができる。
[膜小胞検出装置(第2の実施形態)]
 本発明の膜小胞検出装置の第2の実施形態は、宿主細胞が産生した膜小胞の塩基配列を得るための塩基配列解析装置と、上記塩基配列の一部であるバイオマーカー配列を1つの増幅産物に含むようなプライマー(対)を設計、合成する核酸合成装置と、上記プライマーを用いて定量的ポリメラーゼ連鎖反応によって、生物学的試料における上記膜小胞を検出するための定量PCR装置と、制御装置と、を有し、上記制御装置は、上記塩基配列解析装置によって取得された上記塩基配列を上記宿主細胞に由来するリファレンス配列にマップさせるマップ部と、上記マップされた領域のうち、検出頻度が基準を超える頻出領域を選択する頻出領域選択部と、上記頻出領域をクエリー配列として、相同性検索を行い、検出された上記宿主細胞以外に由来する相同配列との類似性が基準よりも低い上記頻出領域をバイオマーカー候補配列として選択するバイオマーカー候補配列選択部と、上記バイオマーカー候補配列を、上記相同配列にアラインメントして、配列保存性が基準よりも低い領域を検出し、上記バイオマーカー配列とするバイオマーカー配列決定部と、を有する、膜小胞検出装置である。
 本装置は、核酸合成装置を有する点を除いては、構成は第1の実施形態と同様のため、以下では上記相違点を中心に説明する。
 図7は、本装置のハードウェア構成図である。図8は、本装置の機能ブロック図である。図9は、本装置の制御装置の動作フロー図である。
 膜小胞検出装置50は、核酸合成装置51を有している。核酸合成装置51は、バイオマーカー配列決定部34によって決定されたバイオマーカー配列に基づき、バイオマーカー配列(又はその相補的配列)を1つの増幅産物に含むようなプライマー(対)を設計、合成する。更に、必要に応じて蛍光プローブも併せて合成してもよい。
 このような核酸合成装置としては、公知のものを使用でき、例えば、日本テクノサービス社の「NTS M」シリーズ、バイオリティック・ラボ・パフォーマンス社の「Dr.Oligo」シリーズ、オリゴメーカー社のDNA/RNA合成装置等が挙げられる。
 制御装置23の動作フローとしては、第1の実施の形態が有する制御装置の動作フローと比較すると、ステップS46に代えて、以下の2つのステップを有する点で異なっている。
 まず、1つ目は、制御装置23が核酸合成装置51を制御して、バイオマーカー配列決定部34で決定されたバイオマーカー配列を元に、このバイオマーカー配列(又はその相補的配列)を1つの増幅産物に含むようなプライマー(及び、必要に応じてプローブ)を設計し、合成する(ステップS47)ステップを有する点である。
 そして、2つ目は、制御装置23が定量PCR装置22を制御して、核酸合成装置が合成したプライマー(及び、必要に応じて合成されたプローブ)を用いて、生物学的試料における膜小胞を検出する(ステップS48)ステップを有する点である。
 本装置は、核酸合成装置51を有するため、バイオマーカー配列の決定、プライマーの合成、及び、定量PCRによる膜小胞の検出を自動で行うことができ、生物学的試料における膜小胞をより簡便に定量できる。
[バイオマーカー配列探索装置]
 本発明のバイオマーカー配列探索装置の実施形態は、宿主細胞が産生した膜小胞の塩基配列を得るための塩基配列解析装置と、制御装置と、を有し、上記制御装置は、上記塩基配列を上記宿主細胞に由来するリファレンス配列にマップさせるマップ部と、上記マップされた領域のうち、検出頻度が基準を超える頻出領域を選択する頻出領域選択部と、上記頻出領域をクエリー配列として、相同性検索を行い、検出された上記宿主細胞以外に由来する相同配列との類似性が基準よりも低い上記頻出領域をバイオマーカー候補配列として選択するバイオマーカー候補配列選択部と、上記バイオマーカー候補配列を、上記相同配列にアラインメントして、配列保存性が基準よりも低い領域を検出し、これをバイオマーカー配列とするバイオマーカー配列決定部と、を有する、バイオマーカー配列探索装置である。
 図10は、本装置のハードウェア構成図である。図11は、本装置の機能ブロック図である。また、図12は、本装置の制御装置の動作フロー図である。図10及び図11に示されるとおり、バイオマーカー配列探索装置30は、ハードウェア構成上、すでに説明した膜小胞検出装置の第1の実施形態から、定量PCR装置を除いたものである。上記以外の装置の構成、及び、各部の機能については、膜小胞検出装置の第1の実施形態と同様であり、説明を省略する。
 また、図12の制御装置の動作フロー図に示されるとおり、本装置の制御装置の動作フローは、膜小胞検出装置の第1の実施形態が有する制御装置の動作フローにおいて、ステップS46(制御装置23が定量PCR装置22を制御して、バイオマーカー配列(又はその相補的配列)を1つの増幅産物に含むように設計されたプライマーを用いて、定量的ポリメラーゼ連鎖反応によって、生物学的試料における膜小胞を検出するステップ)を有しない点のみが異なっており、それ以外のステップは同一である。
 本装置によれば、生物学的試料における膜小胞を簡便に定量するのに使用できるバイオマーカー配列を探索することができる。
[コンピュータ]
 本発明のコンピュータは、バイオマーカー配列を探索するコンピュータであって、宿主細胞が産生した膜小胞の塩基配列を上記宿主細胞に由来するリファレンス配列にマップさせるマップ部と、上記マップされた領域のうち、検出頻度が基準を超える頻出領域を選択する頻出領域選択部と、上記頻出領域をクエリー配列として、相同性検索を行い、検出された上記宿主細胞以外に由来する相同配列との類似性が基準よりも低い上記頻出領域をバイオマーカー候補配列として選択するバイオマーカー候補配列選択部と、上記バイオマーカー候補配列を、上記相同配列にアラインメントして、配列保存性が基準よりも低い領域を検出し、上記バイオマーカー配列とするバイオマーカー配列決定部と、を有するコンピュータである。
 図13は、本コンピュータのハードウェア構成図である。
 コンピュータ60は、プロセッサ24、記憶デバイス25、表示デバイス26、及び、入力デバイス27を少なくとも備え、図示しない通信デバイスを更に備えていてもよい。
 プロセッサ24は、例えば、マイクロプロセッサ、プロセッサコア、マルチプロセッサ、ASIC(application-specific integrated circuit)、FPGA(field programmable gate array)、及び、GPGPU(General-purpose computing on graphics processing units)等である。
 記憶デバイス25は、各種プログラム、及び、データを一時的に、及び/又は、非一時的に記憶する機能を有し、プロセッサ24の作業エリアを提供する。
 記憶デバイス25は、例えば、ROM(Read Only Memory)、RAM(Random Access Memory)、HDD(Hard Disk Drive)、フラッシュメモリ、及び、SSD(Solid State Drive)等である。
 表示デバイス26は、解析結果、検体名、及び、操作手順等を表示できる。表示デバイス26は、液晶ディスプレイ、及び、有機EL(Electro Luminescence)ディスプレイ等でよい。
 また、表示デバイス26は、入力デバイス27と一体として構成されていてもよい。この場合、表示デバイス26がタッチパネルディスプレイであって、GUI(Graphical User Interface)を提供する形態が挙げられる。
 入力デバイス27は、測定条件、及び、検体名等の入力を受け付け、また、膜小胞検出装置20への指示の入力を受け付けることができる。入力デバイス27は、キーボード、マウス、スキャナ、及び、タッチパネル等でよい。
 図14は、本コンピュータの機能ブロック図である。コンピュータ60は、マップ部31、頻出領域選択部32、バイオマーカー候補配列選択部33、及び、バイオマーカー配列決定部34を有している。
 マップ部31は、記憶デバイス25に記憶されたプログラムをプロセッサ24が実行して実現される機能である。マップ部31は、入力デバイス27、又は、通信機能(図示しない)によってネットワークを介して外部から入力(61)された膜小胞の塩基配列を、同じく公共データベース等から取得(35)された宿主細胞のゲノム配列(又はこれを含む配列の集合)にマップさせる。マップの方法については、本発明の膜小胞の検出方法においてすでに説明したとおりである。
 頻出領域選択部32は、記憶デバイス25に記憶されたプログラムをプロセッサ24が実行して実現される機能である。膜小胞に由来する塩基配列のうち、マップ部31によって、宿主細胞に由来するリファレンス配列にマップされた領域について、頻出領域選択部32によって、検出頻度が基準を超える頻出領域として選択される。検出頻度の基準については、予め設定され、記憶デバイス25に記憶されていてもよい。頻出領域の選択方法は、本発明の膜小胞の検出方法の第1の実施形態の説明において既に述べたとおりである。
 バイオマーカー候補配列選択部33は、記憶デバイス25に記憶されたプログラムをプロセッサ24が実行して実現される機能である。バイオマーカー候補配列選択部33は、頻出領域をクエリー配列として、入力デバイス27、又は、通信機能によってネットワークを介して公共データベース等から取得(36)された宿主細胞以外に由来する配列に対して、相同性検索を行い、検出された宿主細胞以外に由来する相同配列との類似性が基準よりも低い前記頻出領域をバイオマーカー候補配列として選択する。バイオマーカー候補配列の選択方法は、本発明の膜小胞の検出方法の第1の実施形態の説明において既に述べたとおりである。
 バイオマーカー配列決定部34は、記憶デバイス25に記憶されたプログラムをプロセッサ24が実行して実現される機能である。バイオマーカー配列決定部34は、バイオマーカー候補配列選択部33によって選択されたバイオマーカー候補配列について、上記相同配列にアラインメントして、配列保存性が基準よりも低い領域を検出し、これをバイオマーカー配列とする。バイオマーカー配列の決定方法は、本発明の膜小胞の検出方法の第1の実施形態の説明において既に述べたとおりである。
 図15は、本コンピュータのプロセッサによるバイオマーカー配列の探索処理のフロー図である。
 まず、プロセッサ24は、マップ部31によって、外部から取得された膜小胞の塩基配列を宿主細胞に由来するリファレンス配列にマップさせる処理を行う(ステップS71)。一形態として、プロセッサ24は、公共データベース等から取得(35)された宿主細胞のゲノム配列をリファレンス配列として、膜小胞に由来する塩基配列をこれにマッピングする。
 次に、プロセッサ24は、頻出領域選択部32によって、宿主細胞のゲノム配列にマップされた領域のうち、検出頻度が基準を超える頻出領域を選択する処理を行う(ステップS72)。
 次に、プロセッサ24は、バイオマーカー候補配列選択部33によって、頻出領域選択部32によって選択された頻出領域をクエリー配列として、入力デバイス27、又は、通信機能によってネットワークを介して公共データベース等から取得(36)された宿主細胞以外に由来する配列(例えば、宿主細胞以外の細胞のゲノム配列)に対して(これをリファレンスとして)、相同性検索を行い、検出された宿主細胞以外に由来する相同配列との類似性が基準よりも低い頻出領域をバイオマーカー候補配列として選択する処理を行う(ステップS73)。
 次に、プロセッサ24は、バイオマーカー配列決定部34によって、バイオマーカー候補配列選択部33によって選択されたバイオマーカー候補配列を、相同性検索により検出された宿主細胞以外に由来する相同配列にアラインメントして、配列保存性が基準よりも低い領域を検出し、これをバイオマーカー配列とする(ステップS74)。
 本コンピュータによれば、外部から入力された膜小胞の塩基配列から、生物学的試料における膜小胞を簡便に定量するのに使用できるバイオマーカー配列を探索することができる。
[疾病バイオマーカーの探索方法]
 本発明の疾病バイオマーカーの探索方法は、すでに説明したバイオマーカー配列の探索方法を、具体的な疾病の検出のためのバイオマーカーの探索に用いるという、応用例の1つである。図19は、本発明の疾病バイオマーカーの探索方法のフロー図である。以下では、図19のフロー図を用いて、上記疾病バイオマーカーの探索方法について詳述する。
 まず、ステップS81として、疾病の患者から採取された第1の生物学的試料から得られた第1の膜小胞の塩基配列と、既知の細胞の塩基配列、又は、既知のウイルスのゲノム配列とを比較して、第1の膜小胞の宿主細胞である「宿主細胞A」が決定される。
 「疾病」は、その種類は特に制限されないが、上述の「特定疾病」であることが好ましく、典型的には、細菌、及び/又は、ウイルスによって引き起こされる疾病がより好ましく、細菌、及び/又は、ウイルス感染症が更に好ましい。一形態としては、歯周病が好ましい。
 疾病の患者から採取される第1の生物学的試料としては特に制限されないが、例えば、唾液、血液、血清、血しょう、バフィーコート、リンパ液、間質液、体腔液、消化液、汗、尿、鼻汁、涙液、精液、膣液、羊水、乳汁、喀痰、手術洗浄液、糞便、並びに、皮膚又は身体粘膜の拭い液、及び、スワブからなる群より選択される少なくとも1種が好ましく、唾液がより好ましい。
 
また、これらの採取方法も特に制限されず、公知の方法により採取されたものであってよい。
 第1の生物学的試料は、単一の患者から採取された単一の試料であってもよいし、単一の患者から採取された複数の試料(複数種類の試料、採取時機が複数の試料)、及び、複数の患者(患者群)から採取された単一/複数の試料等のいずれであってもよい。
 なかでも、後述する「宿主細胞C」をより的確に、すなわち、患者群により特異なものとして決定できる観点では、複数の患者から採取された試料であることが好ましい。この場合、複数の患者から採取された試料をそのまま用いて、ステップS81を複数回実施してもよいし、複数の患者から採取された試料を混和して、それを新たな第1の生物学的試料として、ステップS81を実施してもよい。
 本ステップは、患者(群)から採取された第1の生物学的試料に含まれる膜小胞を分離し、その膜小胞の塩基配列を取得するステップを更に含んでもよい。生物学的試料から膜小胞を分離し、その塩基配列を取得する方法は、すでに説明したバイオマーカー配列の探索方法のフロー(図1)のステップS11~S13と同様の方法が適用できる。
 一般に、疾病の患者から採取された第1の生物学的試料に含まれる第1の膜小胞の宿主細胞は未知である。本ステップでは、第1の膜小胞の塩基配列と、既知の細胞の塩基配列、又は、既知のウイルスのゲノム配列とを比較して、第1の膜小胞の宿主細胞である、「宿主細胞A」が特定される。なお、すでに説明したとおり、「宿主細胞A」は、細胞そのものであってもよいし、ウイルス感染した細胞であってもよい。
 なお、第1の膜小胞は、1種であってもよいし、2種以上であってもよい。また、2種以上である場合、1種の宿主細胞によって産生されたものであってもよいし、2種以上の宿主細胞によって産生されたものであってもよい。
 従って、宿主細胞Aも、1種であってもよいし、2種以上であってもよい。
 第1の膜小胞の塩基配列と、既知の細胞の塩基配列、又は、既知のウイルスのゲノム配列との比較方法は特に制限されないが、例えば、公共データベース等に収録された既知の細胞のゲノムの塩基配列、又は、既知のウイルスのゲノムの配列をリファレンスとし、BLAST等によって相同性検索を行う方法が挙げられる。本ステップにおける比較には、すでに説明したバイオマーカー配列の探索方法のフロー(図1)のステップ14と同様の方法が適用できる。
 本ステップ実施過程で取得されたデータの整理方法は特に限定されないが、例えば、第1の生物学的試料から取得された個別の膜小胞から得られた配列を、1つ又は複数の宿主細胞A(細胞自体、又は、ウイルス)にそれぞれ帰属したレコードを複数まとめたテーブル等が挙げられる。更に、上記テーブルは、更に、宿主細胞ごとの塩基長のデータを有していてもよく、このようなデータはヒートマップ等によって可視化することもできる(例えば、図21)。
 次に、ステップS82として、健常者から採取された第2の生物学的試料から得られた、第2の膜小胞の塩基配列と、既知の細胞の塩基配列、又は、既知のウイルスのゲノム配列との比較により、第2の膜小胞の宿主細胞である、「宿主細胞B」が決定される。なお、すでに説明したとおり、「宿主細胞B」は、細胞そのものであってもよいし、ウイルス感染した細胞であってもよい。
 本ステップにおける各手順は、第1の生物学的試料に代えて、第2の生物学的試料を用いることを除いては、ステップS81と同様であり、好適形態も同一である。
 次に、ステップS83として、宿主細胞Aと宿主細胞Bとの比較により、第1の生物学的試料における存在量比が大きい宿主細胞として「宿主細胞C」が特定される。
 まず、「存在量比」は生物学的試料に含まれる個々の膜小胞を、宿主細胞、又は、宿主細胞に感染したウイルスに帰属したとき、その膜小胞の個数比として定義される。一形態として、ある生物学的試料から検出された膜小胞の個数の合計に対する、ある宿主細胞(ウイルス)に帰属される膜小胞の個数として定義されることが好ましい。なお、個々の膜小胞の配列は、必ずしも1種の宿主細胞(ウイルス)に帰属されるとは言えず、2種以上の宿主細胞に帰属されてもよく、その場合でも存在量比は上記のように計算されてよい。
 本ステップでは上記比較によって、単に存在量比が大きくても(高頻度で検出される膜小胞であっても)それが非特異的であるような場合、すなわち、共通する宿主細胞に由来するような場合が除外される。
 なお、「存在量比が大きい」とは、存在量比が最も大きいものであってもよいし、存在量比が所定の基準値以上のものであってもよい。
 上記比較により、第1の生物学的試料に、より高頻度に検出される膜小胞の宿主細胞である「宿主細胞C」が特定される。
 宿主細胞Cは、宿主細胞Aに含まれる。宿主細胞Cは、宿主細胞Bに含まれないことが好ましい。宿主細胞Cが宿主細胞Bに含まれる場合、第2の生物学的試料における宿主細胞Cの存在量比が所定の基準値以下であることが好ましい。
 宿主細胞Cを選定するための具体的な比較の方法としては、例えば、以下の方法が挙げられる。まず、各試料に含まれる膜小胞の宿主細胞(又はウイルス)を近縁種ごとにグループ化し、第1の膜小胞に特異的な宿主細胞(又はウイルス)のグループを特定する。次に、特定したグループ内での存在量比(膜小胞単位の帰属頻度)を比較し、その存在量比が所定の基準以上である宿主細胞を「宿主細胞C」とする方法が挙げられる。
 グループ化の方法としては、例えば、宿主細胞が細菌であれば、分類階級の「門」ごとに行う方法、宿主細胞に感染したウイルスであれば、「科」ごとに行う方法が挙げられる。
 本疾病バイオマーカーの探索方法は、本ステップを有しているため、より特異性の高いマーカーを探索できる。
 次に、ステップS84として、宿主細胞Cが産生した膜小胞の塩基配列を、宿主細胞Cに由来するリファレンス配列(典型的には、宿主細胞Cのゲノム配列、又は、宿主細胞Cに感染したウイルスのゲノム配列)にマップさせる。更にステップS85として、マップされた領域のうち、検出頻度が基準を超える領域を選択する。
 上記ステップで使用される「宿主細胞Cが産生した膜小胞」は、典型的には、第1の生物学的試料から得られた膜小胞のうち、宿主細胞Cが産生したと判定されたものであってよい。
 例えば、宿主細胞Cが1種類であったとしても、その宿主細胞Cから産生される膜小胞は、1種類とは限らず、2種類以上の場合があることを本発明者らは知見している。上記ステップS84、ステップS85では、宿主細胞Cから産生される複数種であってもよい膜小胞において、高頻度で検出される領域が特定される。
 上記の詳細な手順は、ステップS84は、すでに説明したバイオマーカー配列の探索方法のフロー(図1)のステップS14と同様であり、好適形態も同様である。また、ステップS85は、すでに説明したバイオマーカー配列の探索方法のフロー(図1)のステップS15と同様であり、好適形態も同様である。
 次に、ステップS86として、頻出領域をクエリー配列として相同性検索を行い、検出された「宿主細胞C以外」に由来する相同配列との類似性が基準よりも低い「頻出領域」がバイオマーカー候補配列として選択される。
 本ステップは、すでに説明したバイオマーカー配列の探索方法のフロー(図1)のステップS16と同様であり、好適形態も同様である。
 本ステップにより、ステップS15で特定された「頻出領域」のうち、特にリファレンス等と類似性の低い配列が選択される。
 次に、ステップS87として、宿主細胞Bのうち、宿主細胞Cの近縁種である宿主細胞Dが選択され、次いで、ステップS88として、宿主細胞Dに由来する膜小胞の塩基配列又はその断片を、リファレンス配列(宿主細胞Cに由来するリファレンス配列)にマップさせ、次いで、ステップS89として、マップされた領域をバイオマーカー候補配列から除外する。
 宿主細胞Dは、宿主細胞C(患者から採取された第1の生物学的試料に含まれる第1の膜小胞の宿主細胞Aのうち、特異的な宿主細胞)の近縁種であって、かつ、宿主細胞B(健常者から採取された第2の生物学的試料に含まれる第2の膜小胞の宿主細胞)に含まれる宿主細胞である。
 宿主細胞Cと、その近縁種である宿主細胞Dの膜小胞は、その塩基配列に共通領域を持つ場合がある。特に、その断片(例えばシークエンスリード)レベルでは、共通領域が存在することが推測される。
 本ステップでは、まず、宿主細胞Dの膜小胞の塩基配列が、宿主細胞Cに由来するリファレンス配列、すなわち、宿主細胞Cのゲノム配列、又は、宿主細胞Cに感染したウイルスのゲノム配列にマップされる。
 そして、マップされた領域のうち、バイオマーカー候補配列と重複する領域がある場合、この領域がバイオマーカー候補配列から除外される。
 これにより、バイオマーカー候補配列の特異性が更に高まる。なお、上記ステップS87~S89を有していなくてもよい。
 近縁種の範囲は適宜選択されればよい。例えば、一形態として、宿主細胞が細菌であれば、分類階級の「門」ごとに行う方法が挙げられ、宿主細胞が、ウイルスに感染した宿主細胞であれば、そのウイルスの「科」ごとに行う方法が挙げられる。
 次に、ステップS90として、バイオマーカー候補配列を、相同配列にアラインメントして、配列保存性が基準よりも低い領域を検出し、これを疾病バイオマーカーとする。ステップS90は、すでに説明したバイオマーカー配列の探索方法のフロー(図1)のS17と同様であり、好適形態も同様である。
 このように決定された疾病バイオマーカーは、疾病の患者から採取された生物学的試料における膜小胞の塩基配列のうち、高頻度に検出され、かつ、宿主細胞Cに特異的な領域であるので、膜小胞中における疾病バイオマーカーを定量することで、疾病の進行状況等の情報を取得できる。
 以下、本発明を実施例により説明するが、本発明はこれらに限定されるものではない。
[実施例1]
 ストレプトコッカスミュータンス(Streptococcus mutans NG8)を細菌株として用いて、これをDSMZ培地又はGifu培地を用いて37℃で培養した。嫌気条件下にするため、初めに20分間N/CO(80:20v/v) 混合ガスを、細菌株と培地を入れたバイアル瓶に充填させた。
 その後、培養液の光学濃度(OD600)が1.0に到達するまで培養を行なった。培養後、細菌株の培養液を7800rpm、4℃で10分間遠心分離した。膜小胞を含む上清を0.22μmのフィルターに通して細胞の残骸を除去し、ろ過した上澄み液から膜小胞を精製する操作を行なった。
 ろ過した上澄み液を126,000×g、4℃で2時間超遠心した。超遠心分離後、上清を除去し、ペレット状になった膜小胞を再度懸濁し、リン酸緩衝生理食塩水(PBS)に入れて4℃で保存した。
 さらなる膜小胞の精製は、ヨードキサノール(OptiPrep)密度勾配を用いて行った。60%ヨードキサノール原液をPBSで35%、30%、25%、20%、15%、10%に希釈した。保存していた膜小胞を含む懸濁液を、4℃で140,000×g、2時間超遠心した。得られたペレットを35%ヨードキサノール溶液に再懸濁した。準備した6つのヨードキサノール溶液を密度の低い順に超遠心チューブに充填した。この際、膜小胞を含む35%の懸濁液が一番下に、10%の溶液が一番上になるように7mL超遠心チューブに入れた。このチューブを、スイングローターを用いて140,000×g、4℃で16時間超遠心分離した。超遠心後、各層から1mLの画分を採取し、それぞれ別々のエッペンドルフチューブに入れて保存した。得られた各画分中に含まれる粒子の大きさと数を、ナノ粒子トラッキング装置を用いて測定し、直径100~200nm程度の粒子を最も多く含む画分を「膜小胞が濃縮されている画分」であるとし、更なる解析に用いた。
 膜小胞由来のDNA断片を次世代シークエンサにより解析し、ショートリードの塩基配列を得た。これらのショートリード塩基配列(150bp程度)の中でシークエンスのクオリティが低い配列を、fastp(Chen et al., fastp: an ultra-fast all-in-one FASTQ preprocessor. Bioinformatics 34, 17, 2018)を用いて除去した。
 その後、SPAdes(Bankevic et al., SPAdes: A New Genome Assembly Algorithm and Its Applications to Single-Cell Sequencing.  J. Comput. Biol., 19, 5, 2012)を用いて、これらのショートリード配列を結合(assembly)させ、数k~数十kbp程度のコンティグ(contig)と呼ばれる長い塩基配列を作成した。
 各膜小胞内部の塩基配列のうちタンパク質コード領域(CDS)をprokka(Seemann, Prokka: rapid prokaryotic genome annotation. Bioinformatics, 30, 14, 2014)を用いて予測・検出し、それらのCDSの一つ一つに対し、NCBIに登録されている培養細菌株のリファレンスゲノム(Streptococcus mutans strain NG8 NZ_CP013237.1)を参照配列として相同性検索を行い、ゲノム上でマップされた領域を検出した。
 相同性検索には、diamond(Buchfunk et al., Sensitive protein alignments at tree-of-life scale using DIAMOND, Nat. Methods., 18, 2021)を使用した。他のCDS領域に比べて統計的に有意に多くの膜小胞で検出された領域を頻出領域(領域)とした (Hyper-geometric distribution test:p値<0.01)。
 図16は、膜小胞粒子内の塩基配列を参照配列にマップした結果である。96の膜小胞粒子を解析し、各粒子に含まれる塩基配列が参照配列にマップされた領域が黒で示されている。図17は、図16における縦軸を膜小胞粒子数から、「検出頻度」すなわち、その領域の配列を有していた膜小胞粒子数の合計に変更した結果である。上記の結果から、多くの膜小胞粒子が共通的に有している領域が存在することがわかる。
 スクリーニングされた頻出領域をSwiss-Protデータベースに登録されているタンパク質配列をリファレンス配列として相同性検索を行い(diamondを使用)、マッチしたデータベース上の各タンパク質配列情報にタグ付けされている機能情報(Gene Ontology)を、解析アルゴリズムによって抽出し、統計的に有意に高頻度で検出された遺伝子機能を検出した(Hyper-geometric distribution test: p値<0.05)。
 図18は、上記遺伝子機能の一覧である。「SM菌」とあるのは、上記ストレプトコッカスミュータンス菌の結果を表している。また、「PAO」「PG菌」とあるのはそれぞれ、Pseudomonas aeruginosa PAO1、Porphyromonas gingivalis W83 (PG)について、上記SM菌と同様の手順で頻出領域を選択した結果、それぞれの頻出領域(タンパク質コード領域)の機能を示している。
 次に、頻出領域をクエリー配列、NCBIに登録されている全ドメインにわたる生物のタンパク質配列(nr)をリファレンス配列として相同性検索を行った(diamond)。
 ヒットしたデータベース上のタンパク質コード配列の中から、同株由来の配列を除く上位20のタンパク質コード配列のアラインメントスコア(Max Score)の総和を計算し、それらの値が最小となった配列のみをバイオマーカー候補配列として選択した。
 このバイオマーカー候補配列とそれらの相同配列(上述の上位20のタンパク質コード配列)の塩基配列を、MAFFTを用いてアラインメントした。アラインメントの結果、100塩基程度にわたって配列保存性の低い領域が検出された場合、その領域をバイオマーカー配列とした。
 得られたバイオマーカー配列のうち最も配列保存性の低かった塩基配列の両端の18~25塩基程度の配列をプライマー配列として用いる。プライマー配列については別途TmCalculatorによってTm値の計算を行い、qPCRでの検出に適した配列長の調節を行った。
 このプライマー(対)を用いて、例えば、Takara社、「TB Green Fast qPCR Mix」、及び、Promega社、「GoTaq Probe qPCR Master Mix」等と組わせることで、生物学的試料における、宿主細菌であるストレプトコッカスミュータンスが産生した膜小胞の定量を行うことができる。
[実施例2] 
 以下の方法により、歯周病バイオマーカーの探索を実施した。
(生物学的試料の採取)
まず、健常者3人、及び、歯周病患者6人からそれぞれ唾液を入手した。歯周病患者については、ステージIII・グレードC(アメリカ歯周病学会・ヨーロッパ歯周病連盟による歯周病分類)に分類される患者を対象とした。これらの患者については、3か月間に亘って抗生物質の投与がなく、非喫煙者であり、糖尿病、その他の全身性疾患の無いものを対象とした。唾液の採取は、Saliva Collection Aid (Salimetrics LLC. Carlsbad, CA)を用いて実施された。健常者3人のサンプルを混和したものを健常者サンプルとし、歯周病患者6人のサンプルを3人分ずつ混和したものを、歯周病患者サンプル1、及び、歯周病患者サンプル2として、その後の解析に使用した。なお、以下では、健常者サンプル、歯周病患者サンプル1、及び、歯周病患者サンプル2をあわせて、「唾液サンプル」ということがある。
(膜小胞の分離)
 唾液サンプルを7800rpm、4℃の条件で10分間遠心し、沈殿物と上清に分離した。分離した遠心上清を、メンブレンフィルター(孔径0.22μm)を用いてろ過し、上清に残留する菌体等を除去した。得られたろ過後の上清からExoBacteria OMV Isolation Kit (System Biosciences, CA, USA)によって膜小胞のみを分離した。
(膜小胞外の核酸成分の除去)
 分離後の膜小胞サンプルに対してデオキシリボヌクレアーゼ(DNase)処理を行い、膜小胞外部にある核酸成分を分解した。具体的には100μLの精製後の膜小胞サンプルに対して、2μLのDNase(13 units (U)/μL)を添加し、37℃で30分、80℃で10分の処理を行なった。
(濃度調整と粒子数定量)
 膜小胞サンプルを希釈し、40000粒子/μLの濃度になるように膜小胞の濃度の調整を行なった。膜小胞の粒子数の定量方法としては、粒子にレーザを照射し、その散乱光から各粒子のブラウン運動を追跡し(トラッキング法)、その拡散速度から、Stokes-Einsteinの式に基づき粒子の径と個数とを計算する方法をとった。測定と算出には、Zetaview(DKSH,Germany)を用いた。
(一粒子解析)
 膜小胞が1粒子ずつ封入されるように濃度調整を行なった上で、膜小胞サンプルとアガロースゲルを混和し、膜小胞1粒子ごとに1ゲルビーズに封入した。
 封入後の膜小胞を下記の試薬を加えることで溶解させた。
 50U/μL Ready-lyse Lysozyme Solution (Epicentre)、
 2U/mL Zymolyase(Zymo research)、
 22U/mL lysostaphin(MERCK)、
 250U/mL mutanolysin(MERCK)、
 この処理はDPBS(Dulbecco’s Phosphate-Buffered Saline)中、37℃で、一晩(オーバーナイト)処理した。
 次に、0.5mg/mL achromopeptidase(MERCK)in DPBS、37℃で8時間処理した。
 最後に、1mg/mL プロテアーゼ(Proteinase K (Promega))と0.5% SDS(Sodium dodecylsulfate)をDPBSに溶解させた溶液によって、40℃で一晩処理を行なった。
 溶解後のゲルビーズ内DNAは、REPLI-g Single Cell Kit (QIAGEN)によって増幅操作を行なった。DNA増幅を行なった後、ゲルビーズDNA分子を核酸染色試薬(1× SYBR Green)によって染色し、一定以上の蛍光が観察されたゲルビーズを、セルソーター(FACSMelody cell sorter (BD Bioscience))によって、96ウェルプレートに1ゲルビーズずつ分離採取した。
 次いで、ウェルプレートに分取した上でREPLI-g Single Cell Kit で二度目の増幅操作を行い、Nextera XT DNA Library Prep Kit (Illumina) を用いてIllumina用のライブラリ作製を行なった上で、Illumina Miseq又はHiseqを用いて、シークエンシングを行い、ショートリードの塩基配列を得た。これらの操作を健常者サンプルについては192粒子、患者サンプルについては576粒子に対して行い、1粒子ごとに塩基配列を得た。
(データ処理)
 得られたショートリード塩基配列(150bp程度)の中でシークエンスのクオリティが低い配列を、fastp(Chen et al., fastp: an ultra-fast all-in-one FASTQ preprocessor. Bioinformatics 34, 17, 2018)を用いて除去した。
 その後、SPAdes(Bankevic et al., SPAdes: A New Genome Assembly Algorithm and Its Applications to Single-Cell Sequencing. J. Comput. Biol., 19, 5, 2012)を用いて、これらのショートリード配列を結合(assembly)させ、数k~数十kbp程度のコンティグ(contig)と呼ばれる長い塩基配列を作成した。
 各膜小胞内部の塩基配列のうちタンパク質コード領域(CDS)をprokka(Seemann, Prokka: rapid prokaryotic genome annotation. Bioinformatics, 30, 14, 2014)を用いて予測・検出し、それらのCDSの一つ一つに対し、NCBIの全タンパク質配列 nrデータベース とGTDBデータベースをリファレンスとして相同性検索を行い、一致度の最も高いCDS領域をゲノム中に最も多く有する細菌がその粒子の宿主細菌であると判断した。
 相同性検索には、diamond(Buchfunk et al., Sensitive protein alignments at tree-of-life scale using DIAMOND, Nat. Methods., 18, 2021)を使用した。この際、ウイルス由来のCDSが含まれる膜小胞も検出されたため、それらの膜小胞については内部のウイルス由来DNAの帰属情報(ウイルスの種)を得た。
 全粒子の解析の結果得られた膜小胞の宿主細菌プロファイルについて、健常者サンプルと患者サンプルの比較を行い、患者サンプルにおいて最も存在量比の高かった細菌分類群としてPatescibacteria門を得た。
 図20は、健常者サンプルと、歯周病患者サンプル内の膜小胞の塩基配列のプロファイルの比較結果である。検出された塩基配列の情報を基に、各膜小胞内部の塩基配列が由来する細菌の分類群を特定した。図20は各細菌株を門レベル(phylum)と属レベル(genus)で分けた場合の検出されたDNA領域の長さを頻度としてヒートマップで表したものである。歯周病患者サンプルでPatescibacteria門に属するTM7x由来の塩基配列が高頻度に検出されることがわかった。
 上記に属する宿主細菌株のうち、最も検出数の高かった(存在量比が大きかった)細菌株A(Patescibacteria TM7x sp900555265)を歯周病患者特有の膜小胞宿主細菌株とした。
 また、ウイルス由来配列を対象とした同様の比較も行った。図21はその結果であり、各膜小胞で検出されたウイルス由来塩基配列の領域長を種ごとに表示したものである。上記比較によって、健常者に比べ歯周病患者において最も検出数の多かったウイルス種B(Podviridae ctUiB3)を歯周病患者特有のウイルスとした。
 上記の細菌株A(またはウイルス種B)の全ゲノム配列(ドラフトゲノム配列)に対して、細菌株A由来と判定された膜小胞由来のシークエンスリード(またはウイルス種B由来のCDSを含む膜小胞由来のシークエンスリード)をマッピングし、有意に多くの膜小胞で検出率の高かったゲノム領域をその膜小胞における頻出DNA領域とした(Hyper-geometric distribution test: p値<1.0-6)。
 次に、上記頻出領域をクエリー配列とし、NCBIに登録されている全ドメインにわたる生物のタンパク質配列(nr)をリファレンス配列として相同性検索を行った(diamond)。
 ヒットしたデータベース上のタンパク質コード配列の中から、同株もしくは同種が属する分類群(細菌の場合は門、ウイルスの場合は科)の配列を除く上位20のタンパク質コード配列のアラインメントスコア(Max Score)の総和を計算し、それらの値が最小となった配列のみをバイオマーカー候補配列として選択した。
 次に、上記バイオマーカー候補配列を、健常者の膜小胞から得られたコンティグに対して相同性検索を行い、上位20のタンパク質コード配列のアラインメントスコア(Max Score)の総和を計算し、それらの値が最小となる配列を選抜した。
 更に、健常者で検出された膜小胞の宿主細菌の中で、上記細菌株Aと同分類群(門レベル)に属する細菌株を宿主とする膜小胞由来シークエンスリードを、細菌株Aのゲノムに対してマッピングした。これら健常者由来膜小胞のシークエンスリードで検出された領域を、上記バイオマーカー候補配列から除外することにより、最終的な歯周病検出用のバイオマーカー配列を得た。
 図22は、歯周病患者に特異的に検出される領域(バイオマーカー配列)の決定手順を表す図である。
 図22(A)は、歯周病患者サンプル由来の膜小胞のうち、TM7x sp900555265 由来と判定された膜小胞内部の塩基配列を参照配列(TM7x sp900555265のゲノム配列)にマップさせた結果の一例を表す図である。図22(A)の縦軸は個々の膜小胞を表し、横軸は、ゲノム配列上の位置を表す。
 また、図22(B)のヒートマップは、図22(A)において、高頻度に検出されたゲノム領域を表している。横軸は、ゲノム配列上の位置を表す。
 これに対し、図22(C)は、健常者由来の膜小胞のうちTM7x sp900555265が含まれる、Patescibacteria門由来と判定された膜小胞を参照配列(TM7x sp900555265のゲノム配列)にマップさせたものである。縦軸、及び、横軸は、図22(A)と同様である。
 図22(D)のヒートマップは、図22(C)において、高頻度に検出されたゲノム領域を表している。横軸は、ゲノム配列上の位置を表す。
 図22(E)は、上記図22(B)、図22(D)の比較から、歯周病患者に特異的に検出されたゲノム領域をマップしたものである。このそれぞれが、バイオマーカー配列となる。
 ウイルス配列の場合も同様に、健常者で検出されたウイルス由来配列の中でもウイルスBと同分類群(科レベル)に属するウイルス由来CDSを含む膜小胞由来シークエンスリードを、ウイルスBのゲノムに対してマッピングした。健常者由来膜小胞のシークエンスリードで検出された領域は無かったため、上記で得られたバイオマーカー候補配列をそのままバイオマーカー配列とした。これらの配列のうち連続した1000bp以上のDNA領域を対象とした。
 図23は、歯周病患者に特異的に検出される領域(バイオマーカー配列)の決定手順を表す図である。
 図23(B)は、歯周病患者サンプル由来の膜小胞のうち、Podviridae ctUiB3由来と判定されたCDS領域を含む膜小胞内部の塩基配列を参照配列(ctUiB3のゲノム配列)にマップさせた結果の一例を表す図である。図23(B)の縦軸は個々の膜小胞を表し、横軸は、ゲノム配列上の位置を表す。
 また、図23(A)は、領域ごとの検出頻度を表し、図23(C)のヒートマップは、図23(A)において、高頻度に検出されたゲノム領域を表している。いずれも、横軸は、ゲノム配列上の位置を表す。このゲノム領域がバイオマーカー配列となる。
(プライマー配列、オリゴヌクレオチドプローブ配列の選定)
 得られたバイオマーカー配列の中から、プローブ法(5′-ヌクレアーゼ法)によるqPCRでの検出に適した100bp程度の配列を複数選択した。この対象配列の選択ならびにプライマー配列、オリゴヌクレオチドプローブ配列の設計にあたっては、Integrated DNA Technologies社が提供するPrimer Quest(登録商標)Tool (https://sg.idtdna.com/pages/tools/primerquest)を用いた。
 このプライマー(対)とプローブを用いて、ThermoFisher Scientific社Applied Biosystemsブランドが提供する、「TaqMan(登録商標) Gene Expression Master Mix」を組わせることで、唾液サンプルを用いた歯周病患者特有の膜小胞由来塩基配列、すなわち、歯周病の検出を行うことができる。
 近年、病原菌と各種疾患を媒介する因子の一つとして、細菌から分泌される膜小胞が注目を集めており、これらが血中へと移行し全身へと運ばれることで、消化器系疾患、心疾患、ひいてはアルツハイマーなどの脳神経疾患に至る幅広い疾患に影響を及ぼす可能性が指摘されている。すなわち、各種疾患に対し強い影響力を持つ血中膜小胞の同定・検出技術は、革新的な疾患予防・診断技術の基盤になる。本発明により特定された細菌膜小胞マーカー配列を指標とした(q)PCR検査(又は、RT-qPCR)等を実施することで、特定の病原細菌種や疾患を簡便に検出することが可能となる。
 これまでも、膜小胞内部の塩基配列を決定・解析する技術は存在したが、内部に含まれる特異性の高い塩基配列のみを増幅することで、特定の細菌由来の膜小胞を検出する技術は存在しなかった。この理由として、膜小胞内部の塩基配列のうち高頻度かつ特異性の高い塩基配列領域を決定するアルゴリズムが存在しなかったこと、またそれらのアルゴリズムを用いて決定された塩基配列を使って、ヒト試料に含まれる膜小胞を検出した実施例が無かったことがある。本発明においては、上記の二つを達成している。
20、50:膜小胞検出装置、21:塩基配列解析装置、22:定量PCR装置、23:制御装置、24:プロセッサ、25:記憶デバイス、26:表示デバイス、27:入力デバイス、28:前処理装置、29:シークエンサ、31:マップ部、32:頻出領域選択部、33:バイオマーカー候補配列選択部、34:バイオマーカー配列決定部、51:核酸合成装置、60:コンピュータ

Claims (26)

  1.  宿主細胞が産生した膜小胞の塩基配列の一部であるバイオマーカー配列を1つの増幅産物に含むように設計されたプライマーを用いて、定量ポリメラーゼ連鎖反応によって、生物学的試料における前記膜小胞を検出することを含み、
     前記バイオマーカー配列は、以下の手順;
     前記宿主細胞が産生した前記膜小胞の塩基配列を得ること、
     前記塩基配列を前記宿主細胞に由来するリファレンス配列にマップさせること、
     前記マップされた領域のうち、検出頻度が基準を超える頻出領域を選択すること、
     前記頻出領域をクエリー配列として相同性検索を行い、検出された前記宿主細胞以外に由来する相同配列との類似性が基準よりも低い前記頻出領域をバイオマーカー候補配列として選択すること、
     前記バイオマーカー候補配列を、前記相同配列にアラインメントして、配列保存性が基準よりも低い領域を検出し、これを前記バイオマーカー配列とすること、
    によって選択されたものである、膜小胞の検出方法。
  2.  前記リファレンス配列が、前記宿主細胞のゲノム配列、又は、前記宿主細胞に感染したウイルス由来の核酸配列である、請求項1に記載の膜小胞の検出方法。
  3.  前記生物学的試料が対象から採取されたものであり、
     前記手順が、前記膜小胞の塩基配列を得ることの前に、
     前記生物学的試料から前記膜小胞を分離取得すること、を更に含む、請求項1又は2に記載の膜小胞の検出方法。
  4.  宿主細胞が産生した膜小胞の塩基配列を得ることと、
     前記塩基配列を前記宿主細胞に由来するリファレンス配列にマップさせることと、
     前記マップされた領域のうち、検出頻度が基準を超える頻出領域を選択することと、
     前記頻出領域をクエリー配列として相同性検索を行い、検出された前記宿主細胞以外に由来する相同配列との類似性が基準よりも低い前記頻出領域をバイオマーカー候補配列として選択することと、
     前記バイオマーカー候補配列を、前記相同配列にアラインメントして、配列保存性が基準よりも低い領域を検出し、これをバイオマーカー配列とすることと、
     前記バイオマーカー配列を1つの増幅産物に含むように設計されたプライマーを用いて、定量ポリメラーゼ連鎖反応によって、生物学的試料における前記膜小胞を検出することと、を含む膜小胞の検出方法。
  5.  前記リファレンス配列が、前記宿主細胞のゲノム配列、又は、前記宿主細胞に感染したウイルス由来の核酸配列である、請求項4に記載の膜小胞の検出方法。
  6.  前記生物学的試料が、対象から採取されたものであり、
     前記膜小胞の塩基配列を得ることの前に、
     前記生物学的試料から前記膜小胞を分離取得すること、を更に含む、請求項4又は5に記載の膜小胞の検出方法。
  7.  前記生物学的試料が、唾液、血液、血清、血しょう、バフィーコート、リンパ液、間質液、体腔液、消化液、汗、尿、鼻汁、涙液、精液、膣液、羊水、乳汁、喀痰、手術洗浄液、糞便、並びに、皮膚又は身体粘膜の拭い液、及び、スワブからなる群より選択される少なくとも1種である、請求項1~6のいずれか1項に記載の膜小胞の検出方法。
  8.  前記バイオマーカー候補配列の選択が、前記相同配列へのアラインメントスコアが最小となった配列を選択することである、請求項1~7のいずれか1項に記載の膜小胞の検出方法。
  9.  前記頻出領域が、タンパク質コード領域である、請求項1~8のいずれか1項に記載の膜小胞の検出方法。
  10.  前記定量ポリメラーゼ連鎖反応が、リアルタイムポリメラーゼ連鎖反応である、請求項1~9のいずれか1項に記載の膜小胞の検出方法。
  11.  前記検出頻度の基準が、統計的検定の有意水準に基づいて予め定められた基準である、請求項1~10のいずれか1項に記載の膜小胞の検出方法。
  12.  宿主細胞が産生した膜小胞の塩基配列を得ることと、
     前記塩基配列を前記宿主細胞に由来するリファレンス配列にマップさせることと、
     前記マップされた領域のうち、検出頻度が基準を超える頻出領域を選択することと、
     前記頻出領域をクエリー配列として相同性検索を行い、検出された前記宿主細胞以外に由来する相同配列との類似性が基準よりも低い前記頻出領域をバイオマーカー候補配列として選択することと、
     前記バイオマーカー候補配列を、前記相同配列にアラインメントして、配列保存性が基準よりも低い領域を検出し、これをバイオマーカー配列とすることと、を含む、バイオマーカー配列の探索方法。
  13.  前記リファレンス配列が、前記宿主細胞のゲノム配列、又は、前記宿主細胞に感染したウイルス由来の核酸配列である、請求項12に記載のバイオマーカー配列の探索方法。
  14.  前記膜小胞の塩基配列を得ることの前に、
     対象から採取された生物学的試料から前記膜小胞を分離取得すること、を更に含む、請求項12又は13に記載のバイオマーカー配列の探索方法。
  15.  前記生物学的試料が、唾液、血液、血清、血しょう、バフィーコート、リンパ液、間質液、体腔液、消化液、汗、尿、鼻汁、涙液、精液、膣液、羊水、乳汁、喀痰、手術洗浄液、糞便、並びに、皮膚又は身体粘膜の拭い液、及び、スワブからなる群より選択される少なくとも1種である、請求項12に記載のバイオマーカー配列の探索方法。
  16.  前記バイオマーカー候補配列の選択が、前記相同配列へのアラインメントスコアが最小となった配列を選択することである、請求項12~15のいずれか1項に記載のバイオマーカー配列の探索方法。
  17.  前記頻出領域が、タンパク質コード領域である、請求項12~16のいずれか1項に記載のバイオマーカー配列の探索方法。
  18.  前記検出頻度の基準が、統計的検定の有意水準に基づいて予め定められた基準である、請求項12~17のいずれか1項に記載のバイオマーカー配列の探索方法。
  19.  宿主細胞が産生した膜小胞の塩基配列を得るための塩基配列解析装置と、
     前記塩基配列の一部であるバイオマーカー配列を1つの増幅産物に含むように設計されたプライマーを用いて、定量ポリメラーゼ連鎖反応によって、生物学的試料における前記膜小胞を検出するための定量PCR装置と、
     制御装置と、を有し、
     前記制御装置は、前記塩基配列解析装置によって取得された前記塩基配列を前記宿主細胞に由来するリファレンス配列にマップさせるマップ部と、
     前記マップされた領域のうち、検出頻度が基準を超える頻出領域を選択する頻出領域選択部と、
     前記頻出領域をクエリー配列として、相同性検索を行い、検出された前記宿主細胞以外に由来する相同配列との類似性が基準よりも低い前記頻出領域をバイオマーカー候補配列として選択するバイオマーカー候補配列選択部と、
     前記バイオマーカー候補配列を、前記相同配列にアラインメントして、配列保存性が基準よりも低い領域を検出し、前記バイオマーカー配列とするバイオマーカー配列決定部と、を有する、膜小胞検出装置。
  20.  塩基配列解析装置と、定量PCR装置と、コンピュータである制御装置と、を有する膜小胞検出装置の前記制御装置に、
     前記塩基配列解析装置を制御して、宿主細胞が産生した膜小胞の塩基配列を得る段階と、
     前記塩基配列を前記宿主細胞に由来するリファレンス配列にマップさせる段階と、
     前記マップされた領域のうち、検出頻度が基準を超える頻出領域を選択する段階と、
     前記頻出領域をクエリー配列として、相同性検索を行い、検出された前記宿主細胞以外に由来する相同配列との類似性が基準よりも低い前記頻出領域をバイオマーカー候補配列として選択する段階と、
     前記バイオマーカー候補配列を、前記相同配列にアラインメントして、配列保存性が基準よりも低い領域を検出し、これをバイオマーカー配列とする段階と、
     前記定量PCR装置を制御して、前記バイオマーカー配列を1つの増幅産物に含むように設計されたプライマーを用いて、定量的ポリメラーゼ連鎖反応によって、生物学的試料における前記膜小胞を検出する段階と、を実行させるプログラム。
  21.  宿主細胞が産生した膜小胞の塩基配列を得るための塩基配列解析装置と、
     制御装置と、を有し、
     前記制御装置は、前記塩基配列を前記宿主細胞に由来するリファレンス配列にマップさせるマップ部と、
     前記マップされた領域のうち、検出頻度が基準を超える頻出領域を選択する頻出領域選択部と、
     前記頻出領域をクエリー配列として、相同性検索を行い、検出された前記宿主細胞以外に由来する相同配列との類似性が基準よりも低い前記頻出領域をバイオマーカー候補配列として選択するバイオマーカー候補配列選択部と、
     前記バイオマーカー候補配列を、前記相同配列にアラインメントして、配列保存性が基準よりも低い領域を検出し、これをバイオマーカー配列とするバイオマーカー配列決定部と、を有する、バイオマーカー配列探索装置。
  22.  塩基配列解析装置と、コンピュータである制御装置と、を有するバイオマーカー配列探索装置の前記制御装置に、
     前記塩基配列解析装置を制御して、宿主細胞が産生した膜小胞の塩基配列を得る段階と、
     前記塩基配列を前記宿主細胞に由来するリファレンス配列にマップさせる段階と、
     前記マップされた領域のうち、検出頻度が基準を超える頻出領域を選択する段階と、
     前記頻出領域をクエリー配列として、相同性検索を行い、検出された前記宿主細胞以外に由来する相同配列との類似性が基準よりも低い前記頻出領域をバイオマーカー候補配列として選択する段階と、
     前記バイオマーカー候補配列を、前記相同配列にアラインメントして、配列保存性が基準よりも低い領域を検出し、これをバイオマーカー配列とする段階と、を実行させるプログラム。
  23.  バイオマーカー配列を探索するコンピュータであって、
     宿主細胞が産生した膜小胞の塩基配列を前記宿主細胞に由来するリファレンス配列にマップさせるマップ部と、
     前記マップされた領域のうち、検出頻度が基準を超える頻出領域を選択する頻出領域選択部と、
     前記頻出領域をクエリー配列として、相同性検索を行い、検出された前記宿主細胞以外に由来する相同配列との類似性が基準よりも低い前記頻出領域をバイオマーカー候補配列として選択するバイオマーカー候補配列選択部と、
     前記バイオマーカー候補配列を、前記相同配列にアラインメントして、配列保存性が基準よりも低い領域を検出し、前記バイオマーカー配列とするバイオマーカー配列決定部と、を有するコンピュータ。
  24.  コンピュータに、
     宿主細胞が産生した膜小胞の塩基配列を前記宿主細胞に由来するリファレンス配列にマップさせる段階と、
     前記マップされた領域のうち、検出頻度が基準を超える頻出領域を選択する段階と、
     前記頻出領域をクエリー配列として相同性検索を行い、検出された前記宿主細胞以外に由来する相同配列との類似性が基準よりも低い前記頻出領域をバイオマーカー候補配列として選択する段階と、
     前記バイオマーカー候補配列を、前記相同配列にアラインメントして、配列保存性が基準よりも低い領域を検出し、これをバイオマーカー配列とする段階と、を実行させるプログラム。
  25.  疾病の患者から採取された第1の生物学的試料から得られた、第1の膜小胞の塩基配列と、既知の細胞の塩基配列、又は、既知のウイルスのゲノム配列とを比較して、前記第1の膜小胞の宿主細胞である、宿主細胞Aを決定することと、
     健常者から採取された第2の生物学的試料から得られた、第2の膜小胞の塩基配列と、既知の細胞の塩基配列、又は、既知のウイルスのゲノム配列とを比較して、前記第2の膜小胞の宿主細胞である、宿主細胞Bを決定することと、
     前記宿主細胞Aと、前記宿主細胞Bとの比較により、前記第1の生物学的試料における存在量比が大きい前記宿主細胞である、宿主細胞Cを特定することと、
     前記宿主細胞Cが産生した膜小胞の塩基配列を前記宿主細胞Cに由来するリファレンス配列にマップさせることと、
     前記マップされた領域のうち、検出頻度が基準を超える頻出領域を選択することと、
     前記頻出領域をクエリー配列として相同性検索を行い、検出された前記宿主細胞C以外に由来する相同配列との類似性が、基準よりも低い前記頻出領域をバイオマーカー候補配列として選択することと、
     前記バイオマーカー候補配列を、前記相同配列にアラインメントして、配列保存性が基準よりも低い領域を検出し、これを疾病バイオマーカーとすることと、を含む疾病バイオマーカーの探索方法。
  26.  前記宿主細胞Bのうち、前記宿主細胞Cの近縁種である宿主細胞Dを選択することと、
     前記宿主細胞Dに由来する膜小胞の塩基配列又はその断片を、前記リファレンス配列にマップさせることと、
     前記マップされた領域を前記バイオマーカー候補配列から除外することと、を更に含む、請求項25に記載の疾病バイオマーカーの探索方法。
PCT/JP2022/032952 2021-09-16 2022-09-01 膜小胞の検出方法、バイオマーカー配列の探索方法、膜小胞検出装置、バイオマーカー配列探索装置、プログラム、コンピュータ、及び、疾病バイオマーカーの探索方法 WO2023042673A1 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2023548403A JPWO2023042673A1 (ja) 2021-09-16 2022-09-01

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2021-151385 2021-09-16
JP2021151385 2021-09-16

Publications (1)

Publication Number Publication Date
WO2023042673A1 true WO2023042673A1 (ja) 2023-03-23

Family

ID=85602190

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2022/032952 WO2023042673A1 (ja) 2021-09-16 2022-09-01 膜小胞の検出方法、バイオマーカー配列の探索方法、膜小胞検出装置、バイオマーカー配列探索装置、プログラム、コンピュータ、及び、疾病バイオマーカーの探索方法

Country Status (2)

Country Link
JP (1) JPWO2023042673A1 (ja)
WO (1) WO2023042673A1 (ja)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017158545A (ja) * 2016-03-04 2017-09-14 公立大学法人大阪市立大学 膵管内乳頭粘液腫瘍又は膵癌の診断に使用するためのバイオマーカー及び当該バイオマーカーを用いた膵管内乳頭粘液腫瘍又は膵癌の検査方法
US20190328861A1 (en) * 2016-12-28 2019-10-31 Birgitta Henriques Normark Microparticles from streptococcus pneumoniae as vaccine antigens
US20190345482A1 (en) * 2017-01-24 2019-11-14 Bgi Shenzhen Method for non-invasive prenatal diagnosis based on exosomal DNA and application thereof
JP2020503028A (ja) * 2016-12-26 2020-01-30 エムディー ヘルスケア インコーポレイテッドMd Healthcare Inc. 細菌メタゲノム解析による肺癌診断方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017158545A (ja) * 2016-03-04 2017-09-14 公立大学法人大阪市立大学 膵管内乳頭粘液腫瘍又は膵癌の診断に使用するためのバイオマーカー及び当該バイオマーカーを用いた膵管内乳頭粘液腫瘍又は膵癌の検査方法
JP2020503028A (ja) * 2016-12-26 2020-01-30 エムディー ヘルスケア インコーポレイテッドMd Healthcare Inc. 細菌メタゲノム解析による肺癌診断方法
US20190328861A1 (en) * 2016-12-28 2019-10-31 Birgitta Henriques Normark Microparticles from streptococcus pneumoniae as vaccine antigens
US20190345482A1 (en) * 2017-01-24 2019-11-14 Bgi Shenzhen Method for non-invasive prenatal diagnosis based on exosomal DNA and application thereof

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
ZHAO NA; ZHANG BO; JIA LEI; HE XIAOXU; BAO BAOLONG: "Extracellular vesicles piwi-interacting RNAs from skin mucus for identification of infected Cynoglossus semilaevis with Vibrio harveyi", FISH & SHELLFISH IMMUNOLOGY, ACADEMIC PRESS, LONDON,, GB, vol. 111, 6 February 2021 (2021-02-06), GB , pages 170 - 178, XP086511841, ISSN: 1050-4648, DOI: 10.1016/j.fsi.2021.02.001 *

Also Published As

Publication number Publication date
JPWO2023042673A1 (ja) 2023-03-23

Similar Documents

Publication Publication Date Title
Fricker et al. What is new and relevant for sequencing-based microbiome research? A mini-review
CN111662958B (zh) 基于纳米孔测序平台的文库的构建方法、鉴定微生物的方法及应用
Martinez et al. PCR-based techniques for leprosy diagnosis: from the laboratory to the clinic
Roeder et al. mRNA profiling using a minimum of five mRNA markers per body fluid and a novel scoring method for body fluid identification
Hung et al. Quantitative detection of Schistosoma japonicum cercariae in water by real-time PCR
KR20070085817A (ko) 혈액 내 숙주 유전자 표현 바이오마커를 사용한 전염성질병 임상 표현형 및 기타 생리상태의 진단 및 예측방법
US11312999B2 (en) Set of genes for molecular classifying of medulloblastoma and use thereof
Petinataud et al. Molecular diagnosis of onychomycosis
US20170140096A1 (en) Systems and methods for detecting the presence of a biological status using clustering
CN111647673A (zh) 微生物菌群在急性胰腺炎中的应用
Keeler et al. Widespread, human-associated redondoviruses infect the commensal protozoan Entamoeba gingivalis
Beldi et al. Molecular characterization of Leishmania parasites in Giemsa-stained slides from cases of human cutaneous and visceral leishmaniasis, Eastern Algeria
Das et al. Molecular epidemiology and transmission dynamics of leprosy among multicase families and case-contact pairs
Zhang et al. A comparison of homogenization vs. enzymatic lysis for microbiome profiling in clinical endoscopic biopsy tissue samples
WO2023042673A1 (ja) 膜小胞の検出方法、バイオマーカー配列の探索方法、膜小胞検出装置、バイオマーカー配列探索装置、プログラム、コンピュータ、及び、疾病バイオマーカーの探索方法
CN114480636B (zh) 胆汁细菌作为肝门部胆管癌诊断及预后标志物的用途
Zou et al. Value analysis of next-generation sequencing combined with Xpert in early precise diagnosis of pulmonary tuberculosis
CN111757945A (zh) 鉴定皮肤癣菌的方法
Wang et al. Performance of the Real Fungus‐ID kit based on multiplex RT‐PCR assay for the rapid detection and identification of Trichophyton spp. and Microsporum spp. in clinical specimens with suspected dermatophyte infection
Goharrizi et al. Non-invasive STEMI-related biomarkers based on meta-analysis and gene prioritization
CN113584190A (zh) 一种诊断草酸钙结石的肠道菌群标志物及其应用
CN115029429B (zh) 炎症相关蛋白联合在预测art治疗敏感性中的应用
US20190195858A1 (en) Separation of Rare Cells and Genomic Analysis Thereof
CN111996248B (zh) 检测微生物的试剂及其在重症肌无力诊断中的应用
CN114839369B (zh) 急性高原反应微生物标志物及其应用

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 22869820

Country of ref document: EP

Kind code of ref document: A1

WWE Wipo information: entry into national phase

Ref document number: 2023548403

Country of ref document: JP