WO2022259995A1 - 真核微生物を定量するための内部標準核酸 - Google Patents

真核微生物を定量するための内部標準核酸 Download PDF

Info

Publication number
WO2022259995A1
WO2022259995A1 PCT/JP2022/022726 JP2022022726W WO2022259995A1 WO 2022259995 A1 WO2022259995 A1 WO 2022259995A1 JP 2022022726 W JP2022022726 W JP 2022022726W WO 2022259995 A1 WO2022259995 A1 WO 2022259995A1
Authority
WO
WIPO (PCT)
Prior art keywords
nucleic acid
acid sequence
sequence
seq
flanking
Prior art date
Application number
PCT/JP2022/022726
Other languages
English (en)
French (fr)
Inventor
ディーター トゥールース,
勇地 関口
Original Assignee
国立研究開発法人産業技術総合研究所
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 国立研究開発法人産業技術総合研究所 filed Critical 国立研究開発法人産業技術総合研究所
Priority to JP2023527846A priority Critical patent/JPWO2022259995A1/ja
Publication of WO2022259995A1 publication Critical patent/WO2022259995A1/ja

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/74Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/80Vectors or expression systems specially adapted for eukaryotic hosts for fungi
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/80Vectors or expression systems specially adapted for eukaryotic hosts for fungi
    • C12N15/81Vectors or expression systems specially adapted for eukaryotic hosts for fungi for yeasts
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N5/00Undifferentiated human, animal or plant cells, e.g. cell lines; Tissues; Cultivation or maintenance thereof; Culture media therefor
    • C12N5/10Cells modified by introduction of foreign genetic material
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes

Definitions

  • the present invention relates to an internal standard nucleic acid for quantifying eukaryotic microorganisms.
  • microorganisms live in all environments, including natural environments such as soil and oceans, the intestines of animals, and human living spaces such as houses. In many cases, they are colonized in each environment with a unique configuration, and such collections of microorganisms are called microbiomes.
  • rRNA ribosomal RNA
  • 18S rRNA gene the 18S rRNA gene
  • ITS Internal Transcribed Spacer
  • 25-28S rRNA gene sequences for eukaryotes are used as indicators. Taxonomy-based metagenomic analysis methods are being actively used.
  • the purpose of the present invention is to provide an internal standard nucleic acid optimized for the detection of eukaryotic microorganisms and/or prokaryotic microorganisms that make up microbiota and the accuracy control of their quantification.
  • the present inventors have already developed an internal standard nucleic acid optimized for accuracy control of detection and quantification of prokaryotic microorganisms (Patent No. 6479336). Subsequently, the present inventors succeeded in producing an internal standard nucleic acid for precision control of detection and quantification of eukaryotic microorganisms, leading to the completion of the present invention.
  • the present invention provides (1) a 5′ flanking sequence comprising a nucleic acid sequence derived from a eukaryotic rRNA-related gene, (2) an artificial nucleic acid sequence comprising a non-naturally occurring nucleic acid sequence, and (3) A nucleic acid comprising at least one partial nucleic acid sequence consisting of a 3' flanking sequence containing a nucleic acid sequence derived from a eukaryotic rRNA-related gene and/or a complementary sequence thereof, wherein the partial nucleic acid sequence is: Partial nucleic acid sequences (a) to (d) of: (a1) a 5′ flanking sequence containing at least 20 consecutive nucleotides in the nucleic acid sequence of SEQ ID NO: 1, (a2) an artificial nucleic acid sequence consisting of the nucleic acid sequence of any one of SEQ ID NOs: 8 to 19, and (a3) ) a partial nucleic acid sequence (a) consisting of a 3' flanking sequence comprising
  • the partial nucleic acid sequence (a) includes (a1′) a 5′ flanking sequence containing the nucleic acid sequence of SEQ ID NO: 1, and (a2) an artificial nucleic acid sequence consisting of the nucleic acid sequence of any one of SEQ ID NOS: 8 to 19.
  • said partial nucleic acid sequence (b) comprises (b1′) a 5′ flanking sequence comprising the nucleic acid sequence of SEQ ID NO:2, ( b2) an artificial nucleic acid sequence selected from the group consisting of SEQ ID NOs: 20 to 31, and (b3′) a 3′ flanking sequence comprising the nucleic acid sequence of SEQ ID NO: 3; ') a 5' flanking sequence comprising the nucleic acid sequence of SEQ ID NO: 3, (c2) an artificial nucleic acid sequence selected from the group consisting of SEQ ID NOS: 32-43, and (c3') a 3' comprising the nucleic acid sequence of SEQ ID NO: 4.
  • said partial nucleic acid sequence (d) is selected from the group consisting of (d1′) a 5′ flanking sequence comprising the nucleic acid sequence of SEQ ID NO: 4, (d2) SEQ ID NOS: 44-55 and (d3') a 3' flanking sequence comprising the nucleic acid sequence of SEQ ID NO:5.
  • the nucleic acid includes (e4) a 5' flanking sequence comprising a nucleic acid sequence derived from a prokaryotic rRNA gene, (e5) an artificial nucleic acid sequence comprising a non-naturally occurring nucleic acid sequence, and (e6) a nucleic acid sequence derived from a prokaryotic rRNA gene. It is preferred to further comprise an additional partial nucleic acid sequence (e) consisting of the 3' flanking sequence comprising and/or its complementary sequence.
  • the additional partial nucleic acid sequence (e) includes (e4') a 5' flanking sequence comprising the nucleic acid sequence of SEQ ID NO: 6, (e5') the artificial nucleic acid sequence of SEQ ID NO: 56 or 57, and (e6') SEQ ID NO: It preferably consists of 3' flanking sequences comprising 7 nucleic acid sequences.
  • the nucleic acid consists of a nucleic acid sequence selected from the group consisting of SEQ ID NOS: 58-69 and/or its complementary sequence.
  • the present invention provides an expression vector containing the above nucleic acid.
  • the present invention provides a transformed cell containing the expression vector.
  • the present invention also provides, according to one embodiment, a nucleic acid sequence that is at least 90% identical to a nucleic acid sequence comprising at least 15 consecutive nucleotides in an artificial nucleic acid sequence selected from the group consisting of SEQ ID NOS:8-57. or provide a probe comprising its complementary sequence.
  • the nucleic acid according to the present invention has a non-naturally occurring nucleic acid sequence and can be amplified in the same manner as eukaryotic rRNA-related genes using known universal primers for amplifying eukaryotic rRNA-related genes. can be done. Therefore, according to the nucleic acid according to the present invention, in the analysis of various microbiota samples containing eukaryotic microorganisms, it is possible to strictly control the accuracy of metagenomic analysis based on rRNA-related genes, which is generally employed at present. .
  • FIG. 1 is a schematic diagram showing exemplary configurations of nucleic acids of the present invention.
  • FIG. 2 is a plot evaluating the quantification of nucleic acids 1-12 as internal standards using the universal primer set for the ITS1 region.
  • FIG. 3 is a plot evaluating the quantification of nucleic acids 1-12 as internal standards using a universal primer set for the 25-28S rRNA D1-D2 region.
  • FIG. 4 is a plot evaluating the quantification of nucleic acids 1-12 as internal standards using a universal primer set for the 16S rRNA V4 region.
  • FIG. 5 is a plot showing the correlation between the amount of soil added to the sample and the number of reads from nucleic acids 1-12.
  • FIG. 1 is a schematic diagram showing exemplary configurations of nucleic acids of the present invention.
  • FIG. 2 is a plot evaluating the quantification of nucleic acids 1-12 as internal standards using the universal primer set for the ITS1 region.
  • FIG. 3 is a plot evaluating the
  • FIG. 6 is a plot showing the correlation between the amount of soil added to the sample and the total amount of fungi estimated based on the number of reads from nucleic acids 1-12.
  • FIG. 7 is a plot showing the copy number of the ITS1 region in mixed samples of fungal/bacterial DNA (actual values and estimated values based on measured values derived from internal standard nucleic acids 3-10).
  • FIG. 8 is a plot showing the mixing ratio of fungal/bacterial DNA (actual values and estimated values based on measured values derived from internal standard nucleic acids 3 to 10).
  • FIG. 9 is a plot showing the number of reads from nucleic acid 4 added at various copy numbers to DNA extracted from soil.
  • FIG. 10 is a graph showing the abundance of microorganisms for each taxonomy estimated based on the number of reads derived from nucleic acid 4.
  • FIG. 10 is a graph showing the abundance of microorganisms for each taxonomy estimated based on the number of reads derived from nucleic acid 4.
  • the present invention provides (1) a 5' flanking sequence comprising a nucleic acid sequence derived from a eukaryotic rRNA-related gene, (2) an artificial nucleic acid sequence comprising a non-naturally occurring nucleic acid sequence, and (3) A nucleic acid comprising at least one partial nucleic acid sequence consisting of a 3′ flanking sequence containing a nucleic acid sequence derived from a eukaryotic rRNA-related gene and/or a complementary sequence thereof, wherein the partial nucleic acid sequence is: Partial nucleic acid sequences (a) to (d) of: (a1) a 5′ flanking sequence containing at least 20 consecutive nucleotides in the nucleic acid sequence of SEQ ID NO: 1, (a2) an artificial nucleic acid sequence consisting of the nucleic acid sequence of any one of SEQ ID NOs: 8 to 19, and (a3) ) a partial nucleic acid sequence (a) consisting of a 3' flanking sequence comprising at
  • the term "eukaryotic rRNA-related gene” refers to genes encoding 18S, 5.8S, and 25-28S rRNA subunits that constitute eukaryotic ribosomes, and ITS (Internal Transcribed Spacer) region. There is an ITS1 region between the 18S rRNA gene and the 5.8S rRNA gene, and an ITS2 region between the 5.8S rRNA gene and the 25-28S rRNA gene, both of which are eukaryotic rRNAs in this embodiment. Included in related genes.
  • the 5′ flanking sequences and 3′ flanking sequences in this embodiment are sequences containing at least 20 contiguous nucleotides among the following conserved sequences 1-5 that are highly conserved in eukaryotic rRNA-associated genes: (hereinafter collectively referred to as “sequences derived from conserved sequences”).
  • conserveed sequences 1-5 are respectively upstream of the V9 region of the 18S rRNA gene, downstream of the V9 region of the 18S rRNA gene/upstream of the ITS1 region, 5.8S rRNA gene, downstream of the ITS2 region/D1- of the 25-28S rRNA gene Sequences upstream of the D2 region and downstream of the D1-D2 region of the 25-28S rRNA gene.
  • a sequence comprising at least 20 contiguous nucleotides in the conserved sequence, used as the 5′ flanking sequence and the 3′ flanking sequence in this embodiment, is a known sequence for amplifying eukaryotic rRNA-related genes. Any position of the conserved sequence may be selected as long as it is recognized by a universal primer (see, for example, Stefanos Banos et al., 2018, BMC Microbiology, Vol. 18, Article number: 190). Sequences derived from conserved sequences used as 5′ flanking sequences and 3′ flanking sequences in this embodiment preferably contain at least 30 contiguous nucleotides in the conserved sequences, more preferably the entire length. .
  • the partial nucleic acid sequences in this embodiment include a sequence derived from conserved sequence 1 and a sequence derived from conserved sequence 2, a sequence derived from conserved sequence 2 and a sequence derived from conserved sequence 3, a sequence derived from conserved sequence 3 and a sequence derived from conserved sequence 4. or a sequence derived from conserved sequence 4 and a sequence derived from conserved sequence 5 are combined as 5′ flanking sequences and 3′ flanking sequences, and an artificial nucleic acid consisting of a non-naturally occurring nucleic acid sequence between the combined sequences Contains arrays.
  • the partial nucleic acid sequence in this embodiment is between the conserved sequence 1-derived sequence and the conserved sequence 2-derived sequence (i.e., 18S V9 region) in the sequence of the eukaryotic rRNA-related gene. and the sequence from conserved sequence 3 (i.e., the ITS1 region), between the sequence from conserved sequence 3 and the sequence from conserved sequence 4 (i.e., the ITS2 region), or the sequence from conserved sequence 4 and the conserved sequence 5-derived sequence (ie, the 25-28S D1-D2 region) is replaced by a non-naturally occurring nucleic acid sequence.
  • a partial nucleic acid sequence (a) containing a sequence (a1) derived from conserved sequence 1 as a 5′ flanking sequence and a sequence (a3) derived from conserved sequence 2 as a 3′ flanking sequence is any of SEQ ID NOs: 8 to 19. ⁇ (a2) ⁇ :ATTGTCAGTCTAGCGAATCATTATACCGAAGAACATCCGTTTATGAGAACGTGCTACCAATTAACTGTACTAAGCTGTCC( ⁇ 8) ⁇ TTACTGATCGAACGTCGTATAATGCTGAGGCATCTGTTATTAACCGTACCTTTCAAGGATTACCATGTGGCAACATAAGT( ⁇ 9) ⁇ TTGGCCTTCAGTCGAGAACTTGTTGAAACTGTCCTGACGCACTGGAACGAGCTTCCATTGATTCGCTAGAAATGCCGACC( ⁇ 10) ⁇ CCTAGAAAGCTCGCCATTAGCCGCAGTAGTGATTGGACATCAGAGTTTCGCTCACAACGTCACCGCTCGTTATGAAACTT( ⁇ 11) ⁇ TCAGGAAGTGTGTCCCATTGCCGGA
  • a partial nucleic acid sequence (b) containing a sequence (b1) derived from conserved sequence 2 as a 5′ flanking sequence and a sequence (b3) derived from conserved sequence 3 as a 3′ flanking sequence is any of SEQ ID NOS: 20 to 31. ⁇ (b2) ⁇ :TCATAAGCAGAGCCTTTATCCCATATAAGCTATTGTCACGAAGTGTCACTGTGAACGAATGTTCTCTAAACTTACTACGGCTTCAGATGTAACGGATTCAGACTACTCTATTCATAACGGACTACAGATTGCGTCAACTACGATATTCTCTCTTGAGATCACGATTAGCAAGTACCTTTGCAGCTTGAAATTAACCAGACCTTTCCTTGGAATGCCTATACAGAGATTTATCATACCAGGAGTTCTCCAGATTACCTAGATGTCTTAACGAGATACAGGACTTACACGATGACTTAGTGTGTTGTTTGCATCAACCTAACAGTAACTGAGCGAATTGTACCAACGTATTCTTTACCGGAAGT( ⁇ 20) ⁇ CATCCTTGGTC
  • a partial nucleic acid sequence (c) containing a sequence (c1) derived from conserved sequence 3 as a 5′ flanking sequence and a sequence (c3) derived from conserved sequence 4 as a 3′ flanking sequence is any of SEQ ID NOS: 32 to 43. ⁇ (c2) ⁇ :AGTTGTCTGCCAGAAATCATTGAACATTCCGACGAATATCGACATGGTTGCTTATCTAAGACCTTAAACGGTACTTGGTTAGCTGATCGCAATACTTGAAAGACTTGATCCTGTACTTACCTGGACACGATGTAATAATCTCACACAGTTATGAGAAGCTGGTTGCACCTAAATAGTCAATTAGCACGTAGTAACGTAGACTTGCCACTGATGAAACATA( ⁇ 32) ⁇ CATTGAACACTTCGTAAGGTACACCTATGGATCAACGATTAAGTCTCGATACCGTAAGATGGTAACTCTAGTCAGTGATAATCAACAGCGTAGTACATTCGTAAGCAGTCTTGGACATTACTTTCTGAGTGCAACATTCAACGTCAA
  • a partial nucleic acid sequence (d) containing a sequence (d1) derived from conserved sequence 4 as a 5′ flanking sequence and a sequence (d3) derived from conserved sequence 5 as a 3′ flanking sequence is any of SEQ ID NOS: 44 to 55. ⁇ (d2) ⁇ :GAACGATTGAAGATGTACTCAGATATTCATTGATGGGCCTACGTCTACTTACTATGGGAATGTAAATACTCTGTTCCAGCCTAAGGTTAGCTTTGCGAATACAAATGTTCTTATCGACGCACAGTCATACGGATTACGATCAAGTTAATGGTTACTCCCTACCGATTGCATCCAGATCATATTGAGAGGAATCACCTGTACGGTTTAGAAATCAGCTCTACTAGAAGACACTATTGCCATACGTCAAATTGCAGTGAGTTTCACCAAATCATGGAGATGTTACCCAGTTAGCATACAACTCTTTGCACAAGTGCATAATGTAGTCCCTATGTCACAAGGTTATACGAAGCATGTCAAATCATCGCCTTTAGTTACGATGT
  • the nucleic acid of this embodiment comprises at least one of the partial nucleic acid sequences of (a), (b), (c) or (d) and/or its complementary sequence. That is, the nucleic acids of this embodiment may be either single-stranded or double-stranded.
  • the nucleic acid in this embodiment may be DNA, RNA, modified nucleic acid, etc., and the nucleic acid in this embodiment can be prepared using one or more of these.
  • nucleic acids in this embodiment may be, for example, single-stranded RNA, single-stranded DNA, double-stranded RNA/DNA hybrids, double-stranded DNA, and the like.
  • nucleic acid sequence composed of DNA is shown, but it can be read as another nucleic acid sequence such as RNA as appropriate, and the nucleic acid in this embodiment also includes them.
  • thymine (T) and uracil (U) can be appropriately substituted.
  • the nucleic acid of this embodiment preferably comprises two or more different partial nucleic acid sequences selected from (a), (b), (c) and (d) and/or complementary sequences thereof, and (a ), (b), (c) and (d) all partial nucleic acid sequences and/or complementary sequences thereof.
  • the arrangement order of the two or more partial nucleic acid sequences is not particularly limited.
  • the nucleic acid of the present embodiment contains consecutive partial nucleic acid sequences (a) and (b), (b) and (c), or (c) and (d)
  • the former 3' Part or all of the flanking sequence and the latter 5' flanking sequence may overlap, but preferably such overlapping sequences are not included twice in the nucleic acid.
  • each conserved sequence-derived sequence is preferably unique in the nucleic acids of the present embodiments.
  • the nucleic acid of this embodiment includes (e4) a 5' flanking sequence comprising a nucleic acid sequence derived from a prokaryotic rRNA gene, (e5) an artificial nucleic acid sequence comprising a non-naturally occurring nucleic acid sequence, and (e6) a prokaryotic rRNA gene-derived It may further comprise an additional partial nucleic acid sequence (e) consisting of a 3' flanking sequence comprising the nucleic acid sequence of.
  • nucleic acid sequences derived from prokaryotic rRNA genes used as (e4) and (e6) in the nucleic acids of the present embodiment may be any sequence highly conserved in prokaryotic rRNA genes, but metagenome analysis of prokaryotic organisms may be used. It preferably contains a sequence recognized by the universal primer used in .
  • (e4) in the nucleic acid of the present embodiment preferably contains at least 20 consecutive nucleotides in the upstream sequence of the V4 region of the 16S rRNA gene: CACCGGCTAACTCCGTGCCAGCAGCCGCGGTAATACGGAGGGTGCAAGCGTTAATCGGAATTACTGGGCGTAAAGCGCACGCAGGCGGTT (SEQ ID NO: 6), and preferably contains the full length. is more preferred.
  • (e6) in the nucleic acid of this embodiment preferably contains at least 20 consecutive nucleotides in the sequence downstream of the V4 region of the 16S rRNA gene: GTGGGGAGCAAACAGGATTAGATACCCTGGTAGTCCACGCCGTAAACGAT (SEQ ID NO: 7), more preferably the full length preferable.
  • the artificial nucleic acid sequence (e5) in the nucleic acid of the present embodiment may be any sequence as long as it is a non-naturally occurring nucleic acid sequence and is different from the artificial nucleic acid sequences of SEQ ID NOs: 8 to 55, ⁇ ATAAGAGCTTTGAGCCCACCCGCATACTGATTTGACTGCCTTAACTTGGTGAAGCCCTCGGACGGAAACTTGACATCTCGTTCTATCTGAATGAGCGCGGCACAGCTTGAGTCTACTTGGAATTGCATTAGCACCGGCCTGCCTTACAACACTGTTGCGTATTGGACTAACTAGCGGCCT( ⁇ 56) ⁇ GTAGTTAGGCAACTCTAGGCGGCAACTGCTCATCAACTAGGAGTACAGTCAATCTGACGGACGCGCTACTGCATACTTAGTCATCTACTGGTTCCAGAGCCACGGGTCATCGTAAATTGGGTATTCCGAAATGGCCCACACGCCGTTCACGTTTCAAATGATTGGCATCTAGGGACACCT( ⁇ 57) ⁇
  • nucleic acids of the present embodiment include the nucleic acid sequences of SEQ ID NOs: 58-69.
  • the nucleic acid sequences of SEQ ID NOs:58, 59 and 62-69 include all partial nucleic acid sequences (a)-(d).
  • the nucleic acid sequences of SEQ ID NOS: 60 and 61 include all partial nucleic acid sequences (a)-(d) and further include an additional partial nucleic acid sequence (e).
  • Nucleic acid sequences comprising partial nucleic acid sequences (a) to (d) are eukaryotic rRNA-related gene sequences in which the 18S V9 region, ITS1 region, ITS2 region and 25-28S D1-D2 regions are replaced with non-naturally occurring nucleic acid sequences and the nucleic acid sequence comprising the partial nucleic acid sequence (e) may be a prokaryotic rRNA gene sequence in which the 16S V4 region has been replaced by a non-naturally occurring nucleic acid sequence.
  • each of the partial nucleic acid sequences (a) to (e) is preferably contained in the nucleic acid molecule at a ratio of 1:1.
  • the nucleic acid of the present embodiment can be incorporated into an expression vector and introduced into cells.
  • the nucleic acid of this embodiment can be easily prepared by any conventionally known nucleic acid synthesis method.
  • the nucleic acid of this embodiment may be used by adding it to the sample to be analyzed at an appropriate timing.
  • the nucleic acid of the present embodiment can be added to a microbiota sample before nucleic acid extraction, and in this case, it is possible to control the accuracy of the entire analysis from nucleic acid extraction to amplification.
  • the nucleic acid of the present embodiment can be added to a nucleic acid solution extracted from a microbiota sample, and in this case, accuracy control of only the nucleic acid amplification reaction becomes possible.
  • microbiota means a collection of multiple microorganisms that exist in a specific environment.
  • Microbiota can be composed of, for example, at least 100, 300, 500, 700, 1,000, or more microorganisms.
  • the microorganisms that make up the microflora may be of any class of prokaryotic and/or eukaryotic microorganisms and may include known as well as unknown microorganisms.
  • Eukaryotic microorganisms means any unicellular or multicellular eukaryotic organisms of a size that cannot be distinguished by the naked eye, e.g., fungi such as yeast, mushrooms, molds; protozoa such as paramecium, amoeba, and the like, but are not limited thereto.
  • the present invention is an expression vector comprising the above nucleic acid.
  • Expression vectors that can be used in this embodiment are not particularly limited, and may be, for example, pUC19 plasmid vector, pT7Blue plasmid vector, pGEM plasmid vector, and the like.
  • the expression vector of this embodiment can be added to a sample to be analyzed in the same manner as the nucleic acid of the first embodiment.
  • the expression vector of this embodiment can be used by introducing it into a microbial cell.
  • a third embodiment of the present invention is a transformed cell containing the expression vector.
  • Cells that can be used in this embodiment may be any microbial cells, such as E. coli DH5 ⁇ , E. coli HB101, and E. coli JM109 (Nippon Gene Co., Ltd.).
  • Introduction of an expression vector into a cell can be performed by a method well known in the art, depending on the type of cell, such as chemical transformation or electroporation.
  • the transformed cells of this embodiment can be added to a microbiota sample before nucleic acid extraction, which enables precision control of the entire analysis from nucleic acid extraction to amplification.
  • the present invention provides a nucleic acid sequence that is at least 90% identical to a nucleic acid sequence comprising at least 15 consecutive nucleotides in an artificial nucleic acid sequence selected from the group consisting of SEQ ID NOS: 8-57. or a probe containing its complementary sequence.
  • the probe of this embodiment may be an oligonucleotide that specifically hybridizes with the amplification product containing the artificial nucleic acid sequence. Therefore, the probe of this embodiment is a nucleic acid sequence comprising at least 15, preferably 20 or more consecutive nucleotides selected from any position in the artificial nucleic acid sequence, and at least 90%, preferably 95% It includes the same nucleic acid sequence as above or its complementary sequence.
  • the probes of this embodiment are preferably labeled with a labeling substance (for example, a fluorescent dye such as FITC or Cy5) in order to detect the corresponding amplification product.
  • a labeling substance for example, a fluorescent dye such as FITC or Cy5
  • the probe of the present embodiment can be easily prepared by any conventionally known nucleic acid synthesis method, and can be labeled by a conventionally known method, if necessary.
  • the accuracy control of the analysis of the microbiota sample can be improved. It becomes possible.
  • nucleic acid sequences of SEQ ID NOS: 58-66 shown below were designed: In eukaryotic rRNA-related genes, the 18S V9 region, ITS1 region, ITS2 region, and 25-28S D1-D2 region were replaced by non-naturally occurring artificial nucleic acid sequences.
  • nucleic acids 1, 2, 5-12 SEQ ID NOs: 58, 59 and 62-69
  • a nucleic acid sequence in which a partial sequence of the prokaryotic 16S rRNA gene in which the 16S V4 region is replaced by an artificial nucleic acid sequence is added to the sequence in which the D2 region is replaced by an artificial nucleic acid sequence that does not exist in nature (nucleic acids 3 and 4 (SEQ ID NOs: 60 and 61 )); and partial sequences of the prokaryotic 16S rRNA gene in which the 16S V4 region was replaced by an artificial nucleic acid sequence (nucleic acids 13-17 (SEQ ID NOs:70-74)).
  • uppercase letters indicate conserved sequences derived from rRNA-related genes
  • lowercase letters indicate artificial nucleic acid sequences that do not exist in nature.
  • Nucleic acid 1 (SEQ ID NO: 58) TGATTACGTCCCTGCCCTTTGTACACACCGCCCGTCGCTAattgtctagcgaatcattataccgaagaacatccgtttatgagaacgtgctaccaattaactgtactaagctgtccAAACTTGGTCATTTAGAGGAACTAAAAGTCGTAACAAGGTTTCCGTAGGTGAACCTGCGGAAGGATCATTAtcataagcagagcctttatcccatataagctattgtcacgaagtgtcactgtgaacgaatgttctctaaacttactacggcttcagatgtaacggattcagactactctattcataacggactacagattgtgtaacggattcagactactctattcataacggactacagattgcgtcaactacgatattctctt
  • Nucleic acid 2 (SEQ ID NO: 59) TGATTACGTCCCTGCCCTTTGTACACACCGCCCGTCGCTAttactgatcgaacgtcgtataatgctgaggcatctgttattaaccgtacctttcaaggattaccatgtggcaacataagtAAACTTGGTCATTTAGAGGAAGTAAAAGTCGTAACAAGGTTTCCGTAGGTGAACCTGCGGAAGGATCAcatcctttggtctaagaaagtgcatgatttgagcataccaatcgccattacgataaagatcctttgagtctaacgtacactgtgtcatctgtaagataccattgtcactacttcagtcagaACTTTCAACAACGGATCTCTTGGCTTCCACATCGATGAAGAACGCAGCGAAATGCGATAAGTAATGTGAATTGCAGAATTCAGTGAATCATCGAATCTTTGAACGCA
  • Nucleic acid 3 (SEQ ID NO: 60) TGATTACGTCCCTGCCCTTTGTACACACCGCCCGTCGCTAttggccttcagtcgagaacttgttgaaactgtcctgacgcactggaacgagcttccattgattcgctagaaatgccgaccAAACTTGGTCATTTAGAGGAACTAAAAGTCGTAACAAGGTTTCCGTAGGTGAACCTGCGGAAGGATCATTAcacagtgtggatctgacgaattaccaaggcactccatgtgtgccatctacgtctcaggaattgtacctgctaccactaggcatcgagaacgctgcatgtattcaccgagtaaggtcttccagactccgataccgtatgtgttcccaggagaaatgtcgcttagccggttcaagccatcatgtcatgtg
  • Nucleic acid 4 (SEQ ID NO: 61) TGATTACGTCCCTGCCCTTTGTACACACCGCCCGTCGCTAcctagaaagctcgccattagccgcagtagtgattggacatcagagtttcgctcacaacgtcaccgctcgttatggaacttAAACTTGGTCATTTAGAGGAACTAAAAGTCGTAACAAGGTTTCCGTAGGTGAACCTGCGGAAGGATCATTAaagcgttggttcgttacgcaaggctctacgaaagcagtgtctacttagcgttcagtgcagcgatccacaatctcatgggtatgtcatcgaccagctacgacgcaagtttcccagatcaagattaggtgcccttcaagcacggttggaactctaccgagctacgacgcaagtttccca
  • Nucleic acid 5 (SEQ ID NO: 62) TGATTACGTCCCTGCCCTTTGTACACACCGCCCGTCGCTAtcaggaagtgtgtcccattgccggaggagtcctattgaatcacggattacgtctgtaacgctggaccgaggttgtatcatAAACTTGGTCATTTAGAGGAACTAAAAGTCGTAACAAGGTTTCCGTAGGTGAACCTGCGGAAGGATCATTAgcttcgattacgatgcccaaatacgatccgcgtagtttccacgaggtctacagtaccctattgttcgaggcagtaacctgaaccgcgtctgtcaacagttatgtgacggcaaacctgaaccgcgtctgtcaacagttatgtgacggcaagttgtccaagtccgagccat
  • Nucleic acid 6 (SEQ ID NO: 63) TGATTACGTCCCTGCCCTTTGTACACACCGCCCGTCGCTAtcccgcaaatacctttggagtgcgtcactatctaggagtgtgccgatgactcgtaatctccatcctcgaagttgcacgatAAACTTGGTCATTTAGAGGAACTAAAAGTCGTAACAAGGTTTCCGTAGGTGAACCTGCGGAAGGATCATTAataatccagggtccacgagtgaatgccctgcaaatgtaccaagttcctgaccttctggcatgtgaagccgatcttatcgctgaagagtctcgaagtcgctgacatacacccgtattgtcgatctgtggcgtaacggacacccttggcgtgtaacggacaccct
  • Nucleic acid 7 (SEQ ID NO: 64) TGATTACGTCCCTGCCCTTTGTACACACCGCCCGTCGCTAgacaccctgttcagattagcgagcctcagttacaccagattccgagttcgtaagatcgagaggagccatcatggacgtttAAACTTGGTCATTTAGAGGAACTAAAAGTCGTAACAAGGTTTCCGTAGGTGAACCTGCGGAAGGATCATTActgacggaccaatctgtatgtaaagcggctattcaggagcctatccgacgagttgatgcttacaaggcgatctatccctgaccagtgctaaccatgtgcataagagcagtctcactcacgagtctcggttccttagacgattcaatgccaagttgtgccggagaacacctgtgtgc
  • Nucleic acid 8 (SEQ ID NO: 65) TGATTACGTCCCTGCCCTTTGTACACACCGCCCGTCGCTAcatgactggaaaccctctgacgtgtaactctggaagctcagttatcggaaacggcgctaagctacgtgatcgtaagcagtAAACTTGGTCATTTAGAGGAACTAAAAGTCGTAACAAGGTTTCCGTAGGTGAACCTGCGGAAGGATCATTActctgatggacctggtgatacacggtactattttggcatggtcacatcgggcatctgtaagacctccagtttgtagtgtgtgcagagttcccagacagtctaagacggcattgactatggccttgtggttcgagaaccgaacatccaagagtttcgcgttcatggcgataacccttcaaacctgtgtggta
  • Nucleic acid 9 (SEQ ID NO: 66) TGATTACGTCCCTGCCCTTTGTACACACCGCCCGTCGCTAgcacctagcctttaacgagaagaatgtagccctacgccatcggcatgtgattccatacgatgttacgaaacctgaggcagAAACTTGGTCATTTAGAGGAAGTAAAAGTCGTAACAAGGTTTCCGTAGGTGAACCTGCGGAAGGATCActtctgaaactatgacgcgccaaccggaatcgtgtaatggattgacctacttgctcggacgacggataacgctgtatgcaaatgtgcctctgtaactcggctctgcgaactgctctgatctaACTTTCAACAACGGATCTCTTGGCTTCCACATCGATGAAGAACGCAGCGAAATGCGATAAGTAATGTGAATTGCAGAATTCAGTGA
  • Nucleic acid 10 (SEQ ID NO: 67) TGATTACGTCCCTGCCCTTTGTACACACCGCCCGTCGCTAtgcggagcatcctagtacaatatccggttgcctataagcccggtatgcgcgaattaacctaactgccagagatgagttccAAACTTGGTCATTTAGAGGAAGTAAAAGTCGTAACAAGGTTTCCGTAGGTGAACCTGCGGAAGGATCAtaggtcacgctagtaccaaggagactcagaccttacagcttgcttgcagacagatcggaatcccacagcagagtttagacgtttggagacagtcccacttcagtcgttggatgcacttagACTTTCAACAACGGATCTCTTGGCTTCCACATCGATGAAGAACGCAGCGAAATGCGATAAGTAATGTGAATTGCAGAATTCAGTGAATCATCGAATCTTTGAACGCAACT
  • Nucleic acid 11 (SEQ ID NO: 68) TGATTACGTCCCTGCCCTTTGTACACACCGCCCGTCGCTAacggcactgatgttcacccgccgtcgatcatacacgcagggcgatgactctatgcgaggctccgaccagtaacaggcgctAAACTTGGTCATTTAGAGGAACTAAAAGTCGTAACAAGGTTTCCGTAGGTGAACCTGCGGAAGGATCATTAcctggcgaatgtctaaggcgtccatatccgaggtgcagcgcgttgcctgaccattaggcccgtatagttcggcgtgaccgagatgccgctcagtacgacggtctaacaagctggcccgcacttgccaacctgtcgcgcttaacaagctggctcgcacttgccaacctgtcgc
  • Nucleic acid 12 (SEQ ID NO: 69) TGATTACGTCCCTGCCCTTTGTACACACCGCCCGTCGCTAcgtacctgtcagcacgctgttgaccttagcccgtggcaacgactgtgaagcctccgacacgtactgagggcgattcccagAAACTTGGTCATTTAGAGGAAGTAAAAGTCGTAACAAGGTTTCCGTAGGTGAACCTGCGGAAGGATCAccatactgcgaatgggagccgcggaggtaagtccttccctgatgaccttgcgcgtagggccgggtaagagcttctccactgactgtcaaccgtgggcacgccgaggatgctactcatgACTTTCAACAACGGATCTCTTGGCTTCCACATCGATGAAGAACGCAGCGAAATGCGATAAGTAATGTGAATTGCAGAATTCAGTGA
  • Nucleic acid 13 (SEQ ID NO: 70) AACTTTCAACAACGGATCTCTTGGTTCTCGCATCGATGAAGAACGCAGCGAAATGCGATACGTAATGTGAATTGCAGAATTCCGTGAATCATCGAATCTTTGAACGCACATTGCCCCTTGGTATTCCAGGGGGCATGCCTGTTTGAGCGTCATTTgtcgggcgactgctctcatgaccagcgtgggcgtccatggctgagcctcgtggctggcgagctctggcgggagggctggtcgagctgctgccacgctctcggctcgatcaccgtgtgacgtcggcgactccaccacggcacggcgacggtgtcacgctcctgggGTTTGACCTCAAATCAGGTAGGAGTACCCGCTGAACTTAAGCATATCA
  • Nucleic acid 14 (SEQ ID NO: 71) AACTTTCAACAACGGATCTCTTGGTTCTCGCATCGATGAAGAACGCAGCGAAATGCGATACGTAATGTGAATTGCAGAATTCCGTGAATCATCGAATCTTTGAACGCACATTGCGCCCCTTGGTATTCCAGGGGGCATGCCTGTTTGAGCGTCATTTcccaggagcgcgtgacaccgtcgccgtggtggagtcgccgacgtcacacggtgatcgagccgagagcgtggcagcatttatattgcaatataaatgctgccacgctctcggctcgatcaccgtgtgacgtcggcgactccaccacggcacggcgacggtgtcacgctctgggGTTTGACCTCAAATCAGGTAGGAGTACCCGCTGAACTTAAGCATATCAATAAGCGGAGGAAAAGAA
  • Nucleic acid 15 (SEQ ID NO: 72) AACTTTCAACAACGGATCTCTTGGTTCTCGCATCGATGAAGAACGCAGCGAAATGCGATACGTAATGTGAATTGCAGAATTCCGTGAATCATCGAATCTTTGAACGCACATTGCCCCTTGGTATTCCAGGGGGCATGCCTGTTTGAGCGTCATTTtaaggcccatgttgtaggtcgaattgctagcaattcgacctacaacatgggcctttaatgctgtgcgcaccaagaggatcaaccagtgtcggatgcatcccgacactggttgatcctcttggtgcgcacagcatttacccagaagtgtattcctctcgaggaatacacttcctcttggtgcgcacagcatttacccagaagtgtattcctcgaggaatacacttctctctc
  • Nucleic acid 16 (SEQ ID NO:73) AACTTTCAACAACGGATCTCTTGGTTCTCGCATCGATGAAGAACGCAGCGAAATGCGATACGTAATGTGAATTGCAGAATTCCGTGAATCATCGAATCTTTGAACGCACATTGCCCCTTGGTATTCCAGGGGGCATGCCTGTTTGAGCGTCATTTgtggtggagtcgccgacgtcacggtgatcgagccgagagcgtggcagcatttatattgcaatataaatgctgccacgctctcggctcgatcaccgtgtgacgtcggcgactccaccaccaccaccaccacggcacggcggcgacggtgtcacgcgctcctgggtaccgcggctagttcggcgtggctggcacGTTTGACCTCAAATCAGGTAGGAGTACCCGCTGAACTTAAGCATATCAATAAGCGGAGGAAAAGAAACC
  • Nucleic acid 17 (SEQ ID NO: 74) AACTTTCAACAACGGATCTCTTGGTTCTCGCATCGATGAAGAACGCAGCGAAATGCGATACGTAATGTGAATTGCAGAATTCCGTGAATCATCGAATCTTTGAACGCACATTGCGCCCCTTGGTATTCCAGGGGGCATGCCTGTTTGAGCGTCATTTggggcggttaaggaaagtcaaactcccgggctgtgaaggcccagtaggttgcgtagctaagacagcacctcataggcatgctgtgcgcaccaagaggatcatgcctatgaggtgctgtcttagctacgcaacctactgggcctaccaagagacgttacccgttaccgcggcggctggcacGTTTGACCTCAAATCAGGTAGGAGTACCCGCTGAACTTAAGCATATCAATAAGCGGAGGAAAAGAAACCAAC
  • GenScript Japan Co., Ltd. was commissioned to synthesize the nucleic acids 1 to 17 above.
  • nucleic acids 1 to 13 could be synthesized, but nucleic acids 14 to 17 could not be synthesized within the time required for synthesizing nucleic acid 13. This indicates that randomly designed non-naturally occurring artificial sequences can contain sequences that are difficult to synthesize.
  • PCR was performed using the following universal primers.
  • Universal primers utilized the eukaryotic 18S rRNA V9 region, the eukaryotic ITS1 region, the eukaryotic ITS2 region, the eukaryotic 25-28S rRNA D1-D2 region, or the prokaryotic 16S rRNA V4 region.
  • PCR reaction solution composition 1x KAPA HiFi and 500 nM primers.
  • PCR reaction conditions ITS1/ITS2, 95°C for 3 minutes; then 95°C for 30 seconds, 52°C for 30 seconds, and 72°C for 30 seconds 25 times; 72°C for 5 minutes.
  • 95°C for 3 minutes for 25-28S rRNA D1D2 and 18S rRNA V9; then 95°C for 30 seconds, 57°C for 30 seconds, 72°C for 30 seconds 25 times; 72°C for 5 minutes.
  • 16S rRNA V4 95°C for 3 minutes; then 95°C for 30 seconds, 50°C for 30 seconds, 72°C for 30 seconds 25 times; 72°C for 5 minutes.
  • nucleic acid 1 to 12 was amplified with appropriate efficiency using universal primers.
  • nucleic acid 13 was amplified only with extremely low efficiency, and was confirmed to be unsuitable as a standard nucleic acid.
  • a plasmid was prepared in which nucleic acids 1 to 12 were integrated into the pUC19 vector.
  • the plasmid was linearized by cutting with BsaI or BpmI and purified by AMpure XP (Agencourt). Concentrations were determined using the Qubit Assay Kit (Thermo Fisher Scientific) and the copy number of the nucleic acid was calculated. Concentrations were adjusted to prepare mixed solutions of plasmids containing nucleic acids 1-12 (10-10 6 copies of each nucleic acid).
  • a sample was prepared by adding DNA (1 ng) extracted from soil using FastDNA Spin Kit for Soil (MP Biomedicals) to the mixed solution. PCR was performed using a universal primer set for the biological 25-28S rRNA D1-D2 regions or a universal primer set for the prokaryotic 16S rRNA V4 region to obtain an amplicon library.
  • Composition of PCR reaction solution 1x KAPA HiFi and 500 nM primers.
  • PCR reaction conditions ITS1/ITS2, 95°C for 3 minutes; then 95°C for 30 seconds, 52°C for 30 seconds, and 72°C for 30 seconds 25 times; 72°C for 5 minutes.
  • 95°C for 3 minutes for 25-28S rRNA D1D2 and 18S rRNA V9; then 95°C for 30 seconds, 57°C for 30 seconds, 72°C for 30 seconds 25 times; 72°C for 5 minutes.
  • 16S rRNA V4 95°C for 3 minutes; then 95°C for 30 seconds, 50°C for 30 seconds, 72°C for 30 seconds 25 times; 72°C for 5 minutes.
  • Amplicons were sequenced using MiSeq (Illumina). The results were evaluated by a DADA2-based analytical pipeline and quantitative results were calculated.
  • Figure 2 shows the results of the universal primer set for the ITS1 region
  • Figure 3 shows the results of the universal primer set for the 25-28S rRNA D1-D2 region
  • Figure 3 shows the results of the universal primer set for the 16S rRNA V4 region.
  • the horizontal axis indicates the added amount of nucleic acids 1 to 12
  • the vertical axis indicates the ratio of the number of reads derived from nucleic acids 1 to 12 to the number of reads of the target sequence derived from DNA extracted from soil.
  • the results are shown in Figure 5.
  • the horizontal axis indicates the amount of soil added to the sample, and the vertical axis indicates the number of reads derived from nucleic acids 1 to 12 when the total number of reads in each sample is unified.
  • the theoretically expected number of internal standard gene reads decreased as the amount of soil increased.
  • the total amount of fungi estimated based on the number of reads derived from nucleic acids 1-12 is shown in FIG. Correlation between soil amount and fungi was confirmed.
  • Nucleic acids 3-10 (5 ⁇ 10 4 copies each) were added to the resulting dilutions using a universal primer set for the prokaryotic 16S rRNA V4 region and a universal primer set for the eukaryotic ITS1 region. PCR was performed under the same conditions as in 1 above to obtain an amplicon library for each sample. Amplicons were sequenced using MiSeq (Illumina) and results were analyzed by the DADA2 pipeline.
  • FIG. 7 the horizontal axis indicates the estimated copy number of the ITS1 region in the unit artificial sequence
  • the vertical axis indicates the measured copy number of the ITS1 region
  • the horizontal axis indicates the estimated mixture ratio of fungi/bacteria.
  • the vertical axis indicates the measured fungal/bacterial mixing ratio.
  • Sc5001 indicates nucleic acid 3 (SEQ ID NO: 60)
  • Sc5002 indicates nucleic acid 4 (SEQ ID NO: 61).
  • a sample was prepared by adding nucleic acid 4 (8.3-8.3 ⁇ 10 3 copies) to DNA (1 ng) extracted from soil, and a universal primer set for the prokaryotic 16S rRNA V4 region and a eukaryotic primer set were prepared.
  • a universal primer set for the biological ITS1 region PCR was performed under the same conditions as in 1 above to obtain an amplicon library for each sample. Amplicons were sequenced using MiSeq (Illumina) and results were analyzed by the DADA2 pipeline.
  • FIG. 9 shows the number of reads derived from nucleic acid 4 when the total number of reads is unified with respect to the amount of nucleic acid 4 added.
  • a high correlation was observed between the amount of nucleic acid 4 added and the read count for both the universal primer set for the prokaryotic 16S rRNA V4 region and the universal primer set for the eukaryotic ITS1 region.
  • FIG. 10 shows the abundance (absolute amount) of microorganisms for each taxonomy (phylum) estimated based on the number of reads derived from nucleic acid 4.
  • the absolute abundance of fungi/bacteria in a sample can be estimated by using nucleic acid 4 as an internal standard nucleic acid.

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Biomedical Technology (AREA)
  • Biotechnology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • Mycology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Analytical Chemistry (AREA)
  • Immunology (AREA)
  • Cell Biology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

(1)真核生物rRNA関連遺伝子由来の核酸配列を含む5'フランキング配列、(2)天然に存在しない核酸配列からなる人工核酸配列、および(3)真核生物rRNA関連遺伝子由来の核酸配列を含む3'フランキング配列からなる部分核酸配列および/またはその相補配列を少なくとも1つ含んでなる核酸を提供する。

Description

真核微生物を定量するための内部標準核酸
 本発明は、真核微生物を定量するための内部標準核酸に関する。
 土壌や海洋などの自然環境、動物の腸内、住宅などの人間の生活空間といったあらゆる環境中に、多様な微生物が生息している。多くの場合、それらはそれぞれの環境において固有の構成を保って定着しており、このような微生物の集合は微生物叢と呼ばれる。近年の微生物叢の解析では、原核生物については16SリボソームRNA(rRNA)遺伝子の、真核生物については18S rRNA遺伝子、ITS(Internal Transcribed Spacer)領域および25-28S rRNA遺伝子の配列を指標とした系統分類に基づくメタゲノム解析手法が盛んに用いられている。この手法では、上記rRNA関連遺伝子のうち高度に配列が保存された領域に対して設計されたユニバーサルプライマーを用いて、試料中に含まれる全rRNA関連遺伝子をPCRにより増幅することにより、微生物叢を構成する微生物の種類を網羅的に同定する。この際、次世代シークエンサーであれば、増幅されたrRNA関連遺伝子を網羅的に配列決定できるだけでなく、増幅産物を分子レベルでカウントできるため、微生物叢を構成する微生物の種類のみならず、その存在量の相対値を得ることができる(非特許文献1)。しかし、試料から核酸を抽出し、PCRで増幅する一連の過程で偏りが生じることは避けられないため、増幅産物のカウントに基づく存在量の相対値は、微生物叢を構成する微生物の存在比率を必ずしも正確に反映しない。したがって、そのような偏りを正確に把握し、補正するための精度管理手法が必要となる。
 PCRの精度管理のために、試料中に存在しない配列を有する外因性核酸(スパイクインコントロール)を内部標準として測定値を補正する手法がすでに知られており、自然界に存在しない非天然の核酸配列からなる標準核酸が開発されている(特許文献1)。しかし、非天然の核酸配列からなる標準核酸は、rRNA関連遺伝子のためのユニバーサルプライマーでは増幅できず、標準核酸の増幅にはユニバーサルプライマーとは異なるプライマーを用いなければならない。その場合、標準核酸の増幅効率をrRNA関連遺伝子の増幅効率と同等とみなすことはできず、厳密な精度管理は依然困難である。
 また、微生物叢に含まれる原核微生物と真核微生物とを同時に解析したい場合にも、それぞれのrRNA関連遺伝子のためのプライマーが異なるため、同様の問題が存在する。
特許第5229895号
Francesca De Filippis et al.,2017,Applied and Environmental Microbiology,Vol.83,e00905-17
 本発明は、微生物叢を構成する真核微生物および/または原核微生物の検出ならびに定量の精度管理のために最適化された内部標準核酸を提供することを目的としてなされたものである。
 本発明者らは、原核微生物の検出および定量の精度管理のために最適化された内部標準核酸をすでに開発している(特許第6479336号)。引き続き、本発明者らは、真核微生物の検出および定量の精度管理のための内部標準核酸の作製に成功し、本発明の完成に至った。
 すなわち、本発明は、一実施形態によれば、(1)真核生物rRNA関連遺伝子由来の核酸配列を含む5’フランキング配列、(2)天然に存在しない核酸配列からなる人工核酸配列、および(3)真核生物rRNA関連遺伝子由来の核酸配列を含む3’フランキング配列からなる部分核酸配列および/またはその相補配列を少なくとも1つ含んでなる核酸であって、前記部分核酸配列が、以下の部分核酸配列(a)~(d):
 (a1)配列番号1の核酸配列中の、少なくとも20個の連続するヌクレオチドを含む5’フランキング配列、(a2)配列番号8~19のいずれかの核酸配列からなる人工核酸配列、および(a3)配列番号2の核酸配列中の、少なくとも20個の連続するヌクレオチドを含む3’フランキング配列からなる部分核酸配列(a);
 (b1)配列番号2の核酸配列中の、少なくとも20個の連続するヌクレオチドを含む5’フランキング配列、(b2)配列番号20~31からなる群から選択される人工核酸配列、および(b3)配列番号3の核酸配列中の、少なくとも20個の連続するヌクレオチドを含む3’フランキング配列からなる部分核酸配列(b);
 (c1)配列番号3の核酸配列中の、少なくとも20個の連続するヌクレオチドを含む5’フランキング配列、(c2)配列番号32~43からなる群から選択される人工核酸配列、および(c3)配列番号4の核酸配列中の、少なくとも20個の連続するヌクレオチドを含む3’フランキング配列からなる部分核酸配列(c);ならびに
 (d1)配列番号4の核酸配列中の、少なくとも20個の連続するヌクレオチドを含む5’フランキング配列、(d2)配列番号44~55からなる群から選択される人工核酸配列、および(d3)配列番号5の核酸配列中の、少なくとも20個の連続するヌクレオチドを含む3’フランキング配列からなる部分核酸配列(d)
からなる群から選択される、核酸を提供するものである。
 上記核酸において、前記部分核酸配列(a)は、(a1’)配列番号1の核酸配列を含む5’フランキング配列、(a2)配列番号8~19のいずれかの核酸配列からなる人工核酸配列、および(a3’)配列番号2の核酸配列を含む3’フランキング配列からなり;前記部分核酸配列(b)は、(b1’)配列番号2の核酸配列を含む5’フランキング配列、(b2)配列番号20~31からなる群から選択される人工核酸配列、および(b3’)配列番号3の核酸配列を含む3’フランキング配列からなり;前記部分核酸配列(c)は、(c1’)配列番号3の核酸配列を含む5’フランキング配列、(c2)配列番号32~43からなる群から選択される人工核酸配列、および(c3’)配列番号4の核酸配列を含む3’フランキング配列からなり;ならびに/または前記部分核酸配列(d)は、(d1’)配列番号4の核酸配列を含む5’フランキング配列、(d2)配列番号44~55からなる群から選択される人工核酸配列、および(d3’)配列番号5の核酸配列を含む3’フランキング配列からなることが好ましい。
 上記核酸は、(e4)原核生物rRNA遺伝子由来の核酸配列を含む5’フランキング配列、(e5)天然に存在しない核酸配列からなる人工核酸配列、および(e6)原核生物rRNA遺伝子由来の核酸配列を含む3’フランキング配列からなる追加の部分核酸配列(e)および/またはその相補配列をさらに含むことが好ましい。
 前記追加の部分核酸配列(e)は、(e4’)配列番号6の核酸配列を含む5’フランキング配列、(e5’)配列番号56または57の人工核酸配列、および(e6’)配列番号7の核酸配列を含む3’フランキング配列からなることが好ましい。
 上記核酸は、配列番号58~69からなる群から選択される核酸配列および/またはその相補配列からなることがより好ましい。
 また、本発明は、一実施形態によれば、上記核酸を含む発現ベクターを提供するものである。
 また、本発明は、一実施形態によれば、上記発現ベクターを含む形質転換細胞を提供するものである。
 また、本発明は、一実施形態によれば、配列番号8~57からなる群から選択される人工核酸配列中の、少なくとも15個の連続するヌクレオチドを含む核酸配列と少なくとも90%同一の核酸配列またはその相補配列を含むプローブを提供するものである。
 本発明に係る核酸は、天然に存在しない核酸配列を有しつつ、真核生物のrRNA関連遺伝子を増幅するための公知のユニバーサルプライマーにより、真核生物のrRNA関連遺伝子と同様に増幅されることができる。そのため、本発明に係る核酸によれば、真核微生物を含有する種々の微生物叢試料の解析において、現在一般的に採用されているrRNA関連遺伝子に基づくメタゲノム解析の厳密な精度管理が可能となる。
図1は、本発明の核酸の例示的な構成を示す模式図である。 図2は、内部標準としての核酸1~12の定量性を、ITS1領域のためのユニバーサルプライマーセットを用いて評価したプロットである。 図3は、内部標準としての核酸1~12の定量性を、25-28S rRNA D1-D2領域のためのユニバーサルプライマーセットを用いて評価したプロットである。 図4は、内部標準としての核酸1~12の定量性を、16S rRNA V4領域のためのユニバーサルプライマーセットを用いて評価したプロットである。 図5は、試料に添加された土壌量と核酸1~12由来のリード数との相関を示すプロットである。 図6は、試料に添加された土壌量と核酸1~12由来のリード数に基づいて推定された真菌の総量との相関を示すプロットである。 図7は、真菌/細菌DNAの混合試料におけるITS1領域のコピー数(実測値と内部標準核酸3~10由来の計測値に基づく推定値)を示すプロットである。 図8は、真菌/細菌DNAの混合比率(実測値と内部標準核酸3~10由来の計測値に基づく推定値)を示すプロットである。 図9は、土壌から抽出されたDNAに種々のコピー数で添加された核酸4由来のリード数を示すプロットである。 図10は、核酸4由来のリード数に基づいて推定された系統分類ごとの微生物の存在量を示すグラフである。
 以下、本発明を詳細に説明するが、本発明は本明細書中に説明した実施形態に限定されるものではない。
 本発明は、第一の実施形態によれば、(1)真核生物rRNA関連遺伝子由来の核酸配列を含む5’フランキング配列、(2)天然に存在しない核酸配列からなる人工核酸配列、および(3)真核生物rRNA関連遺伝子由来の核酸配列を含む3’フランキング配列からなる部分核酸配列および/またはその相補配列を少なくとも1つ含んでなる核酸であって、前記部分核酸配列が、以下の部分核酸配列(a)~(d):
 (a1)配列番号1の核酸配列中の、少なくとも20個の連続するヌクレオチドを含む5’フランキング配列、(a2)配列番号8~19のいずれかの核酸配列からなる人工核酸配列、および(a3)配列番号2の核酸配列中の、少なくとも20個の連続するヌクレオチドを含む3’フランキング配列からなる部分核酸配列(a);
 (b1)配列番号2の核酸配列中の、少なくとも20個の連続するヌクレオチドを含む5’フランキング配列、(b2)配列番号20~31からなる群から選択される人工核酸配列、および(b3)配列番号3の核酸配列中の、少なくとも20個の連続するヌクレオチドを含む3’フランキング配列からなる部分核酸配列(b);
 (c1)配列番号3の核酸配列中の、少なくとも20個の連続するヌクレオチドを含む5’フランキング配列、(c2)配列番号32~43からなる群から選択される人工核酸配列、および(c3)配列番号4の核酸配列中の、少なくとも20個の連続するヌクレオチドを含む3’フランキング配列からなる部分核酸配列(c);ならびに
 (d1)配列番号4の核酸配列中の、少なくとも20個の連続するヌクレオチドを含む5’フランキング配列、(d2)配列番号44~55からなる群から選択される人工核酸配列、および(d3)配列番号5の核酸配列中の、少なくとも20個の連続するヌクレオチドを含む3’フランキング配列からなる部分核酸配列(d)
からなる群から選択される、核酸である。
 本実施形態において「真核生物rRNA関連遺伝子」とは、真核生物のリボソームを構成する18S、5.8S、および25-28S rRNAサブユニットをコードする遺伝子ならびに前記遺伝子間に存在するITS(Internal Transcribed Spacer)領域をいう。18S rRNA遺伝子と5.8S rRNA遺伝子との間にITS1領域が、5.8S rRNA遺伝子と25-28S rRNA遺伝子との間にITS2領域が存在し、これらはいずれも本実施形態における真核生物rRNA関連遺伝子に含まれる。
 本実施形態における5’フランキング配列および3’フランキング配列は、真核生物rRNA関連遺伝子において高度に保存された、以下の保存配列1~5中の、少なくとも20個の連続するヌクレオチドを含む配列(以下、これらをまとめて「保存配列由来の配列」と記載する)から選択される。保存配列1~5はそれぞれ、18S rRNA遺伝子のV9領域の上流、18S rRNA遺伝子のV9領域の下流/ITS1領域の上流、5.8S rRNA遺伝子、ITS2領域の下流/25-28S rRNA遺伝子のD1-D2領域の上流、および25-28S rRNA遺伝子のD1-D2領域の下流の配列である。
 保存配列1(配列番号1)
TGATTACGTCCCTGCCCTTTGTACACACCGCCCGTCGCTA
 保存配列2(配列番号2)
AAACTTGGTCATTTAGAGGAASTAAAAGTCGTAACAAGGTTTCCGTAGGTGAACCTGCGGAAGGATCA
 保存配列3(配列番号3)
ACTTTCAACAACGGATCTCTTGGYTYYCRCATCGATGAAGAACGCAGCGAAATGCGATAMGTAATGTGAATTGCAGAATTCMGTGAATCATCGAATCTTTGAACGCAMMTTGCGCCCYTTGGTATTCCGAAGGGCATGCCTGTTTGRG
 保存配列4(配列番号4)
ACCCGCTGAACTTAAGCATATCAATAAGCGGAGGAAAAGAAACYAAC
 保存配列5(配列番号5)
CCCGTCTTGAAACACGGACCAAGGAGTCTAAC
 本実施形態における5’フランキング配列および3’フランキング配列として用いられる、上記保存配列中の少なくとも20個の連続するヌクレオチドを含む配列は、真核生物のrRNA関連遺伝子を増幅するための公知のユニバーサルプライマー(例えば、Stefanos Banos et al.,2018,BMC Microbiology,Vol.18,Article number:190参照)により認識される限りにおいて、上記保存配列の任意の位置から選択されてよい。本実施形態における5’フランキング配列および3’フランキング配列として用いられる保存配列由来の配列は、上記保存配列中の少なくとも30個の連続するヌクレオチドを含むことが好ましく、全長を含むことがより好ましい。
 本実施形態における部分核酸配列では、保存配列1由来の配列および保存配列2由来の配列、保存配列2由来の配列および保存配列3由来の配列、保存配列3由来の配列および保存配列4由来の配列、または保存配列4由来の配列および保存配列5由来の配列が、5’フランキング配列および3’フランキング配列として組み合わされ、組み合わされた配列の間に、天然に存在しない核酸配列からなる人工核酸配列を含む。言い換えれば、本実施形態における部分核酸配列は、真核生物のrRNA関連遺伝子の配列において、保存配列1由来の配列および保存配列2由来の配列の間(すなわち、18S V9領域)、保存配列2由来の配列および保存配列3由来の配列の間(すなわち、ITS1領域)、保存配列3由来の配列および保存配列4由来の配列の間(すなわち、ITS2領域)、または保存配列4由来の配列および保存配列5由来の配列の間(すなわち、25-28S D1-D2領域)が、天然に存在しない核酸配列により置換されたものである。
 5’フランキング配列として保存配列1由来の配列(a1)を、3’フランキング配列として保存配列2由来の配列(a3)を含む部分核酸配列(a)は、配列番号8~19のいずれかの核酸配列からなる人工核酸配列(a2)を含む:ATTGTCAGTCTAGCGAATCATTATACCGAAGAACATCCGTTTATGAGAACGTGCTACCAATTAACTGTACTAAGCTGTCC(配列番号8)、TTACTGATCGAACGTCGTATAATGCTGAGGCATCTGTTATTAACCGTACCTTTCAAGGATTACCATGTGGCAACATAAGT(配列番号9)、TTGGCCTTCAGTCGAGAACTTGTTGAAACTGTCCTGACGCACTGGAACGAGCTTCCATTGATTCGCTAGAAATGCCGACC(配列番号10)、CCTAGAAAGCTCGCCATTAGCCGCAGTAGTGATTGGACATCAGAGTTTCGCTCACAACGTCACCGCTCGTTATGGAACTT(配列番号11)、TCAGGAAGTGTGTCCCATTGCCGGAGGAGTCCTATTGAATCACGGATTACGTCTGTAACGCTGGACCGAGGTTGTATCAT(配列番号12)、TCCCGCAAATACCTTTGGAGTGCGTCACTATCTAGGAGTGTGCCGATGACTCGTAATCTCCATCCTCGAAGTTGCACGAT(配列番号13)、GACACCCTGTTCAGATTAGCGAGCCTCAGTTACACCAGATTCCGAGTTCGTAAGATCGAGAGGAGCCATCATGGACGTTT(配列番号14)、CATGACTGGAAACCCTCTGACGTGTAACTCTGGAAGCTCAGTTATCGGAAACGGCGCTAAGCTACGTGATCGTAAGCAGT(配列番号15)、GCACCTAGCCTTTAACGAGAAGAATGTAGCCCTACGCCATCGGCATGTGATTCCATACGATGTTACGAAACCTGAGGCAG(配列番号16)、TGCGGAGCATCCTAGTACAATATCCGGTTGCCTATAAGCCCGGTATGCGCGAATTAACCTAACTGCCAGAGATGAGTTCC(配列番号17)、ACGGCACTGATGTTCACCCGCCGTCGATCATACACGCAGGGCGATGACTCTATGCGAGGCTCCGACCAGTAACAGGCGCT(配列番号18)、およびCGTACCTGTCAGCACGCTGTTGACCTTAGCCCGTGGCAACGACTGTGAAGCCTCCGACACGTACTGAGGGCGATTCCCAG(配列番号19)。
 5’フランキング配列として保存配列2由来の配列(b1)を、3’フランキング配列として保存配列3由来の配列(b3)を含む部分核酸配列(b)は、配列番号20~31のいずれかの核酸配列からなる人工核酸配列(b2)を含む:TCATAAGCAGAGCCTTTATCCCATATAAGCTATTGTCACGAAGTGTCACTGTGAACGAATGTTCTCTAAACTTACTACGGCTTCAGATGTAACGGATTCAGACTACTCTATTCATAACGGACTACAGATTGCGTCAACTACGATATTCTCTTGAGATCACGATTAGCAAGTACCTTTGCAGCTTGAAATTAACCAGACCTTTCCTTGGAATGCCTATACAGAGATTTATCATACCAGGAGTTCTCCAGATTACCTAGATGTCTTAACGAGATACAGGACTTACACGATGACTTAGTGTGTTGTTTGCATCAACCTAACAGTAACTGAGCGAATTGTACCAACGTATTCTTTACCGGAAGT(配列番号20)、CATCCTTGGTCTAAGAAAGTGCATGATTTGAGCATACCAATCGCCATTACGATAAAGATCCTTTGAGTCTAACGTACACTGTGTCATCTGTAAGATACCATTGTCACTACTTCAGTCAGA(配列番号21)、CACAGTGTGGATCTGACGAATTACCAAGGCACTCCATGTGTGCCATCTACGTCTCAGGAATTGTACCTGCTACCACTAGGCATCGAGAACGCTGCATGTATTCACCGAGTAAGGTCTTCCAGACTCCGATACCGTATGTGTTCCCAGGAGAAATGTCGCTTAGCCGGTTCAAGCCATCATGTGCTAGACTAGACACGTCTATCGCGGTTTACACGACCATCAGTTGAGCCAATGCTATCCTTGCGGGTCAAACAGAGCTTACGGATCACCCATAGTTGTCACGCCACGTTAAAGTTCCGAGCGAAACGCTATCTCTTCGAGAGCTGTCCCAATGAAACTCTGCACGGACTTGTATTGCAC(配列番号22)、AAGCGTTGGTTCGTTACGCAAGGCTCTACGAAAGCAGTGTCTACTTAGCGTTCAGTGCAGCGATCCACAATCTCATGGGTATGTCATCGACCAGCTACGACGCAAGTTTCCCAGATCAAGATTAGGTGCCCTTCAAGCACGGTTGGAACTCTACCGACAATTACGAGGTCCCAATTACGGGTGGCAACTATGCTGTACCAGTAAGATCCTGCCGATTCGACGCACAGTCATAACTCAGTGTACGTGTATCCTGGCAAGGAGGAAGCTCCCTTTACATGCTAGTGCAATGTCCGCAGTTTGCGAGAGGACTATATCCAGTCTACCACAGGTCAGAGGTTACACCCTGGCTATCTAGTATGG(配列番号23)、GCTTCGATTACGATGCCCAAATACGATCCGCGTAGTTTCCACGAGGTCTACAGTACCCTATTGTTCGAGGCAGTAACCTGAACCGCGTCTGTCAACAGTTATGTGACGGCAAGTTGTCCAAGTCCGAGCCATACTATCAGTCGTCTTAGCTCATGGGAAGCTCGCAGTGTTAAGCTCAGTAGGCAAATTCCAGCGTGATGCCGATCCAGTGTACGAGAATCCTTACATGCAAGTGTCGCAGGCCAGATCAGTTTCGAGAAAGAGTACGTTCTATCCCTGGCGTCCTCAGTGACTCAAGATGAGATTACATCCACACGGTCTCGGTCCATTCGCAAAGTACAGTGTTTCCTTAGCAGCAGG(配列番号24)、ATAATCCAGGGTCCACGAGTGAATGCCCTGCAAATGTACCAAGTTCCTGACCTTCTGGCATGTGAAGCCGATCTTATCGCTGAAGAGTCTCGAAGTCGCTGACATACACCCGTATTGTCGATCTGTTGGCGTAACGGACATACGATGCACTGACAGCAGTTGCTTAGAGCCTAGACACGACATTGCCTTGAACGACCTTGCTACTCATAGGGATACCCGACGTAGACGTTTAGTCCTGCAAGTCGAAAGCCCTTTGTGAGAGTCGCCTTATAGTACCGGATAGTCTCCCAGCCATATTGGAGAGTCCATATAGCCACGGTAGAATGCTCCGAGGTAACCTGAGTCAAATTGCCGCACTAG(配列番号25)、CTGACGGACCAATCTGTATGTAAAGCGGCTATTCAGGAGCCTATCCGACGAGTTGATGCTTACAAGGCGATCTATCCCTGACCAGTGCTAACCATGTGCATAAGAGCAGTCTCACTCACGAGTCTCGGTTCCTTAGACGATTCAATGCCAAGTTGTGCCGGAGAACACCTGTTGATCCTCGACAATGATTCAGTCCACCGGGATGTCTGTAGTTCCCAACGCCAATATGTAGAGCTTCGGTCCACGAAAGTACCGTGGTAGCCATGATATGACTTACGCCCGACAAAGTTCGGGAGTTTCTCGCATGTGAAGTTTCCGCAACCATGAGCAAGGTCGTTTGACCTGGAAGTGTATGATCCG(配列番号26)、CTCTGATGGACCTGGTGATACACGGTACTATTTGGCATGGTCACATCGGGCATCTGTAAGACCTCCAGTTGTAGTGTGCAGAGTTCCCAGACAGTCTAAGACGGCATTGACTATGGCCTTGTGGTTCGAGAACCGAACATCCAAGAGTTTCGCTCGTTCATGGCGATAACCCTTCAACGTGTGGTAACCTGTAACGCAGTCAGCTTTAGCGCGTGAATACCTTGAGGCAATACACCGAGTTGTGCTACCCTAGTGATGACAGAATGGCACCTTATGCTCCGGTACACCTACGGAATCATGCAAGTGGAATCCCTTTCGAGAGCAGGCTCAGTTTAGTTGCGAAGTGATCTCCGCATTTCC(配列番号27)、CTTCTGAAACTATGACGCGCCAACCGGAATCGTGTAATGGATTGACCTACTTGCTCGGACGACGGATAACGCTGTATGCAAATGTGCCTGTAACTCGGCTCTGCGAACTGCTCTGATCTA(配列番号28)、TAGGTCACGCTAGTACCAAGGAGACTCAGACCTTACAGCTTGCTTGCAGACAGATCGGAATCCCACAGCAGAGTTTAGACGTTTGGAGACAGTCCCACTTCAGTCGTTGGATGCACTTAG(配列番号29)、CCTGGCGAATGTCTAAGGCGTCCATATCCGAGGTGCAGCGCGTTGCCTGACCATTAGGCCCGTATAGTTCGGCGTGACCGAGATGCCGCTCAGTACGACGGTCTAACAAGCTGGCCGCACTTGCCAACCTGTCGCGGACTGTCTTAACGGTGGCCCGACTTGCTACCACACCCGTGGGATTGTGCTACGAAGCGTCCCGAAGGTCCTCAGCCCAAGAGTCCTGTAGTGAGTACCCGGAGCCTCGACCCTGATGTGATCCGACCAGATTGGAGCCGGTGACCCTCAGACGGAGTCAAGGTCCTACCTGTGAAGCCCTGACGGCGTGGATTCCTGCTAGAGCCAAGGAGAGTGTCCCGCTAC(配列番号30)、およびCCATACTGCGAATGGGAGCCGCCGGAGGTAAGTCCTTTCCCTGATGACCTTGCGCGTAGGGCCGGGTAAGAGCTTCTCCACTGACTGTCAACCGTGGGCACGCCGAGGATGCTACTCATG(配列番号31)。
 5’フランキング配列として保存配列3由来の配列(c1)を、3’フランキング配列として保存配列4由来の配列(c3)を含む部分核酸配列(c)は、配列番号32~43のいずれかの核酸配列からなる人工核酸配列(c2)を含む:AGTTGTCTGCCAGAAATCATTGAACATTCCGACGAATATCGACATGGTTGCTTATCTAAGACCTTAAACGGTACTTGGTTAGCTGATCGCAATACTTGAAAGACTTGATCCTGTACTTACCTGGACACGATGTAATAATCTCACACAGTTATGAGAAGCTGGTTGCACCTAAATAGTCAATTAGCACGTAGTAACGTAGACTTGCCACTGATGAAACATA(配列番号32)、CATTGAACACTTCGTAAGGTACACCTATGGATCAACGATTAAGTCTCGATACCGTAAGATGGTAACTCTAGTCAGTGATAATCAACAGCGTAGTACATTCGTAAGCAGTCTTGGACATTACTTTCTGAGTGCAACATTCAACGTCTAAACGGGTTAAATCTCTCATAACGGAACTTGTGTGCAACAGATGCTATATGGTATGCAAATGCGATACACTTTG(配列番号33)、ACTATGAGGCCCACAGTTACGAACGACTAGACCACTGTCTTACGAGTGTCGCACCATAAGATGGCGAGTAATCCGCTCAATCCACTGGTTCCTGAGAAAGAGCCGGAAATCTGAGGTCATTCTGCCCATGATAGCTGGAAACACCCGAGTCTCTAAGTGTGAGTAGCCTGATCTACTGCAAACGCCCGATACATATCGTGAGAGTCTGCTAGGACTGATC(配列番号34)、ACCGTAAAGCTAGGTCAGGTCTTCACTGGGCAACGACATAATGGGTAACTCACTTCCAGCCTACATCAGCGGTGTCAAAGGTAGATGCCTATCGTACCACCCACAATGCTCTAGGGTTTCAGAGAAGCTGTGTCTTCCGATGGTCACCAGATGGATTCGACTCAAGGTCATACAGGAGTGTCGCGTAACATAGCCTATGCAACCGTTCGGTTAAGGACGT(配列番号35)、AACATGCTGCGTAGTACGTCGATCACCAAGCTATGAGCGTTGTCAAAGGAGTGTCAACCGACGAGTCCAGGTTTCATCACCTTGCTAGGTATCCACAGGTGCATTAGGCGGCTAAGTCTTCCACATCGTATTGCCGAAGTGTATCGCCCAGACATTCAAGCTGTCAGAACTCTGCGTTACAGAACGTGCCGTCAAGATTCAGGCTATCATCCGTGAACCA(配列番号36)、AGTGACAGTTCACGGTAGCAGCTAAATCTTCGGGCATCACGAGTACATGAGTCTCCCATCGTTAATCCAGCAAGCCGATGTGGAGCTATTTCAACGGGACGTATATGTCGTCCATCCGAGTTGCGGACTATCTACAGGGTGAATTATGCGACTGACTGCCTTGCCACTACGAAACAGTGCGTTCAAATTGCGCTAAGGGCGTGCGAATACTTATGCAGGC(配列番号37)、ATCTGACAGCCTTCTACGAGCCTGCTGAATCAGATGAACCACTTGGTCGCAATGATCGCAAGGTCGGGTATATCTTCACGGTTAGATCCGAACTGCTCCACTGGGTACAACACACTGACTTGGTAACTCGGTCATACACGTCGGGAACATAACTGCCTGTGATAGCACGCACTCTTAGGACAGTCGCATTCTCTAGGTCATGGAATAGCGCAACATCGCT(配列番号38)、AACTTAGGGAGTATGCCGTCGAACATCGCTCGTGAGTAACTTATCGTGCGGATACACCTCGTACATGCCACTCGGTACTTAGAATAGCTGGTAACCTCCGATGCTCGCAATGCGTAGTTCTGGATTCCAATGGACCAACGGTCATTCCTGGGTGACAAAGCAATCTCCTGTAGCAGGTCACAGTTCTCGTCTCGCAGTAACGAAGTCCTCTTACGTCATG(配列番号39)、TCCACGTAAATCAGCGCGTTATGGGTCTGACGTAAGCACAAGGGTCCTATACACGCTACTCTGGTTATCCCTGAGAAGTCGGTTACCATGTCACACAGTCAGGCTATATGCCCTCACGTTGATTCGAGCGAAGTTACTGCACCAAGTCTGGCGTAGTTAGTGTTCCGTAGAGCAAGTCACTCAATCCCGAGCAAAGTGTCGTGATGCTGTTCAGCAAGAC(配列番号40)、CAGGGTTCCCTAGTAAGTACGATTCCAATACGCGATCCGAATGCGGCGTTTCCTAAGCAAGGTATAATCTCCTGACGAGGAGTCGGGTCCATAAGGTTTCCATAGTTCACCGTGAGACTGCGATGGTCTGCCAATGTTCACTTCAAGTCCGTAAGACACGGCAAGAGCCTAGCATCTGTTCGTTCAGAGTCATGGTATCGGACAACTGCCTGATCTTCGA(配列番号41)、GCGGACGATGCCTTTGTCGATAATGCTCCCGCTGTAGGCCAGCGCCAATCGGCTGTGCATTTAGCGAGGTCTCACGCCAGTGCGAGTACGAGCCTTCCTCCTAAGCGTTCGGTCGGACAGGACATCTGGATCGCGGAACCCTAATCCCGTGGGACACCGTCACTTGGTCGATGCGCGTAGCTTGTCACCGCAGGGACTGAGAGGTCAACCCATGCGACTG(配列番号42)、およびGGCAGCTTTACGGTTCCCAGTGCCTAATGAGGACGCCTGGGCGGAATCGAGCCTTCGGAAAGACATCTGCAGCACGGTGCCTGCAACCTGTCGGTGACGTATCAGGACCTGGTGTCCACCCGTTGTCAGGGCTTCCAAGGTCAAGCAAGTGGTGACCGGCCATGCGTGGTCGCTTCACAGAACATCACGGCAGTCGCCGTATCGGCCCGAGTGAGACTAG(配列番号43)。
 5’フランキング配列として保存配列4由来の配列(d1)を、3’フランキング配列として保存配列5由来の配列(d3)を含む部分核酸配列(d)は、配列番号44~55のいずれかの核酸配列からなる人工核酸配列(d2)を含む:GAACGATTGAAGATGTACTCAGATATTCATTGATGGGCCTACGTCTACTTACTATGGGAATGTAAATACTCTGTTCCAGCCTAAGGTTAGCTTTGCGAATACAAATGTTCTTATCGACGCACAGTCATACGGATTACGATCAAGTTAATGGTTACTCCCTACCGATTATTGCATCCAGATCATATTGAGAGGAATCACCTGTACGGTTTAGAAATCAGCTCTACTAGAAGACACTATTGCCATACGTCAAATTGCAGTGAGTTTCACCAAATCATGGAGATGTTACCCAGTTAGCATACAACTCTTTGCACAAGTGCATAATGTAGTCCCTATGTCACAAGGTTATACGAAGCATGTCAAATCATCGCCTTTAGTTACGATGTAGTTCCACAAGCGAAATTAGTTTCCGAAATGGTCAAGCATCCAAGTTTAGCTCGAATCTTTAAGGAGATACTCGAAGTGCCTATATTACGGAGGTATTATCATGTAGCAAGCGTTACCTAGCTTATTAGTCCACGAATCATGTGTTAGAAGTCGTCAAGTTCATGTTATCCTACCAG(配列番号44)、GTAAAGCTATTAACCGGAGTGAATCCTTCATTAAAGTCGCACAAGCTGTATTACCGTTACGCAACGTATTTGATTGACCATGTGAACAGAAGTACCCTATTGACCTAGATTATGCAGCAATGCCTAAGACTATTTGCCTAATTCGGGCTATTTAGACCAATCCTCCATGATGTATATCAGTCAAGGCTAGTTTGGAACATACACGAAAGTCCTTATGTAGTAGAGTGCAATTCTCGTATCCTTCAACAGTGTTATCGAGTATCGAACGATTATCCTATGGGTATCCACTTATAGAACGTGTGTAGACTAACCTGTAAACGATGTCTCTGAAAGCAAGACTACTTATCTGAGATCGGATGTTTAAGACGCTATGACACCATTAACTTATGCCAGTGCTAGTCATTATGACCACGATTTGGAATTTATGGCTATCGCCACTATGAAATGCTAAGCTACCTGAACAATTTGTACGCAGTGACAGTAGATCCTTTGATCCAGAACTTATTAAGAGCTGACCCTATGAAACGTGATGTCCTATTCATTATTACGGGAAACCGTAG(配列番号45)、TCAGGCTATATTGAGGCACCGCCTGGCTAGTAGATTACGACAGCTATAACTTCGGGCAAGCCGGTTGATCCAACTATCGAAACCTCGTTAGAGCAGTGTGTGGCCTAATGGCATACTGGAACCTATCTGTTACGCCGAGAACTCGTGAGCAACTCAGTCTCATAAAGTCATGGTCCGCACTGATGCTGCACAAAGCTACCGATTGATACGTTCGCCGACTGTGATGCGTGAATCATTCCGTCAAAGTGTCCACCCGTGTAGGCATTGGTATATCGACCGATCCAAGAAGCGACGCTTAGTACGCGATTACATTGGGCAGATGGTACAGCTCCCATAAACGCTAGGAACTGTTCGCAAGAGTCCTGTGTCAGAGTCAAGGATACCGTTCAGAGGCAAACTGACCGTCATTCGTGCTAAACGATGTGATCCGCCCTTTCAGACGCTAGTGTTACCTGGAAGAAGATTGGCGCTACCTATGTCCCATACAGCGACAAGGTCTTGTAGAAGGCATGTCAAGCTCCCTAAATGGCTCCGCTAAAGTACGTGTTGAGGGTCTCCAA(配列番号46)、GCTGCTTAGCCTATACCGTAATCGGTGTGCGTGAACACTAGCCAGGTACTGAATCTAGGATCGCTGTGGATCTAACCAGTCCGCTACGACAAGAGTTTACTAGGACCGCCTAAATCATCGGCGCTTACCGTTAAGAAACCTGTCCGGCGACATATACAGTGCCATTGCGCTTGAGAATCATGCTGTGCGAGAGACATACACGGTTCCGAGTTGACATCTACGTGAAGGGCATCTTTCGATGCTGACCCGAAGTTTATCTGGGAAGCTACGTCATTTGCCTACCGCTGCGACTAATCTTTGCAGACGACATGCTATGAGCTTGCTGGACCACGAATCGTTACCAGTCATCTGAGACACTTGGCATACGCTTGGGCTTGATACACCTATGGATGGGATACACTGATCGGCTGCCGCATAATTTGCTACGCCTTACAGAGAAGTGCAGTCTACCGGCTGTTAATACTCCGGCTTTACACGAGAAGCTACTGAGGGCCATTTGACACAATCGCGTGAGTTTGCTGATCTGACATGGGCTGAAACATGAGCCTCCGAACTATCGT(配列番号47)、TACGTGAGATCGGTCCGATATGAGCTGTCCACAATAGCCATAGACTAGGAGTCACCCTTCGAGTGGTTCTAGCACATCCAGATGACACACTAAGTGCCCTGTTCGGGACTTGTAAAGCACGATTCCTTGGTTAAGACGCCTCCCAGTCAGTATCATGGTCGTAAAGTTCGTCCAGTGGTCAACGCTCTTCGTCAAGCGATAAGTTAAAGCCGGTAGCTGCTCAAGCCTGCCATACGGATTAGTTCAAACGAGCCTGTCGTGTACGTTCTCCGCACAATGTCTAACAATGGTACGGTGCAGATAGCTTCCGCCCAGGTTATTAAGGCAAATTGGCCCATCCATTCTGTCGGTCGGCAAACAGTTCCTGAAATTCCGCTGAGGTTGTAAGACCCGGTCTGAATAGCCAGATCAATACGTCGGTGCTGATGAGTGCCATCACAGTTTCTCTAGGATAGCGCACGTTCATGTCGCGTAACGCATCTAGCATTTAGGTGCAACGGTACTACGTCCACCAGTAGGAAGTTCGCATAAACGGTCACCTTAGCCTGAGTAGCCGTCAA(配列番号48)、ATGTCCAACCGAAACTCGTGATCTTAGTGACCGCACGGATCTGTCATTCGAGAAGCGTAGAGACTTATGCCTGGGCCTTAACTTGTGCTCAGTAGCCTCAAGAGAACTGCCTCCTGTCTATTACGGGTAAACTCCTGGTGATCCAGAGACGTAGTGTCAGAACAGCCTAGATGTGTTGCCACGACCTGTAAACGGCTTTCTTACGACGCAATGCTGATGGTGACTGGCGATTAACGAACCGAATCATCCTGTGTGCATCCTACGGTGTGCCATTTGAACCAGAGAGTATCTTCGACCACGATCTGCAAGGGTGTCATGCTTGACCTAGAGTACCACGTTCAGTTGCCTCATAGGGCTTAGCAGCGTATTCATGCGACTTGCGATAACGATGTCCTGTACGGACGTTCCATAGTCCGACAAACCCATGTATGTCTGCGAGAGGTTAGCCAAGAGTGCTTACTCCACCTAGTGAGATGTAGCGACAACGACTGTGAGTGTACGACTCCTTAGGGTATAGCGTTGCCAAACTTCCCAAGGTAGGGAGCCTTTCCCATTACGAA(配列番号49)、TCCACAGTATCATCCGATGGAGCGATTCGCATACGACAGTCAATGGCTATTGGTCAGGACCTAGCTTCCAAGTCAAGGGAAGGTTTCAGGATCGTCGCATCGTACTTTCCTACGAAGTGCCTAAAGGGATCACTCTCCGAACGGTTTGTATCAGCGTGCAGATGTACCTGTTACGCCAGAGGAATGACATTCTACCCGAGGGATCTTACAGTCCGGGATTTGTGCAATCACAGTTGGGCTCTAACGTCAAGCGAGGTGTATGTCCCATGAATAAGGACGGCTTTCTCAGGCCAAGAAGTCTACGCAGAAGTTACCCAGCTCGTTTACGGTGTCCACTCAAAGTCTAGCATGTTCCGGTGACCTAGTTGATGGCAGTAGCAGTACCATGACAAGAGGCTTCCGATTATCCAGACCCAGTTGTGGGCTAATATGAGCAGCACCCTAGTATTTCGCGCAATGCCGGTTATATGAAGGCCACGTACAAGTTTCTCCGCGCATGTGTCAGATAGTATCCGGTTCCACAGCATAAGTCCGCCAGTTGGTTCACTAAGTTGCCGACA(配列番号50)、TATTGACGACCGTTGCCAGAGAGCCATCACTTGGTTTCGACTATAACGACAGATCCGTGGCCTCCTAAAGTTGCGTATGCAGTATCGAGATGTACCCTGCGAACCGAGTGTACTAACGTGTCTGAGGAATCCATTCCCGTATCGGGCACAACAGTATGTGTCTTCCAGATAGAGGGCCTTTGCTGACGAAGTCCTAGACTATCGCTTAGAGACGCCTACAGACCAGTAATCGTGACCTTCTACCTGAGATGCCGTGAACATAGGTGCTAATCCGAGAGCATGTGTACGAACTCCGAACCTTGCCATTAAGGGATGAGCCTACTGAACTACCGCTGATCGTGCGAGTATATCCTGCTGCTAACGTAAACTCCTGAGGGCTACAGCTAAACAGCTTGGACCTAGTGTCATATCGCCGTTCCAACTGACTCCTTGAGAGACTGCGTAAGATTTCCGCCGACATTGCCAAACGCTAATTGCCGATGGTGTAAACGACCCGCATTCCATTGGTTGCTAAAGCCTCGTAAGAATCCGGGCTGACTATCATGTGAGCTTGACGCTAC(配列番号51)、
AGGTCCTCAGAGGCTAATGTTTCATGCAATGAGATCCCGCGTGGACACCACCAAGATTCTACTGTTGTCAAGATACGGGCGACTCGACATGGAGCTACTATTCTATCAGAAGAGCCCTGCCAGGCGTTCAATCGCATTTCCATTTAATGGCTGACTCGCGCAGACGAAGTCTCCTAGAGTTAAGTCTTACGAGCACCGCTTGTGTGAGCACGATCATACGATACTGACTAAGGCGTCACCGAGTTTCAGACCCTACGACATGACTGTCTTTAGGCCAGAGTCTACTAGACCGAGCTTTGGATGCCAACCTTTCCGAAGTGAGATTTACCCACAGCGTTCGTGTGTTCGACTAACCCGCAAAGTGTTACCATAGGCTGGTCCTATTTCGCAGTGGCTAGAGAGCAATGTTCCAGGATGTGCTACTACTTGCCGTGAGCTAGACATACCGATGGCTAAGTGGATACGTTACAGGCGCACGTAGTTCTAACCGGCTTATACGGATAACCTGACCCGAGCGTTATTCTTATGCCGCAGAGAGGTTTCTTACCCGAAGGCACTAG(配列番号52)、GTCACATGCAAGCTGTTTCCTTCTACATGACGAGCCTCTGCGATAGGTGAGTATCCCACTCATTGATAGCTGCCGCAAGTCAGGAGAATACGTCCGTTAGTAAACTGTCCCATGCCGAAGCTCAAGACCTGGAAGTCCTTGATAACTGGCACACTCTGAGCCAACTGAACGTGTACGCATTACAACTCCGGTGTTAGCCTGCTTAGCTGAACCAGCAGTAATTGTTAGGCGTCCCAACGATCCATGATCCGCGTGAAGAAATCTTTAGCGCCCATAGGCAGTAAGGTAGCCCGACATAGTGTCTATTAGGCCCGAAATCCCTTAGGGAGCCCAATACATGATCTTAGCCGAGTCGTAGGAACGTCCATCTCGAAAGTCGTTTGCTAGGGCAATCCAAGTCTCGATCCCGATAAGTTCTGGCTAGGTTGACAAAGCGTCCAGATCCGACGAGTAAATGGTCCCTGTTAATCCGATAGTCGCGCACCACGGTGAATATAGTCCGATGACATTGACCTGTACCAGACCGCGTCTCAAATTGACGAAAGCGATGTTCGTAACCG(配列番号53)、GGTGGAAAGCTCGTCTCCCAATGCCATTAGCCTCGGCGGAGCGATAGCAGCTCCTCTGGAAGCATCAGTGCGTCTGCCCAAGGCGTTCCTCGTCGGTACAACGTAGACTGCCGCTACGGACGGTGTCACCAGGGATACACTCCATAGCATCCGGGTCGCAAGGTGTGCGTGCCAACTACCCGACTTCTAACAGGGCTGGCCGATACTGCGGGCTCAAGTGACTCAGATCCTGAAGGGCGCACCACGTCGCGGACTACAGTGTTCACATGAAGCGCGGTCGTGCAGCGCATGGTCCATACCAACTGCCTAGTACGCGGGACTGGCGTCGAATCGACTCGTCCTTCGGAAACATGACGGCGCGGCCTAAGCGAGAACTCTGCTCGTGTCCATCAACGGCTGGCGGCGATATGTCCTGACCTCAGCCATAGTGCCTACCTCGGGAGCGTTCAAGCGATCCTCGGTCTTAACGGGCGAACTCGGGCTCGAAAGCGAATGCCTCCCTAAGCTCTTCGGTGGCGGACGCGGAATCATAGCTCAGCGAACTCTCACGGTTGCAGGCG(配列番号54)、およびGTCGTGACACGCTTCGACGATTGAGTCGCCGCCTACGACTGACGATCTTCCGCCTGTAGCTGGATGTGCCCGATCCGTGAGGACATTCCCACCTGGACTGACTCGCATGGAGACTGCCACGGTGATTCGCAACAGCCCGTAGAGGCTTCGTTCGACCACCCGATGCTGAAAGCTGCTGCGCTGATCTGAGACCTCGGAGGGCGTAAACTGGACACCTGCCACTCGGACTGTGTTCGCACGTCGGCTTCATAGCCACTGGCAACCGCGCTTGTGTGCAGACGGAACCCTTTAGTGCCTGGCGATGACCCTACTCCCGGTGAACGGCAATGCAATGGGCCTGGAACTGTGACGCTCCCGTACCTTCCCTTGAGAGGACCTGGCATCTGGACGCAACTCCTGGGTGTGACCTGTGAGCAACGCCTCCTACTGGGTATAGCCCGCGCTTAGACGCTGCTAGAGCCGGAGACATACGATCCCTGCGCTTACACGCACGCGATAGGTGCGCTCGATAATCTCGGCCCGGTAGTGCAACCTGACCAGCGGTAGACCTTGATGACGGC(配列番号55)。
 本実施形態の核酸は、(a)、(b)、(c)もしくは(d)の部分核酸配列の少なくとも1つおよび/またはその相補配列を含んでなる。すなわち、本実施形態の核酸は、1本鎖または2本鎖のいずれであってもよい。また、本実施形態における核酸は、DNA、RNA、修飾核酸などであってよく、これらの1種のみまたは2種以上を用いて本実施形態における核酸を調製することができる。したがって、本実施形態における核酸は、例えば、1本鎖RNA、1本鎖DNA、2本鎖RNA/DNAハイブリッド、2本鎖DNAなどであってよい。なお、本明細書においては、DNAにより構成された核酸配列を示すが、適宜、RNAなどの他の核酸配列に読み替えることができ、本実施形態における核酸はそれらをも包含する。その際、チミン(T)とウラシル(U)は適宜置換され得る。
 本実施形態の核酸は、(a)、(b)、(c)および(d)から選択される異なる2つ以上の部分核酸配列ならびに/またはその相補配列を含んでなることが好ましく、(a)、(b)、(c)および(d)すべての部分核酸配列ならびに/またはその相補配列を含んでなることがより好ましい。2つ以上の部分核酸配列の並び順は特に限定されない。ここで、本実施形態の核酸が、部分核酸配列(a)および(b)、(b)および(c)、または(c)および(d)を連続して含む場合には、前者の3’フランキング配列と後者の5’フランキング配列の一部または全体が重複し得るが、そのような重複配列は、当該核酸において二重に含まれないことが好ましい。言い換えれば、各保存配列由来の配列は、本実施形態の核酸においてユニークであることが好ましい。
 本実施形態の核酸は、(e4)原核生物rRNA遺伝子由来の核酸配列を含む5’フランキング配列、(e5)天然に存在しない核酸配列からなる人工核酸配列、および(e6)原核生物rRNA遺伝子由来の核酸配列を含む3’フランキング配列からなる追加の部分核酸配列(e)をさらに含んでもよい。
 本実施形態の核酸における(e4)および(e6)として用いられる原核生物rRNA遺伝子由来の核酸配列は、原核生物rRNA遺伝子において高度に保存された任意の配列であってよいが、原核生物のメタゲノム解析において用いられているユニバーサルプライマーにより認識される配列を含むことが好ましい。すなわち、本実施形態の核酸における(e4)は、16S rRNA遺伝子のV4領域の上流の配列:CACCGGCTAACTCCGTGCCAGCAGCCGCGGTAATACGGAGGGTGCAAGCGTTAATCGGAATTACTGGGCGTAAAGCGCACGCAGGCGGTT(配列番号6)中の、少なくとも20個の連続するヌクレオチドを含むことが好ましく、全長を含むことがより好ましい。本実施形態の核酸における(e6)は、16S rRNA遺伝子のV4領域の下流の配列:GTGGGGAGCAAACAGGATTAGATACCCTGGTAGTCCACGCCGTAAACGAT(配列番号7)中の、少なくとも20個の連続するヌクレオチドを含むことが好ましく、全長を含むことがより好ましい。
 本実施形態の核酸における人工核酸配列(e5)は、天然に存在しない核酸配列であって、上記配列番号8~55の人工核酸配列と異なる配列であれば、任意の配列であってよいが、好ましくは、ATAAGAGCTTTGAGCCCACCCGCATACTGATTTGACTGCCTTAACTTGGTGAAGCCCTCGGACGGAAACTTGACATCTCGTTCTATCTGAATGAGCGCGGCACAGCTTGAGTCTACTTGGAATTGCATTAGCACCGGCCTGCCTTACAACACTGTTGCGTATTGGACTAACTAGCGGCCT(配列番号56)またはGTAGTTAGGCAACTCTAGGCGGCAACTGCTCATCAACTAGGAGTACAGTCAATCTGACGGACGCGCTACTGCATACTTAGTCATCTACTGGTTCCAGAGCCACGGGTCATCGTAAATTGGGTATTCCGAAATGGCCCACACGCCGTTCACGTTTCAAATGATTGGCATCTAGGGACACCT(配列番号57)である。
 本実施形態の核酸の好ましい配列の具体例としては、配列番号58~69の核酸配列を挙げることができる。配列番号58、59および62~69の核酸配列は、部分核酸配列(a)~(d)をすべて含む。配列番号60および61の核酸配列は、部分核酸配列(a)~(d)をすべて含み、追加の部分核酸配列(e)をさらに含む。
 本実施形態の核酸の例示的な構造を図1に示す。部分核酸配列(a)~(d)を含む核酸配列は、18S V9領域、ITS1領域、ITS2領域および25-28S D1-D2領域を天然に存在しない核酸配列により置換した真核生物rRNA関連遺伝子配列であってよく、部分核酸配列(e)を含む核酸配列は、16S V4領域を天然に存在しない核酸配列により置換した原核生物rRNA遺伝子配列であってよい。また、核酸分子中、(a)~(e)の各部分核酸配列は、1:1の比率で含まれることが好ましい。また、以下にも記載するように、本実施形態の核酸を、発現ベクターに組み込んで細胞に導入することができる。
 本実施形態の核酸は、従来公知の任意の核酸合成法により容易に調製され得る。
 本実施形態の核酸は、解析対象の試料に適切なタイミングで添加して用いればよい。例えば、本実施形態の核酸は、核酸を抽出する前の微生物叢試料に添加することができ、この場合には、核酸の抽出から増幅までの解析全体の精度管理が可能となる。また、本実施形態の核酸は、微生物叢試料から抽出された核酸溶液に添加することができ、この場合には、核酸の増幅反応のみの精度管理が可能となる。
 ここで、「微生物叢」とは、ある特定の環境中に存在する複数の微生物の集まりを意味する。微生物叢は、例えば、少なくとも100種類、300種類、500種類、700種類、1,000種類、またはそれ以上の種類の微生物から構成され得る。微生物叢を構成する微生物は、任意の分類の原核微生物および/または真核微生物であってよく、既知の微生物のみならず、未知の微生物も含まれてよい。「真核微生物」とは、肉眼では判別できない大きさの任意の単細胞または多細胞の真核生物全般を意味し、例えば、酵母、キノコ、カビなどの真菌;ミドリムシ、イカダモ、ボルボックスなどの微細藻類;ゾウリムシ、アメーバなどの原生動物などが挙げられるが、これらに限定されない。
 本発明は、第二の実施形態によれば、上記核酸を含む発現ベクターである。本実施形態において使用できる発現ベクターは、特に限定されないが、例えば、pUC19プラスミドベクター、pT7Blueプラスミドベクター、pGEMプラスミドベクターなどであってよい。本実施形態の発現ベクターは、第一の実施形態の核酸と同様に解析対象の試料に添加することができる。あるいは、本実施形態の発現ベクターは、微生物細胞に導入して用いることができる。
 本発明は、第三の実施形態によれば、上記発現ベクターを含む形質転換細胞である。本実施形態において使用できる細胞は、任意の微生物細胞であってよく、例えば、大腸菌DH5α、大腸菌HB101、大腸菌JM109(株式会社ニッポンジーン)などであってよい。発現ベクターの細胞への導入は、細胞の種類に応じて、当分野において周知の方法により行うことができ、例えば、ケミカルトランスフォーメーションまたはエレクトロポレーションなどにより行うことができる。
 本実施形態の形質転換細胞は、核酸を抽出する前の微生物叢試料に添加することができ、これにより、核酸の抽出から増幅までの解析全体の精度管理が可能となる。
 本発明は、第四の実施形態によれば、配列番号8~57からなる群から選択される人工核酸配列中の、少なくとも15個の連続するヌクレオチドを含む核酸配列と少なくとも90%同一の核酸配列またはその相補配列を含むプローブである。
 本実施形態のプローブは、上記人工核酸配列を含む増幅産物と特異的にハイブリダイズするオリゴヌクレオチドであればよい。したがって、本実施形態のプローブは、上記人工核酸配列中の任意の位置から選択される、少なくとも15個、好ましくは20個以上の連続するヌクレオチドを含む核酸配列と、少なくとも90%、好ましくは95%以上同一の核酸配列またはその相補配列を含む。
 本実施形態のプローブは、対応する増幅産物を検出するために、標識物質(例えば、FITCやCy5などの蛍光色素)により標識されていることが好ましい。
 本実施形態のプローブは、従来公知の任意の核酸合成法により容易に調製されることができ、さらに必要に応じて、従来公知の手法により標識することができる。
 本実施形態のプローブは、第一の実施形態の核酸、第二の実施形態の発現ベクター、または第三の実施形態の形質転換細胞と組み合わせて用いることにより、微生物叢試料の解析の精度管理が可能となる。
 以下に実施例を挙げ、本発明についてさらに説明する。なお、これらは本発明を何ら限定するものではない。
<1.人工配列の設計および合成>
 以下に示す配列番号58~66の核酸配列を設計した:真核生物rRNA関連遺伝子において、18S V9領域、ITS1領域、ITS2領域、および25-28S D1-D2領域を天然に存在しない人工核酸配列により置換した核酸配列(核酸1、2、5~12(配列番号58、59および62~69));真核生物rRNA関連遺伝子において、18S V9領域、ITS1領域、ITS2領域、および25-28S D1-D2領域を天然に存在しない人工核酸配列により置換した配列に、16S V4領域を人工核酸配列により置換した原核生物16S rRNA遺伝子の部分配列を付加した核酸配列(核酸3および4(配列番号60および61));ならびに16S V4領域を人工核酸配列により置換した原核生物16S rRNA遺伝子の部分配列(核酸13~17(配列番号70~74))。配列中、大文字はrRNA関連遺伝子由来の保存配列を示し、小文字は天然に存在しない人工核酸配列を示す。
 核酸1(配列番号58)
TGATTACGTCCCTGCCCTTTGTACACACCGCCCGTCGCTAattgtcagtctagcgaatcattataccgaagaacatccgtttatgagaacgtgctaccaattaactgtactaagctgtccAAACTTGGTCATTTAGAGGAACTAAAAGTCGTAACAAGGTTTCCGTAGGTGAACCTGCGGAAGGATCATTAtcataagcagagcctttatcccatataagctattgtcacgaagtgtcactgtgaacgaatgttctctaaacttactacggcttcagatgtaacggattcagactactctattcataacggactacagattgcgtcaactacgatattctcttgagatcacgattagcaagtacctttgcagcttgaaattaaccagacctttccttggaatgcctatacagagatttatcataccaggagttctccagattacctagatgtcttaacgagatacaggacttacacgatgacttagtgtgttgtttgcatcaacctaacagtaactgagcgaattgtaccaacgtattctttaccggaagtAAACTTTCAACAACGGATCTCTTGGTTCTCGCATCGATGAAGAACGCAGCGAAATGCGATACGTAATGTGAATTGCAGAATTCCGTGAATCATCGAATCTTTGAACGCACATTGCGCCCCTTGGTATTCCAGGGGGCATGCCTGTTTGAGCGTCATTTagttgtctgccagaaatcattgaacattccgacgaatatcgacatggttgcttatctaagaccttaaacggtacttggttagctgatcgcaatacttgaaagacttgatcctgtacttacctggacacgatgtaataatctcacacagttatgagaagctggttgcacctaaatagtcaattagcacgtagtaacgtagacttgccactgatgaaacataGTTTGACCTCAAATCAGGTAGGAGTACCCGCTGAACTTAAGCATATCAATAAGCGGAGGAAAAGAAACCAACgaacgattgaagatgtactcagatattcattgatgggcctacgtctacttactatgggaatgtaaatactctgttccagcctaaggttagctttgcgaatacaaatgttcttatcgacgcacagtcatacggattacgatcaagttaatggttactccctaccgattattgcatccagatcatattgagaggaatcacctgtacggtttagaaatcagctctactagaagacactattgccatacgtcaaattgcagtgagtttcaccaaatcatggagatgttacccagttagcatacaactctttgcacaagtgcataatgtagtccctatgtcacaaggttatacgaagcatgtcaaatcatcgcctttagttacgatgtagttccacaagcgaaattagtttccgaaatggtcaagcatccaagtttagctcgaatctttaaggagatactcgaagtgcctatattacggaggtattatcatgtagcaagcgttacctagcttattagtccacgaatcatgtgttagaagtcgtcaagttcatgttatcctaccagCCGCCCGTCTTGAAACACGGACCAAGGAGTCTAAC
 核酸2(配列番号59)
TGATTACGTCCCTGCCCTTTGTACACACCGCCCGTCGCTAttactgatcgaacgtcgtataatgctgaggcatctgttattaaccgtacctttcaaggattaccatgtggcaacataagtAAACTTGGTCATTTAGAGGAAGTAAAAGTCGTAACAAGGTTTCCGTAGGTGAACCTGCGGAAGGATCAcatccttggtctaagaaagtgcatgatttgagcataccaatcgccattacgataaagatcctttgagtctaacgtacactgtgtcatctgtaagataccattgtcactacttcagtcagaACTTTCAACAACGGATCTCTTGGCTTCCACATCGATGAAGAACGCAGCGAAATGCGATAAGTAATGTGAATTGCAGAATTCAGTGAATCATCGAATCTTTGAACGCAACTTGCGCCCTTTGGTATTCCGAAGGGCATGCCTGTTTGAGAGcattgaacacttcgtaaggtacacctatggatcaacgattaagtctcgataccgtaagatggtaactctagtcagtgataatcaacagcgtagtacattcgtaagcagtcttggacattactttctgagtgcaacattcaacgtctaaacgggttaaatctctcataacggaacttgtgtgcaacagatgctatatggtatgcaaatgcgatacactttgACCCGCTGAACTTAAGCATATCAATAAGCGGAGGAAAAGAAACTAACgtaaagctattaaccggagtgaatccttcattaaagtcgcacaagctgtattaccgttacgcaacgtatttgattgaccatgtgaacagaagtaccctattgacctagattatgcagcaatgcctaagactatttgcctaattcgggctatttagaccaatcctccatgatgtatatcagtcaaggctagtttggaacatacacgaaagtccttatgtagtagagtgcaattctcgtatccttcaacagtgttatcgagtatcgaacgattatcctatgggtatccacttatagaacgtgtgtagactaacctgtaaacgatgtctctgaaagcaagactacttatctgagatcggatgtttaagacgctatgacaccattaacttatgccagtgctagtcattatgaccacgatttggaatttatggctatcgccactatgaaatgctaagctacctgaacaatttgtacgcagtgacagtagatcctttgatccagaacttattaagagctgaccctatgaaacgtgatgtcctattcattattacgggaaaccgtagCGACCCGTCTTGAAACACGGACCAAGGAGTCTAAC
 核酸3(配列番号60)
TGATTACGTCCCTGCCCTTTGTACACACCGCCCGTCGCTAttggccttcagtcgagaacttgttgaaactgtcctgacgcactggaacgagcttccattgattcgctagaaatgccgaccAAACTTGGTCATTTAGAGGAACTAAAAGTCGTAACAAGGTTTCCGTAGGTGAACCTGCGGAAGGATCATTAcacagtgtggatctgacgaattaccaaggcactccatgtgtgccatctacgtctcaggaattgtacctgctaccactaggcatcgagaacgctgcatgtattcaccgagtaaggtcttccagactccgataccgtatgtgttcccaggagaaatgtcgcttagccggttcaagccatcatgtgctagactagacacgtctatcgcggtttacacgaccatcagttgagccaatgctatccttgcgggtcaaacagagcttacggatcacccatagttgtcacgccacgttaaagttccgagcgaaacgctatctcttcgagagctgtcccaatgaaactctgcacggacttgtattgcacAAACTTTCAACAACGGATCTCTTGGTTCTCGCATCGATGAAGAACGCAGCGAAATGCGATACGTAATGTGAATTGCAGAATTCCGTGAATCATCGAATCTTTGAACGCACATTGCGCCCCTTGGTATTCCAGGGGGCATGCCTGTTTGAGCGTCATTTactatgaggcccacagttacgaacgactagaccactgtcttacgagtgtcgcaccataagatggcgagtaatccgctcaatccactggttcctgagaaagagccggaaatctgaggtcattctgcccatgatagctggaaacacccgagtctctaagtgtgagtagcctgatctactgcaaacgcccgatacatatcgtgagagtctgctaggactgatcGTTTGACCTCAAATCAGGTAGGAGTACCCGCTGAACTTAAGCATATCAATAAGCGGAGGAAAAGAAACCAACtcaggctatattgaggcaccgcctggctagtagattacgacagctataacttcgggcaagccggttgatccaactatcgaaacctcgttagagcagtgtgtggcctaatggcatactggaacctatctgttacgccgagaactcgtgagcaactcagtctcataaagtcatggtccgcactgatgctgcacaaagctaccgattgatacgttcgccgactgtgatgcgtgaatcattccgtcaaagtgtccacccgtgtaggcattggtatatcgaccgatccaagaagcgacgcttagtacgcgattacattgggcagatggtacagctcccataaacgctaggaactgttcgcaagagtcctgtgtcagagtcaaggataccgttcagaggcaaactgaccgtcattcgtgctaaacgatgtgatccgccctttcagacgctagtgttacctggaagaagattggcgctacctatgtcccatacagcgacaaggtcttgtagaaggcatgtcaagctccctaaatggctccgctaaagtacgtgttgagggtctccaaCCGCCCGTCTTGAAACACGGACCAAGGAGTCTAACaaaCACCGGCTAACTCCGTGCCAGCAGCCGCGGTAATACGGAGGGTGCAAGCGTTAATCGGAATTACTGGGCGTAAAGCGCACGCAGGCGGTTataagagctttgagcccacccgcatactgatttgactgccttaacttggtgaagccctcggacggaaacttgacatctcgttctatctgaatgagcgcggcacagcttgagtctacttggaattgcattagcaccggcctgccttacaacactgttgcgtattggactaactagcggcctGTGGGGAGCAAACAGGATTAGATACCCTGGTAGTCCACGCCGTAAACGAT
 核酸4(配列番号61)
TGATTACGTCCCTGCCCTTTGTACACACCGCCCGTCGCTAcctagaaagctcgccattagccgcagtagtgattggacatcagagtttcgctcacaacgtcaccgctcgttatggaacttAAACTTGGTCATTTAGAGGAACTAAAAGTCGTAACAAGGTTTCCGTAGGTGAACCTGCGGAAGGATCATTAaagcgttggttcgttacgcaaggctctacgaaagcagtgtctacttagcgttcagtgcagcgatccacaatctcatgggtatgtcatcgaccagctacgacgcaagtttcccagatcaagattaggtgcccttcaagcacggttggaactctaccgacaattacgaggtcccaattacgggtggcaactatgctgtaccagtaagatcctgccgattcgacgcacagtcataactcagtgtacgtgtatcctggcaaggaggaagctccctttacatgctagtgcaatgtccgcagtttgcgagaggactatatccagtctaccacaggtcagaggttacaccctggctatctagtatggAAACTTTCAACAACGGATCTCTTGGTTCTCGCATCGATGAAGAACGCAGCGAAATGCGATACGTAATGTGAATTGCAGAATTCCGTGAATCATCGAATCTTTGAACGCACATTGCGCCCCTTGGTATTCCAGGGGGCATGCCTGTTTGAGCGTCATTTaccgtaaagctaggtcaggtcttcactgggcaacgacataatgggtaactcacttccagcctacatcagcggtgtcaaaggtagatgcctatcgtaccacccacaatgctctagggtttcagagaagctgtgtcttccgatggtcaccagatggattcgactcaaggtcatacaggagtgtcgcgtaacatagcctatgcaaccgttcggttaaggacgtGTTTGACCTCAAATCAGGTAGGAGTACCCGCTGAACTTAAGCATATCAATAAGCGGAGGAAAAGAAACCAACgctgcttagcctataccgtaatcggtgtgcgtgaacactagccaggtactgaatctaggatcgctgtggatctaaccagtccgctacgacaagagtttactaggaccgcctaaatcatcggcgcttaccgttaagaaacctgtccggcgacatatacagtgccattgcgcttgagaatcatgctgtgcgagagacatacacggttccgagttgacatctacgtgaagggcatctttcgatgctgacccgaagtttatctgggaagctacgtcatttgcctaccgctgcgactaatctttgcagacgacatgctatgagcttgctggaccacgaatcgttaccagtcatctgagacacttggcatacgcttgggcttgatacacctatggatgggatacactgatcggctgccgcataatttgctacgccttacagagaagtgcagtctaccggctgttaatactccggctttacacgagaagctactgagggccatttgacacaatcgcgtgagtttgctgatctgacatgggctgaaacatgagcctccgaactatcgtCCGCCCGTCTTGAAACACGGACCAAGGAGTCTAACaaaCACCGGCTAACTCCGTGCCAGCAGCCGCGGTAATACGGAGGGTGCAAGCGTTAATCGGAATTACTGGGCGTAAAGCGCACGCAGGCGGTTgtagttaggcaactctaggcggcaactgctcatcaactaggagtacagtcaatctgacggacgcgctactgcatacttagtcatctactggttccagagccacgggtcatcgtaaattgggtattccgaaatggcccacacgccgttcacgtttcaaatgattggcatctagggacacctGTGGGGAGCAAACAGGATTAGATACCCTGGTAGTCCACGCCGTAAACGAT
 核酸5(配列番号62)
TGATTACGTCCCTGCCCTTTGTACACACCGCCCGTCGCTAtcaggaagtgtgtcccattgccggaggagtcctattgaatcacggattacgtctgtaacgctggaccgaggttgtatcatAAACTTGGTCATTTAGAGGAACTAAAAGTCGTAACAAGGTTTCCGTAGGTGAACCTGCGGAAGGATCATTAgcttcgattacgatgcccaaatacgatccgcgtagtttccacgaggtctacagtaccctattgttcgaggcagtaacctgaaccgcgtctgtcaacagttatgtgacggcaagttgtccaagtccgagccatactatcagtcgtcttagctcatgggaagctcgcagtgttaagctcagtaggcaaattccagcgtgatgccgatccagtgtacgagaatccttacatgcaagtgtcgcaggccagatcagtttcgagaaagagtacgttctatccctggcgtcctcagtgactcaagatgagattacatccacacggtctcggtccattcgcaaagtacagtgtttccttagcagcaggAAACTTTCAACAACGGATCTCTTGGTTCTCGCATCGATGAAGAACGCAGCGAAATGCGATACGTAATGTGAATTGCAGAATTCCGTGAATCATCGAATCTTTGAACGCACATTGCGCCCCTTGGTATTCCAGGGGGCATGCCTGTTTGAGCGTCATTTaacatgctgcgtagtacgtcgatcaccaagctatgagcgttgtcaaaggagtgtcaaccgacgagtccaggtttcatcaccttgctaggtatccacaggtgcattaggcggctaagtcttccacatcgtattgccgaagtgtatcgcccagacattcaagctgtcagaactctgcgttacagaacgtgccgtcaagattcaggctatcatccgtgaaccaGTTTGACCTCAAATCAGGTAGGAGTACCCGCTGAACTTAAGCATATCAATAAGCGGAGGAAAAGAAACCAACtacgtgagatcggtccgatatgagctgtccacaatagccatagactaggagtcacccttcgagtggttctagcacatccagatgacacactaagtgccctgttcgggacttgtaaagcacgattccttggttaagacgcctcccagtcagtatcatggtcgtaaagttcgtccagtggtcaacgctcttcgtcaagcgataagttaaagccggtagctgctcaagcctgccatacggattagttcaaacgagcctgtcgtgtacgttctccgcacaatgtctaacaatggtacggtgcagatagcttccgcccaggttattaaggcaaattggcccatccattctgtcggtcggcaaacagttcctgaaattccgctgaggttgtaagacccggtctgaatagccagatcaatacgtcggtgctgatgagtgccatcacagtttctctaggatagcgcacgttcatgtcgcgtaacgcatctagcatttaggtgcaacggtactacgtccaccagtaggaagttcgcataaacggtcaccttagcctgagtagccgtcaaCCGCCCGTCTTGAAACACGGACCAAGGAGTCTAAC
 核酸6(配列番号63)
TGATTACGTCCCTGCCCTTTGTACACACCGCCCGTCGCTAtcccgcaaatacctttggagtgcgtcactatctaggagtgtgccgatgactcgtaatctccatcctcgaagttgcacgatAAACTTGGTCATTTAGAGGAACTAAAAGTCGTAACAAGGTTTCCGTAGGTGAACCTGCGGAAGGATCATTAataatccagggtccacgagtgaatgccctgcaaatgtaccaagttcctgaccttctggcatgtgaagccgatcttatcgctgaagagtctcgaagtcgctgacatacacccgtattgtcgatctgttggcgtaacggacatacgatgcactgacagcagttgcttagagcctagacacgacattgccttgaacgaccttgctactcatagggatacccgacgtagacgtttagtcctgcaagtcgaaagccctttgtgagagtcgccttatagtaccggatagtctcccagccatattggagagtccatatagccacggtagaatgctccgaggtaacctgagtcaaattgccgcactagAAACTTTCAACAACGGATCTCTTGGTTCTCGCATCGATGAAGAACGCAGCGAAATGCGATACGTAATGTGAATTGCAGAATTCCGTGAATCATCGAATCTTTGAACGCACATTGCGCCCCTTGGTATTCCAGGGGGCATGCCTGTTTGAGCGTCATTTagtgacagttcacggtagcagctaaatcttcgggcatcacgagtacatgagtctcccatcgttaatccagcaagccgatgtggagctatttcaacgggacgtatatgtcgtccatccgagttgcggactatctacagggtgaattatgcgactgactgccttgccactacgaaacagtgcgttcaaattgcgctaagggcgtgcgaatacttatgcaggcGTTTGACCTCAAATCAGGTAGGAGTACCCGCTGAACTTAAGCATATCAATAAGCGGAGGAAAAGAAACCAACatgtccaaccgaaactcgtgatcttagtgaccgcacggatctgtcattcgagaagcgtagagacttatgcctgggccttaacttgtgctcagtagcctcaagagaactgcctcctgtctattacgggtaaactcctggtgatccagagacgtagtgtcagaacagcctagatgtgttgccacgacctgtaaacggctttcttacgacgcaatgctgatggtgactggcgattaacgaaccgaatcatcctgtgtgcatcctacggtgtgccatttgaaccagagagtatcttcgaccacgatctgcaagggtgtcatgcttgacctagagtaccacgttcagttgcctcatagggcttagcagcgtattcatgcgacttgcgataacgatgtcctgtacggacgttccatagtccgacaaacccatgtatgtctgcgagaggttagccaagagtgcttactccacctagtgagatgtagcgacaacgactgtgagtgtacgactccttagggtatagcgttgccaaacttcccaaggtagggagcctttcccattacgaaCCGCCCGTCTTGAAACACGGACCAAGGAGTCTAAC
 核酸7(配列番号64)
TGATTACGTCCCTGCCCTTTGTACACACCGCCCGTCGCTAgacaccctgttcagattagcgagcctcagttacaccagattccgagttcgtaagatcgagaggagccatcatggacgtttAAACTTGGTCATTTAGAGGAACTAAAAGTCGTAACAAGGTTTCCGTAGGTGAACCTGCGGAAGGATCATTActgacggaccaatctgtatgtaaagcggctattcaggagcctatccgacgagttgatgcttacaaggcgatctatccctgaccagtgctaaccatgtgcataagagcagtctcactcacgagtctcggttccttagacgattcaatgccaagttgtgccggagaacacctgttgatcctcgacaatgattcagtccaccgggatgtctgtagttcccaacgccaatatgtagagcttcggtccacgaaagtaccgtggtagccatgatatgacttacgcccgacaaagttcgggagtttctcgcatgtgaagtttccgcaaccatgagcaaggtcgtttgacctggaagtgtatgatccgAAACTTTCAACAACGGATCTCTTGGTTCTCGCATCGATGAAGAACGCAGCGAAATGCGATACGTAATGTGAATTGCAGAATTCCGTGAATCATCGAATCTTTGAACGCACATTGCGCCCCTTGGTATTCCAGGGGGCATGCCTGTTTGAGCGTCATTTatctgacagccttctacgagcctgctgaatcagatgaaccacttggtcgcaatgatcgcaaggtcgggtatatcttcacggttagatccgaactgctccactgggtacaacacactgacttggtaactcggtcatacacgtcgggaacataactgcctgtgatagcacgcactcttaggacagtcgcattctctaggtcatggaatagcgcaacatcgctGTTTGACCTCAAATCAGGTAGGAGTACCCGCTGAACTTAAGCATATCAATAAGCGGAGGAAAAGAAACCAACtccacagtatcatccgatggagcgattcgcatacgacagtcaatggctattggtcaggacctagcttccaagtcaagggaaggtttcaggatcgtcgcatcgtactttcctacgaagtgcctaaagggatcactctccgaacggtttgtatcagcgtgcagatgtacctgttacgccagaggaatgacattctacccgagggatcttacagtccgggatttgtgcaatcacagttgggctctaacgtcaagcgaggtgtatgtcccatgaataaggacggctttctcaggccaagaagtctacgcagaagttacccagctcgtttacggtgtccactcaaagtctagcatgttccggtgacctagttgatggcagtagcagtaccatgacaagaggcttccgattatccagacccagttgtgggctaatatgagcagcaccctagtatttcgcgcaatgccggttatatgaaggccacgtacaagtttctccgcgcatgtgtcagatagtatccggttccacagcataagtccgccagttggttcactaagttgccgacaCCGCCCGTCTTGAAACACGGACCAAGGAGTCTAAC
 核酸8(配列番号65)
TGATTACGTCCCTGCCCTTTGTACACACCGCCCGTCGCTAcatgactggaaaccctctgacgtgtaactctggaagctcagttatcggaaacggcgctaagctacgtgatcgtaagcagtAAACTTGGTCATTTAGAGGAACTAAAAGTCGTAACAAGGTTTCCGTAGGTGAACCTGCGGAAGGATCATTActctgatggacctggtgatacacggtactatttggcatggtcacatcgggcatctgtaagacctccagttgtagtgtgcagagttcccagacagtctaagacggcattgactatggccttgtggttcgagaaccgaacatccaagagtttcgctcgttcatggcgataacccttcaacgtgtggtaacctgtaacgcagtcagctttagcgcgtgaataccttgaggcaatacaccgagttgtgctaccctagtgatgacagaatggcaccttatgctccggtacacctacggaatcatgcaagtggaatccctttcgagagcaggctcagtttagttgcgaagtgatctccgcatttccAAACTTTCAACAACGGATCTCTTGGTTCTCGCATCGATGAAGAACGCAGCGAAATGCGATACGTAATGTGAATTGCAGAATTCCGTGAATCATCGAATCTTTGAACGCACATTGCGCCCCTTGGTATTCCAGGGGGCATGCCTGTTTGAGCGTCATTTaacttagggagtatgccgtcgaacatcgctcgtgagtaacttatcgtgcggatacacctcgtacatgccactcggtacttagaatagctggtaacctccgatgctcgcaatgcgtagttctggattccaatggaccaacggtcattcctgggtgacaaagcaatctcctgtagcaggtcacagttctcgtctcgcagtaacgaagtcctcttacgtcatgGTTTGACCTCAAATCAGGTAGGAGTACCCGCTGAACTTAAGCATATCAATAAGCGGAGGAAAAGAAACCAACtattgacgaccgttgccagagagccatcacttggtttcgactataacgacagatccgtggcctcctaaagttgcgtatgcagtatcgagatgtaccctgcgaaccgagtgtactaacgtgtctgaggaatccattcccgtatcgggcacaacagtatgtgtcttccagatagagggcctttgctgacgaagtcctagactatcgcttagagacgcctacagaccagtaatcgtgaccttctacctgagatgccgtgaacataggtgctaatccgagagcatgtgtacgaactccgaaccttgccattaagggatgagcctactgaactaccgctgatcgtgcgagtatatcctgctgctaacgtaaactcctgagggctacagctaaacagcttggacctagtgtcatatcgccgttccaactgactccttgagagactgcgtaagatttccgccgacattgccaaacgctaattgccgatggtgtaaacgacccgcattccattggttgctaaagcctcgtaagaatccgggctgactatcatgtgagcttgacgctacCCGCCCGTCTTGAAACACGGACCAAGGAGTCTAAC
 核酸9(配列番号66)
TGATTACGTCCCTGCCCTTTGTACACACCGCCCGTCGCTAgcacctagcctttaacgagaagaatgtagccctacgccatcggcatgtgattccatacgatgttacgaaacctgaggcagAAACTTGGTCATTTAGAGGAAGTAAAAGTCGTAACAAGGTTTCCGTAGGTGAACCTGCGGAAGGATCActtctgaaactatgacgcgccaaccggaatcgtgtaatggattgacctacttgctcggacgacggataacgctgtatgcaaatgtgcctgtaactcggctctgcgaactgctctgatctaACTTTCAACAACGGATCTCTTGGCTTCCACATCGATGAAGAACGCAGCGAAATGCGATAAGTAATGTGAATTGCAGAATTCAGTGAATCATCGAATCTTTGAACGCAACTTGCGCCCTTTGGTATTCCGAAGGGCATGCCTGTTTGAGAGtccacgtaaatcagcgcgttatgggtctgacgtaagcacaagggtcctatacacgctactctggttatccctgagaagtcggttaccatgtcacacagtcaggctatatgccctcacgttgattcgagcgaagttactgcaccaagtctggcgtagttagtgttccgtagagcaagtcactcaatcccgagcaaagtgtcgtgatgctgttcagcaagacACCCGCTGAACTTAAGCATATCAATAAGCGGAGGAAAAGAAACTAACaggtcctcagaggctaatgtttcatgcaatgagatcccgcgtggacaccaccaagattctactgttgtcaagatacgggcgactcgacatggagctactattctatcagaagagccctgccaggcgttcaatcgcatttccatttaatggctgactcgcgcagacgaagtctcctagagttaagtcttacgagcaccgcttgtgtgagcacgatcatacgatactgactaaggcgtcaccgagtttcagaccctacgacatgactgtctttaggccagagtctactagaccgagctttggatgccaacctttccgaagtgagatttacccacagcgttcgtgtgttcgactaacccgcaaagtgttaccataggctggtcctatttcgcagtggctagagagcaatgttccaggatgtgctactacttgccgtgagctagacataccgatggctaagtggatacgttacaggcgcacgtagttctaaccggcttatacggataacctgacccgagcgttattcttatgccgcagagaggtttcttacccgaaggcactagCGACCCGTCTTGAAACACGGACCAAGGAGTCTAAC
 核酸10(配列番号67)
TGATTACGTCCCTGCCCTTTGTACACACCGCCCGTCGCTAtgcggagcatcctagtacaatatccggttgcctataagcccggtatgcgcgaattaacctaactgccagagatgagttccAAACTTGGTCATTTAGAGGAAGTAAAAGTCGTAACAAGGTTTCCGTAGGTGAACCTGCGGAAGGATCAtaggtcacgctagtaccaaggagactcagaccttacagcttgcttgcagacagatcggaatcccacagcagagtttagacgtttggagacagtcccacttcagtcgttggatgcacttagACTTTCAACAACGGATCTCTTGGCTTCCACATCGATGAAGAACGCAGCGAAATGCGATAAGTAATGTGAATTGCAGAATTCAGTGAATCATCGAATCTTTGAACGCAACTTGCGCCCTTTGGTATTCCGAAGGGCATGCCTGTTTGAGAGcagggttccctagtaagtacgattccaatacgcgatccgaatgcggcgtttcctaagcaaggtataatctcctgacgaggagtcgggtccataaggtttccatagttcaccgtgagactgcgatggtctgccaatgttcacttcaagtccgtaagacacggcaagagcctagcatctgttcgttcagagtcatggtatcggacaactgcctgatcttcgaACCCGCTGAACTTAAGCATATCAATAAGCGGAGGAAAAGAAACTAACgtcacatgcaagctgtttccttctacatgacgagcctctgcgataggtgagtatcccactcattgatagctgccgcaagtcaggagaatacgtccgttagtaaactgtcccatgccgaagctcaagacctggaagtccttgataactggcacactctgagccaactgaacgtgtacgcattacaactccggtgttagcctgcttagctgaaccagcagtaattgttaggcgtcccaacgatccatgatccgcgtgaagaaatctttagcgcccataggcagtaaggtagcccgacatagtgtctattaggcccgaaatcccttagggagcccaatacatgatcttagccgagtcgtaggaacgtccatctcgaaagtcgtttgctagggcaatccaagtctcgatcccgataagttctggctaggttgacaaagcgtccagatccgacgagtaaatggtccctgttaatccgatagtcgcgcaccacggtgaatatagtccgatgacattgacctgtaccagaccgcgtctcaaattgacgaaagcgatgttcgtaaccgCGACCCGTCTTGAAACACGGACCAAGGAGTCTAAC
 核酸11(配列番号68)
TGATTACGTCCCTGCCCTTTGTACACACCGCCCGTCGCTAacggcactgatgttcacccgccgtcgatcatacacgcagggcgatgactctatgcgaggctccgaccagtaacaggcgctAAACTTGGTCATTTAGAGGAACTAAAAGTCGTAACAAGGTTTCCGTAGGTGAACCTGCGGAAGGATCATTAcctggcgaatgtctaaggcgtccatatccgaggtgcagcgcgttgcctgaccattaggcccgtatagttcggcgtgaccgagatgccgctcagtacgacggtctaacaagctggccgcacttgccaacctgtcgcggactgtcttaacggtggcccgacttgctaccacacccgtgggattgtgctacgaagcgtcccgaaggtcctcagcccaagagtcctgtagtgagtacccggagcctcgaccctgatgtgatccgaccagattggagccggtgaccctcagacggagtcaaggtcctacctgtgaagccctgacggcgtggattcctgctagagccaaggagagtgtcccgctacAAACTTTCAACAACGGATCTCTTGGTTCTCGCATCGATGAAGAACGCAGCGAAATGCGATACGTAATGTGAATTGCAGAATTCCGTGAATCATCGAATCTTTGAACGCACATTGCGCCCCTTGGTATTCCAGGGGGCATGCCTGTTTGAGCGTCATTTgcggacgatgcctttgtcgataatgctcccgctgtaggccagcgccaatcggctgtgcatttagcgaggtctcacgccagtgcgagtacgagccttcctcctaagcgttcggtcggacaggacatctggatcgcggaaccctaatcccgtgggacaccgtcacttggtcgatgcgcgtagcttgtcaccgcagggactgagaggtcaacccatgcgactgGTTTGACCTCAAATCAGGTAGGAGTACCCGCTGAACTTAAGCATATCAATAAGCGGAGGAAAAGAAACCAACggtggaaagctcgtctcccaatgccattagcctcggcggagcgatagcagctcctctggaagcatcagtgcgtctgcccaaggcgttcctcgtcggtacaacgtagactgccgctacggacggtgtcaccagggatacactccatagcatccgggtcgcaaggtgtgcgtgccaactacccgacttctaacagggctggccgatactgcgggctcaagtgactcagatcctgaagggcgcaccacgtcgcggactacagtgttcacatgaagcgcggtcgtgcagcgcatggtccataccaactgcctagtacgcgggactggcgtcgaatcgactcgtccttcggaaacatgacggcgcggcctaagcgagaactctgctcgtgtccatcaacggctggcggcgatatgtcctgacctcagccatagtgcctacctcgggagcgttcaagcgatcctcggtcttaacgggcgaactcgggctcgaaagcgaatgcctccctaagctcttcggtggcggacgcggaatcatagctcagcgaactctcacggttgcaggcgCCGCCCGTCTTGAAACACGGACCAAGGAGTCTAAC
 核酸12(配列番号69)
TGATTACGTCCCTGCCCTTTGTACACACCGCCCGTCGCTAcgtacctgtcagcacgctgttgaccttagcccgtggcaacgactgtgaagcctccgacacgtactgagggcgattcccagAAACTTGGTCATTTAGAGGAAGTAAAAGTCGTAACAAGGTTTCCGTAGGTGAACCTGCGGAAGGATCAccatactgcgaatgggagccgccggaggtaagtcctttccctgatgaccttgcgcgtagggccgggtaagagcttctccactgactgtcaaccgtgggcacgccgaggatgctactcatgACTTTCAACAACGGATCTCTTGGCTTCCACATCGATGAAGAACGCAGCGAAATGCGATAAGTAATGTGAATTGCAGAATTCAGTGAATCATCGAATCTTTGAACGCAACTTGCGCCCTTTGGTATTCCGAAGGGCATGCCTGTTTGAGAGggcagctttacggttcccagtgcctaatgaggacgcctgggcggaatcgagccttcggaaagacatctgcagcacggtgcctgcaacctgtcggtgacgtatcaggacctggtgtccacccgttgtcagggcttccaaggtcaagcaagtggtgaccggccatgcgtggtcgcttcacagaacatcacggcagtcgccgtatcggcccgagtgagactagACCCGCTGAACTTAAGCATATCAATAAGCGGAGGAAAAGAAACTAACgtcgtgacacgcttcgacgattgagtcgccgcctacgactgacgatcttccgcctgtagctggatgtgcccgatccgtgaggacattcccacctggactgactcgcatggagactgccacggtgattcgcaacagcccgtagaggcttcgttcgaccacccgatgctgaaagctgctgcgctgatctgagacctcggagggcgtaaactggacacctgccactcggactgtgttcgcacgtcggcttcatagccactggcaaccgcgcttgtgtgcagacggaaccctttagtgcctggcgatgaccctactcccggtgaacggcaatgcaatgggcctggaactgtgacgctcccgtaccttcccttgagaggacctggcatctggacgcaactcctgggtgtgacctgtgagcaacgcctcctactgggtatagcccgcgcttagacgctgctagagccggagacatacgatccctgcgcttacacgcacgcgataggtgcgctcgataatctcggcccggtagtgcaacctgaccagcggtagaccttgatgacggcCGACCCGTCTTGAAACACGGACCAAGGAGTCTAAC
 核酸13(配列番号70)
AACTTTCAACAACGGATCTCTTGGTTCTCGCATCGATGAAGAACGCAGCGAAATGCGATACGTAATGTGAATTGCAGAATTCCGTGAATCATCGAATCTTTGAACGCACATTGCGCCCCTTGGTATTCCAGGGGGCATGCCTGTTTGAGCGTCATTTgtcgggcgactgctctcatgaccagcgtgggcgtccatggctgagcctcgtgtggctcgagccgacgtctggccgtgagctcgggagggctggtcgagctgctgccacgctctcggctcgatcaccgtgtgacgtcggcgactccaccacggcacggcgacggtgtcacgcgctcctgggGTTTGACCTCAAATCAGGTAGGAGTACCCGCTGAACTTAAGCATATCAATAAGCGGAGGAAAAGAAACCAAC
 核酸14(配列番号71)
AACTTTCAACAACGGATCTCTTGGTTCTCGCATCGATGAAGAACGCAGCGAAATGCGATACGTAATGTGAATTGCAGAATTCCGTGAATCATCGAATCTTTGAACGCACATTGCGCCCCTTGGTATTCCAGGGGGCATGCCTGTTTGAGCGTCATTTcccaggagcgcgtgacaccgtcgccgtgccgtggtggagtcgccgacgtcacacggtgatcgagccgagagcgtggcagcatttatattgcaatataaatgctgccacgctctcggctcgatcaccgtgtgacgtcggcgactccaccacggcacggcgacggtgtcacgcgctcctgggGTTTGACCTCAAATCAGGTAGGAGTACCCGCTGAACTTAAGCATATCAATAAGCGGAGGAAAAGAAACCAAC
 核酸15(配列番号72)
AACTTTCAACAACGGATCTCTTGGTTCTCGCATCGATGAAGAACGCAGCGAAATGCGATACGTAATGTGAATTGCAGAATTCCGTGAATCATCGAATCTTTGAACGCACATTGCGCCCCTTGGTATTCCAGGGGGCATGCCTGTTTGAGCGTCATTTtaaggcccatgttgtaggtcgaattgctagcaattcgacctacaacatgggccttaatgctgtgcgcaccaagaggatcaaccagtgtcggatgcatccgacactggttgatcctcttggtgcgcacagcatttacccagaagtgtattcctcgaggaatacacttctgggtaagcgtagGTTTGACCTCAAATCAGGTAGGAGTACCCGCTGAACTTAAGCATATCAATAAGCGGAGGAAAAGAAACCAAC
 核酸16(配列番号73)
AACTTTCAACAACGGATCTCTTGGTTCTCGCATCGATGAAGAACGCAGCGAAATGCGATACGTAATGTGAATTGCAGAATTCCGTGAATCATCGAATCTTTGAACGCACATTGCGCCCCTTGGTATTCCAGGGGGCATGCCTGTTTGAGCGTCATTTgtggtggagtcgccgacgtcacacggtgatcgagccgagagcgtggcagcatttatattgcaatataaatgctgccacgctctcggctcgatcaccgtgtgacgtcggcgactccaccacggcacggcgacggtgtcacgcgctcctgggttaccgcggctagttcggcgtggctggcacGTTTGACCTCAAATCAGGTAGGAGTACCCGCTGAACTTAAGCATATCAATAAGCGGAGGAAAAGAAACCAAC
 核酸17(配列番号74)
AACTTTCAACAACGGATCTCTTGGTTCTCGCATCGATGAAGAACGCAGCGAAATGCGATACGTAATGTGAATTGCAGAATTCCGTGAATCATCGAATCTTTGAACGCACATTGCGCCCCTTGGTATTCCAGGGGGCATGCCTGTTTGAGCGTCATTTggggcggttaaggaaagtcaaactcccgggctgtgaaggcccagtaggttgcgtagctaagacagcacctcataggcatgctgtgcgcaccaagaggatcatgcctatgaggtgctgtcttagctacgcaacctactgggcctaccaagagacgttacccgttaccgcggcggctggcacGTTTGACCTCAAATCAGGTAGGAGTACCCGCTGAACTTAAGCATATCAATAAGCGGAGGAAAAGAAACCAAC
 上記核酸1~17の合成をジェンスクリプトジャパン株式会社に委託した。その結果、核酸1~13は合成できたが、核酸14~17は、核酸13の合成に要した時間では合成できなかった。このことは、ランダムに設計した天然に存在しない人工配列には合成が困難な配列が含まれ得ることを示す。
 次いで、核酸1~13を鋳型として、以下のユニバーサルプライマーを用いたPCRを行った。ユニバーサルプライマーは、真核生物18S rRNA V9領域、真核生物ITS1領域、真核生物ITS2領域、真核生物25-28S rRNA D1-D2領域、もしくは原核生物16S rRNA V4領域を利用した。
 表1.真核生物18S rRNA V9領域のためのユニバーサルプライマーセット
Figure JPOXMLDOC01-appb-T000001
 
 表2.真核生物ITS1領域のためのユニバーサルプライマーセット
Figure JPOXMLDOC01-appb-T000002
 
 表3.真核生物ITS2領域のためのユニバーサルプライマーセット
Figure JPOXMLDOC01-appb-T000003
 
 表4.真核生物25-28S rRNA D1-D2領域のためのユニバーサルプライマーセット
Figure JPOXMLDOC01-appb-T000004
 
 表5.原核生物16S rRNA V4領域のためのユニバーサルプライマーセット
Figure JPOXMLDOC01-appb-T000005
 
PCR反応液組成:1xKAPA HiFiおよび、500nMプライマー。
 PCR反応条件:ITS1/ITS2では、95℃3分;その後、95℃30秒、52℃ 30秒、72℃30秒を25回;72℃5分。25-28S rRNA D1D2及び18S rRNA V9では95℃3分;その後、95℃30秒、57℃30秒、72℃30秒を25回;72℃5分。16S rRNA V4では、95℃3分;その後、95℃30秒、50℃30秒、72℃30秒を25回;72℃5分。
 その結果、核酸1~12の各領域は、ユニバーサルプライマーにより適切な効率により増幅された。一方、核酸13は著しく低い効率でしか増幅されず、標準核酸として不適切であることが確認された。
<2.核酸1~12の定量性の評価>
 核酸1~12がpUC19ベクターに組み込まれたプラスミドを作製した。このプラスミドをBsaIまたはBpmIで切断することにより線状化した後、AMpure XP(Agencourt社)により精製した。Qubitアッセイキット(サーモフィッシャーサイエンティフィック)を用いて濃度を測定し、核酸のコピー数を算出した。濃度を調整し、核酸1~12を含むプラスミドの混合溶液(各核酸につき10~10コピー)を調製した。
 FastDNA Spin Kit for Soil(MP Biomedicals)を用いて土壌から抽出されたDNA(1ng)を混合溶液に対して添加した試料を調製し、上記の真核生物ITS1領域のためのユニバーサルプライマーセット、真核生物25-28S rRNA D1-D2領域のためのユニバーサルプライマーセットまたは原核生物16S rRNA V4領域のためのユニバーサルプライマーセットを用いてPCRを行い、アンプリコンライブラリーを得た。
 PCR反応液組成:1xKAPA HiFiおよび、500nMプライマー。
 PCR反応条件:ITS1/ITS2では、95℃3分;その後、95℃30秒、52℃ 30秒、72℃30秒を25回;72℃5分。25-28S rRNA D1D2及び18S rRNA V9では95℃3分;その後、95℃30秒、57℃30秒、72℃30秒を25回;72℃5分。16S rRNA V4では、95℃3分;その後、95℃30秒、50℃30秒、72℃30秒を25回;72℃5分。
 MiSeq(イルミナ)を用いてアンプリコンのシークエンシングを行った。その結果をDADA2ベースの解析パイプラインにより評価し、定量結果を算出した。
 ITS1領域のためのユニバーサルプライマーセットによる結果を図2に、25-28S rRNA D1-D2領域のためのユニバーサルプライマーセットによる結果を図3に、16S rRNA V4領域のためのユニバーサルプライマーセットによる結果を図4に示す。横軸は核酸1~12の添加量を示し、縦軸は土壌から抽出されたDNA由来の対象配列のリード数当たりの核酸1~12由来リード数の割合を示す。いずれのユニバーサルプライマーセットを用いた場合も核酸1~12の添加量に依存した検出が可能であり、高い定量性および直線性が確認された。これらの結果から、核酸1~12を用いてメタゲノム解析の定量精度の検証が可能であることが示された。
<3.土壌中の真菌の定量>
 核酸1~12の混合物(4×10コピー)を様々な量の土壌(300、150、75または37.5mg)に加えた試料から、FastDNA Spin Kit for Soil(MP Biomedicals)を用いてDNAを抽出した。ITS1領域のためのユニバーサルプライマーセットを用いて上記1と同様の条件によりPCRを行い、各試料ごとのアンプリコンライブラリーを得た。MiSeq(イルミナ)を用いてアンプリコンのシークエンシングを行い、結果をDADA2パイプラインにより解析した。
 結果を図5に示す。横軸は試料に添加された土壌の量を、縦軸は各試料における全リード数を統一したときの核酸1~12由来のリード数を示す。土壌量の増加に伴って理論的に予想される内部標準遺伝子のリード数が減少した。また、核酸1~12由来のリード数に基づいて推定された真菌の総量を図6に示す。土壌量と真菌との相関が確認された。これらの結果から、核酸1~12を内部標準核酸として用いたメタゲノム解析により、微生物叢試料中の真菌の絶対量を正確に定量できることが確認された。
<4.土壌中の真菌および細菌の定量>
 10種類の真菌(Aspergillus oryzae、Candida glabrata、Candida tropicalis、Saccharomyces cerevisiae、Schizosaccharomyces pompe、Trichoderma reesei、Marasmius purpureostriatus Hongo、Hymenoscyphus varicosporoides Tubaki、Emericella nidulansおよびCryptococcus neoformans)ならびに14種類の細菌(Clostridium acetobutylicum、Bacillus subtilis、Bacteroides vulgatus、Pseudomonas putida、Desulfitobacterium hafniense、Deinococcus grandis、Nitrosomonas europaea、Nitrobacter winogradskyi、Escherichia coli、Treponema bryantii、Gemmatimonas aurantiaca、Chloroflexus aurantiacus、Anaerolinea thermophilaおよびDesulfovibrio vulgaris)(個々の真菌および細菌は理化学研究所JCM等から入手)のゲノムDNAが既知量混合された標品を用いて、細菌遺伝子1コピーに対して真菌遺伝子1.5×10コピーが含まれる溶液を調製し、段階的に希釈した。得られた希釈液に対し核酸3~10(各5×10コピー)を添加し、原核生物16S rRNA V4領域のためのユニバーサルプライマーセットおよび真核生物ITS1領域のためのユニバーサルプライマーセットを用いて上記1と同様の条件によりPCRを行い、各試料ごとのアンプリコンライブラリーを得た。MiSeq(イルミナ)を用いてアンプリコンのシークエンシングを行い、結果をDADA2パイプラインにより解析した。
 結果を図7および8に示す。図7において、横軸は単位人工配列における推定されたITS1領域のコピー数、縦軸は計測されたITS1領域のコピー数を示し、図8において、横軸は推定された真菌/細菌の混合比率、縦軸は計測された真菌/細菌の混合比率を示す。また、「Sc5001」は核酸3(配列番号60)、「Sc5002」は核酸4(配列番号61)を示す。これらの結果から、核酸3~10を内部標準核酸として用いたメタゲノム解析により、試料中の真菌/細菌の存在比率を正しく推定できることが示された。
 次いで、土壌から抽出されたDNA(1ng)に核酸4(8.3~8.3×10コピー)を添加した試料を調製し、原核生物16S rRNA V4領域のためのユニバーサルプライマーセットおよび真核生物ITS1領域のためのユニバーサルプライマーセットを用いて上記1と同様の条件によりPCRを行い、各試料ごとのアンプリコンライブラリーを得た。MiSeq(イルミナ)を用いてアンプリコンのシークエンシングを行い、結果をDADA2パイプラインにより解析した。
 核酸4の添加量に対して全リード数を統一した場合の核酸4由来のリード数を図9に示す。原核生物16S rRNA V4領域のためのユニバーサルプライマーセットおよび真核生物ITS1領域のためのユニバーサルプライマーセットの両方について、核酸4の添加量とリードカウントの間に高い相関がみられた。また、核酸4由来のリード数に基づいて推定された系統分類(門)ごとの微生物の存在量(絶対量)を図10に示す。このように、核酸4を内部標準核酸として用いることにより、試料中の真菌/細菌の絶対存在量を推定できることが実証された。

Claims (9)

  1.  (1)真核生物rRNA関連遺伝子由来の核酸配列を含む5’フランキング配列、
     (2)天然に存在しない核酸配列からなる人工核酸配列、および
     (3)真核生物rRNA関連遺伝子由来の核酸配列を含む3’フランキング配列
    からなる部分核酸配列および/またはその相補配列を少なくとも1つ含んでなる核酸であって、
     前記部分核酸配列が、以下の部分核酸配列(a)~(d):
     (a1)配列番号1の核酸配列中の、少なくとも20個の連続するヌクレオチドを含む5’フランキング配列、
     (a2)配列番号8~19のいずれかの核酸配列からなる人工核酸配列、および
     (a3)配列番号2の核酸配列中の、少なくとも20個の連続するヌクレオチドを含む3’フランキング配列
    からなる部分核酸配列(a);
     (b1)配列番号2の核酸配列中の、少なくとも20個の連続するヌクレオチドを含む5’フランキング配列、
     (b2)配列番号20~31からなる群から選択される人工核酸配列、および
     (b3)配列番号3の核酸配列中の、少なくとも20個の連続するヌクレオチドを含む3’フランキング配列
    からなる部分核酸配列(b);
     (c1)配列番号3の核酸配列中の、少なくとも20個の連続するヌクレオチドを含む5’フランキング配列、
     (c2)配列番号32~43からなる群から選択される人工核酸配列、および
     (c3)配列番号4の核酸配列中の、少なくとも20個の連続するヌクレオチドを含む3’フランキング配列
    からなる部分核酸配列(c);ならびに
     (d1)配列番号4の核酸配列中の、少なくとも20個の連続するヌクレオチドを含む5’フランキング配列、
     (d2)配列番号44~55からなる群から選択される人工核酸配列、および
     (d3)配列番号5の核酸配列中の、少なくとも20個の連続するヌクレオチドを含む3’フランキング配列
    からなる部分核酸配列(d)
    からなる群から選択される、核酸。
  2.  前記部分核酸配列(a)が、
     (a1’)配列番号1の核酸配列を含む5’フランキング配列、
     (a2)配列番号8~19のいずれかの核酸配列からなる人工核酸配列、および
     (a3’)配列番号2の核酸配列を含む3’フランキング配列
    からなる;
     前記部分核酸配列(b)が、
     (b1’)配列番号2の核酸配列を含む5’フランキング配列、
     (b2)配列番号20~31からなる群から選択される人工核酸配列、および
     (b3’)配列番号3の核酸配列を含む3’フランキング配列
    からなる;
     前記部分核酸配列(c)が、
     (c1’)配列番号3の核酸配列を含む5’フランキング配列、
     (c2)配列番号32~43からなる群から選択される人工核酸配列、および
     (c3’)配列番号4の核酸配列を含む3’フランキング配列
    からなる;ならびに/または
     前記部分核酸配列(d)が、
     (d1’)配列番号4の核酸配列を含む5’フランキング配列、
     (d2)配列番号44~55からなる群から選択される人工核酸配列、および
     (d3’)配列番号5の核酸配列を含む3’フランキング配列
    からなる、請求項1に記載の核酸。
  3.  (e4)原核生物rRNA遺伝子由来の核酸配列を含む5’フランキング配列、
     (e5)天然に存在しない核酸配列からなる人工核酸配列、および
     (e6)原核生物rRNA遺伝子由来の核酸配列を含む3’フランキング配列
    からなる追加の部分核酸配列(e)および/またはその相補配列をさらに含む、請求項1または2に記載の核酸。
  4.  前記追加の部分核酸配列(e)が、
     (e4’)配列番号6の核酸配列を含む5’フランキング配列、
     (e5’)配列番号56または57の人工核酸配列、および
     (e6’)配列番号7の核酸配列を含む3’フランキング配列
    からなる、請求項3に記載の核酸。
  5.  配列番号58、59および62~69からなる群から選択される核酸配列および/またはその相補配列からなる、請求項1または2に記載の核酸。
  6.  配列番号60または61の核酸配列および/またはその相補配列からなる、請求項3または4に記載の核酸。
  7.  請求項1~6のいずれか1項に記載の核酸を含む発現ベクター。
  8.  請求項7に記載の発現ベクターを含む形質転換細胞。
  9.  配列番号8~57からなる群から選択される人工核酸配列中の、少なくとも15個の連続するヌクレオチドを含む核酸配列と少なくとも90%同一の核酸配列またはその相補配列を含むプローブ。
PCT/JP2022/022726 2021-06-08 2022-06-06 真核微生物を定量するための内部標準核酸 WO2022259995A1 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2023527846A JPWO2022259995A1 (ja) 2021-06-08 2022-06-06

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2021096217 2021-06-08
JP2021-096217 2021-06-08

Publications (1)

Publication Number Publication Date
WO2022259995A1 true WO2022259995A1 (ja) 2022-12-15

Family

ID=84425023

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2022/022726 WO2022259995A1 (ja) 2021-06-08 2022-06-06 真核微生物を定量するための内部標準核酸

Country Status (2)

Country Link
JP (1) JPWO2022259995A1 (ja)
WO (1) WO2022259995A1 (ja)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015204813A (ja) * 2014-04-23 2015-11-19 国立研究開発法人産業技術総合研究所 微生物の16SrRNA遺伝子定量用内部標準遺伝子

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015204813A (ja) * 2014-04-23 2015-11-19 国立研究開発法人産業技術総合研究所 微生物の16SrRNA遺伝子定量用内部標準遺伝子

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
DE FILIPPIS FRANCESCA, LAIOLA MANOLO, BLAIOTTA GIUSEPPE, ERCOLINI DANILO: "Different Amplicon Targets for Sequencing-Based Studies of Fungal Diversity", APPLIED AND ENVIRONMENTAL MICROBIOLOGY, AMERICAN SOCIETY FOR MICROBIOLOGY, US, vol. 83, no. 17, 1 September 2017 (2017-09-01), US , XP093013488, ISSN: 0099-2240, DOI: 10.1128/AEM.00905-17 *
DIETER M. TOURLOUSSE, YOSHIIKE SATOWA, OHASHI AKIKO, MATSUKURA SATOKO, NODA NAOHIRO, SEKIGUCHI YUJI: "Synthetic spike-in standards for high-throughput 16S rRNA gene amplicon sequencing", NUCLEIC ACIDS RESEARCH, OXFORD UNIVERSITY PRESS, GB, vol. 45, no. 4, 15 December 2016 (2016-12-15), GB , pages 1 - 14, XP055615183, ISSN: 0305-1048, DOI: 10.1093/nar/gkw984 *

Also Published As

Publication number Publication date
JPWO2022259995A1 (ja) 2022-12-15

Similar Documents

Publication Publication Date Title
CN108350484B (zh) Rna分析的组合物和方法
CN113166797A (zh) 基于核酸酶的rna耗尽
JP6479336B2 (ja) 微生物の16SrRNA遺伝子定量用内部標準遺伝子
CN104164488A (zh) 一种单引物引发的核酸恒温扩增方法
WO2019131470A1 (en) A primer for next generation sequencer and a method for producing the same, a dna library obtained through the use of a primer for next generation sequencer and a method for producing the same, and a dna analyzing method using a dna library
CN111315884A (zh) 测序文库的归一化
JP6474173B2 (ja) 標的核酸の定量方法のためのキット
Thies Molecular approaches to studying the soil biota
CN105907878A (zh) 基于高分辨熔解曲线技术的结核分枝杆菌耐药性基因突变检测
US10214759B2 (en) Probability-directed isolation of nucleotide sequences (PINS)
JP6074036B2 (ja) 拡大された基質範囲を有する新規のdnaポリメラーゼ
WO2016119448A2 (zh) 不同种属微生物间种类和丰度比较的人工外源性参照分子
WO2022259995A1 (ja) 真核微生物を定量するための内部標準核酸
JP2007060953A (ja) 細菌叢の分析方法
Nakatsu Microbial genetics
CN110577981B (zh) 一种基于人工模拟核酸的分子信标
CN112852938A (zh) 一种用于革兰氏阳性菌耐药基因高通量扩增子测序的引物组及应用
WO2019163672A1 (ja) 白癬菌の遺伝子をlamp法により検出するためのプライマーセット及びそれを含むキット並びにそれらを用いて白癬菌を検出する方法
CN109355412A (zh) 一种用于测定细菌与真菌种类和丰度比较的人工合成外源性参照分子
De Maayer et al. The current state of metagenomic analysis
JP6112652B2 (ja) 標的dnaの特異的増幅方法
US20020086313A1 (en) Application of bioinformatics for direct study of unculturable microorganisms
Lawson et al. Application of molecular methods for microbial identification in dairy products
US6528257B1 (en) Method for the simultaneous monitoring of individual mutants in mixed populations
WO2008015975A1 (fr) Procédé d'amplification d'un fragment d'adn

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 22820176

Country of ref document: EP

Kind code of ref document: A1

WWE Wipo information: entry into national phase

Ref document number: 2023527846

Country of ref document: JP

WWE Wipo information: entry into national phase

Ref document number: 18568042

Country of ref document: US

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 22820176

Country of ref document: EP

Kind code of ref document: A1