WO2021157589A1 - 対象核酸の塩基配列を1細胞レベルで並列に検出する方法 - Google Patents

対象核酸の塩基配列を1細胞レベルで並列に検出する方法 Download PDF

Info

Publication number
WO2021157589A1
WO2021157589A1 PCT/JP2021/003820 JP2021003820W WO2021157589A1 WO 2021157589 A1 WO2021157589 A1 WO 2021157589A1 JP 2021003820 W JP2021003820 W JP 2021003820W WO 2021157589 A1 WO2021157589 A1 WO 2021157589A1
Authority
WO
WIPO (PCT)
Prior art keywords
nucleic acid
cells
base sequence
sequence
nth
Prior art date
Application number
PCT/JP2021/003820
Other languages
English (en)
French (fr)
Inventor
恭行 大川
哲仁 原田
Original Assignee
国立大学法人九州大学
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 国立大学法人九州大学 filed Critical 国立大学法人九州大学
Publication of WO2021157589A1 publication Critical patent/WO2021157589A1/ja

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N5/00Undifferentiated human, animal or plant cells, e.g. cell lines; Tissues; Cultivation or maintenance thereof; Culture media therefor
    • C12N5/10Cells modified by introduction of foreign genetic material
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/12Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/48Hydrolases (3) acting on peptide bonds (3.4)
    • C12N9/50Proteinases, e.g. Endopeptidases (3.4.21-3.4.25)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/686Polymerase chain reaction [PCR]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing

Definitions

  • the present invention relates to a method for detecting the base sequences of target nucleic acids existing in each of a plurality of cells in parallel at the single cell level.
  • the present application claims priority based on Japanese Patent Application No. 2020-017027 filed in Japan on February 4, 2020, the contents of which are incorporated herein by reference.
  • the base sequence of the target nucleic acid is a base sequence in the vicinity of the binding region on the genomic DNA of the DNA-binding protein.
  • the binding position of a DNA-binding protein on genomic DNA can be analyzed at the single cell level.
  • An object of the present invention is to provide a technique for detecting the base sequences of target nucleic acids existing in each of a plurality of cells in parallel at the level of one cell.
  • the present invention includes the following aspects.
  • the first to mth nucleic acid fragments B having different base sequences for each section are further ligated to the detection nucleic acid group A to obtain the first to m detection nucleic acid group B, and the first step ⁇ .
  • the step ⁇ of obtaining a plurality of reads by comprehensively determining the base sequence of the m-th detection nucleic acid group B, and the base sequence of the target nucleic acid contained in the read is the base of the nucleic acid fragment A contained in the read.
  • a method comprising the step ⁇ of detecting in correspondence with one cell based on the sequence and the base sequence of nucleic acid fragment B.
  • the cells bound to the inside of the first to nth compartments are exfoliated and recovered with a mixture of enzymes having proteolytic activity and collagen-degrading activity [2]. The method described in.
  • the present invention it is possible to provide a technique for detecting the base sequence of a target nucleic acid existing in each of a plurality of cells in parallel at the level of one cell.
  • FIG. 1 is a schematic diagram illustrating a method of detecting the base sequences of target nucleic acids existing in each of a plurality of cells in parallel at the level of one cell.
  • FIG. 2 is a schematic diagram illustrating an example of the Chromatin Integration Labeling method (ChIL method).
  • FIG. 3 is a schematic diagram illustrating the ChIL method.
  • FIG. 4 is a schematic diagram illustrating the ChIL method.
  • FIG. 5 is a schematic diagram illustrating the ChIL method.
  • FIG. 6A is a schematic diagram illustrating the ChIL method.
  • FIG. 6B is a schematic diagram illustrating the ChIL method.
  • FIG. 6C is a schematic diagram illustrating the ChIL method.
  • FIG. 7A is a schematic diagram illustrating the ChIL method.
  • FIG. 1 is a schematic diagram illustrating a method of detecting the base sequences of target nucleic acids existing in each of a plurality of cells in parallel at the level of one cell.
  • FIG. 2 is a schematic diagram
  • FIG. 7B is a schematic diagram illustrating the ChIL method.
  • FIG. 8 is a schematic diagram illustrating an example of the high-throughput single-cell ChIL method.
  • FIG. 9A is a typical phase-contrast micrograph showing the results of Experimental Example 1.
  • FIG. 9B is a typical phase-contrast micrograph showing the results of Experimental Example 1.
  • FIG. 10A is a diagram showing the results of Experimental Example 2.
  • FIG. 10B is a graph showing the result of FIG. 10A.
  • the present invention is a method for detecting the base sequence of a target nucleic acid existing in each of a plurality of cells in parallel at the level of one cell, wherein the cells are detected in the first to nth (here, n is).
  • Step ⁇ for partitioning into n compartments (which is an integer of 2 or more) and the first to first to the target nucleic acids of the cells distributed to the first to nth compartments, each of which has a different base sequence for each compartment.
  • the nth nucleic acid fragment A was ligated to obtain the first to nth detection nucleic acid group A, and the cells were collected from the first to nth compartments and pooled.
  • the read includes ⁇ , the step ⁇ of comprehensively determining the base sequences of the first to mth detection nucleic acid groups B to obtain a plurality of reads, and the base sequence of the target nucleic acid contained in the reads.
  • a method including a step ⁇ for detecting in one cell based on the base sequence of nucleic acid fragment A and the base sequence of nucleic acid fragment B.
  • FIG. 1 is a schematic diagram illustrating the method of the present embodiment. Hereinafter, the method of the present embodiment will be described with reference to FIG.
  • Step ⁇ the cells to be analyzed are divided into n compartments of the first to nth (where n is an integer of 2 or more).
  • n is an integer of 2 or more.
  • cells may be distributed to each well of a 96-well plate.
  • n is 96.
  • the number of n is not limited to 96, and may be any integer of 2 or more.
  • n may be, for example, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 24, 48, 96, 384, 1536, 9216, and the like.
  • the cells may be distributed manually using a micropipette or using a device such as a cell sorter.
  • the cell has a target nucleic acid to be analyzed.
  • the target nucleic acid may be, for example, a specific region on the genome (near the target DNA-binding protein), miRNA, or mRNA.
  • the target nucleic acid may be a nucleic acid labeled with a molecule that is not a nucleic acid.
  • non-nucleic acid molecules include proteins, metabolites and the like.
  • a specific binding substance for a protein or metabolite to be analyzed is labeled with a target nucleic acid, and this specific binding substance is brought into contact with a cell.
  • Specific binding substances include antibodies, antibody fragments, aptamers and the like.
  • proteins and metabolites are labeled with the nucleic acid of interest. By detecting this target nucleic acid, proteins and metabolites can be detected in parallel at the single cell level.
  • the target nucleic acid may be present in the cell or on the cell surface.
  • one molecule of the target nucleic acid may be present per cell, or a plurality of molecules may be present per cell.
  • the plurality may be, for example, 2 to 10, for example, 2 to 10,000, or, for example, 2 to 1,000,000.
  • the cells distributed in the first to nth compartments may be fixed inside the compartments.
  • the compartment is composed of well plates, cells may be immobilized on the surface of the wells. Immobilization of cells makes it possible to carry out reactions that require washing. Examples of the reaction requiring washing include an antigen-antibody reaction, a reaction by the ChIL method described later, and the like.
  • the cells distributed in the first to nth compartments may be bound to the inside of the compartments by an avidin-biotin bond.
  • biotin can be bound to the cell surface by reacting the cell with a biotinylating reagent.
  • a biotination reagent for example, a chemical linker containing a succinimide group, a maleimide group, an iodoacetyl group, a pyridyl disulfide group, a hydrazide group, an alkoxyamine group and the like can be used.
  • it may have a cleavable bond inside the biotinlation reagent. Examples of the bond that can be cleaved include a disulfide bond and the like.
  • More specific biotinylation reagent e.g., NHS-Biotin, NHS-LC -Biotin, NHS-LC-LC-Biotin, Sulfo-NHS-SS-Biotin, Alkoxyamine-PEG 4 -SS-PEG 4 -Biotin, HPDP-Biotin, BMCC-Biotin, Iodoactile-LC-Biotin, Amine-PEG 2 -Biotin, Hydrazide-Biotin, Alcoxyamane-PEG 4 -Biotin, etc. are available from Thermofisher Scientific Co., Ltd. However, it is not limited to these.
  • cells whose cell surface is biotinylated When cells whose cell surface is biotinylated are dispensed into an avidin-coated well plate, they can be bound to the surface of the well by an avidin-biotin bond. Streptavidin may be used as the avidin. Alternatively, the cell surface may be avidinated and the well surface may be biotinylated.
  • the cells bound to the solid phase may be allowed to act on a mild enzyme that does not destroy the cells.
  • a mild enzyme that does not destroy the cells.
  • an enzyme include a mixture of an enzyme having a proteolytic activity and an enzyme having a collagen-degrading activity, and more specifically, Accumax (Nacalai Tesque), Accutase (Nacalai Tesque) and the like can be mentioned.
  • a reducing agent such as dithiothreitol (DTT) or ⁇ -mercaptoethanol may be allowed to act to cleave the disulfide bond. This allows the cells to detach from the solid phase. Further, the cells may be detached from the solid phase and recovered by allowing both the enzyme and the reducing agent to act on the cells bound to the solid phase.
  • DTT dithiothreitol
  • ⁇ -mercaptoethanol ⁇ -mercaptoethanol
  • step ⁇ Subsequently, in step ⁇ , the first to nth nucleic acid fragments A having different base sequences for each compartment are ligated to the target nucleic acids of the cells distributed in the first to nth compartments, and the first to nth compartments are linked. Obtain the nucleic acid group A for detection.
  • the method for linking the nucleic acid fragment A is not particularly limited, and may be carried out using, for example, a transposase, for example, by a polymerase chain reaction, or, for example, by a ligation reaction.
  • the obtained amplification product is a ligation of the target nucleic acid and nucleic acid fragment A.
  • a nucleic acid fragment containing the base sequence of nucleic acid fragment A and a target nucleic acid can be linked by a ligation reaction.
  • the method using a transposase Chromatin Integration Labeling, ChIL method will be described later.
  • Nucleic acid fragment A contains an identification sequence that can identify to which compartment the cells were distributed. Nucleic acid fragment A may contain an additional base sequence in addition to the identification sequence. Further, the nucleic acid fragment A may be composed of one continuous nucleic acid fragment, or may be composed of two or more nucleic acid fragments. For example, the nucleic acid fragment A may be composed of a combination of a sense primer and an antisense primer. Further, both the sense primer and the antisense primer may contain an identification sequence. Here, the identification sequence contained in the sense primer and the identification sequence contained in the antisense primer may be different, and the combination of these identification sequences may function as the identification sequence of the nucleic acid fragment A.
  • the identification sequence is not particularly limited as long as it is a base sequence whose appearance frequency is stochastically low, and for example, an arbitrary base sequence of about 4 to 20 bases can be used.
  • Each of the first to nth nucleic acid fragments A can have, for example, a base sequence containing an identification sequence consisting of any of the base sequences shown in Tables 1 and 2 above.
  • Table 1 above shows 384 base sequences.
  • Table 2 above shows 324 base sequences.
  • the base sequences shown in Tables 1 and 2 above are artificially created base sequences, and are sequences in order to more accurately separate cells based on the identification sequence when identifying cells at the single cell level. In consideration of errors, at least two bases are designed to be different from each other.
  • the first to 96th nucleic acid fragments A having different base sequences for each well are ligated to the target nucleic acids of the cells distributed to each well of the 96-well plate.
  • the first to 96th detection nucleic acid group A in which the base sequence of the nucleic acid fragment A is different for each well is obtained.
  • the detection nucleic acid group A means a mixture of detection nucleic acids A having different base sequences.
  • the detection nucleic acid A is obtained by linking the target nucleic acid and the nucleic acid fragment A.
  • the pattern of the cell diagram is changed for each type of nucleic acid fragment A.
  • Step ⁇ cells are collected from the first to nth compartments and pooled.
  • step ⁇ when the cells distributed in the first to nth compartments are bound to the inside of the compartments, in this step, the cells are subjected to the enzyme having proteolytic activity and collagen-degrading activity. It may be peeled off with a mixture and recovered.
  • the cells when the cells are bound to the inside of the compartment by the avidin-biotin bond and the avidin-biotin bond can be cleaved by the reducing agent, the cells may be detached by the action of the reducing agent. good.
  • the avidin-biotin bond can be cleaved by the reducing agent include the case where a disulfide bond is present inside the biotinylated reagent used.
  • the reducing agent are the same as those described above, and examples thereof include dithiothreitol (DTT) and ⁇ -mercaptoethanol.
  • the cells may be detached from the solid phase and recovered by allowing both the enzyme and the reducing agent to act on the cells bound to the solid phase.
  • the pooled cells are redistributed into m compartments of the first to mth (where m is an integer of 2 or more).
  • m is an integer of 2 or more.
  • cells may be distributed to each well of a 384-well plate. In this case, m is 384. In the example of FIG. 1, cells are distributed to each well of 24 384 plates. In this case, m is 9216.
  • the cells may be distributed manually using a micropipette or using a device such as a cell sorter.
  • m is not limited to 384 and 9216, and may be any integer of 2 or more. m may be, for example, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 24, 48, 96, 384, 1536, 9216 and the like.
  • Step ⁇ Subsequently, in step ⁇ , the first to nth detection nucleic acid group A existing in the cell or on the cell surface of the cells distributed in the first to mth compartments has a different base sequence for each compartment.
  • the 1st to mth nucleic acid fragments B are further ligated to obtain the 1st to mth detection nucleic acid group B.
  • the method for linking the nucleic acid fragment B is the same as the method for linking the nucleic acid fragment A described above, and may be carried out using, for example, a transposase, for example, by a polymerase chain reaction, or, for example, by a ligation reaction. May be good.
  • the obtained amplification product is a ligation of the nucleic acid group A for detection and the nucleic acid fragment B.
  • a nucleic acid fragment containing the base sequence of nucleic acid fragment B and a nucleic acid group A for detection can be linked by a ligation reaction.
  • Nucleic acid fragment B contains a discriminating sequence that can identify to which compartment the cells were distributed.
  • Nucleic acid fragment B may contain an additional base sequence in addition to the identification sequence.
  • the nucleic acid fragment B may be composed of one continuous nucleic acid fragment, or may be composed of two or more nucleic acid fragments.
  • the nucleic acid fragment B may be composed of a combination of a sense primer and an antisense primer.
  • both the sense primer and the antisense primer may contain an identification sequence.
  • the identification sequence contained in the sense primer and the identification sequence contained in the antisense primer may be different, and the combination of these identification sequences may function as the identification sequence of the nucleic acid fragment B.
  • the identification sequence is not particularly limited as long as it is a base sequence whose appearance frequency is stochastically low, and for example, an arbitrary base sequence of about 4 to 20 bases can be used.
  • Each of the first to mth nucleic acid fragments B can have, for example, a base sequence containing an identification sequence consisting of any of the base sequences shown in Tables 1 and 2 above.
  • the nucleic acid fragments B of the first to 9216th cells having different base sequences for each well are ligated to the target nucleic acids of the cells distributed to each well of 24 384-well plates.
  • the first to 9216 detection nucleic acid groups B in which the base sequence of the nucleic acid fragment B is different for each well can be obtained.
  • the detection nucleic acid group B means a mixture of detection nucleic acids B having different base sequences.
  • the detection nucleic acid B is a conjugate of the target nucleic acid, the nucleic acid fragment A, and the nucleic acid fragment B.
  • the pattern of the cell diagram is changed for each type of combination of nucleic acid fragment A and nucleic acid fragment B.
  • 96 ⁇ 24 ⁇ 384 types that is, a combination of about 8 ⁇ 10 5 types of nucleic acid fragment A and nucleic acid fragment B can be formed.
  • different combinations of nucleic acid fragment A and nucleic acid fragment B can be associated with each cell. Therefore, in the example of FIG. 1, for about 8 ⁇ 10 5 cells, the base sequence of the target nucleic acid existing in each cell can be detected in parallel at the 1-cell level.
  • step ⁇ Subsequently, in step ⁇ , the base sequences of the first to mth detection nucleic acid groups B are comprehensively determined, and a plurality of reads are obtained. It is preferable to use a next-generation sequencer to determine the base sequence.
  • the base sequence of the target nucleic acid contained in the read is detected in association with one cell based on the base sequence of the nucleic acid fragment A and the base sequence of the nucleic acid fragment B contained in the read.
  • ChIL method Chromatin Integration Labeling
  • the ChIL method is a method of inserting a DNA fragment having a desired base sequence in the vicinity of the binding region of a DNA-binding protein bound to a DNA molecule, and a transposase-binding sequence using a specific binding substance for the DNA-binding protein.
  • the step (c) in which the DNA fragment of the desired base sequence is inserted in the vicinity of the binding region is included.
  • the binding between a DNA-binding protein and a specific genomic region can be analyzed without performing immunoprecipitation. Therefore, according to the ChIL method, it is possible to analyze the binding of a DNA-binding protein to DNA, which has been difficult to analyze by the conventional technique in which immunoprecipitation is an essential step. In addition, it has been difficult to analyze DNA-binding proteins at the single cell level with the prior art. On the other hand, according to the ChIL method, DNA-binding protein can be analyzed at the single cell level.
  • the DNA-binding protein to be analyzed is not particularly limited, and examples thereof include histones, transcription factors, and phosphorylation polymerases.
  • the transcriptional state of a gene can be analyzed by analyzing RNA polymerase II in a specific phosphorylated state as a DNA-binding protein.
  • FIGS. 2 to 7 are schematic views illustrating the ChIL method.
  • FIG. 2 shows a state in which genomic DNA 10 is wrapped around histone 20 to form a chromatin structure.
  • the DNA-binding protein is histone 20.
  • the specific binding substance 30 is an antibody that recognizes histone 20.
  • the DNA fragment 40 is bound to the specific binding substance 30 via the linker 44.
  • the DNA fragment 40 has a base sequence containing a transposase binding sequence 41 and a desired base sequence.
  • the desired base sequence is a base sequence in which the identification sequence 43 is linked downstream of the T7 promoter sequence 42.
  • the arrow of T7 promoter sequence 42 indicates the direction of transcription by T7 polymerase.
  • the DNA fragment 40 corresponds to the above-mentioned nucleic acid fragment A or nucleic acid fragment B.
  • the linker 44 has a role of a tether for bringing the DNA fragment 40 close to the binding region 11 of the histone 20.
  • the linker 44 is a DNA fragment having a length of, for example, 50 to 70 bases.
  • the linker 44 is not particularly limited as long as it functions as a tether, and may be composed of a polymer such as polyethylene glycol.
  • Step (a) the ChIL method is carried out using paraformaldehyde-fixed cells as a sample.
  • the DNA fragment 40 and the binding region 11 are brought close to each other by utilizing the specific binding substance 30 for histone 20.
  • using the specific binding substance 30 to bring it close to each other means that the specific binding substance 30 to which the DNA fragment 40 is bound is bound to the histone 20 which is the antigen thereof as shown in the example of FIG.
  • the fragment 40 and the binding region 11 may be brought close to each other.
  • the specific binding substance 30 is, for example, a mouse IgG antibody against histone 20, and this mouse IgG antibody is bound to histone 20 as a primary antibody, followed by an anti-mouse IgG antibody to which the DNA fragment 40 is bound.
  • the DNA fragment 40 and the binding region 11 may be brought close to each other.
  • the step of bringing the DNA fragment 40 and the binding region 11 close to each other by utilizing the specific binding substance 30 for histone 20 can be carried out in the fixed cell as in the example of FIG. Similar to immunostaining, this step can also use multiple antibodies at the same time. Therefore, according to the ChIL method, DNA fragments having different desired base sequences can be inserted in the vicinity of the binding regions of a plurality of DNA-binding proteins.
  • DNA-binding protein by including a sequence that can be distinguished for each DNA-binding protein in the identification sequence 43, it is possible to distinguish and detect the binding of a plurality of DNA-binding proteins to DNA.
  • FIG. 3 shows a state in which the transposase 50 is added to the sample and the transposase 50 is bound to the transposase binding sequence 41.
  • the transposase is preferably small in size from the viewpoint of easily entering the nucleus.
  • a transposase having a molecular weight of 50 kDa or less is preferable. Further, those having high sequence specificity of the sequence to be recognized are preferable.
  • DNA-type transposases are preferable.
  • a transposase whose activity can be controlled is preferable, and examples thereof include a transposase which is activated when a cation such as a divalent metal ion is added to the buffer.
  • Preferred transposases include, for example, TN5 transposase, sleeping beauty transposase (SB10), TN10 and the like.
  • the transposase binding sequence 41 may be determined according to the transposase used.
  • Step (c) Subsequently, the transposase 50 described above is activated. Activation of the transposase 50 can be carried out, for example, by adding a divalent metal ion to the buffer.
  • transposase 50 it may be necessary to form a dimer in order to exert the activity of transferring a DNA fragment. Also, in order for the transposase 50 to form a dimer, the transposase 50 may need to be attached to the transposase binding sequence 41.
  • the transposase 50 can also be activated by forming a dimer of the transposase 50.
  • transposase 50 in order to activate the transposase 50, it may be necessary to form a dimer of the transposase 50 and add a divalent metal ion to the buffer.
  • FIG. 4 shows a state in which a dimer of transposase 50 is formed.
  • a free DNA fragment having a transposase-binding sequence 41 is added to a sample to bind the transposase 50 to the DNA fragment.
  • the transposase 50 bound to the above DNA fragment forms a dimer with the transposase 50 bound to the transposase binding sequence 41 constituting the DNA fragment 40.
  • the DNA fragment of the desired base sequence in the DNA fragment 40 (in the example of FIG. 4, the base sequence in which the identification sequence 43 is linked downstream of the T7 promoter sequence 42) is inserted in the vicinity of the binding region 11.
  • the neighborhood may be a region that is spatially close to each other, and may be, for example, a binding region of 11 to 500 bases or less, for example, 100 bases or less, or 50 bases or less. ..
  • the neighborhood may be a region that is spatially close to each other, it is a region that is very far from the binding region 11 on the base sequence of the genomic DNA 10, and is a region that is closer to each other due to the interaction between the genomic regions. May be good. That is, the regions may be close to each other in terms of chromosomal structure.
  • the insertion reaction of the DNA fragment by the transposase 50 may be completed incompletely.
  • the inserted DNA fragment is partially single-stranded DNA, cases where the inserted DNA fragment is fragmented, and the like. Therefore, it is preferable to further carry out a step of completely terminating the insertion reaction of the DNA fragment by the transposase 50 by a fill-in reaction or the like using T4DNA ligase, T4DNA polymerase or the like.
  • FIG. 5 is a schematic diagram showing an example of a state in which a DNA fragment having a desired base sequence is inserted in the vicinity of the binding region 11.
  • a DNA fragment of a desired base sequence (a base sequence in which the identification sequence 43 is linked downstream of the T7 promoter sequence 42) is inserted in the vicinity of the binding region 11.
  • the two transposase binding sequences 41 and the base sequence 44'derived from a part of the linker 44 are inserted into the genomic DNA 10.
  • FIG. 6A to 6C are schematic views showing an example in which a DNA fragment is inserted into genomic DNA 10 as a result of activation of transposase 50 from the state of FIG. 3 described above.
  • FIG. 6A shows the state of FIG. 5 described above.
  • FIG. 6B shows a state in which the desired base sequence is inserted in the direction opposite to that in FIG. 5 described above.
  • FIG. 6C shows a base sequence that can be inserted into genomic DNA 10 when transposases 50 bound to a free DNA fragment having a transposase binding sequence 41 form a dimer.
  • the base sequence inserted into the genomic DNA 10 in FIG. 6C contains two transposase binding sequences 41, and may contain an arbitrary base sequence 45 between them.
  • the base sequence 45 is formed by the above-mentioned fill-in reaction.
  • the base sequence shown in FIG. 6C is an unintended by-product and can be inserted not only in the vicinity of the binding region 11 but also in any part on the genomic DNA 10.
  • the base sequence shown in FIG. 6C does not have the desired base sequence (in this example, the base sequence in which the identification sequence 43 is linked downstream of the T7 promoter sequence 42). Therefore, the influence on the target analysis can be eliminated.
  • a DNA fragment having a desired base sequence can be inserted in the vicinity of the binding region of the DNA-binding protein bound to the DNA molecule.
  • the desired base sequence to be inserted into the genomic DNA 10 is a base sequence in which the identification sequence 43 is linked downstream of the T7 promoter sequence 42, but the desired base sequence is not limited to this. ..
  • the desired base sequence another promoter sequence such as the SP6 promoter sequence may be used instead of the T7 promoter sequence 42.
  • the desired base sequence may be composed of only the identification sequence.
  • the length of the desired base sequence to be inserted into the genomic DNA 10 may be, for example, 20 to 500 bases, for example, 20 to 200 bases, or for example, 20 to 100 bases.
  • each element (T7 promoter sequence 42, identification sequence 43 and transposase binding sequence 41) constituting the DNA fragment 40 is adjacent to each other, but an arbitrary base sequence is provided between the elements. Spacers may be present. Further, the order of each element is not limited to that shown in the examples of FIGS. 2 to 6, and may be appropriately replaced or an additional element may be added as needed.
  • the DNA fragment 40 may be single-stranded or double-stranded.
  • the transposase binding sequence 41 needs to be double-stranded DNA due to the characteristics of the transposase used, at least the transposase binding sequence 41 needs to be double-stranded.
  • a step of gene-amplifying DNA10 starting from a desired base sequence (a base sequence in which the identification sequence 43 is linked downstream of the T7 promoter sequence 42 in the examples of FIGS. 2 to 6) to obtain an amplification product, and the amplification are described.
  • the position on the genome into which the desired DNA fragment is inserted can be analyzed by a method including the step of analyzing the base sequence of the product.
  • Gene amplification examples include PCR in which a primer complementary to the inserted base sequence and a random primer are combined, transcription using a polymerase (RNA polymerase, DNA-dependent DNA polymerase, etc.), and the like.
  • RNA polymerase RNA polymerase, DNA-dependent DNA polymerase, etc.
  • gene amplification starting from a desired base sequence means gene amplification of genomic DNA 10 by utilizing a part or all of a desired base sequence inserted in the vicinity of the binding region 11. means.
  • the T7 promoter sequence 42 is included in the base sequence inserted into the genomic DNA 10. Therefore, "gene amplification starting from a desired base sequence” means transcribing the genomic DNA 10 downstream of the T7 promoter sequence 42 into RNA by reacting the above genomic DNA 10 with T7 polymerase and transcribing it. It may be.
  • gene amplification starting from a desired base sequence is a combination of a primer having a base sequence complementary to a part or all of the inserted base sequence and a random primer using the above genomic DNA 10 as a template.
  • the base sequence of the genomic DNA 10 in the vicinity of the binding region 11 may be gene-amplified by performing PCR or the like.
  • the inserted base sequence contains a promoter sequence
  • gene amplification involves contacting RNA polymerase with the promoter sequence and transcribing DNA downstream of the promoter sequence to generate RNA. You may.
  • the nucleotide sequence shown in FIG. 6C does not have the T7 promoter sequence 42, gene amplification (transcription) is not performed even if T7 polymerase is allowed to act on it.
  • the gene may be amplified by PCR or the like using the inserted desired base sequence.
  • the base sequence shown in FIG. 6C does not have a desired base sequence (a base sequence in which the identification sequence 43 is bound downstream of the T7 promoter sequence 42)
  • the inserted base sequence was used. The gene is not amplified even if the PCR reaction is performed.
  • FIG. 7A is a diagram showing a state in which T7 polymerase is allowed to act on DNA10 shown in FIG. 5 or 6A and DNA10 downstream of the T7 promoter sequence 42 is transcribed into RNA60.
  • FIG. 7B is a diagram showing a state in which T7 polymerase is allowed to act on the DNA10 shown in FIG. 6B and the DNA10 downstream of the T7 promoter sequence 42 is transcribed into RNA60.
  • the RNA 60 contains the complementary strand 43'of the discriminant sequence 43 and the complementary strand 10'of the DNA 10 downstream of the discriminant sequence 43. Includes.
  • RNA may be transcribed from a region other than the T7 promoter sequence 42 inserted by the above reaction.
  • the presence of the discriminant sequence 43 makes it possible to discriminate between RNA transcribed from the inserted T7 promoter sequence 42 and other RNA. That is, it can be determined that the RNA 60 having the complementary strand 43'of the identification sequence 43 is the RNA transcribed from the inserted T7 promoter sequence 42 as the starting point.
  • the ChIL method it is possible to perform analysis using a specific binding substance for a plurality of DNA-binding proteins at the same time.
  • a different identification sequence 43 into the DNA fragment 40 inserted into the DNA 10 using each specific binding substance, RNA transcribed from the vicinity of the binding region of any DNA-binding protein. It is also possible to identify whether or not.
  • RNA60 the position on the genome to which the DNA-binding protein is bound can be identified.
  • the base sequence of RNA60 may be analyzed by, for example, a next-generation sequencer, hybridization with a DNA array, or the like.
  • RNA60 is RNA transcribed from the vicinity of the binding region 11. Therefore, by analyzing the base sequence of RNA60, for example, the position of the binding region of the DNA-binding protein (histone 20 in the examples of FIGS. 2 to 7) on the genome can be specified. That is, the direction in which the desired base sequence is inserted does not affect the analysis result.
  • the conjugate used in the ChIL method is a DNA fragment having a base sequence containing a transposase binding sequence and a desired base sequence, and a specific binding substance for a DNA-binding protein or a specific binding substance for the specific binding substance. It is a thing.
  • the transposase binding sequence, the desired base sequence, and the specific binding substance are the same as those described above. That is, the desired base sequence includes an identification sequence. Moreover, the desired base sequence may further contain a promoter sequence upstream of the identification sequence.
  • the DNA fragment is preferably bound to a specific binding substance to the DNA-binding protein or a specific binding substance to the specific binding substance via a linker.
  • the linker is the same as that described above.
  • a conjugate of a desired DNA fragment and a specific binding substance for a DNA-binding protein means, for example, a conjugate in which a desired DNA fragment is bound to a primary antibody. That is, the conjugate may be a conjugate in which the above-mentioned DNA fragment is directly bound to a specific binding substance for a DNA-binding protein.
  • a conjugate of a desired DNA fragment and a specific binding substance for the specific binding substance for a DNA-binding protein means, for example, a conjugate in which the desired DNA fragment is bound to a secondary antibody. That is, the desired DNA fragment may not be bound to a specific binding substance to the DNA-binding protein, but may be bound to a specific binding substance that binds to the specific binding substance to the DNA-binding protein. More specifically, for example, when the specific binding substance for the DNA-binding protein is mouse IgG, a conjugate of a desired DNA fragment and an anti-mouse IgG antibody can be mentioned.
  • the number of desired DNA fragments per molecule of the specific binding substance is not particularly limited, and can be, for example, about 1 to 10.
  • the method for binding the DNA fragment to the specific binding substance is not particularly limited, and for example, a chemical cross-linking agent having a succinimide group, a maleimide group, or the like may be used for binding.
  • a chemical cross-linking agent having a succinimide group, a maleimide group, or the like may be used for binding.
  • an amino group may be bonded to the 5'end of the DNA fragment, and a functional group such as an amino group or a carboxy group existing in the specific binding substance may be covalently bonded to the amino group with an appropriate chemical cross-linking agent. Be done.
  • a DNA fragment may be bound to a specific binding substance by utilizing the binding of avidin and biotin or the like.
  • FIG. 8 is a schematic diagram illustrating an example of the high-throughput single-cell ChIL method.
  • step ⁇ the cells are distributed into 96 compartments of the 1st to 96th.
  • cells are distributed to each well of a 96-well plate.
  • step ⁇ the first to 96th nucleic acid fragments A (ChIL probes) having different base sequences for each compartment are ligated to the target nucleic acids of the cells distributed in the first to 96th compartments, and the first -The 96th detection nucleic acid group A is obtained.
  • the diamond, circle, and star pentagram symbols indicate examples of nucleic acid fragment A, respectively.
  • step ⁇ cells are collected from the first to 96th compartments and pooled.
  • step ⁇ the pooled cells are distributed to 9216 compartments of the first to 9216th cells.
  • a cell sorter is used to distribute cells to each well of 24 384-well plates.
  • step ⁇ the nucleic acid fragments B of the first to 9216th cells having different base sequences for each of the first to 96th detection nucleic acid groups A of the cells distributed to the first to 9216 compartments. Are further ligated to obtain the first to 9216 detection nucleic acid groups B.
  • FIG. 8 the combination of triangular and hexagonal symbols, the combination of pentagonal and star-shaped heptagonal symbols, respectively, shows an example of nucleic acid fragment B.
  • the nucleic acid fragments B of the first to 96th detection nucleic acid groups A are ligated by PCR using the nucleic acid fragments transcribed using T7 RNA polymerase as a template and the primer sets of the first to 9216th. is doing.
  • the nucleic acid fragment B may be bound not to the detection nucleic acid group A itself but to a transcript of the detection nucleic acid group A, a complementary strand of the detection nucleic acid group A, or the like.
  • step ⁇ the base sequences of the detection nucleic acid groups B of the first to 9216th are comprehensively determined, and a plurality of reads are obtained.
  • the base sequence of the target nucleic acid contained in the read is detected in correspondence with one cell based on the base sequence of the nucleic acid fragment A and the base sequence of the nucleic acid fragment B contained in the read.
  • the ChIL method can be carried out in parallel on a large number of cells at the single cell level.
  • Example 1 (Examination of cell fixation / detachment conditions) After fixing the cells on a 96-well plate and performing the ChIL method, the conditions for exfoliation and recovery were examined. As cells, mouse skeletal myoblasts C2C12 were used.
  • the mixture was centrifuged at 300 ⁇ g at 4 ° C. for 5 minutes, and the supernatant was discarded. Subsequently, 1 mL of ice-cooled quench buffer (50 mM Tris-HCl (pH 8.0), 0.1 mM EDTA, 150 mM NaCl) was added. Subsequently, the tube was set on a rotator and rotated at 4 ° C. for 30 minutes. Subsequently, the mixture was centrifuged at 300 ⁇ g at 4 ° C. for 5 minutes, and the supernatant was discarded.
  • ice-cooled quench buffer 50 mM Tris-HCl (pH 8.0), 0.1 mM EDTA, 150 mM NaCl
  • FIG. 9A is a typical phase-contrast micrograph of the surface of the well. The magnification is 4 times. As a result, it was confirmed that the cells were fixed on the surface of the well.
  • Triton X-100 / PBS was added to each well of the 96-well plate and allowed to stand at room temperature for 20 minutes. Subsequently, Triton X-100 was removed from each well, and 200 ⁇ L / well of PBS was added for washing.
  • Blocking One-P Nacalai Tesque
  • Blocking One-P was added at 200 ⁇ L / well and allowed to stand for 20 minutes for blocking.
  • Blocking One-P was removed from each well, and 200 ⁇ L / well of PBS was added for washing.
  • nucleic acid-labeled secondary antibody diluted with 0.1 ⁇ Blocking One-P, 0.5M NaCl / PBS was added in 100 ⁇ L / well increments, and the mixture was reacted overnight at 4 ° C.
  • secondary antibody an anti-mouse IgG antibody was used.
  • the DNA fragment labeled with the nucleic acid-labeled secondary antibody was obtained by annealing the DNA fragment consisting of the nucleotide sequence shown in SEQ ID NO: 1 and the DNA fragment consisting of the nucleotide sequence shown in SEQ ID NO: 2. ..
  • the 62nd to 80th base sequences are TN5 transposase binding sequences
  • the 4th to 23rd base sequences are T7 promoter sequences
  • the 41st to 46th base sequences are. Is a discriminant sequence
  • the first to third bases are a part of the base sequence of the linker.
  • the identification sequence one having a different base sequence for each of the 96 wells was selected from the base sequences shown in Table 1 above and used.
  • the DNA fragment consisting of the base sequence shown in SEQ ID NO: 2 is a DNA fragment complementary to the DNA fragment consisting of the base sequence shown in SEQ ID NO: 1, and is a DNA fragment consisting of the base sequence shown in SEQ ID NO: 1.
  • a binding sequence of TN5 transposase which is a double-stranded DNA, was formed.
  • oligo3-4 a free DNA fragment having a transposase-binding sequence (hereinafter referred to as “oligo3-4”) was added to each well and reacted at room temperature for 1 hour.
  • oligo3-4 a DNA fragment consisting of the nucleotide sequence shown in SEQ ID NO: 3 and a DNA fragment consisting of the nucleotide sequence shown in SEQ ID NO: 4 were annealed.
  • the double-stranded DNA region of oligo3-4 was the binding sequence of the TN5 transposase.
  • TN5 dialysis buffer 50 mM HEPES-KOH (pH 7.2), 0.1 M NaCl, 0.1 mM EDTA, 1 mM DTT, 0.1% Triton X-100, 10% glycerol. did.
  • the inactivation and removal of the transposase can also be performed by first adding 100 ⁇ L / well of 50 mM EDTA and allowing it to stand at 50 ° C. for 30 minutes, and then washing with 100 ⁇ L / well of PBS three times. ..
  • each well was washed with 1 ⁇ T4 DNA ligase reaction buffer, 50 ⁇ L / well of the fill-in reaction solution shown in Table 3 below was added, and the mixture was reacted at room temperature for 30 minutes. This ensured that the DNA fragment labeled with the nucleic acid-labeled secondary antibody was inserted in the vicinity of the CTD serine diphosphorylated RNA polymerase II binding region on the genomic DNA.
  • T4 DNA ligase and T4 DNA polymerase I were inactivated and removed.
  • 100 ⁇ L / well of 50 mM EDTA was added and allowed to stand at 50 ° C. for 30 minutes, and then washed 3 times with 100 ⁇ L / well of PBS. Can also be done.
  • Accumax (Nacalai Tesque, Inc.) is a mild cell exfoliating solution containing an enzyme having proteolytic activity and collagen-degrading activity as a main component.
  • FIG. 9B is a typical phase-contrast micrograph of the surface of the well after collecting the supernatant. The magnification is 10 times. As a result, it was confirmed that the cells were detached from the surface of the well. From the above results, it was clarified that the cells could be immobilized on the surface of the well, further exfoliated and collected under the conditions of this experimental example.
  • the mixture was centrifuged at 300 ⁇ g at 4 ° C. for 5 minutes, and the supernatant was discarded. Subsequently, 1 mL of ice-cooled quench buffer (50 mM Tris-HCl (pH 8.0), 0.1 mM EDTA, 150 mM NaCl) was added. Subsequently, the tube was set on a rotator and rotated at 4 ° C. for 30 minutes. Subsequently, the mixture was centrifuged at 300 ⁇ g at 4 ° C. for 5 minutes, and the supernatant was discarded.
  • ice-cooled quench buffer 50 mM Tris-HCl (pH 8.0), 0.1 mM EDTA, 150 mM NaCl
  • Triton X-100 / PBS was added to each well of the 96-well plate and allowed to stand at room temperature for 20 minutes. Subsequently, Triton X-100 was removed from each well, and 200 ⁇ L / well of PBS was added for washing.
  • Blocking One-P Nacalai Tesque
  • Blocking One-P was added at 200 ⁇ L / well and allowed to stand for 20 minutes for blocking.
  • Blocking One-P was removed from each well, and 200 ⁇ L / well of PBS was added for washing.
  • nucleic acid-labeled secondary antibody diluted with 0.1 ⁇ Blocking One-P, 0.5M NaCl / PBS was added in 100 ⁇ L / well increments, and the mixture was reacted overnight at 4 ° C.
  • secondary antibody an anti-mouse IgG antibody was used.
  • the DNA fragment labeled with the nucleic acid-labeled secondary antibody was obtained by annealing the DNA fragment consisting of the nucleotide sequence shown in SEQ ID NO: 1 and the DNA fragment consisting of the nucleotide sequence shown in SEQ ID NO: 2. ..
  • oligo3-4 a free DNA fragment having a transposase-binding sequence (hereinafter referred to as “oligo3-4”) was added to each well and reacted at room temperature for 1 hour.
  • oligo3-4 a DNA fragment consisting of the nucleotide sequence shown in SEQ ID NO: 3 and a DNA fragment consisting of the nucleotide sequence shown in SEQ ID NO: 4 were annealed.
  • the double-stranded DNA region of oligo3-4 was the binding sequence of the TN5 transposase.
  • TN5 dialysis buffer 50 mM HEPES-KOH (pH 7.2), 0.1 M NaCl, 0.1 mM EDTA, 1 mM DTT, 0.1% Triton X-100, 10% glycerol. did.
  • each well was washed with 1 ⁇ T4 DNA ligase reaction buffer, 50 ⁇ L / well of the fill-in reaction solution shown in Table 3 above was added, and the mixture was reacted at room temperature for 30 minutes. This ensured that the DNA fragment labeled with the nucleic acid-labeled secondary antibody was inserted in the vicinity of the CTD serine diphosphorylated RNA polymerase II binding region on the genomic DNA.
  • DAPI 4, 6-diamidino-2-phenylindole
  • cells were sorted into 384-well plates with 25 cells / well, 50 cells / well, and 75 cells / well.
  • the reagents having the compositions shown in Table 4 below were previously dispensed into the 384 plates at a rate of 100 ⁇ L / well.
  • the 384 plate was allowed to stand at 37 ° C. for 16 hours.
  • the genomic DNA was transcribed by T7 RNA polymerase starting from the T7 RNA promoter sequence contained in the DNA fragment inserted into the genomic DNA.
  • cDNA was synthesized.
  • a custom primer SEQ ID NO: 5
  • SEQ ID NO: 5 was used instead of the 3'SMART-Seq CDS Primer IIA included in the kit.
  • PCR reaction was performed using cDNA as a template.
  • Ad1 primer SEQ ID NO: 6
  • Ad2 primer SEQ ID NO: 7
  • the 30th to 37th base sequences were identification sequences.
  • the 25th to 32nd base sequences were identification sequences.
  • the combination of the identification sequence of the Ad1 primer and the identification sequence of the Ad2 primer used in the PCR reaction those having a different base sequence for each well of 384 wells were used.
  • the first to 162nd tables in Table 2 above show the identification sequences used for the Ad1 primers.
  • the identification sequences used for the Ad2 primers are shown in the 163rd to 324th positions of Table 2 above.
  • the obtained PCR amplification product includes a base sequence near the CTD serine 2 phosphorylated RNA polymerase II binding region on the genomic DNA, which is the base sequence of the target nucleic acid, and a DNA fragment labeled with the nucleic acid-labeled secondary antibody.
  • the discriminant sequence contained in, the discriminant sequence of the Ad1 primer, and the discriminant sequence of the Ad2 primer will be included.
  • the combination of the identification sequence contained in the DNA fragment labeled with the nucleic acid-labeled secondary antibody, the identification sequence of the Ad1 primer, and the identification sequence of the Ad2 primer is different at the one-cell level.
  • the PCR amplification product in which the combination of the identification sequence contained in the DNA fragment labeled with the nucleic acid-labeled secondary antibody, the identification sequence of the Ad1 primer and the identification sequence of the Ad2 primer is the same is derived from the same cell. ..
  • the PCR amplification product was purified and quantified using APPure XP beads (Beckman Coulter). Subsequently, the nucleotide sequence of the PCR amplification product was comprehensively sequenced using a next-generation sequencer (Illumina).
  • FIG. 10A shows the identification sequence contained in the PCR amplification product obtained as a result of performing the above reaction by sorting cells into 384-well plates of 25 cells / well, 50 cells / well, and 75 cells / well. It is a figure which shows. The results of 4 experiments when sorting 25 pieces / well, the results of 3 times when sorting 50 pieces / well, and the results of 2 times when sorting 75 pieces / well are shown.
  • FIG. 10A shows which of the 96 types of identification sequences contained in the DNA fragment labeled with the nucleic acid-labeled secondary antibody was detected. Black indicates that the discriminant sequence was detected, and white black indicates that the discriminant sequence was not detected.
  • FIG. 10B is a graph of the result of FIG. 10A.
  • the vertical axis of the graph shows the number of discriminant sequences detected.
  • “25” indicates the result of sorting 25 cells / well
  • "50” indicates the result of sorting 50 cells / well
  • “75” indicates the result of sorting 50 cells / well. It is shown that it is the result of sorting 75 cells / well.
  • the present invention it is possible to provide a technique for detecting the base sequence of a target nucleic acid existing in each of a plurality of cells in parallel at the level of one cell.

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • Biomedical Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Immunology (AREA)
  • Analytical Chemistry (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Medicinal Chemistry (AREA)
  • Plant Pathology (AREA)
  • Cell Biology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Enzymes And Modification Thereof (AREA)

Abstract

細胞を第1~第n(nは2以上の整数)のn個の区画に分配することと、細胞の対象核酸に、それぞれ区画ごとに塩基配列が異なる第1~第nの核酸断片Aを連結し、検出用核酸群Aを得ることと、細胞を回収してプールすることと、プールした細胞を再度第1~第m(mは2以上の整数)のm個の区画に分配することと、検出用核酸群Aに、それぞれ区画ごとに塩基配列が異なる第1~第mの核酸断片Bを更に連結し、第1~第mの検出用核酸群Bを得ることと、検出用核酸群Bの塩基配列を網羅的に決定し、複数のリードを得ることと、リードに含まれる対象核酸の塩基配列を、当該リードに含まれる核酸断片Aの塩基配列及び核酸断片Bの塩基配列に基づいて、1細胞に対応させて検出することとを含む、検出方法。

Description

対象核酸の塩基配列を1細胞レベルで並列に検出する方法
 本発明は、複数の細胞のそれぞれに存在する対象核酸の塩基配列を1細胞レベルで並列に検出する方法に関する。本願は、2020年2月4日に、日本に出願された特願2020-017027号に基づき優先権を主張し、その内容をここに援用する。
 複数の細胞のそれぞれに存在する対象核酸の塩基配列を1細胞レベルで検出する需要がある。例えば、発明者らは、以前に、DNA結合タンパク質と特定のゲノム領域との結合を1細胞レベルで解析する技術を開発した(特許文献1を参照。)
 特許文献1に記載された方法の場合、対象核酸の塩基配列とは、DNA結合タンパク質のゲノムDNA上の結合領域の近傍の塩基配列である。特許文献1に記載された方法により、DNA結合タンパク質のゲノムDNA上の結合位置を1細胞レベルで解析することができる。
国際公開第2018/042776号
 しかしながら、特許文献1に記載された方法を、複数の細胞に対して1細胞レベルで並列に実施するためには、更なる技術開発が必要である。本発明は、複数の細胞のそれぞれに存在する対象核酸の塩基配列を1細胞レベルで並列に検出する技術を提供することを目的とする。
 本発明は以下の態様を含む。
[1]複数の細胞のそれぞれに存在する対象核酸の塩基配列を1細胞レベルで並列に検出する方法であって、前記細胞を第1~第n(ここで、nは2以上の整数である。)のn個の区画に分配する工程αと、前記第1~第nの区画に分配した前記細胞の前記対象核酸に、それぞれ区画ごとに塩基配列が異なる第1~第nの核酸断片Aを連結し、第1~第nの検出用核酸群Aを得る工程βと、前記第1~第nの区画から前記細胞を回収してプールする工程γと、プールした前記細胞を再度第1~第m(ここで、mは2以上の整数である。)のm個の区画に分配する工程δと、前記第1~第mの区画に分配した前記細胞の、前記第1~第nの検出用核酸群Aに、それぞれ区画ごとに塩基配列が異なる第1~第mの核酸断片Bを更に連結し、第1~第mの検出用核酸群Bを得る工程εと、前記第1~第mの検出用核酸群Bの塩基配列を網羅的に決定し、複数のリードを得る工程ζと、前記リードに含まれる対象核酸の塩基配列を、当該リードに含まれる核酸断片Aの塩基配列及び核酸断片Bの塩基配列に基づいて、1細胞に対応させて検出する工程ηと、を含む、方法。
[2]前記工程αにおいて、前記第1~第nのn個の区画に分配した前記細胞を、前記区画の内部にアビジン-ビオチン結合により結合する、[1]に記載の方法。
[3]前記工程γにおいて、前記第1~第nのn個の区画の内部に結合した前記細胞を、タンパク質分解活性及びコラーゲン分解活性を有する酵素の混合物により剥離させて回収する、[2]に記載の方法。
[4]前記工程βにおける前記対象核酸と前記第1~第nの核酸断片Aとの連結を、トランスポザーゼを用いて行う、[1]~[3]のいずれかに記載の方法。
[5]前記工程εにおける前記第1~第nの検出用核酸群Aと前記第1~第mの核酸断片Bとの連結を、ポリメラーゼ連鎖反応を用いて行う、[1]~[4]のいずれかに記載の方法。
[6]前記第1~第nの核酸断片A及び前記第1~第mの核酸断片Bのそれぞれが、下記表1及び表2に記載のいずれかの塩基配列を含む塩基配列を有する、[1]~[5]のいずれかに記載の方法。
Figure JPOXMLDOC01-appb-T000003
Figure JPOXMLDOC01-appb-T000004
 本発明によれば、複数の細胞のそれぞれに存在する対象核酸の塩基配列を1細胞レベルで並列に検出する技術を提供することができる。
図1は、複数の細胞のそれぞれに存在する対象核酸の塩基配列を1細胞レベルで並列に検出する方法を説明する模式図である。 図2は、Chromatin Integration Labeling法(ChIL法)の一例を説明する模式図である。 図3は、ChIL法を説明する模式図である。 図4は、ChIL法を説明する模式図である。 図5は、ChIL法を説明する模式図である。 図6Aは、ChIL法を説明する模式図である。 図6Bは、ChIL法を説明する模式図である。 図6Cは、ChIL法を説明する模式図である。 図7Aは、ChIL法を説明する模式図である。 図7Bは、ChIL法を説明する模式図である。 図8は、ハイスループットシングルセルChIL法の一例を説明する模式図である。 図9Aは、実験例1の結果を示す代表的な位相差顕微鏡写真である。 図9Bは、実験例1の結果を示す代表的な位相差顕微鏡写真である。 図10Aは、実験例2の結果を示す図である。 図10Bは、図10Aの結果を示すグラフである。
 以下、場合により図面を参照しつつ、本発明の実施形態について詳細に説明する。なお、図面中、同一又は相当部分には同一又は対応する符号を付し、重複する説明は省略する。なお、各図における寸法比は、説明のため誇張している部分があり、必ずしも実際の寸法比とは一致しない。
 1実施形態において、本発明は、複数の細胞のそれぞれに存在する対象核酸の塩基配列を1細胞レベルで並列に検出する方法であって、前記細胞を第1~第n(ここで、nは2以上の整数である。)のn個の区画に分配する工程αと、前記第1~第nの区画に分配した前記細胞の前記対象核酸に、それぞれ区画ごとに塩基配列が異なる第1~第nの核酸断片Aを連結し、第1~第nの検出用核酸群Aを得る工程βと、前記第1~第nの区画から前記細胞を回収してプールする工程γと、プールした前記細胞を再度第1~第m(ここで、mは2以上の整数である。)のm個の区画に分配する工程δと、前記第1~第mの区画に分配した前記細胞の、前記第1~第nの検出用核酸群Aに、それぞれ区画ごとに塩基配列が異なる第1~第mの核酸断片Bを更に連結し、第1~第mの検出用核酸群Bを得る工程εと、前記第1~第mの検出用核酸群Bの塩基配列を網羅的に決定し、複数のリードを得る工程ζと、前記リードに含まれる対象核酸の塩基配列を、当該リードに含まれる核酸断片Aの塩基配列及び核酸断片Bの塩基配列に基づいて、1細胞に対応させて検出する工程ηとを含む方法を提供する。
 図1は、本実施形態の方法を説明する模式図である。以下、図1を用いて本実施形態の方法を説明する。
(工程α)
 まず、工程αにおいて、解析対象の細胞を第1~第n(ここで、nは2以上の整数である。)のn個の区画に分配する。例えば、細胞を96ウェルプレートの各ウェルに分配してもよい。この場合、nは96である。nの数は96に限られず、2以上の任意の整数であってよい。nは、例えば、2、3、4、5、6、7、8、9、10、11、12、24、48、96、384、1536、9216等であってもよい。細胞の分配は、マイクロピペットを用いて手動で行ってもよいし、セルソーター等の装置を用いて行ってもよい。
 ここで、細胞は、解析対象である対象核酸を有している。対象核酸は、例えば、ゲノム上の特定領域(対象DNA結合タンパク質の近傍)であってもよいし、miRNAであってもよいし、mRNAであってもよい。
 あるいは、対象核酸は、核酸でない分子に標識した核酸であってもよい。核酸でない分子としては、例えば、タンパク質、代謝物等が挙げられる。例えば、解析対象であるタンパク質や代謝物に対する特異的結合物質を、対象核酸で標識し、この特異的結合物質を細胞に接触させる。特異的結合物質としては、抗体、抗体断片、アプタマー等が挙げられる。この結果、タンパク質や代謝物が対象核酸で標識される。この対象核酸を検出することにより、タンパク質や代謝物を1細胞レベルで並列に検出することができる。
 対象核酸は細胞内に存在していてもよいし、細胞表面に存在していてもよい。また、対象核酸は、1細胞あたり1分子存在していてもよいし、1細胞あたり複数分子存在していてもよい。ここで、複数とは、例えば2~10個であってもよいし、例えば2~10,000個であってもよいし、例えば2~1,000,000個であってもよい。
 工程αにおいて、第1~第nのn個の区画に分配した細胞を、区画の内部に固定してもよい。例えば、区画がウェルプレートにより構成されている場合には、ウェルの表面に細胞を固定してもよい。細胞を固定することにより、洗浄が必要な反応を行うことが可能になる。洗浄が必要な反応としては、例えば、抗原抗体反応、後述するChIL法による反応等が挙げられる。
 従来、細胞を固相に固定し、所望の反応を行った後、再び細胞を固相から剥離して回収することは困難であった。これに対し、発明者らは、細胞を固相に結合し、更に回収することができる方法を見出した。
 具体的には、第1~第nのn個の区画に分配した細胞を、区画の内部にアビジン-ビオチン結合により結合してもよい。
 例えば、細胞にビオチン化試薬を反応させることにより、細胞表面にビオチンを結合させることができる。ビオチン化試薬としては、例えば、スクシンイミド基、マレイミド基、ヨードアセチル基、ピリジルジスルフィド基、ヒドラジド基、アルコキシアミン基等を含む化学リンカーを用いることができる。また、ビオチン化試薬の内部に切断可能な結合を有していてもよい。切断可能な結合としては、ジスルフィド結合等が挙げられる。
 より具体的なビオチン化試薬としては、例えば、NHS-Biotin、NHS-LC-Biotin、NHS-LC-LC-Biotin、Sulfo-NHS-SS-Biotin、Alkoxyamine-PEG-SS-PEG-Biotin、HPDP-Biotin、BMCC-Biotin、Iodoacetyl-LC-Biotin、Amine-PEG-Biotin、Hydrazide-Biotin、Alkoxyamine-PEG-Biotin(いずれもサーモフィッシャーサイエンティフィック社より入手可能である。)等が挙げられるがこれらに限定されない。
 細胞表面がビオチン化された細胞を、アビジンコートされたウェルプレートに分注すると、ウェルの表面にアビジン-ビオチン結合により結合することができる。アビジンとして、ストレプトアビジンを用いてもよい。また、細胞表面をアビジン化し、ウェルの表面をビオチン化してもよい。
 固相に結合した細胞を固相から剥離して回収する方法としては、例えば、固相に結合した細胞に細胞を破壊しない程度のマイルドな酵素を作用させることが挙げられる。このような酵素としては、タンパク質分解活性を有する酵素及びコラーゲン分解活性を有する酵素の混合物が挙げられ、より具体的には、Accumax(ナカライテスク社)、Accutase(ナカライテスク社)等が挙げられる。
 また、ビオチン化試薬の内部にジスルフィド結合が存在する場合には、ジチオスレイトール(DTT)、β-メルカプトエタノール等の還元剤を作用させて、当該ジスルフィド結合を切断してもよい。これにより、細胞を固相から剥離することができる。更に、固相に結合した細胞に、酵素及び還元剤の双方を作用させることにより、細胞を固相から剥離して回収してもよい。
(工程β)
 続いて、工程βにおいて、第1~第nの区画に分配した細胞の対象核酸に、それぞれ区画ごとに塩基配列が異なる第1~第nの核酸断片Aを連結し、第1~第nの検出用核酸群Aを得る。
 核酸断片Aの連結方法は特に限定されず、例えばトランスポザーゼを用いて行ってもよいし、例えばポリメラーゼ連鎖反応により行ってもよいし、例えば、ライゲーション反応により行ってもよい。
 例えば、核酸断片Aの塩基配列を含むプライマーを用いてポリメラーゼ連鎖反応を行った場合、得られた増幅産物は対象核酸と核酸断片Aが連結したものとなる。例えば、ライゲーション反応により、核酸断片Aの塩基配列を含む核酸断片と対象核酸とを連結させることもできる。トランスポザーゼを用いる方法(Chromatin Integration Labeling、ChIL法)については後述する。
 核酸断片Aは、細胞がどの区画に分配されていたかを識別可能な識別配列を含む。核酸断片Aは識別配列以外に付加的な塩基配列を含んでいてもよい。また、核酸断片Aは1つの連続した核酸断片から構成されていてもよいし、2以上の核酸断片から構成されていてもよい。例えば、核酸断片Aはセンスプライマー及びアンチセンスプライマーの組み合わせから構成されていてもよい。また、センスプライマー及びアンチセンスプライマーの双方が識別配列を含んでいてもよい。ここで、センスプライマーが含む識別配列とアンチセンスプライマーが含む識別配列は異なっていてもよく、これらの識別配列の組み合わせが核酸断片Aの識別配列として機能してもよい。
 識別配列としては、確率的に出現頻度が低い塩基配列であれば特に制限されず、例えば約4~20塩基程度の任意の塩基配列を用いることができる。第1~第nの核酸断片Aのそれぞれは、例えば、上記表1及び表2に記載のいずれかの塩基配列からなる識別配列を含む塩基配列を有することができる。上記表1には、384個の塩基配列が記載されている。上記表2には、324個の塩基配列が記載されている。上記表1及び表2に記載の塩基配列は、人工的に作出した塩基配列であり、1細胞レベルで細胞を識別する際に、識別配列に基づいて細胞をより正確に分離させるために、シーケンスエラーを考慮し、少なくとも2塩基以上が互いに異なるように設計されている。
 図1の例では、96ウェルプレートの各ウェルに分配した細胞の対象核酸に、ウェルごとに塩基配列が異なる第1~第96の核酸断片Aを連結する。この結果、核酸断片Aの塩基配列がウェルごとに異なる、第1~第96の検出用核酸群Aが得られる。ここで、検出用核酸群Aとは、塩基配列が異なる検出用核酸Aの混合物を意味する。検出用核酸Aは、対象核酸と核酸断片Aが連結したものである。図1の例では、核酸断片Aの種類ごとに細胞の図のパターンを変化させている。
(工程γ)
 続いて、工程γにおいて、第1~第nの区画から細胞を回収してプールする。工程αにおいて、第1~第nのn個の区画に分配した細胞が、区画の内部に結合している場合には、本工程において、細胞を、タンパク質分解活性及びコラーゲン分解活性を有する酵素の混合物により剥離させて回収してもよい。
 また、上述したように、細胞がアビジン-ビオチン結合により区画の内部に結合しており、アビジン-ビオチン結合を還元剤により切断可能な場合には、還元剤を作用させて細胞を剥離させてもよい。アビジン-ビオチン結合を還元剤により切断可能な場合としては、例えば、使用したビオチン化試薬の内部にジスルフィド結合が存在する場合が挙げられる。還元剤としては、上述したものと同様であり、ジチオスレイトール(DTT)、β-メルカプトエタノール等が挙げられる。
 また、固相に結合した細胞に、酵素及び還元剤の双方を作用させることにより、細胞を固相から剥離して回収してもよい。
(工程δ)
 続いて、工程δにおいて、プールした細胞を再度第1~第m(ここで、mは2以上の整数である。)のm個の区画に再分配する。例えば、細胞を384ウェルプレートの各ウェルに分配してもよい。この場合、mは384である。図1の例では、細胞を24枚の384プレートの各ウェルに分配している。この場合、mは9216である。細胞の分配は、マイクロピペットを用いて手動で行ってもよいし、セルソーター等の装置を用いて行ってもよい。
 mの数は384や9216に限られず、2以上の任意の整数であってよい。mは、例えば、2、3、4、5、6、7、8、9、10、11、12、24、48、96、384、1536、9216等であってもよい。
(工程ε)
 続いて、工程εにおいて、第1~第mの区画に分配した細胞の細胞内又は細胞表面に存在する、第1~第nの検出用核酸群Aに、それぞれ区画ごとに塩基配列が異なる第1~第mの核酸断片Bを更に連結し、第1~第mの検出用核酸群Bを得る。
 核酸断片Bの連結方法は、上述した核酸断片Aの連結方法と同様であり、例えばトランスポザーゼを用いて行ってもよいし、例えばポリメラーゼ連鎖反応により行ってもよいし、例えば、ライゲーション反応により行ってもよい。
 例えば、核酸断片Bの塩基配列を含むプライマーを用いてポリメラーゼ連鎖反応を行った場合、得られた増幅産物は検出用核酸群Aと核酸断片Bが連結したものとなる。例えば、ライゲーション反応により、核酸断片Bの塩基配列を含む核酸断片と検出用核酸群Aとを連結させることもできる。
 核酸断片Bは、核酸断片Aと同様に、細胞がどの区画に分配されていたかを識別可能な識別配列を含む。核酸断片Bは識別配列以外に付加的な塩基配列を含んでいてもよい。また、核酸断片Bは1つの連続した核酸断片から構成されていてもよいし、2以上の核酸断片から構成されていてもよい。例えば、核酸断片Bはセンスプライマー及びアンチセンスプライマーの組み合わせから構成されていてもよい。また、センスプライマー及びアンチセンスプライマーの双方が識別配列を含んでいてもよい。ここで、センスプライマーが含む識別配列とアンチセンスプライマーが含む識別配列は異なっていてもよく、これらの識別配列の組み合わせが核酸断片Bの識別配列として機能してもよい。
 識別配列としては、確率的に出現頻度が低い塩基配列であれば特に制限されず、例えば約4~20塩基程度の任意の塩基配列を用いることができる。第1~第mの核酸断片Bのそれぞれは、例えば、上記表1及び表2に記載のいずれかの塩基配列からなる識別配列を含む塩基配列を有することができる。
 図1の例では、24枚の384ウェルプレートの各ウェルに分配した細胞の対象核酸に、ウェルごとに塩基配列が異なる第1~第9216の核酸断片Bを連結する。この結果、核酸断片Bの塩基配列がウェルごとに異なる、第1~第9216の検出用核酸群Bが得られる。ここで、検出用核酸群Bとは、塩基配列が異なる検出用核酸Bの混合物を意味する。検出用核酸Bは、対象核酸、核酸断片A及び核酸断片Bが連結したものである。図1の例では、核酸断片A及び核酸断片Bの組み合わせの種類ごとに細胞の図のパターンを変化させている。
 以上の操作により、図1の例では、96×24×384種類、すなわち、約8×10種類の核酸断片A及び核酸断片Bの組み合わせを形成することができる。この場合、1細胞ごとに、核酸断片A及び核酸断片Bの異なる組み合わせを対応させることが可能となる。したがって、図1の例では、約8×10個の細胞について、それぞれの細胞に存在する対象核酸の塩基配列を1細胞レベルで並列に検出することができる。
(工程ζ)
 続いて、工程ζにおいて、第1~第mの検出用核酸群Bの塩基配列を網羅的に決定し、複数のリードを得る。塩基配列の決定には、次世代シーケンサーを用いることが好ましい。
(工程η)
 続いて、工程ηにおいて、前記リードに含まれる対象核酸の塩基配列を、当該リードに含まれる核酸断片Aの塩基配列及び核酸断片Bの塩基配列に基づいて、1細胞に対応させて検出する。
[ChIL法]
 ここで、トランスポザーゼを用いて、DNA分子に結合したDNA結合タンパク質の結合領域の近傍に所望の塩基配列のDNA断片を挿入する方法である、ChIL法(Chromatin Integration Labeling)について説明する。
 ChIL法は、DNA分子に結合したDNA結合タンパク質の結合領域の近傍に所望の塩基配列のDNA断片を挿入する方法であって、前記DNA結合タンパク質に対する特異的結合物質を利用して、トランスポザーゼ結合配列と前記所望の塩基配列とを含む塩基配列を有するDNA断片と、前記結合領域とを近接させる工程(a)と、前記トランスポザーゼ結合配列にトランスポザーゼを結合させる工程(b)と、前記トランスポザーゼを活性化し、その結果、前記所望の塩基配列のDNA断片が前記結合領域の近傍に挿入される工程(c)と、を含む。
 ChIL法によれば、免疫沈降を行うことなく、DNA結合タンパク質と特定のゲノム領域との結合を解析することができる。したがって、ChIL法によれば、免疫沈降を必須の工程とする従来技術では解析が困難であったDNA結合タンパク質について、DNAとの結合を解析することができる。また、従来技術では、1細胞レベルでDNA結合タンパク質の解析を行うことは困難であった。これに対し、ChIL法によれば、1細胞レベルでDNA結合タンパク質の解析を行うこともできる。
 解析対象となるDNA結合タンパク質は、特に制限されず、例えば、ヒストン、転写因子、リン酸化ポリメラーゼ等が挙げられる。例えば、DNA結合タンパク質として、特定のリン酸化状態のRNAポリメラーゼIIを解析することにより、遺伝子の転写状態を解析することができる。
 以下、図2~7を参照しながらChIL法について説明する。図2~7は、ChIL法を説明する模式図である。図2は、ゲノムDNA10がヒストン20に巻きついてクロマチン構造を形成した状態を示す。図2の例では、DNA結合タンパク質はヒストン20である。
 図2の例では、特異的結合物質30は、ヒストン20を認識する抗体である。特異的結合物質30には、リンカー44を介してDNA断片40が結合されている。DNA断片40は、トランスポザーゼ結合配列41と、所望の塩基配列とを含む塩基配列を有している。図2の例では、所望の塩基配列は、T7プロモーター配列42の下流に識別配列43が連結した塩基配列である。図2~7において、T7プロモーター配列42の矢印は、T7ポリメラーゼによる転写の向きを示す。DNA断片40は、上述した核酸断片A又は核酸断片Bに対応する。
 リンカー44は、DNA断片40をヒストン20の結合領域11に近接させるためのつなぎひも(tether、テザー)の役割を有している。図2の例では、リンカー44はDNA断片であり、例えば50~70塩基の長さを有している。しかしながら、リンカー44は、テザーとして機能するものであれば特に制限されず、例えばポリエチレングリコール等のポリマーで構成されていてもよい。
(工程(a))
 図2の例では、パラホルムアルデヒド固定された細胞を試料としてChIL法を実施している。まず、ヒストン20に対する特異的結合物質30を利用して、DNA断片40と結合領域11とを近接させる。ここで、特異的結合物質30を利用して近接させるとは、図2の例のようにDNA断片40が結合した特異的結合物質30を、その抗原であるヒストン20に結合させることにより、DNA断片40と結合領域11とを近接させることであってもよい。あるいは、特異的結合物質30が、例えばヒストン20に対するマウスIgG抗体であり、このマウスIgG抗体を1次抗体としてヒストン20に結合させ、続いて、DNA断片40が結合した抗マウスIgG抗体を2次抗体として上記の1次抗体に結合させることにより、DNA断片40と結合領域11とを近接させることであってもよい。
 ヒストン20に対する特異的結合物質30を利用して、DNA断片40と結合領域11とを近接させる工程は、図2の例のように、固定された細胞内で実施することができる。この工程は、免疫染色と同様に、複数の抗体を同時に使用することも可能である。したがって、ChIL法によれば、複数のDNA結合タンパク質の結合領域の近傍にそれぞれ異なる所望の塩基配列のDNA断片を挿入することもできる。ここで、識別配列43に、DNA結合タンパク質ごとに区別可能な配列を含めることにより、複数のDNA結合タンパク質のDNAへの結合を区別して検出することもできる。
(工程(b))
 続いて、トランスポザーゼ結合配列41にトランスポザーゼ50を結合させる。図3は、試料にトランスポザーゼ50を添加して、トランスポザーゼ結合配列41にトランスポザーゼ50を結合させた状態を示す。
 トランスポザーゼとしては、核内に入りやすい観点から、大きさが小さなものが好ましい。例えば、分子量が50KDa以下のトランスポザーゼが好ましい。また、認識する配列の配列特異性が高いものが好ましい。また、DNA型トランスポザーゼが好ましい。また、活性を制御できるトランスポザーゼが好ましく、例えば、2価の金属イオン等のカチオンをバッファー中に添加すると活性化されるトランスポザーゼが挙げられる。好ましいトランスポザーゼとしては、例えば、TN5トランスポザーゼ、sleeping beauty transposase(SB10)、TN10等が挙げられる。トランスポザーゼ結合配列41は、使用するトランスポザーゼに応じて決定すればよい。
(工程(c))
 続いて、上記のトランスポザーゼ50を活性化する。トランスポザーゼ50の活性化は、例えば、2価の金属イオンをバッファー中に添加すること等により実施することができる。
 また、トランスポザーゼ50の種類によっては、DNA断片を転移させる活性を発揮するためにダイマーを形成する必要がある場合がある。また、トランスポザーゼ50がダイマーを形成するために、トランスポザーゼ50がトランスポザーゼ結合配列41に結合している必要がある場合がある。例えば、上述したTN5、SB10、TN10等はこのようなトランスポザーゼである。このような場合には、トランスポザーゼ50のダイマーを形成させることによってもトランスポザーゼ50を活性化することができる。
 また、トランスポザーゼ50の種類によっては、トランスポザーゼ50を活性化するために、トランスポザーゼ50のダイマーを形成させ、且つ2価の金属イオンをバッファー中に添加することが必要な場合がある。
 図4は、トランスポザーゼ50のダイマーを形成させた状態を示す。図4では、試料に、トランスポザーゼ結合配列41を有する遊離のDNA断片を添加して、当該DNA断片にトランスポザーゼ50を結合させている。図4に示すように、上記のDNA断片と結合したトランスポザーゼ50は、DNA断片40を構成するトランスポザーゼ結合配列41に結合したトランスポザーゼ50とダイマーを形成する。
 トランスポザーゼ50を活性化した結果、DNA断片40中の所望の塩基配列(図4の例ではT7プロモーター配列42の下流に識別配列43が連結した塩基配列)のDNA断片が結合領域11の近傍に挿入される。ここで、近傍とは、空間的に近い領域であればよく、例えば結合領域11から500塩基以下であってもよく、例えば100塩基以下であってもよく、例えば50塩基以下であってもよい。
 あるいは、近傍とは、空間的に近い領域であればよいため、ゲノムDNA10の塩基配列上は結合領域11から非常に離れた領域であって、ゲノム領域同士の相互作用により近接した領域であってもよい。すなわち、染色体構造上近接した領域であってもよい。
 本工程において、トランスポザーゼ50によるDNA断片の挿入反応が不完全に終了する場合がある。具体的には、例えば、挿入されたDNA断片が部分的に1本鎖DNAとなっている場合、挿入されたDNA断片が断片化している場合等が挙げられる。そこで、T4DNAリガーゼ、T4DNAポリメラーゼ等を用いたfill in反応等により、トランスポザーゼ50によるDNA断片の挿入反応を完全に終了させる工程を更に実施することが好ましい。
 図5は、所望の塩基配列のDNA断片が結合領域11の近傍に挿入された状態の一例を示す模式図である。図5に示すように、この例では、結合領域11の近傍に所望の塩基配列(T7プロモーター配列42の下流に識別配列43が連結した塩基配列)のDNA断片が挿入されている。図5の例では、所望の塩基配列だけでなく、2つのトランスポザーゼ結合配列41、及びリンカー44の一部に由来する塩基配列44’もゲノムDNA10に挿入されている。
 図6A~図6Cは、上述した図3の状態からトランスポザーゼ50が活性化した結果、DNA断片がゲノムDNA10に挿入された場合の例を示す模式図である。図6Aは、上述した図5の状態を示す。図6Bは、上述した図5とは逆向きに所望の塩基配列が挿入された状態を示す。図6Cは、トランスポザーゼ結合配列41を有する遊離のDNA断片に結合したトランスポザーゼ50同士がダイマーを形成した場合に、ゲノムDNA10に挿入されうる塩基配列を示す。
 図6CにおいてゲノムDNA10に挿入された塩基配列は、2つのトランスポザーゼ結合配列41を含み、それらの間に、任意の塩基配列45を含む場合がある。塩基配列45は、上述したfill in反応により形成されたものである。
 図6Cに示す塩基配列は、目的外の副産物であり、結合領域11の近傍に限らず、ゲノムDNA10上のあらゆる部分に挿入され得る。しかしながら、図6Cに示す塩基配列は、所望の塩基配列(この例ではT7プロモーター配列42の下流に識別配列43が連結した塩基配列)を有していない。このため、目的とする解析における影響を排除することができる。
 以上の工程により、DNA分子に結合したDNA結合タンパク質の結合領域の近傍に所望の塩基配列のDNA断片を挿入することができる。
(所望の塩基配列)
 また、図2~6の例では、ゲノムDNA10に挿入する所望の塩基配列は、T7プロモーター配列42の下流に識別配列43が連結した塩基配列であったが、所望の塩基配列はこれに限定されない。例えば、所望の塩基配列として、T7プロモーター配列42の代わりにSP6プロモーター配列等の別のプロモーター配列を用いてもよい。あるいは、所望の塩基配列は、識別配列のみから構成されていてもよい。
 ゲノムDNA10に挿入する所望の塩基配列の長さは、例えば20~500塩基であってもよく、例えば20~200塩基であってもよく、例えば20~100塩基であってもよい。
 また、図2~6の例では、DNA断片40を構成する各要素(T7プロモーター配列42、識別配列43及びトランスポザーゼ結合配列41)は隣接しているが、各要素の間には任意の塩基配列のスペーサーが存在していてもよい。また、各要素の順序は図2~6の例に示したものに限定されず、必要に応じて適宜入れ換えてもよいし、追加の要素を付加してもよい。
 また、DNA断片40は、1本鎖であってもよく、2本鎖であってもよい。但し、使用するトランスポザーゼの特性により、トランスポザーゼ結合配列41が2本鎖DNAである必要がある場合には、少なくともトランスポザーゼ結合配列41は2本鎖である必要がある。
(ChIL法により挿入したDNA断片を利用した解析)
 ChIL法では、所望の塩基配列(図2~6の例ではT7プロモーター配列42の下流に識別配列43が連結した塩基配列)を起点としてDNA10を遺伝子増幅し、増幅産物を得る工程と、前記増幅産物の塩基配列を解析する工程と、を含む方法により、所望のDNA断片が挿入されたゲノム上の位置を解析することができる。
(遺伝子増幅)
 遺伝子増幅としては、例えば、挿入した塩基配列に相補的なプライマーとランダムプライマーとを組み合わせたPCR、ポリメラーゼ(RNAポリメラーゼ、DNA依存性DNAポリメラーゼ等)を用いた転写等が挙げられる。本明細書において、「所望の塩基配列を起点として遺伝子増幅する」とは、結合領域11の近傍に挿入された所望の塩基配列の一部又は全部を利用してゲノムDNA10を遺伝子増幅することを意味する。
 例えば、図2~6の例では、ゲノムDNA10に挿入した塩基配列にT7プロモーター配列42が含まれている。そこで、「所望の塩基配列を起点として遺伝子増幅する」とは、上記のゲノムDNA10にT7ポリメラーゼを作用させて転写することにより、T7プロモーター配列42の下流のゲノムDNA10をRNAに転写することであってもよい。
 あるいは、「所望の塩基配列を起点として遺伝子増幅する」とは、上記のゲノムDNA10を鋳型として、挿入した塩基配列の一部又は全部に相補的な塩基配列を有するプライマーと、ランダムプライマーとを組み合わせたPCRを行うこと等により、結合領域11の近傍のゲノムDNA10の塩基配列を遺伝子増幅することであってもよい。
 すなわち、ChIL法では、挿入した塩基配列がプロモーター配列を含んでおり、遺伝子増幅が、プロモーター配列にRNAポリメラーゼを接触させてプロモーター配列の下流のDNAを転写してRNAを生成することにより遺伝子増幅してもよい。なお、上述したように、図6Cに示す塩基配列は、T7プロモーター配列42を有していないため、T7ポリメラーゼを作用させても遺伝子増幅(転写)されることはない。
 あるいは、挿入した所望の塩基配列を利用したPCR等により遺伝子増幅してもよい。なお、上述したように、図6Cに示す塩基配列は、所望の塩基配列(T7プロモーター配列42の下流に識別配列43が結合した塩基配列)を有していないため、挿入した塩基配列を利用したPCR反応を行っても遺伝子増幅されることはない。
 図7Aは、図5又は図6Aに示すDNA10にT7ポリメラーゼを作用させて、T7プロモーター配列42の下流のDNA10をRNA60に転写した状態を示す図である。また、図7Bは、図6Bに示すDNA10にT7ポリメラーゼを作用させて、T7プロモーター配列42の下流のDNA10をRNA60に転写した状態を示す図である。
 図7A、図7Bの例では、T7プロモーター配列42の下流に識別配列43が導入されているため、RNA60は、識別配列43の相補鎖43’及び識別配列43の下流のDNA10の相補鎖10’を含んでいる。
 ゲノムDNAにT7RNAポリメラーゼを作用させると、上記の反応により挿入したT7プロモーター配列42以外の領域からRNAが転写されてしまう場合がある。これに対し、識別配列43が存在することにより、挿入したT7プロモーター配列42を起点として転写されたRNAとそれ以外のRNAとを識別することが可能になる。すなわち、識別配列43の相補鎖43’を有するRNA60は、挿入したT7プロモーター配列42を起点として転写されたRNAであると判断することができる。
 また、上述したように、ChIL法では、同時に複数のDNA結合タンパク質に対する特異的結合物質を用いた解析を行うことができる。ここで、各特異的結合物質を利用してDNA10に挿入されるDNA断片40に、それぞれ異なる識別配列43を導入しておくことにより、いずれのDNA結合タンパク質の結合領域の近傍から転写されたRNAであるかを識別することも可能になる。
 続いて、転写されたRNA60の塩基配列を解析することにより、DNA結合タンパク質が結合したゲノム上の位置を特定することができる。RNA60の塩基配列の解析は、例えば、次世代シークエンサーにより行ってもよいし、DNAアレイとのハイブリダイゼーション等により行ってもよい。
 上述した図7A、図7Bの例では、RNA60に転写される領域が互いに異なっているが、いずれの例においても、RNA60は結合領域11の近傍から転写されるRNAである。したがって、RNA60の塩基配列を解析することにより、例えば、DNA結合タンパク質(図2~7の例ではヒストン20)の結合領域のゲノム上の位置を特定することができる。すなわち、所望の塩基配列が挿入される向きは、解析結果に影響しない。
(結合体)
 ここで、ChIL法に用いる結合体について説明する。ここで、結合体とは、トランスポザーゼ結合配列と所望の塩基配列とを含む塩基配列を有するDNA断片と、DNA結合タンパク質に対する特異的結合物質又は前記特異的結合物質に対する特異的結合物質とが結合したものである。
 結合体において、トランスポザーゼ結合配列、所望の塩基配列、特異的結合物質については、上述したものと同様である。すなわち、所望の塩基配列は識別配列を含む。また、所望の塩基配列は、識別配列の上流にプロモーター配列を更に含んでいてもよい。
 結合体において、DNA断片は、リンカーを介してDNA結合タンパク質に対する特異的結合物質又は前記特異的結合物質に対する特異的結合物質と結合していることが好ましい。リンカーについては上述したものと同様である。
 「所望のDNA断片と、DNA結合タンパク質に対する特異的結合物質との結合体」は、例えば、1次抗体に所望のDNA断片が結合した結合体を意味する。すなわち、結合体は、DNA結合タンパク質に対する特異的結合物質に直接上記のDNA断片が結合した結合体であってもよい。
 また、「所望のDNA断片と、DNA結合タンパク質に対する前記特異的結合物質に対する特異的結合物質との結合体」は、例えば、2次抗体に所望のDNA断片が結合した結合体を意味する。すなわち、所望のDNA断片は、DNA結合タンパク質に対する特異的結合物質には結合しておらず、DNA結合タンパク質に対する特異的結合物質に結合する特異的結合物質に結合していてもよい。より具体的には、例えば、DNA結合タンパク質に対する特異的結合物質がマウスIgGであった場合、所望のDNA断片と抗マウスIgG抗体との結合体等が挙げられる。
 特異的結合物質1分子あたりの所望のDNA断片の数は特に制限されず、例えば1~10個程度であることができる。また、特異的結合物質にDNA断片を結合する方法は特に制限されず、例えば、スクシンイミド基、マレイミド基等を有する化学架橋剤を用いて結合してもよい。例えば、DNA断片の5’末端にアミノ基を結合させておき、当該アミノ基と特異的結合物質に存在するアミノ基、カルボキシ基等の官能基を適宜の化学架橋剤で共有結合することが挙げられる。あるいは、例えば、アビジンとビオチンの結合等を利用して特異的結合物質にDNA断片を結合させてもよい。
[ハイスループットシングルセルChIL法]
 ここで、ChIL法を、多数の細胞に対して1細胞レベルで並列に実施する方法(以下、「ハイスループットシングルセルChIL法」という場合がある。)について説明する。図8は、ハイスループットシングルセルChIL法の一例を説明する模式図である。
 まず、工程αにおいて、細胞を第1~第96の96個の区画に分配する。図8の例では、96ウェルプレートの各ウェルに細胞を分配している。
 続いて、工程βにおいて、第1~第96の区画に分配した細胞の対象核酸に、それぞれ区画ごとに塩基配列が異なる第1~第96の核酸断片A(ChILプローブ)を連結し、第1~第96の検出用核酸群Aを得る。図8において、菱形、円、星型五角形の記号は、それぞれ核酸断片Aの例を示す。
 続いて、工程γにおいて、第1~第96の区画から細胞を回収してプールする。
 続いて、工程δにおいて、プールした前記細胞を第1~第9216の9216個の区画に分配する。図8の例では、セルソーターを使用して、24枚の384ウェルプレートの各ウェルに細胞を分配している。
 続いて、工程εにおいて、第1~第9216の区画に分配した細胞の、第1~第96の検出用核酸群Aに、それぞれ区画ごとに塩基配列が異なる第1~第9216の核酸断片Bを更に連結し、第1~第9216の検出用核酸群Bを得る。図8において、三角形及び六角形の記号の組み合わせ、5角形及び星型七角形の記号の組み合わせは、それぞれ核酸断片Bの例を示す。
 図8の例では、第1~第96の検出用核酸群Aを、T7RNAポリメラーゼを用いて転写した核酸断片を鋳型として、第1~第9216のプライマーセットを用いたPCRにより核酸断片Bを連結している。このように、核酸断片Bは、検出用核酸群Aそのものではなく、検出用核酸群Aの転写物、検出用核酸群Aの相補鎖等に結合してもよい。
 続いて、工程ζにおいて、第1~第9216の検出用核酸群Bの塩基配列を網羅的に決定し、複数のリードを得る。
 続いて、工程ηにおいて、リードに含まれる対象核酸の塩基配列を、当該リードに含まれる核酸断片Aの塩基配列及び核酸断片Bの塩基配列に基づいて、1細胞に対応させて検出する。
 図8の例の場合、96種類の核酸断片A及び9216種類(24枚の384ウェルプレートの各ウェルに対応する。)の核酸断片Bの組み合わせである、884,736種類の識別配列の組み合わせにより対象核酸を識別することができる。884,736種類の識別配列の組み合わせのそれぞれが1細胞に対応する。すなわち、同じ識別配列の組み合わせを有するリードは、同一の1細胞に由来する。以上の方法により、ChIL法を、多数の細胞に対して1細胞レベルで並列に実施することができる。
 次に実施例を示して本発明を更に詳細に説明するが、本発明は以下の実施例に限定されるものではない。
[実験例1]
(細胞の固定・剥離条件の検討)
 細胞を96ウェルプレートに固定してChIL法を行った後、剥離して回収する条件検討を行った。細胞としては、マウス骨格筋芽細胞C2C12を使用した。
《細胞表面のビオチン化》
 まず、細胞1×10個をリン酸緩衝生理食塩水(PBS)に懸濁し、15mLチューブに入れた。続いて、300×g、4℃で5分間遠心し、上清を捨てた。
 続いて、沈殿した細胞のペレットに、PBSに溶解し氷冷した、1mg/mL Sulfo-NHS-SS-Biotin(カタログ番号「A39258」、サーモフィッシャーサイエンティフィック社)を加えて懸濁した。続いて、チューブをローテーターにセットして4℃で30分間回転させた。これにより、細胞表面に、ビオチンが、ジスルフィド結合を有する化学リンカーで結合した。
 続いて、300×g、4℃で5分間遠心し、上清を捨てた。続いて、氷冷したクエンチバッファー(50mM Tris-HCl(pH8.0),0.1mM EDTA,150mM NaCl)を1mL加えた。続いて、チューブをローテーターにセットして4℃で30分間回転させた。続いて、300×g、4℃で5分間遠心し、上清を捨てた。
《細胞の固定》
 続いて、沈殿した細胞のペレットに、1%パラホルムアルデヒド(PFA)/PBSを1mL加えて懸濁した。続いて、チューブをローテーターにセットして4室温で5分間回転させた。これにより、細胞が固定された。続いて、300×g、4℃で5分間遠心し、上清を捨てた。続いて、沈殿した細胞のペレットに、200μLのPBSを加えて懸濁し、遠心することを2回繰り返して洗浄した。
《細胞のウェル表面への結合》
 続いて、細胞表面がビオチン化された細胞を、10,000個/50μLとなるようにPBS/0.1%ウシ血清アルブミン(BSA)/0.05%Tween-20に懸濁した。続いて、アビジンコートされた96ウェルプレート(カタログ番号「15507」、ピアス社)に、10,000個/ウェルで分注した。続いて、プレートをシェーカーにセットし、4℃で一晩穏やかに振とうした。これにより、細胞が、96ウェルプレートの表面に固定された。
 図9Aは、ウェルの表面の代表的な位相差顕微鏡写真である。倍率は4倍である。その結果、ウェルの表面に細胞が固定されたことが確認された。
 続いて、1%Triton X-100/PBSを96ウェルプレートの各ウェルに添加し、室温で20分間静置した。続いて、各ウェルからTriton X-100を除去し、PBSを200μL/ウェルずつ加えて洗浄した。
 続いて、Blocking One-P(ナカライテスク社)を200μL/ウェル加えて20分間静置し、ブロッキングした。続いて、各ウェルからBlocking One-Pを除去し、PBSを200μL/ウェル加えて洗浄した。
《DNA断片のCTDセリン2リン酸化RNAポリメラーゼII結合領域への近接》
 続いて、0.1×Blocking One-P/PBSで希釈した抗CTDセリン2リン酸化RNAポリメラーゼIIマウスIgG抗体2μg/mLを100μL/ウェルずつ添加し、室温で6時間反応させた。続いて、PBSを200μL/ウェルずつ加えて室温で5分間静置後除去することを3回繰り返して洗浄した。
 続いて、0.1×Blocking One-P,0.5M NaCl/PBSで希釈した核酸標識2次抗体2μg/mLを100μL/ウェルずつ添加し、4℃で一晩反応させた。2次抗体としては、抗マウスIgG抗体を使用した。この結果、核酸標識2次抗体に標識したDNA断片とゲノムDNA上のCTDセリン2リン酸化RNAポリメラーゼII結合領域とが近接した。
 ここで、核酸標識2次抗体に標識したDNA断片は、配列番号1に記載の塩基配列からなるDNA断片と、配列番号2に記載の塩基配列からなるDNA断片とをアニーリングさせたものであった。
 配列番号1に記載の塩基配列において、第62~80番目の塩基配列はTN5トランスポザーゼの結合配列であり、第4~23番目の塩基配列はT7プロモーター配列であり、第41~46番目の塩基配列は識別配列であり、第1~3塩基はリンカーの一部の塩基配列であった。また、識別配列としては、96ウェルの各ウェルごとに塩基配列が異なるものを、上記表1に記載の塩基配列から選択して使用した。
 また、配列番号2に記載の塩基配列からなるDNA断片は、配列番号1に記載の塩基配列からなるDNA断片と相補的なDNA断片であり、配列番号1に記載の塩基配列からなるDNA断片とアニールすることにより、2本鎖DNAであるTN5トランスポザーゼの結合配列を形成した。
《トランスポザーゼの結合》
 続いて、TN5トランスポザーゼを0.088μg/ウェルずつ添加し、室温で10分間放置した。これにより、核酸標識2次抗体に標識されたDNA断片中のトランスポザーゼ結合配列にトランスポザーゼが結合した。
《トランスポザーゼの活性化及びDNA断片の挿入》
 続いて、トランスポザーゼ結合配列を有する遊離のDNA断片(以下、「oligo3-4」という。)を各ウェルに添加し、室温で1時間反応させた。oligo3-4は、配列番号3に記載の塩基配列からなるDNA断片と、配列番号4に記載の塩基配列からなるDNA断片とをアニーリングさせたものであった。oligo3-4の2本鎖DNA領域は、TN5トランスポザーゼの結合配列であった。
 続いて、各ウェルを1×TN5透析バッファー(50mM HEPES-KOH(pH7.2),0.1M NaCl,0.1mM EDTA,1mM DTT,0.1%Triton X-100,10%グリセロール)で洗浄した。
 続いて、1×TAPS-DMFバッファー(10mM TAPS-NaOH(pH8.5),5mM MgCl,10%N,N-ジメチルホルムアミド)を50μL/ウェルずつ添加し、37℃で1時間静置した。これにより、核酸標識2次抗体に標識されたDNA断片に結合したトランスポザーゼが活性化し、核酸標識2次抗体に標識されたDNA断片がゲノムDNA上のCTDセリン2リン酸化RNAポリメラーゼII結合領域の近傍に挿入された。
 続いて、0.05%ドデシル硫酸ナトリウム溶液を50μL/ウェルずつ添加し、室温で10分間静置したのち、PBS 100μL/ウェルで3回洗浄した。これにより、トランスポザーゼを失活させて除去した。なお、トランスポザーゼの失活及び除去は、まず、50mM EDTAを100μL/ウェルずつ添加して50℃で30分間静置し、続いて、PBS 100μL/ウェルで3回洗浄することによっても行うことができる。
 続いて、各ウェルを1×T4DNAリガーゼ反応バッファーで洗浄し、下記表3に組成を示すfill in反応溶液を50μL/ウェルずつ加え室温で30分間反応させた。これにより、核酸標識2次抗体に標識されたDNA断片をゲノムDNA上のCTDセリン2リン酸化RNAポリメラーゼII結合領域の近傍に確実に挿入させた。
Figure JPOXMLDOC01-appb-T000005
 続いて、上清を除去し、0.05%ドデシル硫酸ナトリウム溶液を50μL/ウェルずつ添加し、室温で10分間静置したのち、PBSで3回洗浄した。これにより、T4DNAリガーゼ及びT4DNAポリメラーゼIを失活させて除去した。なお、T4DNAリガーゼ及びT4DNAポリメラーゼIの失活及び除去は、まず、50mM EDTAを100μL/ウェルずつ添加して50℃で30分間静置し、続いて、PBS 100μL/ウェルで3回洗浄することによっても行うことができる。
《細胞の剥離》
 続いて、Accumax(ナカライテスク社)を50μL/ウェルずつ加えて室温で10分間静置した。なお、Accumax(ナカライテスク社)は、タンパク質分解活性及びコラーゲン分解活性を持つ酵素を主成分とする温和な細胞剥離液である。
 続いて、1Mジチオスレイトール(DTT)/0.01M酢酸ナトリウムバッファー(pH5.2)溶液(カタログ番号「14130-41」、ナカライテスク社)を0.5μL/ウェルずつ加えて37℃で10分間静置した。続いて、各ウェルから上清を回収した。
 図9Bは、上清を回収した後のウェルの表面の代表的な位相差顕微鏡写真である。倍率は10倍である。その結果、ウェルの表面から細胞が剥離されたことが確認された。以上の結果から、本実験例の条件により、細胞をウェルの表面に固定化し、更に剥離して回収できることが明らかとなった。
[実験例2]
(ハイスループットシングルセルChIL法)
 ChIL法により、DNA結合タンパク質である、CTDセリン2リン酸化RNAポリメラーゼIIの、ゲノムDNA上の結合位置を1細胞レベルで多数の細胞に対して並列に解析した。また、分配する細胞数の検討も行った。細胞としては、C2C12細胞を使用した。
《細胞表面のビオチン化》
 まず、細胞1×10個をリン酸緩衝生理食塩水(PBS)に懸濁し、15mLチューブに入れた。続いて、300×g、4℃で5分間遠心し、上清を捨てた。
 続いて、沈殿した細胞のペレットに、PBSに溶解し氷冷した、1mg/mL Sulfo-NHS-SS-Biotin(カタログ番号「A39258」、サーモフィッシャーサイエンティフィック社)を加えて懸濁した。続いて、チューブをローテーターにセットして4℃で30分間回転させた。これにより、細胞表面に、ビオチンが、ジスルフィド結合を有する化学リンカーで結合した。
 続いて、300×g、4℃で5分間遠心し、上清を捨てた。続いて、氷冷したクエンチバッファー(50mM Tris-HCl(pH8.0),0.1mM EDTA,150mM NaCl)を1mL加えた。続いて、チューブをローテーターにセットして4℃で30分間回転させた。続いて、300×g、4℃で5分間遠心し、上清を捨てた。
《細胞の固定》
 続いて、沈殿した細胞のペレットに、1%パラホルムアルデヒド(PFA)/PBSを1mL加えて懸濁した。続いて、チューブをローテーターにセットして4室温で5分間回転させた。これにより、細胞が固定された。続いて、300×g、4℃で5分間遠心し、上清を捨てた。続いて、沈殿した細胞のペレットに、200μLのPBSを加えて懸濁し、遠心することを2回繰り返して洗浄した。
《細胞のウェル表面への結合》
 続いて、細胞表面がビオチン化された細胞を、10,000個/50μLとなるようにPBS-0.1%ウシ血清アルブミン(BSA)/0.05%Tween-20に懸濁した。続いて、アビジンコートされた96ウェルプレート(カタログ番号「15507」、ピアス社)に、10,000個/ウェルで分注した。続いて、プレートをシェーカーにセットし、4℃で一晩穏やかに振とうした。これにより、細胞が、96ウェルプレートの表面に固定された。
 続いて、1%Triton X-100/PBSを96ウェルプレートの各ウェルに添加し、室温で20分間静置した。続いて、各ウェルからTriton X-100を除去し、PBSを200μL/ウェルずつ加えて洗浄した。
 続いて、Blocking One-P(ナカライテスク社)を200μL/ウェル加えて20分間静置し、ブロッキングした。続いて、各ウェルからBlocking One-Pを除去し、PBSを200μL/ウェル加えて洗浄した。
《DNA断片のCTDセリン2リン酸化RNAポリメラーゼII結合領域への近接》
 続いて、0.1×Blocking One-P/PBSで希釈した抗CTDセリン2リン酸化RNAポリメラーゼIIマウスIgG抗体2μg/mLを100μL/ウェルずつ添加し、室温で6時間反応させた。続いて、PBSを200μL/ウェルずつ加えて室温で5分間静置後除去することを3回繰り返して洗浄した。
 続いて、0.1×Blocking One-P,0.5M NaCl/PBSで希釈した核酸標識2次抗体2μg/mLを100μL/ウェルずつ添加し、4℃で一晩反応させた。2次抗体としては、抗マウスIgG抗体を使用した。この結果、核酸標識2次抗体に標識したDNA断片とゲノムDNA上のCTDセリン2リン酸化RNAポリメラーゼII結合領域とが近接した。
 ここで、核酸標識2次抗体に標識したDNA断片は、配列番号1に記載の塩基配列からなるDNA断片と、配列番号2に記載の塩基配列からなるDNA断片とをアニーリングさせたものであった。
《トランスポザーゼの結合》
 続いて、TN5トランスポザーゼを0.088μg/ウェルずつ添加し、室温で10分間放置した。これにより、核酸標識2次抗体に標識されたDNA断片中のトランスポザーゼ結合配列にトランスポザーゼが結合した。
《トランスポザーゼの活性化及びDNA断片の挿入》
 続いて、トランスポザーゼ結合配列を有する遊離のDNA断片(以下、「oligo3-4」という。)を各ウェルに添加し、室温で1時間反応させた。oligo3-4は、配列番号3に記載の塩基配列からなるDNA断片と、配列番号4に記載の塩基配列からなるDNA断片とをアニーリングさせたものであった。oligo3-4の2本鎖DNA領域は、TN5トランスポザーゼの結合配列であった。
 続いて、各ウェルを1×TN5透析バッファー(50mM HEPES-KOH(pH7.2),0.1M NaCl,0.1mM EDTA,1mM DTT,0.1%Triton X-100,10%グリセロール)で洗浄した。
 続いて、1×TAPS-DMFバッファー(10mM TAPS-NaOH(pH8.5),5mM MgCl,10%N,N-ジメチルホルムアミド)を50μL/ウェルずつ添加し、37℃で1時間静置した。これにより、核酸標識2次抗体に標識されたDNA断片に結合したトランスポザーゼが活性化し、核酸標識2次抗体に標識されたDNA断片がゲノムDNA上のCTDセリン2リン酸化RNAポリメラーゼII結合領域の近傍に挿入された。
 続いて、0.05%ドデシル硫酸ナトリウム溶液を50μL/ウェルずつ添加し、室温で10分間静置したのち、PBS 100μL/ウェルで3回洗浄した。これにより、トランスポザーゼを失活させて除去した。
 続いて、各ウェルを1×T4DNAリガーゼ反応バッファーで洗浄し、上記表3に組成を示すfill in反応溶液を50μL/ウェルずつ加え室温で30分間反応させた。これにより、核酸標識2次抗体に標識されたDNA断片をゲノムDNA上のCTDセリン2リン酸化RNAポリメラーゼII結合領域の近傍に確実に挿入させた。
 続いて、上清を除去し、0.05%ドデシル硫酸ナトリウム溶液を50μL/ウェルずつ添加し、室温で10分間静置したのち、PBSで3回洗浄した。これにより、T4DNAリガーゼ及びT4DNAポリメラーゼIを失活させて除去した。
《細胞の剥離及び回収》
 続いて、Accumax(ナカライテスク社)を50μL/ウェルずつ加えて室温で10分間静置した。続いて、1Mジチオスレイトール(DTT)-0.01M酢酸ナトリウムバッファー(pH5.2)溶液(カタログ番号「14130-41」、ナカライテスク社)を0.5μL/ウェルずつ加えて37℃で10分間静置した。続いて、各ウェルから細胞を回収して混合した。
 続いて、細胞をDAPI(4’,6-ジアミジノ-2-フェニルインドール)で染色した。続いて、セルソーターを使用して、細胞を25個/ウェル、50個/ウェル、75個/ウェルずつ384ウェルプレートにソーティングした。384プレートには、予め下記表4に記載の組成の試薬を100μL/ウェルずつ分注しておいた。
Figure JPOXMLDOC01-appb-T000006
 続いて、384プレートを37℃で16時間静置した。これにより、ゲノムDNAに挿入したDNA断片に含まれていたT7RNAプロモーター配列を起点として、T7RNAポリメラーゼによりゲノムDNAが転写された。
 続いて、DNaseIを0.5μL/ウェルずつ加え37℃で30分間反応させた。これにより、回収した細胞中に含まれていたDNAが分解された。続いて、Agencourt RNACleanXPキット(ベックマン・コールター社)を用いて転写されたRNAを精製し、10μL/ウェルずつの溶出液に溶出した。
《ライブラリ作成及びシーケンス》
 続いて、SMART-Seq v4 Ultra Low Input RNA Kit for Sequencing(イルミナ社)を用いて次世代シーケンス用のライブラリを作製した。
 まず、cDNAを合成した。cDNA合成用プライマーとして、キットに含まれている3’SMART-Seq CDS Primer IIAの代わりにカスタムプライマー(配列番号5)を使用した。
 続いて、cDNAを鋳型としてPCR反応を行った。PCR反応のプライマーとして、キットに含まれているPCR Primer IIAの代わりにAd1プライマー(配列番号6)及びAd2プライマー(配列番号7)を使用した。
 Ad1プライマーの塩基配列において、第30~37番目の塩基配列は識別配列であった。また、Ad2プライマーの塩基配列において、第25~32番目の塩基配列は識別配列であった。また、PCR反応に用いたAd1プライマーの識別配列及びAd2プライマーの識別配列の組み合わせは、384ウェルの各ウェルごとに塩基配列が異なるものを使用した。上記表2の第1~第162番目に、Ad1プライマーに使用した識別配列を示す。また、上記表2の第163~324番目に、Ad2プライマーに使用した識別配列を示す。
 この結果、得られたPCR増幅産物には、対象核酸の塩基配列である、ゲノムDNA上のCTDセリン2リン酸化RNAポリメラーゼII結合領域の近傍の塩基配列、核酸標識2次抗体に標識したDNA断片に含まれる識別配列、Ad1プライマーの識別配列及びAd2プライマーの識別配列が含まれることになる。
 そして、核酸標識2次抗体に標識したDNA断片に含まれる識別配列、Ad1プライマーの識別配列及びAd2プライマーの識別配列の組み合わせは、1細胞レベルで異なるものとなる。
 つまり、核酸標識2次抗体に標識したDNA断片に含まれる識別配列、Ad1プライマーの識別配列及びAd2プライマーの識別配列の組み合わせが同一であるPCR増幅産物は、同一の1細胞に由来するものである。
 続いて、AMPure XP beads(ベックマン・コールター社)を用いてPCR増幅産物を精製し、定量した。続いて、次世代シーケンサー(イルミナ社)を用いてPCR増幅産物の塩基配列を網羅的にシーケンスした。
 図10Aは、細胞を25個/ウェル、50個/ウェル、75個/ウェルずつ384ウェルプレートにソーティングして、上記の反応を行った結果、得られたPCR増幅産物に含まれていた識別配列を示す図である。25個/ウェルずつソーティングした場合の4回の実験結果、50個/ウェルずつソーティングした場合の3回の実験結果、75個/ウェルずつソーティングした場合の2回の実験結果を示す。
 図10Aでは、核酸標識2次抗体に標識したDNA断片に含まれる96種類の識別配列のいずれが検出されたかを示す。黒色は、識別配列が検出されたことを示し、白色黒色は、識別配列が検出されなかったことを示す。
 また、図10Bは、図10Aの結果をグラフにしたものである。グラフの縦軸は検出された識別配列の数を示す。また、図10B中、「25」は細胞を25個/ウェルずつソーティングした結果であることを示し、「50」は細胞を50個/ウェルずつソーティングした結果であることを示し、「75」は細胞を75個/ウェルずつソーティングした結果であることを示す。
 その結果、細胞を25個/ウェルずつソーティングした場合、約28個の識別配列が検出されたことが明らかとなった。また、細胞を50個/ウェルずつソーティングした場合、約38個の識別配列が検出されたことが明らかとなった。また、細胞を75個/ウェルずつソーティングした場合、約44個の識別配列が検出されたことが明らかとなった。
 以上の結果から、細胞を10,000個/ウェルずつ分注して識別配列で識別し、回収してプールした後、25個/ウェルずつ再分配して検出すると、再分配する1ウェルあたりの細胞数に対する、検出される識別配列の種類の割合が、期待値に最も近くなることが明らかとなった。
 また、本実験例の方法により、複数の細胞のそれぞれに存在する対象核酸の塩基配列を1細胞レベルで並列に検出することができることが明らかとなった。
 本発明によれば、複数の細胞のそれぞれに存在する対象核酸の塩基配列を1細胞レベルで並列に検出する技術を提供することができる。
 10…ゲノムDNA、10’…ゲノムDNA10の相補鎖、11…結合領域、20…ヒストン、30…特異的結合物質、40…DNA断片、41…トランスポザーゼ結合配列、41’…トランスポザーゼ結合配列41の相補鎖、42…T7プロモーター配列、43…識別配列、43’…識別配列43の相補鎖、44…リンカー、44’…リンカー44の一部に由来する塩基配列、45…任意配列、50…トランスポザーゼ、60…RNA。

Claims (6)

  1.  複数の細胞のそれぞれに存在する対象核酸の塩基配列を1細胞レベルで並列に検出する方法であって、
     前記細胞を第1~第n(ここで、nは2以上の整数である。)のn個の区画に分配する工程αと、
     前記第1~第nの区画に分配した前記細胞の前記対象核酸に、それぞれ区画ごとに塩基配列が異なる第1~第nの核酸断片Aを連結し、第1~第nの検出用核酸群Aを得る工程βと、
     前記第1~第nの区画から前記細胞を回収してプールする工程γと、
     プールした前記細胞を再度第1~第m(ここで、mは2以上の整数である。)のm個の区画に分配する工程δと、
     前記第1~第mの区画に分配した前記細胞の、前記第1~第nの検出用核酸群Aに、それぞれ区画ごとに塩基配列が異なる第1~第mの核酸断片Bを更に連結し、第1~第mの検出用核酸群Bを得る工程εと、
     前記第1~第mの検出用核酸群Bの塩基配列を網羅的に決定し、複数のリードを得る工程ζと、
     前記リードに含まれる対象核酸の塩基配列を、当該リードに含まれる核酸断片Aの塩基配列及び核酸断片Bの塩基配列に基づいて、1細胞に対応させて検出する工程ηと、
     を含む、方法。
  2.  前記工程αにおいて、前記第1~第nのn個の区画に分配した前記細胞を、前記区画の内部にアビジン-ビオチン結合により結合する、請求項1に記載の方法。
  3.  前記工程γにおいて、前記第1~第nのn個の区画の内部に結合した前記細胞を、タンパク質分解活性及びコラーゲン分解活性を有する酵素の混合物により剥離させて回収する、請求項2に記載の方法。
  4.  前記工程βにおける前記対象核酸と前記第1~第nの核酸断片Aとの連結を、トランスポザーゼを用いて行う、請求項1~3のいずれか一項に記載の方法。
  5.  前記工程εにおける前記第1~第nの検出用核酸群Aと前記第1~第mの核酸断片Bとの連結を、ポリメラーゼ連鎖反応を用いて行う、請求項1~4のいずれか一項に記載の方法。
  6.  前記第1~第nの核酸断片A及び前記第1~第mの核酸断片Bのそれぞれが、下記表1及び表2に記載のいずれかの塩基配列を含む塩基配列を有する、請求項1~5のいずれか一項に記載の方法。
    Figure JPOXMLDOC01-appb-T000001
    Figure JPOXMLDOC01-appb-T000002
PCT/JP2021/003820 2020-02-04 2021-02-03 対象核酸の塩基配列を1細胞レベルで並列に検出する方法 WO2021157589A1 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2020-017027 2020-02-04
JP2020017027A JP2021122218A (ja) 2020-02-04 2020-02-04 対象核酸の塩基配列を1細胞レベルで並列に検出する方法

Publications (1)

Publication Number Publication Date
WO2021157589A1 true WO2021157589A1 (ja) 2021-08-12

Family

ID=77200305

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2021/003820 WO2021157589A1 (ja) 2020-02-04 2021-02-03 対象核酸の塩基配列を1細胞レベルで並列に検出する方法

Country Status (2)

Country Link
JP (1) JP2021122218A (ja)
WO (1) WO2021157589A1 (ja)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018042776A1 (ja) * 2016-08-30 2018-03-08 国立大学法人九州大学 Dna結合タンパク質の結合領域の近傍に所望のdna断片を挿入する方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018042776A1 (ja) * 2016-08-30 2018-03-08 国立大学法人九州大学 Dna結合タンパク質の結合領域の近傍に所望のdna断片を挿入する方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
CUSANOVICH, D. A. ET AL.: "Multiplex single cell profiling of chromatin accessibility by combinatorial cellular indexing", SCIENCE, vol. 348, no. 6237, 22 May 2015 (2015-05-22), pages 910 - 914, XP055416774, DOI: 10.1126/science.aab1601 *
HARADA, AKIHITO ET AL.: "Single-cell epigenome analysis by chromatin integration labeling (ChIL)", EXPERIMENTAL MEDICINE, vol. 37, no. 20, 2019, pages 178 - 183 *
MULQUEEN, R. M. ET AL.: "Highly scalable generation of DNA methylation profiles in single cells", NATURE BIOTECHNOLOGY, vol. 36, no. 5, 9 April 2018 (2018-04-09), pages 428 - 431, XP055503150, DOI: 10.1038/nbt.4112 *
VITAK SARAH A, TORKENCZY KRISTOF A, ROSENKRANTZ JIMI L, FIELDS ANDREW J, CHRISTIANSEN LENA, WONG MELISSA H, CARBONE LUCIA, STEEMER: "Sequencing thousands of single-cell genomes with combinatorial indexing", NATURE METHODS, vol. 14, no. 3, 30 January 2017 (2017-01-30), pages 302 - 308, XP055416420 *

Also Published As

Publication number Publication date
JP2021122218A (ja) 2021-08-30

Similar Documents

Publication Publication Date Title
US11459602B2 (en) Method for generating double stranded DNA libraries and sequencing methods for the identification of methylated cytosines
Wassarman et al. Interactions of small nuclear RNA's with precursor messenger RNA during in vitro splicing
US20170212101A1 (en) Methods and compositions to identify, quantify, and characterize target analytes and binding moieties
JP6943376B2 (ja) Dna結合タンパク質の結合領域の近傍に所望のdna断片を挿入する方法
JP2001524808A (ja) 放出可能な不揮発性の質量標識分子
US20150045237A1 (en) Method for identification of the sequence of poly(a)+rna that physically interacts with protein
US20190264201A1 (en) Dna library construction of immobilized chromatin immunoprecipitated dna
EP3198063A1 (en) Rna stitch sequencing: an assay for direct mapping of rna : rna interactions in cells
SG185239A1 (en) Method for identifying nucleic acids bound to an analyte
JP7049103B2 (ja) 単一細胞の網羅的3’末端遺伝子発現解析法
WO2021157589A1 (ja) 対象核酸の塩基配列を1細胞レベルで並列に検出する方法
WO2014151554A1 (en) Phi29 method for library preparation
WO2023097295A1 (en) Rna and dna analysis using engineered surfaces
US20220356462A1 (en) Method for amplifying nucleic acid using solid-phase carrier
WO2017127556A1 (en) Methods and compositions to identify, quantify, and characterize target analytes and binding moieties
JP2023508796A (ja) Dna中のn-4-アセチルデオキシシチジンの検出のための方法およびキット
JPWO2007046520A1 (ja) 固定化ピューロマイシン・リンカーを用いたタンパク質のスクリーニング方法
US11268087B2 (en) Isolation and immobilization of nucleic acids and uses thereof
JPWO2005001086A1 (ja) 固定化mRNA−ピューロマイシン連結体及びその用途
US20110065592A1 (en) Rapid method for identifying polypeptide-nucleic acid interactions
US11312991B2 (en) Method for decoding base sequence of nucleic acid corresponding to end region of RNA and method for analyzing DNA element
CN118660973A (zh) 使用工程化的表面进行rna和dna分析
Class et al. Patent application title: METHOD FOR IDENTIFICATION OF THE SEQUENCE OF POLY (A)+ RNA THAT PHYSICALLY INTERACTS WITH PROTEIN Inventors: Markus Landthaler (Berlin, DE) Mathias Munschauer (Berlin, DE) Alexander Baltz (Berlin, DE)

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 21750062

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 21750062

Country of ref document: EP

Kind code of ref document: A1