WO2023236121A1 - 检测罕见细胞的方法、装置及其应用 - Google Patents

检测罕见细胞的方法、装置及其应用 Download PDF

Info

Publication number
WO2023236121A1
WO2023236121A1 PCT/CN2022/097740 CN2022097740W WO2023236121A1 WO 2023236121 A1 WO2023236121 A1 WO 2023236121A1 CN 2022097740 W CN2022097740 W CN 2022097740W WO 2023236121 A1 WO2023236121 A1 WO 2023236121A1
Authority
WO
WIPO (PCT)
Prior art keywords
cells
sequence
droplet
sequences
nucleic acid
Prior art date
Application number
PCT/CN2022/097740
Other languages
English (en)
French (fr)
Inventor
刘传宇
刘龙奇
汪洋
宋雨默
刘颖
黄亚灵
Original Assignee
深圳华大生命科学研究院
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 深圳华大生命科学研究院 filed Critical 深圳华大生命科学研究院
Priority to PCT/CN2022/097740 priority Critical patent/WO2023236121A1/zh
Publication of WO2023236121A1 publication Critical patent/WO2023236121A1/zh

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • CCHEMISTRY; METALLURGY
    • C40COMBINATORIAL TECHNOLOGY
    • C40BCOMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
    • C40B70/00Tags or labels specially adapted for combinatorial chemistry or libraries, e.g. fluorescent tags or bar codes

Definitions

  • This application relates to the field of cell detection technology, and specifically to a method, device and application for detecting rare cells.
  • Single-cell sequencing technology based on microfluidic systems is currently widely used. Compared with other technologies, the consumption of micro-scale droplets in microfluidics is extremely small. Each droplet with stable shape can be regarded as an independent microreactor, thus reducing cross-contamination in experiments and facilitating the The droplets are manipulated; the larger specific surface area of the droplets can also speed up various reaction speeds and heat transfer rates, so microfluidic technology is an ideal choice in the field of single cell research.
  • the detection cost of traditional single-cell sequencing methods based on microfluidic systems is relatively expensive, and its cost increases linearly with the number of cells processed.
  • the rare cells include embryonic cells, stem cells, progenitor cells, cancer stem cells and/or tumor cells.
  • the rare cells include circulating tumor cells and/or fetal cell-free cells, optionally, the fetal cell-free cells are fetal nucleated red blood cells.
  • a single magnetic bead is connected with 100,000 to 10 million, preferably 100,000 to 1,000,000 of the oligonucleotide sequences, optionally, wherein based on the same single magnetic bead, the plurality of oligonucleotide sequences Each barcode tag sequence in the nucleotide sequence is the same, and based on different single magnetic beads, the barcode tag sequences are different from each other, optionally, wherein each of the plurality of oligonucleotide sequences is unique based on the same single magnetic bead.
  • Molecular identifier sequences UMI differ from each other.
  • the single-cell nucleic acid sequence is an mRNA sequence
  • constructing a DNA library based on the single-cell nucleic acid sequence further includes: after reverse transcribing the mRNA sequence into a DNA sequence, constructing the DNA library .
  • the single droplet contains 1-10, preferably 5-7 single cells.
  • the single droplet also contains an Index carrier, wherein multiple Index sequences are connected to the Index carrier, and the Index sequence recognizes the oligos of the magnetic beads in the single droplet.
  • the second capture sequence in the nucleotide sequence and is captured by the second capture sequence.
  • At least 100,000 Index sequences are connected to the Index vector.
  • the droplets contain 5-15, preferably 8-10 Index carriers.
  • determining whether the rare cell is present in the biological sample includes:
  • the set proportion threshold is 1-10%, preferably 1%-5%.
  • the second embodiment of the present application proposes a device for detecting rare cells in biological samples, including: a droplet sealing device for sealing multiple single cells and magnetic beads in a single droplet, wherein the multiple single cells
  • the cells are from the biological sample, and the magnetic beads are connected with a plurality of oligonucleotide sequences, each oligonucleotide sequence including a barcode tag sequence, a unique molecular identification sequence UMI and a first capture sequence; a DNA library construction device, Connected to the droplet sealing device, used to construct a DNA library based on the single cell nucleic acid sequence captured by the first capture sequence in the single droplet; a sequencing device connected to the DNA library construction device, used to construct the The DNA library is sequenced; and an analysis device is connected to the sequencing device for data analysis, screening specific marker sequence information of rare cells from the single cell nucleic acid sequence, and determining whether the biological sample is present. of rare cells.
  • the biological sample is from a mammal, optionally the biological sample is from a pregnant woman or a subject having or suspected of having a disease.
  • the rare cells include embryonic cells, stem cells, progenitor cells, cancer stem cells and/or tumor cells.
  • the rare cells include circulating tumor cells and/or fetal cell-free cells, optionally, the fetal cell-free cells are fetal nucleated red blood cells.
  • a single magnetic bead is connected with 100,000 to 10 million, preferably 100,000 to 1,000,000 of the oligonucleotide sequences, optionally, wherein based on the same single magnetic bead, the plurality of oligonucleotide sequences Each barcode tag sequence in the nucleotide sequence is the same, and based on different single magnetic beads, the barcode tag sequences are different from each other, optionally, wherein each of the plurality of oligonucleotide sequences is unique based on the same single magnetic bead.
  • Molecular identifier sequences UMI differ from each other.
  • the first capture sequence is selected from at least one of poly(dT) and DNA capture sequences.
  • the first capture sequence is poly(dT).
  • the first capture sequence is poly(dT).
  • the capture sequence is located at the 3' end of the oligonucleotide sequence on the magnetic beads.
  • each of the oligonucleotide sequences also includes a linker sequence and/or a second capture sequence.
  • the DNA library construction device is further used to: lyse the plurality of single cells to obtain single cell nucleic acid sequences, wherein the single cell nucleic acid sequences are captured by the first capture sequence; destroy the liquid Drop to release the magnetic beads connected with the oligonucleotide sequence and the single-cell nucleic acid sequence; construct a DNA library based on the single-cell nucleic acid sequence.
  • the single cell nucleic acid sequence is an mRNA sequence
  • the DNA library construction device is further used to construct the DNA library after reverse transcribing the mRNA sequence into a DNA sequence.
  • the single droplet contains 1-10, preferably 5-7 single cells.
  • each droplet contains 1-10 magnetic beads, preferably 1 magnetic bead.
  • At least 100,000 Index sequences are connected to the Index vector.
  • the set proportion threshold is 1-10%, preferably 1%-5%.
  • the fourth embodiment of the present application proposes a non-invasive fetal diagnosis method, which includes: based on the method of detecting rare cells in biological samples described in any embodiment of the first aspect of the present application, determining whether they are from a pregnant woman The presence of fetal cells in the biological sample; and analyzing the genome or transcriptome information of the fetal cell cells to determine the developmental status of the fetus and/or whether it suffers from genetic diseases.
  • the genetic disease is a chromosomal disease, a single-gene genetic disease or a multi-gene genetic disease.
  • the method proposed in this application for detecting rare cells based on the super-loading strategy uses the super-Poisson distribution of cells to increase the initial input amount of cells in a single experiment to the million level to allow for inclusion in one droplet. Multiple cells; once the rare cells are wrapped in the droplet, the magnetic beads in the droplet can capture the characteristic cell markers of the rare cells; by setting a certain threshold, the characteristics of the rare cells can be captured The magnetic beads of the marker are screened out and the presence of rare cells in the droplets is simultaneously proven.
  • This method can transform the probability of detecting rare cells from a large number of background cells (one in ten thousand or even one in a million) to the probability of detecting rare cells (a fraction) based on magnetic beads within the target droplet, thus greatly improving the It improves the detection rate and accuracy of rare cells and significantly reduces the cost of detecting rare cells.
  • Figure 3 is a droplet generating device according to an embodiment of the present application.
  • Figure 5 is a schematic diagram of a C4V2 slide according to an embodiment of the present application.
  • Figure 10 is a Seurat clustering diagram of PBMC (background cells) and MCF-7 (breast cancer cells) according to Example 2 of the present application;
  • FIG 11 is a diagram showing the specific expression of four marker genes (FOLR1, KRT18, BASP1 and C4BPB) in MCF-7 cells according to Example 2 of the present application;
  • Figure 12 is a schematic diagram of a method for detecting rare cells based on a super-loading strategy according to an embodiment of the present application.
  • the number of rare cells is extremely small, and this technology is based on a large number of background cells, by analyzing all single cells (including a large number of background cells and a very small number of rare cells) to identify rare cells, the encapsulation rate of existing magnetic beads is higher than that of existing magnetic beads. In this case, the probability of capturing and detecting rare cells is extremely low.
  • Provide magnetic bead phase use a certain concentration of magnetic bead phase, in which each magnetic bead is connected with hundreds of thousands to tens of millions of oligonucleotide sequences (oligo), which contain barcode sequences. and a first capture sequence, wherein the barcode sequence has magnetic bead specificity, that is, the barcode sequence attached to the same magnetic bead is the same, and the barcode sequences attached to different magnetic beads are different; the first capture sequence can capture droplets Nucleic acid sequences from multiple single cells.
  • a cell phase prepare millions of cells into a high-density cell phase, where the high-density cell phase includes a majority of background cells and a certain number of target cells mixed in a small proportion. .
  • Droplet generation Based on droplet microfluidic single-cell technology, a high-density cell phase and a certain concentration of magnetic bead phase are used to generate droplets on a microfluidic device. This process will cause a droplet to be wrapped in One or more magnetic beads and one or more cells.
  • Post-processing of cells based on droplets Use droplets as independent reactors to lyse cells in the droplets and release nucleic acid sequences. These nucleic acid sequences will be captured by the first capture sequence on the magnetic beads; then all collected The droplets are demulsified, and the nucleic acid sequences captured by the magnetic beads are subjected to cDNA amplification, fragmentation, library construction, and sequencing (see Examples for details).
  • Detection of target cells (rare cells): Since the cells in this overloading strategy are in an overloaded state in the droplets, that is, one magnetic bead corresponds to multiple cells, and since the number of rare cells is extremely low, most droplets only contain background. Cells, a small number of droplets will be wrapped into the target cells (rare cells), so in the subsequent data processing, the specific markers of the target cells are used to screen the sequenced data, and the background cell signals are filtered and screened out to capture Magnetic beads with a certain proportion of rare cell signals will be considered positive beads and prove that rare cells were detected in the droplet.
  • the above method proposed in the embodiment of the present application realizes the transformation of the probability of detecting rare cells (one in ten thousand or even one in a million) from a large number of background cells in traditional detection technology to the detection of rare cells based on magnetic beads in the target droplet.
  • the probability of cells (a fraction), thus greatly improving the detection rate and accuracy of rare cells.
  • the above method wraps multiple cells into a single droplet, avoiding the need to dilute cells to extremely low density during the cell phase preparation process. There is no need to generate excessive droplets during the detection process, thus significantly reducing the cost of rare cells. testing costs.
  • this application uses a high-throughput microfluidic single-cell sequencing platform to detect rare cells, completing the capture and genome analysis of rare cells in one step; and the platform is highly applicable and can be applied to various types of rare cells. cells, and can analyze and identify rare cells based on the platform's data analysis process and personalized analysis.
  • Figure 1 is a flow chart of a method for detecting rare cells according to an embodiment of the present application. As shown in Figure 1, the method includes the following steps:
  • Step S101 Provide single cells from biological samples.
  • rare cells refer to a type of cells with low abundance in biological fluids.
  • rare cell types include: embryonic cells, stem cells, progenitor cells, cancer stem cells, various types of tumor cells, etc.
  • Rare cells can be associated with symptoms of the disease or, for example, pregnancy.
  • rare cells include circulating tumor cells and fetal cell-free cells, where the fetal cell-free cells can be fetal nucleated red blood cells. It can be understood that the methods and platforms proposed in the embodiments of this application are universally applicable to various types of rare cells, that is, the methods for detecting rare cells proposed in the embodiments of this application can be used to identify cells that account for a small proportion of the population. Any category of low-abundance cells, with no restriction on rare cell types here.
  • biological samples refer to samples derived from organisms.
  • the biological sample is from a mammal.
  • the biological sample is from a pregnant woman or a subject who has or is suspected of having a disease.
  • the method for detecting rare cells proposed in the embodiments of the present application can detect target cells (ie, rare cells) in a large number of background cells. Therefore, in the embodiments of the present application, the biological samples can be derived from the same subject. , or it can be derived from different subjects, such as from multiple subjects with certain types of tumor screening needs; it can be derived from the same species or from different species, such as from mice and humans. , there are no restrictions on the source and composition of biological samples.
  • the biological sample can be any biological fluid, tissue or organ from which single cells can be extracted.
  • the biological sample is a body fluid, tissue or organ containing rare cells in the same organism; in other embodiments, the biological sample is a body fluid, tissue or organ containing rare cells in a different organism.
  • the biological sample is at least one of peripheral blood, urine, saliva or tissue.
  • Step S102 Provide magnetic beads, wherein multiple oligonucleotide sequences are connected to the magnetic beads, and each oligonucleotide sequence includes a barcode tag sequence, a unique molecular identification sequence UMI and a first capture sequence.
  • multiple oligonucleotide sequences are connected to the magnetic beads.
  • 100,000 to 10 million oligonucleotide sequences are attached to a single magnetic bead.
  • between 100,000 and 1,000,000 oligonucleotide sequences are attached to a single magnetic bead. It can be understood that the number of oligonucleotides connected to a single magnetic bead is sufficient as long as it is sufficient for the number of nucleic acid sequences of all single cells enclosed in a single droplet. This application does not intend to Limit the number of oligonucleotides.
  • FIG. 2 is a schematic structural diagram of a magnetic bead according to an embodiment of the present application.
  • each oligonucleotide sequence connected to the magnetic beads includes: barcode tag sequence, unique molecular identification sequence UMI and first capture sequence, which is based on the same single magnetic bead.
  • the barcode tag sequences in multiple oligonucleotide sequences are the same; based on different individual magnetic beads, the barcode tag sequences are different from each other. That is, the barcode tag sequence is magnetic bead specific.
  • the barcode sequence length may be 8-16 bp. In some embodiments, the barcode sequence length may be 10-20 bp.
  • the first capture sequence is used to capture the nucleic acid sequence released after cell lysis in a single droplet, that is, the first capture sequence has a structure that is reverse complementary to the nucleic acid sequence released by the cell.
  • the first capture sequence is selected from at least one of poly(dT), a DNA capture sequence, or a capture sequence with a specific function, wherein poly(dT) is used to capture mRNA sequences, and the DNA capture sequence is used to capture DNA sequences and capture sequences with specific functions are used to capture sequences with special recognition functions designed according to needs.
  • sequences with specific functions can be designed separately according to different experimental designs and purposes.
  • the sequences with specific functions can be sequences coupled to oligo on the capture antibody, sequences coupled to oligo on the capture Index vector, etc.
  • the first capture sequence is poly(dT). In some embodiments, the first capture sequence is located at the 3' end of the oligonucleotide sequence on the magnetic beads. In some embodiments, the length of the first capture sequence may be 10-40 bp. In some embodiments, the length of the first capture sequence may be 10-20 bp.
  • a unique molecular identifier (UMI) is used to label the nucleic acid sequence captured by the first capture sequence, where each of the multiple oligonucleotide sequences is based on the same single magnetic bead.
  • the unique molecular identifier sequences UMI are different from each other. In other words, UMI has unique specificity, that is, the UMI carried by each captured single cell nucleic acid sequence is different.
  • the original nucleic acid template is marked through UMI, so that during subsequent data analysis, repeated amplified sequences with the same UMI sequence can be removed according to the UMI sequence (i.e., UMI correction), thereby reducing the risk of Bias and amplification errors caused by subsequent library construction and amplification.
  • the length of the UMI may be 5-20 bp. In some embodiments, the UMI may be 10-20 bp in length. In some embodiments, the UMI may be 10 bp in length.
  • the oligonucleotide sequence may also include a linker sequence, which may be used for primer binding, library construction, and sequencing in subsequent amplification.
  • Step S103 Enclose a plurality of the single cells and the magnetic beads in a single droplet.
  • a microfluidic device or other device that can generate droplets is used for droplet sealing.
  • Figures 3 and 4 are respectively a droplet generating device and a partial schematic diagram of the droplet generating device according to an embodiment of the present application.
  • Figure 5 is a schematic diagram of a C4V2 slide used for droplet generation.
  • single cells derived from biological samples are prepared into a high-density cell phase, and the initial input amount is millions or even higher; the initial input amount of magnetic beads can also be from hundreds of thousands to millions.
  • the high-density cell phase and the magnetic bead phase are wrapped with an oil phase to achieve the encapsulation of single/multiple magnetic beads and single/multiple cells in a single droplet.
  • a single droplet may contain 1-10 single cells. In some embodiments, a single droplet may contain 1-5 single cells. In some embodiments, a single droplet may contain 5-7 single cells. It can be understood that in the embodiments of the present application, by increasing the initial input amount of single cells, the need to dilute the cells to extremely low density during the cell phase preparation process is avoided, and at the same time, the input amount of magnetic beads can also be appropriately increased. For example, in some embodiments, increasing the input amount of magnetic beads to 1 million can maintain the magnetic bead wrapping rate above 95%, avoid excessive empty droplets during the droplet generation process, and maximize the rare Cell capture rate, this strategy significantly reduces the detection cost of rare cells and improves the detection rate of rare cells.
  • each droplet contains 1-10 magnetic beads. In some embodiments, each droplet contains 1, 2, 3, or 4 magnetic beads. In some embodiments, each droplet contains 5-8 magnetic beads. In some embodiments, each droplet contains 1 magnetic bead.
  • Example 1 of the present application the initial input amount of cells is in the millions or even higher (high-density cell phase), while the initial input amount of magnetic beads is approximately hundreds of thousands (standard density). Magnetic bead phase), the magnitudes of the two are very different. Therefore, when the droplet is sealed by a microfluidic device, in most cases, multiple cells and only one/two magnetic beads will be enclosed in a single droplet.
  • the barcodes in the tens of millions of independent and identical oligonucleotides connected to the magnetic beads will label the nucleic acid sequences of multiple single cells wrapped in the droplets, causing them to be wrapped into The nucleic acid sequences of multiple single cells in the same droplet all carry the same barcode.
  • the nucleic acid sequence has the same barcode. Capture positive magnetic beads with rare cell nucleic acid sequences, thereby increasing the detection rate of rare cells in a large number of background cells from one in ten thousand or even one in a million to the detection of rare cell markers on the magnetic beads in the droplet The rate is a fraction of that, which improves detection sensitivity and significantly reduces detection costs.
  • the demulsifier is an emulsifier or the like.
  • step S105 includes: based on a single droplet, calculating the number of unique molecular identifier sequences UMI corresponding to the single cell nucleic acid sequence aligned to the specific marker sequence of the rare cell and all unique molecular identifiers A ratio between the total number of sequence UMIs; comparing the ratio with a set ratio threshold; when the positive ratio is greater than the set ratio threshold, it is determined that the rare cell exists in the biological sample.
  • scRNA_parse software is first used to format the original offline data, and barcode correction and filtering are performed according to the white list; then, STAR is used to compare the filtered sequences to background cells and target cells.
  • Reference genome/transcriptome of cells rare cells
  • PISA software use PISA software to process and annotate the file, and calculate the UMI annotated to the reference genome/transcriptome of the target cell in a magnetic bead based on the statistically obtained barcode and UMI data.
  • the corresponding proportion threshold is set based on data accumulation. When the proportion exceeds the proportion threshold, the target cells are considered to be detected, and the magnetic beads can be determined to be positive magnetic beads.
  • the set proportion threshold may be 1%-10%. In some embodiments, the set proportion threshold may be 1%-5%. In some embodiments, the set ratio threshold may be 5%-10%.
  • the probability of detecting rare cells from a large number of background cells in traditional detection technology is transformed into one based on the detection of rare cells within the target droplet.
  • the probability of detecting rare cells with magnetic beads (a fraction), thus greatly improving the detection rate and accuracy of rare cells.
  • the above method wraps multiple cells into a single droplet, avoiding the need to dilute cells to extremely low density during the cell phase preparation process.
  • the wrapping rate of magnetic beads in the droplet is greatly improved. , a larger number of cells are captured during the droplet generation process, a single experiment can achieve a high input of cells, and significantly reduce the cost of detecting rare cells.
  • the high detection rate (a fraction) achieved by the detection method proposed in the above embodiment is achieved based on the magnetic beads in the target droplet, that is, based on the barcode calculation of the same magnetic beads with rare
  • the UMI ratio of cell-specific nucleic acid sequences positive magnetic beads can be obtained and rare cells can be detected.
  • another embodiment of the present application based on the above-mentioned method of detecting rare cells based on magnetic beads, also proposes a method of detecting rare cells by further increasing the input amount of magnetic beads.
  • the oligonucleotide sequence connected to the magnetic beads also includes a second capture sequence for additional capture of non-single cell nucleic acid sequences.
  • the second capture sequence is used to capture the Index sequence to achieve droplet-derived labeling of magnetic beads.
  • the Index carrier is a solid magnetic bead. Multiple Index sequences are connected to the Index carrier.
  • the Index sequence also includes a barcode sequence, a UMI sequence and a capture sequence (collectively referred to as an Index sequence), and each Index carrier has a unique barcode sequence.
  • a single droplet contains 5-15 Index carriers. In some embodiments, a single droplet contains 8-10 Index carriers.
  • the droplet sealing device 110 is used to seal multiple single cells and magnetic beads in a single droplet.
  • the multiple single cells are from biological samples.
  • the magnetic beads are connected with multiple oligonucleotide sequences. Each oligonucleotide sequence is connected to the magnetic beads.
  • the nucleotide sequence includes the barcode tag sequence, the unique molecular identifier sequence UMI and the first capture sequence.
  • the device for detecting rare cells realizes the transformation of the probability of detecting rare cells from a large number of background cells (one in ten thousand or even one in a million) in traditional detection technology to one based on the detection of rare cells in the target droplet.
  • the probability of magnetic beads detecting rare cells (a fraction) greatly improves the detection rate and accuracy of rare cells.
  • the above method encapsulates multiple cells into a single droplet.
  • this method increases the input amount of magnetic beads and improves the wrapping rate of magnetic beads in the droplet, further increasing the probability of rare cell capture, and achieving cell success in a single experiment. /The high investment of magnetic beads greatly reduces the cost of detecting rare cells.
  • embodiments of the present disclosure also provide a method for diagnosing cancer, including determining the presence of circulating tumor cells in a biological sample from a subject based on the method for detecting rare cells described in any of the above embodiments;
  • the method for detecting rare cells in the embodiments of the present application not only involves using specific markers to screen the presence and quantity of rare cells, but also uses the sequenced rare cell information for subsequent more in-depth analysis, thereby achieving Efficient and accurate diagnosis of cancer.
  • the genetic disease may be a chromosomal disease, a single-gene genetic disease, or a polygenic genetic disease.
  • 1.2 Use a cell counting board or counter to detect the concentration of cells or nuclei.
  • step 3.5 Mix the cell suspension prepared in step 1.5 by pipetting, and add 100 ⁇ L of cell buffer to the cells wells of the chip.
  • step 6.6 After slowly removing the supernatant from the PCR tubes in step 6.6, add 100 ⁇ l of the second-strand synthesis reaction system to each tube, shake to mix, and centrifuge briefly.
  • QC Quality control
  • oligo concentration is greater than 5ng/ ⁇ l.
  • step 9.4.2 Add 30 ⁇ l of the prepared adapter ligation reaction solution into the PCR tube in step 9.3.4, shake to mix, and then centrifuge briefly to collect the reaction solution at the bottom of the tube.
  • Quality control (QC) standards product concentration is greater than 3ng/ ⁇ l, and the main peak of fragment distribution is between 300 and 500bp.
  • Figure 9A shows repetition one and Figure 9B shows repetition two.
  • Figures 7 to 9 specifically show the distribution of magnetic beads capturing mouse transcripts when human and mouse cells are mixed in different proportions when the proportion threshold is set to 5%.
  • the ordinate of the scatter plot is the ratio of the number of mouse transcripts captured by each magnetic bead to the total number of captured transcripts, and the abscissa is the magnetic bead serial number.
  • the proportion of mouse transcripts captured by magnetic beads is greater than 5%, the magnetic bead is considered Mouse cells were captured.
  • the open diamond pattern represents the target cells (NIH/3T3)
  • the solid circular pattern represents the background cells (HEK293T).
  • the upper right corner of the scatter plot shows the number of rare cells and background cells.
  • PBMC peripheral blood mononuclear cells
  • MCF-7 target cells (that is, rare cells) as the experimental material. ) strategy to detect rare cells.
  • the main variable in this test is the amount of magnetic beads input.
  • the ratio of target cells to background cells is 1:10000.
  • Each group is set to repeat the experiment twice.
  • the specific magnetic bead input amount, cell number and The experimental groups are shown in Table 22.
  • Group PBMC MCF-7 Magnetic bead input amount 1, 2 50W 50 35W 3, 4 50W 50 70W 5, 6 50W 50 105W 7, 8 50W 0 35W 9, 10 0 2.2W 35W
  • the obtained offline data is cDNA and Oligo double-end Fastq compressed files, in which cDNA read1 retains 30bp tag sequence information, and the specific structure is 20bp barcode (10bp barcode1+10bp barcode2)+10bp UMI; read2 retains cDNA Sequence information, the specific structure is 100bp cDNA fragment; Oligo library read1 retains 20bp long barcode information, the specific structure is 10bp barcode1+10bp barcode2; read2 retains 30bp UMI information and Oligo magnetic bead exclusive barcode information (i.e. barcode information on the Index carrier) , the specific structure is 10bp UMI+10bp barcode1+10bp barcode2.
  • the filtering conditions include: the proportion of mitochondria is greater than 5%, the number of genes is less than 200 and greater than the upper quartile.
  • Use DoubletFinder version 2.0.3 to remove doublets based on the doublet rate of 5%.
  • Figure 10 is a Seurat clustering diagram of PBMC (background cells) and MCF-7 (breast cancer cells) according to this embodiment.
  • PBMC background cells
  • MCF-7 breast cancer cells
  • Figure 11 is a graph showing the specific expression of four marker genes (FOLR1, KRT18, BASP1 and C4BPB) in MCF-7 cells according to Example 2 of the present application.
  • four marker genes were selected based on existing PBMC and MCF data.
  • Figure 11 shows the expression levels of four genes in MCF-7 cells. It can be seen that FOLR1, KRT18, BASP1 and C4BPB have specific high expression in MCF cells. Therefore, these four genes can be used as MCF-7 cells. marker gene.
  • Table 23 shows the results of predicting MCF-7 cells based on four marker genes (FOLR1, KRT18, BASP1 and C4BPB).
  • Group 7, used as a negative control showed no detection of rare cells in 500,000 background cells without the addition of MCF-7 cells (i.e., target cells or rare cells).
  • Group 9 was used as a positive control.
  • this droplet microfluidic single-cell library construction device captured 6659 mcf cells.
  • the 6659 MCF-7 cells were analyzed through the above four marker genes. The cells were screened separately, and overlap cells were obtained. A total of 6275 overlap MCF-7 cells were obtained, accounting for 94.23% of the total number of detected cells.

Abstract

一种检测生物样本中罕见细胞的方法,包括:提供来自生物样本的单细胞;提供磁珠;使多个所述单细胞与所述磁珠封闭在单个液滴中;基于所述单个液滴中由所述第一捕获序列捕获的单细胞核酸序列,构建DNA文库并进行测序及数据分析;和从所述单细胞核酸序列中筛选罕见细胞的特异性标志序列信息,并确定所述生物样本中是否存在所述罕见细胞。

Description

检测罕见细胞的方法、装置及其应用 技术领域
本申请涉及细胞检测技术领域,具体涉及一种检测罕见细胞的方法、装置及其应用。
背景技术
罕见细胞是指在生物流体中丰度较低的一类细胞,该类细胞在生长发育、疾病进程中均扮演着重要角色。罕见细胞的分离与检测在临床研究、疾病监测过程中具有重要意义。罕见细胞在体液中数量极少,如每10 8-10 9的血细胞或每10 6-10 7个正常白细胞中仅有1个循环肿瘤细胞(circulating tumor cell,CTC)。目前罕见细胞的分离、检测仍具挑战,相关技术中罕见细胞分离、检测技术包括磁激活细胞分选技术(MACS),荧光激活细胞分选技术(FACS),微流控技术等。
基于微流控系统的单细胞测序技术目前应用较广。相比于其它技术,微流控中的微尺度液滴试剂消耗量极小,每一个形态稳定的液滴均可视为独立的微反应器,因而减少了实验中的交叉污染,便于对该液滴进行操控;液滴较大的比表面积还能加快各种反应速度和传热速度,因此微流控技术是单细胞研究领域的理想选择。然而,传统的基于微流控系统的单细胞测序方法的检测成本较为昂贵,其成本随着处理的细胞数量呈线性增长。此外,传统液滴微流控方法需要将细胞密度调至很低,以避免细胞在液滴中出现双胞或多胞情况(即一个液滴中包裹大于1个细胞)。这样的实验策略使得利用该技术检测样品中的罕见细胞时,需要更高的试剂和人工成本,且捕获罕见细胞的概率也极低。
由此,亟待建立一套灵敏度高、特异性强而检测成本低的罕见细胞高通量检测技术。
发明内容
本申请至少从以下方面解决了现有技术的问题之一。
为此,本申请的实施例提供了一种检测罕见细胞的方法、装置及其应用。
本申请第一方面实施例提出了一种检测生物样本中罕见细胞的方法,包括:提供来自生物样本的单细胞;提供磁珠,其中所述磁珠上连接有多条寡核苷酸序列,每条寡核苷酸序列包含barcode标签序列、唯一分子标识序列UMI和第一捕获序列;使多个所述单细胞与所述磁珠封闭在单个液滴中;基于所述单个液滴中由所述第一捕获序列捕获的单细胞核酸序列,构建DNA文库并进行测序及数据分析;和从所述单细胞核酸序列中筛选罕见细胞的特异性标志序列信息,并确定所述生物样本中是否存在所述罕见细胞。
在一些实施例中,所述生物样本来自哺乳动物,任选地所述生物样品来自怀孕女性或患有或疑似患有疾病的受试者。
在一些实施例中,所述生物样本为外周血、尿液、唾液或组织的至少一种。
在一些实施例中,所述罕见细胞包括:胚胎细胞、干细胞、祖细胞、癌症干细胞和/或肿瘤细胞。
在一些实施例中,所述罕见细胞包括循环肿瘤细胞和/或胎儿游离细胞,任选地,所述胎儿游离细胞为胎儿有核红细胞。
在一些实施例中,单个磁珠上连接有10万至1000万、优选10万至100万条所述寡核苷酸序列,任选地,其中基于相同单个磁珠,所述多条寡核苷酸序列中的各个barcode标签序列相同,并且基于不同单个磁珠,所述barcode标签序列彼此不同,任选地,其中基于相同单个磁珠,所述多条寡核苷酸序列中的各个唯一分子标识序列UMI彼此不同。
在一些实施例中,所述第一捕获序列选自poly(dT)和DNA捕获序列中的至少一种,优选地所述第一捕获序列是poly(dT),任选地,所述第一捕获序列位于所述磁珠上所述寡核苷酸序列的3’末端,任选地,每条所述寡核苷酸序列还包括接头序列和/或第二捕获序列。
在一些实施例中,基于所述单个液滴中由所述第一捕获序列捕获的单细胞核酸序列构建DNA文库包括:裂解所述多个单细胞以获得单细胞核酸序列,其中所述单细胞核酸序列被所述第一捕获序列捕获;破坏所述液滴以释放连接有所述寡核苷酸序列和所述单细胞核酸序列的磁珠;基于所述单细胞核酸序列构建DNA文库。
在一些实施例中,所述单细胞核酸序列为mRNA序列,其中所述基于所述单细胞核酸序列构建DNA文库进一步包括:将所述mRNA序列反转录为DNA序列后,构建所述DNA文库。
在一些实施例中,所述单个液滴包含1-10、优选5-7个单细胞。
在一些实施例中,所述每个液滴包含1-10个磁珠-,优选包含1个磁珠。
在一些实施例中,所述单个液滴中还包含Index载体,其中所述Index载体上连接有多条Index序列,所述Index序列识别所述单个液滴中的所述磁珠的所述寡核苷酸序列中的所述第二捕获序列,并被所述第二捕获序列捕获。
在一些实施例中,所述Index载体上连接有至少10万条Index序列。
在一些实施例中,所述液滴中含有5-15、优选8-10个Index载体。
在一些实施例中,确定所述生物样本中是否存在所述罕见细胞,包括:
基于单个液滴计算与比对到所述罕见细胞的特异性标志序列的单细胞核酸序列对应的唯一分子标识序列UMI的个数与所有唯一分子标识序列UMI的总数之间的比例;比较所述比例与设定比例阈值;当所述阳性比例大于所述设定比例阈值,确定所述生物样本中存在所述罕见细胞。
在一些实施例中,所述设定比例阈值为1-10%、优选1%-5%。
本申请第二方面实施例提出了一种检测生物样本中罕见细胞的设备,包括:液滴封闭装置,用于使多个单细胞与磁珠封闭在单个液滴中,其中所述多个单细胞来自所述生物样本,所述磁珠上连接有多条寡核苷酸序列,每条寡核苷酸序列包含barcode标签序列、唯一分子标识序列UMI和第一捕获序列;DNA文库构建装置,与所述液滴封闭装置相连,用于基于所述单个液滴中由所述第一捕获序列捕获的单细胞核酸序列构建DNA文库;测序装置,与 DNA文库构建装置相连,用于对所述DNA文库进行测序;和分析装置,与所述测序装置相连,用于数据分析,和从所述单细胞核酸序列中筛选罕见细胞的特异性标志序列信息,并确定所述生物样本中是否存在所述罕见细胞。
在一些实施例中,所述生物样本来自哺乳动物,任选地所述生物样品来自怀孕女性或患有或疑似患有疾病的受试者。
在一些实施例中,所述生物样本为外周血、尿液、唾液或组织的至少一种。
在一些实施例中,所述罕见细胞包括:胚胎细胞、干细胞、祖细胞、癌症干细胞和/或肿瘤细胞。
在一些实施例中,所述罕见细胞包括循环肿瘤细胞和/或胎儿游离细胞,任选地,所述胎儿游离细胞为胎儿有核红细胞。
在一些实施例中,单个磁珠上连接有10万至1000万、优选10万至100万条所述寡核苷酸序列,任选地,其中基于相同单个磁珠,所述多条寡核苷酸序列中的各个barcode标签序列相同,并且基于不同单个磁珠,所述barcode标签序列彼此不同,任选地,其中基于相同单个磁珠,所述多条寡核苷酸序列中的各个唯一分子标识序列UMI彼此不同。
在一些实施例中,所述第一捕获序列选自poly(dT)和DNA捕获序列中的至少一种,优选地所述第一捕获序列是poly(dT),任选地,所述第一捕获序列位于所述磁珠上所述寡核苷酸序列的3’末端,任选地,每条所述寡核苷酸序列还包括接头序列和/或第二捕获序列。
在一些实施例中,所述DNA文库构建装置还用于:裂解所述多个单细胞以获得单细胞核酸序列,其中所述单细胞核酸序列被所述第一捕获序列捕获;破坏所述液滴以释放连接有所述寡核苷酸序列和所述单细胞核酸序列的磁珠;基于所述单细胞核酸序列构建DNA文库。
在一些实施例中,所述单细胞核酸序列为mRNA序列,其中所述DNA文库构建装置还用于:将所述mRNA序列反转录为DNA序列后,构建所述DNA文库。
在一些实施例中,所述单个液滴包含1-10、优选5-7个单细胞。
在一些实施例中,所述每个液滴包含1-10个磁珠,优选包含1个磁珠。
在一些实施例中,所述单个液滴中还包含Index载体,其中所述Index载体上连接有多条Index序列,所述Index序列识别所述单个液滴中的所述磁珠的所述寡核苷酸序列中的所述第二捕获序列,并被所述第二捕获序列捕获。
在一些实施例中,所述Index载体上连接有至少10万条Index序列。
在一些实施例中,所述液滴中含有5-15、优选8-10个Index载体。
在一些实施例中,所述分析装置还用于:基于单个液滴,计算与比对到所述罕见细胞的特异性标志序列的单细胞核酸序列对应的唯一分子标识序列UMI的个数与所有唯一分子标识序列UMI的总数之间的比例;比较所述比例与设定比例阈值;当所述阳性比例大于所述设定比例阈值,确定所述生物样本中存在所述罕见细胞。
在一些实施例中,所述设定比例阈值为1-10%、优选1%-5%。
本申请第三方面实施例提出了一种诊断癌症的方法,包括:基于本申请第一方面实施例的任一实施例中所述的检测生物样本中罕见细胞的方法,确定来自受试者的生物样本中存在循环肿瘤细胞;分析所述循环肿瘤细胞的数量、疾病相关基因的表达情况,和/或染色质开放区域的调控情况;和根据所述循环肿瘤细胞的数量、疾病相关基因的表达情况和/或染色质开放区域的调控情况,鉴定所述受试者是否存在患有相关疾病的风险、疾病的发展情况和/或疾病的预后进程。
本申请第四方面实施例提出了一种非侵入性胎儿诊断方法,包括:基于本申请第一方面实施例的任一实施例中所述的检测生物样本中罕见细胞的方法,确定来自怀孕女性的生物样本存在胎儿游离细胞;和分析所述胎儿游离细胞的基因组或转录组信息,以确定胎儿的发育状况以及和/或是否患有遗传疾病。
在本申请实施例中,所述遗传疾病是染色体病、单基因遗传病或多基因遗传病。
本申请的实施方案实现了如下有益效果:
本申请所提出的基于超载(super-loading)策略检测罕见细胞的方法,利用细胞的超泊松分布,将单次实验的细胞起始投入量增加到百万级别,以允许一个液滴内包裹多个细胞;一旦液滴内包裹进罕见细胞,液滴内磁珠即可捕获到罕见细胞的特征性细胞标志物(marker);通过设定一定的阈值,即可将带有罕见细胞特征性marker的磁珠筛选出来,并同时证明液滴中罕见细胞的存在。该方法可将从大量背景细胞中检测罕见细胞的概率(万分之一甚至百万分之一)转变成基于目标液滴内的磁珠检测罕见细胞的概率(几分之一),从而大大提高了罕见细胞检出率及准确性,同时大幅降低了罕见细胞的检测成本。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例的检测罕见细胞的方法的流程图;
图2为根据本申请实施例的磁珠结构示意图;
图3为根据本申请实施例的液滴发生装置;
图4为根据本申请实施例的液滴发生装置的局部示意图;
图5为根据本申请实施例的C4V2载片示意图;
图6为根据本申请实施例所提供的检测罕见细胞的装置的结构示意图;
图7A和图7B为根据本申请实施例一,目的细胞(NIH/3T3):背景细胞(HEK293T)=1:100时,每个磁珠捕获小鼠转录本数占捕获转录本总数的比例,其中实验设两组重复,图7A为重复一、图7B为重复二;
图8A和图8B为根据本申请实施例一,目的细胞(NIH/3T3):背景细胞(HEK293T)=1:1000时,每个磁珠捕获小鼠转录本数占捕获转录本总数的比例,其中实验设两组重复, 图8A为重复一、图8B为重复二;
图9A和图9B为根据本申请实施例一,目的细胞(NIH/3T3):背景细胞(HEK293T)=1:10000时,每个磁珠捕获小鼠转录本数占捕获转录本总数的比例,其中实验设两组重复,图9A为重复一、图9B为重复二;
图10为根据本申请实施例二,PBMC(背景细胞)和MCF-7(乳腺癌细胞)的Seurat聚类图;
图11为根据本申请实施例二,4个marker基因(FOLR1、KRT18、BASP1和C4BPB)在MCF-7细胞中特异表达图;
图12为根据本申请实施例的基于超载(super-loading)策略检测罕见细胞的方法的示意图。
具体实施方式
下面详细描述本公开的实施例,所述实施例的示例在附图中示出。下面通过参考附图描述的实施例是示例性的,旨在用于解释本公开,而不能理解为对本公开的限制。
本公开是基于发明人对以下事实和问题的发现和认识做出的:罕见细胞在体液中含量极少,在相关技术中,罕见细胞的富集检测过程繁琐,并且在通量、成本等方面都存在诸多挑战。在近年来应用较多的基于微流控系统的单细胞测序技术中,理想状态下,应保证每个液滴均含有一个细胞和一个磁珠,这样一张微流控芯片便可生成几十上百万个独立单细胞反应空间。但在实际应用中,一张芯片的有效液滴数远达不到此数量级,原因在于,为了保证绝大多数液滴不含有多于一个的细胞或者磁珠,需要控制液滴生成数量远远超过细胞或磁珠的投入量,这导致大多数液滴内并不含有细胞和/或磁珠,也就是细胞或者磁珠在液滴内服从泊松分布(Poisson Distribution)。
因此,在单细胞微流控技术的试剂成本本就较为昂贵的情况下,这样的泊松分布策略需要较多液滴的生成量,且在这些液滴中有大部分为空液滴,即其并未包裹任何细胞或磁珠;同时在检测过程中如若产生双胞或多胞情况,即单个液滴中包裹大于一个细胞,则会影响后续实验数据准确性,因此在实验过程中需要控制细胞投入量在一定数值以内、以避免双胞或多胞问题,而这样的策略使得随着检测样本量的增加,试剂成本和人工成本检测成本逐步增加。此外,由于罕见细胞的数量极少,而该技术是基于大量的背景细胞,通过分析所有单细胞(包括大量背景细胞和极少数的罕见细胞)以识别罕见细胞,在现有磁珠包裹率的情况下,捕获和检测到罕见细胞的概率也极低。
本申请所提出的基于super-loading策略检测罕见细胞的方法,利用细胞的超泊松分布,将单次实验的细胞起始投入量增加到百万级别,以允许一个液滴内包裹多个细胞/细胞;一旦液滴内包裹进罕见细胞,液滴内磁珠即可捕获到罕见细胞的特征性细胞标志物(marker);通过设定一定的阈值,即可将捕获罕见细胞特征性marker的磁珠筛选出来,并同时证明液滴中罕见细胞的存在;背景细胞信号将被过滤并舍弃。在一些实施例中,所提出的方法主要 包括以下步骤:
1.提供磁珠相:使用一定浓度的磁珠相,其中每个磁珠上均连有数十万至数千万条寡核苷酸序列(oligo),该寡核苷酸序列包含barcode序列和第一捕获序列,其中所述barcode序列具有磁珠特异性,即同一磁珠上连有的barcode序列相同,不同磁珠所连有的barcode序列不同;所述第一捕获序列能够捕获液滴中来自多个单细胞的核酸序列。
2.提供细胞相:将百万数量级别的细胞配备成高密度的细胞相,其中所述高密度的细胞相中包括占绝大部分比例的背景细胞以及按小比例混入的一定数量的目的细胞。
3.液滴生成:基于液滴微流控单细胞技术,将高密度的细胞相与一定浓度的磁珠相在微流控装置上进行液滴生成,该过程将使得一个液滴中包裹进一个或多个磁珠和一个或多个细胞。
4.基于液滴的细胞后续处理:将液滴作为独立反应器,在液滴内裂解细胞并释放核酸序列,这些核酸序列将会被磁珠上的第一捕获序列捕获;之后对所有收集的液滴进行破乳,并对磁珠所捕获的核酸序列进行cDNA扩增、片段化以及建库和测序(具体参见实施例)。
5.目的细胞(罕见细胞)检测:由于本超载策略中细胞在液滴中呈超载状态,即一个磁珠对应多个细胞,而由于罕见细胞的数量极低,因而多数的液滴仅含有背景细胞,少数的液滴将包裹进目的细胞(罕见细胞),因而在后续数据处理中,利用目的细胞的特异性marker对测序后的数据进行筛选,并将背景细胞信号过滤并筛除,捕获到一定比例罕见细胞信号的磁珠将被视为阳性磁珠,同时证明在该液滴中检测到罕见细胞。
本申请实施例中提出的上述方法实现了将传统检测技术中从大量背景细胞中检测罕见细胞的概率(万分之一甚至百万分之一)转变成基于目标液滴内的磁珠检测罕见细胞的概率(几分之一),因而大大提高了罕见细胞检出率及准确性。同时,上述方法将单个液滴中包裹进多个细胞,避免了细胞相制备过程中对于细胞稀释至极低密度的需求,在检测过程中也无需产生过量的液滴,因而大幅降低了罕见细胞的检测成本。
此外,本申请运用高通量微流控单细胞测序平台来进行罕见细胞的检测,一步到位地完成了罕见细胞的捕获和基因组分析;并且该平台适用性高,可以适用于各种类型的罕见细胞,并能够依据该平台的数据分析的流程并加以个性化分析对罕见细胞进行分析和鉴定。
下面将结合附图来描述本申请实施例中所提出的检测生物样本中罕见细胞的方法和装置。
图1为本申请实施例的检测罕见细胞的方法的流程图。如图1所示,所述方法包括以下步骤:
步骤S101:提供来自生物样本的单细胞。
在本申请的实施例中,罕见细胞是指在生物流体中丰度较低的一类细胞。在一些实施例中,罕见细胞的类型包括:胚胎细胞、干细胞、祖细胞、癌症干细胞和各种类型的肿瘤细胞等。罕见细胞可与病变症状相关,也可与诸如怀孕等相关联。在一些实施例中,罕见细胞包 括循环肿瘤细胞和胎儿游离细胞,其中胎儿游离细胞可以为胎儿有核红细胞。可以理解的是,本申请实施例中所提出的方法和平台对各种类型的罕见细胞具有普适性,即本申请实施例中提出的检测罕见细胞的方法可以用于鉴定群体中占比较少的任意类别的低丰度细胞,在此不对罕见细胞类型进行限制。
在本申请的实施例中,生物样本是指来源于生物的样本。在一些实施例中,所述生物样本来自哺乳动物。在一些实施例中,生物样品来自怀孕女性或患有或疑似患有疾病的受试者。可以理解的是,本申请实施例中所提出的检测罕见细胞的方法可以在大量背景细胞中检测目的细胞(即罕见细胞),因此在本申请实施例中,生物样本可以来源于同一受试者,也可来源于不同受试者,如来源于具某类肿瘤筛查需求的多位受试者;既可来源于同一种属,也可来源于不同种属,例如来源于小鼠和人,在此对生物样本的来源和组成不作限制。
在本申请的实施例中,所述生物样本可以为任意能够提取出单细胞的生物体液、组织或器官。在一些实施例中,所述生物样本为同一生物体内含有罕见细胞的体液、组织或器官;在另一些实施例中,所述生物样本为不同生物体内含有罕见细胞的体液、组织或器官。在一些实施例中,所述生物样本为外周血、尿液、唾液或组织的至少一种。
步骤S102:提供磁珠,其中所述磁珠上连接有多条寡核苷酸序列,每条寡核苷酸序列包含barcode标签序列、唯一分子标识序列UMI和第一捕获序列。
在本申请实施例中,磁珠上连接有多条寡核苷酸序列。在一些实施例中,单个磁珠上连接有10万至1000万条寡核苷酸序列。在一些实施例中,单个磁珠上连接有10万至100万条寡核苷酸序列。可以理解的是,对于单个磁珠上所连接的寡核苷酸的数量,只要满足对于单个液滴中所包裹的所有单细胞的核酸序列的数量而言是足量的即可,本申请无意对此寡核苷酸的数量进行限制。
图2为根据本申请实施例的磁珠结构示意图。如图2所示,在本申请的实施例中,磁珠上连有的每条寡核苷酸序列包含:barcode标签序列、唯一分子标识序列UMI和第一捕获序列,其中基于相同单个磁珠,多条寡核苷酸序列中的各个barcode标签序列相同;基于不同单个磁珠,barcode标签序列彼此不同。也即,barcode标签序列具有磁珠特异性。在一些实施例中,barcode序列长度可以为8-16bp。在一些实施例中,barcode序列长度可以为10-20bp。
在本申请实施例中,第一捕获序列用于捕获单个液滴中细胞裂解后所释放的核酸序列,即第一捕获序列具有与细胞释放的核酸序列反向互补的结构。在一些实施例中,第一捕获序列选自poly(dT)、DNA捕获序列或具特定功能的捕获序列中的至少一种,其中poly(dT)用于捕获mRNA序列、DNA捕获序列用于捕获DNA序列、具特定功能的捕获序列用于捕获根据需求设计出的具特殊识别功能的序列。在一些实施例中,特定功能的序列可根据实验设计和目的的不同分别设计,具特定功能的序列可以是捕获抗体上偶联oligo的序列、捕获Index载体上偶联oligo的序列等。在一些实施例中,第一捕获序列为poly(dT)。在一些实施例中, 第一捕获序列位于所述磁珠上寡核苷酸序列的3’末端。在一些实施例中,第一捕获序列的长度可以为10-40bp。在一些实施例中,第一捕获序列的长度可以为10-20bp。
在本申请实施例中,唯一分子标识序列(unique molecular identifier,UMI)用于对第一捕获序列所捕获的核酸序列进行标记,其中基于相同单个磁珠,多条寡核苷酸序列中的各个唯一分子标识序列UMI彼此不同。也就是说,UMI具有唯一特异性,即每条所捕获的单细胞核酸序列上所带有的UMI均不相同。在一些实施例中,通过UMI实现了对原始核酸模板的标记,以此在后续数据分析时,可以根据UMI序列去除带有相同UMI序列的重复扩增序列(即UMI矫正),以此降低由后续建库扩增所带来的偏倚性(bias)和扩增错误。在本申请实施例中,UMI的长度可以为5-20bp。在一些实施例中,UMI的长度可以为10-20bp。在一些实施例中,UMI的长度可以为10bp。
在本申请实施例中,寡核苷酸序列还可以包含接头序列,该接头序列可以用于后续扩增中的引物结合以及建库和测序。
步骤S103:使多个所述单细胞与所述磁珠封闭在单个液滴中。
在本申请实施例中,使用微流控装置或其它可以实现液滴生成的装置进行液滴封闭。图3和图4分别为根据本申请实施例的液滴发生装置以及该液滴发生装置的局部示意图,图5为液滴生成所使用的C4V2载片示意图。在本申请实施例中,来源于生物样本的单细胞被制备为高密度细胞相,其初始投入量为百万级甚至更高数量;磁珠的初始投入量也可由数十万至百万。如图4所示,在本申请实施例中,通过使用油相将高密度细胞相和磁珠相进行包裹,以实现在单个液滴中包裹入单个/多个磁珠和单个/多个细胞。在本申请实施例中,优选在单个液滴中包裹入单个磁珠和多个细胞。
在本申请实施例中,单个液滴可以包含1-10个单细胞。在一些实施例中,单个液滴可以包含1-5个单细胞。在一些实施例中,单个液滴可以包含5-7个单细胞。可以理解的是,在本申请实施例中,通过将单细胞的初始投入量加大,避免了细胞相制备过程中对于细胞稀释至极低密度的需求,同时也可以适度加大磁珠的投入量,如在一些实施例中,将磁珠投入量加大至100万,可使磁珠包裹率维持在95%以上,避免在液滴生成过程中产生过量的空液滴,最大限度提高罕见细胞的捕获率,该策略大幅降低了罕见细胞的检测成本,提高了罕见细胞的检出率。
在本申请实施例中,每个液滴包含1-10个磁珠。在一些实施例中,每个液滴包含1、2、3或4个磁珠。在一些实施例中,每个液滴包含5-8个磁珠。在一些实施例中,每个液滴包含1个磁珠。
可以理解的是,在本申请的实施例一中,由于细胞的初始投入量为百万级甚至更高数量(高密度细胞相),而磁珠的初始投入量大概为数十万(标准密度磁珠相),二者量级相差悬殊,因此经微流控装置进行液滴封闭时,在绝大多数情况下,单个液滴中会包裹入多个细胞和仅一个/两个磁珠。在这种情况下,磁珠上所连接的上千万条独立且相同的寡核苷酸中的 barcode将对此液滴中所包裹的多个单细胞的核酸序列进行标记,使得被包裹入同一液滴的多个单细胞的核酸序列均带有相同的barcode,以此在后续数据分析时,通过对罕见细胞(即目的细胞)的特征性标记(marker)进行检测,即可确定带有捕获有罕见细胞核酸序列的阳性磁珠,由此将大量背景细胞中罕见细胞的检出率由万分之一甚至百万分之一提高至液滴内磁珠上的罕见细胞marker的检出率几分之一,提高了检测灵敏度并大幅降低了检测成本。
此外,在本申请的实施例二中,在液滴包裹的过程中,由于加大了磁珠的投入量,会出现单个液滴中包裹入多个磁珠和多个细胞的情况。可以理解的是,在此情况下,多个磁珠上所连接的寡核苷酸序列中的不同的barcode会对此液滴中所包裹的所有单细胞的核酸序列进行标记,并仍通过对罕见细胞(即目的细胞)的特征性标记(marker)进行检测以确定阳性磁珠,同时实现在此磁珠所对应的多个细胞中确定罕见细胞。因此,即使在同一液滴中包裹有多个磁珠的情况下,仍可实现上述罕见细胞的检测,并实现上述几分之一的高检出率和高灵敏度。
步骤S104:基于所述单个液滴中由所述第一捕获序列捕获的单细胞核酸序列,构建DNA文库并进行测序及数据分析。
在一些实施例中,步骤S104包括:裂解多个单细胞以获得单细胞核酸序列,其中单细胞核酸序列被第一捕获序列捕获;破坏液滴以释放连接有所述寡核苷酸序列和单细胞核酸序列的磁珠;基于单细胞核酸序列构建DNA文库。
在本申请的实施例中,在磁珠和多个单细胞封闭于单个液滴中后,液滴中的裂解液将裂解多个单细胞以获得单细胞核酸序列。然后,这些被释放的核酸序列将被磁珠上连有的寡核苷酸序列中的第一捕获序列捕获,以将核酸序列与磁珠相连。此过程独立地发生于单个液滴形成的反应器中。可以理解的是,这一捕获步骤使得每条与磁珠相连的核酸序列均连接有磁珠上所携带的寡核苷酸序列,包括barcode和UMI等,其中连接至同一磁珠上的核酸序列所连有的barcode相同、而UMI彼此不同;连接至不同磁珠上的核酸序列所连有的barcode不同、UMI同样彼此不同,以此实现核酸序列的磁珠标记与原始模板标记。
在一些实施例中,在捕获核酸序列后,收集所有液滴,使用破乳剂(breakage buffer)打破液滴油包水结构以释放连接有寡核苷酸序列和所述单细胞核酸序列的磁珠。可以理解的是,此破乳步骤可以针对单个液滴分别进行,也可将所有液滴收集后针对所有液滴共同处理,只要将用于形成液滴包裹的油相破坏即可,对于处理过程在此不作限制。在一些实施例中,破乳剂为乳化剂等。
在一些实施例中,基于所述单细胞核酸序列,使用标准建库流程构建DNA文库。在一些实施例中,标准建库程序可以为华大标准建库程序(详见下方实施例1)。在另一些实施例中,标准建库程序还可以为相关技术中已推行的Illumina、Roche、SOLiD等测序平台适配的标准建库程序,在此不作限制。
在一些实施例中,在基于所述单细胞核酸序列使用标准建库程序构建DNA文库之前, 还包括:以释放的捕获有单细胞核酸序列的磁珠为模板,针对单细胞核酸序列以及所连有的寡核苷酸序列(包括barcode、UMI等)进行扩增。在一些实施例中,单细胞核酸序列为mRNA序列。同时,在捕获的单细胞核酸序列为mRNA的情况下,在捕获步骤后需要对mRNA进行反转录,再针对合成的cDNA以及所连有的寡核苷酸序列(包括barcode、UMI等)进行扩增。
步骤S105:从所述单细胞核酸序列中筛选罕见细胞的特异性标志序列信息,并确定所述生物样本中是否存在所述罕见细胞。
在本申请实施例中,步骤S105包括:基于单个液滴,计算与比对到所述罕见细胞的特异性标志序列的单细胞核酸序列对应的唯一分子标识序列UMI的个数与所有唯一分子标识序列UMI的总数之间的比例;比较所述比例与设定比例阈值;当所述阳性比例大于所述设定比例阈值,确定所述生物样本中存在所述罕见细胞。
在本申请实施例中,针对步骤S104中构建的DNA文库进行上机测序,以得到测序数据。测序可以在相关技术的各个测序平台执行。在本申请的实施例中,测序平台为华大智造MGI平台。
在本申请实施例中,针对测序数据,使用首先采用scRNA_parse软件对原始下机数据进行格式处理,根据白名单进行barcode校正、过滤;然后,利用STAR将过滤得到的序列比对至背景细胞和目的细胞(罕见细胞)的参考基因组/转录组;使用PISA软件对文件进行处理、注释等,根据统计得到的barcode、UMI数据计算在一个磁珠中注释到目的细胞参考基因组/转录组的UMI与此磁珠上所有UMI的比例,根据数据累积设定相应比例阈值,当比例超过该比例阈值即认为检测到目的细胞,并可以确定此磁珠为阳性磁珠。可以理解的是,针对上述质控、过滤、比对和注释等步骤,可以使用相关技术中任意可以实现的脚本和软件,在此不作限制。
在本申请实施例中,设定比例阈值可以为1%-10%。在一些实施例中,设定比例阈值可以为1%-5%。在一些实施例中,设定比例阈值可以为5%-10%。
在本申请实施例中,使用具有磁珠特异性的barcode以确定测序数据的磁珠来源,使用唯一分子标识序列UMI进行原始核酸序列标记以进行后续的矫正等,尽可能地消除了建库扩增过程中所带来的偏倚性和错误。
通过上述本实施例所提出的检测罕见细胞的方法,实现了将传统检测技术中从大量背景细胞中检测罕见细胞的概率(万分之一甚至百万分之一)转变成基于目标液滴内的磁珠检测罕见细胞的概率(几分之一),因而大大提高了罕见细胞检出率及准确性。同时,上述方法将单个液滴中包裹进多个细胞,避免了细胞相制备过程中对于细胞稀释至极低密度的需求,同时通过提高磁珠投入量,使得液滴中磁珠包裹率大大提高,在液滴生成过程中更多地捕获到大量地细胞,单次试验实现细胞的高投入量,大幅降低了罕见细胞的检测成本。
可以理解的是,通过上述实施例所提出的检测方法所实现的高检出率(几分之一)是基 于目标液滴中的磁珠实现的,即根据barcode计算同一磁珠上带有罕见细胞特异核酸序列的UMI的比例,即可得到阳性磁珠,并确定检测出罕见细胞。对此,本申请另一实施例在上述基于磁珠检测罕见细胞的方法的基础上,还提出了进一步加大磁珠投入量的检测罕见细胞的方法。
在本申请实施例二所提出的检测罕见细胞的方法中,磁珠上连接的寡核苷酸序列还包含第二捕获序列,用于额外捕获非单细胞核酸序列。在本实施例中,该第二捕获序列用于捕获Index序列,以实现磁珠的液滴来源的标记。具体地,通过在细胞相中添加Index载体,使得在液滴生成(封闭)步骤中,生成的单个液滴中进一步包含Index载体。在一些实施例中,Index载体为一种固体磁珠。该Index载体上连接有多条Index序列,该Index序列同样包含barcode序列、UMI序列和捕获序列(统称为Index序列),并且每个Index载体具有唯一的barcode序列。该Index序列在Index载体被包裹进液滴后从Index载体上断裂,并捕获同一液滴中的磁珠的寡核苷酸序列中的第二捕获序列,即与磁珠上的第二捕获序列互补配对,使得Index序列与磁珠上的barcode建立联系,以此实现单个液滴中的磁珠的标记,即,当单个液滴中存在两个及以上磁珠时,被包裹在此液滴中的Index载体释放Index序列,这些Index序列与第二捕获序列结合,并同时使磁珠的barcode被标记;在后续分析时,利用同一液滴中Index序列的相似性,即可区分并确定来自于同一个液滴的磁珠,即可区分来自于同一个液滴的细胞,以此实现细胞的液滴来源的回溯。
在一些实施例中,每个Index载体上连接有数十万条Index序列。在一些实施例中,每个Index载体上连接有至少10万条Index序列。在一些实施例中,Index序列长度可以为30-90bp。
在一些实施例中,单个液滴中含有5-15个Index载体。在一些实施例中,单个液滴中含有8-10个Index载体。
根据本申请实施例二所提出的基于液滴的检测方法,实现了来源于同一液滴的磁珠和细胞的标记和回溯,同样实现了上述将传统检测技术中从大量背景细胞中检测罕见细胞的概率(万分之一甚至百万分之一)转变成基于目标液滴内的磁珠检测罕见细胞的概率(几分之一),因而大大提高了罕见细胞检出率及准确性。同时,该方法通过加大磁珠投入量,提高液滴中磁珠的包裹率,进一步提高了罕见细胞捕获的概率,同时在单次试验中实现了细胞的高投入量,因而大幅降低了罕见细胞的检测成本。
进一步地,本申请实施例还提出一种检测罕见细胞的装置。
图6为根据本申请实施例所提供的检测罕见细胞的装置的结构示意图。如图6所示,该检测罕见细胞的装置100包括:液滴封闭装置110、DNA文库构建装置120、测序装置130和分析装置140。
其中,液滴封闭装置110用于使多个单细胞与磁珠封闭在单个液滴中,其中多个单细胞来自生物样本,磁珠上连接有多条寡核苷酸序列,每条寡核苷酸序列包含barcode标签序列、 唯一分子标识序列UMI和第一捕获序列。
DNA文库构建装置120与液滴封闭装置相连,用于基于单个液滴中由第一捕获序列捕获的单细胞核酸序列构建DNA文库。
测序装置130与DNA文库构建装置相连,用于对DNA文库进行测序。
分析装置140与测序装置相连,用于数据分析,和从单细胞核酸序列中筛选罕见细胞的特异性标志序列信息,并确定生物样本中是否存在罕见细胞。
需要说明的是,本实施例提出的检测罕见细胞的装置执行上述检测罕见细胞的方法,并与上述方法一一对应,前述对该方法实施例的解释说明也适用于本实施例的检测罕见细胞的装置100,此处不再赘述。
本公开实施例所提出的检测罕见细胞的装置,实现了将传统检测技术中从大量背景细胞中检测罕见细胞的概率(万分之一甚至百万分之一)转变成基于目标液滴内的磁珠检测罕见细胞的概率(几分之一),因而大大提高了罕见细胞检出率及准确性。同时,上述方法将单个液滴中包裹进多个细胞,同时,该方法通过提高磁珠投入量,提高液滴中磁珠的包裹率,进一步提高了罕见细胞捕获的概率,单次试验实现细胞/磁珠的高投入量,大幅降低了罕见细胞的检测成本。
进一步地,本公开实施例还提出一种诊断癌症的方法,包括基于上述任一实施例中所述的检测罕见细胞的方法,确定来自受试者的生物样本中存在循环肿瘤细胞;
分析循环肿瘤细胞的数量、疾病相关基因的表达情况和/或染色质开放区域的调控情况;和
根据所述循环肿瘤细胞的数量及疾病相关基因的表达情况和/或染色质开放区域的调控情况,鉴定所述受试者是否存在患有相关疾病的风险、疾病的发展情况和/或疾病的预后进程。
本申请实施例提出的诊断癌症的方法,通过基于上述任一实施例中所述的检测罕见细胞的方法,确定来自受试者的生物样本中存在循环肿瘤细胞。可以理解的是,本申请实施例提出的检测罕见细胞的方法方法可以实现液滴中单个细胞数据的分离,即如果液滴包裹进罕见细胞,那么液滴中磁珠便可以捕获到这些罕见细胞的转录组或基因组信息,该类罕见细胞的表达谱往往与背景细胞存在较大差异,比如在某些疾病相关基因的表达量上、染色质开放区的调控上等。因此,这些信息均可作为鉴定受试者是否存在某类疾病风险、疾病发展及预后进程、胎儿相关遗传性疾病的重要依据。由此,本申请实施例中的检测罕见细胞的方法不仅仅涉及使用特异性marker筛选罕见细胞的有无及数量,还能将测序到的罕见细胞信息用于后续更加深入的分析,从而实现了癌症的高效及精准诊断。
进一步地,本公开实施例还提出一种非侵入性胎儿诊断方法,包括:上述任一实施例中所述的检测罕见细胞的方法,确定来自怀孕女性的生物样本存在胎儿游离细胞;和分析胎儿游离细胞的基因组或转录组信息,以确定胎儿的发育状况和/或是否患有遗传疾病。
在一些实施例中,遗传疾病可以为染色体病、单基因遗传病或多基因遗传病。
本申请实施例所提出的非侵入性胎儿诊断方法,通过基于本申请实施例中的检测罕见细胞的方法确定来自怀孕女性的生物样本中的胎儿游离细胞,并进一步对该胎儿游离细胞的基因组信息或转录组信息进行深入分析,从而获得胎儿的发育状况以及是否患有遗传疾病等相关信息,由此实现了非侵入性情况下胎儿信息的高效获取和精准分析。
图12为根据本申请实施例的基于超载(super-loading)策略检测罕见细胞的方法的示意图。如图12所示,a部分表示在传统检测未进行液滴微流控细胞super-loading时,罕见细胞信号强度极弱,在背景细胞中的事件发生率为万分之一甚至百万分之一(如e部分所示)。图b部分示出了适用于本申请实施例所提出的基于super-loading策略检测罕见细胞的方法的微流控液滴发生装置,在该装置中对细胞进行super-loading,使得单个液滴中包裹入磁珠和多个细胞。图c部分表示根据本申请实施例中提出的检测罕见细胞的方法,在形成封闭液滴后,这些包裹有样本中大量细胞群体的液滴会分为两类,即带有目的细胞(即罕见细胞)的液滴和不带有目的细胞的液滴,通过基因组/转录本特征仅筛选出带有目的细胞特征的液滴并进行分析,即可将目的细胞检出。将每个单独的液滴视为一个体系,如图12中d部分所示,目的细胞的检出概率将远远大于百万群体中目的细胞的检出概率。
下述实施例中的实验方法,如无特殊说明,均为常规方法,按照本领域内的文献所描述的技术或条件或者按照产品说明书进行。下述实施例中所用的材料、试剂等,如无特殊说明,均可从商业途径得到。
实施例1
本实施例以人胚胎肾细胞HEK293T作为背景细胞,以小鼠胚胎成纤维细胞3T3为目的细胞(即罕见细胞)为实验材料,使用基于超载(super-loading)策略检测罕见细胞的方法和平台,在目的细胞与背景细胞的比例分别为1:100、1:1000和1:10000比例下对罕见细胞进行检测,每组设置2次重复实验,具体细胞数量和实验组别如表1所示。
表1
组别 293T数目 3T3数目
1、2 1000000 10000
3、4 1000000 1000
5、6 1000000 100
1.细胞悬液准备
1.1针对293T细胞系和3T3细胞系分别制备细胞悬液,使用PBS(含0.04%BSA)清洗细胞1-2次并使用40μm的细胞筛过滤。
1.2使用细胞计数板或计数仪检测细胞或细胞核的浓度。
1.3根据293T细胞悬液浓度,按照每组投入110万个293T细胞的标准计算所需细胞悬液体积。之后将含有110万个293T细胞的细胞悬液300g、25℃、5min离心以收集细胞沉淀,并加入22.5μl Cell Resuspension Buffer重悬细胞或细胞核。
1.4根据3T3细胞悬液浓度,分别将3T3细胞浓度调整至1000个/μl,100个/μl和10个/μl。之后分别将11μl 3个浓度梯度的3T3细胞悬液与上述1.3步中制备的22.5μl 293T细胞悬液混合,3个浓度梯度各设两组重复(如表1)。
1.5每组加入33μl Cell Additive、5.5μl RNase Inhibitor和38μl Index载体,最终每组细胞悬液体系的总体积为110μl。
2.磁珠准备
2.1震荡混匀Single Cell Barcoded Beads-V2,每组吸取100μl Single Cell Barcoded Beads-V2于PCR管中,将PCR管置于磁力架上,静置2min,去除上清。
2.2从磁力架上取下PCR管,向管中加入99μl Lysis Buffer-V2悬浮磁珠。
2.3在上机前在磁珠相中加入11μl CR reagent,吹打混匀,之后放置于冰上,等待上机。
3.液滴生成
3.1采用C4V2载片,将载片放置于如图3所示的液滴发生装置C4V2的载片槽区域。
3.2向C4V2收集管中加入100μl Droplet Generation Oil,拧紧收集管管盖,并将收集管竖直放置于固定架上。
3.3将收集管管盖上的第一连接管的A端(此管接触收集管底部,如图4所示)插入载片的Outlet孔。
3.4调节C4V2针筒活塞的位置,并将其放置在C4V2底座的初始位置上。用针头连接针筒与收集管管盖上的第二连接管的B端(如图3所示,此管不接触收集管底部)。
3.5吹打混匀步骤1.5中配制好的细胞悬液,向芯片的cells孔加入100μL细胞缓冲液。
3.6吹打混匀步骤2.3中配制好的磁珠悬浮液,向芯片的beads孔加入100μl磁珠悬浮液。
3.7快速添加450μL Droplet Generation Oil到芯片的Oil孔。
3.8快速将针筒的活塞拉到20mL刻度处,并将针筒固定在固定支架上。
3.9收集液滴,该过程持续10min左右,待cells孔或beads孔任一孔中的液体即将加载完毕时,立即拧松收集管的盖子,拔出芯片outlet孔的连接管,竖直拉伸连接管,让管中的液滴流入收集管中。
3.10竖直放置收集管,在室温下静置20min,之后立即进行后续破乳操作。
4.破乳
4.1 6×SSC配制(每个样本的使用量约为50mL):15mL 20×SSC中加入35mL Molecular Grade Water,振荡混匀。
4.2 Breakage Buffer配制(每个样本的使用量约为10mL):20mL 6×SSC中加入400μl Additive B。
4.3连接C4 V2过滤器与真空泵,启动真空泵。
4.4加入约20mL 6×SSC,对C4 V2过滤器进行预润洗。
4.5待滤膜上无液体残留,将收集管中的所有液体均匀的倒在滤膜表面,并用2mL 6×SSC清洗收集管2次,将清洗液一并倒入过滤装置中。
4.6用力颠倒混匀Breakage Buffer,并分次缓慢加入过滤器中。
4.7待滤膜上无液体残留,连续加入30mL 6×SSC,清洗磁珠。
4.8待滤膜上无液体残留,关闭真空泵,断开真空泵与过滤器的连接。
4.9将过滤器转移到超净工作台中,加入700μl Collection Buffer悬浮磁珠。
4.10将含有磁珠的收集液转移至一个1.5mL低吸附离心管中。
4.11用700μl Collection Buffer悬浮残留的磁珠。
4.12将含有磁珠的收集液转移到上述同一个1.5mL离心管中。
4.13将离心管放置于磁力架上,静置3min,缓慢去除上清。
4.14加入1ml 6×SSC,静置2min,缓慢去除上清。
4.14向1.5ml管中加入200μl 6×SSC,吹打混匀,并将回收的磁珠悬液转移至1个0.2mL PCR管中并放置于磁力架上静置,吸取上清。
4.15向上述1.5ml管中再加入200μl 6×SSC,再次吹打混匀,并将磁珠悬液转移至步骤4.14中的同一个装有磁珠的PCR管中。
4.16将0.2mL PCR管放置于磁力架上,静置2min,缓慢去除上清。
4.17保持PCR管在磁力架上,加入200μL 6×SSC,静置,配制逆转录反应体系。
5.逆转录反应
5.1每个PCR单管按照下表2中所示配方在冰上配制逆转录反应体系。
表2
Figure PCTCN2022097740-appb-000001
5.2缓慢去除步骤4.17中的6×SSC上清,并加入100μl逆转录反应体系悬浮磁珠。
5.3按表3中所示的反应条件在PCR仪上孵育。
表3
Figure PCTCN2022097740-appb-000002
5.4反应结束后,将PCR管放置于磁力架上,静置2min后去除上清。
5.5从磁力架取下PCR管,每管加入200μl Wash Buffer E(TE-SDS)终止反应。
5.6将PCR管放置于磁力架上,静置2min,去除上清。
5.7保持PCR管在磁力架上,每管加入200μl Wash Buffer F(TE-TW),静置2min,去除上清。
5.8再次重复5.7步骤。
6.二链合成
6.1将5.8中的PCR管放置于磁力架上,静置2min,去除上清。
6.2每管加入200μl稀释后的Solution S1,从磁力架上取下PCR管,轻弹混匀磁珠。
6.3混匀后,室温孵育5min。
6.4短暂离心,将PCR管放置于磁力架上,静置2min后去除上清。
6.5保持离心管置于磁力架上,每管中加入200μl Solution S2,静置2min,去掉上清。
6.6保持离心管置于磁力架上,每管加入200μL Wash Buffer F(TE-TW),静置,准备下一步反应体系。
6.7按照表4所示配方在冰上配制二链合成反应体系。
表4
Figure PCTCN2022097740-appb-000003
6.8缓慢去除步骤6.6中PCR管的上清后,向每管加入100μl二链合成反应体系,振荡混匀,并短暂离心。
6.9按表5中所示的反应条件在PCR仪上孵育。
表5
Figure PCTCN2022097740-appb-000004
6.10反应结束后,短暂离心,将PCR管放置在磁力架上,静置2min,去除上清。
6.11从磁力架取下PCR管,每管加入200μl Wash Buffer E(TE-SDS),振荡混匀,终止反应。
6.12将PCR管短暂离心后放置于磁力架上,静置2min,去除上清。
6.13保持离心管置于磁力架上,每管加入200μl Wash Buffer F(TE-TW),静置2min, 去除上清。
6.14从磁力架上取下PCR管,每管加入200μl Wash Buffer F(TE-TW),并吹打混匀,将磁珠悬液均匀分为4份并转移至新的PCR管中,每管约50μl。
6.15在原PCR管中再次加入200μl Wash Buffer F(TE-TW),并吹打混匀,再将磁珠悬液均匀分为4份转移至6.14步骤中已经装磁珠的4个PCR管中,每管约50μl。
6.16将PCR管短暂离心后放置在磁力架上,静置,配制下一步反应体系。
7.cDNA扩增
7.1按照表6所示配方在冰上配制cDNA扩增反应体系。
表6
Figure PCTCN2022097740-appb-000005
7.2缓慢去除6.16步骤中每个PCR管的上清后,向每管加入100μl配制的cDNA扩增反应体系,振荡混匀,并短暂离心。
7.3按表7所示的反应条件在PCR仪上孵育。
表7
Figure PCTCN2022097740-appb-000006
7.4将每组4管PCR产物混合到一个1.5mL管中,总体积约为400μl。
7.5吸取266μl(0.6×)Cleanup Beads A-v2至已混合合并的PCR产物中,并轻轻吹打至完全混匀,然后置于室温中孵育10min。
7.6将PCR管短暂离心后置于磁力架上,静置5min至液体澄清。
7.7吸取上清并转移至一个新的1.5mL离心管中,并将其标记为oligo产物。
7.8保持7.6步骤中的离心管于磁力架上,加入1000μl 80%乙醇,漂洗磁珠及管壁,静置30s,去掉上清。
7.9重复上一步的操作。
7.10保持离心管在磁力架上,打开管盖,于室温干燥磁珠。
7.11将离心管从磁力架上取下,加入32μl Nuclease-Free Water洗脱磁珠,并轻轻吹打 至完全混匀,之后于室温孵育5min。
7.12将离心管短暂离心后置于磁力架上,静置2至5min至液体澄清,将上清(30μl)转移到新的1.5mL离心管中,标记为cDNA产物。
7.13取1μl cDNA产物使用Qubit dsDNA HS Kit检测浓度,并另取1μl cDNA产物使用Agilent DNA分析试剂盒检测片段分布。
7.14向7.7步骤中留存的oligo产物中加入266μl(0.8×)Cleanup Beads A-v2,并轻轻吹打至完全混匀,之后于室温孵育10min。
7.15保持离心管在磁力架上,加入1000μl 80%乙醇,漂洗磁珠及管壁,静置30s,去掉上清。
7.16重复上一步的操作。
7.17保持离心管在磁力架上,打开管盖,于室温干燥磁珠。
7.18将离心管从磁力架上取下,加入32μl Nuclease-Free Water洗脱,并轻轻吹打至完全混匀,之后于室温孵育5min。
7.19将离心管短暂离心后置于磁力架上,静置2至5min至液体澄清,将上清(30μl)转移到新的1.5mL离心管中,标记为Oligo产物。
7.20取1μl Oligo产物使用Qubit dsDNA HS Kit检测浓度。
质控(QC)标准:cDNA浓度大于5ng/μl,片段分布主峰在900-1500bp之间。
8.Oligo产物二次扩增
8.1取新的0.2mL PCR管,取8μL 7.19步骤中的Oligo产物进行二次扩增。反应体系如表8所示:
表8
Figure PCTCN2022097740-appb-000007
8.2按表9的反应条件在PCR仪上孵育。
表9
Figure PCTCN2022097740-appb-000008
8.3吸取35μl Cleanup Beads A-v2至PCR产物中,并轻轻吹打至完全混匀,之后于室温孵育5min。
8.4将PCR管短暂离心后置于磁力架上,静置2至5min至液体澄清,吸取上清并转移到新的PCR管中。
8.5吸取35μl Cleanup Beads A-v2加到8.4步骤中PCR管的上清中,并轻轻吹打至完全混匀,之后于室温孵育5min。
8.6将PCR管短暂离心后置于磁力架上,静置2至5min至液体澄清,弃掉上清。
8.7保持离心管在磁力架上,加入200μl 80%乙醇漂洗磁珠及管壁,静置30s,去掉上清。
8.8重复上一步。
8.9保持离心管在磁力架上,打开离心管管盖,于室温干燥1min。
8.10将离心管从磁力架上取下,加入32μl Nuclease-Free Water,并轻轻吹打至完全混匀。
8.11于室温孵育5min。
8.12短暂离心后,将离心管置于磁力架上,静置2至5min至液体澄清,将30μl上清转移到新的离心管中。
8.13取1μl纯化后的产物使用Qubit dsDNA HS Kit检测浓度。
质控(QC)标准:oligo浓度大于5ng/μl。
9.文库构建
9.1打断
9.1.1取出Fragmentation Enzyme-v2,轻轻颠倒混匀10次,短暂离心后置于冰上待用。
9.1.2按表10在冰上配制打断反应液。
表10
Figure PCTCN2022097740-appb-000009
9.1.3根据cDNA产物浓度,取200至300ng 7.12中纯化后的cDNA产物于新的0.2mL PCR管中,使用Nuclease-Free Water补足体积至16μl。
9.1.4向9.1.3的PCR管中加入4μl配制好的打断反应液,涡旋震荡后短暂离心将反应液收集至管底。
9.1.5按照表11设置反应条件,即当PCR仪温度降至4℃时,立即将PCR管置于PCR仪上进行37℃反应。
表11
Figure PCTCN2022097740-appb-000010
9.1.6反应结束后,立即取出PCR管并置于冰上,向PCR管中加入30μl Stop Solution-v2,振荡混匀,终止反应。
9.1.7短暂离心将反应液收集至管底,并将PCR管置于冰上。
9.2打断产物的磁珠双选
9.2.1向PCR产物中加入30μl Cleanup Beads A,轻轻吹打至完全混匀,并于室温孵育5min。
9.2.2短暂离心后,将离心管置于磁力架上,静置3至5min至液体澄清,转移上清到新的PCR管中。
9.2.3向上一步PCR管的上清中加入20μl Cleanup Beads A,轻轻吹打至充分混匀,并于室温孵育5min。
9.2.4短暂离心后,将离心管置于磁力架上,静置3至5min至液体澄清,去除上清。
9.2.5保持离心管固定于磁力架上,加入200μl新鲜配制的80%乙醇,漂洗磁珠及管壁,静置30s,去除上清。
9.2.6重复上一步。
9.2.7保持离心管固定于磁力架上,打开管盖,于室温干燥磁珠。
9.2.8将离心管从磁力架上取下,加入42μl ddH 2O洗脱DNA,并于室温孵育5min。
9.2.9短暂离心后,将离心管置于磁力架上,静置3至5min至液体澄清,将40μl上清液转移到新的0.2ml PCR管中。
9.3末端修复
9.3.1按照表12在冰上配制末端修复反应液。
表12
Figure PCTCN2022097740-appb-000011
9.3.2吸取10μl配制好的末端修复反应液加入到步骤9.2.9中的新的PCR管中,涡旋振荡后短暂离心将反应液收集至管底。
9.3.3将PCR管置于PCR仪上,按照表13的条件进行反应。
表13
Figure PCTCN2022097740-appb-000012
9.3.4反应结束后,短暂离心将反应液收集至管底,并将PCR管置于冰上。
9.4接头连接
9.4.1按照表14所示在冰上配制接头连接反应液。
表14
Figure PCTCN2022097740-appb-000013
9.4.2吸取30μl配制好的接头连接反应液加入到步骤9.3.4的PCR管中,振荡混匀后短暂离心以将反应液收集到管底。
9.4.3将PCR管置于PCR仪上,按照表15中的条件进行反应。
表15
Figure PCTCN2022097740-appb-000014
9.4.4反应结束后,短暂离心将反应液收集至管底。
9.4.5向PCR管中加入20μl TE Buffer至总体积为100μl。
9.5连接产物纯化
9.5.1吸取50μl Cleanup Beads A-v2至步骤9.4.5中的接头连接产物中,轻轻吹打至完全混匀,于室温孵育10min。
9.5.2短暂离心后,将离心管置于磁力架上,静置2至5min至液体澄清,去除上清。
9.5.3保持离心管在磁力架上,加入200μl新鲜配制的80%乙醇,漂洗磁珠及管壁,静置30s,去掉上清。
9.5.4重复上一步。
9.5.5保持离心管在磁力架上,打开离心管管盖,于室温干燥磁珠。
9.5.6将离心管从磁力架上取下,加入48μl Nuclease-Free Water洗脱DNA,并于室温下孵育5min。
9.5.7短暂离心,将离心管置于磁力架上,静置2至5min至液体澄清,将46μl上清转移到新的0.2mL PCR管中。
9.6 PCR扩增
9.6.1在步骤9.5.7的PCR管中加入4μl iDrop Index Primer。
9.6.2再向PCR管中加入50μl AMP Ready Mix-v2,涡旋振荡后短暂离心将反应液收集至管底。
9.6.3将PCR管置于PCR仪上,按照表16中的条件进行反应。
表16
Figure PCTCN2022097740-appb-000015
9.7 PCR扩增产物片段筛选
9.7.1吸取60μl Cleanup Beads A-v2至PCR产物中,完全混匀,并于室温孵育10min。
9.7.2短暂离心后,将离心管置于磁力架上,静置2至5min至液体澄清,吸取上清并转移到新的PCR管中。
9.7.3吸取20μl Cleanup Beads A-v2加到所转移的上清中,吹打至完全混匀,并于室温孵育5min。
9.7.4短暂离心后,将离心管置于磁力架上,静置2至5min至液体澄清,去除上清。
9.7.5保持离心管在磁力架上,加入200μl新鲜配制的80%乙醇,漂洗磁珠及管壁,静置30s,去掉上清。
9.7.6重复上一步。
9.7.7保持离心管在磁力架上,打开离心管管盖,室温放置1min。
9.7.8将离心管从磁力架上取下,加入42μL TE Buffer,吹打至完全混匀,并于室温孵育5min。
9.7.9短暂离心,将离心管置于磁力架上,静置2至5min至液体澄清,将40μl上清转移到新的0.2mL PCR管中。
9.7.10取1μl片段筛选后的产物使用Qubit dsDNA HS Kit检测浓度,并另取1μl片段筛选后的产物使用Agilent DNA分析试剂盒检测片段分布。
质控(QC)标准:产物浓度大于3ng/μl,片段分布主峰在300至500bp之间。
9.8变性
9.8.1取0.75至1.5pmol PCR产物(针对cDNA,取300-400ng;针对oligo,取300-400ng)至新的0.2mL PCR管中,用TE Buffer补充至总体积45μl。
9.8.2加入5μl Split Oligo-v6到PCR管中,振荡混匀,短暂离心将反应液收集至管底。
9.8.3将PCR管置于PCR仪上,按照表17的条件进行反应。
表17
Figure PCTCN2022097740-appb-000016
9.8.4反应结束后,立即将PCR管置于冰上,静置5min。
9.9单链环化
9.9.1按照表18在冰上配制单链环化反应液。
表18
Figure PCTCN2022097740-appb-000017
9.9.2吸取10μl配制好的单链环化反应液加入到步骤9.8.4的PCR管中,振荡混匀后短暂离心将反应液收集至管底。
9.9.3将PCR管置于PCR仪上,按照表19的条件进行反应。
表19
Figure PCTCN2022097740-appb-000018
9.9.4反应结束后,将PCR管短暂离心并置于冰上,立即进入下步反应。
9.10酶切消化
9.10.1按照表20的配方在冰上配制酶切消化反应液。
表20
Figure PCTCN2022097740-appb-000019
9.10.2吸取4μl配制好的酶切消化反应液加入步骤9.9.4的PCR管中,振荡混匀,短暂离心将反应液收集至管底。
9.10.3将PCR管置于PCR仪上,按照表21的条件进行反应。
表21
Figure PCTCN2022097740-appb-000020
9.10.4反应结束后,立即加入3μl Stop solution-v2,振荡混匀并短暂离心将反应液收集 至管底。
9.11酶切消化产物纯化
9.11.1吸取90μl Cleanup Beads B至步骤9.10.4的酶切消化产物中,并轻轻吹打至完全混匀,并于室温孵育10min。
9.11.2短暂离心后将离心管置于磁力架上,静置2至5min至液体澄清,去掉上清。
9.11.3保持离心管在磁力架上,加入200μl新鲜配制的80%乙醇漂洗磁珠及管壁,静置30s,去掉上清。
9.11.4重复上一步。
9.11.5保持离心管在磁力架上,打开管盖,于室温干燥磁珠。
9.11.6将离心管从磁力架上取下,加入32μl TE Buffer,轻轻吹打至完全混匀,并于室温孵育10min。
9.11.7短暂离心,将离心管置于磁力架上,静置2至5min至液体澄清,将30μl上清转移到新的1.5mL离心管中。
9.11.8取1μl酶切消化产物使用
Figure PCTCN2022097740-appb-000021
ssDNA Assay Kit检测浓度。
质控(QC)标准:浓度大于0.5ng/μl。
10.上机测序
将检测合格的文库进行二代双端测序,左右读长(read1和read2)各为150bp。
11.数据处理
11.1得到的下机数据为双端Fastq压缩文件,其中,read1保留长为30bp的标签序列信息,具体结构为20bp的barcode(10bp barcode1+10bp barcode2)+10bp UMI,read2保留cDNA序列信息,具体结构为100bp cDNA片段。使用scRNA_parse软件对原始下机Fastq数据进行barcode矫正(匹配barcode白名单)、质量过滤(过滤平均质量值低于4的序列)、格式处理(将矫正过的barcode及UMI添加到read2 fastq文件ID行)。
11.2比对至参考基因组
11.2.1将处理好的单端fastq文件利用STAR(2.7.9a)比对至人鼠混合参考基因组,得到sam文件。
11.2.2利用PISA(v0.7)将sam文件转换为bam文件,并将reads ID中的bead barcode及UMI序列转移为bam文件的tag,分别记为CB及UR。
11.2.3使用PISA根据人鼠混合参考基因组对bam文件进行注释,并添加物种tag。
11.2.4将注释得到的bam文件利用PISA进行UMI的矫正(Hamming距离为1,矫正为丰度更高的UMI)。
11.3根据bam文件统计人和鼠每一个bead barcode对应的UMI及基因的个数。
11.4使用barcodeRanks根据11.3统计文件进行骤降截取,选取有效细胞。
11.5根据得到的有效细胞重新计算人和鼠的bead barcode对应的UMI及基因的个数。
11.6若一个细胞鼠的UMI数目占人和鼠UMI总和的比例大于99%,则判定该细胞为罕见细胞(signal);否则,该细胞为背景细胞(background),并利用R ggplot2包绘制散点图(参见图7至图9)。
图7A和图7B为目的细胞:背景细胞=1:100时,每个磁珠捕获小鼠转录本数占捕获转录本总数的比例,其中图7A为重复一、图7B为重复二。
图8A和图8B为目的细胞:背景细胞=1:1000时,每个磁珠捕获小鼠转录本数占捕获转录本总数的比例,其中图8A为重复一、图8B为重复二。
图9A和图9B为目的细胞:背景细胞=1:10000时,每个磁珠捕获小鼠转录本数占捕获转录本总数的比例,其中图9A为重复一、图9B为重复二。
可见,图7至图9具体展示了在设定比例阈值为5%的情况下,捕获有小鼠转录本的磁珠在人鼠细胞以不同比例混合条件下的分布。散点图纵坐标为每个磁珠捕获小鼠转录本数占捕获转录本总数的比例,横坐标为磁珠序号,当磁珠所捕获小鼠转录本数的比例大于5%时则认为该磁珠捕获有小鼠细胞。散点图中空心菱形图案代表目标细胞(NIH/3T3),实心圆形图案代表背景细胞(HEK293T)。散点图右上角为罕见细胞与背景细胞的个数。可从上述图7至图9所示的散点图观察到,本轮测试最高灵敏度达到了1/10000,即能够在10000个背景细胞中实现1个目标细胞的有效检出,证明了本实施例所述罕见细胞检测方法具有超高的灵敏度。
实施例2
本实施例以女性外周血单个核细胞(Peripheral Blood Mononuclear Cells,PBMC)作为背景细胞,以人乳腺癌细胞系MCF-7为目的细胞(即罕见细胞)为实验材料,使用基于超载(super-loading)策略检测罕见细胞的方法和平台,本次测试主要变量为磁珠投入量,目的细胞与背景细胞的比例为1:10000,每组设置2次重复实验,具体磁珠投入量、细胞数量和实验组别如表22所示。
表22
组别 PBMC MCF-7 磁珠投入量
1、2 50W 50 35W
3、4 50W 50 70W
5、6 50W 50 105W
7、8 50W 0 35W
9、10 0 2.2W 35W
实验流程参考实施例1
数据处理:
1.得到的下机数据为cDNA以及Oligo双端Fastq压缩文件,其中cDNA read1保留长为30bp的标签序列信息,具体结构为20bp的barcode(10bp barcode1+10bp barcode2)+10bp UMI,;read2保留cDNA序列信息,具体结构为100bp cDNA片段;Oligo文库read1保 留长20bp的barcode信息,具体结构为10bp barcode1+10bp barcode2;read2保留30bp UMI信息和Oligo磁珠专属barcode信息(即Index载体上的barcode信息),具体结构为10bp UMI+10bp barcode1+10bp barcode2。使用scRNA_parse软件对原始下机Fastq数据进行barcode矫正(匹配barcode白名单)、质量过滤(过滤平均质量值低于4的序列)、格式处理(将矫正过的barcode及UMI添加到read2fastq文件ID行)。
2.比对至参考基因组
2.1将处理好的单端fastq文件利用STAR(2.7.9a)比对至参考基因组,得到sam文件。
2.2利用PISA(v0.7)将sam文件转变为bam文件,并将reads ID中的cell barcode及UMI序列转移为bam文件的tag,分别记为CB及UR。
2.3将注释得到的bam文件利用PISA进行UMI的矫正(Hamming距离为1,矫正为丰度更高的UMI)。
2.4根据bam文件统计每一个cell barcode对应的UMI及基因的个数。
3.beads合并
3.1使用barcodeRanks根据2.4中统计文件进行骤降截取,选取有效beads。
3.2根据Oligo序列计算beads之间余弦值,过滤背景beads大于有效beads的余弦值,基于过滤后的beads进行合并,作为cell。
3.3统计cell和gene数值,生成矩阵。
4.细胞质控及聚类
4.1细胞-基因矩阵质控过滤,过滤条件包括,线粒体比例大于5%、基因数小于200且大于上四分位,利用DoubletFinder(version 2.0.3)根据双胞率5%去除双胞。
4.2进行均一化(NormalizeData)和标准化(ScaleData)。
4.3进行PCA降维,再选择前50个维度进行聚类和UMAP降维。
5.标志基因筛选
5.1图10为根据本实施例,PBMC(背景细胞)和MCF-7(乳腺癌细胞)的Seurat聚类图。由图10可见,将PBMC(背景细胞)和MCF-7(乳腺癌细胞)构建Seurat对象,MCF-7细胞能够独立成簇,且与PBMC细胞互不重叠。
图11为根据本申请实施例二,4个marker基因(FOLR1、KRT18、BASP1和C4BPB)在MCF-7细胞中特异表达图。本实施例中,根据现有的PBMC和MCF数据挑选4个marker基因。图11示出了4个基因在MCF-7细胞中的表达量,可见FOLR1、KRT18、BASP1和C4BPB在MCF细胞中具有特异性的高表达,因此,这4个基因能够作为MCF-7细胞的marker基因。
5.2测试样本根据挑选的4个marker基因统计数目,取4个基因的交集即为该样本的预测MCF-7的细胞数(见表23)。
表23
Figure PCTCN2022097740-appb-000022
表23示出了根据4个marker基因(FOLR1、KRT18、BASP1和C4BPB)预测MCF-7细胞的结果。由表23可见,组7作为阴性对照,在未投入MCF-7细胞(即目的细胞或罕见细胞)的情况下,在50W个背景细胞中显示无罕见细胞检出。组9作为阳性对照,在2.2W个MCF-7细胞的投入量下,本液滴微流控单细胞建库装置捕获到6659个mcf细胞,通过上述4个marker基因对这6659个MCF-7细胞分别进行筛选,并取交集(overlap)细胞,共获得6275个交集MCF-7细胞,占总检出细胞数的94.23%。可见,此4个marker基因能够有效作为MCF-7细胞的筛选标准,同时组7(阴性对照)未检出罕见细胞而组9(阳性对照)检出大量罕见细胞,证明本实施例所使用的检测罕见细胞的方法具有高的准确性。
此外,根据表23所示的结果,在磁珠投入量为35W、MCF-7细胞的投入比为0.01%的情况下(即组1),交集细胞数量为1;在磁珠投入量为70W、MCF-7细胞的投入比为0.01%的情况下(即组3),交集(overlap)细胞数量为2;在磁珠投入量为105W、MCF-7细胞的投入比为0.01%的情况下(即组5),交集(overlap)细胞数量为3,可见在组1、3和5的MCF-7细胞的投入量为50个的情况下,基于50W的背景细胞,本实施例所使用的检测罕见细胞的方法能够实现罕见细胞的有效检出。同时,这样的实验结果也证明,本实施例所使用的检测罕见细胞的方法在较高和较低的磁珠投入数量的情况下,均能够有效检出罕见细胞,并且检出率随磁珠投入数量的增加而增高。可见本申请实施例所提出的检测罕见细胞的方法能够有效检出罕见细胞且准确性高。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。

Claims (35)

  1. 一种检测生物样本中罕见细胞的方法,包括:
    提供来自生物样本的单细胞;
    提供磁珠,其中所述磁珠上连接有多条寡核苷酸序列,每条寡核苷酸序列包含barcode标签序列、唯一分子标识序列UMI和第一捕获序列;
    使多个所述单细胞与所述磁珠封闭在单个液滴中;
    基于所述单个液滴中由所述第一捕获序列捕获的单细胞核酸序列,构建DNA文库并进行测序及数据分析;和
    从所述单细胞核酸序列中筛选罕见细胞的特异性标志序列信息,并确定所述生物样本中是否存在所述罕见细胞。
  2. 根据权利要求1所述的方法,其中所述生物样本来自哺乳动物,任选地所述生物样品来自怀孕女性或患有或疑似患有疾病的受试者。
  3. 根据权利要求1或2所述的方法,其中所述生物样本为外周血、尿液、唾液或组织的至少一种。
  4. 根据权利要求1至3中任一项所述的方法,其中所述罕见细胞包括:胚胎细胞、干细胞、祖细胞、癌症干细胞和/或肿瘤细胞。
  5. 根据权利要求1至3中任一项所述的方法,其中所述罕见细胞包括循环肿瘤细胞和/或胎儿游离细胞,任选地,所述胎儿游离细胞为胎儿有核红细胞。
  6. 根据权利要求1至5中任一项所述的方法,其中单个磁珠上连接有10万至1000万、优选10万至100万条所述寡核苷酸序列,
    任选地,其中基于相同单个磁珠,所述多条寡核苷酸序列中的各个barcode标签序列相同,并且基于不同单个磁珠,所述barcode标签序列彼此不同,
    任选地,其中基于相同单个磁珠,所述多条寡核苷酸序列中的各个唯一分子标识序列UMI彼此不同。
  7. 根据权利要求1至6中任一项所述的方法,其中所述第一捕获序列选自poly(dT)和DNA捕获序列中的至少一种,优选地所述第一捕获序列是poly(dT),
    任选地,所述第一捕获序列位于所述磁珠上所述寡核苷酸序列的3’末端,
    任选地,每条所述寡核苷酸序列还包括接头序列和/或第二捕获序列。
  8. 根据权利要求1至7中任一项所述的方法,其中基于所述单个液滴中由所述第一捕获序列捕获的单细胞核酸序列构建DNA文库包括:
    裂解所述多个单细胞以获得单细胞核酸序列,其中所述单细胞核酸序列被所述第一捕获序列捕获;
    破坏所述液滴以释放连接有所述寡核苷酸序列和所述单细胞核酸序列的磁珠;
    基于所述单细胞核酸序列构建DNA文库。
  9. 根据权利要求8所述的方法,其中所述单细胞核酸序列为mRNA序列,其中所述基于所述单细胞核酸序列构建DNA文库进一步包括:
    将所述mRNA序列反转录为DNA序列后,构建所述DNA文库。
  10. 根据权利要求1至9中任一项所述的方法,其中所述单个液滴包含1-10、优选5-7个单细胞。
  11. 根据权利要求1至10中任一项所述的方法,其中所述每个液滴包含1-10个磁珠,优选包含1个磁珠。
  12. 根据权利要求1至11中任一项所述的方法,其中所述单个液滴中还包含Index载体,其中所述Index载体上连接有多条Index序列,所述Index序列识别所述单个液滴中的所述磁珠的所述寡核苷酸序列中的所述第二捕获序列,并被所述第二捕获序列捕获。
  13. 根据权利要求12所述的方法,其中所述Index载体上连接有至少10万条Index序列。
  14. 根据权利要求12或13所述的方法,其中所述液滴中含有5-15、优选8-10个Index载体。
  15. 根据权利要求1至14中任一项所述的方法,其中确定所述生物样本中是否存在所述罕见细胞,包括:
    基于单个液滴计算与比对到所述罕见细胞的特异性标志序列的单细胞核酸序列对应的唯一分子标识序列UMI的个数与所有唯一分子标识序列UMI的总数之间的比例;
    比较所述比例与设定比例阈值;
    当所述阳性比例大于所述设定比例阈值,确定所述生物样本中存在所述罕见细胞。
  16. 根据权利要求4所述的方法,其中所述设定比例阈值为1-10%、优选1%-5%。
  17. 一种检测生物样本中罕见细胞的设备,包括:
    液滴封闭装置,用于使多个单细胞与磁珠封闭在单个液滴中,其中所述多个单细胞来自所述生物样本,所述磁珠上连接有多条寡核苷酸序列,每条寡核苷酸序列包含barcode标签序列、唯一分子标识序列UMI和第一捕获序列;
    DNA文库构建装置,与所述液滴封闭装置相连,用于基于所述单个液滴中由所述第一捕获序列捕获的单细胞核酸序列构建DNA文库;
    测序装置,与DNA文库构建装置相连,用于对所述DNA文库进行测序;和
    分析装置,与所述测序装置相连,用于数据分析,和从所述单细胞核酸序列中筛选罕见细胞的特异性标志序列信息,并确定所述生物样本中是否存在所述罕见细胞。
  18. 根据权利要求17所述的装置,其中所述生物样本来自哺乳动物,任选地所述生物样品来自怀孕女性或患有或疑似患有疾病的受试者。
  19. 根据权利要求17或18所述的装置,其中所述生物样本为外周血、尿液、唾液或组织的至少一种。
  20. 根据权利要求17至19中任一项所述的装置,其中所述罕见细胞包括:胚胎细胞、干细胞、祖细胞、癌症干细胞和/或肿瘤细胞。
  21. 根据权利要求17至19中任一项所述的装置,其中所述罕见细胞包括循环肿瘤细胞和/或胎儿游离细胞,任选地,所述胎儿游离细胞为胎儿有核红细胞。
  22. 根据权利要求17至21中任一项所述的装置,其中单个磁珠上连接有10万至1000万、优选10万至100万条所述寡核苷酸序列,
    任选地,其中基于相同单个磁珠,所述多条寡核苷酸序列中的各个barcode标签序列相同,并且基于不同单个磁珠,所述barcode标签序列彼此不同,
    任选地,其中基于相同单个磁珠,所述多条寡核苷酸序列中的各个唯一分子标识序列UMI彼此不同。
  23. 根据权利要求17至22中任一项所述的装置,其中所述第一捕获序列选自poly(dT)和DNA捕获序列中的至少一种,优选地所述第一捕获序列是poly(dT),
    任选地,所述第一捕获序列位于所述磁珠上所述寡核苷酸序列的3’末端,
    任选地,每条所述寡核苷酸序列还包括接头序列和/或第二捕获序列。
  24. 根据权利要求17至23中任一项所述的装置,其中所述DNA文库构建装置还用于:
    裂解所述多个单细胞以获得单细胞核酸序列,其中所述单细胞核酸序列被所述第一捕获序列捕获;
    破坏所述液滴以释放连接有所述寡核苷酸序列和所述单细胞核酸序列的磁珠;
    基于所述单细胞核酸序列构建DNA文库。
  25. 根据权利要求24所述的装置,其中所述单细胞核酸序列为mRNA序列,其中所述DNA文库构建装置还用于:
    将所述mRNA序列反转录为DNA序列后,构建所述DNA文库。
  26. 根据权利要求17至25中任一项所述的装置,其中所述单个液滴包含1-10、优选5-7个单细胞。
  27. 根据权利要求17至26中任一项所述的装置,其中所述每个液滴包含1-10个磁珠,优选包含1个磁珠。
  28. 根据权利要求17至27中任一项所述的装置,其中所述单个液滴中还包含Index载体,其中所述Index载体上连接有多条Index序列,所述Index序列识别所述单个液滴中的 所述磁珠的所述寡核苷酸序列中的所述第二捕获序列,并被所述第二捕获序列捕获。
  29. 根据权利要求28所述的装置,其中所述Index载体上连接有至少10万条Index序列。
  30. 根据权利要求28或29所述的装置,其中所述液滴中含有5-15、优选8-10个Index载体。
  31. 根据权利要求17至30中任一项所述的装置,其中所述分析装置还用于:
    基于单个液滴,计算与比对到所述罕见细胞的特异性标志序列的单细胞核酸序列对应的唯一分子标识序列UMI的个数与所有唯一分子标识序列UMI的总数之间的比例;
    比较所述比例与设定比例阈值;
    当所述阳性比例大于所述设定比例阈值,确定所述生物样本中存在所述罕见细胞。
  32. 根据权利要求29所述的装置,其中所述设定比例阈值为1-10%、优选1%-5%。
  33. 一种诊断癌症的方法,包括:
    基于权利要求1至16中任一项所述的方法,确定来自受试者的生物样本中存在循环肿瘤细胞;
    分析所述循环肿瘤细胞的数量、疾病相关基因的表达情况和/或染色质开放区域的调控情况;和
    根据所述循环肿瘤细胞的数量及疾病相关基因的表达情况和/或染色质开放区域的调控情况,鉴定所述受试者是否存在患有相关疾病的风险、疾病的发展情况和/或疾病的预后进程。
  34. 一种非侵入性胎儿诊断方法,包括:
    基于权利要求1至15中任一项所述的方法,确定来自怀孕女性的生物样本存在胎儿游离细胞;和
    分析所述胎儿游离细胞的基因组或转录组信息,以确定胎儿的发育状况和/或是否患有遗传疾病。
  35. 根据权利要求34所述的方法,其中所述遗传疾病是染色体病、单基因遗传病或多基因遗传病。
PCT/CN2022/097740 2022-06-08 2022-06-08 检测罕见细胞的方法、装置及其应用 WO2023236121A1 (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
PCT/CN2022/097740 WO2023236121A1 (zh) 2022-06-08 2022-06-08 检测罕见细胞的方法、装置及其应用

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/CN2022/097740 WO2023236121A1 (zh) 2022-06-08 2022-06-08 检测罕见细胞的方法、装置及其应用

Publications (1)

Publication Number Publication Date
WO2023236121A1 true WO2023236121A1 (zh) 2023-12-14

Family

ID=89117398

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/CN2022/097740 WO2023236121A1 (zh) 2022-06-08 2022-06-08 检测罕见细胞的方法、装置及其应用

Country Status (1)

Country Link
WO (1) WO2023236121A1 (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017139690A1 (en) * 2016-02-11 2017-08-17 10X Genomics, Inc. Cell population analysis using single nucleotide polymorphisms from single cell transcriptomes
WO2018064640A1 (en) * 2016-10-01 2018-04-05 Berkeley Lights, Inc. Dna barcode compositions and methods of in situ identification in a microfluidic device
WO2018075693A1 (en) * 2016-10-19 2018-04-26 10X Genomics, Inc. Methods and systems for barcoding nucleic acid molecules from individual cells or cell populations
US20200002763A1 (en) * 2016-12-22 2020-01-02 10X Genomics, Inc. Methods and systems for processing polynucleotides
WO2020167830A1 (en) * 2019-02-12 2020-08-20 Becton, Dickinson And Company Determining expressions of transcript variants and polyadenylation sites
WO2022067494A1 (en) * 2020-09-29 2022-04-07 Singleron (Nanjing) Biotechnologies, Ltd. Method for detection of whole transcriptome in single cells

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017139690A1 (en) * 2016-02-11 2017-08-17 10X Genomics, Inc. Cell population analysis using single nucleotide polymorphisms from single cell transcriptomes
WO2018064640A1 (en) * 2016-10-01 2018-04-05 Berkeley Lights, Inc. Dna barcode compositions and methods of in situ identification in a microfluidic device
WO2018075693A1 (en) * 2016-10-19 2018-04-26 10X Genomics, Inc. Methods and systems for barcoding nucleic acid molecules from individual cells or cell populations
US20200002763A1 (en) * 2016-12-22 2020-01-02 10X Genomics, Inc. Methods and systems for processing polynucleotides
WO2020167830A1 (en) * 2019-02-12 2020-08-20 Becton, Dickinson And Company Determining expressions of transcript variants and polyadenylation sites
WO2022067494A1 (en) * 2020-09-29 2022-04-07 Singleron (Nanjing) Biotechnologies, Ltd. Method for detection of whole transcriptome in single cells

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
CHOI, J. R. ET AL.: "Single-Cell RNA Sequencing and Its Combination with Protein and DNA Analyses.", CELLS, vol. 9, no. 1130, 4 May 2020 (2020-05-04), XP055764574 *

Similar Documents

Publication Publication Date Title
Zhang et al. Comparative analysis of droplet-based ultra-high-throughput single-cell RNA-seq systems
AU2015289414B2 (en) Non-invasive prenatal diagnosis of fetal genetic condition using cellular DNA and cell free DNA
US20190338345A1 (en) Generating cell-free dna libraries directly from blood
JP7203128B2 (ja) 血液試料中の循環腫瘍細胞のデジタル分析
EP2714884B1 (en) Microfluidic cell trap and assay apparatus for high-throughput analysis
US20210024996A1 (en) Method for verifying bioassay samples
US20080090239A1 (en) Rare cell analysis using sample splitting and dna tags
US20080026390A1 (en) Diagnosis of Fetal Abnormalities by Comparative Genomic Hybridization Analysis
JP2018524993A (ja) 染色体異常を検出するための核酸及び方法
CN106536735B (zh) 分析dna样品的探针集合和使用所述探针集合的方法
US20220025443A1 (en) Methods for screening biological samples for contamination
US20230049664A1 (en) Droplet microfluidics-based single cell sequencing and applications
WO2023284768A1 (zh) 融合引物直扩法人类线粒体全基因组高通量测序试剂盒
CN108611408A (zh) 检测胎儿染色体非整倍性的方法和装置
CN106282361B (zh) 用于捕获血液病相关基因的基因捕获试剂盒
WO2023236121A1 (zh) 检测罕见细胞的方法、装置及其应用
CN114875118B (zh) 确定细胞谱系的方法、试剂盒和装置
CN111850114A (zh) 一组用于评估弥漫大b细胞淋巴瘤分子分型的基因群,其试剂盒及分析方法
EP3192879A1 (en) Method for detecting presence/absence of fetal chromosomal aneuploidy
WO2023186110A1 (zh) 一种富集孕妇血浆中胎儿dna的方法和试剂盒
CN115992243B (zh) 一种检测卵巢癌的引物组合、试剂盒及文库构建方法
EP4347870A1 (en) Methods and systems for determining cell-cell interaction
EP3202912A1 (en) Noninvasive method and system for determining fetal chromosomal aneuploidy
CN117821562A (zh) 一种富集短片段dna文库的方法及其应用
WO2023154732A1 (en) Method of performing multi-modal single-cell and whole- genome sequencing from frozen tissue

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 22945266

Country of ref document: EP

Kind code of ref document: A1