WO2021131110A1 - 細胞階層化処理により特定の生物学的特徴を有する細胞を同定する方法およびその応用方法 - Google Patents

細胞階層化処理により特定の生物学的特徴を有する細胞を同定する方法およびその応用方法 Download PDF

Info

Publication number
WO2021131110A1
WO2021131110A1 PCT/JP2020/025915 JP2020025915W WO2021131110A1 WO 2021131110 A1 WO2021131110 A1 WO 2021131110A1 JP 2020025915 W JP2020025915 W JP 2020025915W WO 2021131110 A1 WO2021131110 A1 WO 2021131110A1
Authority
WO
WIPO (PCT)
Prior art keywords
cell
space structure
cells
arrangement space
fraction
Prior art date
Application number
PCT/JP2020/025915
Other languages
English (en)
French (fr)
Inventor
正憲 宮西
正和 中島
功 宮塚
マイ アン リー
Original Assignee
ネクスジェン株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ネクスジェン株式会社 filed Critical ネクスジェン株式会社
Priority to US17/789,279 priority Critical patent/US20230039070A1/en
Priority to JP2021566786A priority patent/JPWO2021131110A1/ja
Priority to US18/014,112 priority patent/US20230279354A1/en
Priority to PCT/JP2021/025050 priority patent/WO2022004864A1/ja
Priority to CN202180053451.XA priority patent/CN116075311A/zh
Priority to KR1020237001669A priority patent/KR20230034299A/ko
Priority to JP2021542548A priority patent/JP7215776B2/ja
Priority to EP21834496.8A priority patent/EP4177337A1/en
Publication of WO2021131110A1 publication Critical patent/WO2021131110A1/ja
Priority to JP2022040623A priority patent/JP2022179822A/ja

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12MAPPARATUS FOR ENZYMOLOGY OR MICROBIOLOGY; APPARATUS FOR CULTURING MICROORGANISMS FOR PRODUCING BIOMASS, FOR GROWING CELLS OR FOR OBTAINING FERMENTATION OR METABOLIC PRODUCTS, i.e. BIOREACTORS OR FERMENTERS
    • C12M1/00Apparatus for enzymology or microbiology
    • C12M1/34Measuring or testing with condition measuring or sensing means, e.g. colony counters
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/483Physical analysis of biological material
    • G01N33/487Physical analysis of biological material of liquid biological material
    • G01N33/49Blood
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12MAPPARATUS FOR ENZYMOLOGY OR MICROBIOLOGY; APPARATUS FOR CULTURING MICROORGANISMS FOR PRODUCING BIOMASS, FOR GROWING CELLS OR FOR OBTAINING FERMENTATION OR METABOLIC PRODUCTS, i.e. BIOREACTORS OR FERMENTERS
    • C12M41/00Means for regulation, monitoring, measurement or control, e.g. flow regulation
    • C12M41/46Means for regulation, monitoring, measurement or control, e.g. flow regulation of cellular or enzymatic activity or functionality, e.g. cell viability
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12MAPPARATUS FOR ENZYMOLOGY OR MICROBIOLOGY; APPARATUS FOR CULTURING MICROORGANISMS FOR PRODUCING BIOMASS, FOR GROWING CELLS OR FOR OBTAINING FERMENTATION OR METABOLIC PRODUCTS, i.e. BIOREACTORS OR FERMENTERS
    • C12M41/00Means for regulation, monitoring, measurement or control, e.g. flow regulation
    • C12M41/48Automatic or computerized control
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/02Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving viable microorganisms
    • C12Q1/04Determining presence or kind of microorganism; Use of selective media for testing antibiotics or bacteriocides; Compositions containing a chemical indicator therefor
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B99/00Subject matter not provided for in other groups of this subclass

Definitions

  • the present invention utilizes a method for identifying cells (groups) including cell stratification treatment using quantitative physical property data, a method for separating cells (groups) using cell stratification treatment, and a cell stratification treatment.
  • Cells in the living body basically have the same gene set, and although they are produced by the division of a single cell called a fertilized egg cell, their biological functions are variously different. Cells are distinguished from other cells as cells or groups of cells with certain biological properties based on their unique biological function. For example, cells found in each tissue in the body, such as bone marrow and muscle, differ in both morphology and biological function. Stem cells, such as hematopoietic stem cells (HSCs), are known to have the biological functions of self-renewal and pluripotency.
  • HSCs hematopoietic stem cells
  • Non-Patent Document 1 It is known that among stem cells having self-renewal ability and pluripotency, there are cells that maintain the biological functions that characterize these stem cells for a long period of time and stem cells that lose their functions in a relatively short period of time.
  • various cells in the living body have various characteristics such as the expression level of each gene, the intracellular content of the protein expressed from each gene, the type of protein exposed on the cell surface, the state of post-translational modification of the protein, and the cell morphology. It has a unique state in various physical properties, and it is possible to identify cells having a certain biological function by combining these physical properties.
  • a fluorescently labeled monoclonal antibody that recognizes a molecule such as a protein expressed on the surface of each cell and an antibody bound to the cell are used.
  • a method using a flow cytometer that can separate cells according to the combination of fluorescent labels has been mainly used.
  • various cells in the living body including hematopoietic cells, basically have the same set of genetic information with some exceptions, the expression level of each gene, the intracellular content of proteins expressed from each gene, and the cell surface. It has unique states in various physical properties such as the type of protein exposed to the protein, the state of post-translational modification of the protein, and cell morphology. Based on the data quantifying these physical characteristics, the present inventors have found that it is possible to stratify cell populations according to the differentiation hierarchy, and utilize a high-precision classification ability model that performs the stratification. To provide a method for analyzing, identifying, or separating cells located in a specific hierarchy of the cell differentiation hierarchy, and a system using the same.
  • the present invention utilizes the similarity of quantitative physical property data of each cell in a sample to stratify each cell or cell fraction, and a cell fraction arrangement spatial structure similar to a cell differentiation lineage. Alternatively, it comprises a step of obtaining a cell arrangement space structure and a step of identifying one or more regions in the cell fraction arrangement space structure or the cell arrangement space structure by using the biological property data of each cell. Provided is a method for identifying cells having specific biological properties.
  • the present invention utilizes the similarity of quantitative physical property data of each cell in a sample to stratify each cell or cell fraction to obtain a cell fraction similar to a cell differentiation lineage. Acquire the step of identifying the region where cells having specific biological characteristics are located in the arrangement space structure or cell arrangement space structure, and the gating parameter structure for separating cells having specific biological characteristics. Provided is a method for isolating cells using quantitative physical property data including steps.
  • the present invention utilizes biological property data of each cell in a cell fraction arrangement space structure or a cell arrangement space structure similar to a cell differentiation line obtained by layering each cell or cell fraction in one embodiment.
  • a method of identifying a candidate marker set for identifying cells having a particular biological property which comprises the step of identifying one or more regions.
  • the present invention utilizes the similarity of quantitative physical property data of each cell in a sample to stratify each cell or cell fraction to obtain a cell fraction similar to a cell differentiation lineage.
  • the step of identifying one or more regions using the biological property data of each cell, and culturing the cell population under the condition that the identified cells are enriched.
  • a method for culturing cells including a step is provided.
  • a cell fraction similar to a cell differentiation line obtained by stratifying each cell or cell fraction by utilizing the similarity of quantitative physical characteristic data of each cell in a reference sample.
  • a method for evaluating the content of cells having a specific biological property in a test sample which comprises a step of comparing the fractionated space structure or the cell arrangement space structure.
  • a cell fraction similar to a cell differentiation line obtained by stratifying each cell or cell fraction by utilizing the similarity of quantitative physical characteristic data of each cell in a reference sample.
  • a method for evaluating the state of differentiation of cells in a test sample which comprises a step of comparing the arrangement space structure or the cell arrangement space structure.
  • a cell fraction similar to a cell differentiation line obtained by stratifying each cell or cell fraction by utilizing the similarity of quantitative physical characteristic data of each cell in a reference sample.
  • Cell differentiation lineage obtained by layering each cell or cell fraction using the similarity between the arrangement space structure or cell arrangement space structure and the quantitative physical property data of each cell under multiple conditions in the test sample.
  • a method for evaluating the differentiation direction of cells in a test sample which comprises a step of comparing a cell fraction arrangement space structure or a cell arrangement space structure similar to the above.
  • a cell fraction similar to a cell differentiation line obtained by stratifying each cell or cell fraction by utilizing the similarity of quantitative physical characteristic data of each cell in a reference sample. It was obtained by layering each cell or cell fraction using the similarity between the arrangement space structure or cell arrangement space structure and the quantitative physical property data of each cell at each time point before and after culturing the test sample.
  • a method for evaluating a culture method which comprises a step of comparing a cell fractionation space structure or a cell arrangement space structure similar to a cell differentiation lineage.
  • the present invention utilizes the similarity of quantitative physical property data of each cell in a sample to stratify each cell or cell fraction, and a cell fraction arrangement spatial structure similar to a cell differentiation lineage.
  • a step of obtaining a cell arrangement space structure, and a step of identifying one or more regions in the cell fraction arrangement space structure or the cell arrangement space structure by using the biological property data of each cell and the above-mentioned step.
  • a program that causes a computer to perform a step of identifying the position of a cell having a specific biological property in a cell fractionation space structure or a cell placement space structure.
  • a cell image similar to a cell differentiation lineage obtained by layering each cell or cell fraction by utilizing the similarity of quantitative physical characteristic data of each cell in a sample is provided.
  • a computer that visualizes biological property data obtained by testing a cell whose position in the cell fractionation space structure or cell arrangement space structure is specified in the cell arrangement space structure or cell arrangement space structure. Provide a program to be executed by.
  • Input unit for inputting quantitative physical data and biological characteristic data for each cell; (2) A processing unit that generates a cell fractionation space structure or a cell arrangement space structure similar to a cell differentiation lineage by layering processing; and (3) An output unit that outputs a cell fractionation arrangement space structure or a cell arrangement space structure. ; Provide a system including a computer having.
  • Input unit for inputting quantitative physical data and biological characteristic data for each cell; (2) A processing unit that generates a cell fractional arrangement spatial structure or a cell arrangement spatial structure similar to a cell differentiation lineage by stratification processing; and (3) A combination of physical characteristics of cells having specific biological characteristics.
  • Output unit to output; Provide a system including a computer having.
  • the technique of the present invention uses quantitative physical characteristic data acquired from a cell population at a specific time point in a cell population that changes along a time series to arrange (layer) the cell population at that time. It is possible to reproduce changes along the series.
  • the biological function of the stratified cells can be further confirmed by experiments, and the data on the obtained biological function can be confirmed.
  • quantitative physical property data By combining with quantitative physical property data, more detailed analysis can be performed quickly.
  • tissue stem cells and cancer stem cells for example, in a period of several thousandths of a period and cost as compared with the conventional method.
  • perform current / future profiling health, disease state, etc.
  • each individual individual
  • provide an individual treatment method can provide useful information to.
  • by investigating the relationship between the identification of the cellular state of the individual and the medication history and / or the dietary content it is possible to support the screening of the personalized therapeutic agent and / or the medication and dietary individualization guidance. ..
  • the differentiation of the purified cells is performed. It becomes possible to evaluate the style. Furthermore, by clarifying the relationship between the culture conditions when the purified cells are cultured for a certain period of time and the evaluation of the differentiation mode, the optimum culture condition screening for enriching specific differentiated cells from the purified cells can be performed. Can help.
  • FIG. 1 is a schematic diagram showing a cell differentiation lineage of cells in a living tissue.
  • FIG. 2 is a schematic diagram showing the similarity between the cell differentiation lineage in a living tissue and the cell fraction arrangement space structure or the cell arrangement space structure generated by the high-precision classification ability model of the present invention.
  • FIG. 3 is a schematic diagram showing an example in which biological characteristic data is applied to the cell fraction arrangement space structure or the cell arrangement space structure generated by the high-precision classification ability model of the present invention.
  • FIG. 4 is a schematic diagram showing an example in which biological characteristic data is applied to the cell fraction arrangement space structure or the cell arrangement space structure generated by the high-precision classification ability model of the present invention.
  • FIG. 5 is a schematic diagram showing one aspect of a system having the high-precision classification ability model of the present invention.
  • FIG. 6 is a schematic diagram showing one aspect of the processing content included in the high-precision classification ability model of the present invention.
  • FIG. 7 is a schematic diagram showing another aspect of the processing content included in the high-precision classification ability model of the present invention.
  • FIG. 8 is a diagram showing an aspect of a system having a high-precision classification ability model of the present invention.
  • FIG. 9 is a schematic diagram showing an image displayed on the display unit of the interface in one aspect of the system having the high-precision classification ability model of the present invention.
  • FIG. 10 is a schematic diagram showing another aspect of the system having the high-precision classification ability model of the present invention.
  • FIG. 11A is a diagram showing an example of the cell arrangement spatial structure of cells contained in human umbilical cord blood obtained by the cell stratification method of the present invention.
  • FIG. 11B is a diagram showing the expression level of CD34 in the cell arrangement spatial structure of cells contained in human umbilical cord blood obtained by the cell stratification method of the present invention.
  • FIG. 11A is a diagram showing an example of the cell arrangement spatial structure of cells contained in human umbilical cord blood obtained by the cell stratification method of the present invention.
  • FIG. 11B is a diagram showing the expression level of CD34 in the cell arrangement spatial structure of cells contained in human umbilical cord blood obtained by the cell stratification method of the present invention.
  • FIG. 12A is a diagram showing an example of the cell arrangement spatial structure of a biopsy sample of a head and neck squamous epithelial cancer patient obtained by the cell stratification method of the present invention.
  • FIG. 12B is a diagram showing the expression level of P-MET in the cell arrangement spatial structure of a biopsy sample of a head and neck squamous epithelial cancer patient obtained by the cell stratification method of the present invention.
  • FIG. 12C shows the prediction of cells confirmed to be cancer cells in the cell arrangement spatial structure of the biopsy sample of a head and neck squamous cell carcinoma patient obtained by the cell stratification method of the present invention. It is a figure which shows the distribution.
  • FIG. 12A is a diagram showing an example of the cell arrangement spatial structure of a biopsy sample of a head and neck squamous epithelial cancer patient obtained by the cell stratification method of the present invention.
  • FIG. 12B is a diagram showing the expression level of P-MET in the cell arrangement spatial structure of a biopsy sample of
  • FIG. 12D is a diagram showing the expression level of ACTA2 in the cell arrangement spatial structure of a biopsy sample of a head and neck squamous epithelial cancer patient obtained by the cell stratification method of the present invention.
  • FIG. 12E shows the cells confirmed by biological findings as myofibroblasts in the cell arrangement spatial structure of the biopsy sample of the head and neck squamous epithelial cancer patient obtained by the cell stratification method of the present invention. It is a figure which shows the distribution.
  • differentiation means the process by which cells with a low degree of specialization are transformed into more specialized cells such as nerve cells or muscle cells.
  • “Differentiated” or “differentiated” is a relative term, and “differentiated cells” or “differentiated cells” go further in the developmental pathway than the cells with which they are being compared, and more. It means that it is specialized.
  • stem cell means an undifferentiated cell capable of self-renewal at the single cell level and capable of producing two or more different differentiated cells. That is, stem cells can divide asymmetrically, with one daughter cell retaining the stem cell state and the other daughter cell expressing some distinct other specific biological function and phenotype. Alternatively, stem cells can divide symmetrically into two stem cells, thus maintaining some stem cells in a cell population having stem cells, while other cells in the population are differentiated progeny. Give rise to only.
  • stem cell may include pluripotent stem cells, tissue stem cells, etc., where “pluripotent” means the ability to differentiate into a plurality of but a limited number of lineages of cells. ..
  • tissue stem cells include, for example, ectoderm lineage stem cells, mesoderm lineage stem cells and endoderm lineage stem cells. Whether or not the obtained cells are various stem cells can be examined by the presence or absence of expression of a specific marker gene or the like.
  • the “stem cell” also includes the "cancer stem cell” described later.
  • cancer stem cells there are cells in cancer tissues that have self-renewal ability and ability to generate cells of various genealogy that compose tumors (pluripotency), and such cells are “cancer stem cells”. "It is called. "Cancer stem cells” are sometimes referred to as “tumor progenitor cells” or “tumorogenic cells / carcinogenic cells”. It is understood that there are differentiation lines with cancer stem cells as the most upstream in cancer tissues as well as in normal tissues. Therefore, in the present specification, the cells identified by using the quantitative physical characteristic data also include cells in cancer tissues such as “cancer stem cells”.
  • hematopoietic stem cell means a cell that has a lifelong pluripotency capable of ultimately differentiating into all blood cells (erythrocytes, leukocytes, platelets, etc.). Hematopoietic stem cells can include intermediate stages of differentiation into progenitor or blast cells. "Progenitor cells” or “blasts” are used interchangeably in the present invention and have reduced potency, but are still capable of maturing into cells of a particular lineage (eg, bone marrow or lymphatic lineage). It means a certain, maturing cell.
  • a particular lineage eg, bone marrow or lymphatic lineage
  • hematopoietic stem cells markers Lin -, c-Kit +, Sca-1 +, CD150 +, CD34 - / low, Flk2 - or, the marker Lin -, CD48 -, CD41 - , identified by CD150 +, etc. Can be done (Cell, 2005, Vol. 121, pp. 1109-1121).
  • long-term hematopoietic stem cell means a hematopoietic stem cell that maintains self-renewal ability for a long period of time even after cell division, and at least one of the two daughter cells produced by cell division is a pre-division cell. Maintains similar hematopoietic stem cell traits.
  • long-term hematopoietic stem cells do not lose any self-renewal ability due to cell division in a normal in vivo or in vitro culture environment.
  • long-term hematopoietic stem cells maintain their self-renewal ability even after undergoing 100, 50, 20 or 10 cell divisions.
  • the self-replicating ability is maintained.
  • the self-renewal ability is maintained by measuring the content of the undifferentiated cell population contained in the cell group after culturing for a certain period of time.
  • the undifferentiated cell population can be identified by a combination of positive and negative markers of known markers such as c-Kit, Sca-1, and CD11b.
  • it can be confirmed by a known subculture method that hematopoietic stem cells maintain their self-renewal ability for a long period of time even after undergoing cell division.
  • isolated cell means a cell extracted from an organism in which it is originally found or a progeny of such a cell. Such cells may be cultured in vitro, eg, in the presence of other cells. In addition, such cells or cells that are descendants thereof may be later introduced into a second organism.
  • the term "isolated cell population” means a population of cells taken out and isolated from a heterogeneous cell population.
  • the isolated population may be a substantially pure cell population compared to the heterogeneous cell population from which the cells were isolated or concentrated, and is still heterogeneous. It may be a cell population.
  • a cell population that is "substantially pure" for a particular cell type is defined as at least about 50%, more preferably at least about 60%, 65%, of the cells that make up the entire cell population. 70%, 75%, 85%, 90%, 92%, 93%, most preferably at least about 95%, 96%, 97%, 98%, 99% of cells are composed of cells of the particular cell type. It means that it has been done.
  • a "substantially pure" stem cell population is less than about 50%, more preferably about 40%, 30%, 20%, 15%, 10%, 8%, less than 7% of non-stem cell cells, most. It preferably means a population of cells containing about 5%, 4%, 3%, 2% or less than 1%.
  • identification refers to a specific target such as an organism, cell, substance or data having a specific property of interest. It means selecting from a group including a large number by operation / evaluation method. Selected targets may or may not be physically separated from the population.
  • clustering or simply “clustering” generally means data processing that divides a set to be classified into subsets such that internal coupling and external separation are achieved (B).
  • Non-hierarchical clustering means data processing that defines an evaluation function for the goodness of division and searches for division that optimizes the evaluation function.
  • Non-hierarchical clustering is not particularly limited and can be performed using a method known to those skilled in the art.
  • the non-hierarchical clustering of the present invention can be performed by using a k-means method, a mixed Gaussian model (Gaussian Mixture Model, GMM), or the like, but is not limited thereto.
  • Hierarchical clustering means data processing that obtains the final classification result by treating each target as one separate cluster and sequentially integrating clusters with high similarity based on a certain standard.
  • the processing result is expressed as a dendrogram (tree diagram) or the like that connects all the processing targets.
  • Hierarchical clustering analysis is not particularly limited and can be performed using a method known to those skilled in the art.
  • the hierarchical clustering of the present invention can be performed using, but is not limited to, the group averaging method, Ward's method, UPGMA, shortest distance method, single connection method, longest distance method, complete connection method, and the like.
  • quantitative physical property data refers to the mRNA expression level of each gene measured for various cells in the living body, the intracellular content of the protein expressed from each gene, and the exposure to the cell surface. It means quantitative data of various physical properties such as protein type, protein post-translational modification state, and cell morphology. Cells with unique biological functions can be identified by a combination of these quantitative physical property data. These physical properties can be quantified based on a certain standard by various known methods, and are obtained by using, for example, a device such as a flow cytometer, a next-generation sequencer (NGS), or a method such as imaging. It can, but is not limited to these. In one aspect, quantitative physical characteristic data may be obtained by indicating a boolean value indicating the presence or absence of physical characteristics as a pseudo value.
  • layering of a cell or a cell fraction means each cell cluster (fraction) by performing a clustering process using the similarity of quantitative physical characteristic data and the similarity of the processing target. ) And / or between each cell, the similarity of the quantitative physical property data set is used to define the positional relationship between each other, and the cell fractional arrangement spatial structure and / or the cell arrangement spatial structure including these positional relationships are defined. Is obtained.
  • machine learning means finding a pattern hidden in data (learning data) in a certain situation by a computer according to the usual understanding of those skilled in the art. Further, in a certain aspect, it means a method of constructing a classifier for discriminating data by learning previously acquired data and thereby discriminating and interpreting newly acquired data.
  • the trained classifier is sometimes referred to as a "trained model”.
  • the method of performing machine learning can be selected from, but is not limited to, artificial neural network learning, decision tree learning, support vector machine learning, Bayesian network learning, clustering, and regression analysis, AdaBoost, and the like.
  • the "flow cytometer” is generally composed of three systems, a flow path system, an optical system, and an electrical system, and means a known technique for detecting scattered light and fluorescence in individual cells.
  • Information such as the relative size and internal structure of cells can be obtained from the detected scattered light, and information such as the amount of various antigens and nucleic acids present in the cell membrane, cytoplasm, and nucleus can be obtained from the fluorescent signal.
  • the scattered light is further classified into two types, forward scattered light (FSC: Forward Scattered Light) and side scattered light (SSC: Side Scattered Light), depending on the scattering direction.
  • FSC Forward Scattered Light
  • SSC Side Scattered Light
  • FSC is the light detected in front of the optical axis of the laser beam among the scattered light, and its intensity is substantially proportional to the surface area or size of the cell.
  • SSC is light detected at an angle of 90 ° with respect to the optical axis of the laser beam. Most of SSCs are scattered by light shining on substances inside cells, and are almost proportional to the granular properties and internal structure of cells.
  • a photodiode is used as the FSC signal detector
  • a highly sensitive photomultiplier tube is used as the SSC and fluorescence signal detector.
  • Each detector detects an optical signal generated when a cell crosses a laser beam and generates a voltage pulse proportional to its intensity, thereby generating a voltage pulse (Height: H) and an area (Area) of the voltage pulse. : A), width (Wids: W) values are recorded. These values for FSC and SSC are commonly expressed as FSC-H, FSC-A, FSC-W, SSC-H, SSC-A, SSC-W and the like.
  • a flow cytometer can detect fluorescence in a plurality of wavelength regions at the same time. For example, by labeling a plurality of cell surface molecules with a plurality of types of fluorescent labels having different emission wavelength regions, each cell can be detected. The amount of these cell surface molecules in can be quantified at the same time. Analysis using "flow cytometer" technology is called “flow cytometry”.
  • Cell stratification using quantitative physical property data Various cells in the living body have various physics such as the expression level of each gene, the intracellular content of the protein expressed from each gene, the type of protein exposed on the cell surface, the state of post-translational modification of the protein, and the cell morphology. It has a unique state in terms of physical properties, and it is possible to identify cells with unique biological functions by combining these physical properties. These physical properties can be quantified based on certain criteria by various known methods, and therefore, various cells having a certain biological function can be identified by a combination of the quantitative physical property data. can do.
  • cell differentiation has a hierarchy (Fig. 1), and it is understood that cells more closely related in the cell differentiation hierarchy are more similar in their quantitative physical property data.
  • quantitative physical characteristic data can be obtained between each cell cluster (fraction) and / or each cell.
  • the positional relationship between the sets is defined by using the similarity of the set, and the cell fraction arrangement spatial structure and / or the cell arrangement spatial structure including these positional relationships can be obtained.
  • the cell fractionation space structure or the cell placement space structure obtained by the above clustering treatment has a structure similar to that of a cell differentiation phylogenetic tree (Fig. 2).
  • a cell fractionation space structure or a cell placement space structure can be obtained by cell stratification using physical property data.
  • the cell stratification uses the similarity of the quantitative physical characteristic data set to identify the positional relationship for each cell or cell fraction by clustering processing using the similarity of each quantitative physical characteristic data.
  • the cell fraction arrangement space structure or the cell arrangement space structure can be obtained as a set of the positional relationships.
  • the cell fractionation space structure or cell placement space structure is provided as a data structure that accumulates data representing positional relationships utilizing the similarity of quantitative physical property data sets between cells.
  • cell fractions and / or cells having similar quantitative physical property data sets occupy close positions.
  • a cell population obtained from a certain amount of living tissue includes cell groups belonging to various positions on the differentiation lineage, and by targeting such cell groups as a processing target, a cell image located close to the differentiation lineage.
  • the minutes and / or cells occupy close positions in the cell fractionation space structure and / or the cell placement space structure obtained by the above clustering treatment. Therefore, the cell fraction arrangement space structure or the cell arrangement space structure obtained by the above clustering treatment has a structure similar to the cell differentiation phylogenetic tree.
  • the cell fraction arrangement space structure or the cell arrangement space structure can be expressed as a structure having an arbitrary number of dimensions depending on the purpose.
  • the dimensional axis is typically represented as a composite axis of one or more physical properties.
  • the cell stratification process of the present invention can be performed by combining the quantitative physical property data and the biological property data acquired by an experiment or the like. Since cells that are close to each other in a cell differentiation lineage have similar biological characteristics to each other, by combining quantitative physical property data and biological property data, a cell fraction arrangement spatial structure or cell that is more similar to the cell differentiation lineage It is possible to obtain an arrangement space structure.
  • the above cell fraction is given by adding biological characteristic data reflecting the biological function of each cell. It is possible to identify the position of a cell group having a specific biological property in the arrangement space structure or the cell arrangement space structure (Fig. 3).
  • a marker known to be specifically expressed in long-term hematopoietic stem cells which are cells in a more undifferentiated state, in a cell fractional arrangement space structure or a cell arrangement space structure composed of a blood cell lineage cell group, for example, CD34.
  • the cell fraction is identified by identifying the position of a cell belonging to a distant position on the differentiation lineage by using the biological characteristic data of each cell.
  • the arrangement space structure or cell arrangement space structure and the cell differentiation phylogenetic tree for example, cells having more undifferentiated characteristics on the cell differentiation lineage tree in the cell fraction arrangement space structure or cell arrangement space structure.
  • it becomes possible to identify the region where cells having more differentiated characteristics are located Fig. 4).
  • markers related to differentiation diversity, functional test data, markers related to self-renewal ability, functional test data, etc. can be used, and a plurality of these can be used in combination.
  • the cell fraction arrangement spatial structure or cell arrangement is specified by specifying the position of the cell expressing the marker of long-term hematopoietic stem cells and the position of the cell expressing the marker of short-term hematopoietic stem cells.
  • the spatial structure it is possible to identify a region where a cell group having characteristics characteristic of long-term stem cells is located or a region where a cell group having characteristics characteristic of more differentiated cells is located.
  • long-term hematopoietic stem cell candidate cells or long-term hematopoietic stem cells can be identified by specifying the region located upstream of the differentiation lineage.
  • Long-term hematopoietic stem cells are considered to be a cell population containing diversity including cells that are slightly different in various physiological characteristics such as self-renewal ability maintenance characteristics and proliferation characteristics.
  • subpopulations having particularly similar quantitative physical properties can be identified among the cell populations contained in these long-term hematopoietic stem cells.
  • the biological property data among the properties used for the quantitative physical property data, those known to be related to a specific biological property can be used, and an isolated cell group can be used.
  • the experimental results obtained by biologically testing the cells can be used.
  • the test may be an in vitro or in vivo test, and the structure of the biological property data is not particularly limited, and may be a scalar value or a boolean value.
  • the cell fractionation space structure of the present invention or the method of combining the cell arrangement space structure with biological data has certain biological properties for which a marker to be identified has not been known so far.
  • Cell groups can be identified as a combination of quantitative physical property data.
  • by specifying them as a combination of quantitative physical characteristic data it is possible to provide markers with higher specificity, and there are known markers.
  • the cell population can be segregated into subpopulations utilizing biological properties.
  • the clustering process of the present invention is a quantitative physical characteristic data obtained by performing (1) downsampling process, (2) data normalization process and / or (3) dimension reduction process. It includes a step of performing (4) data clustering processing for a characteristic data set.
  • (1) downsampling step the number of data to be subjected to the clustering process is reduced by utilizing the quantitative physical characteristic data of the analysis target, the distribution of cells, and the like.
  • Known methods such as Density Sample, SPADE, and Decimate can be applied to the process, but the process is not limited thereto.
  • a known method is used to normalize the quantitative physical characteristic data, perform unit conversion, and the like.
  • the dimension of the quantitative physical characteristic data is reduced by using a known method.
  • known methods such as PCA, MDS, T-SNE, UMAP, PHATE, Modified Locally Linear Embedding can be applied, but are not limited thereto.
  • the quantitative physical property data of the target cell is not particularly limited, and various data obtained by a known method can be used. For example, it is possible to obtain quantitative data on the intracellular content of mRNA or protein expressed from each gene, the type of protein exposed on the cell surface, the state of post-translational modification of the protein, and physical properties such as cell morphology. It is possible and these can be used as quantitative physical property data. In certain embodiments, flow cytometers can be used for these quantitative physical property data, and various antibodies and reporter proteins can also be used. In addition, data obtained by comprehensively quantifying the mRNA expressed by each cell using a next-generation sequencer (NGS) may be used.
  • NGS next-generation sequencer
  • Any number of quantitative physical property data can be used, for example 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17 , 18, 19, 20, 25, 30, 40, 50, 60, 70, 80.90, 100, 150, 200, 250, 300, 350, 400, 450, 500, 600, 700, 800, 900, 1000 , 2000, 3000, 4000, 5000, 6000, 7000, 8000, 9000, 10000 or more than 10000 quantitative physical property data can be used, but is not limited thereto.
  • the classification ability in the clustering process depends on the combination of the quantitative physical characteristic data set for various cells, the setting parameters of the clustering process, and the like.
  • the target cell population can be classified into some form by appropriately setting the type of quantitative physical characteristic data.
  • the combination of the quantitative physical characteristic data may have a variation in the value to the extent that each cell can be distinguished in the target cell population, and usually, by increasing the types of the quantitative physical characteristic data, the type of the quantitative physical characteristic data may be increased. It is usually possible to secure sufficient variation.
  • each quantitative physical characteristic data can be quantitatively evaluated by a value such as variance, standard deviation, or coefficient of variation, and the combination of the quantitative physical characteristic data used in the present invention can be used.
  • a value such as variance, standard deviation, or coefficient of variation
  • the combination of the quantitative physical characteristic data used in the present invention can be used.
  • the coefficient of variation is 0.01, 0.02, 0.03, 0.04, 0.05, 0.06, 0.07, 0.08, 0.09, 0.10, 0.15, 0.
  • Quantitative physical property data with values such as .2, 0.3, 0.4, 0.5 can be used in combination, but is not limited thereto.
  • the cell stratification process used in the cell identification method using the quantitative physical characteristic data of the present invention depends not only on the type of clustering algorithm used, but also on the setting parameters at the time of clustering execution such as the number of clustering.
  • the present invention acquires or determines the biological characteristics obtained for the cells to be treated by experiments or the like, and optimizes the cell stratification treatment by utilizing the acquired or determined biological characteristics. can do.
  • the clustering process can be optimized so that cells having the specific biological characteristics of the characteristic data are layered in the same or neighboring regions in terms of the cell fractionation space structure or the cell arrangement space structure.
  • the present invention in one aspect, optimizes the cell stratification process for the identification of long-term hematopoietic stem cells.
  • Previous studies have revealed marker molecules in certain long-term hematopoietic stem cells. Using such marker molecules as part of their quantitative physical properties, cell groups that show similarities to the property data are layered into regions that are the same or nearby in terms of cell fractionation space structure or cell placement space structure.
  • the clustering process can be optimized as such. In such optimization, it is possible to optimize for a plurality of quantitative physical properties.
  • a discriminator for classifying known stem cells in the tissue to be examined using the quantitative physical property data is configured by using a general machine learning method. To do. Then, by analyzing the discriminator (learned model) trained so that the stem cells can be identified in this way, the importance in the classification of each quantitative physical characteristic data used for the classification is specified, and the stem cells are identified.
  • One or more quantitative physical characteristic data that are important for this purpose are specified as differentiation lineage identification quantitative physical characteristic data. In this way, by optimizing the clustering process using one or more differentiation lineage identification quantitative physical characteristic data identified by a trained model trained using known stem cells, the clustering process can be performed more accurately. It is possible to configure a clustering process in which target cells are rearranged (hierarchized) according to a cell differentiation lineage (Fig. 5).
  • the cell stratification process used in the cell identification method using the quantitative physical characteristic data of the present invention can be optimized by changing the setting parameters of the clustering process. For example, it can be performed by changing the setting parameters of the above-mentioned (1) downsampling processing, (2) data processing and / or (3) dimension reduction processing to be combined with the clustering processing, but the present invention is not limited thereto.
  • the quantitative physical characteristic data of the target cell used in the present invention can be obtained by various known methods capable of quantifying the physical characteristic data for each cell or cell fraction.
  • NGS next-generation sequencer
  • a method of quantifying the protein, a method of quantifying various quantitative physical properties by imaging in combination with labeling, and the like can be used, but the method is not limited thereto.
  • a commercially available marker set (Surface Marker Screening Panel / BDBiosciences, LEGEND SCREENING / BIO LEGEND, etc.) can be used.
  • the cell population in a cell population that changes along a time series, is arranged (hierarchized) by using quantitative physical characteristic data acquired from the cell population at a specific time point. Reproduce changes over time.
  • a cell fraction arrangement space or a cell arrangement space is used by using quantitative physical property data of a cell population obtained from a subject at a plurality of time points. May be generated.
  • quantitative physical property data of cell populations obtained from similar tissues of different subjects may be mixed and used. Therefore, the quantitative physical property data of the present invention may be obtained from a cell population obtained from a single or a plurality of subjects at a plurality of time points.
  • cells are separated using a cell sorter using a combination of quantitative physical property data that identifies a part of the cell fractionation space structure or the cell placement space structure obtained by cell stratification. can do.
  • the cell sorter can generally separate cells having a specific value range for various physical properties by a gating step. By combining gating steps using a plurality of physical properties used as a reference, cells or cell populations having a specific value range for a plurality of quantitative physical properties can be separated. The combination of the value ranges of the physical characteristic data used for such separation constitutes the gating parameter structure.
  • a biological sample by using a gating parameter structure that reflects a combination of quantitative physical property data that identifies a spatial region containing long-term hematopoietic stem cells or their subpopulations in a cell fractionation space structure or cell placement space structure, a biological sample.
  • Long-term hematopoietic stem cells or their subpopulations can be isolated from cell populations containing diverse cells such as.
  • the combination of quantitative physical property data for specifying a part of the cell fractionation space structure or the cell placement space structure obtained by cell stratification or a part thereof is a cell located in the region.
  • a marker set for identifying a cell it can be used not only for the purpose of separating cells but also for the purpose of clarifying the localization of the cell in a living tissue, for example.
  • a marker set that can be used to identify a region of a cell having a particular biological property has that biological property. It can be used as a candidate marker set for identifying cells having.
  • a candidate marker set By confirming the biological characteristics of the cells identified by the candidate marker set in more detail, it is possible to identify the marker set necessary for identifying the cells having the desired biological characteristics with the desired accuracy. Can be done.
  • a candidate marker set By utilizing the cell fractionation space structure or the cell arrangement space structure of the present invention, a candidate marker set can be obtained in an extremely short period of time as compared with the case where a candidate marker set is identified using only biological properties. be able to.
  • MERTK CD96, CD156c, CD230, CD66a / c / e, CD255, ⁇ 2-microglobulin, CD26, Lymphotox in ⁇ Receptor, MSC, NPC, CD32, CD81, CD201, CD274, CD48, CD183, CD243, TRA-2-54, MUC-13, CD111, CD223, CD22, CD179a, CD7, NKp80, CD334, CD199, CD300c, CD120b, CD360, TRA-1-81, CD102, CD11b / ITGAM, CD141, CD207, CD50, CD352, Delta Opioid Receptor, CD89, CD36L1, APCDD1, CD39, CD49e, CD1a, CD49b, CD30, CD324, CD122 / IL2RB, CD267, CD90, CD335, CD294, CD196, HLA-A, B, C, CD303, CD200, CD229, CD95, CD213 ⁇ 1, CD13,
  • Detection kit for detecting cells When cell surface molecules or the like are selected as markers for identification using the quantitative physical property data of the present invention, it is possible to provide a detection kit combining reagents for chemically detecting and quantifying these molecules. it can.
  • reagents labeled antibodies using cell surface molecules as antigens, biocompatible polymers having specific affinity for cell surface molecules, enzyme proteins whose activity changes by reaction with cell surface molecules, etc. are used as reagents. Can be used.
  • a detection kit for identifying long-term hematopoietic stem cell candidate cells CD217, CD191, CD328, CD34, GPR56, CD275, CD185, CD371, CD45RO, CD192, CD44, CD19, Notch 1, CD21, CD182 , CD47, CD133, MRGX2, CD117, CD20, CD368, CD3, CD135, CD130, CD180, CD84, CD221, CD276, CD179b, CD85h, CD105, SUSD2, CD162, CD45RA, CD197, CD5, CXCR7, CD161, CD63, CD10 , CCRL2, TRA-2-49, CD366, CD28, CD11c, CD106, CD85, CD87, CD11a, CD35, CD46, CD59, Integrin ⁇ 9 ⁇ 1, CD99, SSEA-5, CD31, CD147, CD226, CD88, CD40, EGFR, CD131, CD58, CD126, SSEA-4, CD127 / IL
  • the cell stratification of the present invention can be utilized to optimize culture conditions to enrich cells with specific biological properties. For example, the cell fractionation space structure or cell arrangement space structure of the cell population at the start of culture is compared with the cell fractionation space structure or cell arrangement space structure of the cell population after culturing for a certain period under specific culture conditions. This makes it possible to determine whether or not the culture conditions bring about enrichment of the cell population having the desired biological characteristics, and to specify the culture conditions that bring about more enrichment. By utilizing such optimized culture conditions, a cell population having a specific biological property can be rapidly and mass-produced.
  • the cell stratification of the present invention can be utilized to assess the content of cells with specific biological properties in a sample. For example, a cell fractionation space structure or cell arrangement space structure obtained by layering cells contained in a reference sample, and a cell fractionation space structure or cell arrangement space obtained by layering cells in a test sample. By comparing the structures, the content of cells with specific biological properties in the test sample can be evaluated as a comparison with the reference sample. By evaluating the content of cells having specific biological properties in the sample in this way, for example, quality control of cell products can be performed.
  • Method of evaluating cell differentiation status using cell stratification By utilizing the cell stratification of the present invention, it is possible to identify the differentiation state of cells in a test sample. Typically, a cell fractionation space structure or cell arrangement space structure obtained by layering each cell in a reference sample and a cell fractionation space structure obtained by layering each cell in a test sample. Alternatively, the state of differentiation of the cell population in the test sample can be evaluated by comparing the cell arrangement spatial structure and analyzing the bias of the spatial structure of the test sample with respect to the reference sample.
  • the direction of cell differentiation in the test sample can be evaluated.
  • the cell fractionation space structure or cell arrangement space structure obtained by layering each cell in the reference sample and the cell fractionation space obtained at a plurality of time points for a part of the test sample can be evaluated.
  • the structure or the cell arrangement spatial structure it is possible to evaluate in which direction the cells of the test sample are differentiating.
  • cell culture conditions can be adjusted for the purpose of enriching cells having specific biological characteristics.
  • the cell fractionation space structure or cell arrangement space structure obtained by layering each cell in the reference sample and the cells obtained by layering the test sample before and after culturing at each time point.
  • the culture conditions that give the desired effect for example, the culture conditions that enrich the cells having specific biological characteristics. Etc. can be evaluated and the culture method can be adjusted.
  • the cell stratification step used in the cell identification method using the quantitative physical property data of the present invention is, if necessary, the above-mentioned (1) downsampling process, (2) data processing and / or (3) dimension reduction processing.
  • the target cell group can be rearranged in the cell differentiation hierarchy, and can be used as a processing system for causing a computer to perform a calculation process for providing a cell fraction arrangement space structure or a cell arrangement space structure.
  • the processing system used for the cell stratification process using the computer is referred to as a "high-precision classification ability model" (Fig. 6).
  • the model is configured as a program that instructs the computer to process, and can be stored in a storage medium that can be read from the computer.
  • the high-precision classifier model of the present invention optionally combines (4) clustering (layering) processing in combination with (1) downsampling processing, (2) data processing and / or (3) dimension reduction processing described above. (5) Visualized data processing to generate image data for visualizing the cell fractional arrangement spatial structure or cell arrangement spatial structure obtained by the high-precision classification ability model, (6) Input analysis. Analytical processing that analyzes and / or modifies the cell fractionation space structure or cell arrangement space structure based on the parameters, and (7) cells contained in a part of the cell fractionation space structure and / or the cell arrangement space structure.
  • a known method can be used for the visualization data processing, and for example, a Spanning Tree, ElPiGraph, and the like can be used, but the visualization data processing is not limited thereto.
  • a known method can be used for generating the automatic gated parameter set, and for example, flowDentiity and the like can be used, but the method is not limited thereto.
  • the program of the present invention causes a computer to perform a step of visualizing a cell fraction arrangement space structure or a cell arrangement space structure on a display unit in an aspect such as a pseudo three-dimensional space.
  • a step of identifying a cell fractionation space structure or a region on the cell placement space structure according to the predetermined criteria for example, selecting a region having specific biological property data, specific biological It is possible, but not limited to, to select an area that satisfies a specified condition from the positional relationship of a plurality of areas having characteristic data.
  • a region on the cell fractionation space structure or cell placement space structure containing cells having a marker specifically expressed in long-term hematopoietic stem cells is selected.
  • Regions that are thought to contain differentiated cells can be selected.
  • the present invention visualizes biological property data for each cell in a cell fractionation space structure or a cell placement space structure similar to a cell differentiation lineage obtained by cell stratification.
  • a cell fractionation space structure or a cell placement space structure similar to a cell differentiation lineage obtained by cell stratification.
  • the biological property data obtained by separating a cell whose position in the cell fractionation space structure or the cell arrangement space structure is specified and testing the cell is obtained again.
  • the present invention isolates a cell whose position within the cell fractionation space structure or cell arrangement space structure is specified, and tests the cell to obtain biological property data as a physical property.
  • a method for newly generating a cell fractionation space structure or a cell arrangement space structure using these data and a program for executing the method on a computer are provided.
  • the present invention comprises a method for performing a more detailed analysis by visualizing biological property data in the newly generated cell fractionation space structure or cell arrangement space structure, and a method for performing the method in a computer.
  • the program of the present invention can output statistically processed data instead of visualization on the cell fractionation space structure or the cell placement space structure.
  • the program of the present invention can further execute the data analysis step based on the output data and the set threshold value.
  • the invention (1) Input unit for inputting quantitative physical data and biological characteristic data for each cell; (2) A processing unit that generates a cell fractionation space structure or a cell arrangement space structure similar to a cell differentiation lineage by layering processing; and (3) An output unit that outputs a cell fractionation arrangement space structure or a cell arrangement space structure. ; Provide a system including a computer having. Such a system can be used for analysis by correlating biological characteristic data with a cell differentiation lineage.
  • the present invention (1) Input unit for inputting quantitative physical data and biological characteristic data for each cell; (2) A processing unit that generates a cell fractional arrangement spatial structure or a cell arrangement spatial structure similar to a cell differentiation lineage by stratification processing; and (3) A combination of physical characteristics of cells having specific biological characteristics.
  • FIG. 8 The configuration of a computer having a high-precision classification ability model of the present invention and used for a system for processing the model is illustrated as a block diagram shown in FIG. Note that FIG. 8 is merely an example, and the computer used in the system having the high-precision classification ability model of the present invention does not need to include all of the components shown in FIG. It is also possible, and it is also possible to add other components.
  • the computer 100 shown in FIG. 8 is a main storage device including a processor 101 composed of a CPU or the like, a RAM, a ROM, and / or a memory 102 including a flash memory, an I / O control circuit 103, an HDD, an SSD, or the like. Each of these components, including 104, is electrically connected to each other via a control line and a data line.
  • the I / O control circuit 103 is further connected in the same manner as a root network line 105 outside the computer, an input / output device 106 such as a keyboard, a mouse, and a display, and an analysis device 107 such as a flow cytometer and a cell sorter.
  • the program code that defines each information processing performed in the high-precision classification ability model is stored in the main storage device 104.
  • the program code is read into the processor 101 through the I / O control circuit 103 and executed.
  • the memory 102 is temporarily used to write and read data while the program is running.
  • the processor 101 may be composed of a single CPU or a plurality of CPUs.
  • the network circuit connected to the I / O control circuit 103 is a wired or wireless network, and is used for transmitting and receiving data necessary for executing a program.
  • the input / output device 106 connected to the I / O control circuit 103 is an input device such as a mouse or keyboard used by a human to operate a computer in executing a program, and / or a computer such as an LCD display or a speaker. It is composed of an output device for human recognition of the processing result.
  • the analytical device 107 connected to the I / O control circuit 103 is composed of devices such as a flow cytometer and a cell sorter, and is used for acquiring quantitative physical characteristic data and cell isolation.
  • the input / output device 106 has an image display unit for displaying display image data generated by a high-precision classification ability model.
  • the input / output device 106 has a partial area thereof on an image displayed on the image display unit and a processing input unit for designating a process to be performed on the area.
  • the computer identifies the area of the cell fraction arrangement space structure or the cell arrangement space structure data corresponding to the selected area by the data analysis processing of the high-precision classification ability model, and is designated for the space structure data. Perform processing.
  • the display image data for displaying the processing result generated by the high-precision classification ability model is displayed on the image display unit of the input / output device.
  • the process of analysis and display processing can be repeated any number of times, and a bidirectional human interface can be configured.
  • the interface provides, for example, a graph (image) in which cells included in each cell fraction fractionated by a high-precision classification ability model are plotted in a different color for each fraction in a two-dimensional or three-dimensional space.
  • An image display unit for displaying as a two-dimensional image can be provided.
  • the interface may have an input means capable of manipulating the viewpoint to be observed.
  • it may have an input means for rotating each axis (dimensional axis) of the three-dimensional space to change the viewpoint.
  • a means for displaying a scroll bar, a virtual trackball, a virtual joystick, or the like on the display unit and operating the scroll bar, a virtual trackball, a virtual joystick, or the like with the mouse pointer or the like displayed on the display unit may be provided, or a mouse, a track, or the like may be provided.
  • the behavior of hardware such as pads and joysticks may be associated with viewpoint changes.
  • FIG. 9 shows an image displayed on the image display unit of the interface in one aspect of the present invention.
  • the image includes a graph (201) in which cells included in each cell fraction fractionated by a high-precision classification ability model are plotted in different colors for each fraction in a three-dimensional space.
  • the graph can be rotated by operating the virtual joystick (202) with the mouse pointer (203). Further, by designating the region (204) in the graph (201) with the mouse pointer (203), the cells or cell fraction contained in the region can be specified.
  • the information display unit (205) can display numerical data related to all cells used in the analysis, data related to cells belonging to the region specified in the graph, and the like.
  • buttons (206) displayed in the image or the pull-down menu (207) with the mouse pointer by operating the button (206) displayed in the image or the pull-down menu (207) with the mouse pointer, various processes such as analysis of the entire analysis data or cells belonging to the specified region, data storage, and the like are performed. Can be specified.
  • the figure is an example, and the present invention may include an interface having other configurations.
  • the analysis device 107 is a measuring unit for detecting quantitative physical characteristic data from a sample to be analyzed, such as a flow cytometer, a next-generation sequencer (NGS), an imaging device, and a physical property analysis device.
  • a sample processing unit such as a cell sorter, for isolating a cell population using a quantitative physical property dataset.
  • the measuring unit acquires a plurality of types of quantitative physical property data for each cell of the sample to be analyzed and provides the data to a computer.
  • the computer processes all or part of the quantitative physical characteristic data obtained from multiple cells included in the analysis target sample in an arbitrary format. Can be stored in the main memory as a data structure of.
  • the sample processing unit divides a sample cell group by using a quantitative physical characteristic data set generated by an automatic gated parameter set generation process of a high-precision classification ability model of a computer. Or a part thereof can be isolated.
  • the cell group obtained from the sample may be the cell group itself used for generating the cell fractionation space structure or the cell placement space structure data in the high-precision classification ability model, or may be obtained from a sample of the same type. It may be a cell group.
  • a plurality of the above computers can be used, and each computer may individually perform each process of the high-precision classification ability model and exchange the process results through the network line.
  • the input / output device and the analysis device and the computer may be connected by a network line, or the system as a whole may have a cloud network configuration (FIG. 10).
  • a system having the high-precision classification ability model of the present invention a system having a learning unit for generating and expanding the high-precision classification ability model and a discrimination unit for classifying target cells using the learned high-precision classification ability model. Can be configured.
  • the system may include other functions such as a management function and a report function used for investigating the state of the high-precision classification ability model, if necessary (Fig. 5).
  • Example 1 Identification of mouse long-term hematopoietic stem cells Collection of cells Long-term hematopoietic stem cell-specific reporter mouse (a mouse in which the Hoxb5 gene on the genome is replaced with the Hoxb5 gene fused with a gene encoding three copies of the marrow fluorescent protein; nature, In 2016, Vol. 530, pp. 223-227) Bone marrow cells were collected from the bone marrow.
  • Quantitative data were acquired for the following 16 types of physical characteristics. Specifically, bone marrow cells are suspended in a burfer solution for antibody staining (PBS / 2% FCS / 2 mM EDTA, etc.), and all cell staining is performed on ice. After staining with an anti-c-kit antibody, c-Kit positive cells were concentrated using MACS (Magnetic-activated cell sorting). Then, the remaining antibody was sequentially added to the concentrated c-Kit positive cells for staining, and finally SYSTEMX-Red was added as a DNA staining reagent for removing dead cells. Data were collected from the stained cells using a flow cytometer and the dedicated software BD FACSDiva. The machine learning data was analyzed and extracted using FlowJo.
  • Step 1 Identification of differentiation lineage identification Quantitative physical characteristic data
  • HSC cell groups that have already been identified based on Hoxb5 positivity are used as correct answer data, and HSC from 220,610 sample data by supervised learning by machine learning.
  • AdaBoost machine learning model
  • Step 2 Optimization of clustering and clustering
  • non-hierarchical clustering Gaussian Mixture Model
  • the clustering process was optimized by setting the number of clusters so that the number of clusters including Att 12, 9 and 14 was minimized.
  • the clustering process was optimized so as to divide the data of 220,610 sample data (each sample data represents an individual cell) into 101 clusters.
  • the number of clusters containing cells having Att 12, 9 and 14 was 3 out of 101 clusters. A total of 1,198 sample data were classified into the three clusters.
  • mCherry-positive cells that is, Hoxb5-positive HSC cells were all classified into the above three clusters, and the clustering process was optimized so that the cells could be stratified according to the differentiation hierarchy of the cell differentiation lineage. was confirmed.
  • the LT-HSC cell group (331 cases) already identified based on Hoxb5 positive and the ST-HSC cell group (1,081 cases) already identified based on Hoxb5 negative have the above three-dimensional spatial structure. The position placed inside was verified.
  • the LT-HSC cell group (331 cases) identified based on Hoxb5 positive and the ST-HSC cell group (1,081 cases) identified based on Hoxb5 negative are included in the above three-dimensional spatial structure. It was confirmed that they were concentrated in a specific region of the cell and were arranged according to the order of biological cell differentiation. Specifically, it was confirmed that the LT-HSC cell group and then the ST-HSC cell group were arranged starting from one of the ends of the three-dimensional spatial structure.
  • Att12, 16 and 10 are the parameters that play an important contribution to the classification. ..
  • Example 2 Layering of human blood cell lineage
  • quantitative physical characteristic data of human umbilical cord blood is acquired by a flow cytometer using a commercially available marker set (including CD34), and the quantitative physical characteristic data of the present invention is obtained.
  • the cell arrangement space structure was obtained by the cell stratification treatment using.
  • An example showing the cell arrangement space in three dimensions is shown in FIG. 11A.
  • the expression level of CD34 known to be expressed in a certain long-term hematopoietic stem cell is classified into stages 0 to 9, and the expression level of CD34 in each cell is determined on the cell arrangement space structure.
  • Mapped to (Fig. 11B) Cells with high expression levels of CD34 are concentrated at one end of the cell arrangement space structure, and the cell arrangement space structure obtained by cell stratification processing using quantitative physical characteristic data reflects the cell lineage relationship. It is shown that.
  • Example 3 Hierarchy of head and neck squamous cell carcinoma cells (1) Identification of cancer cells A biopsy sample containing cancer cells obtained from a patient with head and neck squamous cell carcinoma by a known method (Cell, Vol. 171, no). .7, pp.1611-1624), a cell arrangement space structure was obtained by the cell stratification treatment of the present invention using quantitative physical property data. An example showing the cell arrangement space in three dimensions is shown in FIG. 12A. Data identified by Single-cell RNAseq on the expression level of P-MET, which is known to be expressed in cancer cells, was mapped onto the cell arrangement spatial structure to obtain FIG. 12B. The expression level of P-MET was classified into stages 0-9. On the other hand, the positions of cells determined to be cancer cells based on biological findings were mapped on the cell arrangement space structure to obtain FIG. 12C.
  • Example 3 (2) Identification of myofibroblasts
  • the data identified by Single-cell RNAseq on the expression level of ACTA2 known to be expressed in myofibroblasts is mapped.
  • FIG. 12D was obtained.
  • the expression level of ACTA2 was classified into stages 0 to 1.
  • the positions of cells determined to be myofibroblasts based on biological findings were mapped on the cell arrangement spatial structure to obtain FIG. 12E.
  • Example 4 Identification of candidate markers for identifying human long-term hematopoietic stem cells
  • the physical characteristic data for specifying the expression level distribution pattern of CD34 The combination was specified, and the effect of each physical characteristic data on the identification was quantified.
  • the more influential physical property data are classified into ++++ to + as important physical properties for identifying long-term hematopoietic stem cells and are shown in the table below.
  • the above physical properties can be used as candidate markers for identifying long-term hematopoietic stem cells.
  • the present invention by visualizing the cell fractionation space structure and / or the cell arrangement space structure obtained by layering cells by an arbitrary method, the early stage of differentiation, that is, the identification of cells close to stem cells and branching are performed. It is possible to support the understanding of the relationship between differentiating strains. In addition, by utilizing the cell stratification of the present invention, it becomes possible to identify tissue stem cells and cancer stem cells in a shorter period of time and at low cost, and the current and future profiling (health) of each individual (individual). , Disease status, etc.) and can provide useful information for providing individualized treatments.
  • the differentiation mode of the purified cells is described. Can be evaluated.
  • the optimum culture condition screening for enriching specific differentiated cells from the purified cells can be performed. Can help.

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Biomedical Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biotechnology (AREA)
  • Physics & Mathematics (AREA)
  • Analytical Chemistry (AREA)
  • Biochemistry (AREA)
  • Genetics & Genomics (AREA)
  • General Engineering & Computer Science (AREA)
  • Hematology (AREA)
  • Microbiology (AREA)
  • Molecular Biology (AREA)
  • Medicinal Chemistry (AREA)
  • Immunology (AREA)
  • Biophysics (AREA)
  • Sustainable Development (AREA)
  • Urology & Nephrology (AREA)
  • Food Science & Technology (AREA)
  • General Physics & Mathematics (AREA)
  • Pathology (AREA)
  • Ecology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Medical Informatics (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Hardware Design (AREA)
  • Cell Biology (AREA)
  • Plant Pathology (AREA)
  • Toxicology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

本発明は、定量物理的特性データを利用した細胞階層化処理を含む細胞(群)の同定方法、細胞階層化処理を利用して細胞(群)を分離する方法、細胞階層化処理を利用して細胞(群)を特定するための分子マーカーの同定方法、細胞階層化処理を利用した細胞(群)の培養方法、細胞階層化処理を利用して細胞(群)を同定する工程をコンピュータに実行させるプログラム、細胞階層化処理を利用して細胞(群)を解析、同定または分離するシステムに関する。

Description

細胞階層化処理により特定の生物学的特徴を有する細胞を同定する方法およびその応用方法
 本発明は、定量物理的特性データを利用した細胞階層化処理を含む細胞(群)の同定方法、細胞階層化処理を利用して細胞(群)を分離する方法、細胞階層化処理を利用して細胞(群)を特定するための分子マーカーの同定方法、細胞階層化処理を利用した細胞(群)の培養方法、細胞階層化処理を利用して細胞(群)を同定する工程をコンピュータに実行させるプログラム、細胞階層化処理を利用して細胞(群)を解析、同定または分離するシステムに関する。
 生体中の細胞は基本的に同じ遺伝子セットを有しており、受精卵細胞という単一の細胞の分裂によって生み出されているにも関わらず、その生物学的機能は様々に異なっている。細胞は固有の生物学的機能に基づいて、一定の生物学的特性を有する細胞または細胞群として、他の細胞と区別されている。例えば、生体中の各組織、例えば骨髄、筋肉に見出される細胞はそれぞれ形態においても、生物学的機能においても異なっている。幹細胞、例えば造血幹細胞(HSC)は、自己複製能と多分化能という生物学的機能を有することが知られている。自己複製能と多分化能を有する幹細胞の中でも、これらの幹細胞を特徴づける生物学的機能を長期に亘って維持する細胞と、比較的短期間にその機能を失う幹細胞が存在することが知られている(非特許文献1)。
 長期間、例えば生物個体の生涯に亘って自己複製能と多分化能を維持する幹細胞は、その自己複製能を利用して大量培養を行うことが可能であり、また、その多分化能を利用して、様々な細胞に分化させることができる。このような特性を有する幹細胞は再生医療を実用化する際の切り札となり得る細胞であると考えられている。しかしながら、これらの幹細胞はいずれも生体内における存在量が極めて希少な細胞であって、生体から容易に同定、単離することができない。
 これまでの基礎生物学の研究から、一般に多細胞生物の各組織においては組織幹細胞から各種分化細胞に至る分化系統が存在し、組織幹細胞を最上流とする細胞分化の階層性が存在していると考えられており、一定の生物学的ルールの下に、細胞分化による階層性が形成・維持されていると理解されている(図1)。しかしながら、生物個体の組織から分離された各種細胞について、細胞形態等の情報に基づいて各細胞間の分化系統上の関係を推定し、上記概念的に理解されている細胞分化階層性を再構築することは極めて困難である。
 一方、生体の各種細胞は、各遺伝子の発現量や、各遺伝子から発現されるタンパク質の細胞内含量、細胞表面に露出されるタンパク質の種類、タンパク質の翻訳後修飾の状態、細胞形態等の様々な物理的特性において固有の状態を有しており、これらの物理的特性の組み合わせによって、一定の生物学的機能を有する細胞を特定することが可能である。従来、一般的に様々な生物学的機能を有する細胞を同定・純化するためには、各細胞がそれぞれその表面に発現するタンパク質等の分子を認識する蛍光標識されたモノクローナル抗体と、結合した抗体の蛍光標識の組合せに応じて細胞を分離することのできるフローサイトメーターを併用した手法が主に用いられてきた。
 しかしながら、このような手法においては、目的の細胞と他の細胞を区別、純化することを可能とするための、「至適なモノクローナル抗体の組み合わせ」を、試行錯誤を通じて開発する必要があり、特定の生物学的機能を有する細胞を同定し、他の細胞から単離して純化するためには、非常に熟練した技術が必要とされてきた。そして、試験すべきモノクローナル抗体の組み合わせの多さなどに起因して、一般的にこのような開発手法には膨大な時間と費用が必要とされる。実際に、1988年にマウスの造血幹細胞(HSC)が発見されて以来、造血幹細胞の特性を有する細胞の中でも、特にマウス個体の生涯に亘って自己複製能および多分化能を維持する特徴を有する長期造血幹細胞が発見、同定されるまでには、30年もの年月が必要であった(非特許文献2)。
日本輸血細胞治療学会誌、2006年、Vol.52、No.5、pp.583-588 nature、2016年、Vol.530,pp.223-227
 細胞分化階層の特定の階層に属する、生物学的に重要な機能を有する希少な細胞、例えば組織幹細胞やがん幹細胞を同定、単離するためには、従来の開発手法を凌駕する効率化・高速化を可能とする新規手法の開発が望まれている。
 造血系細胞を含む生体の各種細胞は、一部の例外を除き基本的に同一セットの遺伝情報を有するものの、各遺伝子の発現量や、各遺伝子から発現されるタンパク質の細胞内含量、細胞表面に露出されるタンパク質の種類、タンパク質の翻訳後修飾の状態、細胞形態等の様々な物理的特性において固有の状態を有している。本発明者らは、これら物理的特性を定量したデータに基づき、細胞集団を分化階層性に従って階層化することが可能であることを見出し、当該階層化を行う高精度分類能モデルを利用することで、細胞分化階層の特定の階層に位置する細胞を解析、同定、または分離する方法およびこれを用いたシステムを提供する。
 すなわち、本発明は一態様において、試料中の各細胞の定量物理的特性データの類似度を利用して、各細胞または細胞画分を階層化し、細胞分化系統に類似した細胞画分配置空間構造または細胞配置空間構造を得る工程、および各細胞の生物学的特性データを利用して、前記細胞画分配置空間構造または細胞配置空間構造内の、1または複数の領域を特定する工程を含む、特定の生物学的特性を有する細胞を同定する方法を提供する。
 また、本発明は一態様において、試料中の各細胞の定量物理的特性データの類似度を利用して、各細胞または細胞画分を階層化して得られた細胞分化系統に類似した細胞画分配置空間構造または細胞配置空間構造において、特定の生物学的特性を有する細胞の位置する領域を特定する工程、および特定の生物学的特性を有する細胞を分離するためのゲーティングパラメータ構造を取得する工程を含む、定量物理的特性データを用いた細胞の単離方法を提供する。
 また、本発明は一態様において各細胞または細胞画分を階層化して得られた細胞分化系統に類似した細胞画分配置空間構造または細胞配置空間構造において、各細胞の生物学的特性データを利用して1または複数の領域を特定する工程を含む、特定の生物学的特性を有する細胞を特定するための候補マーカーセットを同定する方法を提供する。
 また、本発明は一態様において、特定の生物学的特性を有する細胞を同定するための、CD217,CD191,CD328,CD34,GPR56,CD275,CD185,CD371,CD45RO,CD192,CD44,CD19,Notch 1,CD21,CD182,CD47,CD133,MRGX2,CD117,CD20,CD368,CD3,CD135,CD130,CD180,CD84,CD221,CD276,CD179b,CD85h,CD105,SUSD2,CD162,CD45RA,CD197,CD5,CXCR7,CD161,CD63,CD10,CCRL2,TRA-2-49,CD366,CD28,CD11c,CD106,CD85,CD87,CD11a,CD35,CD46,CD59,Integrin α9β1,CD99,SSEA-5,CD31,CD147,CD226,CD88,CD40,EGFR,CD131,CD58,CD126,SSEA-4,CD127/IL7R,CD194,CD43,Sialyl Lewis X,CD200R,TCR α/β,CD123,CD38、MSC,CD268,CD195,CD181,CD69,CD27,CD1b,CD18,KLRG1,CD24,CD97,CD328,CD79b,CD112,CD155,CD326,CD62L,CD45,TCR γ/δ,CD235ab,CD184,CD8a,CD52,CD49f,CD9,CD109,CD279,CD360,CD143,CD45RA,CD4,CD73,CD172a/b,CD154,CD370,Siglec-8,CD85k,CD170,Siglec-9,CD36,CD8a,CD218a,CD304,ROR1,CD1c,CD57,TNAP,CD114,TSLPR,CD278/ICOS,CD116/CSF2RA,CD103,Tim-4,TLT-2,HLA-E,CD317,CD2,CD71,CD269,CD148,HVEM,CD100,CD45RB,CD166,CD61,CD85d,CD298,CD82,DR3,CD164,CD263,CD215,CD132,CD158,MERTK、CD96,CD156c,CD230,CD66a/c/e,CD255,β2-microglobulin,CD26,Lymphotoxin β Receptor,MSC,NPC,CD32,CD81,CD201,CD274,CD48,CD183,CD243,TRA-2-54,MUC-13,CD111,CD223,CD22,CD179a,CD7,NKp80,CD334,CD199,CD300c,CD120b,CD360,TRA-1-81,CD102,CD11b/ITGAM,CD141,CD207,CD50,CD352,Delta Opioid Receptor,CD89,CD36L1,APCDD1,CD39,CD49e,CD1a,CD49b,CD30,CD324,CD122/IL2RB,CD267,CD90,CD335,CD294,CD196,HLA-A,B,C,CD303,CD200,CD229,CD95,CD213α1,CD13,CD62P,VEGFR-3,CD206,CD140a,TRA-1-60-R,CD92,CD64,Jagged 2,CCR10,CLEC4A,CD107a、FcεRIα,CD355,CD15,CD142,CD272,CD93,CD271,4-1BB Ligand,CD158b,CD365,Ksp37,IL-28RA,CD85,CD94,CD369,CD74,CD115,CD42b,CD282,CD152,CD340,CD338,CD119,GARP,LOX-1,CD151,CD337,CD29,CD104,CD1d,CD55,GPR83,CXCL16,CD261,CD318,CD25,Notch3,HLA-DR,CD85,TIGIT,CD124,CD6,CD172g,CD245,CD107b,CD258,CD165,CD262,CD336,erbB3,XCR1,CD38,CD138,CD70,CD16,CD144,CD213α2,CD344,CD323,Integrin β7,CD160,CD158e1,CD319,CD49c,CD354,CD314,IFN-γ R b chain,CD23,CD231,CD203c,CD140b,B7-H4,Notch 4から選択される定量物理的特性またはこれらの組み合わせを含むマーカーであって、当該細胞が長期造血幹細胞であるマーカーを提供する。
 また、本発明は一態様において、特定の生物学的特性を有する細胞を同定するための、CD217,CD191,CD328,CD34,GPR56,CD275,CD185,CD371,CD45RO,CD192,CD44,CD19,Notch 1,CD21,CD182,CD47,CD133,MRGX2,CD117,CD20,CD368,CD3,CD135,CD130,CD180,CD84,CD221,CD276,CD179b,CD85h,CD105,SUSD2,CD162,CD45RA,CD197,CD5,CXCR7,CD161,CD63,CD10,CCRL2,TRA-2-49,CD366,CD28,CD11c,CD106,CD85,CD87,CD11a,CD35,CD46,CD59,Integrin α9β1,CD99,SSEA-5,CD31,CD147,CD226,CD88,CD40,EGFR,CD131,CD58,CD126,SSEA-4,CD127/IL7R,CD194,CD43,Sialyl Lewis X,CD200R,TCR α/β,CD123,CD38、MSC,CD268,CD195,CD181,CD69,CD27,CD1b,CD18,KLRG1,CD24,CD97,CD328,CD79b,CD112,CD155,CD326,CD62L,CD45,TCR γ/δ,CD235ab,CD184,CD8a,CD52,CD49f,CD9,CD109,CD279,CD360,CD143,CD45RA,CD4,CD73,CD172a/b,CD154,CD370,Siglec-8,CD85k,CD170,Siglec-9,CD36,CD8a,CD218a,CD304,ROR1,CD1c,CD57,TNAP,CD114,TSLPR,CD278/ICOS,CD116/CSF2RA,CD103,Tim-4,TLT-2,HLA-E,CD317,CD2,CD71,CD269,CD148,HVEM,CD100,CD45RB,CD166,CD61,CD85d,CD298,CD82,DR3,CD164,CD263,CD215,CD132,CD158,MERTK、CD96,CD156c,CD230,CD66a/c/e,CD255,β2-microglobulin,CD26,Lymphotoxin β Receptor,MSC,NPC,CD32,CD81,CD201,CD274,CD48,CD183,CD243,TRA-2-54,MUC-13,CD111,CD223,CD22,CD179a,CD7,NKp80,CD334,CD199,CD300c,CD120b,CD360,TRA-1-81,CD102,CD11b/ITGAM,CD141,CD207,CD50,CD352,Delta Opioid Receptor,CD89,CD36L1,APCDD1,CD39,CD49e,CD1a,CD49b,CD30,CD324,CD122/IL2RB,CD267,CD90,CD335,CD294,CD196,HLA-A,B,C,CD303,CD200,CD229,CD95,CD213α1,CD13,CD62P,VEGFR-3,CD206,CD140a,TRA-1-60-R,CD92,CD64,Jagged 2,CCR10,CLEC4A,CD107a、FcεRIα,CD355,CD15,CD142,CD272,CD93,CD271,4-1BB Ligand,CD158b,CD365,Ksp37,IL-28RA,CD85,CD94,CD369,CD74,CD115,CD42b,CD282,CD152,CD340,CD338,CD119,GARP,LOX-1,CD151,CD337,CD29,CD104,CD1d,CD55,GPR83,CXCL16,CD261,CD318,CD25,Notch3,HLA-DR,CD85,TIGIT,CD124,CD6,CD172g,CD245,CD107b,CD258,CD165,CD262,CD336,erbB3,XCR1,CD38,CD138,CD70,CD16,CD144,CD213α2,CD344,CD323,Integrin β7,CD160,CD158e1,CD319,CD49c,CD354,CD314,IFN-γ R b chain,CD23,CD231,CD203c,CD140b,B7-H4,Notch 4から選択される定量物理的特性またはこれらの組み合わせを定量または検出する試薬を含む検出キットであって、当該細胞が長期造血幹細胞である検出キットを提供する。
 また、本発明は一態様において、試料中の各細胞の定量物理的特性データの類似度を利用して、各細胞または細胞画分を階層化して得られた細胞分化系統に類似した細胞画分配置空間構造または細胞配置空間構造において、各細胞の生物学的特性データを利用して1または複数の領域を特定する工程、および前記同定された細胞が富化される条件で細胞集団を培養する工程を含む、細胞の培養方法を提供する。
 また、本発明は一態様において、基準試料中の各細胞の定量物理的特性データの類似度を利用して各細胞または細胞画分を階層化して得られた細胞分化系統に類似した細胞画分配置空間構造または細胞配置空間構造と、試験試料中の各細胞の定量物理的特性データの類似度を利用して各細胞または細胞画分を階層化して得られた細胞分化系統に類似した細胞画分配置空間構造または細胞配置空間構造を比較する工程を含む、試験試料中の特定の生物学的特性を有する細胞の含有量を評価する方法を提供する。
 また、本発明は一態様において、基準試料中の各細胞の定量物理的特性データの類似度を利用して各細胞または細胞画分を階層化して得られた細胞分化系統に類似した細胞画分配置空間構造または細胞配置空間構造と、試験試料中の各細胞の定量物理的特性データの類似度を利用して各細胞または細胞画分を階層化して得られた細胞分化系統に類似した細胞画分配置空間構造または細胞配置空間構造を比較する工程を含む、試験試料中の細胞の分化状態を評価する方法を提供する。
 また、本発明は一態様において、基準試料中の各細胞の定量物理的特性データの類似度を利用して各細胞または細胞画分を階層化して得られた細胞分化系統に類似した細胞画分配置空間構造または細胞配置空間構造と、試験試料中について複数の条件下で各細胞の定量物理的特性データの類似度を利用して各細胞または細胞画分を階層化して得られた細胞分化系統に類似した細胞画分配置空間構造または細胞配置空間構造を比較する工程を含む、試験試料中の細胞の分化方向を評価する方法を提供する。
 また、本発明は一態様において、基準試料中の各細胞の定量物理的特性データの類似度を利用して各細胞または細胞画分を階層化して得られた細胞分化系統に類似した細胞画分配置空間構造または細胞配置空間構造と、試験試料の培養前と培養後の各時点における各細胞の定量物理的特性データの類似度を利用して各細胞または細胞画分を階層化して得られた細胞分化系統に類似した細胞画分配置空間構造または細胞配置空間構造を比較する工程を含む、培養方法を評価する方法を提供する。
 また、本発明は一態様において、試料中の各細胞の定量物理的特性データの類似度を利用して、各細胞または細胞画分を階層化し、細胞分化系統に類似した細胞画分配置空間構造または細胞配置空間構造を得る工程、および各細胞の生物学的特性データを利用して、前記細胞画分配置空間構造または細胞配置空間構造内の1または複数の領域を特定する工程、および、前記細胞画分配置空間構造または細胞配置空間構造において、特定の生物学的特性を有する細胞の位置を同定する工程をコンピュータに実行させるプログラムを提供する。
 また、本発明は一態様において、試料中の各細胞の定量物理的特性データの類似度を利用して、各細胞または細胞画分を階層化して得られた、細胞分化系統に類似した細胞画分配置空間構造または細胞配置空間構造において、前記細胞画分配置空間構造または細胞配置空間構造内の位置が特定される細胞を試験することで得られた生物学的特性データを可視化する工程をコンピュータに実行させるプログラムを提供する。
 また、本発明は一態様において、
 (1)各細胞について定量物理的データおよび生物学的特性データを入力する入力部;
 (2)階層化処理により細胞分化系統に類似した細胞画分配置空間構造または細胞配置空間構造を生成する処理部;および
 (3)細胞画分配置空間構造または細胞配置空間構造を出力する出力部;
を有するコンピュータを含んだシステムを提供する。
 また、本発明は一態様において、
 (1)各細胞について定量物理的データおよび生物学的特性データを入力する入力部;
 (2)階層化処理により細胞分化系統に類似した細胞画分配置空間構造または細胞配置空間構造を生成する処理部;および
 (3)特定の生物学的特性を備える細胞の物理的特性の組み合わせを出力する出力部;
を有するコンピュータを含んだシステムを提供する。
 本発明の技術は、時系列に沿って変化する細胞集団において、特定時点における細胞集団から取得した定量物理的特性データを利用して、当該細胞集団を配置(階層化)することにより、当該時系列に沿った変化を再現することができる。当該細胞画分配置空間構造または細胞配置空間構造(疑似細胞系譜)を用いて、各細胞の分化過程における時間的変遷を表現および/または分析することが可能となる。例えば、当該細胞画分配置空間構造および/または細胞配置空間構造を任意の方法により可視化することにより、分化の初期段階、すなわち幹細胞に近い細胞の同定や、枝分かれした分化系統の関係性の把握を支援することが可能となる。特に細胞の生存に影響を与えることなく取得できる定量物理的特性データ用いる場合、階層化された細胞の生物学的機能を更に実験により確認することができ、当該得られた生物学的機能に関するデータを定量物理的特性データと組み合わせることで、より詳細な解析を迅速に実施することができる。
 また、本発明の方法により、例えば、従来の手法と比較して、数千分の1の期間、費用で、例えば組織幹細胞やがん幹細胞の同定を行うことが可能となる。また、例えば、本発明の方法により、各種細胞状態の同定が容易となり、各個体(個人)の現在・将来のプロファイリング(健康、疾患状態等)を行い、個別的な治療法の提供をするために有益な情報を提供することができる。また、上記個体の細胞状態の同定と、投薬履歴および/または食事内容の関連を調査することにより、個別化治療薬のスクリーニングの支援および/または服薬、食事の個別化指導を支援することができる。また、一旦生体から取得した細胞集団をから単離された純化細胞を、一定期間培養した後に得られる細胞集団に対して、本発明の細胞並べ替えアルゴリズムを適用することにより、上記純化細胞の分化様式を評価することが可能となる。さらに、上記純化細胞を一定期間培養した際の培養条件と、上記分化様式の評価の関連を明らかにすることにより、当該純化細胞から特定の分化細胞を富化するための至適培養条件スクリーニングを支援することができる。
図1は、生体組織における細胞の細胞分化系統を示す模式図である。 図2は、生体組織における細胞分化系統と、本発明の高精度分類能モデルが生成する細胞画分配置空間構造または細胞配置空間構造の類似性を示す模式図である。 図3は、本発明の高精度分類能モデルが生成する細胞画分配置空間構造または細胞配置空間構造に生物学的特性データを適用した例を示す模式図である。 図4は、本発明の高精度分類能モデルが生成する細胞画分配置空間構造または細胞配置空間構造に生物学的特性データを適用した例を示す模式図である。細胞画分配置空間構造または細胞配置空間構造において、複数の生物学的特性について、それぞれを有する細胞の位置の関係から、目的の生物学的特性を有する細胞を含む領域を特定する例を示している。 図5は、本発明の高精度分類能モデルを有するシステムの一態様を示す模式図である。 図6は、本発明の高精度分類能モデルに含まれる処理内容の一態様を示す模式図である。 図7は、本発明の高精度分類能モデルに含まれる処理内容の別の一態様を示す模式図である。 図8は、本発明の高精度分類能モデルを有するシステムの一態様を示す模図である。 図9は、本発明の高精度分類能モデルを有するシステムの一態様において、インターフェイスの表示部に表示される画像を示す模式図である。 図10は、本発明の高精度分類能モデルを有するシステムの別の一態様を示す模式図である。 図11Aは、本発明の細胞階層化方法により得られた、ヒト臍帯血に含有される細胞の細胞配置空間構造の例を示す図である。 図11Bは、本発明の細胞階層化方法により得られた、ヒト臍帯血に含有される細胞の細胞配置空間構造における、CD34の発現レベルを示す図である。 図12Aは、本発明の細胞階層化方法により得られた、頭頸部扁平上皮癌患者の生検試料の細胞配置空間構造の例を示す図である。 図12Bは、本発明の細胞階層化方法により得られた、頭頸部扁平上皮癌患者の生検試料の細胞配置空間構造における、P-METの発現レベルを示す図である。 図12Cは、本発明の細胞階層化方法により得られた、頭頸部扁平上皮癌患者の生検試料の細胞配置空間構造における、癌細胞であることが生物学的所見により確認された細胞の予測分布を示す図である。 図12Dは、本発明の細胞階層化方法により得られた、頭頸部扁平上皮癌患者の生検試料の細胞配置空間構造における、ACTA2の発現レベルを示す図である。 図12Eは、本発明の細胞階層化方法により得られた、頭頸部扁平上皮癌患者の生検試料の細胞配置空間構造における、筋線維芽細胞であること生物学的所見により確認された細胞の分布を示す図である。
 以下、本発明の実施形態について説明する。以下の説明は単なる例示であり、本発明の範囲はこれらの説明に拘束されることはなく、本発明の趣旨を損なわない範囲で適宜変更し実施することができる。
(定義)
 本明細書において、複数の数値の範囲が示された場合、それら複数の範囲の任意の下限値および上限値の組み合わせからなる範囲も同様に意味する。
 本明細書において、「分化」とは、特殊化の程度が低い細胞が、例えば、神経細胞又は筋肉細胞などのより特殊化した細胞に変化するプロセスを意味する。「分化した」または「分化している」は、相対的な用語であり、「分化した細胞」または「分化細胞」は、それが比較されている細胞よりも発生経路のさらに先へ進み、より特殊化されていることを意味する。
 本明細書において、「幹細胞」とは、単一細胞レベルにおいて自己複製能力を有し、かつ2種以上の異なる分化細胞を産生する能力を有する未分化細胞を意味する。すなわち、幹細胞は、非対称的に分裂することができ、その際一方の娘細胞は幹細胞状態を保持し、他方の娘細胞はある別個の他の特定の生物学的機能および表現型を発現する。あるいは、幹細胞は、2つの幹細胞へ対称的に分裂することができ、したがって、幹細胞を有する細胞集団中には、いくつかの幹細胞が維持され、一方、集団中の他の細胞は分化された後代のみを生じさせる。
 例えば、「幹細胞」は、多能性幹細胞、組織幹細胞等を含んでもよく、ここで、「多能性」とは、複数のしかし限定的な数の系統の細胞へと分化できる能力を意味する。「組織幹細胞」は、例えば、外胚葉系列幹細胞、中胚葉系列幹細胞および内胚葉系列幹細胞を含む。得られた細胞が各種幹細胞であるか否かは、特異的マーカー遺伝子の発現有無等により調べることができる。また、「幹細胞」は、後述の「がん幹細胞」も含む。
 また、がん組織においても、自己複製能と腫瘍を構成する多様な系譜の細胞を生じさせる能力(多分化能)を持つ細胞が存在すると考えられており、このような細胞は「がん幹細胞」と呼ばれている。「がん幹細胞」は、「腫瘍始原細胞」や「腫瘍原性細胞/発がん性細胞」と呼ばれることもある。正常組織と同様に、がん組織においても、がん幹細胞を最上流とする分化系統が存在すると理解されている。したがって、本明細書において、定量物理特性データを利用して特定される細胞は、「がん幹細胞」等の癌組織における細胞も包含する。
 本明細書において、「造血幹細胞」とは、すべての血球(赤血球、白血球、および血小板等)に最終的に分化し得る多分化能を生涯に渡り有する細胞を意味する。造血幹細胞は、前駆細胞もしくは芽細胞への分化の中間段階を包含し得る。「前駆細胞」もしくは「芽細胞」は、本発明において交換可能に使用され、低下した分化能を有するが、特定の系列(例えば、骨髄系統もしくはリンパ系統)の異なる細胞へとなお成熟する能力がある、成熟しつつある細胞を意味する。一態様において、造血幹細胞は、マーカーLin、c-Kit、Sca-1、CD150、CD34-/低、Flk2や、マーカーLin、CD48、CD41、CD150等で同定することができる(Cell、2005年、Vol.121、pp.1109-1121)。
 本明細書において、「長期造血幹細胞」とは、細胞分裂を経ても自己複製能を長期に維持する造血幹細胞を意味し、細胞分裂によって生み出される2つの娘細胞の少なくとも一方は、分裂前の細胞と同様の造血幹細胞の形質を維持する。一態様において、長期造血幹細胞は生体内の通常の培養環境または生体外の培養環境において、細胞分裂によって自己複製能を全く失わない。また、一態様において、長期造血幹細胞は100回、50回、20回または10回の細胞分裂を経ても、自己複製能を維持する。
 当該自己複製能が維持されていることは、様々な公知の方法によって確認することができる。例えば、一定期間培養した後の細胞群に含まれる未分化細胞集団の含有率を測定することで、自己複製能が維持されていることを確認することができる。未分化細胞集団は、例えばc-Kit、Sca-1、CD11bなどの公知のマーカーの陽性・陰性の組み合わせにより同定することができる。また、一態様において、造血幹細胞が細胞分裂を経ても自己複製能を長期に維持していることは、公知の継代移植法によって確認することもできる。
 本明細書において「単離された細胞」とは、それが本来見出される生物から取り出された細胞またはそのような細胞の子孫を意味する。このような細胞は、インビトロで、例えば他の細胞の存在下で培養されたものであってもよい。また、このような細胞もしくはその子孫である細胞は、後に、第2の生物へ導入されてもよい。
 本明細書において「単離された細胞集団」とは、不均質な細胞集団から取り出され分離された細胞の集団を意味する。いくつかの態様において、単離された集団は、細胞を単離または濃縮する元となった不均質細胞集団と比べて実質的に純粋な細胞集団であってもよく、また、依然として不均質な細胞集団であってもよい。
 細胞集団が特定の細胞種について「実質的に純粋」であるとは、当該細胞集団において、細胞集団全体を構成する細胞に対して少なくとも約50%、より好ましくは少なくとも約60%、65%、70%、75%、85%、90%、92%、93%、最も好ましくは少なくとも約95%、96%、97%、98%、99%の細胞が、当該特定の細胞種の細胞から構成されていることを意味する。例えば、「実質的に純粋」な幹細胞集団とは、幹細胞でない細胞を約50%未満、より好ましくは約40%、30%、20%、15%、10%、8%、7%未満、最も好ましくは約5%、4%、3%、2%または1%未満含む細胞の集団を意味する。
 本明細書において「同定」、「分離」、「単離」、「純化」または「スクリーニング」とは、目的とするある特定の性質をもつ生物、細胞、物質、データなどの標的を、特定の操作/評価方法で多数を含む集団の中から選抜することをいう。選抜された標的は、集団から物理的に分離されてもよく、分離されなくともよい。
 本明細書において、「クラスタリング処理」または単に「クラスタリング」とは、一般的に分類対象の集合を内的結合と外的分離が達成されるような部分集合に分割するデータ処理を意味し(B.S.Everitt: Cluster Analysis,Edward Arnold,third edition(1993)、大橋 靖雄:分類手法概論,計測と制御,Vol.24,No.11,pp.999-1006(1985)、Annals of Data Science,2015,Vol.2,no.2,pp165-193)、一般に「非階層的クラスタリング」および「階層的クラスタリング」に分類される。
 「非階層的クラスタリング」は、分割の良さの評価関数を定め,その評価関数を最適にする分割を探索するデータ処理を意味する。非階層的クラスタリングは、特に限定されず当業者に公知の手法を用いて行うことができる。例えば、本発明の非階層的クラスタリングは、k-means法、混合ガウスモデル(Gaussian Mixture Model,GMM)などを用いて行うことができるが、これらに限定されない。
 「階層的クラスタリング」は、各対象をばらばらの一つのクラスターとみなして、一定の基準に基づいて類似度の高いクラスターを順次統合することによって、最終的な分類結果を得るデータ処理を意味する。処理結果は、すべての処理対象を結合するデンドログラム(樹状図)等として表現される。階層的クラスタリング分析は、特に限定されず当業者に公知の手法を用いて行うことができる。例えば、本発明の階層的クラスタリングは、群平均法、ウォード法、UPGMA、最短距離法、単連結法、最長距離法、完全連結法などを用いて行うことができるが、これらに限定されない。
 本明細書において、「定量物理的特性データ」とは、生体の各種細胞について測定される、各遺伝子のmRNA発現量や、各遺伝子から発現されるタンパク質の細胞内含量、細胞表面に露出されるタンパク質の種類、タンパク質の翻訳後修飾の状態、細胞形態等の様々な物理的特性の定量データを意味する。固有の生物学的機能を有する細胞は、これらの定量物理的特性データの組み合わせによって特定することが可能である。これらの物理的特性は公知の各種方法により一定の基準に基づいて定量することが可能であり、例えば、フローサイトメーター、次世代シークエンサー(NGS)などの装置、イメージングなどの手法を用いて取得することができるが、これらに限定されない。一態様において、物理的特性の有無を示す真偽値を疑似的な値で示すことで、定量物理的特性データとしてもよい。
 本明細書において、細胞または細胞画分の「階層化」とは、定量物理的特性データ類似性を利用し、処理対象の類似度を利用したクラスタリング処理を行うことにより、各細胞クラスター(画分)および/または各細胞の間に、定量物理的特性データセットの類似度を利用して互いの位置関係が規定され、これらの位置関係を含む細胞画分配置空間構造および/または細胞配置空間構造が得られる。
 本明細書において、「機械学習」とは、当業者の通常の理解に従って、ある局面においてデータ(学習データ)に潜むパターンをコンピュータにより見つけ出すことを意味する。また、ある局面において、以前に取得されたデータを学習することで、データを識別する識別器を構成し、これにより新たに取得したデータを識別解釈する手法を意味する。学習された識別器は、「学習済みモデル」と呼ばれることがある。機械学習の実施方法は、人工ニューラルネットワーク学習、デシジョンツリー学習、サポートベクターマシン学習、ベイジアンネットワーク学習、クラスター化、及び回帰分析、AdaBoost等から選択され得るが、これらに限定されない。
 本明細書において、「フローサイトメーター」は、一般に流路系、光学系、電気系の3つの系により構成され、個々の細胞について散乱光と蛍光を検出する公知の技術を意味する。検出された散乱光からは細胞の相対的な大きさや内部構造を、そして蛍光シグナルからは細胞膜、細胞質、核内に存在する種々の抗原、核酸の量などの情報を得ることができる。散乱光はさらに散乱する方向により前方散乱光(FSC:Forward Scattered Light)と側方散乱光(SSC:Side Scattered Light)の2種類に分類される。FSCは、散乱光の中でもレーザービームの光軸に対して前方で検出される光であり、その強度は細胞の表面積または大きさにほぼ比例する。SSCは、レーザービームの光軸に対して90°の角度で検出される光である。SSCの大部分は細胞内の物質に光が当たって散乱したものであり、細胞の顆粒性状、内部構造にほぼ比例する。一般的にFSC信号の検出器としてはフォトダイオードが用いられ、SSCと蛍光信号の検出器としては感度の高い光電子倍増管が用いられる。各検出器は細胞がレーザービームを横切ったときに発生する光信号を検出し、その強さに比例した電圧パルスを発生することで、当該電圧パルスの高さ(Height:H)、面積(Area:A)、幅(Width:W)の値が記録される。FSCおよびSSCについてのこれらの値は、一般的にFSC‐H、FSC‐A、FSC‐W、SSC‐H、SSC‐A、SSC‐Wなどと表示される。一般にフローサイトメーターは複数波長領域の蛍光を同時に検出することが可能であり、例えば、複数種の細胞表面分子を、それぞれ異なる発光波長領域を有する複数種の蛍光標識で標識することにより、各細胞におけるこれら細胞表面分子の量を同時に定量することができる。「フローサイトメーター」技術を用いた分析は「フローサイトメトリー」と呼ばれる。
(定量物理的特性データを利用した細胞階層化処理)
 生体の各種細胞は、各遺伝子の発現量や、各遺伝子から発現されるタンパク質の細胞内含量、細胞表面に露出されるタンパク質の種類、タンパク質の翻訳後修飾の状態、細胞形態等の様々な物理的特性において固有の状態を有しており、これらの物理的特性の組み合わせによって、固有の生物学的機能を有する細胞を特定することが可能である。これらの物理的特性は公知の各種方法により一定の基準に基づいて定量化することが可能であり、したがって、一定の生物学的機能を有する各種細胞は、その定量物理的特性データの組み合わせで特定することができる。
 一方、細胞分化は階層性を有しており(図1)、細胞分化階層中においてより近縁の細胞は、その定量物理的特性データにおいてもより類似していると理解される。このような定量物理的特性データ類似性を利用し、処理対象の類似度を利用したクラスタリング処理を行うことにより、各細胞クラスター(画分)および/または各細胞の間に、定量物理的特性データセットの類似度を利用した互いの位置関係が規定され、これらの位置関係を含む細胞画分配置空間構造および/または細胞配置空間構造が得られる。上記クラスタリング処理によって得られた細胞画分配置空間構造または細胞配置空間構造は、細胞分化系統樹に類似した構造を有している(図2)。
 本発明の細胞同定方法において、物理的特性データを利用した細胞階層化によって細胞画分配置空間構造または細胞配置空間構造が得られる。典型的には、当該細胞階層化は各定量物理的特性データの類似度を利用したクラスタリング処理によって、各細胞または細胞画分間に定量物理的特性データセットの類似度を利用して位置関係を特定し、当該位置関係の集合として細胞画分配置空間構造または細胞配置空間構造を得ることができる。一態様において、細胞画分配置空間構造または細胞配置空間構造は、各細胞間の定量物理的特性データセットの類似度を利用した位置関係を表すデータを集積したデータ構造として提供される。
 上記細胞画分配置空間構造または細胞配置空間構造において、類似の定量物理的特性データセットを有する細胞画分および/または細胞は、近接した位置を占める。一般に一定量の生体組織から得られる細胞集団は分化系統上様々な位置に属する細胞群を含んでおり、このような細胞群を処理対象とすることにより、分化系統上近接した位置にある細胞画分および/または細胞は、上記クラスタリング処理によって得られた細胞画分配置空間構造および/または細胞配置空間構造において近接した位置を占める。したがって、上記クラスタリング処理によって得られた細胞画分配置空間構造または細胞配置空間構造は、細胞分化系統樹に類似した構造を有している。
 当該細胞画分配置空間構造または細胞配置空間構造は、目的に応じて、任意の数の次元を有する構造として表現することができる。当該次元軸は、典型的には1またはそれ以上の数の物理的特性の合成軸として表現される。
 一態様において、本発明の細胞階層化処理は、定量物理的特性データに加えて、実験等により取得される生物学的特性データを組み合わせて行うことができる。細胞分化系統において近接する細胞は、互いに生物学的特性が近似するため、定量物理的特性データと生物学的特性データを組み合わせることで、より細胞分化系統に近似した細胞画分配置空間構造または細胞配置空間構造を得ることが可能となる。
(細胞階層化処理を用いた細胞群の同定方法)
 上記細胞分化系統樹に類似した構造を有する細胞画分配置空間構造または細胞配置空間構造において、それぞれの細胞の生物学的機能を反映する生物学的特性データを付与することにより、上記細胞画分配置空間構造または細胞配置空間構造における、特定の生物学的特性を有する細胞群の位置を特定することが可能となる(図3)。例えば、血球系細胞群から構成した細胞画分配置空間構造または細胞配置空間構造において、より未分化の状態の細胞である長期造血幹細胞に特異的に発現することの知られたマーカー、例えばCD34を発現する細胞の位置を特定することにより、当該細胞画分配置空間構造または細胞配置空間構造における、長期造血幹細胞の生物学的特性を有する細胞群の位置を同定することが可能となる。
 また、例えば、細胞画分配置空間構造または細胞配置空間構造において、各細胞の生物学的特性データを利用して分化系統上で離れた位置に属する細胞の位置を特定することにより、細胞画分配置空間構造または細胞配置空間構造と細胞分化系統樹の関係をより詳細に把握し、例えば、細胞画分配置空間構造または細胞配置空間構造において、より細胞分化系統樹上未分化な特性を有する細胞またはより分化した特性を有する細胞が位置する領域を特定することが可能となる(図4)。このような目的に、例えば分化多様性に関連するマーカー、機能試験データ等、自己複製能に関連するマーカー、機能試験データ等を利用することができ、これらを複数組み合わせて使用することができる。
 例えば、血球系細胞に適用する場合、長期造血幹細胞のマーカーを発現する細胞の位置、および、短期造血幹細胞のマーカーを発現する細胞の位置を特定することにより、細胞画分配置空間構造または細胞配置空間構造において、長期幹細胞に特徴的な特性を有する細胞群の位置する領域、あるいは、より分化した細胞に特徴的な特性を有する細胞群の位置する領域を特定することができる。
 より具体的には、分化系統の上流に位置する領域を特定することで、長期造血幹細胞候補細胞または長期造血幹細胞を特定することができる。長期造血幹細胞は自己複製能維持特性、増殖特性等様々な生理学的特性において少しずつ異なる細胞を含む多様性を含む細胞集団であると考えられている。本発明の別の態様において、これら長期造血幹細胞に含まれる細胞集団のうち、特に類似した定量物理的特性を有する亜集団に同定することができる。
 一態様において、上記生物学的特性データとしては、定量物理的特性データに使用する特性のうち、特定の生物学的特性との関連が知られているものを使用できるほか、単離した細胞群について生物学的試験することによって得られた実験結果などを使用することができる。当該試験は、インビトロまたはインビボ試験であってよく、当該生物学的特性データの構造は特に限定されず、スカラー値であってもよく、真偽値であってもよい。
 一態様において、本願発明の細胞画分配置空間構造または細胞配置空間構造と生物学的データを組み合わせる方法により、これまでに特定すべきマーカーの知られていなかった、一定の生物学的特性を有する細胞群を定量物理的特性データの組み合わせとして特定することができる。また、既に何らかのマーカーが知られていた細胞群についても、これを定量物理的特性データの組み合わせとして特定することで、より特異性の高いマーカーを提供することができるほか、既知のマーカーが存在する細胞群を、生物学的特性を利用して亜集団に分離することができる。
 一態様において、本発明のクラスタリング処理は、定量物理的特性データに対して、(1)ダウンサンプリング処理、(2)データ正規化処理および/または(3)次元縮小処理、を行った定量物理的特性データセットを対象として(4)データクラスタリング処理を行う工程を含む。上記(1)ダウンサンプリング工程では、分析対象の定量物理的特性データや細胞の分布等を利用して、クラスタリング処理に供するデータ数を減少させる。当該工程には、例えばDensity Sampling、SPADE、Decimateといった公知の手法を適用できるがこれらに限定されない。上記(2)データ処理工程では、公知の方法を用いて、定量物理的特性データの正規化、単位変換などを行う。上記(3)次元縮小処理では、公知の方法を用いて、定量物理的特性データの次元を減少させる。例えば、PCA、MDS、T-SNE、UMAP、PHATE、Modified Locally Linear Embeddingといった公知の手法を適用できるがこれらに限定されない。
 対象細胞の定量物理的特性データとしては、特に限定されず公知の手法により得られる様々なデータを利用することができる。例えば、各遺伝子から発現されるmRNAまたはタンパク質の細胞内含量、細胞表面に露出されるタンパク質の種類、タンパク質の翻訳後修飾の状態、細胞形態等の物理的特性について、定量データを取得することが可能であり、これらを定量物理的特性データとして使用することができる。特定の態様において、これらの定量物理的特性データはフローサイトメーターを用いることができ、各種抗体やレポータータンパク質を利用することもできる。また、次世代シーケンサー(NGS)を用いて各細胞の発現するmRNAを網羅的に定量したデータを用いてもよい。
任意の数の定量物理的特性データを用いることができ、例えば、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、40、50、60、70、80.90、100、150、200、250、300、350、400、450、500、600、700、800、900、1000、2000、3000、4000、5000、6000、7000、8000、9000、10000あるいは10000超の定量物理的特性データを用いることができるがこれらに限定されない。
 クラスタリング処理における分類能力は、各種細胞について設定される当該定量物理的特性データの組み合わせ、クラスタリング処理の設定パラメータなどに依存する。通常、定量物理的特性データの種類を適切に設定することにより、対象細胞集団を何らかの形態に分類することができる。例えば、定量物理的特性データの組み合わせは、対象細胞集団において各細胞を区別し得る程度にその値がばらつきを有するものであればよく、通常、定量物理的特性データの種類を増加させることにより、通常十分なばらつきを確保することが可能である。この際、細胞形態、タンパク質発現量など、物理的特性の大きく異なる定量物理的特性データを組み合わせることが好ましく、タンパク質発現量においても、それぞれ生物学的機能の異なるタンパク質の発現量を定量物理的特性データとして組み合わせることが望ましい。また、このような各定量物理的特性データのばらつきは、分散、標準偏差、あるいは変動係数といった値で定量的に評価することが可能であり、本願発明に使用する定量物理的特性データの組み合わせは、例えば対象細胞集団において、細胞間での「分散」、「標準偏差」あるいは「変動係数」の値が一定以上になる特性データを2以上組み合わせることで得ることができる。これらの値の具体的な数値は、対象となる細胞集団、使用する機器、目的とする細胞分類の精度などに基づいて当業者が適宜設定可能である。例えば、変動係数が0.01、0.02、0.03、0.04、0.05、0.06、0.07、0.08、0.09、0.10、0.15、0.2、0.3、0.4、0.5等の値を有する定量物理的特性データを組み合わせて使用することができるが、これに限定されない。
(細胞階層化処理の最適化)
 本発明の定量物理的特性データを利用した細胞同定方法に用いる細胞階層化処理は、使用するクラスタリングアルゴリズムの種類に依存するほか、例えばクラスタリング数などのクラスタリング実行時の設定パラメータに依存する。
 本発明は一態様において、処理対象とする細胞について得られた生物学的特性を実験等により取得または決定し、当該取得または決定された生物学的特性を利用して細胞階層化処理を最適化することができる。例えば、当該特性データ特定の生物学的特性を有する細胞が細胞画分配置空間構造または細胞配置空間構造上同一又は近傍の領域に階層化されるようにクラスタリング処理を最適化することができる。
 本発明は一態様において、当該細胞階層化処理を長期造血幹細胞の同定のために最適化する。これまでの研究により、ある種の長期造血幹細胞が有するマーカー分子が知られている。このようなマーカー分子を定量物理的特性の一部として使用し、当該特性データについて類似性を示す細胞群が、細胞画分配置空間構造または細胞配置空間構造上同一又は近傍の領域に階層化されるようにクラスタリング処理を最適化することができる。このような最適化において、複数の定量物理的特性について最適化することができる。
 本発明は一態様において、上記クラスタリング処理とは別に、上記定量物理的特性データを利用して検討対象の組織において公知の幹細胞を分類する識別機を、一般的な機械学習の方法を用いて構成する。そして、このように幹細胞を識別できるように学習された識別機(学習済みモデル)を解析することにより、分類に用いた各定量物理的特性データの分類における重要度を特定し、当該幹細胞を識別するために重要な一つまたは複数の定量物理的特性データを、分化系統識別定量物理的特性データとして特定する。このように、公知の幹細胞を用いて学習された学習済みモデルにより特定された一つまたは複数の分化系統識別定量物理的特性データを用いて、上記クラスタリング処理を最適化する事により、より正確に細胞分化系統に従って対象細胞を並び替え(階層化)するクラスタリング処理を構成することが可能となる(図5)。
 本発明の定量物理的特性データを利用した細胞同定方法に用いる細胞階層化処理の最適化は、クラスタリング処理の設定パラメータを変更することによって行うことができる。例えば、クラスタリング処理に組み合わせる上記(1)ダウンサンプリング処理、(2)データ処理および/または(3)次元縮小処理の処理の設定パラメータを変更することによって行うことができるが、これに限定されない。
(定量物理的特性データの取得方法)
 本発明において使用する対象細胞の定量物理的特性データは、細胞あるいは細胞画分毎に物理的特性データを定量化することのできる公知の各種方法により取得することが可能である。例えば、当該方法として上記フローサイトメーターを用いて細胞形態や細胞表面のタンパク質の発現量を定量化する方法、次世代シークエンサー(NGS)などの装置を用いて単一細胞レベルで全ゲノムmRNA発現量を定量する方法、標識化と組み合わせてイメージングにより各種定量物理的特性を定量する方法などを用いることができるが、これらに限定されない。複数の細胞表面マーカー分子を同時に定量する場合には、市販のマーカーセット(Surface Marker Screening Panel/BDBiosciences社、LEGEND SCREENING /BIO LEGEND社など)を利用することができる。
 本発明は一態様において、時系列に沿って変化する細胞集団において、特定時点における細胞集団から取得した定量物理的特性データを利用して、当該細胞集団を配置(階層化)することにより、当該時系列に沿った変化を再現する。また、別の態様において、細胞数および/またはその多様性の確保のために、複数時点において被検体から取得した細胞集団の定量物理的特性データを用いて、細胞画分配置空間または細胞配置空間を生成してもよい。さらに、異なる被検体の同様の組織から取得した細胞集団の定量物理的特性データを混在して用いてもよい。したがって、本発明の定量物理的特性データは、複数時点において単一もしくは複数の被検体から取得した細胞集団から得たものであり得る。
(細胞階層化を利用した細胞の分離方法)
 本発明の一態様において、細胞階層化により得た細胞画分配置空間構造または細胞配置空間構造の一部領域を特定する定量物理的特性データの組み合わせを利用して、セルソーターを用いて細胞を分離することができる。セルソーターは一般に各種物理的特性について特定の値範囲を有する細胞をゲーティング工程により分離することができる。基準として用いる物理的特性を複数使用したゲーティング工程を組み合わせることで、複数の定量物理的特性について、特定の値範囲を有する細胞または細胞集団を分離することができる。このような分離に用いる物理的特性データの値範囲の組み合わせは、ゲーティングパラメータ構造を構成する。例えば、細胞画分配置空間構造または細胞配置空間構造において長期造血幹細胞またはその亜集団を含む空間領域を特定する定量物理的特性データの組み合わせを反映したゲーティングパラメータ構造を使用することで、生体試料などの多様な細胞を含む細胞集団から、長期造血幹細胞またはその亜集団を分離することができる。
(細胞階層化を利用して細胞を同定するためのマーカーを選択する方法)
 本発明の一態様において、細胞階層化により得た細胞画分配置空間構造または細胞配置空間構造の一部領域を特定する定量物理的特性データの組み合わせまたはその一部は、当該領域に位置する細胞を同定するためのマーカーセットとして、細胞の分離の用途の他、例えば、生体組織内で当該細胞の局在を明らかにする目的等に使用することができる。
 本発明の一態様において、細胞画分配置空間構造または細胞配置空間構造において、特定の生物学的特性を有する細胞の位置する領域を特定するために利用できるマーカーセットは、当該生物学的特性を有する細胞を特定するための候補マーカーセットとして使用することができる。当該候補マーカーセットで特定される細胞の生物学的特性をより詳細に確認することで、目的の生物学的特性を有する細胞を、所望の精度で同定するために必要なマーカーセットを特定することができる。本発明の細胞画分配置空間構造または細胞配置空間構造を利用することにより、生物学的特性のみを利用して候補マーカーセットを同定する場合に比して、極めて短期間で候補マーカーセットを得ることができる。
 本発明の一態様において、長期造血幹細胞候補細胞を同定するための候補マーカーとして、CD217,CD191,CD328,CD34,GPR56,CD275,CD185,CD371,CD45RO,CD192,CD44,CD19,Notch 1,CD21,CD182,CD47,CD133,MRGX2,CD117,CD20,CD368,CD3,CD135,CD130,CD180,CD84,CD221,CD276,CD179b,CD85h,CD105,SUSD2,CD162,CD45RA,CD197,CD5,CXCR7,CD161,CD63,CD10,CCRL2,TRA-2-49,CD366,CD28,CD11c,CD106,CD85,CD87,CD11a,CD35,CD46,CD59,Integrin α9β1,CD99,SSEA-5,CD31,CD147,CD226,CD88,CD40,EGFR,CD131,CD58,CD126,SSEA-4,CD127/IL7R,CD194,CD43,Sialyl Lewis X,CD200R,TCR α/β,CD123,CD38、MSC,CD268,CD195,CD181,CD69,CD27,CD1b,CD18,KLRG1,CD24,CD97,CD328,CD79b,CD112,CD155,CD326,CD62L,CD45,TCR γ/δ,CD235ab,CD184,CD8a,CD52,CD49f,CD9,CD109,CD279,CD360,CD143,CD45RA,CD4,CD73,CD172a/b,CD154,CD370,Siglec-8,CD85k,CD170,Siglec-9,CD36,CD8a,CD218a,CD304,ROR1,CD1c,CD57,TNAP,CD114,TSLPR,CD278/ICOS,CD116/CSF2RA,CD103,Tim-4,TLT-2,HLA-E,CD317,CD2,CD71,CD269,CD148,HVEM,CD100,CD45RB,CD166,CD61,CD85d,CD298,CD82,DR3,CD164,CD263,CD215,CD132,CD158,MERTK、CD96,CD156c,CD230,CD66a/c/e,CD255,β2-microglobulin,CD26,Lymphotoxin β Receptor,MSC,NPC,CD32,CD81,CD201,CD274,CD48,CD183,CD243,TRA-2-54,MUC-13,CD111,CD223,CD22,CD179a,CD7,NKp80,CD334,CD199,CD300c,CD120b,CD360,TRA-1-81,CD102,CD11b/ITGAM,CD141,CD207,CD50,CD352,Delta Opioid Receptor,CD89,CD36L1,APCDD1,CD39,CD49e,CD1a,CD49b,CD30,CD324,CD122/IL2RB,CD267,CD90,CD335,CD294,CD196,HLA-A,B,C,CD303,CD200,CD229,CD95,CD213α1,CD13,CD62P,VEGFR-3,CD206,CD140a,TRA-1-60-R,CD92,CD64,Jagged 2,CCR10,CLEC4A,CD107a、FcεRIα,CD355,CD15,CD142,CD272,CD93,CD271,4-1BB Ligand,CD158b,CD365,Ksp37,IL-28RA,CD85,CD94,CD369,CD74,CD115,CD42b,CD282,CD152,CD340,CD338,CD119,GARP,LOX-1,CD151,CD337,CD29,CD104,CD1d,CD55,GPR83,CXCL16,CD261,CD318,CD25,Notch3,HLA-DR,CD85,TIGIT,CD124,CD6,CD172g,CD245,CD107b,CD258,CD165,CD262,CD336,erbB3,XCR1,CD38,CD138,CD70,CD16,CD144,CD213α2,CD344,CD323,Integrin β7,CD160,CD158e1,CD319,CD49c,CD354,CD314,IFN-γ R b chain,CD23,CD231,CD203c,CD140b,B7-H4およびNotch 4から選択される1または複数からなる候補マーカーを提供する。
 一態様において、当該物理的特性データを利用して細胞を同定するためのマーカーは、公知の他のマーカーや、生物学的特性を同定するマーカーと組み合わせて使用することができる。
(細胞を検出する検出キット)
 本発明の定量物理的特性データを利用して同定するためのマーカーとして細胞表面分子などを選択した場合、これら分子を化学的に検出、定量するための試薬を組み合わせた検出キットを提供することができる。このような試薬として、細胞表面分子を抗原とする標識化抗体、細胞表面分子に特異的親和性を有する生体親和性高分子、細胞表面分子との反応により活性が変化する酵素タンパク質などを試薬として用いることができる。
 本発明の一態様において、長期造血幹細胞候補細胞を同定するため検出キットとして、CD217,CD191,CD328,CD34,GPR56,CD275,CD185,CD371,CD45RO,CD192,CD44,CD19,Notch 1,CD21,CD182,CD47,CD133,MRGX2,CD117,CD20,CD368,CD3,CD135,CD130,CD180,CD84,CD221,CD276,CD179b,CD85h,CD105,SUSD2,CD162,CD45RA,CD197,CD5,CXCR7,CD161,CD63,CD10,CCRL2,TRA-2-49,CD366,CD28,CD11c,CD106,CD85,CD87,CD11a,CD35,CD46,CD59,Integrin α9β1,CD99,SSEA-5,CD31,CD147,CD226,CD88,CD40,EGFR,CD131,CD58,CD126,SSEA-4,CD127/IL7R,CD194,CD43,Sialyl Lewis X,CD200R,TCR α/β,CD123,CD38、MSC,CD268,CD195,CD181,CD69,CD27,CD1b,CD18,KLRG1,CD24,CD97,CD328,CD79b,CD112,CD155,CD326,CD62L,CD45,TCR γ/δ,CD235ab,CD184,CD8a,CD52,CD49f,CD9,CD109,CD279,CD360,CD143,CD45RA,CD4,CD73,CD172a/b,CD154,CD370,Siglec-8,CD85k,CD170,Siglec-9,CD36,CD8a,CD218a,CD304,ROR1,CD1c,CD57,TNAP,CD114,TSLPR,CD278/ICOS,CD116/CSF2RA,CD103,Tim-4,TLT-2,HLA-E,CD317,CD2,CD71,CD269,CD148,HVEM,CD100,CD45RB,CD166,CD61,CD85d,CD298,CD82,DR3,CD164,CD263,CD215,CD132,CD158,MERTK、CD96,CD156c,CD230,CD66a/c/e,CD255,β2-microglobulin,CD26,Lymphotoxin β Receptor,MSC,NPC,CD32,CD81,CD201,CD274,CD48,CD183,CD243,TRA-2-54,MUC-13,CD111,CD223,CD22,CD179a,CD7,NKp80,CD334,CD199,CD300c,CD120b,CD360,TRA-1-81,CD102,CD11b/ITGAM,CD141,CD207,CD50,CD352,Delta Opioid Receptor,CD89,CD36L1,APCDD1,CD39,CD49e,CD1a,CD49b,CD30,CD324,CD122/IL2RB,CD267,CD90,CD335,CD294,CD196,HLA-A,B,C,CD303,CD200,CD229,CD95,CD213α1,CD13,CD62P,VEGFR-3,CD206,CD140a,TRA-1-60-R,CD92,CD64,Jagged 2,CCR10,CLEC4A,CD107a、FcεRIα,CD355,CD15,CD142,CD272,CD93,CD271,4-1BB Ligand,CD158b,CD365,Ksp37,IL-28RA,CD85,CD94,CD369,CD74,CD115,CD42b,CD282,CD152,CD340,CD338,CD119,GARP,LOX-1,CD151,CD337,CD29,CD104,CD1d,CD55,GPR83,CXCL16,CD261,CD318,CD25,Notch3,HLA-DR,CD85,TIGIT,CD124,CD6,CD172g,CD245,CD107b,CD258,CD165,CD262,CD336,erbB3,XCR1,CD38,CD138,CD70,CD16,CD144,CD213α2,CD344,CD323,Integrin β7,CD160,CD158e1,CD319,CD49c,CD354,CD314,IFN-γ R b chain,CD23,CD231,CD203c,CD140b,B7-H4およびNotch 4から選択される1または複数と反応する試薬を含むキットを提供することができる。
(細胞階層化を利用して細胞を培養する方法)
 本発明の細胞階層化を利用して、特定の生物学的特性を有する細胞を富化するように培養条件を最適化することができる。例えば、培養開始時点の細胞集団の細胞画分配置空間構造または細胞配置空間構造と、特定の培養条件で一定期間培養した後の細胞集団の細胞画分配置空間構造または細胞配置空間構造を比較することで、当該培養条件が目的の生物学的特性を有する細胞集団の富化をもたらすか否かを判別し、より富化をもたらすような培養条件を特定することが可能となる。このように最適化された培養条件を利用することにより、特定の生物学的特性を有する細胞集団を迅速かつ大量に製造することができる。
(細胞階層化を利用して特定の生物学的特性を有する細胞の試料中の含有量を特定する方法。)
 本発明の細胞階層化を利用して、試料中の特定の生物学的特性を有する細胞の含有量を評価することができる。例えば、基準試料に含まれる細胞を階層化して得られた細胞画分配置空間構造または細胞配置空間構造と、試験試料中の細胞を階層化して得られた細胞画分配置空間構造または細胞配置空間構造を比較することで、試験試料中において特定の生物学的特性を有する細胞の含有量を、基準試料との比較として評価することができる。このように試料中の特定の生物学的特性を有する細胞の含有量を評価することで、例えば細胞製品の品質管理などを行うことができる。例えば、本方法を利用することで、凍結臍帯血等を融解したのち、どの程度長期造血幹細胞が残存しているのかを予測することや、新鮮臍帯血等にどの程度長期造血幹細胞が含まれているかを予測することができる。
(細胞階層化を利用して細胞の分化状態を評価する方法)
 本発明の細胞階層化を利用することで、試験試料中の細胞の分化状態を特定することができる。典型的には、基準試料中の各細胞を階層化して得られた細胞画分配置空間構造または細胞配置空間構造と、試験試料中の各細胞を階層化して得られた細胞画分配置空間構造または細胞配置空間構造を比較し、基準試料に対する試験試料の空間構造の偏りを分析することで、試験試料中の細胞集団の分化状態を評価することができる。
(細胞階層化を利用して細胞の分化方向を評価する方法)
 本発明の細胞階層化を利用することで、試験試料中の細胞の分化方向を評価することができる。典型的には、基準試料中の各細胞を階層化して得られた細胞画分配置空間構造または細胞配置空間構造と、試験試料中の一部について複数の時点で得られた細胞画分配置空間構造または細胞配置空間構造を比較することで、試験試料の細胞が、どの分化方向に分化しつつあるのかを評価することができる。
(細胞階層化を利用して細胞培養条件を調整する方法)
 本発明の細胞階層化を利用することで、特定の生物学的特性を有する細胞を富化することなどを目的に、細胞培養条件を調整することができる。典型的には、基準試料中の各細胞を階層化して得られた細胞画分配置空間構造または細胞配置空間構造と、試験試料の培養前と培養後の各時点における階層化により得られた細胞画分配置空間構造または細胞配置空間構造と、培養条件の関係を統計的に分析することにより、所望の効果を与える培養条件、例えば、特定の生物学的特性を有する細胞を富化する培養条件などを評価し、培養方法を調整することができる。
(細胞階層化を利用して細胞を同定するための高精度分類能モデルおよびプログラム)
 本発明の定量物理的特性データを利用した細胞の同定方法に用いられる細胞階層化工程は、必要に応じて上記(1)ダウンサンプリング処理、(2)データ処理および/または(3)次元縮小処理等と組み合わせて、対象細胞群を細胞分化階層に並べ替え、細胞画分配置空間構造または細胞配置空間構造を提供する計算処理をコンピュータに行わせる処理系として使用することができる。当該コンピュータを用いた細胞階層化処理に用いる処理系を「高精度分類能モデル」と称する(図6)。当該モデルは、コンピュータに処理を指示するプログラムとして構成され、コンピュータから読み出し可能な記憶媒体に保存することができる。
 一態様において、本発明の高精度分類能モデルは、任意に上記(1)ダウンサンプリング処理、(2)データ処理および/または(3)次元縮小処理と組み合わせて(4)クラスタリング(階層化)処理を行った後に、(5)高精度分類能モデルによって得られた細胞画分配置空間構造または細胞配置空間構造を可視化表現するための画像データを生成する可視化データ処理、(6)入力された分析パラメータに基づいて細胞画分配置空間構造または細胞配置空間構造を分析および/または修飾する分析処理、並びに(7)細胞画分配置空間構造および/または細胞配置空間構造の一部領域に含まれる細胞画分または細胞を画定する、定量物理的特性データの組み合わせ(定量物理的特性データセット)からなる自動ゲート化パラメータセットを生成する自動ゲート化パラメータセット生成処理を有していてもよい(図7)。上記可視化データ処理には、公知の方法を用いることができ、例えば、Minimum Spanning Tree、ElPiGraphなどを利用できるがこれらに限定されない。また、自動ゲート化パラメータセットの生成には、公知の方法を用いることができ、例えば、flowDensityなどを利用できるがこれらに限定されない。また、本発明のプログラムは一態様において、細胞画分配置空間構造または細胞配置空間構造を疑似3次元空間等の態様で表示部に可視化するための工程をコンピュータに実行させる。
 一態様において、(5)高精度分類能モデルによって得られた細胞画分配置空間構造または細胞配置空間構造を可視化表現するための画像データを生成する可視化データ処理、(6)入力された分析パラメータに基づいて細胞画分配置空間構造または細胞配置空間構造を分析および/または修飾する分析処理に替えて、あらかじめ指定された基準に従い、細胞画分配置空間構造または細胞配置空間構造上の領域を特定し、細胞画分配置空間構造または細胞配置空間構造を分析および/または修飾する分析処理を行ってもよい。
 当該あらかじめ指定された基準に従って細胞画分配置空間構造または細胞配置空間構造上の領域を特定しする工程として、例えば、特定の生物学的特性データを有する領域を選択すること、特定の生物学的特性データを有する複数の領域の位置関係から、指定された条件を満たす領域を選択することなどを採用することができるがこれらに限定されない。
 より具体的な例として、造血系細胞集団を階層化する場合に、長期造血幹細胞において特異的に発現するマーカーを有する細胞を含む、細胞画分配置空間構造または細胞配置空間構造上の領域を選択することや、長期造血幹細胞に特異的に発現するマーカーを発現する細胞を含む領域と、短期造血幹細胞に特異的に発現するマーカーを発現する細胞を含む領域の位置関係を利用して、より未分化な細胞を含むと考えられる領域を選択することができる。
(細胞画分配置空間構造または細胞配置空間構造を利用した分析方法およびプログラム)
 本発明は一態様において、細胞階層化により得られた細胞分化系統に類似した細胞画分配置空間構造または細胞配置空間構造において、各細胞に関する生物学的特性データを可視化することで前記空間の各領域に位置する細胞の生物学的特性を評価するための分析方法および当該方法をコンピュータにおいて実行するためのプログラムを提供する。
 本発明は一態様において、前記細胞画分配置空間構造または細胞配置空間構造内の位置が特定される細胞を分離し、当該細胞を試験することで得られた生物学的特性データを、再度前記空間構造において可視化することで前記空間の各領域に位置する細胞の生物学的特性を評価するための分析方法および当該方法をコンピュータにおいて実行するためのプログラムを提供する。
 本発明は一態様において、前記細胞画分配置空間構造または細胞配置空間構造内の位置が特定される細胞を単離し、当該細胞を試験することで得られた生物学的特性データを物理的特性データと組み合わせて、これらのデータを利用して新たに細胞画分配置空間構造または細胞配置空間構造を生成する方法および当該方法をコンピュータにおいて実行するためのプログラムを提供する。
 本発明は一態様において、上記新たに生成された細胞画分配置空間構造または細胞配置空間構造において、生物学的特性データを可視化することで更に詳細に分析を行う方法、および当該方法をコンピュータにおいて実行するためのプログラムを提供する。
 これらの方法およびプログラムを利用することにより、データを利用して所望の生物学的特性を有する細胞を同定する工程と、当該同定された細胞について生物学的実験等により得られた生物学的特性を統合的かつ再帰的に分析することが可能となり、極めて迅速に特定の生物学的機能を有する細胞を同定することなどが可能となる。
 一態様において、本発明のプログラムは、細胞画分配置空間構造または細胞配置空間構造上における可視化に替えて、統計学的に処理されたデータを出力することができる。本発明のプログラムは、更に当該出力されたデータと設定された閾値に基づいて、データ分析工程を実行することができる。
(細胞階層化を利用して細胞を同定するためのシステム)
 一態様において、本発明は、
 (1)各細胞について定量物理的データおよび生物学的特性データを入力する入力部;
 (2)階層化処理により細胞分化系統に類似した細胞画分配置空間構造または細胞配置空間構造を生成する処理部;および
 (3)細胞画分配置空間構造または細胞配置空間構造を出力する出力部;
を有するコンピュータを含んだシステムを提供する。
 このようなシステムは、生物学的特性データを細胞分化系統と相関させて分析することなどに使用できる。
 また、一態様において、本発明は、
 (1)各細胞について定量物理的データおよび生物学的特性データを入力する入力部;
 (2)階層化処理により細胞分化系統に類似した細胞画分配置空間構造または細胞配置空間構造を生成する処理部;および
 (3)特定の生物学的特性を備える細胞の物理的特性の組み合わせを出力する出力部;
を有するコンピュータを含んだシステム。
 このようなシステムは、特定の生物学的特性を有する細胞を同定することなどに使用できる。
 本発明の高精度分類能モデルを有し、これを処理するシステムに使用するコンピュータの構成を図8に示すブロック図として例示する。なお、図8はあくまでも例示に過ぎず、本発明の高精度分類能モデルを有するシステムに使用するコンピュータは図8に示す構成要素の全てを備える必要はなく、一部を省略した構成をとることも可能であるし、また、他の構成要素を加えることも可能である。
 図8に示したコンピュータ100は、CPU等から構成されるプロセッサ101、RAM、ROM、および/またはフラッシュメモリを含むメモリ102、I/O制御回路103、HDDまたはSSD等で構成される主記憶装置104含み、これらの各構成要素が制御ライン及びデータラインを介して互いに電気的に接続される。I/O制御回路103はさらに、コンピュータ外部の根ネットワーク回線105、キーボード、マウス、ディスプレイなどの入力/出力デバイス106、フローサイトメーター、セルソーターなどの分析デバイス107と同様に接続される。
 図8に示したコンピュータ100において、高精度分類能モデルにおいて実施される各情報処理を規定するプログラムコードは、主記憶装置104に記憶されている。当該プログラムコードは、I/O制御回路103を通じてプロセッサ101に読み込まれ実行される。メモリ102は、プログラムが実行される間、データの書き込み及び読み込みを実行するために一時的に用いられる。
 なお、プロセッサ101は、単一または複数のCPUで構成され得る。
 I/O制御回路103に接続したネットワーク回路は、有線または無線ネットワークであり、プログラムの実行に必要なデータの送受信等に使用される。I/O制御回路103に接続した入出力デバイス106は、プログラムの実行にあたってヒトがコンピュータを操作する際に使用するマウス、キーボードなどの入力デバイス、および/または、LCDディスプレイ、スピーカなどの、コンピュータの処理結果をヒトに認識させるための出力デバイスによって構成される。I/O制御回路103に接続した分析デバイス107は、フローサイトメーターやセルソーター等のデバイスによって構成され、定量物理的特性データの取得や、細胞単離に使用される。
 本発明の一態様において、上記入出力デバイス106は、高精度分類能モデルよって生成された、表示用画像データを表示する画像表示部を有する。
 本発明の一態様において、上記入出力デバイス106は、上記画像表示部に表示された画像上でその一部領域および当該領域に対して行う処理を指定する処理入力部を有しており、当該選択された領域および処理を特定する情報をコンピュータに伝達する。コンピュータは、高精度分類能モデルのデータ分析処理により当該選択された領域に対応する細胞画分配置空間構造または細胞配置空間構造データの領域を特定し、当該空間構造データに対して、指定された処理を行う。
 本発明の一態様において、高精度分類能モデルで生成された上記処理結果を表示するための表示用画像データは、入出力デバイスの画像表示部に表示される。当該分析、表示処理の過程は任意の回数繰り返すことができ、双方向性のヒューマンインターフェースを構成することができる。
 当該インターフェイスは、例えば、2次元、または3次元空間に、高精度分類能モデルで分画された各細胞画分に含まれる細胞を、画分毎に異なる色でプロットしたグラフ(画像)を、2次元画像として表示する画像表示部を備えることができる。また、当該インターフェイスは観察する視点を操作可能な入力手段を有することができる。3次元空間にプロットしたグラフを2次元画像として表示する場合、3次元空間の各軸(次元軸)を回転させて視点を変更するための入力手段を有してもよい。そのような入力手段として、表示部にスクロールバー、仮想トラックボール、仮想ジョイスティックなどを表示して、これを表示部に表示されるマウスポインタ等で操作する手段を設けてもよいし、マウス、トラックパッド、ジョイスティックなどのハードウェアの動作と視点変更を関連付けてもよい。
 本発明の一態様において、インターフェイスの画像表示部に表示される画像を図9に示す。当該画像は、3次元空間に、高精度分類能モデルで分画された各細胞画分に含まれる細胞を、画分毎に異なる色でプロットしたグラフ(201)を含んでいる。当該グラフは、仮想ジョイスティック(202)をマウスポインタ(203)で操作することにより回転させることができる。また、マウスポインタ(203)で上記グラフ(201)中の領域(204)を指定することにより、当該領域に含まれる細胞または細胞画分を特定することができる。情報表示部(205)は、分析に用いたすべての細胞に関する数値データや、上記グラフ中で特定された領域に属する細胞に関するデータ等を表示することができる。また、画像中に表示されたボタン(206)や、プルダウンメニュー(207)をマウスポインタで操作することにより、分析データ全体または上記特定された領域に属する細胞の解析、データの保存等、各種処理を指定することができる。当該図は一例であり、本発明は他の構成を有するインターフェイスを備えてもよい。
 本発明の一態様において、上記分析デバイス107は、フローサイトメーター、次世代シーケンサー(NGS)、イメージング機器、物性解析装置などの、分析対象検体から定量物理的特性データを検出するための測定部を有している。また別の態様において、上記分析デバイス107は、セルソーター等の、細胞集団を定量物理的特性データセットを利用して単離するための検体処理部を有している。
 本発明の一態様において、上記測定部は分析対象検体の各細胞について複数種の定量物理的特性データを取得し、コンピュータに提供する。コンピュータは当該定量物理的特性データを直接高精度分類能モデルにて処理するほか、当該分析対象検体に含まれる複数の細胞から得られた定量物理的特性データの全部または一部を、任意のフォーマットのデータ構造体として主記憶装置に保存することができる。
 本発明の一態様において、上記検体処理部は、コンピュータの高精度分類能モデルの自動ゲート化パラメータセット生成処理によって生成された定量物理的特性データセットを利用して、検体細胞群を分割し、またはその一部を単離することができる。当該検体から取得された細胞群は、高精度分類能モデルにおける細胞画分配置空間構造または細胞配置空間構造データの生成に用いた細胞群自体でもよく、また、これと同種の検体から取得された細胞群でもよい。
 本発明の一態様において、上記コンピュータは複数使用することができ、各コンピュータが高精度分類能モデルの各処理を個別に行い、ネットワーク回線を通じて処理結果をやり取りしてもよい。また、上記入出力デバイスおよび分析デバイスとコンピュータをネットワーク回線で接続してもよく、システム全体としてCloudネットワーク構成を有していてもよい(図10)。
 本発明の高精度分類能モデルを有するシステムとして、当該高精度分類能モデルの生成、拡張を行う学習ユニットと、学習済み高精度分類能モデルを用いて対象細胞の分類を行う識別ユニットを有するシステムを構成することができる。
 当該システムは、必要に応じて、高精度分類能モデルの状態を調査するため等に使用される管理機能、レポート機能等、他の機能を含んでもよい(図5)。
 以下、実施例により本発明をさらに詳細に説明するが、本発明はこれらによって限定されるものではない。
 実施例1:マウスの長期造血幹細胞の同定
 細胞の採取
 長期造血幹細胞特異的レポーターマウス(ゲノム上のHoxb5遺伝子を3コピーのmcherry蛍光タンパク質をコードする遺伝子と融合したHoxb5遺伝子と置換したマウス;nature、2016年、Vol.530,pp.223-227)骨髄より、骨髄細胞を採取した。
 定量物理的データの取得
 下記の16種の物理的特性について、定量データを取得した。
 具体的には、骨髄細胞を抗体染色用バーファー液(PBS/2%FCS/2mM EDTA等)に懸濁し、細胞染色は全て氷上で行う。抗c-kit抗体で染色した後、c-Kit陽性細胞をMACS(Magnetic-activated cell sorting)を用いて濃縮した。その後、濃縮されたc-Kit陽性細胞に残りの抗体を順次加え染色し、最後に死細胞除去のためDNA染色試薬としてSYTOX-Redを加えた。染色した細胞は、フローサイトメーターおよび専用ソフトウェアBD FACSDivaを用いてデータ採取を行った。機械学習用データは、FlowJoを用いて解析、抽出した。
Figure JPOXMLDOC01-appb-I000001
 細胞並べ替え(階層化)処理
 得られた物理的定量特性データに基づいてHSC細胞群を同定する識別機を解析することで分化系統識別定量物理的特性データを特定し、これによりGausianMixtureModelを用いた非階層化クラスタリング処理を最適化した。
 具体的には、以下の2つのステップにて実施した。
 (工程1)分化系統識別定量物理的特性データの特定
 はじめに、既にHoxb5陽性に基づいて特定済みであるHSC細胞群を正解データとして、機械学習による教師有り学習によりサンプルデータ220,610件から、HSCを分類可能な機械学習モデル(AdaBoost)を構築した。その際、上記16個のパラメータのうち、分類に重要な寄与を果たしているパラメータを特定したところ、Att12、9および14が分類に重要な寄与を果たしているパラメータであることが判明した。したがって、Att12、9および14を分化系統識別定量物理的特性データとして特定した。なお、これらのパラメータの組み合わせによりHoxb5陽性のHSCが同定される結果は予想外のものであった。
 (工程2)クラスタリングの最適化およびクラスタリング
 次に、16個のパラメータすべてを対象として、正解データを用いずに非階層クラスタリング(GausianMixtureModel)を実行した。この際、Att12、9および14を含むクラスター数が最少となるように、クラスター数を設定することで、クラスタリング処理を最適化した。その結果、サンプルデータ220,610件(各サンプルデータは個々の細胞を表す)のデータを101のクラスターに分割するようにクラスタリング処理が最適化された。クラスタリング結果の得られた各クラスターに含まれるサンプルデータを確認すると、Att12、9および14を有する細胞を含むクラスターは、101のクラスターのうち3つであった。当該3つのクラスターには、総計1,198件のサンプルデータが分類された。
 当該分類結果を解析したところ、mCherry陽性細胞すなわちHoxb5陽性HSC細胞は上記3つのクラスターに全て分類され、細胞分化系統の分化階層にしたがって細胞を階層化できるように、クラスタリング処理が最適化されたことが確認された。
 細胞階層化による長期造血幹細胞の高速同定
 全骨髄有核細胞(250,304件)について、上記16の物理的特性について定量物理的特性データを取得し、当該定量物理的特性データに基づいて、細胞並べ替え(階層化)処理を実行した結果を3次元空間構造に配置し、これを画像化した。
 次に、既にHoxb5陽性に基づいて特定済みであるLT-HSC細胞群(331件)およびHoxb5陰性に基づいて特定済みであるST-HSC細胞群(1,081件)が、上記3次元空間構造中に配置された位置を検証した。
 その結果、Hoxb5陽性に基づいて特定済みであるLT-HSC細胞群(331件)およびHoxb5陰性に基づいて特定済みであるST-HSC細胞群(1,081件)は、上記3次元空間構造中の特定の領域に集中的に配置され、かつ、生物学的な細胞分化の順序に従い配置されている事が確認された。具体的には3次元空間構造の末端の一つを起点として、LT-HSC細胞群が、次にST-HSC細胞群が配置されている事が確認された。
 また、この3次元空間構造への細胞の配置において上記16個の各パラメータの寄与度についても数値化を試み、Att12、16および10が分類に重要な寄与を果たしているパラメータであることが判明した。
 実施例2:ヒト血球系細胞の階層化
 ヒト臍帯血について、市販のマーカーセット(CD34を含む)を利用してフローサイトメーターにより定量物理的特性データを取得し、本発明の定量物理的特性データを利用した細胞階層化処理により細胞配置空間構造を得た。当該細胞配置空間を3次元で示した例を図11Aに示す。
 上記細胞配置空間構造において、ある種の長期造血幹細胞において発現することの知られたCD34の発現量を段階0~9に分類し、各細胞におけるCD34の発現量段階を、前記細胞配置空間構造上にマップした(図11B)。CD34の発現量の多い細胞は細胞配置空間構造の一端に集中しており、定量物理的特性データを利用した細胞階層化処理により得られた細胞配置空間構造が、細胞系統関係を反映していることを示している。
 実施例3:頭頸部扁平上皮癌細胞の階層化
(1)癌細胞の同定
 公知の方法により頭頸部扁平上皮癌患者から得られた癌細胞を含む生検試料について(Cell,Vol.171,no.7, pp.1611-1624)、定量物理的特性データを利用した本発明の細胞階層化処理により細胞配置空間構造を得た。当該細胞配置空間を3次元で示した例を図12Aに示す。癌細胞において発現することの知られたP-METの発現量をSingle-cell RNAseqにより同定したデータを前記細胞配置空間構造上にマップして図12Bを得た。P-METの発現量を段階0~9に分類した。一方、生物学的所見から癌細胞であると判断された細胞の位置を、前記細胞配置空間構造上にマップして図12Cを得た。
(2)筋繊維芽細胞の同定
 実施例3で得られた細胞配置空間において、筋繊維芽細胞において発現することの知られたACTA2の発現量をSingle-cell RNAseqにより同定したデータをマップして、図12Dを得た。ACTA2の発現量を段階0~1に分類した。一方、生物学的所見から筋繊維芽細胞であると判断された細胞の位置を、前記細胞配置空間構造上にマップして図12Eを得た。
 図12A~Eから、本発明の細胞階層化により得られた細胞配置空間構造において、生物学的特性を示すデータにより特定される領域と、実験的に生物学的特性が確認された細胞の位置が高い相関を示すことが理解される。
 実施例4:ヒト長期造血幹細胞を特定するための候補マーカーの同定
 上記実施例2で得たヒト臍帯血から得た細胞配置空間構造において、CD34の発現量分布パターンを特定する物理的特性データの組み合わせを特定し、当該特定に対して各物理的特性データの与える影響を数値化した。より影響の大きい物理的特性データを、長期造血幹細胞の特定に重要な物理的特性として、++++~+に分類して下記表に示す。
Figure JPOXMLDOC01-appb-I000002
Figure JPOXMLDOC01-appb-I000003
 上記物理的特性は、長期造血幹細胞を特定するための候補マーカーとして使用することができる。候補マーカーにより特定される細胞の生物学的特徴を分析することで、より高精度で長期造血幹細胞を特定する候補マーカーを同定することが可能となる。各分析段階において本発明の細胞階層化を利用して候補マーカーの重要度を付与することにより、迅速に候補マーカーの高精度化を達成することができる。
 本発明により、細胞を階層化して得た細胞画分配置空間構造および/または細胞配置空間構造を任意の方法により可視化することにより、分化の初期段階、すなわち幹細胞に近い細胞の同定や、枝分かれした分化系統の関係性の把握を支援することが可能となる。また、本発明の細胞階層化を利用することにより、より短期間で安価に組織幹細胞やがん幹細胞の同定を行うことが可能となり、また、各個体(個人)の現在・将来のプロファイリング(健康、疾患状態等)を行い、個別的な治療法の提供をするために有益な情報を提供することができる。また、上記個体の細胞状態の同定と、投薬履歴および/または食事内容の関連を調査することにより、個別化治療薬のスクリーニングの支援および/または服薬、食事の個別化指導を支援することができる。また、一旦生体から取得した細胞集団をから単離された純化細胞を、一定期間培養した後に得られる細胞集団に対して、本発明の細胞階層化を適用することにより、上記純化細胞の分化様式を評価することが可能となる。さらに、上記純化細胞を一定期間培養した際の培養条件と、上記分化様式の評価の関連を明らかにすることにより、当該純化細胞から特定の分化細胞を富化するための至適培養条件スクリーニングを支援することができる。また、本発明の細胞階層化を利用することにより、細胞集団に含まれる特定細胞の細胞含有率、細胞集団の分化状態、分化方向を評価し、細胞の品質評価を行うことができる。

Claims (16)

  1.  試料中の各細胞の定量物理的特性データの類似度を利用して、各細胞または細胞画分を階層化し、細胞分化系統に類似した細胞画分配置空間構造または細胞配置空間構造を得る工程、および各細胞の生物学的特性データを利用して、前記細胞画分配置空間構造または細胞配置空間構造内の領域を特定する工程を含む、特定の生物学的特性を有する細胞を同定する方法。
  2.  前記各細胞の生物学的特性データを利用した領域の特定は、各細胞または細胞画分における、生物学的特性と関連付けられたマーカーの量または有無による特定である、前記請求項1に記載の方法。
  3.  前記各細胞の生物学的特性データを利用した領域の特定は、生物学的特性と関連付けられたマーカーを有する細胞の、細胞画分配置空間構造または細胞配置空間構造上の位置を利用した特定である、前記請求項1に記載の方法。
  4.  試料中の各細胞の定量物理的特性データの類似度を利用して各細胞または細胞画分を階層化して得られた細胞分化系統に類似した細胞画分配置空間構造または細胞配置空間構造において、特定の生物学的特性を有する細胞の位置する領域を特定する工程、および特定の生物学的特性を有する細胞を分離するためのゲーティングパラメータ構造を取得する工程を含む、定量物理的特性データを用いた細胞の単離方法。
  5.  試料中の各細胞の定量物理的特性データの類似度を利用して各細胞または細胞画分を階層化して得られた細胞分化系統に類似した細胞画分配置空間構造または細胞配置空間構造において、各細胞の生物学的特性データに基づいて1または複数の領域を特定する工程を含む、特定の生物学的特性を有する細胞を特定するための候補マーカーセットを同定する方法。
  6.  特定の生物学的特性を有する細胞を同定するための、CD217,CD191,CD328,CD34,GPR56,CD275,CD185,CD371,CD45RO,CD192,CD44,CD19,Notch 1,CD21,CD182,CD47,CD133,MRGX2,CD117,CD20,CD368,CD3,CD135,CD130,CD180,CD84,CD221,CD276,CD179b,CD85h,CD105,SUSD2,CD162,CD45RA,CD197,CD5,CXCR7,CD161,CD63,CD10,CCRL2,TRA-2-49,CD366,CD28,CD11c,CD106,CD85,CD87,CD11a,CD35,CD46,CD59,Integrin α9β1,CD99,SSEA-5,CD31,CD147,CD226,CD88,CD40,EGFR,CD131,CD58,CD126,SSEA-4,CD127/IL7R,CD194,CD43,Sialyl Lewis X,CD200R,TCR α/β,CD123,CD38、MSC,CD268,CD195,CD181,CD69,CD27,CD1b,CD18,KLRG1,CD24,CD97,CD328,CD79b,CD112,CD155,CD326,CD62L,CD45,TCR γ/δ,CD235ab,CD184,CD8a,CD52,CD49f,CD9,CD109,CD279,CD360,CD143,CD45RA,CD4,CD73,CD172a/b,CD154,CD370,Siglec-8,CD85k,CD170,Siglec-9,CD36,CD8a,CD218a,CD304,ROR1,CD1c,CD57,TNAP,CD114,TSLPR,CD278/ICOS,CD116/CSF2RA,CD103,Tim-4,TLT-2,HLA-E,CD317,CD2,CD71,CD269,CD148,HVEM,CD100,CD45RB,CD166,CD61,CD85d,CD298,CD82,DR3,CD164,CD263,CD215,CD132,CD158,MERTK、CD96,CD156c,CD230,CD66a/c/e,CD255,β2-microglobulin,CD26,Lymphotoxin β Receptor,MSC,NPC,CD32,CD81,CD201,CD274,CD48,CD183,CD243,TRA-2-54,MUC-13,CD111,CD223,CD22,CD179a,CD7,NKp80,CD334,CD199,CD300c,CD120b,CD360,TRA-1-81,CD102,CD11b/ITGAM,CD141,CD207,CD50,CD352,Delta Opioid Receptor,CD89,CD36L1,APCDD1,CD39,CD49e,CD1a,CD49b,CD30,CD324,CD122/IL2RB,CD267,CD90,CD335,CD294,CD196,HLA-A,B,C,CD303,CD200,CD229,CD95,CD213α1,CD13,CD62P,VEGFR-3,CD206,CD140a,TRA-1-60-R,CD92,CD64,Jagged 2,CCR10,CLEC4A,CD107a、FcεRIα,CD355,CD15,CD142,CD272,CD93,CD271,4-1BB Ligand,CD158b,CD365,Ksp37,IL-28RA,CD85,CD94,CD369,CD74,CD115,CD42b,CD282,CD152,CD340,CD338,CD119,GARP,LOX-1,CD151,CD337,CD29,CD104,CD1d,CD55,GPR83,CXCL16,CD261,CD318,CD25,Notch3,HLA-DR,CD85,TIGIT,CD124,CD6,CD172g,CD245,CD107b,CD258,CD165,CD262,CD336,erbB3,XCR1,CD38,CD138,CD70,CD16,CD144,CD213α2,CD344,CD323,Integrin β7,CD160,CD158e1,CD319,CD49c,CD354,CD314,IFN-γ R b chain,CD23,CD231,CD203c,CD140b,B7-H4,Notch 4から選択される定量物理的特性またはこれらの組み合わせを含むマーカーであって、当該細胞が長期造血幹細胞であるマーカー。
  7.  特定の生物学的特性を有する細胞を同定するための、CD217,CD191,CD328,CD34,GPR56,CD275,CD185,CD371,CD45RO,CD192,CD44,CD19,Notch 1,CD21,CD182,CD47,CD133,MRGX2,CD117,CD20,CD368,CD3,CD135,CD130,CD180,CD84,CD221,CD276,CD179b,CD85h,CD105,SUSD2,CD162,CD45RA,CD197,CD5,CXCR7,CD161,CD63,CD10,CCRL2,TRA-2-49,CD366,CD28,CD11c,CD106,CD85,CD87,CD11a,CD35,CD46,CD59,Integrin α9β1,CD99,SSEA-5,CD31,CD147,CD226,CD88,CD40,EGFR,CD131,CD58,CD126,SSEA-4,CD127/IL7R,CD194,CD43,Sialyl Lewis X,CD200R,TCR α/β,CD123,CD38、MSC,CD268,CD195,CD181,CD69,CD27,CD1b,CD18,KLRG1,CD24,CD97,CD328,CD79b,CD112,CD155,CD326,CD62L,CD45,TCR γ/δ,CD235ab,CD184,CD8a,CD52,CD49f,CD9,CD109,CD279,CD360,CD143,CD45RA,CD4,CD73,CD172a/b,CD154,CD370,Siglec-8,CD85k,CD170,Siglec-9,CD36,CD8a,CD218a,CD304,ROR1,CD1c,CD57,TNAP,CD114,TSLPR,CD278/ICOS,CD116/CSF2RA,CD103,Tim-4,TLT-2,HLA-E,CD317,CD2,CD71,CD269,CD148,HVEM,CD100,CD45RB,CD166,CD61,CD85d,CD298,CD82,DR3,CD164,CD263,CD215,CD132,CD158,MERTK、CD96,CD156c,CD230,CD66a/c/e,CD255,β2-microglobulin,CD26,Lymphotoxin β Receptor,MSC,NPC,CD32,CD81,CD201,CD274,CD48,CD183,CD243,TRA-2-54,MUC-13,CD111,CD223,CD22,CD179a,CD7,NKp80,CD334,CD199,CD300c,CD120b,CD360,TRA-1-81,CD102,CD11b/ITGAM,CD141,CD207,CD50,CD352,Delta Opioid Receptor,CD89,CD36L1,APCDD1,CD39,CD49e,CD1a,CD49b,CD30,CD324,CD122/IL2RB,CD267,CD90,CD335,CD294,CD196,HLA-A,B,C,CD303,CD200,CD229,CD95,CD213α1,CD13,CD62P,VEGFR-3,CD206,CD140a,TRA-1-60-R,CD92,CD64,Jagged 2,CCR10,CLEC4A,CD107a、FcεRIα,CD355,CD15,CD142,CD272,CD93,CD271,4-1BB Ligand,CD158b,CD365,Ksp37,IL-28RA,CD85,CD94,CD369,CD74,CD115,CD42b,CD282,CD152,CD340,CD338,CD119,GARP,LOX-1,CD151,CD337,CD29,CD104,CD1d,CD55,GPR83,CXCL16,CD261,CD318,CD25,Notch3,HLA-DR,CD85,TIGIT,CD124,CD6,CD172g,CD245,CD107b,CD258,CD165,CD262,CD336,erbB3,XCR1,CD38,CD138,CD70,CD16,CD144,CD213α2,CD344,CD323,Integrin β7,CD160,CD158e1,CD319,CD49c,CD354,CD314,IFN-γ R b chain,CD23,CD231,CD203c,CD140b,B7-H4,Notch 4から選択される定量物理的特性またはこれらの組み合わせを定量または検出する試薬を含む検出キットであって、当該細胞が長期造血幹細胞である検出キット。
  8.  試料中の各細胞の定量物理的特性データの類似度を利用して、各細胞または細胞画分を階層化して得られた細胞分化系統に類似した細胞画分配置空間構造または細胞配置空間構造において、各細胞の生物学的特性データを利用して1または複数の領域を特定する工程、および、前記同定された細胞が富化される条件で細胞集団を培養する工程を含む、細胞の培養方法。
  9.  基準試料中の各細胞の定量物理的特性データの類似度を利用して各細胞または細胞画分を階層化して得られた細胞分化系統に類似した細胞画分配置空間構造または細胞配置空間構造と、試験試料中の各細胞の定量物理的特性データの類似度を利用して各細胞または細胞画分を階層化して得られた細胞分化系統に類似した細胞画分配置空間構造または細胞配置空間構造を比較する工程を含む、試験試料中における特定の生物学的特性を有する細胞の含有量を評価する方法。
  10.  基準試料中の各細胞の定量物理的特性データの類似度を利用して各細胞または細胞画分を階層化して得られた細胞分化系統に類似した細胞画分配置空間構造または細胞配置空間構造と、試験試料中の各細胞の定量物理的特性データの類似度を利用して各細胞または細胞画分を階層化して得られた細胞分化系統に類似した細胞画分配置空間構造または細胞配置空間構造を比較する工程を含む、試験試料中の細胞の分化状態を評価する方法。
  11.  基準試料中の各細胞の定量物理的特性データの類似度を利用して各細胞または細胞画分を階層化して得られた細胞分化系統に類似した細胞画分配置空間構造または細胞配置空間構造と、試験試料中について、複数の条件下で、各細胞の定量物理的特性データの類似度を利用して各細胞または細胞画分を階層化して得られた細胞分化系統に類似した細胞画分配置空間構造または細胞配置空間構造を比較する工程を含む、試験試料中の細胞の分化方向を評価する方法。
  12.  基準試料中の各細胞の定量物理的特性データの類似度を利用して各細胞または細胞画分を階層化して得られた細胞分化系統に類似した細胞画分配置空間構造または細胞配置空間構造と、試験試料について、特定条件下での培養前と培養後の各時点における各細胞の定量物理的特性データの類似度を利用して各細胞または細胞画分を階層化して得られた細胞分化系統に類似した細胞画分配置空間構造または細胞配置空間構造を比較する工程を含む、培養方法を評価する方法。
  13.  試料中の各細胞の定量物理的特性データの類似度を利用して、各細胞または細胞画分を階層化し、細胞分化系統に類似した細胞画分配置空間構造または細胞配置空間構造を得る工程、および各細胞の生物学的特性データを利用して、前記細胞画分配置空間構造または細胞配置空間構造内の1または複数の領域を特定する工程、および、前記細胞画分配置空間構造または細胞配置空間構造において、特定の生物学的特性を有する細胞の位置を同定する工程をコンピュータに実行させるプログラム。
  14.  試料中の各細胞の定量物理的特性データの類似度を利用して、各細胞または細胞画分を階層化して得られた、細胞分化系統に類似した細胞画分配置空間構造または細胞配置空間構造において、前記細胞画分配置空間構造または細胞配置空間構造内の位置が特定される細胞を試験することで得られた生物学的特性データを可視化する工程をコンピュータに実行させるプログラム。
  15.  (1)各細胞について定量物理的データおよび生物学的特性データを入力する入力部;
     (2)階層化処理により細胞分化系統に類似した細胞画分配置空間構造または細胞配置空間構造を生成する処理部;および
     (3)細胞画分配置空間構造または細胞配置空間構造を出力する出力部;
    を有するコンピュータを含んだシステム。
  16.  (1)各細胞について定量物理的データおよび生物学的特性データを入力する入力部;
     (2)階層化処理により細胞分化系統に類似した細胞画分配置空間構造または細胞配置空間構造を生成する処理部;および
     (3)特定の生物学的特性を備える細胞の物理的特性の組み合わせを出力する出力部;
    を有するコンピュータを含んだシステム。
PCT/JP2020/025915 2018-12-28 2020-07-01 細胞階層化処理により特定の生物学的特徴を有する細胞を同定する方法およびその応用方法 WO2021131110A1 (ja)

Priority Applications (9)

Application Number Priority Date Filing Date Title
US17/789,279 US20230039070A1 (en) 2018-12-28 2020-07-01 Method for identifying cell having specific biological characteristics by cell classification process and application method thereof
JP2021566786A JPWO2021131110A1 (ja) 2018-12-28 2020-07-01
US18/014,112 US20230279354A1 (en) 2020-07-01 2021-07-01 Human long-term hematopoietic stem cell marker
PCT/JP2021/025050 WO2022004864A1 (ja) 2020-07-01 2021-07-01 ヒト長期造血幹細胞マーカー
CN202180053451.XA CN116075311A (zh) 2020-07-01 2021-07-01 人长期造血干细胞标志物
KR1020237001669A KR20230034299A (ko) 2020-07-01 2021-07-01 인간 장기 조혈 간세포 마커
JP2021542548A JP7215776B2 (ja) 2020-07-01 2021-07-01 ヒト長期造血幹細胞マーカー
EP21834496.8A EP4177337A1 (en) 2020-07-01 2021-07-01 Human long-term hematopoietic stem cell marker
JP2022040623A JP2022179822A (ja) 2020-07-01 2022-03-15 ヒト長期造血幹細胞マーカー

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2018247567 2018-12-28
PCT/JP2019/051270 WO2020138351A1 (ja) 2018-12-28 2019-12-26 細胞並べ替え(階層化)処理システム。
JPPCT/JP2019/051270 2019-12-26

Publications (1)

Publication Number Publication Date
WO2021131110A1 true WO2021131110A1 (ja) 2021-07-01

Family

ID=71128786

Family Applications (2)

Application Number Title Priority Date Filing Date
PCT/JP2019/051270 WO2020138351A1 (ja) 2018-12-28 2019-12-26 細胞並べ替え(階層化)処理システム。
PCT/JP2020/025915 WO2021131110A1 (ja) 2018-12-28 2020-07-01 細胞階層化処理により特定の生物学的特徴を有する細胞を同定する方法およびその応用方法

Family Applications Before (1)

Application Number Title Priority Date Filing Date
PCT/JP2019/051270 WO2020138351A1 (ja) 2018-12-28 2019-12-26 細胞並べ替え(階層化)処理システム。

Country Status (3)

Country Link
US (1) US20230039070A1 (ja)
JP (2) JPWO2020138351A1 (ja)
WO (2) WO2020138351A1 (ja)

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1836557A4 (en) * 2004-11-19 2009-01-21 Trillium Diagnostics Llc SOFTWARE-INTEGRATED FLOW CYTOMETRY TEST FOR QUANTITATING THE HUMAN POLYMORPH-ACID LEUKOCYTIC FC RI RECEPTOR (CD64)
AU2012267489B2 (en) * 2011-06-10 2017-03-16 The Trustees Of The University Of Pennsylvania System and method of cytomic vascular health profiling

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
BYUNGJIN HWANG, JI HYUN LEE, DUHEE BANG: "Single-cell RNA sequencing technologies and bioinformatics pipelines", EXPERIMENTAL & MOLECULAR MEDICINE, vol. 50, no. 8, 1 August 2018 (2018-08-01), XP055723644, DOI: 10.1038/s12276-018-0071-8 *
VELTEN LARS, HAAS SIMON F., RAFFEL SIMON, BLASZKIEWICZ SANDRA, ISLAM SAIFUL, HENNIG BIANCA P., HIRCHE CHRISTOPH, LUTZ CHRISTOPH, B: "Human haematopoietic stem cell lineage commitment is a continuous process", NATURE CELL BIOLOGY, NATURE PUBLISHING GROUP UK, LONDON, vol. 19, no. 4, 1 April 2017 (2017-04-01), London, pages 271 - 281, XP055834340, ISSN: 1465-7392, DOI: 10.1038/ncb3493 *

Also Published As

Publication number Publication date
JPWO2020138351A1 (ja) 2020-07-02
US20230039070A1 (en) 2023-02-09
JPWO2021131110A1 (ja) 2021-07-01
WO2020138351A1 (ja) 2020-07-02

Similar Documents

Publication Publication Date Title
Watcham et al. New insights into hematopoietic differentiation landscapes from single-cell RNA sequencing
Triana et al. Single-cell proteo-genomic reference maps of the hematopoietic system enable the purification and massive profiling of precisely defined cell states
Baron et al. Cell type purification by single-cell transcriptome-trained sorting
EP2951722B1 (en) Process for identifying rare events
Tighe et al. Improving the quality and reproducibility of flow cytometry in the lung. An official American Thoracic Society workshop report
Kalina et al. CD maps—dynamic profiling of CD1–CD100 surface expression on human leukocyte and lymphocyte subsets
Toghi Eshghi et al. Quantitative comparison of conventional and t-SNE-guided gating analyses
Peng et al. Cell–cell communication inference and analysis in the tumour microenvironments from single-cell transcriptomics: data resources and computational strategies
US20220237930A1 (en) Cell age classification and drug screening
WO2006025028A2 (en) Novel classification method of blood cells and tailor-made therapy and prevention based thereupon
Chamberlain et al. Cell type classification and discovery across diseases, technologies and tissues reveals conserved gene signatures and enables standardized single-cell readouts
Lian et al. Artificial-cell-type aware cell-type classification in CITE-seq
CN116075311A (zh) 人长期造血干细胞标志物
WO2021131110A1 (ja) 細胞階層化処理により特定の生物学的特徴を有する細胞を同定する方法およびその応用方法
Zhang et al. Probabilistic cell type assignment of single-cell transcriptomic data reveals spatiotemporal microenvironment dynamics in human cancers
Alacid et al. A cell–cell atlas approach for understanding symbiotic interactions between microbes
Lucas et al. Advances in acute myeloid leukemia classification, prognostication and monitoring by flow cytometry
CN115917316A (zh) 嗜中性粒细胞祖细胞及相关方法和用途
Houtsma et al. CombiFlow: Flow cytometry-based identification and characterization of genetically and functionally distinct AML subclones
JP2022021661A (ja) シングルセルゲノム配列とメタゲノム配列を統合する新規処理法
Briggs et al. Single cell transcriptomic analysis of bloodstream form Trypanosoma brucei reconstructs cell cycle progression and differentiation via quorum sensing
Simpson et al. Lifting the curse from high dimensional data: Automated projection pursuit clustering for the variety of biological data modalities
Erez et al. Quantifying the Dynamics of Hematopoiesis by In Vivo IdU Pulse‐Chase, Mass Cytometry, and Mathematical Modeling
Dieter et al. Flow cytometry methods for targeted isolation of ctenophore cells
Papalexi Characterizing the Molecular Behavior of Immune Responses via Multimodal Genetic Screens

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 20906527

Country of ref document: EP

Kind code of ref document: A1

ENP Entry into the national phase

Ref document number: 2021566786

Country of ref document: JP

Kind code of ref document: A

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 20906527

Country of ref document: EP

Kind code of ref document: A1