WO2021256078A1 - バイオマーカー特定方法及び細胞の製造方法 - Google Patents
バイオマーカー特定方法及び細胞の製造方法 Download PDFInfo
- Publication number
- WO2021256078A1 WO2021256078A1 PCT/JP2021/016167 JP2021016167W WO2021256078A1 WO 2021256078 A1 WO2021256078 A1 WO 2021256078A1 JP 2021016167 W JP2021016167 W JP 2021016167W WO 2021256078 A1 WO2021256078 A1 WO 2021256078A1
- Authority
- WO
- WIPO (PCT)
- Prior art keywords
- cell
- cells
- biomarker
- information
- gene
- Prior art date
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N5/00—Undifferentiated human, animal or plant cells, e.g. cell lines; Tissues; Cultivation or maintenance thereof; Culture media therefor
- C12N5/06—Animal cells or tissues; Human cells or tissues
- C12N5/0602—Vertebrate cells
- C12N5/0652—Cells of skeletal and connective tissues; Mesenchyme
- C12N5/0657—Cardiomyocytes; Heart cells
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N5/00—Undifferentiated human, animal or plant cells, e.g. cell lines; Tissues; Cultivation or maintenance thereof; Culture media therefor
- C12N5/06—Animal cells or tissues; Human cells or tissues
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/02—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving viable microorganisms
- C12Q1/04—Determining presence or kind of microorganism; Use of selective media for testing antibiotics or bacteriocides; Compositions containing a chemical indicator therefor
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6876—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
- C12Q1/6881—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for tissue or cell typing, e.g. human leukocyte antigen [HLA] probes
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2501/00—Active agents used in cell culture processes, e.g. differentation
- C12N2501/10—Growth factors
- C12N2501/115—Basic fibroblast growth factor (bFGF, FGF-2)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2501/00—Active agents used in cell culture processes, e.g. differentation
- C12N2501/10—Growth factors
- C12N2501/155—Bone morphogenic proteins [BMP]; Osteogenins; Osteogenic factor; Bone inducing factor
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2501/00—Active agents used in cell culture processes, e.g. differentation
- C12N2501/10—Growth factors
- C12N2501/16—Activin; Inhibin; Mullerian inhibiting substance
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2501/00—Active agents used in cell culture processes, e.g. differentation
- C12N2501/40—Regulators of development
- C12N2501/415—Wnt; Frizzeled
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2506/00—Differentiation of animal cells from one lineage to another; Differentiation of pluripotent cells
- C12N2506/45—Differentiation of animal cells from one lineage to another; Differentiation of pluripotent cells from artificially induced pluripotent stem cells
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2533/00—Supports or coatings for cell culture, characterised by material
- C12N2533/90—Substrates of biological origin, e.g. extracellular matrix, decellularised tissue
Definitions
- the technique of the present disclosure relates to a method for identifying a biomarker and a method for producing a cell.
- Japanese Unexamined Patent Publication No. 2019-02038 discloses a method for constructing a database of gene-related information including gene-related measurement data that reflects the expression of a gene in a biological sample or the function of a gene product.
- Japanese Patent Publication No. 2009-534036 discloses a method for regulating a cell culture phenotype in a cell line or identifying a protein that is an indicator of the cell culture phenotype.
- the embodiments of the present disclosure have been made under the above circumstances. It is an object of the present disclosure to provide a biomarker identification method for rapidly identifying a biomarker indicating a cell characteristic, and a cell production method for which the production process is rapidly optimized.
- a method for specifying a biomarker showing the characteristics of cell A used for producing cell B which comprises the following (1) to (4).
- (1) Based on the annotation information given to each of the plurality of biomarkers, the evaluation value for each of the plurality of biomarkers is derived, and the biomarker to be measured is selected from the plurality of biomarkers based on the evaluation value. To do.
- (2) To acquire evaluation data of the biomarker to be measured from at least one of the cell A and the culture system before the start of the culture of the cell A and at least one during the culture.
- the evaluation data of the identification marker of the cell B is acquired from at least one of the cell A and the culture system.
- a biomarker showing the characteristics of cell A used for producing cell B is selected from the biomarkers to be measured. Identify one.
- ⁇ 4> The biomarker identification method according to any one of ⁇ 1> to ⁇ 3>, wherein the cell A is a pluripotent stem cell and the cell B is a differentiated cell.
- ⁇ 5> A method for producing a cell B by culturing the cell A, which comprises the following (A) to (C).
- A) Perform the biomarker identification method according to any one of ⁇ 1> to ⁇ 3>, and identify at least one biomarker showing the characteristics of cell A.
- B) Refer to the annotation information of the identified biomarker to identify at least one of the biomarker-related signal transduction and the mechanism by which the biomarker fluctuates.
- C To produce cell B by culturing cell A under culture conditions that inhibit or promote at least one of signal transduction and mechanism.
- ⁇ 6> The method for producing a cell according to ⁇ 5>, wherein the cell A is a pluripotent stem cell and the cell B is a differentiated cell.
- a biomarker identification method for rapidly identifying a biomarker indicating a cell characteristic, and a cell production method for which the production process is rapidly optimized.
- the term "process” includes, in addition to a process independent of other processes, the process as long as the purpose of the process is achieved even if it cannot be clearly distinguished from the other process. ..
- the numerical range indicated by using "-" includes the numerical values before and after "-" as the minimum value and the maximum value, respectively.
- the upper limit value or the lower limit value described in one numerical range may be replaced with the upper limit value or the lower limit value of the numerical range described in another stepwise description. ..
- the upper limit value or the lower limit value of the numerical range may be replaced with the value shown in the examples.
- each component may contain a plurality of applicable substances.
- the content or content of each component is the total content or content of the plurality of substances present in the composition unless otherwise specified. Means quantity.
- “X and / or Y” is synonymous with "at least one of X and Y”. That is, “X and / or Y” means that it may be only X, only Y, or a combination of X and Y. Further, when three or more matters are connected and expressed by "and / or” in the present disclosure, the same concept as “X and / or Y" is applied.
- the biomarker means an element that can be changed depending on the presence of cells.
- Biomarkers include, for example, gene expression level, protein expression level, metabolite production amount, reduced amount of metabolized chemical substances, pH (potential of Hydrogen) of culture solution, O 2 concentration in culture system, and culture. CO 2 concentration in the system, proportion of live cells, proportion of dead cells, etc.
- the biomarker identification method of the present disclosure is a method of specifying a biomarker showing the characteristics of cell A used for producing cell B.
- the biomarker identification method of the present disclosure includes the following (1) to (4).
- the following (1) and the like are also referred to as process (1) and the like, respectively.
- the evaluation value for each of the plurality of biomarkers is derived, and the biomarker to be measured is selected from the plurality of biomarkers based on the evaluation value. To do.
- at least a biomarker showing the characteristics of cell A used for producing cell B is selected from the biomarkers to be measured. Identify one.
- biomarker identification method of the present disclosure by performing steps (1) to (4), a biomarker showing the characteristics of cell A used for producing cell B can be rapidly identified, and moreover, it is specified. Since the biomarker has annotation information, the annotation information can be linked to the culture step of cell A or the adjustment of the phenotype of cell B.
- Cell A and cell B may have the same phenotype or may have different phenotypes.
- the phenotypes of cell A and cell B are the same, it means that cell A proliferates while maintaining the phenotype, and cell B is obtained as the proliferated cell.
- the phenotypes of cell A and cell B are different, it means that cell A is morphologically changed or cell differentiation is performed to obtain cell B.
- Cell A and cell B may be animal cells or plant cells.
- the origin of the cell A is, for example, a mammal, specifically, a human; an experimental animal such as a mouse, a rat, a guinea pig, a rabbit, a monkey; a cow, a horse, a pig, a goat, a sheep.
- Industrial animals such as; pet animals such as dogs and cats; etc.
- cell A An example of the morphology of cell A is a cell capable of differentiating into other cells.
- the cell A is an animal cell
- the cell A is a pluripotent stem cell such as an ES cell (embryonic stem cell) or an iPS cell (induced pluripotent stem cell); a mesenchymal stem cell.
- Multipotent stem cells such as cells), tissue stem cells (tissue stem cells), somatic stem cells (somatic stem cells); and the like.
- Cell A may be a commercially available cell or a cell for sale, or a cell prepared according to a known method.
- Pluripotent stem cells include bone marrow, fat, blood, synovial, dermal, muscle, umbilical cord, placenta, amniotic membrane, chorion, decidua, endometrium, tooth sac, periodontal ligament, pulp or tooth germ. Examples include cells derived from the tissue of. iPS cells can be produced from any somatic cell.
- the somatic cells used for producing iPS cells are not particularly limited, and iPS cells may be produced using fetal somatic cells, and iPS cells may be produced using adult-derived somatic cells (that is, mature somatic cells). It may be produced.
- tissue stem cells such as nerve stem cells, hematopoietic stem cells, mesenchymal stem cells, and dental pulp stem cells, (2) tissue precursor cells, and (3) fibers.
- tissue stem cells such as nerve stem cells, hematopoietic stem cells, mesenchymal stem cells, and dental pulp stem cells
- tissue precursor cells such as tissue precursor cells, and (3) fibers.
- Blast cells skin cells, etc.
- epithelial cells eg, T cells, B cells
- endothelial cells eg, muscle cells, hair cells, gastric mucosal cells, intestinal cells, splenic cells, pancreatic cells (exocrine pancreatic cells) (Cells, etc.)
- brain cells lung cells, kidney cells, skin cells and other differentiated cells.
- cell B An example of the morphology of cell B is a cell differentiated from a cell having differentiation potential.
- the cell B is an animal cell, the cell B may be any somatic cell.
- cell B examples include gastrointestinal cells (hepatic cells, hepatic sinus endothelial cells, Kupper cells, hepatic stellate cells, pit cells, bile duct cells, mesengage cells, pancreatic endocrine cells, aden cells, duct cells, and absorption cells.
- gastrointestinal cells hepatic cells, hepatic sinus endothelial cells, Kupper cells, hepatic stellate cells, pit cells, bile duct cells, mesengage cells, pancreatic endocrine cells, aden cells, duct cells, and absorption cells.
- Endograft cells such as cells, cup cells, panate cells, intestinal endocrine cells, etc.), cells of tissues such as lung and thyroid; blood cells / lymphoid cells (hematopoietic stem cells, erythrocytes, platelets, macrophages, granulocytes, helper T) Cells, killer T cells, B cells, etc.), vasculature cells (vascular endothelial cells, etc.), myocardial cells (atrial muscle cells, ventricular muscle cells, etc.), osteoblasts, bone cells, cartilage cells, tendon cells, fat cells , Skeletal muscle cells, smooth muscle cells and other mesophyll cells; neural cells, sensory organ cells (cells such as crystal, retina, inner ear, etc.), epidermal cells, epidermoid cells such as hair follicle cells; ..
- the cell A is a pluripotent stem cell such as an ES cell or an iPS cell
- the cell B is a differentiated cell derived from the pluripotent stem cell.
- step (1) evaluation values for each of the plurality of biomarkers are derived based on the annotation information given to each of the plurality of biomarkers, and the biomarkers to be measured are measured from among the plurality of biomarkers based on the evaluation values. Select a marker.
- biomarkers to be measured are not limited, and all types of biomarkers can be mentioned.
- the expression level of the gene is preferable from the viewpoint that a plurality of biomarkers can be measured at one time.
- the expression level of the gene is preferably measured by extracting total RNA from cell A.
- the gene expression level can be measured by RT-PCR (Reverse Transcription Polymerase Chain Reaction), microarray, RNA-Seq analysis using a next-generation sequencer, or the like.
- the expression level of the protein can be measured by ELISA (Enzyme-linked Immunosorbent Assay), flow cytometry, LC-MS / MS (Liquid Chromatography-tandem Mass Spectrometry) and the like.
- the expression level of the protein can also be calculated by labeling the protein by an immunological method, acquiring the labeled image on a computer, and performing image analysis.
- the amount of metabolites produced or the amount of chemical substances metabolized is measured using LC-MS / MS or a bioanalyzer equipped with an enzyme membrane biosensor. Can be measured and obtained.
- step (1) an information processing device embodying the step (1) and an operation method of the information processing device will be illustrated.
- the embodiment of step (1) is not limited to the following examples.
- the information processing apparatus includes at least one processor, and the processor acquires the annotation information given to each of the plurality of biomarkers related to the biological sample, and derives the evaluation value for each of the plurality of biomarkers based on the annotation information. Then, the biomarker to be measured is selected from a plurality of biomarkers based on the evaluation value.
- a specific example of a "biological sample" is a "cell”.
- the operation method of the information processing device includes an acquisition process for acquiring annotation information given to each of a plurality of biomarkers related to a biological sample, and a derivation process for deriving an evaluation value for each of a plurality of biomarkers based on the annotation information.
- the processor executes a selection process of selecting a biomarker to be measured from a plurality of biomarkers based on the evaluation value.
- the processor selects annotation information regarding the characteristics of the biological sample of interest (for example, the characteristics of the cells of interest) and derives an evaluation value based only on the selected annotation information.
- the processor refers to the database in which the annotation information for the biomarker is registered and imparts the annotation information to the biomarker.
- annotation information is associated with the type of biological sample (for example, the type of cell).
- the processor accepts user specifications for a range of multiple categories defined according to the type of biological sample (eg, cell type) and the number of biomarkers to be measured for each of the multiple categories, and for each of the plurality of categories. It is preferable to select a number of biomarkers that satisfy the range from the biomarkers prepared in the above, and assign the selected biomarkers to each of a plurality of categories as biomarkers to be measured.
- type of biological sample eg, cell type
- the category preferably includes iPS cells, ectoderm, mesoderm, and endoderm.
- the processor counts the number of annotation information given for each of a plurality of biomarkers and derives an evaluation value based on the number of annotations.
- the processor weights the evaluation value according to the information value of the annotation information.
- the processor determines that the annotation information, which is relatively rare, has a high information value, and weights the evaluation value heavily.
- the processor weights the evaluation value based on the orthogonality of the annotation information.
- the processor weights the evaluation value of the biomarker whose intensity index is within the preset threshold range.
- the processor accepts user designation of a priori marker, which is a biomarker already known to affect the properties of a biological sample (eg, cellular properties), and weights the evaluation value of the priorit marker. Is preferable.
- the processor selects more than 100 biomarkers to be measured and 1000 or less.
- the biomarker preferably contains a gene.
- the gene preferably contains expression-variable genes (DEGs; Differently Expressed Genes) whose expression levels are specifically varied.
- DEGs Differently Expressed Genes
- Annotation information is preferably a term defined by Gene Ontology.
- the information processing apparatus 10 is, for example, a desktop personal computer, which is operated by a user.
- the information processing device 10 is connected to the network 11.
- the network 11 is, for example, a WAN (Wide Area Network) such as the Internet or a public communication network.
- WAN Wide Area Network
- the information processing apparatus 10 is connected to the gene expression information DB server 12 (DB is an abbreviation for database) and the annotation information DB server 13 via the network 11.
- the gene expression information DB server 12 has a gene expression information DB 14.
- the gene expression information DB 14 is, for example, a GEO (Gene Expression Omnibus) provided by the National Center for Biotechnology Information (NCBI).
- NCBI National Center for Biotechnology Information
- a huge amount of gene expression information 15 uploaded by an unspecified number of researchers is registered as open data.
- the gene expression information 15 is information regarding the expression level of a gene expressed by cells during culture.
- the gene expression information DB server 12 receives the first distribution request 72 (see FIG. 8) from the information processing device 10.
- the gene expression information DB server 12 reads out the gene expression information 15 in response to the first distribution request 72 from the gene expression information DB 14. Then, the read gene expression information 15 is delivered to the information processing apparatus 10.
- the annotation information DB server 13 has the annotation information DB 16.
- the annotation information DB 16 is, for example, DAVID (The Database for Annotation, Visualization and Integrated Discovery) provided by the National Institute of Allergy and Infectious Diseases (NIAID), and / or European Bioinformatics Research. InterPro provided by the Institute (EBI; European Bioinformatics Institute).
- DAVID The Database for Annotation, Visualization and Integrated Discovery
- NIAID National Institute of Allergy and Infectious Diseases
- EBI European Bioinformatics Institute
- the annotation information DB server 13 receives the second distribution request 75 (see FIG. 8) from the information processing device 10.
- the annotation information DB server 13 reads the annotation information corresponding to the second distribution request 75 from the annotation information DB 16. Then, the distribution information 76 (see FIG. 8) including the read annotation information is distributed to the information processing apparatus 10.
- the gene expression information 15 is information in which the expression level is registered for each gene.
- the type of the biological sample whose expression level was measured (“iPS cell” in FIG. 2) is registered.
- keywords such as "iPS cell”, “mesoderm”, and “differentiation ability” are registered for facilitating the search.
- the keyword is registered, for example, by the researcher who uploaded the gene expression information 15 or the provider of the gene expression information DB 14.
- the annotation information DB 16 stores the annotation information table 20 shown in FIG.
- annotation information ID; Identification Data
- the annotation information includes "embryonic axis specification” of ID “GO: 0000578”, “Homeodomain-related” of ID “IPR012287”, and the like. It is a term defined by Gene Ontology (GO).
- the iPS cell 25 forms a trigerm 26 by cell division.
- the three germ layers 26 are ectoderm 27, mesoderm 28, and endoderm 29.
- Each of the three germ layers 26 differentiates into a plurality of types of histiocytes 30.
- the ectoderm 27 differentiates into a crystalline lens 31, a nerve cell 32, and the like.
- the mesoderm 28 differentiates into blood cells 33, bone cells 34, muscle cells 35 and the like.
- the endoderm 29 differentiates into alveolar cells 36, intestinal cells 37, hepatocytes 38 and the like.
- FIG. 6 shows an outline of the processing of the information processing apparatus 10.
- the information processing apparatus 10 first acquires annotation information from the annotation information DB server 13. Then, the evaluation value for each gene is derived based on the acquired annotation information. Next, a gene to be measured (hereinafter referred to as a gene to be measured) is selected from a plurality of genes based on the derived evaluation value. At this time, the information processing apparatus 10 selects the number of genes to be measured specified by the user. The number of genes to be measured is, for example, about 3000, and the number of genes to be measured is, for example, 1000. The information processing apparatus 10 presents the selected gene to be measured to the user.
- the computer constituting the information processing apparatus 10 includes a storage device 45, a memory 46, a CPU (Central Processing Unit) 47, a communication unit 48, a display 49, and an input device 50. These are interconnected via a bus line 51.
- the storage device 45 is a hard disk drive built in the computer constituting the information processing device 10 or connected via a cable or a network. Alternatively, the storage device 45 is a disk array in which a plurality of hard disk drives are connected. The storage device 45 stores control programs such as an operating system, various application programs, and various data associated with these programs. A solid state drive may be used instead of the hard disk drive.
- the memory 46 is a work memory for the CPU 47 to execute a process.
- the CPU 47 comprehensively controls each part of the computer by loading the program stored in the storage device 45 into the memory 46 and executing the processing according to the program.
- the communication unit 48 is a network interface that controls the transmission of various information via the network 11.
- the display 49 displays various screens.
- the computer constituting the information processing apparatus 10 receives input of operation instructions from the input device 50 through various screens.
- the input device 50 is a keyboard, a mouse, a touch panel, or the like.
- the operation program 55 is stored in the storage device 45 of the information processing device 10.
- the operation program 55 is an application program for making the computer function as the information processing device 10.
- the CPU 47 of the computer constituting the information processing device 10 cooperates with the memory 46 and the like to receive an instruction receiving unit 60, an extraction unit 61, an acquisition unit 62, a derivation unit 63, and a selection unit 64. , And functions as a display control unit 65.
- the CPU 47 is an example of a "processor”.
- the instruction receiving unit 60 receives various instructions by the user via the input device 50. For example, the instruction receiving unit 60 accepts a plurality of categories and a user's designation of a range of the number of genes to be measured for each of the plurality of categories (hereinafter referred to as a number range). Categories are defined by the user according to the type of biological sample (eg, cell type). The instruction receiving unit 60 generates the category and quantity range designation information 70 according to the designated category and quantity range, and outputs the category and quantity range designation information 70 to the selection unit 64.
- a number range a range of the number of genes to be measured for each of the plurality of categories
- Categories are defined by the user according to the type of biological sample (eg, cell type).
- the instruction receiving unit 60 generates the category and quantity range designation information 70 according to the designated category and quantity range, and outputs the category and quantity range designation information 70 to the selection unit 64.
- the instruction receiving unit 60 also accepts the designation by the user of the prior knowledge gene.
- the instruction receiving unit 60 generates the prior knowledge gene designation information 71 corresponding to the designated prior knowledge gene, and outputs the prior knowledge gene designation information 71 to the selection unit 64.
- Prior findings genes are genes that are already known to affect the behavior of iPS cells 25. That is, the prior knowledge gene is an example of the “previous knowledge marker”.
- the behavior of the iPS cell 25 is an example of "characteristics of a biological sample" according to the technique of the present disclosure.
- the instruction receiving unit 60 also accepts the first distribution instruction by the user, which instructs the gene expression information DB server 12 to distribute the gene expression information 15.
- the first delivery instruction is a search instruction composed of search keywords related to the iPS cell 25, for example, "iPS cell”, “ectoderm”, “mesoderm”, “endoderm”, and the like. ..
- the first distribution instruction is given through a search screen (not shown) provided with a search keyword input box and a search button.
- the instruction receiving unit 60 transmits the first distribution request 72 including the search keyword to the gene expression information DB server 12.
- the gene expression information DB server 12 searches for gene expression information 15 in which the registered keyword matches the search keyword from the gene expression information 15 in the gene expression information DB 14. Then, the searched gene expression information 15 is delivered to the information processing apparatus 10. In the information processing apparatus 10, the gene expression information 15 is input to the extraction unit 61 and the display control unit 65.
- the display control unit 65 displays the display screen (not shown) of the gene expression information 15 from the gene expression information DB server 12 on the display 49.
- the instruction receiving unit 60 accepts the user's designation of the gene expression information 15 (hereinafter referred to as extraction target 15E (see FIG. 22)) for which the DEGs are to be extracted from the displayed gene expression information 15.
- the instruction receiving unit 60 generates the extraction target designation information 73 according to the designated extraction target 15E, and outputs the extraction target designation information 73 to the extraction unit 61.
- the extraction unit 61 extracts DEGs from the extraction target 15E specified in the extraction target designation information 73. For example, the extraction unit 61 compares the expression level of each gene of the extraction target 15E with a preset threshold value, and extracts genes whose expression level is equal to or higher than the threshold value as DEGs. The extraction unit 61 generates a DEGs list 74 in which the extracted DEGs are registered, and outputs the DEGs list 74 to the acquisition unit 62.
- the acquisition unit 62 transmits the second distribution request 75 based on the DEGs list 74 from the extraction unit 61 to the annotation information DB server 13.
- the second delivery request 75 includes the DEGs registered in the DEGs list 74.
- the annotation information DB server 13 searches the annotation information table 20 in the annotation information DB 16 for the annotation information given to the DEGs included in the second distribution request 75. Then, the distribution information 76 composed of the searched annotation information and the set of DEGs is distributed to the information processing apparatus 10. In the information processing apparatus 10, the distribution information 76 is input to the acquisition unit 62.
- the acquisition unit 62 acquires the distribution information 76 from the annotation information DB server 13.
- the distribution information 76 includes annotation information as described above. Therefore, the acquisition unit 62 acquires the annotation information by acquiring the distribution information 76.
- the acquisition unit 62 adds annotation information to the DEGs list 74 based on the distribution information 76, and sets the DEGs list 74 as the assigned DEGs list 74G. That is, the acquisition unit 62 refers to the annotation information DB 16 and imparts annotation information to the gene.
- the acquisition unit 62 outputs the assigned DEGs list 74G to the out-licensing unit 63.
- the derivation unit 63 derives the evaluation value for each DEGs based on the assigned DEGs list 74G. Then, the evaluation value table 77, which is the result of deriving the evaluation values, is output to the selection unit 64.
- the selection unit 64 unconditionally selects the prior knowledge gene as the measurement target gene according to the prior knowledge gene designation information 71. Further, the selection unit 64 selects the gene to be measured from the DEGs extracted by the extraction unit 61 according to the category and the number range designation information 70. The selection unit 64 outputs the measurement target gene list 78, which is the selection result of the measurement target gene, to the display control unit 65. The display control unit 65 generates a measurement target gene display screen 120 (see FIG. 24) based on the measurement target gene list 78, and displays this on the display 49.
- the category designation screen 80 is displayed on the display 49 under the control of the display control unit 65 in order to accept the designation by the user of the category and the number range.
- the category designation screen 80 is provided with a pull-down menu 81 for selecting and inputting the behavior of the cell of interest, which is an example of “characteristics of the biological sample of interest”.
- the category designation screen 80 is provided with an input box 82 for the category, an input box 83 for the lower limit of the number range, and an input box 84 for the upper limit.
- the input boxes 82 to 84 can be added by selecting the add button 85.
- the desired category and the number range are input in the input boxes 82 to 84, and then the designation button 86 is selected, the instruction receiving unit 60 of the cell of interest Accepts behavior, category, and number range specifications.
- the category and the number range designation information 70 are output from the instruction receiving unit 60 to the selection unit 64.
- the category and number range designation information 70 includes the behavior of the cell of interest selected in the pull-down menu 81, the category entered in the input box 82, and the number range entered in the input boxes 83, 84.
- FIG. 9 illustrates a case where "differentiation ability" is selected as the behavior of the cell of interest. Further, the case where "iPS cells”, “ectoderm”, “mesoderm”, and “endoderm” are specified as categories and "225 to 250" is specified for each category as the number range is exemplified. There is. Only one category may be specified. Further, the same numerical value may be input to the input boxes 83 and 84.
- a display area 87 is provided which is the total of the lower limit and the upper limit of the number range input to the input boxes 83 and 84.
- a message 88 urging the user to have a total of more than 100 and 1000 or less is displayed.
- the display control unit 65 pops up the warning screen 90 on the category designation screen 80. .. On the warning screen 90, a message 91 indicating that the total number is out of the range of more than 100 and 1000 or less and cannot be specified as it is is displayed.
- the OK button 92 is selected, the display control unit 65 turns off the display of the warning screen 90.
- the category specification screen 80 is configured so that it cannot be specified when the total number of pieces is out of the range of more than 100 pieces and 1000 pieces or less. Therefore, as shown in FIG. 11, as a result, the selection unit 64 selects more than 100 genes to be measured and 1000 or less.
- the prior knowledge gene designation screen 95 is displayed on the display 49 under the control of the display control unit 65 in order to accept the designation by the user of the prior knowledge gene.
- the prior knowledge gene designation screen 95 is provided with a pull-down menu 96 for selecting and inputting a set of prior knowledge genes.
- the pull-down menu 96 can be added by selecting the add button 97.
- a set of a plurality of previously found genes is prepared in advance as an option.
- a set of priori genes is prepared for each category.
- the set of prior knowledge genes includes, for example, a set of prior research genes used for gene analysis by TaqMan (registered trademark) scorecard, a set of prior research genes used for gene analysis by nCounter (registered trademark), and TruSeq (registered trademark). ) Includes a set of prior findings genes used for gene analysis.
- the instruction receiving unit 60 accepts the designation of the prior knowledge gene set.
- the prior knowledge gene designation information 71 is output from the instruction receiving unit 60 to the selection unit 64.
- the prior knowledge gene designation information 71 is information in which a set of prior knowledge genes and a category corresponding thereto are registered.
- prior findings genes for the category “iPS cells” and one set of prior findings genes for the categories “ectoderm”, “mesoderm”, and “endoderm”, for a total of five prior findings. It illustrates the case where a set of genes is specified. Instead of or in addition to designating a set, prior findings genes may be designated one by one.
- the extraction target designation screen 105 is displayed on the display 49 under the control of the display control unit 65 in order to allow the user to specify the extraction target 15E.
- the extraction target designation screen 105 is provided with an input box 106 for the extraction target 15E.
- the input box 106 can be added by selecting the add button 107.
- the extraction target designation information 73 is information in which the extraction target 15E input to the input box 106 and the type of the biological sample (for example, the cell type) registered in the extraction target 15E are registered.
- FIG. 13 illustrates a case where one extraction target 15E is specified for each of "iPS cell”, “ectoderm”, “mesoderm” and “endoderm”. Two or more extraction targets 15E may be specified for one type of biological sample.
- the DEGs list 74 contains the DEGs and the types of biological samples registered in the extraction target 15E from which the DEGs are extracted.
- Some DEFs such as DEFs with IDs "GE_5" and “GE_10”, have only one type of biological sample registered, while others, such as DEFs with IDs "GE_1” and “GE_2”, are registered.
- IPS cells "ectoderm”, “mesoderm”, “endoderm”, and some other types of biological samples are registered. That is, some DEGs belong to only one type of biological sample, and some DEGs belong to a plurality of types of biological samples.
- the distribution information 76 is information in which the DEGs and the corresponding annotation information are registered.
- the assigned DEGs list 74G is the one in which the item of annotation information is added to the DEGs list 74 shown in FIG.
- the added DEGs list 74G associates the annotation information with the type of biological sample (eg, cell type).
- the acquisition unit 62 selects the annotation information related to the behavior of the cell of interest in the category and the number range designation information 70 from the annotation information registered in the distribution information 76. Then, only the selected annotation information is registered in the DEGs list 74, and the assigned DEGs list 74G is used.
- the acquisition unit 62 does not select annotation information having no relation to the differentiation ability such as IDs “GO: 00000075” and “GO: 0001028”, but is related to differentiation such as IDs “GO: 0000578” and “GO: 0001501”. Select and register only annotation information.
- the search keyword related to the behavior of the cell of interest may be included in the second delivery request 75, and the annotation information related to the behavior of the cell of interest may be selected in the annotation information DB server 13.
- the derivation unit 63 counts the number of annotation information given to each DEGs based on the given DEGs list 74G. Then, the counted number of grants itself is registered in the evaluation value table 77 as an evaluation value. For example, when 28 annotation information is given to the DEFs of the ID "GE_1”, "28", which is the same as the number given, is registered as an evaluation value in the evaluation value table 77.
- the selection unit 64 first unconditionally selects a set of prior knowledge genes designated in the prior knowledge gene designation information 71 as measurement target genes.
- a tentative measurement target gene list 78P in which a set of prior knowledge genes is registered as a measurement target gene is generated.
- An embodiment in which this set of prior knowledge genes is unconditionally selected as a measurement target gene is an example in which the weighting of the evaluation value of the prior knowledge gene is increased so that the prior knowledge gene is always selected as the measurement target gene. Is.
- the selection unit 64 generates the selection order table group 115 based on the evaluation value table 77.
- the selection order table group 115 includes a selection order table 116A of the category “iPS cells” corresponding to the biological sample type “iPS cells” and a selection order table 116B of the category “ectoderm” corresponding to the biological sample type “ectoderm”.
- the selection unit 64 assigns a selection order to each category in order from the DEGs having the highest evaluation value (the number of annotation information given is large). That is, the selection order of the DEGs having the highest evaluation value is the first place, the selection order of the DEGs having the next highest evaluation value is the second place, the selection order of the next highest evaluation value is the third place, and so on. ..
- the selection unit 64 selects a gene to be measured that satisfies the number range from the DEGs prepared for each category with reference to the selection order table 116, and allocates the gene to each category.
- FIG. 20 illustrates how a gene to be measured in the category “iPS cell” is selected from the DEGs prepared for the category “iPS cell”. Further, in FIG. 20, as the number range of the category “iPS cells”, “225 to 250” shown in FIG. 9 is specified, and the number of prior knowledge genes of the category “iPS cells” selected in FIG. 18 is The case where the number is 100 is illustrated. In this case, it is necessary to select at least 125, and at most 150, DEGs in order to satisfy the number range. Therefore, the selection unit 64 selects a total of 150 DEGs from the 1st to 150th selection ranks in the selection order table 116A. Then, the selected 150 DEGs are registered in the provisional measurement target gene list 78P as the measurement target genes of the category “iPS cells”.
- the selection unit 64 is a number that satisfies the number range with reference to the selection order tables 116B to 116D in the same manner for the other categories “ectoderm”, “mesoderm”, and “endoderm”. Select DEFs. Then, the selected DEGs are registered in the provisional measurement target gene list 78P as the measurement target gene. By sequentially selecting the genes to be measured in this way, the selection unit 64 finally generates a gene list 78 to be measured, as shown in FIG. 21, in which the number range is satisfied in each category.
- the extraction unit 61 extracts DEGs from the extraction target 15E and generates a DEGs list 74.
- the acquisition unit 62 acquires the annotation information by acquiring the distribution information 76 from the annotation information DB server 13.
- the acquisition unit 62 assigns the annotation information of the distribution information 76 to the DEGs list 74, and sets it as the assigned DEGs list 74G.
- the derivation unit 63 counts the number of annotation information given to each DEGs and registers the number given as an evaluation value in the evaluation value table 77.
- the selection unit 64 selects a gene to be measured based on the evaluation value, and generates a gene list 78 to be measured.
- the measurement target gene registered in the measurement target gene list 78 is displayed on the measurement target gene display screen 120.
- the measurement target gene display screen 120 is provided with display areas 121A, 121B, 121C, and 121D for each category.
- the gene to be measured in the category “iPS cells” is displayed in the display area 121A.
- the measurement target genes of the category “ectoderm” are displayed in the display area 121B, the category “mesoderm” is displayed in the display area 121C, and the measurement target genes of the category "endoderm” are displayed in the display area 121D.
- a save button 122 is selected when saving the measurement target gene list 78.
- the print button 123 is selected when printing the gene list 78 to be measured.
- the display control unit 65 turns off the display of the gene display screen 120 to be measured.
- the CPU 47 of the information processing device 10 includes an instruction receiving unit 60, an extraction unit 61, an acquisition unit 62, a derivation unit 63, and a selection unit. It functions as a unit 64 and a display control unit 65.
- the category designation screen 80 shown in FIG. 9 is displayed on the display 49 (step ST100).
- the user inputs the behavior of the cell of interest and the desired category and number range, and selects the designated button 86.
- the instruction receiving unit 60 receives the designation of the behavior of the cell of interest and the category and the number range (step ST110), and the category and the number range designation information 70 is generated.
- the category and number range designation information 70 is output to the instruction receiving unit 60 or the selection unit 64.
- the prior knowledge gene designation screen 95 shown in FIG. 12 is displayed on the display 49 (step ST120).
- the user inputs a desired set of prior findings genes and selects the designation button 98.
- the instruction receiving unit 60 receives the designation of the set of the prior knowledge genes (step ST130), and the prior knowledge gene designation information 71 is generated.
- the prior knowledge gene designation information 71 is output from the instruction receiving unit 60 to the selection unit 64.
- a search screen (not shown) is displayed on the display 49.
- the instruction receiving unit 60 receives the first distribution instruction by the user including the search keyword.
- the instruction receiving unit 60 transmits the first distribution request 72 including the search keyword to the gene expression information DB server 12 (step ST140).
- the gene expression information 15 is distributed from the gene expression information DB server 12 in response to the first distribution request 72.
- the gene expression information 15 is input to the display control unit 65. Then, under the control of the display control unit 65, the display screen of the gene expression information 15 (not shown) is displayed on the display 49 (step ST150).
- the extraction target designation screen 105 shown in FIG. 13 is displayed on the display 49 (step ST160).
- the user inputs the desired extraction target 15E and selects the designation button 108.
- the instruction receiving unit 60 receives the designation of the extraction target 15E (step ST170), and the extraction target designation information 73 is generated.
- the extraction target designation information 73 is output from the instruction receiving unit 60 to the extraction unit 61.
- DEGs are extracted from the extraction target 15E, and the DEGs list 74 shown in FIG. 14 is generated (step ST180).
- the DEGs list 74 is output from the extraction unit 61 to the acquisition unit 62.
- the second distribution request 75 based on the DEGs list 74 is transmitted from the acquisition unit 62 to the annotation information DB server 13 (step ST190).
- the distribution information 76 including the annotation information shown in FIG. 15 is distributed from the annotation information DB server 13.
- the distribution information 76 is input to the acquisition unit 62.
- the distribution information 76 and, by extension, the annotation information are acquired by the acquisition unit 62 (step ST200).
- Step ST200 is an example of "acquisition processing".
- the acquisition unit 62 assigns annotation information to the DEGs list 74 based on the distribution information 76, and makes the DEGs list 74 the assigned DEGs list 74G (step ST210). At this time, only the annotation information related to the behavior of the cell of interest is selected and given.
- the assigned DEGs list 74G is output from the acquisition unit 62 to the out-licensing unit 63.
- the derivation unit 63 counts the number of annotation information given to each DEGs, and the number of annotations is registered in the evaluation value table 77 as an evaluation value (step ST220).
- the evaluation value table 77 is output from the derivation unit 63 to the selection unit 64.
- Step ST220 is an example of “deriving process”.
- the prior knowledge gene is unconditionally selected as the measurement target gene by the selection unit 64 (step ST230).
- the selection unit 64 selects a number of DEGs that satisfy the number range from the DEGs prepared for each category in descending order of evaluation value. Then, the selected DEGs are assigned to each category as measurement target genes (step ST240). Through such a process, the gene list 78 to be measured shown in FIG. 21 is generated. The gene list 78 to be measured is output from the selection unit 64 to the display control unit 65. Step ST240 is an example of "selection processing".
- the display control unit 65 displays the measurement target gene display screen 120 shown in FIG. 24 on the display 49 (step ST250). The user confirms the gene to be measured through the gene display screen 120 to be measured.
- the information processing apparatus 10 includes an acquisition unit 62, a derivation unit 63, and a selection unit 64.
- the acquisition unit 62 acquires the annotation information given to each of the plurality of genes.
- the derivation unit 63 derives evaluation values for each of a plurality of genes based on the annotation information.
- the selection unit 64 selects a gene to be measured from a plurality of genes based on the evaluation value. Therefore, it is possible to select the gene to be measured in a data-driven manner with the reliable support of the evaluation value based on the annotation information.
- the genes to be measured thus selected are easy to develop at multiple levels, but are customized for the cells to be studied. Therefore, it becomes possible to select a more appropriate gene to be measured, which leads to elucidation of cell behavior.
- the acquisition unit 62 selects annotation information related to the behavior of the cell of interest.
- the selection unit 64 derives an evaluation value based only on the selected annotation information. Therefore, the gene to be measured can be selected based only on the annotation information specific to the behavior of the cell of interest. In other words, it is possible to exclude annotation information that is not closely related to the behavior of the cell of interest as noise, and select the gene to be measured in a form that is limited to annotation information that is highly relevant to the behavior of the cell of interest. can.
- the acquisition unit 62 refers to the annotation information DB 16 in which the annotation information for the gene is registered, and adds the annotation information to the gene. Therefore, the annotation information can be easily added by using the existing annotation information DB 16.
- the annotation information is associated with the type of biological sample (for example, the type of cell).
- the instruction receiving unit 60 receives a plurality of categories defined according to the type of the biological sample, and a user's designation of a number range for each of the plurality of categories.
- the selection unit 64 selects a number of genes satisfying the number range from the genes prepared for each of the plurality of categories, and allocates the selected genes to each of the plurality of categories as measurement target genes. Therefore, the gene to be measured can be selected without excess or deficiency for each category.
- the category When measuring the expression level of a gene for the purpose of evaluating the iPS cell 25 and its differentiation process, the category includes, for example, "iPS cell”, “ectoderm”, “mesoderm” and “endoderm”. In this case, it is possible to obtain a gene to be measured for each category related to the iPS cell 25.
- the category is not limited to the above, and it is preferable to make it appropriate according to the purpose.
- the categories include, for example, "ES cells”, “ectoderm”, “mesoderm” and "endoderm”.
- the derivation unit 63 counts the number of annotation information given for each of a plurality of genes, and derives an evaluation value based on the number of grants. Therefore, the evaluation value can be easily derived.
- Genes include prior knowledge genes. Then, the instruction receiving unit 60 accepts the designation by the user of the prior knowledge gene.
- the selection unit 64 unconditionally selects the prior knowledge gene as the measurement target gene as a form of increasing the weighting of the evaluation value of the prior knowledge gene. Therefore, it is possible to reflect the user's intention to measure the priori knowledge gene. In addition, it is possible to effectively incorporate prior knowledge genes in which past knowledge is condensed.
- the selection unit 64 selects more than 100 genes to be measured and 1000 or less. When the number of genes to be measured exceeds 100, it is advantageous to elucidate the behavior of cells. On the other hand, when the number of genes to be measured is 1000 or less, the time and cost of the test are not too long, which is advantageous for development into multi-level experiments.
- Genes include DEGs. Therefore, it is possible to select a gene to be measured, which is considered to contribute to the elucidation of cell behavior.
- prior knowledge gene was unconditionally selected as the gene to be measured, but it is not limited to this. Similar to DEGs, prior knowledge genes may be selected based on the derived evaluation values by acquiring annotation information and deriving the evaluation values. At this time, the weighting of the evaluation value of the previously found gene may be heavier than that of DEGs. Further, in this case, the importance may be set for each of the prior knowledge genes, and the evaluation value may be derived in consideration of the importance. Specifically, the higher the importance, the higher the evaluation value is derived. For genes other than the prior knowledge genes, such as DEGs, the evaluation value may be derived with the lowest importance.
- the prior knowledge gene does not necessarily have to be specified. For example, if the cell to be studied is new and the priori-finding gene does not exist in the first place, the designation of the prioritizing gene may be omitted.
- the specification of the extraction target 15E may be omitted, and all the gene expression information 15 distributed from the gene expression information DB server 12 may be used as the extraction target 15E.
- the category does not necessarily have to be specified. However, even if the category is omitted, it is necessary to specify the range of the number of genes to be measured to be selected, at least the upper limit.
- the gene expression information DB 14 is not limited to a public DB such as an exemplary GEO.
- it may be a local DB in which the gene expression information 15 measured at the laboratory to which the user belongs is registered.
- the annotation information DB 16 is not limited to a public DB such as DAVID and InterPro, but may be a local DB prepared by a laboratory to which the user belongs, for example.
- the evaluation value is weighted according to the information value of the annotation information.
- FIG. 26 shows an example in which an annotation information having a relatively small number of grants and a relatively high rarity is judged to have a high information value, and the number of annotations to be given is increased.
- the derivation unit 63 counts the number of annotations given to each of the annotation information given to the DEGs (hereinafter referred to as the total number of grants) based on the given DEGs list 74G.
- the derivation unit 63 compares the total number of grants with the preset threshold value. Then, it is determined that the annotation information whose total number of annotations is less than the threshold value has high information value, and as shown in Table 151, the number of annotations of the annotation information when deriving the evaluation value is set to a value larger than 1. .. That is, the weighting of the annotation information judged to have high information value is increased.
- the derivation unit 63 counts the number of annotation information given for each DEFs, including the number of weighted grants, and generates an evaluation value table 77.
- FIG. 26 illustrates a case where "10” is set as a threshold value, the total number of grants is "6", and the number of annotation information of ID "GO: 00000578" which is less than the threshold value is "10".
- FIG. 27 shows an example of weighting the evaluation value based on the orthogonality of the annotation information.
- the derivation unit 63 finds a set of genes that can cover the annotation information as closely as possible and without duplication, and determines that the annotation information is highly orthogonal to the set of genes.
- Table 158 exemplifies the addition status of the annotation information shown by A1 to A7 to the three DEFs of the IDs "GE_1000", “GE_1001", and “GE_1002".
- annotation information of A1 to A7 "iPS cells” are associated with A1 to A4 as the type of biological sample, and "ectoderm” is associated with A5 to A7.
- the DEGs of ID "GE_1000” and ID “GE_1001” are preferentially selected as the measurement target genes over the DEGs of ID "GE_1002" only by looking at the number of annotation information given.
- the DEFs of the ID "GE_1002” are preferentially selected as the measurement target genes over the DEFs of the ID "GE_1001". In this way, if the DEGs of ID "GE_1000” and ID “GE_1002" are finally selected as the genes to be measured, both “iPS cells” and "ectoderm” can be covered.
- the evaluation value may be derived based on the number of annotation information that can be covered by the combination with other genes. Taking Table 158 as an example, the number of annotation information that can be covered is 6 in the combination of the DEFs of the ID “GE_1000” and the ID “GE_1001”. In the combination of the DEGs of the ID “GE_1000” and the ID “GE_1002”, the number of annotation information that can be covered is seven. In the combination of the IDEs of the ID "GE_1001" and the ID "GE_1002", the number of annotation information that can be covered is five. From this result, the evaluation value of the DEFs of the ID "GE_1000” and the ID "GE_1002" is made higher than the evaluation value of the DEFs of the ID "GE_1001".
- the derivation unit 63 weights the evaluation value according to the information value of the annotation information. Therefore, for example, by increasing the weighting of the number of annotation information given that is determined to have high information value, a gene to which annotation information that is considered to have high information value is attached can be easily selected as a gene to be measured. Therefore, the validity and reliability of the gene to be measured can be enhanced.
- the derivation unit 63 determines that the annotation information having a relatively high rarity has a high information value, and weights it heavily. Therefore, a gene to which rare annotation information that is often overlooked can be selected as a measurement target gene.
- the derivation unit 63 weights the evaluation value based on the orthogonality of the annotation information. Therefore, a set of genes that can cover annotation information as closely as possible and without duplication can be selected as a gene to be measured.
- FIGS. 26 and 27 may be combined and carried out.
- 100 is added to the evaluation value of DEGs in which the annotation information whose total number of grants is less than the threshold value is given and the orthogonality of the annotation information is high.
- annotation information having a relatively high rarity was determined to be the annotation information having a high information value, but the example of the annotation information having a high information value is not limited to these.
- annotation information that is relatively frequently published in research papers may be determined to be annotation information with high information value.
- the number of annotation information given to the DEGs is weighted, but the weighting mode is not limited to this.
- the number of annotation information given to the prior knowledge gene may be weighted in the same manner as in the case shown in FIG. 26.
- the embodiment shown in FIG. 27 may be applied to the previously found gene.
- the added DEGs list 160G of the third embodiment is provided with an item of strength index information.
- the item of intensity index information whether or not the intensity index is within a preset threshold range is registered.
- the intensity index is, for example, a field-change, a q value (q-value) indicating a significant difference in expression corrected for multiple tests, and the like.
- the derivation unit 63 sets the number of annotation information of the DEGs whose strength index is within the threshold range to be larger than 1 when deriving the evaluation value. That is, the weighting of the evaluation values of the DEGs whose intensity index is within the threshold range is increased.
- the derivation unit 63 counts the number of annotation information given for each DEFs, including the number of weighted grants, and generates an evaluation value table 77.
- FIG. 28 illustrates a case where the intensity index of DEFs such as IDs “GE_2” and “GE_5” is within the threshold range and the number of these annotation information given is “2”.
- the derivation unit 63 makes the weighting of the evaluation value of the DEGs whose intensity index is within the threshold range heavy. Therefore, DEGs whose intensity index is within the threshold range, which is considered to be important for elucidating the characteristics of the biological sample (for example, the characteristics of cells), can be selected as the gene to be measured.
- the second embodiment and the third embodiment may be combined and implemented.
- biomarker As explained above, it is possible to select the biomarker to be measured with the support of the evaluation value based on the annotation information.
- the biomarkers to be measured thus selected are customized according to the cell type of interest. Therefore, it becomes possible to select a more appropriate biomarker to be measured, which leads to the culture step of cell A or the adjustment of the phenotype of cell B.
- Step (2) evaluation data of the biomarker to be measured is acquired from at least one of the cell A and the culture system before the start of the culture of the cell A and at least one during the culture.
- step (2) a sample is collected from at least one of the cell A and the culture system before the start of the culture of the cell A and at least one of the cultures, the collected sample is stored, and the sample is measured from the stored sample. It is also possible to acquire the evaluation data of the target biomarker.
- the biomarker to be measured in the step (2) is the biomarker selected in the step (1).
- Step (2) is performed at least one of the cells A before the start of culturing and during culturing.
- an extract from cell A, a secretion of cell A, and the like are measurement samples.
- an extract from the cell A, a culture solution, a gas in the culture system, and the like are measurement samples.
- Step (2) may be performed once or multiple times.
- samples are collected from at least one of cell A and the culture system at a plurality of time points, the collected samples are stored, and the evaluation data of the biomarker to be measured is obtained from the stored samples. It may be obtained.
- the biomarker for acquiring the evaluation data at one time point and the biomarker for acquiring the evaluation data at another time point may be the same or different. .. It is preferable to acquire evaluation data for all biomarkers to be measured through multiple time points.
- Cell A is cultured under culture conditions suitable for cell A survival. Then, during the culture of the cell A, the cell A is induced to differentiate into the cell B as needed, and the culture suitable for inducing the differentiation of the cell B, that is, the differentiation culture is performed. Expansion culture of cell A may be performed before differentiation culture of cell A into cell B.
- the step (2) When the step (2) is performed during the culture of the cell A, it may be performed during the expansion culture of the cell A, that is, before the start of the differentiation culture, or during the differentiation culture of the cell A into the cell B.
- the step (2) can be performed, for example, from 3 days before the start of the differentiation culture to 14 days after the start of the differentiation culture, preferably from 3 days before the start of the differentiation culture to 10 days after the start of the differentiation culture. It is more preferable to carry out the process from the day before the start to 8 days after the start of the differentiation culture.
- the step (2) can be performed, for example, from 3 days before the start of the differentiation culture to the day before the end of the differentiation culture, and preferably from 3 days before the start of the differentiation culture to 3 days before the end of the differentiation culture. It is more preferable to carry out the process from the day before the start of the culture to 5 days before the end of the differentiation culture.
- Step (3) evaluation data of the identification marker of the cell B is acquired from at least one of the cell A and the culture system at the end of the culture of the cell A and at least one after the end of the culture.
- step (3) a sample is collected from at least one of the cell A and the culture system at the end of the culture of the cell A and at least one after the end of the culture, the collected sample is stored, and the cells are stored from the stored sample. It may be possible to acquire the evaluation data of the identification marker of B.
- End of culture and "after the end of culture” mean the time when the proliferation, morphological change or cell differentiation of cell A has progressed to the extent that the identification marker of cell B can be detected.
- the type of the identification marker for cell B is not limited as long as it is a marker derived from cell B and can confirm the presence or absence of cell B.
- the identification marker for cell B may be one type or two or more types. Examples of the cell B identification marker include the presence / absence of gene expression, gene expression level, protein expression presence / absence, protein expression level, cell morphology, and the like.
- the identification marker for cell B the presence or absence or amount of a protein specifically expressed in cell B is preferable from the viewpoint that an immunological detection method can be applied.
- Step (2) and step (3) may be performed on one clone of cell A or a plurality of clones of cell A.
- the cells A may be cultured once or multiple times, whereby steps (2) and (3) may be performed once or multiple times.
- steps (2) and (3) may be performed once or multiple times.
- a plurality of evaluation data sets of the evaluation data of the biomarker to be measured and the evaluation data of the identification marker of the cell B are acquired.
- a plurality of sets of evaluation data sets may be subjected to the step (4).
- step (4) based on the evaluation data of the biomarker to be measured and the evaluation data of the identification marker of the cell B, the biomarker showing the characteristics of the cell A used for producing the cell B from among the biomarkers to be measured. Identify at least one marker.
- step (4) at least one biomarker showing the characteristics of cell A and related to cell A and cell B is specified from the biomarkers to be measured.
- the following is given as an example of the embodiment of the step (4).
- Based on the evaluation data of the identification marker of the cell B at least one cell A having a high production efficiency of the cell B and a cell A having a low production efficiency of the cell B are selected.
- the evaluation data of the biomarker to be measured was compared between the cell A in which the production efficiency of the cell B was high and the cell A in which the production efficiency of the cell B was low, and the expression level, production amount, concentration, etc. were significant. Identify at least one biomarker that differs.
- step (4) for example, the evaluation data of the biomarkers to be measured and the evaluation data of the identification marker of cell B are analyzed by a statistical method or machine learning. It can be done by doing. Any statistical method or machine learning can be applied to the implementation of step (4). Examples of statistical methods or machine learning include regression analysis using random forests, logistic regression analysis, neural networks, support vector machines, naive bayes, decision trees, and the like.
- the step (4) is preferably performed by processing by a computer.
- Random forest is one of the machine learning algorithms.
- the following is an example of the embodiment of the step (4) to which the regression analysis using the random forest is applied.
- the evaluation data of the biomarker to be measured is set as an explanatory variable, and the evaluation data of the identification marker of cell B is set as the objective variable.
- Two or more sets of evaluation data sets are used as training data to create a predictive model of the identification marker of cell B.
- items having a high contribution to the creation of the prediction model are extracted from the explanatory variables, and the extracted items are used as biomarkers indicating the characteristics of cell A.
- the data amount of the explanatory variable may be compressed and / or reduced by using a known dimension reduction means.
- a known dimension reduction means As means for compressing and / or reducing the amount of data, PCA (Principal Component Analysis, principal component analysis), LSA (Latent Semantic Analysis, latent semantic analysis), LDA (Linear Discriminant Analysis, linear discriminant analysis), Lasso, etc. Sparse modeling techniques can be used.
- the missing value may be substituted by using a known missing value complementing method.
- a known missing value complementing method As the missing value interpolation method, gradient boosting, linear interpolation, or the like can be used.
- the method for producing cells of the present disclosure is a method for producing cells B by culturing cell A, and includes the following (A) to (C).
- the following (A) and the like are also referred to as a process (A) and the like, respectively.
- A Perform the biomarker identification method of the present disclosure to identify at least one biomarker showing the characteristics of cell A.
- B Refer to the annotation information of the identified biomarker to identify at least one of the biomarker-related signal transduction and the mechanism by which the biomarker fluctuates.
- C To produce cell B by culturing cell A under culture conditions that inhibit or promote at least one of signal transduction and mechanism.
- the method for producing cells of the present disclosure can rapidly identify a biomarker characteristic of cell A used for producing cell B by performing steps (A) to (C), and the biomarker thereof.
- the manufacturing process can be quickly optimized based on the marker annotation information.
- the type of cell A and the type of cell B are as described above.
- the cell A is a pluripotent stem cell such as an ES cell or an iPS cell
- the cell B is a differentiated cell derived from the pluripotent stem cell.
- step (A) the biomarker identification method of the present disclosure is performed, and at least one biomarker showing the characteristics of cell A is specified.
- the details of the step (A) are as described in the above-mentioned steps (1) to (4).
- Step (B) refers to the annotation information of the identified biomarker and identifies at least one of the signaling associated with the biomarker and the mechanism by which the biomarker fluctuates.
- the identified biomarker has annotation information. If there are a plurality of specified biomarkers, or a plurality of annotation information is given to one biomarker, and there are a plurality of annotation information to be referred to, the annotation information having a relatively high information value is used. It is preferable to refer to it.
- Annotation information having a relatively high information value is, for example, annotation information having a relatively high rarity, annotation information having a relatively high orthogonality to cell B, annotation information having a relatively large number of publications in research papers, and the like. ..
- Match biomarkers to public databases find commonality among multiple annotation information, by enrichment analysis to identify at least one of the biomarker-related signaling and biomarker variability mechanisms. Analysis such as specifying a signal transmission path from annotation information may be performed.
- Step (C) In step (C), cell A is cultured under culture conditions that inhibit or promote at least one of signal transduction and mechanism to produce cell B.
- Step (C) is a step that inhibits or promotes at least one of the signal transduction and mechanism identified in step (B), leading to the culture step of cell A or the adjustment of the phenotype of cell B.
- the step (C) may be, for example, the following step.
- the following is an example and does not limit the embodiments of the present disclosure.
- -Cell A is cultured by adjusting the culture conditions that change the biomarker, for example, the O 2 concentration in the culture system, the number of rotations of the stirrer that stirs the medium, and the like, and cell B is produced.
- step (C) may overlap with the step (A) or the step (B), and the time may not overlap with the step (A) and the step (B).
- step (C) may be started during step (A) or step (B), and the culture conditions may be changed at any time point of step (C).
- Step (C) is performed under culture conditions suitable for cell A survival. Then, during the step (C), cell A is induced to differentiate into cell B as necessary, and a culture suitable for inducing differentiation of cell B, that is, differentiation culture is performed. In step (C), expansion culture of cell A may be performed before differentiation culture of cell A into cell B.
- iPS cell the cell of interest
- differentiation ability the behavior of the cell of interest
- biomarker to be measured is selected.
- the categories and the number range are the same as those shown in FIG. That is, “iPS cells”, “ectoderm”, “mesoderm” and “endoderm” were designated as categories, and "225 to 250" was designated for each category as the number range.
- Table 200 shown in FIG. 29 shows the priori genes designated for selecting the gene to be measured in this example, and the extracted DEGs.
- Prior knowledge genes include those based on investigator hearings or well-known gene panels such as the TaqMan scorecard.
- the DEGs include iPS cells 25 or ES cells, and those extracted from the extraction target 15E in an experiment in which iPS cells 25 or ES cells were differentiated into three germ layers 26 or histiocytes 30.
- approximately 2900 (partially duplicated) genes approximately 1000 (specifically, 980) genes to be measured that satisfy the number range were selected. More specifically, only the annotation information related to differentiation from the annotation information acquired from the annotation information DB 16 was selected and given to the priori knowledge genes and DEGs.
- the evaluation values were derived based on the annotation information, and the numbers satisfying the number range were selected in descending order of the evaluation values.
- normalization genes were also selected as measurement target genes. In this way, about 1000 genes (specifically, 980 genes) were selected as measurement targets. About 1000 selected genes to be measured are called C1000.
- iPS cells 25 before differentiation induction were separately measured for comprehensive gene expression level by microarray (expression level of about 21,000 genes). Measurement) was performed.
- FIG. 30 shows the measurement result 202 of the gene expression level by the microarray.
- Bar 203 represents the expression level of each gene.
- the group was divided into a group of 9 samples on the left side and a group of 6 samples on the right side by clustering, and the group of 6 samples included all 5 samples with low differentiation induction efficiency indicated by "Bad". .. That is, according to the measurement result 202 of the gene expression level by the microarray, at the stage of iPS cells 25, the high and low accuracy of the differentiation induction efficiency is relatively high (the detection sensitivity of the sample whose differentiation induction efficiency is low is 100%, and the differentiation induction efficiency is high. It was found to be predictable with a lower sample specificity (83%). “Good” indicates a sample having a high efficiency of differentiation induction.
- Highly expressed genes whose expression level is equal to or higher than the threshold are extracted from about 21,000 genes to be measured by the microarray, and the degree of influence on cell behavior is obtained from the annotation information given to the highly expressed genes.
- Selected relatively high annotation information (called high-impact annotation information) by a statistical method.
- Table 205 of FIG. 31 and Table 206 of FIG. According to Table 205 and Table 206, various miscellaneous annotation information was selected as high-impact annotation information, and it was found that it is difficult to obtain effective knowledge that leads to elucidation of cell behavior.
- FIG. 33 shows the measurement result 208 of the expression level of C1000 performed on the iPS cells 25 before the induction of differentiation of 15 samples.
- the group was divided into a group of 9 samples on the right side and a group of 6 samples on the left side by clustering, and all 5 samples with low differentiation induction efficiency indicated by "Bad" were included in the group of 6 samples ("Bad”.
- the detection sensitivity of the sample with low differentiation induction efficiency is 100%, and the specificity of the sample with low differentiation induction efficiency is 83%). Therefore, according to C1000 according to the technique of the present disclosure, it was confirmed that it is possible to predict the differentiation induction efficiency at the same level as the comprehensive measurement by the microarray.
- the measurement result by the set of measurement genes of the TaqMan scorecard is simulated by extracting 84 genes of the TaqMan scorecard from the result of the comprehensive gene expression level measurement by the microarray.
- FIG. 35 shows a bar graph 215 of the odds ratio according to the set of measurement genes of C1000
- FIG. 36 shows a bar graph 216 of the odds ratio according to the set of measurement genes of the TaqMan scorecard.
- the genes related to "mesoderm” and “endoderm” are enriched in the sample having low differentiation induction efficiency, and "iPS cells” are used.
- the related genes were reduced.
- the odds ratio of the genes related to the type of each biological sample when the differentiation induction efficiency is low is statistically significantly different from 100% (q value (q-value) is 0) except for "ectoderm". It was less than 0.05 (q ⁇ 0.05). Therefore, it was found that the set of C1000 measurement genes has a certain analytical ability for a sample having a low differentiation induction efficiency. It is considered that these results were obtained because a sufficiently large number of genes to be measured focusing on the type of each biological sample were distributed in a well-balanced manner.
- the gene related to "iPS cells” in the sample with high differentiation induction efficiency becomes “endoderm” in the sample with low differentiation induction efficiency.
- the related genes were each enriched.
- the odds ratio was statistically significantly different from 100% only in the genes related to "iPS cells” when the differentiation induction efficiency was high. Therefore, it was found that the set of measurement genes of the TaqMan scorecard has a limited ability to analyze samples with low differentiation induction efficiency. It is considered that these results were obtained because, unlike the case of C1000, the number of genes distributed to each type of biological sample was small, and an extreme ratio was likely to occur.
- RNA-Seq RNA-Seq
- ⁇ Preparation of iPS cell-derived cardiomyocytes> [Induction of differentiation from iPS cells to cardiomyocytes] From peripheral blood mononuclear cells derived from a plurality of donors, 15 clones of iPS cells were prepared according to the method described in Japanese Patent No. 59842217. These clones are referred to as clone A, clone B, clone C, clone D, clone E, clone F, clone G, clone H, clone I, clone J, clone K, clone L, clone M, clone N and clone O.
- mTeSR1 (registered trademark) (Stem Cell Technologies) and Matrigel (registered trademark) (Corning) were used, and the cells were treated with a 0.5 mmol / L EDTA solution (Invitrogen) for 7 minutes. Was collected and subcultured. Under the above conditions, iPS cells were expanded and cultured up to two T225 flasks. After growing iPS cells until the confluency reaches about 80% under the above conditions, the cells are separated into single cells by TrypLE Select (“TrypLE” is a registered trademark) (Thermo Fisher) and collected.
- TrypLE Select is a registered trademark
- the same culture solution was used to make up the final solution volume to 30 ml, and the stirring culture was continued.
- the final concentration was 1 ⁇ mol / L H1152, 25 ⁇ g / ml Gentamicin, 100 ng / ml bFGF, 24 ng / ml Activin, 5% fetal bovine serum (GE Healthcare), ⁇ 0.5 mTeSR1® and ⁇ 0.5 DMEM low-glucose (Thermo Fisher) was replaced with a culture medium, and differentiation culture was started. Two days after the start of stirring culture, a part of the culture solution was collected and used for gene expression analysis described later.
- a part of the culture medium was collected and the number of cells was measured, and the final concentration was 25 ⁇ g / ml Gentamacin, 100 ng / ml bFGF, 24 ng / ml Activin, 40 ng / ml BMP4, 10% fetal bovine serum, and DMEM low-glucose.
- the culture was adjusted to 1.0 ⁇ 10 6 cells / ml in the culture medium, and the stirring culture was continued. From 3 to 7 days after the start of stirring culture, the medium was changed daily with the same culture solution, and stirring culture was continued. Eight days after the start of stirring culture, a part of the culture solution was collected and used for gene expression analysis described later.
- a part of the culture medium was collected and the number of cells was measured, and the final concentration was 25 ⁇ g / ml Gentamacin, 16.25 ⁇ g / ml XAV939 (Sigma Aldrich), 10% fetal bovine serum, and DMEM low-glucose. It was adjusted to 1.0 ⁇ 10 6 cells / ml in the medium, and stirring culture was continued. Stirring culture From the 9th to the 13th, the medium was changed every 2 days with the same culture solution excluding XAV939, and the stirring culture was continued. 14 days after the start of stirring culture, a part of the culture solution was collected and the number of cells was counted. Table 1 shows the number of cells finally obtained after induction of differentiation.
- the cTnT positive rate (percentage of cell numbers) was calculated by comparison with the isotype control.
- the dot plot of the cell mass induced to differentiate from clone A is shown in FIG. 37, and the cTnT positive rate for each clone is shown in Table 2.
- the gene expression level of C1000 was measured using the extracted RNA as a sample.
- a prediction model was created using the evaluation data set of 12 clones out of the evaluation data set of 15 clones as training data, and the validity of the prediction model was verified using the evaluation data set of the remaining 3 clones as test data.
- the result is shown in FIG. 38.
- the horizontal axis (X) is the measured value of the cTnT positive rate and the vertical axis (Y) is the predicted value of the cTnT positive rate.
- the validity of the prediction model was shown.
- the genes with the highest contributions in the preparation of the above prediction model are shown in Table 3 in descending order of contributions.
Landscapes
- Health & Medical Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Engineering & Computer Science (AREA)
- Organic Chemistry (AREA)
- Wood Science & Technology (AREA)
- Zoology (AREA)
- Biotechnology (AREA)
- Genetics & Genomics (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biomedical Technology (AREA)
- General Health & Medical Sciences (AREA)
- Microbiology (AREA)
- Biochemistry (AREA)
- General Engineering & Computer Science (AREA)
- Immunology (AREA)
- Analytical Chemistry (AREA)
- Physics & Mathematics (AREA)
- Biophysics (AREA)
- Molecular Biology (AREA)
- Cell Biology (AREA)
- Toxicology (AREA)
- Cardiology (AREA)
- Rheumatology (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
(1)~(4)を含むバイオマーカー特定方法とその応用。(1)複数のバイオマーカーそれぞれに付与されたアノテーション情報に基づいてバイオマーカー毎の評価値を導出し、評価値に基づいて複数のバイオマーカーの中から測定対象のバイオマーカーを選択する。(2)細胞Aの培養開始前及び培養中の少なくとも一方において細胞A及び培養系の少なくとも一方から測定対象のバイオマーカーの評価データを取得する。(3)細胞Aの培養終期及び培養終了後の少なくとも一方において細胞A及び培養系の少なくとも一方から細胞Bの識別マーカーの評価データを取得する。(4)測定対象のバイオマーカーの評価データと細胞Bの識別マーカーの評価データとに基づき、測定対象のバイオマーカーの中から細胞Aの特徴を示すバイオマーカーを少なくとも1つ特定する。
Description
本開示の技術は、バイオマーカー特定方法及び細胞の製造方法に関する。
特開2019-020838号公報には、生体試料における遺伝子の発現又は遺伝子産物の機能を反映する遺伝子関連測定データを含む遺伝子関連情報のデータベースを構築する方法が開示されている。
特表2009-534036号公報には、細胞株において細胞培養表現型を調節する又は細胞培養表現型の指標となるタンパク質を同定する方法が開示されている。
特表2009-534036号公報には、細胞株において細胞培養表現型を調節する又は細胞培養表現型の指標となるタンパク質を同定する方法が開示されている。
細胞の培養工程又は培養細胞の表現型の調整に繋げる目的で、細胞の培養効率又は培養細胞の品質を制約する特徴的なバイオマーカーを特定することが試みられている。特徴的なバイオマーカーを特定するために、想定し得る全てのバイオマーカーを実測することが考えられるが、しかし、全てのバイオマーカーの実測には手間と時間がかかる。また、想定し得る全てのバイオマーカーを実測できたとしても、それらのバイオマーカーに細胞培養に関する知見が多いとは限らず、特徴的なバイオマーカーの特定が細胞の培養工程又は培養細胞の表現型の調整に繋がらないこともあり得る。
本開示の実施形態は、上記状況のもとになされた。
本開示は、細胞の特徴を示すバイオマーカーを迅速に特定するバイオマーカー特定方法、及び、製造工程が迅速に適切化される細胞の製造方法を提供することを課題とする。
本開示は、細胞の特徴を示すバイオマーカーを迅速に特定するバイオマーカー特定方法、及び、製造工程が迅速に適切化される細胞の製造方法を提供することを課題とする。
課題を解決するための具体的手段には、下記の態様が含まれる。
<1> 細胞Bの製造に用いる細胞Aの特徴を示すバイオマーカーを特定する方法であって、下記の(1)~(4)を含む、バイオマーカー特定方法。
(1)複数のバイオマーカーそれぞれに付与されたアノテーション情報に基づいて、複数のバイオマーカー毎の評価値を導出し、評価値に基づいて、複数のバイオマーカーの中から測定対象のバイオマーカーを選択すること。
(2)細胞Aの培養開始前及び培養中の少なくとも一方において、細胞A及び培養系の少なくとも一方から、測定対象のバイオマーカーの評価データを取得すること。
(3)細胞Aの培養終期及び培養終了後の少なくとも一方において、細胞A及び培養系の少なくとも一方から、細胞Bの識別マーカーの評価データを取得すること。
(4)測定対象のバイオマーカーの評価データと、細胞Bの識別マーカーの評価データとに基づき、測定対象のバイオマーカーの中から、細胞Bの製造に用いる細胞Aの特徴を示すバイオマーカーを少なくとも1つ特定すること。
<2> バイオマーカーが、遺伝子の発現量、タンパク質の発現量、及び代謝物の生成量からなる群から選ばれる少なくとも1種を含む、<1>に記載のバイオマーカー特定方法。
<3> (2)が複数のタイムポイントにおいて行われる、<1>又は<2>に記載のバイオマーカー特定方法。
<4> 細胞Aが多能性幹細胞であり、細胞Bが分化細胞である、<1>~<3>のいずれか1つに記載のバイオマーカー特定方法。
(1)複数のバイオマーカーそれぞれに付与されたアノテーション情報に基づいて、複数のバイオマーカー毎の評価値を導出し、評価値に基づいて、複数のバイオマーカーの中から測定対象のバイオマーカーを選択すること。
(2)細胞Aの培養開始前及び培養中の少なくとも一方において、細胞A及び培養系の少なくとも一方から、測定対象のバイオマーカーの評価データを取得すること。
(3)細胞Aの培養終期及び培養終了後の少なくとも一方において、細胞A及び培養系の少なくとも一方から、細胞Bの識別マーカーの評価データを取得すること。
(4)測定対象のバイオマーカーの評価データと、細胞Bの識別マーカーの評価データとに基づき、測定対象のバイオマーカーの中から、細胞Bの製造に用いる細胞Aの特徴を示すバイオマーカーを少なくとも1つ特定すること。
<2> バイオマーカーが、遺伝子の発現量、タンパク質の発現量、及び代謝物の生成量からなる群から選ばれる少なくとも1種を含む、<1>に記載のバイオマーカー特定方法。
<3> (2)が複数のタイムポイントにおいて行われる、<1>又は<2>に記載のバイオマーカー特定方法。
<4> 細胞Aが多能性幹細胞であり、細胞Bが分化細胞である、<1>~<3>のいずれか1つに記載のバイオマーカー特定方法。
<5> 細胞Aを培養して細胞Bを製造する方法であって、下記の(A)~(C)を含む、細胞の製造方法。
(A)<1>~<3>のいずれか1つに記載のバイオマーカー特定方法を行い、細胞Aの特徴を示すバイオマーカーを少なくとも1つ特定すること。
(B)特定されたバイオマーカーのアノテーション情報を参照し、バイオマーカーが関係するシグナル伝達及びバイオマーカーが変動するメカニズムの少なくとも1つを特定すること。
(C)シグナル伝達及びメカニズムの少なくとも1つを阻害又は促進する培養条件で細胞Aを培養し、細胞Bを製造すること。
<6> 細胞Aが多能性幹細胞であり、細胞Bが分化細胞である、<5>に記載の細胞の製造方法。
(A)<1>~<3>のいずれか1つに記載のバイオマーカー特定方法を行い、細胞Aの特徴を示すバイオマーカーを少なくとも1つ特定すること。
(B)特定されたバイオマーカーのアノテーション情報を参照し、バイオマーカーが関係するシグナル伝達及びバイオマーカーが変動するメカニズムの少なくとも1つを特定すること。
(C)シグナル伝達及びメカニズムの少なくとも1つを阻害又は促進する培養条件で細胞Aを培養し、細胞Bを製造すること。
<6> 細胞Aが多能性幹細胞であり、細胞Bが分化細胞である、<5>に記載の細胞の製造方法。
本開示によれば、細胞の特徴を示すバイオマーカーを迅速に特定するバイオマーカー特定方法、及び、製造工程が迅速に適切化される細胞の製造方法が提供される。
本開示において「工程」との語には、他の工程から独立した工程に加え、他の工程と明確に区別できない場合であってもその工程の目的が達成されれば、当該工程も含まれる。
本開示において「~」を用いて示された数値範囲には、「~」の前後に記載される数値がそれぞれ最小値及び最大値として含まれる。
本開示中に段階的に記載されている数値範囲において、一つの数値範囲で記載された上限値又は下限値は、他の段階的な記載の数値範囲の上限値又は下限値に置き換えてもよい。また、本開示中に記載されている数値範囲において、その数値範囲の上限値又は下限値は、実施例に示されている値に置き換えてもよい。
本開示において各成分は該当する物質を複数種含んでいてもよい。組成物中に各成分に該当する物質が複数種存在する場合、各成分の含有率又は含有量は、特に断らない限り、組成物中に存在する当該複数種の物質の合計の含有率又は含有量を意味する。
本開示において実施形態を図面を参照して説明する場合、当該実施形態の構成は図面に示された構成に限定されない。
本開示において「X及び/又はY」は、「X及びYのうちの少なくとも1つ」と同義である。つまり、「X及び/又はY」は、Xだけであってもよいし、Yだけであってもよいし、X及びYの組み合わせであってもよい、という意味である。また、本開示において3つ以上の事柄を「及び/又は」で結び付けて表現する場合も、「X及び/又はY」と同様の考え方が適用される。
本開示において「~」を用いて示された数値範囲には、「~」の前後に記載される数値がそれぞれ最小値及び最大値として含まれる。
本開示中に段階的に記載されている数値範囲において、一つの数値範囲で記載された上限値又は下限値は、他の段階的な記載の数値範囲の上限値又は下限値に置き換えてもよい。また、本開示中に記載されている数値範囲において、その数値範囲の上限値又は下限値は、実施例に示されている値に置き換えてもよい。
本開示において各成分は該当する物質を複数種含んでいてもよい。組成物中に各成分に該当する物質が複数種存在する場合、各成分の含有率又は含有量は、特に断らない限り、組成物中に存在する当該複数種の物質の合計の含有率又は含有量を意味する。
本開示において実施形態を図面を参照して説明する場合、当該実施形態の構成は図面に示された構成に限定されない。
本開示において「X及び/又はY」は、「X及びYのうちの少なくとも1つ」と同義である。つまり、「X及び/又はY」は、Xだけであってもよいし、Yだけであってもよいし、X及びYの組み合わせであってもよい、という意味である。また、本開示において3つ以上の事柄を「及び/又は」で結び付けて表現する場合も、「X及び/又はY」と同様の考え方が適用される。
<バイオマーカー特定方法>
本開示においてバイオマーカーとは、細胞の存在によって変動しうる要素を意味する。バイオマーカーは、例えば、遺伝子の発現量、タンパク質の発現量、代謝物の生成量、代謝される化学物質の減少量、培養液のpH(potential of Hydrogen)、培養系内のO2濃度、培養系内のCO2濃度、生細胞の割合、死細胞の割合などである。
本開示においてバイオマーカーとは、細胞の存在によって変動しうる要素を意味する。バイオマーカーは、例えば、遺伝子の発現量、タンパク質の発現量、代謝物の生成量、代謝される化学物質の減少量、培養液のpH(potential of Hydrogen)、培養系内のO2濃度、培養系内のCO2濃度、生細胞の割合、死細胞の割合などである。
本開示のバイオマーカー特定方法は、細胞Bの製造に用いる細胞Aの特徴を示すバイオマーカーを特定する方法である。本開示のバイオマーカー特定方法は、下記の(1)~(4)を含む。下記の(1)等をそれぞれ、工程(1)等ともいう。
(1)複数のバイオマーカーそれぞれに付与されたアノテーション情報に基づいて、複数のバイオマーカー毎の評価値を導出し、評価値に基づいて、複数のバイオマーカーの中から測定対象のバイオマーカーを選択すること。
(2)細胞Aの培養開始前及び培養中の少なくとも一方において、細胞A及び培養系の少なくとも一方から、測定対象のバイオマーカーの評価データを取得すること。
(3)細胞Aの培養終期及び培養終了後の少なくとも一方において、細胞A及び培養系の少なくとも一方から、細胞Bの識別マーカーの評価データを取得すること。
(4)測定対象のバイオマーカーの評価データと、細胞Bの識別マーカーの評価データとに基づき、測定対象のバイオマーカーの中から、細胞Bの製造に用いる細胞Aの特徴を示すバイオマーカーを少なくとも1つ特定すること。
(2)細胞Aの培養開始前及び培養中の少なくとも一方において、細胞A及び培養系の少なくとも一方から、測定対象のバイオマーカーの評価データを取得すること。
(3)細胞Aの培養終期及び培養終了後の少なくとも一方において、細胞A及び培養系の少なくとも一方から、細胞Bの識別マーカーの評価データを取得すること。
(4)測定対象のバイオマーカーの評価データと、細胞Bの識別マーカーの評価データとに基づき、測定対象のバイオマーカーの中から、細胞Bの製造に用いる細胞Aの特徴を示すバイオマーカーを少なくとも1つ特定すること。
本開示のバイオマーカー特定方法は、工程(1)~工程(4)を行うことによって、細胞Bの製造に用いる細胞Aの特徴を示すバイオマーカーを迅速に特定することができ、しかも、特定されたバイオマーカーはアノテーション情報を有するので、そのアノテーション情報を細胞Aの培養工程又は細胞Bの表現型の調整に繋げることができる。
細胞Aと細胞Bとは、表現型が同じでもよく、表現型が異なっていてもよい。細胞Aと細胞Bの表現型が同じ場合とは、細胞Aがその表現型を保ったまま増殖し、増殖した細胞として細胞Bが得られることを意味する。細胞Aと細胞Bの表現型が異なる場合とは、細胞Aが形態変化又は細胞分化を経て細胞Bが得られることを意味する。
細胞A及び細胞Bは、動物細胞でもよく、植物細胞でもよい。細胞Aが動物細胞である場合、細胞Aの由来は、例えば哺乳類であり、具体的には、ヒト;マウス、ラット、モルモット、ウサギ、サル等の実験動物;ウシ、ウマ、ブタ、ヤギ、ヒツジ等の産業動物;イヌ、ネコ等の愛玩動物;などである。
細胞Aの形態の一例は、他の細胞への分化能を有する細胞である。細胞Aが動物細胞である場合、細胞Aは、例えば、ES細胞(embryonic stem cells)、iPS細胞(induced pluripotent stem cells)等の多能性幹細胞(pluripotent stem cells);間葉系幹細胞(mesenchymal stem cells)、組織幹細胞(tissue stem cells)、体性幹細胞(somatic stem cells)等の多分化能幹細胞(multipotent stem cells);などである。
細胞Aは、市販又は分譲されている細胞でもよいし、公知の方法に従って作製した細胞でもよい。多分化能幹細胞としては、骨髄、脂肪、血液、滑膜、真皮、筋肉、臍帯、胎盤、羊膜、絨毛膜、脱落膜、子宮内膜、歯小嚢、歯根膜、歯髄又は歯胚のいずれかの組織に由来する細胞が挙げられる。iPS細胞は、任意の体細胞から作製することができる。iPS細胞の作製に用いる体細胞は特に限定されず、胎児期の体細胞を用いてiPS細胞を作製してもよく、成人由来の体細胞(即ち、成熟した体細胞)を用いてiPS細胞を作製してもよい。iPS細胞を作製する体細胞としては、例えば、(1)神経幹細胞、造血幹細胞、間葉系幹細胞、歯髄幹細胞等の組織幹細胞(又は体性幹細胞)、(2)組織前駆細胞、(3)線維芽細胞(皮膚細胞等)、上皮細胞、肝細胞、リンパ球(例えば、T細胞、B細胞)、内皮細胞、筋肉細胞、毛細胞、胃粘膜細胞、腸細胞、脾細胞、膵細胞(膵外分泌細胞等)、脳細胞、肺細胞、腎細胞、皮膚細胞等の分化した細胞が挙げられる。
細胞Bの形態の一例は、分化能を有する細胞から分化した細胞である。細胞Bが動物細胞である場合、細胞Bはいずれの体細胞でもよい。
細胞Bとしては、例えば、消化器系細胞(肝細胞、肝類洞内皮細胞、クッパー細胞、肝星細胞、ピット細胞、胆管細胞、中皮細胞、膵内分泌細胞、腺房細胞、導管細胞、吸収細胞、杯細胞、パネート細胞、腸内分泌細胞等)、肺、甲状腺等の組織の細胞等の内胚葉系細胞;血球・リンパ球系細胞(造血幹細胞、赤血球、血小板、マクロファージ、顆粒球、ヘルパーT細胞、キラーT細胞、B細胞等)、脈管系細胞(血管内皮細胞等)、心筋細胞(心房筋細胞、心室筋細胞等)、骨芽細胞、骨細胞、軟骨細胞、腱細胞、脂肪細胞、骨格筋細胞、平滑筋細胞等の中胚葉系細胞;神経系細胞、感覚器細胞(水晶体、網膜、内耳等の細胞)、表皮細胞、毛包の細胞等の外胚葉系細胞;が挙げられる。
本開示の実施形態の一例は、細胞Aが、ES細胞、iPS細胞等の多能性幹細胞であり、細胞Bが、多能性幹細胞から誘導される分化細胞である。
[工程(1)]
工程(1)は、複数のバイオマーカーそれぞれに付与されたアノテーション情報に基づいて、複数のバイオマーカー毎の評価値を導出し、評価値に基づいて、複数のバイオマーカーの中から測定対象のバイオマーカーを選択する。
工程(1)は、複数のバイオマーカーそれぞれに付与されたアノテーション情報に基づいて、複数のバイオマーカー毎の評価値を導出し、評価値に基づいて、複数のバイオマーカーの中から測定対象のバイオマーカーを選択する。
測定対象のバイオマーカーの種類は、制限されるものではなく、あらゆる種類のバイオマーカーが挙げられる。測定対象のバイオマーカーとしては、1度に複数のバイオマーカーを測定できる観点から、遺伝子の発現量が好ましい。遺伝子の発現量は、細胞AからトータルRNAを抽出して測定することが好ましい。
遺伝子の発現量は、RT-PCR(Reverse Transcription Polymerase Chain Reaction)、マイクロアレイ、次世代シークエンサーを用いたRNA-Seq解析などによって測定できる。
タンパク質の発現量は、ELISA(Enzyme-linked Immunosorbent Assay)、フローサイトメトリー、LC-MS/MS(Liquid Chromatography-tandem Mass Spectrometry)などによって測定できる。タンパク質の発現量は、免疫学的手法でタンパク質を標識したのち、標識画像をコンピュータに取得し画像解析を行って算出することもできる。
代謝物の生成量又は代謝される化学物質の減少量は、培地中の代謝物又は代謝される化学物質の量を、LC-MS/MS、又は、酵素膜バイオセンサーを搭載したバイオアナライザーを用いて測定し求めることができる。
タンパク質の発現量は、ELISA(Enzyme-linked Immunosorbent Assay)、フローサイトメトリー、LC-MS/MS(Liquid Chromatography-tandem Mass Spectrometry)などによって測定できる。タンパク質の発現量は、免疫学的手法でタンパク質を標識したのち、標識画像をコンピュータに取得し画像解析を行って算出することもできる。
代謝物の生成量又は代謝される化学物質の減少量は、培地中の代謝物又は代謝される化学物質の量を、LC-MS/MS、又は、酵素膜バイオセンサーを搭載したバイオアナライザーを用いて測定し求めることができる。
以下に、工程(1)の実施形態の一例として、工程(1)を具現化する情報処理装置、及びこの情報処理装置の作動方法を例示する。なお、工程(1)の実施形態は以下の例に限定されない。
情報処理装置は、少なくとも1つのプロセッサを備え、プロセッサは、生体試料に関する複数のバイオマーカーのそれぞれに付与されたアノテーション情報を取得し、アノテーション情報に基づいて、複数のバイオマーカー毎の評価値を導出し、評価値に基づいて、複数のバイオマーカーの中から測定対象のバイオマーカーを選択する。「生体試料」の具体例が「細胞」である。
情報処理装置の作動方法は、生体試料に関する複数のバイオマーカーのそれぞれに付与されたアノテーション情報を取得する取得処理と、アノテーション情報に基づいて、複数のバイオマーカー毎の評価値を導出する導出処理と、評価値に基づいて、複数のバイオマーカーの中から測定対象のバイオマーカーを選択する選択処理と、をプロセッサが実行する。
情報処理装置の作動方法は、生体試料に関する複数のバイオマーカーのそれぞれに付与されたアノテーション情報を取得する取得処理と、アノテーション情報に基づいて、複数のバイオマーカー毎の評価値を導出する導出処理と、評価値に基づいて、複数のバイオマーカーの中から測定対象のバイオマーカーを選択する選択処理と、をプロセッサが実行する。
プロセッサは、注目する生体試料の特性(例えば、注目する細胞の特性)に関するアノテーション情報を選定して、選定したアノテーション情報のみに基づいて評価値を導出することが好ましい。
プロセッサは、バイオマーカーに対するアノテーション情報が登録されたデータベースを参照して、バイオマーカーに対してアノテーション情報を付与することが好ましい。
アノテーション情報には、生体試料の種類(例えば、細胞の種類)が関連付けられていることが好ましい。
プロセッサは、生体試料の種類(例えば、細胞の種類)に応じて定義された複数のカテゴリ、及び複数のカテゴリ毎の測定対象のバイオマーカーの個数の範囲のユーザによる指定を受け付け、複数のカテゴリ毎に用意されたバイオマーカーから、範囲を満たす数のバイオマーカーを選択し、選択したバイオマーカーを、測定対象のバイオマーカーとして複数のカテゴリのそれぞれに割り振ることが好ましい。
カテゴリは、iPS細胞、外胚葉、中胚葉、及び内胚葉を含むことが好ましい。
プロセッサは、複数のバイオマーカー毎にアノテーション情報の付与数を計数し、付与数に基づいて評価値を導出することが好ましい。
プロセッサは、アノテーション情報の情報価値に応じて、評価値に対して重み付けを行うことが好ましい。
プロセッサは、稀少性が比較的高いアノテーション情報を情報価値が高いと判断して、評価値に対して重み付けを重くすることが好ましい。
プロセッサは、アノテーション情報の直交性に基づいて、評価値に対して重み付けを行うことが好ましい。
プロセッサは、強度指標が予め設定された閾値範囲内にあるバイオマーカーの評価値の重み付けを重くすることが好ましい。
プロセッサは、生体試料の特性(例えば、細胞の特性)に影響を与えることが既に知られているバイオマーカーである先行知見マーカーのユーザによる指定を受け付け、先行知見マーカーの評価値の重み付けを重くすることが好ましい。
プロセッサは、100個超1000個以下の測定対象のバイオマーカーを選択することが好ましい。
バイオマーカーは遺伝子を含むことが好ましい。
遺伝子は、発現量が特異的に変動している発現変動遺伝子(DEGs;Differentially Expressed Genes)を含むことが好ましい。
アノテーション情報は、遺伝子オントロジーで定義された用語であることが好ましい。
情報処理装置、及び情報処理装置の作動方法を、図面を参照しながら、さらに詳細に説明する。以下の説明は、本開示の技術のユーザが、細胞Aを分化誘導して細胞Bを製造する場合において、バイオマーカーとして遺伝子の発現量を探索する形態を例に挙げて説明する。
[第1実施形態]
図1において、情報処理装置10は、例えばデスクトップ型のパーソナルコンピュータであり、ユーザにより操作される。情報処理装置10はネットワーク11に接続されている。ネットワーク11は、例えば、インターネットあるいは公衆通信網等のWAN(Wide Area Network)である。
図1において、情報処理装置10は、例えばデスクトップ型のパーソナルコンピュータであり、ユーザにより操作される。情報処理装置10はネットワーク11に接続されている。ネットワーク11は、例えば、インターネットあるいは公衆通信網等のWAN(Wide Area Network)である。
情報処理装置10は、ネットワーク11を介して、遺伝子発現情報DBサーバ12(DBは、データベースの略である。)、及びアノテーション情報DBサーバ13と接続されている。遺伝子発現情報DBサーバ12は遺伝子発現情報DB14を有する。遺伝子発現情報DB14は、例えば、アメリカ国立バイオテクノロジーセンター(NCBI;National Center for Biotechnology Information)が提供するGEO(Gene Expression Omnibus)である。遺伝子発現情報DB14には、不特定多数の研究者からアップロードされた膨大な遺伝子発現情報15がオープンデータとして登録されている。遺伝子発現情報15は、培養中に細胞が発現する遺伝子の発現量に関する情報である。
遺伝子発現情報DBサーバ12は、情報処理装置10から第1配信要求72(図8参照)を受信する。遺伝子発現情報DBサーバ12は、第1配信要求72に応じた遺伝子発現情報15を遺伝子発現情報DB14から読み出す。そして、読み出した遺伝子発現情報15を情報処理装置10に配信する。
アノテーション情報DBサーバ13はアノテーション情報DB16を有する。アノテーション情報DB16は、例えば、アメリカ国立アレルギー・感染症研究所(NIAID;National Institute of Allergy and Infectious Diseases)が提供するDAVID(The Database for Annotation, Visualization and Integrated Discovery)、及び/又は、欧州バイオインフォマティクス研究所(EBI;European Bioinformatics Institute)が提供するInterProである。アノテーション情報DB16には、複数の遺伝子のそれぞれについて、対応するアノテーション情報が登録されている。
アノテーション情報DBサーバ13は、情報処理装置10から第2配信要求75(図8参照)を受信する。アノテーション情報DBサーバ13は、第2配信要求75に応じたアノテーション情報をアノテーション情報DB16から読み出す。そして、読み出したアノテーション情報を含む配信情報76(図8参照)を情報処理装置10に配信する。
図2に示すように、遺伝子発現情報15は、遺伝子毎に発現量が登録された情報である。遺伝子発現情報15には、発現量を測定した生体試料の種類(図2では「iPS細胞」)が登録されている。また、遺伝子発現情報15には、「iPS細胞」、「中胚葉」、「分化能」等、検索を容易にするためのキーワードが登録されている。キーワードは、例えば遺伝子発現情報15をアップロードした研究者、あるいは遺伝子発現情報DB14の提供者によって登録される。
アノテーション情報DB16には、図3に示すアノテーション情報テーブル20が格納されている。アノテーション情報テーブル20は、遺伝子毎にアノテーション情報(ID;Identification Data)が登録されたものである。
図4の表22に示すように、アノテーション情報は、ID「GO:0000578」の「embryonic axis specification(胚軸の仕様)」、ID「IPR012287」の「Homeodomain-related(ホメオドメイン関連)」等、遺伝子オントロジー(GO;Gene Ontology)で定義された用語である。
図5に示すように、以下では、ヒト体細胞を初期化して樹立されたiPS細胞25を研究対象とした場合を例示する。iPS細胞25は、細胞分裂することにより三胚葉26を形成する。三胚葉26は、外胚葉27、中胚葉28、及び内胚葉29である。三胚葉26は、それぞれ複数種の組織細胞30に分化する。具体的には、外胚葉27は、水晶体31、神経細胞32等に分化する。中胚葉28は、血液細胞33、骨細胞34、筋細胞35等に分化する。内胚葉29は、肺胞細胞36、腸管細胞37、肝細胞38等に分化する。
図6に、情報処理装置10の処理の概要を示す。情報処理装置10は、まず、アノテーション情報DBサーバ13からアノテーション情報を取得する。そして、取得したアノテーション情報に基づいて、遺伝子毎の評価値を導出する。次いで、導出した評価値に基づいて、複数の遺伝子の中から測定対象の遺伝子(以下、測定対象遺伝子という。)を選択する。この際、情報処理装置10は、ユーザにより指定された個数の測定対象遺伝子を選択する。測定対象遺伝子の候補となる遺伝子は例えば約3000個、測定対象遺伝子は例えば1000個である。情報処理装置10は、選択した測定対象遺伝子をユーザに提示する。
図7において、情報処理装置10を構成するコンピュータは、ストレージデバイス45、メモリ46、CPU(Central Processing Unit)47、通信部48、ディスプレイ49、及び入力デバイス50を備えている。これらはバスライン51を介して相互接続されている。
ストレージデバイス45は、情報処理装置10を構成するコンピュータに内蔵、又はケーブル、ネットワークを通じて接続されたハードディスクドライブである。もしくはストレージデバイス45は、ハードディスクドライブを複数台連装したディスクアレイである。ストレージデバイス45には、オペレーティングシステム等の制御プログラム、各種アプリケーションプログラム、及びこれらのプログラムに付随する各種データ等が記憶されている。ハードディスクドライブに代えてソリッドステートドライブを用いてもよい。
メモリ46は、CPU47が処理を実行するためのワークメモリである。CPU47は、ストレージデバイス45に記憶されたプログラムをメモリ46へロードして、プログラムにしたがった処理を実行することにより、コンピュータの各部を統括的に制御する。
通信部48は、ネットワーク11を介した各種情報の伝送制御を行うネットワークインターフェースである。ディスプレイ49は各種画面を表示する。情報処理装置10を構成するコンピュータは、各種画面を通じて、入力デバイス50からの操作指示の入力を受け付ける。入力デバイス50は、キーボード、マウス、タッチパネル等である。
図8において、情報処理装置10のストレージデバイス45には、作動プログラム55が記憶されている。作動プログラム55は、コンピュータを情報処理装置10として機能させるためのアプリケーションプログラムである。
作動プログラム55が起動されると、情報処理装置10を構成するコンピュータのCPU47は、メモリ46等と協働して、指示受付部60、抽出部61、取得部62、導出部63、選択部64、及び表示制御部65として機能する。CPU47は、「プロセッサ」の一例である。
指示受付部60は、入力デバイス50を介したユーザによる様々な指示を受け付ける。例えば、指示受付部60は、複数のカテゴリ、及び複数のカテゴリ毎の測定対象遺伝子の個数の範囲(以下、個数範囲という。)のユーザによる指定を受け付ける。カテゴリは、生体試料の種類(例えば、細胞の種類)に応じてユーザにより定義される。指示受付部60は、指定されたカテゴリ及び個数範囲に応じたカテゴリ及び個数範囲指定情報70を生成し、カテゴリ及び個数範囲指定情報70を選択部64に出力する。
指示受付部60は、先行知見遺伝子のユーザによる指定も受け付ける。指示受付部60は、指定された先行知見遺伝子に応じた先行知見遺伝子指定情報71を生成し、先行知見遺伝子指定情報71を選択部64に出力する。先行知見遺伝子は、iPS細胞25の挙動に影響を与えることが既に知られている遺伝子である。すなわち先行知見遺伝子は、「先行知見マーカー」の一例である。そして、iPS細胞25の挙動は、本開示の技術に係る「生体試料の特性」の一例である。
指示受付部60は、遺伝子発現情報DBサーバ12に対して遺伝子発現情報15の配信を指示する、ユーザによる第1配信指示も受け付ける。第1配信指示は、具体的にはiPS細胞25に関する検索キーワード、例えば「iPS細胞」、「外胚葉」、「中胚葉」、「内胚葉」、・・・等で構成される検索指示である。第1配信指示は、検索キーワードの入力ボックスと検索ボタンが設けられた検索画面(図示省略)を通じて行われる。指示受付部60は、第1配信指示を受け付けた場合、上記検索キーワードを含む第1配信要求72を遺伝子発現情報DBサーバ12に送信する。遺伝子発現情報DBサーバ12は、遺伝子発現情報DB14にある遺伝子発現情報15の中から、登録されたキーワードが検索キーワードと一致する遺伝子発現情報15を検索する。そして、検索した遺伝子発現情報15を情報処理装置10に配信する。情報処理装置10において、遺伝子発現情報15は、抽出部61及び表示制御部65に入力される。
表示制御部65は、遺伝子発現情報DBサーバ12からの遺伝子発現情報15の表示画面(図示省略)をディスプレイ49に表示する。指示受付部60は、表示された遺伝子発現情報15のうち、DEGsを抽出する対象とする遺伝子発現情報15(以下、抽出対象15E(図22参照)と表記する。)のユーザによる指定を受け付ける。指示受付部60は、指定された抽出対象15Eに応じた抽出対象指定情報73を生成し、抽出対象指定情報73を抽出部61に出力する。
抽出部61は、抽出対象指定情報73で指定された抽出対象15EからDEGsを抽出する。抽出部61は、例えば、抽出対象15Eの各遺伝子の発現量と予め設定された閾値とを比較し、発現量が閾値以上である遺伝子をDEGsとして抽出する。抽出部61は、抽出したDEGsが登録されたDEGsリスト74を生成し、DEGsリスト74を取得部62に出力する。
取得部62は、抽出部61からのDEGsリスト74に基づく第2配信要求75をアノテーション情報DBサーバ13に送信する。第2配信要求75は、DEGsリスト74に登録されたDEGsを含む。アノテーション情報DBサーバ13は、アノテーション情報DB16にあるアノテーション情報テーブル20の中から、第2配信要求75に含まれるDEGsに付与されたアノテーション情報を検索する。そして、検索したアノテーション情報及びDEGsの組で構成される配信情報76を情報処理装置10に配信する。情報処理装置10において、配信情報76は、取得部62に入力される。
取得部62は、アノテーション情報DBサーバ13からの配信情報76を取得する。配信情報76には、前述のようにアノテーション情報が含まれる。このため、取得部62は、配信情報76を取得することで、アノテーション情報を取得していることになる。
取得部62は、配信情報76に基づいて、DEGsリスト74にアノテーション情報を付与し、DEGsリスト74を付与済DEGsリスト74Gとする。つまり、取得部62は、アノテーション情報DB16を参照して、遺伝子に対してアノテーション情報を付与する。取得部62は、付与済DEGsリスト74Gを導出部63に出力する。
導出部63は、付与済DEGsリスト74Gに基づいて、DEGs毎の評価値を導出する。そして、評価値の導出結果である評価値テーブル77を選択部64に出力する。
選択部64は、先行知見遺伝子指定情報71に応じて、先行知見遺伝子を無条件で測定対象遺伝子として選択する。また、選択部64は、カテゴリ及び個数範囲指定情報70に応じて、抽出部61において抽出されたDEGsの中から測定対象遺伝子を選択する。選択部64は、測定対象遺伝子の選択結果である測定対象遺伝子リスト78を表示制御部65に出力する。表示制御部65は、測定対象遺伝子リスト78に基づいて、測定対象遺伝子表示画面120(図24参照)を生成し、これをディスプレイ49に表示する。
図9において、カテゴリ指定画面80は、カテゴリ及び個数範囲のユーザによる指定を受け付けるために、表示制御部65の制御の下、ディスプレイ49に表示される。カテゴリ指定画面80には、「注目する生体試料の特性」の一例である注目する細胞の挙動を選択入力するためのプルダウンメニュー81が設けられている。また、カテゴリ指定画面80には、カテゴリの入力ボックス82、及び個数範囲の下限の入力ボックス83と上限の入力ボックス84が設けられている。入力ボックス82~84は、追加ボタン85を選択することで追加することが可能である。
プルダウンメニュー81で注目する細胞の挙動が選択され、入力ボックス82~84に所望のカテゴリ及び個数範囲が入力された後、指定ボタン86が選択された場合、指示受付部60は、注目する細胞の挙動、カテゴリ、及び個数範囲の指定を受け付ける。これにより指示受付部60から選択部64にカテゴリ及び個数範囲指定情報70が出力される。カテゴリ及び個数範囲指定情報70は、プルダウンメニュー81で選択された注目する細胞の挙動、入力ボックス82に入力されたカテゴリ、及び入力ボックス83、84に入力された個数範囲を含む。
図9では、注目する細胞の挙動として「分化能」が選択された場合を例示している。また、カテゴリとして「iPS細胞」、「外胚葉」、「中胚葉」、「内胚葉」が指定され、個数範囲として、各カテゴリに対して「225~250」が指定された場合を例示している。指定するカテゴリは1つでもよい。また、入力ボックス83、84には同じ数値が入力されてもよい。
入力ボックス83、84の下部には、入力ボックス83、84に入力された個数範囲の下限及び上限の合計の表示領域87が設けられている。表示領域87の下部には、合計が100個超1000個以下となるようユーザに促すメッセージ88が表示されている。
図10に示すように、合計が100個超1000個以下の範囲外である状態で指定ボタン86が選択された場合、表示制御部65は、カテゴリ指定画面80上に警告画面90をポップアップ表示する。警告画面90には、合計が100個超1000個以下の範囲外で、このままでは指定できない旨のメッセージ91が表示される。OKボタン92が選択された場合、表示制御部65は警告画面90の表示を消す。
カテゴリ指定画面80は、こうして個数範囲の合計が100個超1000個以下の範囲外である場合に指定ができないように構成される。このため図11に示すように、選択部64は、結果として100個超1000個以下の測定対象遺伝子を選択することとなる。
図12において、先行知見遺伝子指定画面95は、先行知見遺伝子のユーザによる指定を受け付けるために、表示制御部65の制御の下、ディスプレイ49に表示される。先行知見遺伝子指定画面95には、先行知見遺伝子のセットを選択入力するためのプルダウンメニュー96が設けられている。プルダウンメニュー96は、追加ボタン97を選択することで追加することが可能である。プルダウンメニュー96には、複数の先行知見遺伝子のセットが選択肢として予め用意されている。先行知見遺伝子のセットは、カテゴリ毎に用意されている。先行知見遺伝子のセットには、例えば、TaqMan(登録商標)スコアカードによる遺伝子解析に用いられる先行知見遺伝子のセット、nCounter(登録商標)による遺伝子解析に用いられる先行知見遺伝子のセット、TruSeq(登録商標)による遺伝子解析に用いられる先行知見遺伝子のセット等が含まれる。
プルダウンメニュー96で所望の先行知見遺伝子のセットが選択された後、指定ボタン98が選択された場合、指示受付部60は、先行知見遺伝子のセットの指定を受け付ける。これにより指示受付部60から選択部64に先行知見遺伝子指定情報71が出力される。先行知見遺伝子指定情報71は、先行知見遺伝子のセットと、これに対応するカテゴリとが登録された情報である。
図12では、カテゴリ「iPS細胞」について先行知見遺伝子のセットが2つ、カテゴリ「外胚葉」、「中胚葉」、「内胚葉」について先行知見遺伝子のセットが1つずつ、計5つの先行知見遺伝子のセットが指定された場合を例示している。セットを指定する代わりに、あるいは加えて、先行知見遺伝子を1つずつ指定する構成としてもよい。
図13において、抽出対象指定画面105は、抽出対象15Eをユーザに指定させるために、表示制御部65の制御の下、ディスプレイ49に表示される。抽出対象指定画面105には、抽出対象15Eの入力ボックス106が設けられている。入力ボックス106は、追加ボタン107を選択することで追加することが可能である。
抽出対象15Eが入力ボックス106に入力された後、指定ボタン108が選択された場合、指示受付部60において抽出対象15Eの指定が受け付けられる。これにより指示受付部60から抽出部61に抽出対象指定情報73が出力される。抽出対象指定情報73は、入力ボックス106に入力された抽出対象15Eと、当該抽出対象15Eに登録された生体試料の種類(例えば、細胞の種類)とが登録された情報である。
図13では、「iPS細胞」、「外胚葉」、「中胚葉」及び「内胚葉」のそれぞれに対して1つずつ、抽出対象15Eが指定された場合を例示している。1つの生体試料の種類に対して2つ以上の抽出対象15Eを指定しても構わない。
図14に示すように、DEGsリスト74には、DEGsと、当該DEGsを抽出した抽出対象15Eに登録された生体試料の種類とが登録されている。DEGsには、ID「GE_5」、「GE_10」等のDEGsのように、1つの生体試料の種類だけが登録されているものもあれば、ID「GE_1」、「GE_2」等のDEGsのように、「iPS細胞」、「外胚葉」、「中胚葉」、「内胚葉」といった複数の生体試料の種類が登録されているものもある。つまり、1つの生体試料の種類にだけ属しているDEGsもあれば、複数の生体試料の種類にまたがって属しているDEGsもある。
図15に示すように、配信情報76は、DEGsと、これに対応するアノテーション情報とが登録された情報である。
図16において、付与済DEGsリスト74Gは、図14で示したDEGsリスト74に、アノテーション情報の項目が追加されたものである。この付与済DEGsリスト74Gによって、アノテーション情報に生体試料の種類(例えば、細胞の種類)が関連付けられる。
取得部62は、配信情報76に登録されたアノテーション情報の中から、カテゴリ及び個数範囲指定情報70の注目する細胞の挙動に関するアノテーション情報を選定する。そして、選定したアノテーション情報のみをDEGsリスト74に登録し、付与済DEGsリスト74Gとする。
図9で示したように、本例では、注目する細胞の挙動として「分化能」が指定されている。このため、取得部62は、ID「GO:0000075」、「GO:0001028」といった分化能に関りがないアノテーション情報は選定せず、ID「GO:0000578」、「GO:0001501」といった分化に関するアノテーション情報のみを選定して登録する。注目する細胞の挙動に関する検索キーワードを第2配信要求75に含めておき、アノテーション情報DBサーバ13において、注目する細胞の挙動に関するアノテーション情報を選定してもよい。
図17において、導出部63は、付与済DEGsリスト74Gに基づいて、各DEGsに付与されたアノテーション情報の付与数を計数する。そして、計数した付与数自体を、評価値として評価値テーブル77に登録する。例えばID「GE_1」のDEGsに28個のアノテーション情報が付与されていた場合、評価値テーブル77には評価値として付与数と同じ「28」が登録される。
図18において、選択部64は、まず、先行知見遺伝子指定情報71で指定された先行知見遺伝子のセットを、無条件で測定対象遺伝子として選択する。これにより、先行知見遺伝子のセットが測定対象遺伝子として登録された仮測定対象遺伝子リスト78Pが生成される。この先行知見遺伝子のセットを無条件で測定対象遺伝子として選択する態様は、先行知見遺伝子の評価値の重み付けを重くして、必ず先行知見遺伝子が測定対象遺伝子として選択されるようにすることの一例である。
図19において、選択部64は、評価値テーブル77に基づいて、選択順位表群115を生成する。選択順位表群115は、生体試料の種類「iPS細胞」に対応するカテゴリ「iPS細胞」の選択順位表116A、生体試料の種類「外胚葉」に対応するカテゴリ「外胚葉」の選択順位表116B、生体試料の種類「中胚葉」に対応するカテゴリ「中胚葉」の選択順位表116C、及び生体試料の種類「内胚葉」に対応するカテゴリ「内胚葉」の選択順位表116Dで構成される。選択部64は、各カテゴリについて、評価値が高い(アノテーション情報の付与数が多い)DEGsから順に選択順位をつけていく。すなわち、評価値が最も高いDEGsの選択順位を1位、次に評価値が高いDEGsの選択順位を2位、次の次に評価値が高いDEGsの選択順位を3位、・・・とする。
図20に示すように、選択部64は、選択順位表116を参照して、カテゴリ毎に用意されたDEGsから、個数範囲を満たす測定対象遺伝子を選択し、各カテゴリに割り振る。
図20は、カテゴリ「iPS細胞」のために用意されたDEGsから、カテゴリ「iPS細胞」の測定対象遺伝子を選択する様子を例示している。また、図20は、カテゴリ「iPS細胞」の個数範囲として、図9で示した「225~250」が指定され、かつ図18で選択された、カテゴリ「iPS細胞」の先行知見遺伝子の個数が100個であった場合を例示している。この場合、個数範囲を満たすためには、少なくとも125個、多くとも150個のDEGsを選択する必要がある。このため選択部64は、選択順位表116Aにおいて選択順位1位~150位までの計150個のDEGsを選択する。そして、選択した150個のDEGsを、カテゴリ「iPS細胞」の測定対象遺伝子として仮測定対象遺伝子リスト78Pに登録する。
図示は省略するが、選択部64は、他のカテゴリ「外胚葉」、「中胚葉」、「内胚葉」も同様にして、選択順位表116B~116Dを参照して、個数範囲を満たす数のDEGsを選択する。そして、選択したDEGsを測定対象遺伝子として仮測定対象遺伝子リスト78Pに登録する。選択部64は、こうして測定対象遺伝子を順次選択していくことで、最終的には図21に示すような、各カテゴリにおいて個数範囲が満たされた測定対象遺伝子リスト78を生成する。
図22及び図23は、抽出部61、取得部62、導出部63、及び選択部64による一連の処理をまとめた図である。まず、図22に示すように、抽出部61は、抽出対象15EからDEGsを抽出し、DEGsリスト74を生成する。取得部62は、アノテーション情報DBサーバ13からの配信情報76を取得することで、アノテーション情報を取得する。取得部62は、配信情報76のアノテーション情報をDEGsリスト74に付与し、付与済DEGsリスト74Gとする。
図23に示すように、導出部63は、各DEGsへのアノテーション情報の付与数を計数し、付与数を評価値として評価値テーブル77に登録する。選択部64は、評価値に基づいて測定対象遺伝子を選択し、測定対象遺伝子リスト78を生成する。
図24に示すように、測定対象遺伝子表示画面120には、測定対象遺伝子リスト78に登録された測定対象遺伝子が表示される。測定対象遺伝子表示画面120には、カテゴリ毎に表示領域121A、121B、121C、121Dが設けられている。表示領域121Aにはカテゴリ「iPS細胞」の測定対象遺伝子が表示される。表示領域121Bにはカテゴリ「外胚葉」、表示領域121Cにはカテゴリ「中胚葉」、表示領域121Dにはカテゴリ「内胚葉」の測定対象遺伝子がそれぞれ表示される。
測定対象遺伝子表示画面120の下部には、保存ボタン122、印刷ボタン123、及び確認ボタン124が設けられている。保存ボタン122は、測定対象遺伝子リスト78を保存する場合に選択される。印刷ボタン123は、測定対象遺伝子リスト78を印刷する場合に選択される。確認ボタン124が選択された場合、表示制御部65は、測定対象遺伝子表示画面120の表示を消す。
次に、上記構成による作用について、図25のフローチャートを参照して説明する。まず、情報処理装置10において作動プログラム55が起動されると、図8で示したように、情報処理装置10のCPU47は、指示受付部60、抽出部61、取得部62、導出部63、選択部64、及び表示制御部65として機能される。
表示制御部65の制御の下、図9で示したカテゴリ指定画面80がディスプレイ49に表示される(ステップST100)。ユーザは、注目する細胞の挙動と、所望のカテゴリ及び個数範囲とを入力し、指定ボタン86を選択する。これにより、指示受付部60において、注目する細胞の挙動と、カテゴリ及び個数範囲との指定が受け付けられ(ステップST110)、カテゴリ及び個数範囲指定情報70が生成される。カテゴリ及び個数範囲指定情報70は、指示受付部60か選択部64に出力される。
続いて、表示制御部65の制御の下、図12で示した先行知見遺伝子指定画面95がディスプレイ49に表示される(ステップST120)。ユーザは、所望の先行知見遺伝子のセットを入力し、指定ボタン98を選択する。これにより、指示受付部60において、先行知見遺伝子のセットの指定が受け付けられ(ステップST130)、先行知見遺伝子指定情報71が生成される。先行知見遺伝子指定情報71は、指示受付部60から選択部64に出力される。
表示制御部65の制御の下、図示省略した検索画面がディスプレイ49に表示される。そして、指示受付部60において、検索キーワードを含むユーザによる第1配信指示が受け付けられる。これにより、指示受付部60から、検索キーワードを含む第1配信要求72が遺伝子発現情報DBサーバ12に送信される(ステップST140)。
第1配信要求72に応じて、遺伝子発現情報DBサーバ12から遺伝子発現情報15が配信される。遺伝子発現情報15は表示制御部65に入力される。そして、表示制御部65の制御の下、図示省略した遺伝子発現情報15の表示画面がディスプレイ49に表示される(ステップST150)。
また、表示制御部65の制御の下、図13で示した抽出対象指定画面105がディスプレイ49に表示される(ステップST160)。ユーザは、所望の抽出対象15Eを入力し、指定ボタン108を選択する。これにより、指示受付部60において、抽出対象15Eの指定が受け付けられ(ステップST170)、抽出対象指定情報73が生成される。抽出対象指定情報73は、指示受付部60から抽出部61に出力される。
抽出部61において、抽出対象15EからDEGsが抽出され、図14で示したDEGsリスト74が生成される(ステップST180)。DEGsリスト74は、抽出部61から取得部62に出力される。続いて、DEGsリスト74に基づく第2配信要求75が取得部62からアノテーション情報DBサーバ13に送信される(ステップST190)。
第2配信要求75に応じて、アノテーション情報DBサーバ13から、図15で示したアノテーション情報を含む配信情報76が配信される。配信情報76は取得部62に入力される。これにより、配信情報76、ひいてはアノテーション情報が取得部62において取得される(ステップST200)。ステップST200は、「取得処理」の一例である。
図16で示したように、取得部62によって、配信情報76に基づいて、DEGsリスト74にアノテーション情報が付与され、DEGsリスト74が付与済DEGsリスト74Gとされる(ステップST210)。この際、注目する細胞の挙動に関するアノテーション情報のみが選定されて付与される。付与済DEGsリスト74Gは、取得部62から導出部63に出力される。
図17で示したように、導出部63によって、各DEGsに付与されたアノテーション情報の付与数が計数され、付与数が評価値として評価値テーブル77に登録される(ステップST220)。評価値テーブル77は、導出部63から選択部64に出力される。ステップST220は、「導出処理」の一例である。
図18で示したように、選択部64によって、先行知見遺伝子が無条件で測定対象遺伝子として選択される(ステップST230)。
さらに、図20で示したように、選択部64によって、カテゴリ毎に用意されたDEGsから、評価値が高い順に個数範囲を満たす数のDEGsが選択される。そして、選択されたDEGsが測定対象遺伝子として各カテゴリに割り振られる(ステップST240)。こうした過程を経て、図21で示した測定対象遺伝子リスト78が生成される。測定対象遺伝子リスト78は、選択部64から表示制御部65に出力される。ステップST240は、「選択処理」の一例である。
最後に、表示制御部65によって、図24で示した測定対象遺伝子表示画面120がディスプレイ49に表示される(ステップST250)。ユーザは、この測定対象遺伝子表示画面120を通じて、測定対象遺伝子を確認する。
以上説明したように、情報処理装置10は、取得部62と、導出部63と、選択部64とを備える。取得部62は、複数の遺伝子のそれぞれに付与されたアノテーション情報を取得する。導出部63は、アノテーション情報に基づいて、複数の遺伝子毎の評価値を導出する。選択部64は、評価値に基づいて、複数の遺伝子の中から測定対象遺伝子を選択する。このため、アノテーション情報に基づく評価値という確かな裏付けの下で、データドリブンで測定対象遺伝子を選択することが可能となる。このようにして選択された測定対象遺伝子は、多水準展開が容易でありながら、研究対象の細胞に合わせてカスタマイズされている。したがって、細胞の挙動の解明に繋がる、より適切な測定対象遺伝子を選択することが可能となる。
取得部62は、注目する細胞の挙動に関するアノテーション情報を選定する。選択部64は、選定したアノテーション情報のみに基づいて評価値を導出する。このため、注目する細胞の挙動に特化したアノテーション情報のみに基づいて、測定対象遺伝子を選択することができる。換言すれば、注目する細胞の挙動への関連性が薄いアノテーション情報をノイズとして排除し、注目する細胞の挙動への関連性が高いアノテーション情報に限定した形で、測定対象遺伝子を選択することができる。
取得部62は、遺伝子に対するアノテーション情報が登録されたアノテーション情報DB16を参照して、遺伝子に対してアノテーション情報を付与する。このため、既存のアノテーション情報DB16を用いて、簡単にアノテーション情報を付与することができる。
アノテーション情報には、生体試料の種類(例えば、細胞の種類)が関連付けられている。指示受付部60は、生体試料の種類に応じて定義された複数のカテゴリ、及び複数のカテゴリ毎の個数範囲のユーザによる指定を受け付ける。選択部64は、複数のカテゴリ毎に用意された遺伝子から、個数範囲を満たす数の遺伝子を選択し、選択した遺伝子を、測定対象遺伝子として複数のカテゴリのそれぞれに割り振る。このため、カテゴリ毎に過不足なく測定対象遺伝子を選択することができる。
iPS細胞25及びその分化過程を評価することを目的として遺伝子の発現量を測定する場合、カテゴリは、例えば、「iPS細胞」、「外胚葉」、「中胚葉」及び「内胚葉」を含む。この場合、iPS細胞25に関連するカテゴリ毎の測定対象遺伝子を得ることができる。カテゴリは上記に限定されるものではなく、目的に応じて適切化することが好ましい。ES細胞及びその分化過程を評価することを目的として遺伝子の発現量を測定する場合、カテゴリは、例えば、「ES細胞」、「外胚葉」、「中胚葉」及び「内胚葉」を含む。
導出部63は、複数の遺伝子毎にアノテーション情報の付与数を計数し、付与数に基づいて評価値を導出する。このため、簡単に評価値を導出することができる。
遺伝子は先行知見遺伝子を含む。そして、指示受付部60は、先行知見遺伝子のユーザによる指定を受け付ける。選択部64は、先行知見遺伝子の評価値の重み付けを重くする一形態として、先行知見遺伝子を無条件で測定対象遺伝子として選択する。このため、先行知見遺伝子を測定したいというユーザの意図を反映させることができる。また、過去の知見が凝縮された先行知見遺伝子を有効に取り入れることができる。
選択部64は、100個超1000個以下の測定対象遺伝子を選択する。測定対象遺伝子が100個超であると、細胞の挙動の解明に有利である。一方、測定対象遺伝子が1000個以下であると、検査の時間及びコストがかかりすぎず、多水準実験への展開に有利である。
遺伝子はDEGsを含む。このため、より細胞の挙動の解明に寄与すると考えられる測定対象遺伝子を選択することができる。
先行知見遺伝子は無条件で測定対象遺伝子として選択するとしたが、これに限らない。先行知見遺伝子についてもDEGsと同様にアノテーション情報を取得して評価値を導出し、導出した評価値に基づいて選択してもよい。この際、先行知見遺伝子の評価値の重み付けを、DEGsよりも重くしてもよい。また、この場合、先行知見遺伝子の各々に対して重要度を設定し、重要度を加味して評価値を導出してもよい。具体的には、重要度が高い程、高い評価値を導出する構成とする。先行知見遺伝子以外の遺伝子、例えばDEGs等は、重要度を最低と見なして評価値を導出してもよい。
先行知見遺伝子は、必ずしも指定しなくてもよい。例えば、研究対象の細胞が新規で、先行知見遺伝子がそもそも存在しない場合は、先行知見遺伝子の指定を省略してもよい。
抽出対象15Eの指定も省略し、遺伝子発現情報DBサーバ12から配信された全ての遺伝子発現情報15を抽出対象15Eとしてもよい。
カテゴリも、必ずしも指定しなくてもよい。ただし、カテゴリの指定は省略しても、選択する測定対象遺伝子の個数の範囲、少なくとも上限は指定する必要がある。
遺伝子発現情報DB14は、例示のGEOといった公共的なDBに限定されない。例えばユーザが所属する研究所で測定された遺伝子発現情報15が登録された、ローカルなDBであっても構わない。アノテーション情報DB16についても同様に、DAVID、InterProといった公共的なDBに限らず、例えばユーザが所属する研究所で用意されたローカルなDBであってもよい。
[第2実施形態]
図26及び図27に例示する第2実施形態では、アノテーション情報の情報価値に応じて、評価値に対して重み付けを行う。
図26及び図27に例示する第2実施形態では、アノテーション情報の情報価値に応じて、評価値に対して重み付けを行う。
図26は、付与数が比較的少ない、稀少性が比較的高いアノテーション情報を情報価値が高いと判断して、当該アノテーション情報の付与数を多くする例を示す。導出部63は、まず、表150に示すように、付与済DEGsリスト74Gに基づいて、DEGsに付与されたアノテーション情報のそれぞれの付与数(以下、トータル付与数という)を計数する。導出部63は、トータル付与数と予め設定された閾値とを比較する。そして、トータル付与数が閾値未満のアノテーション情報を情報価値が高いと判断して、表151に示すように、当該アノテーション情報の、評価値を導出する際の付与数を1よりも大きい値とする。つまり、情報価値が高いと判断したアノテーション情報の重み付けを重くする。導出部63は、重み付けがされた付与数を含めて、各DEGsのアノテーション情報の付与数を計数し、評価値テーブル77を生成する。
図26は、閾値として「10」が設定され、トータル付与数が「6」と閾値未満のID「GO:0000578」のアノテーション情報の付与数が「10」とされた場合を例示している。
図27は、アノテーション情報の直交性に基づいて、評価値に対して重み付けを行う例を示す。導出部63は、できる限り漏れなく且つ重複なくアノテーション情報をカバー可能な遺伝子のセットを見出し、その遺伝子のセットに対してアノテーション情報の直交性が高いと判断する。
表158は、ID「GE_1000」、「GE_1001」、「GE_1002」の3個のDEGsに対する、A1~A7で示すアノテーション情報の付与状況を例示したものである。A1~A7のアノテーション情報のうち、A1~A4には生体試料の種類として「iPS細胞」が、A5~A7には「外胚葉」がそれぞれ関連付けられている。
この場合、アノテーション情報の付与数だけをみれば、ID「GE_1000」及びID「GE_1001」のDEGsが、ID「GE_1002」のDEGsよりも優先的に測定対象遺伝子として選択される。しかし、アノテーション情報の直交性を考慮すると、ID「GE_1002」のDEGsが、ID「GE_1001」のDEGsよりも優先的に測定対象遺伝子として選択される。こうして最終的にID「GE_1000」及びID「GE_1002」のDEGsが測定対象遺伝子として選択されれば、「iPS細胞」及び「外胚葉」の両方をカバーすることができる。
他の遺伝子との組み合わせでカバーできるアノテーション情報の数に基づいて、評価値を導出してもよい。表158を例に説明すると、ID「GE_1000」及びID「GE_1001」のDEGsの組み合わせでは、カバーできるアノテーション情報の数は6個である。ID「GE_1000」及びID「GE_1002」のDEGsの組み合わせでは、カバーできるアノテーション情報の数は7個である。ID「GE_1001」及びID「GE_1002」のDEGsの組み合わせでは、カバーできるアノテーション情報の数は5個である。この結果から、ID「GE_1000」及びID「GE_1002」のDEGsの評価値を、ID「GE_1001」のDEGsの評価値よりも高くする。
このように、第2実施形態では、導出部63は、アノテーション情報の情報価値に応じて、評価値に対して重み付けを行う。このため、例えば情報価値が高いと判断したアノテーション情報の付与数の重み付けを重くすることで、情報価値が高いと思われるアノテーション情報が付与された遺伝子が、測定対象遺伝子として選択されやすくなる。したがって、測定対象遺伝子の妥当性、信頼性を高めることができる。
図26においては、導出部63は、稀少性が比較的高いアノテーション情報を情報価値が高いと判断して、重み付けを重くする。このため、見落としがちな稀少なアノテーション情報が付与された遺伝子を、測定対象遺伝子として選択することができる。
図27においては、導出部63は、アノテーション情報の直交性に基づいて、評価値に対して重み付けを行う。このため、できる限り漏れなく且つ重複なくアノテーション情報をカバー可能な遺伝子のセットを、測定対象遺伝子として選択することができる。
図26及び図27の例を複合して実施してもよい。この場合、例えば、トータル付与数が閾値未満のアノテーション情報が付与され、且つアノテーション情報の直交性が高いDEGsの評価値に100を加算する。
図26では稀少性が比較的高いアノテーション情報を情報価値が高いアノテーション情報と判断したが、情報価値が高いアノテーション情報の例は、これらに限定されない。例えば、研究論文への掲載数が比較的多いアノテーション情報を、情報価値が高いアノテーション情報と判断してもよい。
図26では、DEGsに付与されたアノテーション情報の付与数に対して重み付けを行っているが、重み付けの態様はこれに限定されない。先行知見遺伝子についても評価値を導出する場合は、先行知見遺伝子に付与されたアノテーション情報の付与数に対して、図26で示した場合と同様に重み付けを行ってもよい。図27で示した態様も同様に、先行知見遺伝子に対して適用してもよい。
[第3実施形態]
図28に例示する第3実施形態では、強度指標が予め設定された閾値範囲内にある遺伝子の評価値の重み付けを重くする。
図28に例示する第3実施形態では、強度指標が予め設定された閾値範囲内にある遺伝子の評価値の重み付けを重くする。
図28において、第3実施形態の付与済DEGsリスト160Gには、強度指標情報の項目が設けられている。強度指標情報の項目には、強度指標が予め設定された閾値範囲内であるか否かが登録されている。強度指標は、例えばfold-change、多重検定補正済の発現有意差を示すq値(q-value)等である。
導出部63は、表161に示すように、強度指標が閾値範囲内にあるDEGsのアノテーション情報の、評価値を導出する際の付与数を1よりも大きい値とする。つまり、強度指標が閾値範囲内にあるDEGsの評価値の重み付けを重くする。導出部63は、重み付けがされた付与数を含めて、各DEGsのアノテーション情報の付与数を計数し、評価値テーブル77を生成する。
図28は、ID「GE_2」、「GE_5」等のDEGsの強度指標が閾値範囲内で、これらのアノテーション情報の付与数が「2」とされた場合を例示している。
このように、第3実施形態では、導出部63は、強度指標が閾値範囲内にあるDEGsの評価値の重み付けを重くする。このため、生体試料の特性(例えば、細胞の特性)の解明により重要と考えられる、強度指標が閾値範囲内にあるDEGsを、測定対象遺伝子として選択することができる。第2実施形態と第3実施形態を複合して実施してもよい。
以上説明したように、アノテーション情報に基づく評価値という裏付けの下で、測定対象のバイオマーカーを選択することが可能となる。このようにして選択された測定対象のバイオマーカーは、注目する細胞の種類に合わせてカスタマイズされている。したがって、細胞Aの培養工程又は細胞Bの表現型の調整に繋がる、より適切な測定対象のバイオマーカーを選択することが可能となる。
[工程(2)]
工程(2)は、細胞Aの培養開始前及び培養中の少なくとも一方において、細胞A及び培養系の少なくとも一方から、測定対象のバイオマーカーの評価データを取得する。工程(2)は、細胞Aの培養開始前及び培養中の少なくとも一方において細胞A及び培養系の少なくとも一方から試料を採取し、採取した試料を保存しておき、保存しておいた試料から測定対象のバイオマーカーの評価データを取得することでもよい。工程(2)において測定対象とされるバイオマーカーは、工程(1)において選択されたバイオマーカーである。
工程(2)は、細胞Aの培養開始前及び培養中の少なくとも一方において、細胞A及び培養系の少なくとも一方から、測定対象のバイオマーカーの評価データを取得する。工程(2)は、細胞Aの培養開始前及び培養中の少なくとも一方において細胞A及び培養系の少なくとも一方から試料を採取し、採取した試料を保存しておき、保存しておいた試料から測定対象のバイオマーカーの評価データを取得することでもよい。工程(2)において測定対象とされるバイオマーカーは、工程(1)において選択されたバイオマーカーである。
工程(2)は、細胞Aの培養開始前及び培養中の少なくとも一方において行われる。細胞Aの培養開始前は、例えば、細胞A自体、細胞Aからの抽出物、細胞Aの分泌物などが測定試料である。細胞Aの培養中は、例えば、細胞A自体、細胞Aからの抽出物、培養液、培養系内のガスなどが測定試料である。
工程(2)は、1回行ってもよく、複数回行ってもよい。工程(2)は、複数のタイムポイントにおいて細胞A及び培養系の少なくとも一方から試料を採取し、採取した試料を保存しておき、保存しておいた試料から測定対象のバイオマーカーの評価データを取得することでもよい。
工程(2)を複数のタイムポイントにおいて行う場合、あるタイムポイントにおいて評価データを取得するバイオマーカーと、別のタイムポイントにおいて評価データを取得するバイオマーカーとは、同じでもよく、異なっていてもよい。複数のタイムポイントを通じて、測定対象のバイオマーカーすべてについて評価データを取得することが好ましい。
細胞Aの培養は、細胞Aの生存に適した培養条件で行う。そして、細胞Aの培養中に、必要に応じて細胞Aを細胞Bに分化誘導し、細胞Bの分化誘導に適した培養、すなわち分化培養を行う。細胞Aの細胞Bへの分化培養の前に、細胞Aの拡大培養を行ってもよい。
工程(2)を細胞Aの培養中に行う場合、細胞Aの拡大培養中、すなわち分化培養開始前に行ってもよいし、細胞Aの細胞Bへの分化培養中に行ってもよい。工程(2)は、例えば、分化培養開始3日前から分化培養開始14日後までの間に行うことができ、分化培養開始3日前から分化培養開始10日後までの間に行うことが好ましく、分化培養開始前日から分化培養開始8日後までの間に行うことがより好ましい。また、工程(2)は、例えば、分化培養開始3日前から分化培養終了前日までの間に行うことができ、分化培養開始3日前から分化培養終了3日前までの間に行うことが好ましく、分化培養開始前日から分化培養終了5日前までの間に行うことがより好ましい。
[工程(3)]
工程(3)は、細胞Aの培養終期及び培養終了後の少なくとも一方において、細胞A及び培養系の少なくとも一方から、細胞Bの識別マーカーの評価データを取得する。工程(3)は、細胞Aの培養終期及び培養終了後の少なくとも一方において細胞A及び培養系の少なくとも一方から試料を採取し、採取した試料を保存しておき、保存しておいた試料から細胞Bの識別マーカーの評価データを取得することでもよい。「培養終期」及び「培養終了後」は、細胞Bの識別マーカーが検出できる程度に細胞Aの増殖、形態変化又は細胞分化が進んだ時期を意味する。
工程(3)は、細胞Aの培養終期及び培養終了後の少なくとも一方において、細胞A及び培養系の少なくとも一方から、細胞Bの識別マーカーの評価データを取得する。工程(3)は、細胞Aの培養終期及び培養終了後の少なくとも一方において細胞A及び培養系の少なくとも一方から試料を採取し、採取した試料を保存しておき、保存しておいた試料から細胞Bの識別マーカーの評価データを取得することでもよい。「培養終期」及び「培養終了後」は、細胞Bの識別マーカーが検出できる程度に細胞Aの増殖、形態変化又は細胞分化が進んだ時期を意味する。
細胞Bの識別マーカーの種類は、細胞Bに由来し細胞Bの有無を確認できるマーカーであれば、制限されるものではない。細胞Bの識別マーカーは、1種でもよく、2種以上でもよい。細胞Bの識別マーカーとしては、例えば、遺伝子の発現の有無、遺伝子の発現量、タンパク質の発現の有無、タンパク質の発現量、細胞の形態などが挙げられる。細胞Bの識別マーカーとしては、免疫学的な検出方法が適用できる観点から、細胞Bに特異的に発現するタンパク質の有無又は量が好ましい。
工程(2)及び工程(3)は、1クローンの細胞Aに行ってもよく、複数クローンの細胞Aに行ってもよい。
細胞Aの培養は1回行ってもよく、複数回行ってもよく、それによって、工程(2)及び工程(3)は、1回行ってもよく、複数回行ってもよい。
複数クローンの培養又は複数回の培養によって、測定対象のバイオマーカーの評価データと、細胞Bの識別マーカーの評価データと、の評価データセットが、複数セット取得される。複数セットの評価データセットを工程(4)に供してもよい。
細胞Aの培養は1回行ってもよく、複数回行ってもよく、それによって、工程(2)及び工程(3)は、1回行ってもよく、複数回行ってもよい。
複数クローンの培養又は複数回の培養によって、測定対象のバイオマーカーの評価データと、細胞Bの識別マーカーの評価データと、の評価データセットが、複数セット取得される。複数セットの評価データセットを工程(4)に供してもよい。
[工程(4)]
工程(4)は、測定対象のバイオマーカーの評価データと、細胞Bの識別マーカーの評価データとに基づき、測定対象のバイオマーカーの中から、細胞Bの製造に用いる細胞Aの特徴を示すバイオマーカーを少なくとも1つ特定する。工程(4)において、測定対象のバイオマーカーの中から、細胞Aの特徴を示すバイオマーカーであって、細胞A及び細胞Bに関連があるバイオマーカーが少なくとも1つ特定される。
工程(4)は、測定対象のバイオマーカーの評価データと、細胞Bの識別マーカーの評価データとに基づき、測定対象のバイオマーカーの中から、細胞Bの製造に用いる細胞Aの特徴を示すバイオマーカーを少なくとも1つ特定する。工程(4)において、測定対象のバイオマーカーの中から、細胞Aの特徴を示すバイオマーカーであって、細胞A及び細胞Bに関連があるバイオマーカーが少なくとも1つ特定される。
工程(4)の実施形態の一例として、下記が挙げられる。
測定対象のバイオマーカーの評価データと細胞Bの識別マーカーの評価データとの評価データセットを複数セット取得しておく。細胞Bの識別マーカーの評価データに基づき、細胞Bの製造効率が高かった細胞Aと、細胞Bの製造効率が低かった細胞Aとを、それぞれ少なくとも1つ選出する。細胞Bの製造効率が高かった細胞Aと、細胞Bの製造効率が低かった細胞Aとの間において、測定対象のバイオマーカーの評価データを比較し、発現量、生成量、濃度等に有意な差があるバイオマーカーを少なくとも1つ特定する。
測定対象のバイオマーカーの評価データと細胞Bの識別マーカーの評価データとの評価データセットを複数セット取得しておく。細胞Bの識別マーカーの評価データに基づき、細胞Bの製造効率が高かった細胞Aと、細胞Bの製造効率が低かった細胞Aとを、それぞれ少なくとも1つ選出する。細胞Bの製造効率が高かった細胞Aと、細胞Bの製造効率が低かった細胞Aとの間において、測定対象のバイオマーカーの評価データを比較し、発現量、生成量、濃度等に有意な差があるバイオマーカーを少なくとも1つ特定する。
測定対象のバイオマーカーの数が比較的多い場合、工程(4)は、例えば、測定対象のバイオマーカーの評価データと、細胞Bの識別マーカーの評価データとを、統計的手法又は機械学習によって分析することで実施可能である。工程(4)の実施には、あらゆる統計的手法又は機械学習が適用可能である。統計的手法又は機械学習の例として、ランダムフォレストを用いた回帰分析、ロジスティック回帰分析、ニューラルネットワーク、サポートベクターマシン、単純ベイズ、決定木などが挙げられる。工程(4)は、コンピュータが処理することによって行われることが好ましい。
工程(4)の実施形態の一例として、ランダムフォレストを用いた回帰分析が挙げられる。ランダムフォレストは、機械学習のアルゴリズムの一つである。ランダムフォレストを用いた回帰分析を適用した工程(4)の実施形態の一例として、下記が挙げられる。
測定対象のバイオマーカーの評価データと細胞Bの識別マーカーの評価データとの評価データセットを複数セット取得しておく。測定対象のバイオマーカーの評価データを説明変数に設定し、細胞Bの識別マーカーの評価データを目的変数に設定する。2セット以上の評価データセットをトレーニングデータとして使用し、細胞Bの識別マーカーの予測モデルを作成する。予測モデルの作成に供していない別の評価データセットをテストデータとして使用し、予測モデルの精度を確認する。精度が高いと確認できた予測モデルにおいて、説明変数の中から予測モデルの作成に寄与度が高い項目を抽出し、抽出した項目を細胞Aの特徴を示すバイオマーカーとする。
測定対象のバイオマーカーの評価データと細胞Bの識別マーカーの評価データとの評価データセットを複数セット取得しておく。測定対象のバイオマーカーの評価データを説明変数に設定し、細胞Bの識別マーカーの評価データを目的変数に設定する。2セット以上の評価データセットをトレーニングデータとして使用し、細胞Bの識別マーカーの予測モデルを作成する。予測モデルの作成に供していない別の評価データセットをテストデータとして使用し、予測モデルの精度を確認する。精度が高いと確認できた予測モデルにおいて、説明変数の中から予測モデルの作成に寄与度が高い項目を抽出し、抽出した項目を細胞Aの特徴を示すバイオマーカーとする。
工程(4)の実施に当たって説明変数が目的変数に対して過剰に存在する場合は、公知の次元削減手段を用いて説明変数のデータ量を圧縮及び/又は削減してもよい。データ量の圧縮及び/又は削減の手段としては、PCA(Principal Component Analysis、主成分分析)、LSA(Latent Semantic Analysis、潜在意味解析)、LDA(Linear Discriminant Analysis、線形判別分析)、又はLasso等のスパースモデリング手法を用いることができる。
工程(4)の実施に当たって説明変数に欠損値がある場合は、公知の欠損値補完法を用いることで欠損値を代入してもよい。欠損値補完法としては、勾配ブースティング、線形補完などを用いることができる。
<細胞の製造方法>
本開示の細胞の製造方法は、細胞Aを培養して細胞Bを製造する方法であって、下記の(A)~(C)を含む。下記の(A)等をそれぞれ、工程(A)等ともいう。
本開示の細胞の製造方法は、細胞Aを培養して細胞Bを製造する方法であって、下記の(A)~(C)を含む。下記の(A)等をそれぞれ、工程(A)等ともいう。
(A)本開示のバイオマーカー特定方法を行い、細胞Aの特徴を示すバイオマーカーを少なくとも1つ特定すること。
(B)特定されたバイオマーカーのアノテーション情報を参照し、バイオマーカーが関係するシグナル伝達及びバイオマーカーが変動するメカニズムの少なくとも1つを特定すること。
(C)シグナル伝達及びメカニズムの少なくとも1つを阻害又は促進する培養条件で細胞Aを培養し、細胞Bを製造すること。
(B)特定されたバイオマーカーのアノテーション情報を参照し、バイオマーカーが関係するシグナル伝達及びバイオマーカーが変動するメカニズムの少なくとも1つを特定すること。
(C)シグナル伝達及びメカニズムの少なくとも1つを阻害又は促進する培養条件で細胞Aを培養し、細胞Bを製造すること。
本開示の細胞の製造方法は、工程(A)~工程(C)を行うことによって、細胞Bの製造に用いる細胞Aの特徴を示すバイオマーカーを迅速に特定することができ、そして、そのバイオマーカーのアノテーション情報に基づき製造工程を迅速に適切化することができる。
細胞Aの種類と細胞Bの種類は、先述のとおりである。本開示の実施形態の一例は、細胞Aが、ES細胞、iPS細胞等の多能性幹細胞であり、細胞Bが、多能性幹細胞から誘導される分化細胞である。
[工程(A)]
工程(A)は、本開示のバイオマーカー特定方法を行い、細胞Aの特徴を示すバイオマーカーを少なくとも1つ特定する。工程(A)の詳細は、先述の工程(1)~工程(4)のとおりである。
工程(A)は、本開示のバイオマーカー特定方法を行い、細胞Aの特徴を示すバイオマーカーを少なくとも1つ特定する。工程(A)の詳細は、先述の工程(1)~工程(4)のとおりである。
[工程(B)]
工程(B)は、特定されたバイオマーカーのアノテーション情報を参照し、このバイオマーカーが関係するシグナル伝達及びこのバイオマーカーが変動するメカニズムの少なくとも1つを特定する。
工程(B)は、特定されたバイオマーカーのアノテーション情報を参照し、このバイオマーカーが関係するシグナル伝達及びこのバイオマーカーが変動するメカニズムの少なくとも1つを特定する。
特定されたバイオマーカーはアノテーション情報を有する。特定されたバイオマーカーが複数であったり、1つのバイオマーカーに複数のアノテーション情報が付与されていたりして、参照対象となるアノテーション情報が複数である場合は、情報価値が比較的高いアノテーション情報を参照することが好ましい。情報価値が比較的高いアノテーション情報とは、例えば、稀少性が比較的高いアノテーション情報、細胞Bとの直交性が比較的高いアノテーション情報、研究論文への掲載数が比較的多いアノテーション情報などである。
バイオマーカーが関係するシグナル伝達及びバイオマーカーが変動するメカニズムの少なくとも1つを特定するために、バイオマーカーを公共のデータベースに照合する、複数のアノテーション情報の間に共通性を見出す、エンリッチメント解析によってアノテーション情報からシグナル伝達経路を特定する、などの解析を行ってもよい。
[工程(C)]
工程(C)は、シグナル伝達及びメカニズムの少なくとも1つを阻害又は促進する培養条件で細胞Aを培養し、細胞Bを製造する。工程(C)は、工程(B)において特定したシグナル伝達及びメカニズムの少なくとも1つを阻害又は促進して、細胞Aの培養工程又は細胞Bの表現型の調整に繋げる工程である。
工程(C)は、シグナル伝達及びメカニズムの少なくとも1つを阻害又は促進する培養条件で細胞Aを培養し、細胞Bを製造する。工程(C)は、工程(B)において特定したシグナル伝達及びメカニズムの少なくとも1つを阻害又は促進して、細胞Aの培養工程又は細胞Bの表現型の調整に繋げる工程である。
工程(C)は、例えば下記の工程であってよい。下記は例示であり、本開示の実施形態を限定するものではない。
・シグナル伝達の上流及び下流の少なくとも一方に関与するタンパク質を添加した培地で細胞Aを培養し、細胞Bを製造する。
・シグナル伝達の上流及び下流の少なくとも一方に関与するタンパク質を阻害又は促進する化学物質を添加した培地で細胞Aを培養し、細胞Bを製造する。
・バイオマーカーが変動するメカニズムを阻害又は促進する化学物質を添加した培地で細胞Aを培養し、細胞Bを製造する。
・バイオマーカーを変動させた培地で細胞Aを培養し、細胞Bを製造する。
・バイオマーカーを変動させる培養条件、例えば、培養系内のO2濃度、培地を攪拌する攪拌機の回転数などを調整して細胞Aを培養し、細胞Bを製造する。
・シグナル伝達の上流及び下流の少なくとも一方に関与するタンパク質を添加した培地で細胞Aを培養し、細胞Bを製造する。
・シグナル伝達の上流及び下流の少なくとも一方に関与するタンパク質を阻害又は促進する化学物質を添加した培地で細胞Aを培養し、細胞Bを製造する。
・バイオマーカーが変動するメカニズムを阻害又は促進する化学物質を添加した培地で細胞Aを培養し、細胞Bを製造する。
・バイオマーカーを変動させた培地で細胞Aを培養し、細胞Bを製造する。
・バイオマーカーを変動させる培養条件、例えば、培養系内のO2濃度、培地を攪拌する攪拌機の回転数などを調整して細胞Aを培養し、細胞Bを製造する。
工程(C)は、工程(A)又は工程(B)と時間が重なっていてもよく、工程(A)及び工程(B)と時間が重なっていなくてもよい。例えば、工程(A)又は工程(B)の最中に工程(C)を開始し、工程(C)のいずれかのタイムポイントで培養条件を変更してもよい。
工程(C)は、細胞Aの生存に適した培養条件で行う。そして、工程(C)の間に、必要に応じて細胞Aを細胞Bに分化誘導し、細胞Bの分化誘導に適した培養、すなわち分化培養を行う。工程(C)において、細胞Aの細胞Bへの分化培養の前に、細胞Aの拡大培養を行ってもよい。
以下、本開示の実施形態を、実施例によってさらに具体的に説明するが、本開示の実施形態は以下の実施例に限定されるものではない。
化学物質等の略称は以下のとおりである。
bFGF basic Fibroblast Growth Factor
BMP4 Bone Morphogenetic Protein 4
cTnT cardiac Troponin T
DMEM Dulbecco's Modified Eagle Medium
D-PBS Dulbecco's Phosphate-Buffered Saline
EDTA Ethylenediaminetetraacetic acid
bFGF basic Fibroblast Growth Factor
BMP4 Bone Morphogenetic Protein 4
cTnT cardiac Troponin T
DMEM Dulbecco's Modified Eagle Medium
D-PBS Dulbecco's Phosphate-Buffered Saline
EDTA Ethylenediaminetetraacetic acid
下記において、物質濃度に関し、特に断りのない限り、「%」は「v/v%」である。
<測定対象とするバイオマーカーの選択>
注目する細胞を「iPS細胞」とし、注目する細胞の挙動を「分化能」とし、測定対象とするバイオマーカーを選択した実施例を説明する。本実施例において、カテゴリ及び個数範囲は図9で示した例と同じである。すなわち、カテゴリとして「iPS細胞」、「外胚葉」、「中胚葉」及び「内胚葉」を指定し、個数範囲として各カテゴリに「225~250」を指定した。
注目する細胞を「iPS細胞」とし、注目する細胞の挙動を「分化能」とし、測定対象とするバイオマーカーを選択した実施例を説明する。本実施例において、カテゴリ及び個数範囲は図9で示した例と同じである。すなわち、カテゴリとして「iPS細胞」、「外胚葉」、「中胚葉」及び「内胚葉」を指定し、個数範囲として各カテゴリに「225~250」を指定した。
図29に示す表200は、本実施例において測定対象遺伝子を選択するために指定された先行知見遺伝子、及び抽出されたDEGsを示す。先行知見遺伝子には、知見者ヒアリングに基づくもの、あるいはTaqManスコアカードといった有名遺伝子パネルも含まれている。DEGsには、iPS細胞25あるいはES細胞、及び、iPS細胞25あるいはES細胞を三胚葉26又は組織細胞30に分化させた実験における抽出対象15Eから抽出されたものが含まれている。本実施例では、これら約2900個(一部重複)の遺伝子の中から、個数範囲を満たす約1000個(具体的には980個)の測定対象遺伝子を選択した。より詳しくは、先行知見遺伝子及びDEGsに、アノテーション情報DB16から取得したアノテーション情報のうちで分化に関わるアノテーション情報のみを選定して付与した。そして、アノテーション情報に基づいて評価値を導出し、評価値が高い順に個数範囲を満たす数を選択した。また、先行知見遺伝子及びDEGsとは別に、正規化用遺伝子も測定対象遺伝子として選択した。こうして、約1000個(具体的には980個)の遺伝子を測定対象に選択した。選択した約1000個の測定対象遺伝子をC1000という。
iPS細胞25を心筋細胞に分化誘導する実験において、iPS細胞25の段階における15サンプルのC1000の発現量を測定した。15サンプルのうち、10サンプルは分化誘導効率が高く、一方で5サンプルは分化誘導効率が低かった。
ここで、本開示の技術の効果を確認するため、比較例として、15サンプルの分化誘導前のiPS細胞25について、別途、マイクロアレイによる網羅的な遺伝子発現量測定(約21000個の遺伝子の発現量測定)を行った。
図30に、マイクロアレイによる遺伝子発現量の測定結果202を示す。バー203は各遺伝子の発現量を表す。測定結果202によれば、クラスタリングによって左側の9サンプルのグループと右側の6サンプルのグループとに分かれ、6サンプルのグループに、「Bad」で示す分化誘導効率が低かった5サンプルが全て包含された。つまり、マイクロアレイによる遺伝子発現量の測定結果202によれば、iPS細胞25の段階で、分化誘導効率の高低を比較的高い確度(分化誘導効率が低くなるサンプルの検出感度100%、分化誘導効率が低くなるサンプルの特異度83%)で予測可能であることが分かった。「Good」は、分化誘導効率が高かったサンプルを示す。
マイクロアレイの測定対象となった約21000個の遺伝子から、発現量が閾値以上である高発現遺伝子を抽出し、さらに、高発現遺伝子に付与されたアノテーション情報の中から、細胞の挙動への影響度が比較的高いアノテーション情報(高影響アノテーション情報という。)を統計的な手法によって選出した。その結果を図31の表205及び図32の表206に示す。表205及び表206によれば、種々雑多なアノテーション情報が高影響アノテーション情報として選出されており、細胞の挙動の解明に繋がる有効な知見を得ることは困難であることが分かった。
図33に、15サンプルの分化誘導前のiPS細胞25について行った、C1000の発現量の測定結果208を示す。測定結果208によれば、クラスタリングによって右側の9サンプルのグループと左側の6サンプルのグループに分かれ、6サンプルのグループに、「Bad」で示す分化誘導効率が低かった5サンプルが全て包含された(分化誘導効率が低くなるサンプルの検出感度100%、分化誘導効率が低くなるサンプルの特異度83%)。したがって、本開示の技術に係るC1000によれば、マイクロアレイによる網羅的な測定と同等のレベルの分化誘導効率の予測が可能であることが確認された。
マイクロアレイの測定対象となった遺伝子についての先述の解析と同様にして、C1000から高発現遺伝子を抽出し、さらに高影響アノテーション情報を選出した。その結果を図34の表210に示す。表210によれば、血管形成系機能発現に関するアノテーション情報が特に多く選出されていることが分かる。また、NODAL、LEFTY1、LEFTY2、CER1、BMP4等の遺伝子が目立っており、これらの遺伝子が分化誘導効率の高低を決定付けていそうなことが読み取れる。つまり、本開示の技術のように、アノテーション情報から評価値を導出し、評価値に基づいて測定対象遺伝子を選択すれば、生体試料の特性の解明に大いに役立つことが確認された。
続いて、本開示の技術により選択したC1000の測定遺伝子のセットと、従来手法を代表してTaqManスコアカードの測定遺伝子のセットとの解析能力を比較した。TaqManスコアカードの測定遺伝子のセットによる測定結果は、マイクロアレイによる網羅的な遺伝子発現量測定の結果から、TaqManスコアカードの84個の遺伝子を抽出して疑似的に作成したものである。
解析能力の比較として、DEGs抽出によって、TaqManスコアカードにおける生体試料の種類と、C1000における生体試料の種類のアノテーション情報とを対比させ、各アノテーション情報が付与された遺伝子に対して、DEGsがどの程度濃縮されたかを表すオッズ比を調べた。図35にC1000の測定遺伝子のセットによるオッズ比の棒グラフ215、図36にTaqManスコアカードの測定遺伝子のセットによるオッズ比の棒グラフ216を示す。
図35の棒グラフ215によれば、C1000の測定遺伝子のセットでは、分化誘導効率が低いサンプルにおいて、「中胚葉」及び「内胚葉」に関連する遺伝子が濃縮されており、且つ「iPS細胞」に関連する遺伝子が減少していた。また、分化誘導効率が低い場合の各生体試料の種類に関連する遺伝子は、「外胚葉」を除いて、オッズ比が統計的に有意に100%から乖離(q値(q-value)が0.05未満(q<0.05))していた。このため、C1000の測定遺伝子のセットは、分化誘導効率が低くなるサンプルに対する一定の解析能力を有していることが分かった。こうした結果が得られたのは、各生体試料の種類に焦点を当てた十分に多い測定対象遺伝子がバランスよく配分されているためと考えられる。
一方、図36の棒グラフ216によれば、TaqManスコアカードの測定遺伝子のセットでは、分化誘導効率が高いサンプルにおいて「iPS細胞」に関連する遺伝子が、分化誘導効率が低いサンプルにおいて「内胚葉」に関連する遺伝子が、それぞれ濃縮されていた。しかし、オッズ比が統計的に有意に100%から乖離しているのは、分化誘導効率が高い場合の「iPS細胞」に関連する遺伝子のみであった。このため、TaqManスコアカードの測定遺伝子のセットは、分化誘導効率が低くなるサンプルに対する解析能力に限界があることが分かった。こうした結果が得られたのは、C1000の場合と異なり、各生体試料の種類に配分された遺伝子の個数が少なく、極端な比率が生まれやすいためと考えられる。
以上のように、本開示の技術は、事前に知見が蓄積されていない場合においても、統計的に有意な解明が可能である。つまり、検査が短時間で済み、且つ比較的安価なPCRをベースとした手法を、RNA-Seqのように活用可能ということであり、幅広い応用が期待できる。
<iPS細胞由来心筋細胞の作製>
[iPS細胞から心筋細胞への分化誘導]
複数のドナーに由来する末梢血単核球細胞から特許第5984217号公報に記載の方法に準じてiPS細胞を15クローン作製した。これらクローンを、クローンA、クローンB、クローンC、クローンD、クローンE、クローンF、クローンG、クローンH、クローンI、クローンJ、クローンK、クローンL、クローンM、クローンN及びクローンOという。
[iPS細胞から心筋細胞への分化誘導]
複数のドナーに由来する末梢血単核球細胞から特許第5984217号公報に記載の方法に準じてiPS細胞を15クローン作製した。これらクローンを、クローンA、クローンB、クローンC、クローンD、クローンE、クローンF、クローンG、クローンH、クローンI、クローンJ、クローンK、クローンL、クローンM、クローンN及びクローンOという。
iPS細胞の培養にはmTeSR1(登録商標)(Stem Cell Technologies社)及びMatrigel(登録商標)(Corning社)を使用し、0.5mmol/L EDTA溶液(Invitrogen社)によって7分間処理することで細胞を回収し継代した。
上記の条件でT225フラスコ2枚分までiPS細胞を拡大培養した。上記条件でコンフルエンシーが80%程度になるまでiPS細胞を増殖させたのち、TrypLE Select(「TrypLE」は登録商標)(Thermo Fisher社)にて細胞を単一細胞に分離及び剥離して回収し、終濃度1μmol/L H1152(富士フイルム和光純薬株式会社)、25μg/ml Gentamicin(Thermo Fisher社)及び100ng/ml bFGF(富士フイルム和光純薬株式会社)を添加したmTeSR1(登録商標)中に3.0×106cells/mlとなるように細胞を懸濁し、細胞懸濁液を得た。この細胞懸濁液を一部採取し、後述する遺伝子発現解析に用いた。
上記細胞懸濁液を30mlシングルユースバイオリアクター(エイブル社)中に15ml添加し、回転速度40rpmで攪拌培養した。攪拌培養開始から2時間~4時間後、同一の培養液にて最終液量30mlとなるようにメスアップし、攪拌培養を継続した。
攪拌培養開始1日後、終濃度1μmol/L H1152、25μg/ml Gentamicin、100ng/ml bFGF、24ng/ml Activin、5%ウシ胎児血清(GEヘルスケア社)、×0.5 mTeSR1(登録商標)及び×0.5 DMEM low-glucose(Thermo Fisher社)からなる培養液に置換し、分化培養を開始した。
攪拌培養開始2日後、培養液を一部採取し、後述する遺伝子発現解析に用いた。また、培養液を一部採取して細胞数を計測し、終濃度25μg/ml Gentamaicin、100ng/ml bFGF、24ng/ml Activin、40ng/ml BMP4、10%ウシ胎児血清、及びDMEM low-glucoseからなる培養液中に1.0×106cells/mlとなるように調製し、攪拌培養を継続した。攪拌培養開始3日~7日は同培養液にて毎日培地交換し、攪拌培養を継続した。
攪拌培養開始8日後、培養液を一部採取し、後述する遺伝子発現解析に用いた。また、培養液を一部採取して細胞数を計測し、終濃度25μg/ml Gentamaicin、16.25μg/ml XAV939(Sigma Aldrich社)、10%ウシ胎児血清、及びDMEM low-glucoseからなる培養液中に1.0×106cells/mlとなるように調製し、攪拌培養を継続した。攪拌培養9日~13日はXAV939を除いた同培養液にて2日毎に培地交換し、攪拌培養を継続した。
攪拌培養開始14日後、培養液の一部を採取して細胞数を計測した。最終的に得られた分化誘導後の細胞数を表1に示す。
上記の条件でT225フラスコ2枚分までiPS細胞を拡大培養した。上記条件でコンフルエンシーが80%程度になるまでiPS細胞を増殖させたのち、TrypLE Select(「TrypLE」は登録商標)(Thermo Fisher社)にて細胞を単一細胞に分離及び剥離して回収し、終濃度1μmol/L H1152(富士フイルム和光純薬株式会社)、25μg/ml Gentamicin(Thermo Fisher社)及び100ng/ml bFGF(富士フイルム和光純薬株式会社)を添加したmTeSR1(登録商標)中に3.0×106cells/mlとなるように細胞を懸濁し、細胞懸濁液を得た。この細胞懸濁液を一部採取し、後述する遺伝子発現解析に用いた。
上記細胞懸濁液を30mlシングルユースバイオリアクター(エイブル社)中に15ml添加し、回転速度40rpmで攪拌培養した。攪拌培養開始から2時間~4時間後、同一の培養液にて最終液量30mlとなるようにメスアップし、攪拌培養を継続した。
攪拌培養開始1日後、終濃度1μmol/L H1152、25μg/ml Gentamicin、100ng/ml bFGF、24ng/ml Activin、5%ウシ胎児血清(GEヘルスケア社)、×0.5 mTeSR1(登録商標)及び×0.5 DMEM low-glucose(Thermo Fisher社)からなる培養液に置換し、分化培養を開始した。
攪拌培養開始2日後、培養液を一部採取し、後述する遺伝子発現解析に用いた。また、培養液を一部採取して細胞数を計測し、終濃度25μg/ml Gentamaicin、100ng/ml bFGF、24ng/ml Activin、40ng/ml BMP4、10%ウシ胎児血清、及びDMEM low-glucoseからなる培養液中に1.0×106cells/mlとなるように調製し、攪拌培養を継続した。攪拌培養開始3日~7日は同培養液にて毎日培地交換し、攪拌培養を継続した。
攪拌培養開始8日後、培養液を一部採取し、後述する遺伝子発現解析に用いた。また、培養液を一部採取して細胞数を計測し、終濃度25μg/ml Gentamaicin、16.25μg/ml XAV939(Sigma Aldrich社)、10%ウシ胎児血清、及びDMEM low-glucoseからなる培養液中に1.0×106cells/mlとなるように調製し、攪拌培養を継続した。攪拌培養9日~13日はXAV939を除いた同培養液にて2日毎に培地交換し、攪拌培養を継続した。
攪拌培養開始14日後、培養液の一部を採取して細胞数を計測した。最終的に得られた分化誘導後の細胞数を表1に示す。
[iPS細胞由来心筋細胞塊のフローサイトメトリーによる解析]
攪拌培養開始後14日の細胞塊をTrypLE Select(「TrypLE」は登録商標)で単一細胞まで分離し、Live/Dead(登録商標)Fixable Green Dead Cell Stain Kitを用いて死細胞を染色した。D-PBS(Thermo Fisher社)にて洗浄後、終濃度4% ホルムアルデヒド(Sigma Aldrich社)で処理して細胞を固定した。固定細胞0.5×106cellsに対して、終濃度0.1%Saponin(Merck Millipore社)及び2%ウシ胎児血清を含むD-PBS中に、抗cTnT抗体(Abcam社、ab8295)を1/250に希釈して添加し、室温で1時間処置した。同時にアイソタイプコントロールとしてIgG1 Isotype Control from Murine Myeloma(Sigma Aldrich社、M5284)を1/25に希釈して添加したサンプルを並列させた。次いで、Alexa Fluor 647(「Alexa Fluor」は登録商標)標識ヤギ抗マウスIgG1抗体(Thermo Fisher社、A21240)を1/500に希釈して添加し、室温で30分処置した。標識後の細胞をフローサイトメーター(Thermo Fisher社、Attune NxT)を用いて解析した。前方光散乱、側方光散乱、及び生細胞をゲーティングしたのち、アイソタイプコントロールとの比較からcTnT陽性率(細胞の個数割合)を算出した。クローンAから分化誘導された細胞塊のドットプロットを図37に、クローンごとのcTnT陽性率を表2に示す。
攪拌培養開始後14日の細胞塊をTrypLE Select(「TrypLE」は登録商標)で単一細胞まで分離し、Live/Dead(登録商標)Fixable Green Dead Cell Stain Kitを用いて死細胞を染色した。D-PBS(Thermo Fisher社)にて洗浄後、終濃度4% ホルムアルデヒド(Sigma Aldrich社)で処理して細胞を固定した。固定細胞0.5×106cellsに対して、終濃度0.1%Saponin(Merck Millipore社)及び2%ウシ胎児血清を含むD-PBS中に、抗cTnT抗体(Abcam社、ab8295)を1/250に希釈して添加し、室温で1時間処置した。同時にアイソタイプコントロールとしてIgG1 Isotype Control from Murine Myeloma(Sigma Aldrich社、M5284)を1/25に希釈して添加したサンプルを並列させた。次いで、Alexa Fluor 647(「Alexa Fluor」は登録商標)標識ヤギ抗マウスIgG1抗体(Thermo Fisher社、A21240)を1/500に希釈して添加し、室温で30分処置した。標識後の細胞をフローサイトメーター(Thermo Fisher社、Attune NxT)を用いて解析した。前方光散乱、側方光散乱、及び生細胞をゲーティングしたのち、アイソタイプコントロールとの比較からcTnT陽性率(細胞の個数割合)を算出した。クローンAから分化誘導された細胞塊のドットプロットを図37に、クローンごとのcTnT陽性率を表2に示す。
<遺伝子の発現量の測定>
iPS細胞の培養工程において採取した攪拌培養0日目、2日目及び8日目の細胞からそれぞれ、RNeasy Plus Mini Kit(キアゲン社)を用いて、トータルRNAの抽出を行った。抽出したRNAを試料にしてC1000の遺伝子発現量を測定した。
iPS細胞の培養工程において採取した攪拌培養0日目、2日目及び8日目の細胞からそれぞれ、RNeasy Plus Mini Kit(キアゲン社)を用いて、トータルRNAの抽出を行った。抽出したRNAを試料にしてC1000の遺伝子発現量を測定した。
<測定した遺伝子情報の解析>
C1000の遺伝子発現量のデータと、心筋細胞の識別マーカーであるcTnT陽性率とから、今回使用したiPS細胞の特徴を示す遺伝子を特定するために、下記の解析を行った。
攪拌培養0日目、2日目及び8日目に採取した各細胞から取得したそれぞれのトータルRNAからC1000の遺伝子発現量のデータを取得し、これを説明変数とした。また、攪拌培養14日目のcTnT陽性率を目的変数とした。この説明変数と目的変数とから、ランダムフォレストを用いた回帰分析によってcTnT陽性率の予測モデルを作成した。15クローンの評価データセットのうち、12クローンの評価データセットをトレーニングデータとして用いて予測モデルを作成し、残る3クローンの評価データセットをテストデータとして予測モデルの妥当性を検証した。その結果を図38に示す。横軸(X)をcTnT陽性率の実測値とし、縦軸(Y)をcTnT陽性率の予測値とし、3つのテストデータをプロットした結果、3プロットそれぞれがY=Xの直線に漸近しており、予測モデルの妥当性が示された。
上記の予測モデルの作成において寄与度が高かった遺伝子を、寄与度の高い順に表3に示す。
C1000の遺伝子発現量のデータと、心筋細胞の識別マーカーであるcTnT陽性率とから、今回使用したiPS細胞の特徴を示す遺伝子を特定するために、下記の解析を行った。
攪拌培養0日目、2日目及び8日目に採取した各細胞から取得したそれぞれのトータルRNAからC1000の遺伝子発現量のデータを取得し、これを説明変数とした。また、攪拌培養14日目のcTnT陽性率を目的変数とした。この説明変数と目的変数とから、ランダムフォレストを用いた回帰分析によってcTnT陽性率の予測モデルを作成した。15クローンの評価データセットのうち、12クローンの評価データセットをトレーニングデータとして用いて予測モデルを作成し、残る3クローンの評価データセットをテストデータとして予測モデルの妥当性を検証した。その結果を図38に示す。横軸(X)をcTnT陽性率の実測値とし、縦軸(Y)をcTnT陽性率の予測値とし、3つのテストデータをプロットした結果、3プロットそれぞれがY=Xの直線に漸近しており、予測モデルの妥当性が示された。
上記の予測モデルの作成において寄与度が高かった遺伝子を、寄与度の高い順に表3に示す。
<遺伝子のアノテーション情報の参照>
表3に示す遺伝子(すなわち、今回使用したiPS細胞の特徴を示すバイオマーカー)について、各遺伝子に紐づけされたアノテーション情報を参照したところ、sFRP2のアノテーション情報に、心筋細胞への分化に影響を与えるWnt3aをsFRP2が阻害する、という文献が見つかった。この文献の内容から、培養液にWnt3aを添加してWntシグナル経路を活性化することでiPS細胞から心筋細胞への分化効率が上昇する、と予測された。
表3に示す遺伝子(すなわち、今回使用したiPS細胞の特徴を示すバイオマーカー)について、各遺伝子に紐づけされたアノテーション情報を参照したところ、sFRP2のアノテーション情報に、心筋細胞への分化に影響を与えるWnt3aをsFRP2が阻害する、という文献が見つかった。この文献の内容から、培養液にWnt3aを添加してWntシグナル経路を活性化することでiPS細胞から心筋細胞への分化効率が上昇する、と予測された。
<iPS細胞を心筋細胞へと分化誘導する培養工程の改善>
iPS細胞の15クローンからクローンDとクローンHとクローンOとを選択し、先述と同様の攪拌培養を14日間行った。その際に、各クローンそれぞれ培養2日~8日目の間の各日において、培養液中にWnt3aを終濃度100ng/ml添加した。同時に、培養液中にWnt3aを添加しない対照群も培養した。攪拌培養開始後14日の細胞塊に、先述と同様のフローサイトメトリーによる解析を行い、cTnT陽性率を調べた。その結果を表4に示す。Wnt3a非添加群と比べWnt3a添加群は、iPS細胞から心筋細胞への分化効率が有意に上昇した。
iPS細胞の15クローンからクローンDとクローンHとクローンOとを選択し、先述と同様の攪拌培養を14日間行った。その際に、各クローンそれぞれ培養2日~8日目の間の各日において、培養液中にWnt3aを終濃度100ng/ml添加した。同時に、培養液中にWnt3aを添加しない対照群も培養した。攪拌培養開始後14日の細胞塊に、先述と同様のフローサイトメトリーによる解析を行い、cTnT陽性率を調べた。その結果を表4に示す。Wnt3a非添加群と比べWnt3a添加群は、iPS細胞から心筋細胞への分化効率が有意に上昇した。
本実施形態を、iPS細胞から心筋細胞を製造する製造工程に採用することで、心筋細胞の生産性を改善することが可能である。
日本国特許出願第2020-106416号の開示は、その全体が参照により本明細書に取り込まれる。
本明細書に記載された全ての文献、特許出願、及び技術規格は、個々の文献、特許出願、及び技術規格が参照により取り込まれることが具体的かつ個々に記された場合と同程度に、本明細書中に援用されて取り込まれる。
本明細書に記載された全ての文献、特許出願、及び技術規格は、個々の文献、特許出願、及び技術規格が参照により取り込まれることが具体的かつ個々に記された場合と同程度に、本明細書中に援用されて取り込まれる。
10 情報処理装置
11 ネットワーク
12 遺伝子発現情報データベースサーバ(遺伝子発現情報DBサーバ)
13 アノテーション情報データベースサーバ(アノテーション情報DBサーバ)
14 遺伝子発現情報データベース(遺伝子発現情報DB)
15 遺伝子発現情報
15E 抽出対象
16 アノテーション情報データベース(アノテーション情報DB)
20 アノテーション情報テーブル
22、150、151、158、161、200、205、206、210 表
25 iPS細胞
26 三胚葉
27 外胚葉
28 中胚葉
29 内胚葉
30 組織細胞
31 水晶体
32 神経細胞
33 血液細胞
34 骨細胞
35 筋細胞
36 肺胞細胞
37 腸管細胞
38 肝細胞
45 ストレージデバイス
46 メモリ
47 CPU(プロセッサ)
48 通信部
49 ディスプレイ
50 入力デバイス
51 バスライン
55 作動プログラム(情報処理装置の作動プログラム)
60 指示受付部
61 抽出部
62 取得部
63 導出部
64 選択部
65 表示制御部
70 カテゴリ及び個数範囲指定情報
71 先行知見遺伝子指定情報
72 第1配信要求
73 抽出対象指定情報
74 DEGsリスト
74G、160G 付与済DEGsリスト
75 第2配信要求
76 配信情報
77 評価値テーブル
78 測定対象遺伝子リスト
78P 仮測定対象遺伝子リスト
80 カテゴリ指定画面
81、96 プルダウンメニュー
82~84、106 入力ボックス
85、97、107 追加ボタン
86、98、108 指定ボタン
87、121A~121D 表示領域
88、91 メッセージ
90 警告画面
92 OKボタン
95 先行知見遺伝子指定画面
105 抽出対象指定画面
115 選択順位表群
116A~116D 選択順位表
120 測定対象遺伝子表示画面
122 保存ボタン
123 印刷ボタン
124 確認ボタン
202 マイクロアレイによる遺伝子発現量の測定結果
203 バー
208 C1000の発現量の測定結果
215、216 棒グラフ
ST100、ST110、ST120、ST130、ST140、ST150、ST160、ST170、ST180、ST190、ST210、ST230、ST250 ステップ
ST200 ステップ(取得処理)
ST220 ステップ(導出処理)
ST240 ステップ(選択処理)
11 ネットワーク
12 遺伝子発現情報データベースサーバ(遺伝子発現情報DBサーバ)
13 アノテーション情報データベースサーバ(アノテーション情報DBサーバ)
14 遺伝子発現情報データベース(遺伝子発現情報DB)
15 遺伝子発現情報
15E 抽出対象
16 アノテーション情報データベース(アノテーション情報DB)
20 アノテーション情報テーブル
22、150、151、158、161、200、205、206、210 表
25 iPS細胞
26 三胚葉
27 外胚葉
28 中胚葉
29 内胚葉
30 組織細胞
31 水晶体
32 神経細胞
33 血液細胞
34 骨細胞
35 筋細胞
36 肺胞細胞
37 腸管細胞
38 肝細胞
45 ストレージデバイス
46 メモリ
47 CPU(プロセッサ)
48 通信部
49 ディスプレイ
50 入力デバイス
51 バスライン
55 作動プログラム(情報処理装置の作動プログラム)
60 指示受付部
61 抽出部
62 取得部
63 導出部
64 選択部
65 表示制御部
70 カテゴリ及び個数範囲指定情報
71 先行知見遺伝子指定情報
72 第1配信要求
73 抽出対象指定情報
74 DEGsリスト
74G、160G 付与済DEGsリスト
75 第2配信要求
76 配信情報
77 評価値テーブル
78 測定対象遺伝子リスト
78P 仮測定対象遺伝子リスト
80 カテゴリ指定画面
81、96 プルダウンメニュー
82~84、106 入力ボックス
85、97、107 追加ボタン
86、98、108 指定ボタン
87、121A~121D 表示領域
88、91 メッセージ
90 警告画面
92 OKボタン
95 先行知見遺伝子指定画面
105 抽出対象指定画面
115 選択順位表群
116A~116D 選択順位表
120 測定対象遺伝子表示画面
122 保存ボタン
123 印刷ボタン
124 確認ボタン
202 マイクロアレイによる遺伝子発現量の測定結果
203 バー
208 C1000の発現量の測定結果
215、216 棒グラフ
ST100、ST110、ST120、ST130、ST140、ST150、ST160、ST170、ST180、ST190、ST210、ST230、ST250 ステップ
ST200 ステップ(取得処理)
ST220 ステップ(導出処理)
ST240 ステップ(選択処理)
Claims (6)
- 細胞Bの製造に用いる細胞Aの特徴を示すバイオマーカーを特定する方法であって、下記の(1)~(4)を含む、バイオマーカー特定方法。
(1)複数のバイオマーカーそれぞれに付与されたアノテーション情報に基づいて、複数の前記バイオマーカー毎の評価値を導出し、前記評価値に基づいて、複数の前記バイオマーカーの中から測定対象のバイオマーカーを選択すること。
(2)前記細胞Aの培養開始前及び培養中の少なくとも一方において、前記細胞A及び培養系の少なくとも一方から、前記測定対象のバイオマーカーの評価データを取得すること。
(3)前記細胞Aの培養終期及び培養終了後の少なくとも一方において、前記細胞A及び培養系の少なくとも一方から、前記細胞Bの識別マーカーの評価データを取得すること。
(4)前記測定対象のバイオマーカーの評価データと、前記細胞Bの識別マーカーの評価データとに基づき、前記測定対象のバイオマーカーの中から、前記細胞Bの製造に用いる細胞Aの特徴を示すバイオマーカーを少なくとも1つ特定すること。 - 前記バイオマーカーが、遺伝子の発現量、タンパク質の発現量、及び代謝物の生成量からなる群から選ばれる少なくとも1種を含む、請求項1に記載のバイオマーカー特定方法。
- 前記(2)が複数のタイムポイントにおいて行われる、請求項1又は請求項2に記載のバイオマーカー特定方法。
- 前記細胞Aが多能性幹細胞であり、前記細胞Bが分化細胞である、請求項1~請求項3のいずれか1項に記載のバイオマーカー特定方法。
- 細胞Aを培養して細胞Bを製造する方法であって、下記の(A)~(C)を含む、細胞の製造方法。
(A)請求項1~請求項3のいずれか1項に記載のバイオマーカー特定方法を行い、前記細胞Aの特徴を示すバイオマーカーを少なくとも1つ特定すること。
(B)特定されたバイオマーカーのアノテーション情報を参照し、当該バイオマーカーが関係するシグナル伝達及び当該バイオマーカーが変動するメカニズムの少なくとも1つを特定すること。
(C)前記シグナル伝達及び前記メカニズムの少なくとも1つを阻害又は促進する培養条件で前記細胞Aを培養し、前記細胞Bを製造すること。 - 前記細胞Aが多能性幹細胞であり、前記細胞Bが分化細胞である、請求項5に記載の細胞の製造方法。
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202180039681.0A CN115885048A (zh) | 2020-06-19 | 2021-04-21 | 生物标记确定方法及细胞的制造方法 |
EP21825277.3A EP4148139A4 (en) | 2020-06-19 | 2021-04-21 | METHOD FOR IDENTIFYING BIOMARKERS AND METHOD FOR PRODUCING CELLS |
JP2022532342A JPWO2021256078A1 (ja) | 2020-06-19 | 2021-04-21 | |
US18/053,373 US20230066188A1 (en) | 2020-06-19 | 2022-11-08 | Biomarker identifying method and cell producing method |
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020106416 | 2020-06-19 | ||
JP2020-106416 | 2020-06-19 |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
US18/053,373 Continuation US20230066188A1 (en) | 2020-06-19 | 2022-11-08 | Biomarker identifying method and cell producing method |
Publications (1)
Publication Number | Publication Date |
---|---|
WO2021256078A1 true WO2021256078A1 (ja) | 2021-12-23 |
Family
ID=79267756
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
PCT/JP2021/016167 WO2021256078A1 (ja) | 2020-06-19 | 2021-04-21 | バイオマーカー特定方法及び細胞の製造方法 |
Country Status (5)
Country | Link |
---|---|
US (1) | US20230066188A1 (ja) |
EP (1) | EP4148139A4 (ja) |
JP (1) | JPWO2021256078A1 (ja) |
CN (1) | CN115885048A (ja) |
WO (1) | WO2021256078A1 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115454988A (zh) * | 2022-09-27 | 2022-12-09 | 哈尔滨工业大学 | 基于随机森林网络的卫星电源系统缺失数据补全方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009534036A (ja) | 2006-04-21 | 2009-09-24 | ワイス | 細胞培養表現型の示差的発現プロファイリング分析およびその使用 |
JP5984217B2 (ja) | 2010-06-15 | 2016-09-06 | セルラー ダイナミクス インターナショナル, インコーポレイテッド | 少量の末梢血からの人工多能性幹細胞の作製 |
WO2016148253A1 (ja) * | 2015-03-18 | 2016-09-22 | 小野薬品工業株式会社 | ナイーブ型多能性幹細胞の製造方法 |
JP2019020838A (ja) | 2017-07-12 | 2019-02-07 | シスメックス株式会社 | データベースを構築する方法 |
JP2020106416A (ja) | 2018-12-27 | 2020-07-09 | 新コスモス電機株式会社 | 定電位電解式ガスセンサ |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA2812194C (en) * | 2010-09-17 | 2022-12-13 | President And Fellows Of Harvard College | Functional genomics assay for characterizing pluripotent stem cell utility and safety |
AR087491A1 (es) * | 2011-08-12 | 2014-03-26 | Sanofi Sa | Evaluacion de la calidad de celulas pluripotentes inducidas por referencia a patrones distintivos de corte y empalme de pluripotencia |
US11085067B2 (en) * | 2013-06-10 | 2021-08-10 | President And Fellows Of Harvard College | Early developmental genomic assay for characterizing pluripotent stem cell utility and safety |
JP6736772B2 (ja) * | 2017-06-19 | 2020-08-05 | 公益財団法人神戸医療産業都市推進機構 | 多能性幹細胞の分化能の予測方法及びそのための試薬 |
WO2019240008A1 (ja) * | 2018-06-13 | 2019-12-19 | 富士フイルム株式会社 | 情報処理装置、導出方法、及び導出プログラム |
-
2021
- 2021-04-21 CN CN202180039681.0A patent/CN115885048A/zh active Pending
- 2021-04-21 WO PCT/JP2021/016167 patent/WO2021256078A1/ja unknown
- 2021-04-21 EP EP21825277.3A patent/EP4148139A4/en not_active Withdrawn
- 2021-04-21 JP JP2022532342A patent/JPWO2021256078A1/ja not_active Abandoned
-
2022
- 2022-11-08 US US18/053,373 patent/US20230066188A1/en active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009534036A (ja) | 2006-04-21 | 2009-09-24 | ワイス | 細胞培養表現型の示差的発現プロファイリング分析およびその使用 |
JP5984217B2 (ja) | 2010-06-15 | 2016-09-06 | セルラー ダイナミクス インターナショナル, インコーポレイテッド | 少量の末梢血からの人工多能性幹細胞の作製 |
WO2016148253A1 (ja) * | 2015-03-18 | 2016-09-22 | 小野薬品工業株式会社 | ナイーブ型多能性幹細胞の製造方法 |
JP2019020838A (ja) | 2017-07-12 | 2019-02-07 | シスメックス株式会社 | データベースを構築する方法 |
JP2020106416A (ja) | 2018-12-27 | 2020-07-09 | 新コスモス電機株式会社 | 定電位電解式ガスセンサ |
Non-Patent Citations (2)
Title |
---|
TAKASHIMA, Y. ET AL.: "Resetting transcription factor control circuity toward ground-state pluripotency in human", CELL, vol. 158, 2014, pages 1254 - 1269, XP029055525, DOI: 10.1016/j.cell.2014.08.029 * |
TALEAHMAD, S. ET AL.: "Low focal adhesion signaling promotes ground state pluripotency of mouse embryonic stem cells", J. PROTEOME RES., vol. 16, 2017, pages 3583 - 3595, XP055895672 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115454988A (zh) * | 2022-09-27 | 2022-12-09 | 哈尔滨工业大学 | 基于随机森林网络的卫星电源系统缺失数据补全方法 |
Also Published As
Publication number | Publication date |
---|---|
EP4148139A1 (en) | 2023-03-15 |
JPWO2021256078A1 (ja) | 2021-12-23 |
EP4148139A4 (en) | 2023-11-08 |
US20230066188A1 (en) | 2023-03-02 |
CN115885048A (zh) | 2023-03-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Schwalie et al. | A stromal cell population that inhibits adipogenesis in mammalian fat depots | |
Kernfeld et al. | A single-cell transcriptomic atlas of thymus organogenesis resolves cell types and developmental maturation | |
Girskis et al. | Rewiring of human neurodevelopmental gene regulatory programs by human accelerated regions | |
Phipson et al. | Evaluation of variability in human kidney organoids | |
Patel et al. | Lifelong multilineage contribution by embryonic-born blood progenitors | |
Lau et al. | Mouse embryo model derived exclusively from embryonic stem cells undergoes neurulation and heart development | |
Dwyer et al. | Expression profiling of constitutive mast cells reveals a unique identity within the immune system | |
Mo et al. | Epigenomic landscapes of retinal rods and cones | |
Yoshida et al. | Early hematopoietic lineage restrictions directed by Ikaros | |
Greenblatt et al. | The unmixing problem: a guide to applying single‐cell RNA sequencing to bone | |
Ayturk et al. | Single‐cell RNA sequencing of calvarial and long‐bone endocortical cells | |
Yang et al. | Single cell transcriptomics reveals unanticipated features of early hematopoietic precursors | |
Zhang et al. | A human embryonic limb cell atlas resolved in space and time | |
Williams et al. | Prediction of human induced pluripotent stem cell cardiac differentiation outcome by multifactorial process modeling | |
Noh et al. | A resource for discovering specific and universal biomarkers for distributed stem cells | |
WO2021256078A1 (ja) | バイオマーカー特定方法及び細胞の製造方法 | |
Morte et al. | Evaluation of proliferation of neural stem cells in vitro and in vivo | |
Sokol et al. | Protocols for endothelial cell isolation from mouse tissues: small intestine, colon, heart, and liver | |
Palani et al. | Adipogenic and SWAT cells separate from a common progenitor in human brown and white adipose depots | |
KR20240115244A (ko) | 중간엽 기질세포 품질 평가 방법 | |
CN113512588B (zh) | 用于骨肉瘤分型和评估骨肉瘤预后的基因及其应用 | |
Sun et al. | Single-cell RNA-Seq reveals transcriptional regulatory networks directing the development of mouse maxillary prominence | |
Wang et al. | Single-cell transcriptomic profiling reveals specific maturation signatures in human cardiomyocytes derived from LMNB2-inactivated induced pluripotent stem cells | |
Stankiewicz et al. | Sex biased human thymic architecture guides T cell development through spatially defined niches | |
Vu et al. | Identifying novel regulators of placental development using time-series transcriptome data |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
121 | Ep: the epo has been informed by wipo that ep was designated in this application |
Ref document number: 21825277 Country of ref document: EP Kind code of ref document: A1 |
|
ENP | Entry into the national phase |
Ref document number: 2022532342 Country of ref document: JP Kind code of ref document: A |
|
ENP | Entry into the national phase |
Ref document number: 2021825277 Country of ref document: EP Effective date: 20221209 |
|
NENP | Non-entry into the national phase |
Ref country code: DE |