CN115885048A - 生物标记确定方法及细胞的制造方法 - Google Patents

生物标记确定方法及细胞的制造方法 Download PDF

Info

Publication number
CN115885048A
CN115885048A CN202180039681.0A CN202180039681A CN115885048A CN 115885048 A CN115885048 A CN 115885048A CN 202180039681 A CN202180039681 A CN 202180039681A CN 115885048 A CN115885048 A CN 115885048A
Authority
CN
China
Prior art keywords
cell
cells
information
biomarker
gene
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202180039681.0A
Other languages
English (en)
Inventor
村上裕太
长濑雅也
野口恭久
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Corp
Original Assignee
Fujifilm Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujifilm Corp filed Critical Fujifilm Corp
Publication of CN115885048A publication Critical patent/CN115885048A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N5/00Undifferentiated human, animal or plant cells, e.g. cell lines; Tissues; Cultivation or maintenance thereof; Culture media therefor
    • C12N5/06Animal cells or tissues; Human cells or tissues
    • C12N5/0602Vertebrate cells
    • C12N5/0652Cells of skeletal and connective tissues; Mesenchyme
    • C12N5/0657Cardiomyocytes; Heart cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N5/00Undifferentiated human, animal or plant cells, e.g. cell lines; Tissues; Cultivation or maintenance thereof; Culture media therefor
    • C12N5/06Animal cells or tissues; Human cells or tissues
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/02Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving viable microorganisms
    • C12Q1/04Determining presence or kind of microorganism; Use of selective media for testing antibiotics or bacteriocides; Compositions containing a chemical indicator therefor
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6881Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for tissue or cell typing, e.g. human leukocyte antigen [HLA] probes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2501/00Active agents used in cell culture processes, e.g. differentation
    • C12N2501/10Growth factors
    • C12N2501/115Basic fibroblast growth factor (bFGF, FGF-2)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2501/00Active agents used in cell culture processes, e.g. differentation
    • C12N2501/10Growth factors
    • C12N2501/155Bone morphogenic proteins [BMP]; Osteogenins; Osteogenic factor; Bone inducing factor
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2501/00Active agents used in cell culture processes, e.g. differentation
    • C12N2501/10Growth factors
    • C12N2501/16Activin; Inhibin; Mullerian inhibiting substance
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2501/00Active agents used in cell culture processes, e.g. differentation
    • C12N2501/40Regulators of development
    • C12N2501/415Wnt; Frizzeled
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2506/00Differentiation of animal cells from one lineage to another; Differentiation of pluripotent cells
    • C12N2506/45Differentiation of animal cells from one lineage to another; Differentiation of pluripotent cells from artificially induced pluripotent stem cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2533/00Supports or coatings for cell culture, characterised by material
    • C12N2533/90Substrates of biological origin, e.g. extracellular matrix, decellularised tissue

Landscapes

  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Biotechnology (AREA)
  • Genetics & Genomics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biomedical Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • Immunology (AREA)
  • Analytical Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • Cell Biology (AREA)
  • Toxicology (AREA)
  • Cardiology (AREA)
  • Rheumatology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

一种包括(1)~(4)的生物标记确定方法及其应用。(1)根据对多个生物标记分别赋予的注释信息来导出每个生物标记的评价值,并根据评价值从多个生物标记中选择要测定的生物标记。(2)在细胞A的培养开始前及培养期间中的至少一个时期,从细胞A及培养系统中的至少一者获取要测定的生物标记的评价数据。(3)在细胞A的培养末期及培养结束后中的至少一个时期,从细胞A及培养系统中的至少一者获取细胞B的识别标记的评价数据。(4)根据要测定的生物标记的评价数据和细胞B的识别标记的评价数据从要测定的生物标记中确定至少一个表示细胞A的特征的生物标记。

Description

生物标记确定方法及细胞的制造方法
技术领域
本发明的技术涉及一种生物标记确定方法及细胞的制造方法。
背景技术
日本特开2019-020838号公报中公开了一种构建包括反映活体试样中的基因的表达或基因产物的功能的基因相关测定数据的基因相关信息的数据库的方法。
日本特表2009-534036号公报中公开了一种鉴定在细胞系中调节细胞培养表型或成为细胞培养表型的指标的蛋白质的方法。
发明内容
发明要解决的技术课题
以调整细胞的培养工序或培养细胞的表型为目的,尝试了确定限制细胞的培养效率或培养细胞的品质的特征性生物标记。为了确定特征性生物标记,可考虑实测可想到的所有生物标记,然而,实测所有生物标记费力费时。并且,即使实测了可想到的所有生物标记,这些生物标记中的与细胞培养相关的知识也不一定多,确定特征性生物标记也有可能无法调整细胞的培养工序或培养细胞的表型。
本发明的实施方式是在上述状况下完成的。
本发明的课题在于,提供一种快速确定表示细胞的特征的生物标记的生物标记确定方法及快速优化制造工序的细胞的制造方法。
用于解决技术课题的手段
用于解决课题的具体方案包括下述方式。
<1>一种生物标记确定方法,其为确定表示用于细胞B的制造的细胞A的特征的生物标记的方法,包括下述(1)~(4)。
(1)根据对多个生物标记分别赋予的注释信息来导出多个生物标记的每一个的评价值,并根据评价值从多个生物标记中选择要测定的生物标记。
(2)在细胞A的培养开始前及培养期间中的至少一个时期,从细胞A及培养系统中的至少一者获取要测定的生物标记的评价数据。
(3)在细胞A的培养末期及培养结束后中的至少一个时期,从细胞A及培养系统中的至少一者获取细胞B的识别标记的评价数据。
(4)根据要测定的生物标记的评价数据和细胞B的识别标记的评价数据从要测定的生物标记中确定至少一个表示用于细胞B的制造的细胞A的特征的生物标记。
<2>根据<1>所述的生物标记确定方法,其中,生物标记包括选自包括基因的表达量、蛋白质的表达量及代谢物的生成量的组中的至少一种。
<3>根据<1>或<2>所述的生物标记确定方法,其中,(2)在多个时间点进行。
<4>根据<1>至<3>中任一项所述的生物标记确定方法,其中,细胞A为多能干细胞,细胞B为分化细胞。
<5>一种细胞的制造方法,其为培养细胞A来制造细胞B的方法,包括下述(A)~(C)。
(A)进行<1>至<3>中任一项所述的生物标记确定方法来确定至少一个表示细胞A的特征的生物标记。
(B)参考所确定的生物标记的注释信息来确定生物标记所涉及的信号传导及生物标记发生变动的机理中的至少一个。
(C)在阻碍或促进信号传导及机理中的至少一个的培养条件下培养细胞A来制造细胞B。
<6>根据<5>所述的细胞的制造方法,其中,细胞A为多能干细胞,细胞B为分化细胞。
发明效果
根据本发明,提供一种快速确定表示细胞的特征的生物标记的生物标记确定方法及快速优化制造工序的细胞的制造方法。
附图说明
图1是表示信息处理装置等的图。
图2是表示基因表达信息的图。
图3是表示注释信息表的图。
图4是表示注释信息的表。
图5是表示从iPS细胞分化成三胚层及从三胚层分化成组织细胞的状况的图。
图6是表示信息处理装置的处理的概要的图。
图7是表示构成信息处理装置的计算机的框图。
图8是表示信息处理装置的CPU的处理部的框图。
图9是表示类别指定画面和类别及数量范围指定信息的图。
图10是表示在类别指定画面上弹出显示有警告画面的状态的图。
图11是表示选择部的处理的概要的图。
图12是表示先验知识基因指定画面和先验知识基因指定信息的图。
图13是表示提取对象指定画面和提取对象指定信息的图。
图14是表示DEGs列表的图。
图15是表示传送信息的图。
图16是表示在获取部中生成已赋予的DEGs列表的状况的图。
图17是表示在导出部中生成评价值表的状况的图。
图18是表示在选择部中无条件地选择先验知识基因作为测定对象基因的状况的图。
图19是表示在选择部中根据评价值表生成选择位次表组的状况的图。
图20是表示在选择部中选择满足数量范围的数量的DEGs并分配所选择的DEGs作为测定对象基因的状况的图。
图21是表示测定对象基因列表的图。
图22是表示提取部及获取部的处理的概要的图。
图23是表示导出部及选择部的处理的概要的图。
图24是表示测定对象基因显示画面的图。
图25是表示信息处理装置的处理顺序的流程图。
图26是表示将稀有度相对较高的注释信息判断为信息价值高而增加该注释信息的赋予数的例子的图。
图27是表示针对3个DEGs的注释信息的赋予状况的表。
图28是表示对强度指标在预先设定的阈值范围内的基因的评价值增加权重的第3实施方式的图。
图29是表示为了选择实施例的测定对象基因而指定的先验知识基因及所提取的DEGs的表。
图30是表示通过作为比较例的微阵列进行的基因表达量测定的结果的图。
图31是表示选自成为微阵列的测定对象的基因中的高影响注释信息的表。
图32是表示选自成为微阵列的测定对象的基因中的高影响注释信息的表。
图33是表示C1000的表达量的测定结果的图。
图34是表示选自C1000中的高影响注释信息及被赋予高影响注释信息的基因的表。
图35是基于C1000的测定基因组的优势比的条形图表。
图36是基于比较例的TaqMan记分卡的测定基因组的优势比的条形图表。
图37是表示利用流式细胞仪分析诱导iPS细胞分化成心肌细胞的细胞团而得的结果的点图的一例。
图38是通过使用随机森林的回归分析制作出的cTnT阳性率的预测模型的散点图。
具体实施方式
在本发明中,术语“工序”包括独立于其他工序的工序,除此之外,若即使在无法与其他工序明确区分的情况下也可实现该工序的目的,则还包括该工序。
在本发明中,使用“~”表示的数值范围分别包括记载于“~”的前后的数值作为最小值及最大值。
在本发明中阶段性地记载的数值范围中,一个数值范围所记载的上限值或下限值可以替换成其他阶段性记载的数值范围的上限值或下限值。并且,在本发明中记载的数值范围中,该数值范围的上限值或下限值可以替换成实施例中所示的值。
在本发明中,各成分可以包括多种对应的物质。在组合物中存在多种与各成分对应的物质的情况下,若无特别限制,则各成分的含有率或含量表示存在于组合物中的该多种物质的总含有率或总含量。
在本发明中,在参考附图对实施方式进行说明的情况下,该实施方式的结构并不限定于附图所示的结构。
在本发明中,“X和/或Y”的含义与“X及Y中的至少一个”相同。即,“X和/或Y”表示可以仅为X,也可以仅为Y,也可以为X及Y的组合。并且,在本发明中,当用“和/或”结合三个以上事项来表达时,也适用与“X和/或Y”相同的观点。
<生物标记确定方法>
在本发明中,生物标记表示可根据细胞的存在而发生变动的要素。生物标记例如为基因的表达量、蛋白质的表达量、代谢物的生成量、代谢的化学物质的减少量、培养液的pH(potential of Hydrogen(酸碱度))、培养系统内的O2浓度、培养系统内的CO2浓度、活细胞的比例、死细胞的比例等。
本发明的生物标记确定方法为确定表示用于细胞B的制造的细胞A的特征的生物标记的方法。本发明的生物标记确定方法包括下述(1)~(4)。将下述(1)等分别还称为工序(1)等。
(1)根据对多个生物标记分别赋予的注释信息来导出多个生物标记的每一个的评价值,并根据评价值从多个生物标记中选择要测定的生物标记。
(2)在细胞A的培养开始前及培养期间中的至少一个时期,从细胞A及培养系统中的至少一者获取要测定的生物标记的评价数据。
(3)在细胞A的培养末期及培养结束后中的至少一个时期,从细胞A及培养系统中的至少一者获取细胞B的识别标记的评价数据。
(4)根据要测定的生物标记的评价数据和细胞B的识别标记的评价数据从要测定的生物标记中确定至少一个表示用于细胞B的制造的细胞A的特征的生物标记。
本发明的生物标记确定方法通过进行工序(1)~工序(4),能够快速确定表示用于细胞B的制造的细胞A的特征的生物标记,而且,所确定的生物标记具有注释信息,因此能够利用该注释信息来调整细胞A的培养工序或细胞B的表型。
细胞A的表型与细胞B的表型可以相同,也可以不同。细胞A的表型与细胞B的表型相同的情况表示细胞A在维持其表型的情况下增殖,并且获得细胞B作为增殖的细胞。细胞A的表型与细胞B的表型不同的情况表示细胞A经形态变化或细胞分化而获得细胞B。
细胞A及细胞B可以为动物细胞,也可以为植物细胞。在细胞A为动物细胞的情况下,细胞A的来源例如为哺乳类,具体而言,为人;小鼠、白鼠、土拨鼠、兔、猴等实验动物;牛、马、猪、山羊、羊等家畜;狗、猫等宠物;等。
细胞A的形态的一例为具有分化成其他细胞的能力的细胞。在细胞A为动物细胞的情况下,细胞A例如为ES细胞(embryonic stem cells(胚胎干细胞))、iPS细胞(inducedpluripotent stem cells(诱导多能干细胞))等多能干细胞(pluripotent stem cells);间充质干细胞(mesenchymal stem cells)、组织干细胞(tissue stem cells)、成体干细胞(somatic stem cells)等专能干细胞(multipotent stem cells);等。
细胞A可以为市售或流通的细胞,也可以为按照公知的方法制作的细胞。作为专能干细胞,可举出源自骨髓、脂肪、血液、滑膜、真皮、肌肉、脐带、胎盘、羊膜、绒毛膜、蜕膜、子宫内膜、牙囊、牙周膜、牙髓或牙胚中的任一组织的细胞。iPS细胞可以由任意的体细胞制作。用于iPS细胞的制作的体细胞并无特别限定,可以使用胎儿期的体细胞来制作iPS细胞,也可以使用源自成人的体细胞(即,成熟的体细胞)来制作iPS细胞。作为制作iPS细胞的体细胞,例如可举出(1)神经干细胞、造血干细胞、间充质干细胞、牙髓干细胞等组织干细胞(或成体干细胞)、(2)组织祖细胞、(3)成纤维细胞(皮肤细胞等)、上皮细胞、肝细胞、淋巴细胞(例如,T细胞、B细胞)、内皮细胞、肌肉细胞、毛细胞、胃粘膜细胞、肠细胞、脾细胞、胰腺细胞(胰腺外分泌细胞等)、脑细胞、肺细胞、肾细胞、皮肤细胞等分化的细胞。
细胞B的形态的一例为从具有分化能力的细胞分化的细胞。在细胞B为动物细胞的情况下,细胞B可以为任一体细胞。
作为细胞B,例如可举出消化系统细胞(肝细胞、肝窦内皮细胞、枯否细胞、肝星状细胞、陷窝细胞、胆管细胞、间皮细胞、胰腺内分泌细胞、腺泡细胞、导管细胞、吸收细胞、杯状细胞、潘氏细胞、肠内分泌细胞等)、肺、甲状腺等组织的细胞等内胚层系细胞;血细胞/淋巴细胞系细胞(造血干细胞、红细胞、血小板、巨噬细胞、粒细胞、辅助T细胞、杀伤T细胞、B细胞等)、血管系细胞(血管内皮细胞等)、心肌细胞(心房肌细胞、心室肌细胞等)、成骨细胞、骨细胞、软骨细胞、肌腱细胞、脂肪细胞、骨骼肌细胞、平滑肌细胞等中胚层系细胞;神经系统细胞、感觉器官细胞(晶状体、视网膜、内耳等的细胞)、表皮细胞、毛囊的细胞等外胚层系细胞。
本发明的实施方式的一例中,细胞A为ES细胞、iPS细胞等多能干细胞,细胞B为衍生自多能干细胞的分化细胞。
[工序(1)]
工序(1)中,根据对多个生物标记分别赋予的注释信息来导出多个生物标记的每一个的评价值,并根据评价值从多个生物标记中选择要测定的生物标记。
要测定的生物标记的种类并无限制,可举出所有种类的生物标记。作为要测定的生物标记,从能够一次性测定多个生物标记的观点出发,优选基因的表达量。优选,基因的表达量从细胞A中提取总RNA来测定。
基因的表达量可以通过使用RT-PCR(Reverse Transcription Polymerase ChainReaction(逆转录聚合酶链反应))、微阵列、下一代测序仪的RNA-Seq分析等来测定。
蛋白质的表达量可以通过ELISA(Enzyme-linked Immunosorbent Assay(酶联免疫吸附测定))、流式细胞仪、LC-MS/MS(Liquid Chromatography-tandem MassSpectrometry(液相色谱-串联质谱))等来测定。蛋白质的表达量也可以在利用免疫学方法标记蛋白质之后,在计算机上获取标记图像,并进行图像分析来计算。
代谢物的生成量或代谢的化学物质的减少量可以使用LC-MS/MS或搭载有酶膜生物传感器的生物分析仪来测定培养基中的代谢物或代谢的化学物质的量而求出。
以下,作为工序(1)的实施方式的一例,例示体现出工序(1)的信息处理装置及该信息处理装置的运行方法。另外,工序(1)的实施方式并不限定于以下例子。
信息处理装置具备至少一个处理器,处理器获取对与活体试样相关的多个生物标记分别赋予的注释信息,根据注释信息来导出多个生物标记的每一个的评价值,并根据评价值从多个生物标记中选择要测定的生物标记。“活体试样”的具体例为“细胞”。
信息处理装置的运行方法中,处理器执行:获取处理,获取对与活体试样相关的多个生物标记分别赋予的注释信息;导出处理,根据注释信息来导出多个生物标记的每一个的评价值;及选择处理,根据评价值从多个生物标记中选择要测定的生物标记。
优选,处理器选择与所关注的活体试样的特性(例如,所关注的细胞的特性)的注释信息,并仅根据所选择的注释信息来导出评价值。
优选,处理器参考登记有针对生物标记的注释信息的数据库对生物标记赋予注释信息。
优选,活体试样的种类(例如,细胞的种类)与注释信息建立有关联。
优选,处理器受理用户对根据活体试样的种类(例如,细胞的种类)定义的多个类别及多个类别的每一个的要测定的生物标记的数量范围的指定,从针对多个类别的每一个准备的生物标记中选择满足范围的数量的生物标记,将所选择的生物标记分别分配给多个类别作为要测定的生物标记。
优选,类别包括iPS细胞、外胚层、中胚层及内胚层。
优选,处理器针对多个生物标记的每一个对注释信息的赋予数进行计数,并根据赋予数来导出评价值。
优选,处理器根据注释信息的信息价值对评价值进行加权。
优选,处理器将稀有度相对较高的注释信息判断为信息价值高,并对评价值增加权重。
优选,处理器根据注释信息的正交性对评价值进行加权。
优选,处理器对强度指标在预先设定的阈值范围内的生物标记的评价值增加权重。
优选,处理器受理用户对先验知识标记的指定,并对先验知识标记的评价值增加权重,该先验知识标记为已知对活体试样的特性(例如,细胞的特性)造成影响的生物标记。
优选,处理器选择超过100个且1000个以下的要测定的生物标记。
优选,生物标记包括基因。
优选,基因包括表达量发生特异性变动的表达变动基因(DEGs;DifferentiallyExpressed Genes)。
优选,注释信息为基因本体论中定义的术语。
参考附图对信息处理装置及信息处理装置的运行方法进行更详细的说明。以下说明中,列举本发明的技术的用户在诱导细胞A分化来制造细胞B时搜索基因的表达量作为生物标记的方式的例子进行说明。
[第1实施方式]
在图1中,信息处理装置10例如为台式个人计算机,其由用户操作。信息处理装置10与网络11连接。网络11例如为互联网或公共通信网等WAN(Wide Area Network(广域网))。
信息处理装置10经由网络11与基因表达信息DB服务器12(DB为数据库的缩写。)及注释信息DB服务器13连接。基因表达信息DB服务器12具有基因表达信息DB14。基因表达信息DB14例如为由美国国家生物技术信息中心(NCBI;National Center for BiotechnologyInformation)提供的GEO(Gene Expression Omnibus(基因表达综合数据库))。基因表达信息DB14中作为开放数据登记有由非特定多数的研究人员上传的庞大的基因表达信息15。基因表达信息15为与细胞在培养期间表达的基因的表达量相关的信息。
基因表达信息DB服务器12从信息处理装置10接收第1传送请求72(参考图8)。基因表达信息DB服务器12从基因表达信息DB14读取与第1传送请求72对应的基因表达信息15。然后,将读取到的基因表达信息15传送至信息处理装置10。
注释信息DB服务器13具有注释信息DB16。注释信息DB16例如为由美国国立过敏症和传染病研究所(NIAID;National Institute of Allergy and Infectious Diseases)提供的DAVID(The Database for Annotation,Visualization and Integrated Discovery(注释、可视化和集成发现数据库))和/或由欧洲生物信息研究所(EBI;EuropeanBioinformatics Institute)提供的InterPro。注释信息DB16中针对多个基因分别登记有对应的注释信息。
注释信息DB服务器13从信息处理装置10接收第2传送请求75(参考图8)。注释信息DB服务器13从注释信息DB16读取与第2传送请求75对应的注释信息。然后,将包括读取到的注释信息的传送信息76(参考图8)传送至信息处理装置10。
如图2所示,基因表达信息15为针对每个基因登记有表达量的信息。基因表达信息15中登记有测定了表达量的活体试样的种类(在图2中为“iPS细胞”)。并且,基因表达信息15中登记有“iPS细胞”、“中胚层”、“分化能力”等用于使搜索变得容易的关键词。关键词例如由上传基因表达信息15的研究人员或基因表达信息DB14的提供者登记。
注释信息DB16中存储有图3所示的注释信息表20。注释信息表20中针对每个基因登记有注释信息(ID;Identification Data(识别数据))。
如图4的表22所示,注释信息为ID“GO:0000578”的“embryonic axisspecification(胚轴的规格)”、ID“IPR012287”的“Homeodomain-related(同源域相关)”等基因本体论(GO;Gene Ontology)中定义的术语。
如图5所示,以下,例示以重新编程人体细胞而建立的iPS细胞25为研究对象的情况。iPS细胞25通过细胞分裂形成三胚层26。三胚层26为外胚层27、中胚层28及内胚层29。三胚层26分别分化成多种组织细胞30。具体而言,外胚层27分化成晶状体31、神经细胞32等。中胚层28分化成血液细胞33、骨细胞34、肌细胞35等。内胚层29分化成肺泡细胞36、肠道细胞37、肝细胞38等。
图6中示出信息处理装置10的处理的概要。首先,信息处理装置10从注释信息DB服务器13获取注释信息。然后,根据获取到的注释信息来导出每个基因的评价值。接着,根据导出的评价值从多个基因中选择要测定的基因(以下,称为测定对象基因。)。此时,信息处理装置10选择用户指定的数量的测定对象基因。成为测定对象基因的候选的基因例如为约3000个,测定对象基因例如为1000个。信息处理装置10将所选择的测定对象基因展示给用户。
在图7中,构成信息处理装置10的计算机具备存储装置45、存储器46、CPU(CentralProcessing Unit(中央处理器))47、通信部48、显示器49及输入装置50。它们经由总线51彼此连接。
存储装置45为内置于构成信息处理装置10的计算机或通过线缆、网络连接的硬盘驱动器。或者,存储装置45为联装多台硬盘驱动器而成的磁盘阵列。存储装置45中存储有操作系统等的控制程序、各种应用程序及这些程序所附带的各种数据等。也可以使用固态驱动器来代替硬盘驱动器。
存储器46为供CPU47执行处理的工作存储器。CPU47将存储于存储装置45中的程序加载到存储器46中,并执行基于程序的处理,由此统一控制计算机的各部。
通信部48为经由网络11进行各种信息的传送控制的网络接口。显示器49显示各种画面。构成信息处理装置10的计算机通过各种画面受理来自输入装置50的操作指示的输入。输入装置50为键盘、鼠标、触摸面板等。
在图8中,信息处理装置10的存储装置45中存储有运行程序55。运行程序55为用于使计算机发挥信息处理装置10的功能的应用程序。
若启动运行程序55,则构成信息处理装置10的计算机的CPU47与存储器46等协作而发挥指示受理部60、提取部61、获取部62、导出部63、选择部64及显示控制部65的功能。CPU47为“处理器”的一例。
指示受理部60经由输入装置50受理用户的各种指示。例如,指示受理部60受理用户对多个类别及多个类别的每一个的测定对象基因的数量范围(以下,称为数量范围。)的指定。类别根据活体试样的种类(例如,细胞的种类)由用户定义。指示受理部60生成与所指定的类别及数量范围对应的类别及数量范围指定信息70,并将类别及数量范围指定信息70输出至选择部64。
指示受理部60还受理用户对先验知识基因的指定。指示受理部60生成与所指定的先验知识基因对应的先验知识基因指定信息71,并将先验知识基因指定信息71输出至选择部64。先验知识基因为已知对iPS细胞25的行为造成影响的基因。即,先验知识基因为“先验知识标记”的一例。并且,iPS细胞25的行为为本发明的技术所涉及的“活体试样的特性”的一例。
指示受理部60还受理对基因表达信息DB服务器12指示基因表达信息15的传送的用户的第1传送指示。具体而言,第1传送指示为由与iPS细胞25相关的搜索关键词(例如,“iPS细胞”、“外胚层”、“中胚层”、“内胚层”、……等)构成的搜索指示。第1传送指示通过设置有搜索关键词的输入框和搜索按钮的搜索画面(省略图示)进行。在受理到第1传送指示的情况下,指示受理部60将包括上述搜索关键词的第1传送请求72发送给基因表达信息DB服务器12。基因表达信息DB服务器12从基因表达信息DB14中的基因表达信息15中搜索登记的关键词与搜索关键词一致的基因表达信息15。然后,将搜索到的基因表达信息15传送至信息处理装置10。在信息处理装置10中,基因表达信息15被输入至提取部61及显示控制部65。
显示控制部65将来自基因表达信息DB服务器12的基因表达信息15的显示画面(省略图示)显示于显示器49上。指示受理部60受理用户对所显示的基因表达信息15中作为提取DEGs的对象的基因表达信息15(以下,称为提取对象15E(参考图22)。)的指定。指示受理部60生成与所指定的提取对象15E对应的提取对象指定信息73,并将提取对象指定信息73输出至提取部61。
提取部61从由提取对象指定信息73指定的提取对象15E中提取DEGs。提取部61例如比较提取对象15E的各基因的表达量和预先设定的阈值,提取表达量为阈值以上的基因作为DEGs。提取部61生成登记有所提取的DEGs的DEGs列表74,并将DEGs列表74输出至获取部62。
获取部62将基于来自提取部61的DEGs列表74的第2传送请求75发送给注释信息DB服务器13。第2传送请求75包括登记在DEGs列表74中的DEGs。注释信息DB服务器13从注释信息DB16中的注释信息表20中搜索对包括在第2传送请求75中的DEGs赋予的注释信息。然后,将由搜索到的注释信息及DEGs的组构成的传送信息76传送至信息处理装置10。在信息处理装置10中,传送信息76被输入至获取部62。
获取部62获取来自注释信息DB服务器13的传送信息76。如上所述,传送信息76包括注释信息。因此,获取部62通过获取传送信息76来获取注释信息。
获取部62根据传送信息76对DEGs列表74赋予注释信息,使DEGs列表74成为已赋予的DEGs列表74G。即,获取部62参考注释信息DB16对基因赋予注释信息。获取部62将已赋予的DEGs列表74G输出至导出部63。
导出部63根据已赋予的DEGs列表74G来导出每个DEGs的评价值。然后,将作为评价值的导出结果的评价值表77输出至选择部64。
选择部64根据先验知识基因指定信息71无条件地选择先验知识基因作为测定对象基因。并且,选择部64根据类别及数量范围指定信息70从在提取部61中提取的DEGs中选择测定对象基因。选择部64将作为测定对象基因的选择结果的测定对象基因列表78输出至显示控制部65。显示控制部65根据测定对象基因列表78来生成测定对象基因显示画面120(参考图24),并将其显示于显示器49上。
在图9中,为了受理用户对类别及数量范围的指定,类别指定画面80在显示控制部65的控制下显示于显示器49上。类别指定画面80中设置有用于选择输入作为“所关注的活体试样的特性”的一例的所关注的细胞的行为的下拉菜单81。并且,类别指定画面80中设置有类别的输入框82及数量范围的下限的输入框83和上限的输入框84。输入框82~84可以通过选择追加按钮85来追加。
在下拉菜单81中选择所关注的细胞的行为并在输入框82~84中输入所期望的类别及数量范围之后选择了指定按钮86的情况下,指示受理部60受理所关注的细胞的行为、类别及数量范围的指定。由此,类别及数量范围指定信息70从指示受理部60输出至选择部64。类别及数量范围指定信息70包括在下拉菜单81中选择的所关注的细胞的行为、在输入框82中输入的类别及在输入框83、84中输入的数量范围。
在图9中,例示了作为所关注的细胞的行为选择了“分化能力”的情况。并且,例示了作为类别指定了“iPS细胞”、“外胚层”、“中胚层”、“内胚层”、作为数量范围对各类别指定了“225~250”的情况。所指定的类别也可以为一个。并且,也可以在输入框83、84中输入相同的数值。
在输入框83、84的下部设置有在输入框83、84中输入的数量范围的下限及上限的合计显示区域87。在显示区域87的下部显示有提示用户使合计超过100个且成为1000个以下的消息88。
如图10所示,在合计处于超过100个且1000个以下的范围外的状态下选择了指定按钮86的情况下,显示控制部65在类别指定画面80上弹出显示警告画面90。在警告画面90上显示内容为合计在超过100个且1000个以下的范围外且照这样是无法进行指定的消息91。在选择了确认按钮92的情况下,显示控制部65取消警告画面90的显示。
如此,类别指定画面80构成为在数量范围的合计在超过100个且1000个以下的范围外的情况下无法进行指定。因此,如图11所示,选择部64结果会选择超过100个且1000个以下的测定对象基因。
在图12中,为了受理用户对先验知识基因的指定,先验知识基因指定画面95在显示控制部65的控制下显示于显示器49上。先验知识基因指定画面95中设置有用于选择输入先验知识基因组的下拉菜单96。下拉菜单96可以通过选择追加按钮97来追加。作为选项,下拉菜单96中预先准备有多个先验知识基因组。先验知识基因组是针对每个类别准备的。先验知识基因组例如包括用于通过TaqMan(注册商标)记分卡进行的基因分析的先验知识基因组、用于通过nCounter(注册商标)进行的基因分析的先验知识基因组、用于通过TruSeq(注册商标)进行的基因分析的先验知识基因组等。
在下拉菜单96中选择所期望的先验知识基因组之后选择了指定按钮98的情况下,指示受理部60受理先验知识基因组的指定。由此,先验知识基因指定信息71从指示受理部60输出至选择部64。先验知识基因指定信息71为登记有先验知识基因组和与之对应的类别的信息。
在图12中,例示了针对类别“iPS细胞”指定两个先验知识基因组、针对类别“外胚层”、“中胚层”、“内胚层”分别指定一个先验知识基因组而共指定五个先验知识基因组的情况。也可以构成为,代替指定组而分别指定一个先验知识基因,或者,除指定组以外,还分别指定一个先验知识基因。
在图13中,为了供用户指定提取对象15E,提取对象指定画面105在显示控制部65的控制下显示于显示器49上。提取对象指定画面105中设置有提取对象15E的输入框106。输入框106可以通过选择追加按钮107来追加。
在输入框106中输入提取对象15E之后选择了指定按钮108的情况下,在指示受理部60中受理提取对象15E的指定。由此,提取对象指定信息73从指示受理部60输出至提取部61。提取对象指定信息73为登记有在输入框106中输入的提取对象15E和登记在该提取对象15E中的活体试样的种类(例如,细胞的种类)的信息。
在图13中,例示了针对“iPS细胞”、“外胚层”、“中胚层”及“内胚层”分别指定一个提取对象15E的情况。也可以针对一个活体试样的种类指定两个以上提取对象15E。
如图14所示,DEGs列表74中登记有DEGs和登记在提取该DEGs的提取对象15E中的活体试样的种类。DEGs中,既有如ID“GE_5”、“GE_10”等DEGs那样仅登记有一个活体试样的种类的DEGs,也有如ID“GE_1”、“GE_2”等DEGs那样登记有“iPS细胞”、“外胚层”、“中胚层”、“内胚层”之类的多个活体试样的种类的DEGs。即,既有仅属于一个活体试样的种类的DEGs,也有同属于多个活体试样的种类的DEGs。
如图15所示,传送信息76为登记有DEGs和与之对应的注释信息的信息。
在图16中,已赋予的DEGs列表74G在图14所示的DEGs列表74中追加注释信息项而成。活体试样的种类(例如,细胞的种类)通过该已赋予的DEGs列表74G与注释信息被建立关联。
获取部62从登记在传送信息76中的注释信息中选择与类别及数量范围指定信息70的所关注的细胞的行为相关的注释信息。然后,仅将所选择的注释信息登记到DEGs列表74中,作为已赋予的DEGs列表74G。
如图9所示,在本例子中,“分化能力”被指定为所关注的细胞的行为。因此,获取部62不选择ID“GO:0000075”、“GO:0001028”之类的与分化能力无关的注释信息而仅选择ID“GO:0000578”、“GO:0001501”之类的与分化相关的注释信息进行登记。也可以使第2传送请求75包括与所关注的细胞的行为相关的搜索关键词,并在注释信息DB服务器13中选择与所关注的细胞的行为相关的注释信息。
在图17中,导出部63根据已赋予的DEGs列表74G对赋予到各DEGs的注释信息的赋予数进行计数。然后,将所计的赋予数本身登记到评价值表77中作为评价值。例如,在对ID“GE_1”的DEGs赋予了28个注释信息的情况下,在评价值表77中登记与赋予数相同的“28”作为评价值。
在图18中,首先,选择部64无条件地选择由先验知识基因指定信息71指定的先验知识基因组作为测定对象基因。由此,生成将先验知识基因组登记为测定对象基因的临时测定对象基因列表78P。无条件地选择该先验知识基因组作为测定对象基因的方式为增加先验知识基因的评价值的权重以使先验知识基因一定会被选为测定对象基因的一例。
在图19中,选择部64根据评价值表77来生成选择位次表组115。选择位次表组115由与活体试样的种类“iPS细胞”对应的类别“iPS细胞”的选择位次表116A、与活体试样的种类“外胚层”对应的类别“外胚层”的选择位次表116B、与活体试样的种类“中胚层”对应的类别“中胚层”的选择位次表116C及与活体试样的种类“内胚层”对应的类别“内胚层”的选择位次表116D构成。选择部64针对各类别从评价值高的(注释信息的赋予数多的)DEGs开始依次排列选择位次。即,将评价值最高的DEGs的选择位次排在第1位,将评价值次高的DEGs的选择位次排在第2位,将评价值第3高的DEGs的选择位次排在第3位,……。
如图20所示,选择部64参考选择位次表116从针对每个类别准备的DEGs中选择满足数量范围的测定对象基因,并将其分配给各类别。
图20中例示了从为类别“iPS细胞”准备的DEGs中选择类别“iPS细胞”的测定对象基因的状况。并且,图20中例示了将图9所示的“225~250”指定为类别“iPS细胞”的数量范围且在图18中选择的类别“iPS细胞”的先验知识基因的数量为100个的情况。在该情况下,为了满足数量范围,需要选择至少125个且最多150个DEGs。因此,选择部64在选择位次表116A中选择选择位次为第1位~第150位的共150个DEGs。然后,将所选择的150个DEGs登记到临时测定对象基因列表78P中作为类别“iPS细胞”的测定对象基因。
尽管省略图示,但选择部64对其他类别“外胚层”、“中胚层”、“内胚层”也同样地参考选择位次表116B~116D来选择满足数量范围的数量的DEGs。然后,将所选择的DEGs登记到临时测定对象基因列表78P中作为测定对象基因。选择部64通过如此依次选择测定对象基因,最终生成如图21所示的在各类别中满足数量范围的测定对象基因列表78。
图22及图23是将由提取部61、获取部62、导出部63及选择部64进行的一连串的处理汇总到一起的图。首先,如图22所示,提取部61从提取对象15E中提取DEGs,生成DEGs列表74。获取部62通过获取来自注释信息DB服务器13的传送信息76来获取注释信息。获取部62对DEGs列表74赋予传送信息76的注释信息,作为已赋予的DEGs列表74G。
如图23所示,导出部63对赋予到各DEGs的注释信息的赋予数进行计数,并将赋予数登记到评价值表77中作为评价值。选择部64根据评价值来选择测定对象基因,生成测定对象基因列表78。
如图24所示,在测定对象基因显示画面120上显示登记在测定对象基因列表78中的测定对象基因。测定对象基因显示画面120中针对每个类别设置有显示区域121A、121B、121C、121D。在显示区域121A显示类别“iPS细胞”的测定对象基因。在显示区域121B显示类别“外胚层”,在显示区域121C显示类别“中胚层”,在显示区域121D显示类别“内胚层”的测定对象基因。
在测定对象基因显示画面120的下部设置有保存按钮122、打印按钮123及确认按钮124。保存按钮122在保存测定对象基因列表78时选择。打印按钮123在打印测定对象基因列表78时选择。在选择了确认按钮124的情况下,显示控制部65取消测定对象基因显示画面120的显示。
接着,参考图25的流程图对上述结构所起的作用进行说明。首先,若在信息处理装置10中启动运行程序55,则如图8所示,信息处理装置10的CPU47发挥指示受理部60、提取部61、获取部62、导出部63、选择部64及显示控制部65的功能。
在显示控制部65的控制下,图9所示的类别指定画面80显示于显示器49上(步骤ST100)。用户输入所关注的细胞的行为和所期望的类别及数量范围,并选择指定按钮86。由此,在指示受理部60中,受理所关注的细胞的行为和类别及数量范围的指定(步骤ST110),生成类别及数量范围指定信息70。类别及数量范围指定信息70从指示受理部60输出至选择部64。
接着,在显示控制部65的控制下,图12所示的先验知识基因指定画面95显示于显示器49上(步骤ST120)。用户输入所期望的先验知识基因组,并选择指定按钮98。由此,在指示受理部60中,受理先验知识基因组的指定(步骤ST130),生成先验知识基因指定信息71。先验知识基因指定信息71从指示受理部60输出至选择部64。
在显示控制部65的控制下,省略图示的搜索画面显示于显示器49上。然后,在指示受理部60中,受理包括搜索关键词的用户的第1传送指示。由此,包括搜索关键词的第1传送请求72从指示受理部60发送至基因表达信息DB服务器12(步骤ST140)。
根据第1传送请求72,从基因表达信息DB服务器12传送基因表达信息15。基因表达信息15被输入至显示控制部65。然后,在显示控制部65的控制下,省略图示的基因表达信息15的显示画面显示于显示器49上(步骤ST150)。
并且,在显示控制部65的控制下,图13所示的提取对象指定画面105显示于显示器49上(步骤ST160)。用户输入所期望的提取对象15E,并选择指定按钮108。由此,在指示受理部60中,受理提取对象15E的指定(步骤ST170),生成提取对象指定信息73。提取对象指定信息73从指示受理部60输出至提取部61。
在提取部61中,从提取对象15E中提取DEGs,生成图14所示的DEGs列表74(步骤ST180)。DEGs列表74从提取部61输出至获取部62。接着,基于DEGs列表74的第2传送请求75从获取部62发送至注释信息DB服务器13(步骤ST190)。
根据第2传送请求75,从注释信息DB服务器13传送图15所示的包括注释信息的传送信息76。传送信息76被输入至获取部62。由此,在获取部62中获取传送信息76以及注释信息(步骤ST200)。步骤ST200为“获取处理”的一例。
如图16所示,获取部62根据传送信息76对DEGs列表74赋予注释信息,从而DEGs列表74成为已赋予的DEGs列表74G(步骤ST210)。此时,仅选择与所关注的细胞的行为相关的注释信息进行赋予。已赋予的DEGs列表74G从获取部62输出至导出部63。
如图17所示,导出部63对赋予到各DEGs的注释信息的赋予数进行计数,并将赋予数登记到评价值表77中作为评价值(步骤ST220)。评价值表77从导出部63输出至选择部64。步骤ST220为“导出处理”的一例。
如图18所示,选择部64无条件地选择先验知识基因作为测定对象基因(步骤ST230)。
进而,如图20所示,选择部64从针对每个类别准备的DEGs中以评价值高的顺序选择满足数量范围的数量的DEGs。然后,将所选择的DEGs分配给各类别作为测定对象基因(步骤ST240)。经这种过程,生成图21所示的测定对象基因列表78。测定对象基因列表78从选择部64输出至显示控制部65。步骤ST240为“选择处理”的一例。
最后,显示控制部65将图24所示的测定对象基因显示画面120显示于显示器49上(步骤ST250)。用户通过该测定对象基因显示画面120来确认测定对象基因。
如上所述,信息处理装置10具备获取部62、导出部63及选择部64。获取部62获取对多个基因分别赋予的注释信息。导出部63根据注释信息来导出多个基因的每一个的评价值。选择部64根据评价值从多个基因中选择测定对象基因。因此,在基于注释信息的评价值这一可靠的依据下,能够以数据驱动的方式选择测定对象基因。如此选择的测定对象基因易于多层次的发展,并且是对应于要研究的细胞定制的。因此,能够选择有助于弄清细胞的行为的更适当的测定对象基因。
获取部62选择与所关注的细胞的行为相关的注释信息。选择部64仅根据所选择的注释信息来导出评价值。因此,能够仅根据专用于所关注的细胞的行为的注释信息来选择测定对象基因。换言之,能够以将与所关注的细胞的行为的相关性较低的注释信息视为噪声排除掉而限定于与所关注的细胞的行为的相关性较高的注释信息的形式选择测定对象基因。
获取部62参考登记有针对基因的注释信息的注释信息DB16对基因赋予注释信息。因此,能够使用现有的注释信息DB16简单地赋予注释信息。
活体试样的种类(例如,细胞的种类)与注释信息建立有关联。指示受理部60受理用户对根据活体试样的种类定义的多个类别及多个类别的每一个的数量范围的指定。选择部64从针对多个类别的每一个准备的基因中选择满足数量范围的数量的基因,并将所选择的基因分别分配给多个类别作为测定对象基因。因此,能够针对每个类别不多不少地选择测定对象基因。
在以评价iPS细胞25及其分化过程为目的测定基因的表达量的情况下,类别例如包括“iPS细胞”、“外胚层”、“中胚层”及“内胚层”。在该情况下,能够获得与iPS细胞25相关的每个类别的测定对象基因。类别并不限定于上述,优选根据目的进行优化。在以评价ES细胞及其分化过程为目的测定基因的表达量的情况下,类别例如包括“ES细胞”、“外胚层”、“中胚层”及“内胚层”。
导出部63针对多个基因的每一个对注释信息的赋予数进行计数,并根据赋予数来导出评价值。因此,能够简单地导出评价值。
基因包括先验知识基因。然后,指示受理部60受理用户对先验知识基因的指定。作为增加先验知识基因的评价值的权重的一个方式,选择部64无条件地选择先验知识基因作为测定对象基因。因此,能够反映想要测定先验知识基因的用户的意图。并且,能够有效地采用浓缩过去的知识而得的先验知识基因。
选择部64选择超过100个且1000个以下的测定对象基因。若测定对象基因超过100个,则有利于弄清细胞的行为。另一方面,若测定对象基因为1000个以下,则不会花费太多检查时间及成本,有利于发展成多层次实验。
基因包括DEGs。因此,能够选择认为更有助于弄清细胞的行为的测定对象基因。
先验知识基因是无条件地选作测定对象基因,但并不限于此。针对先验知识基因,也可以与DEGs相同地获取注释信息来导出评价值,并根据导出的评价值进行选择。此时,可以使先验知识基因的评价值的权重大于DEGs的权重。并且,在该情况下,可以对各先验知识基因设定重要度,并加上重要度来导出评价值。具体而言,构成为重要度越高,导出的评价值越高。也可以以将先验知识基因以外的基因(例如,DEGs等)的重要度视为最低的方式导出评价值。
先验知识基因并不一定要指定。例如,在要研究的细胞为新的细胞而原本就不存在先验知识基因的情况下,可以省略先验知识基因的指定。
也可以将提取对象15E的指定也省略掉并将从基因表达信息DB服务器12传送过来的所有基因表达信息15作为提取对象15E。
类别也不一定要指定。但是,即使省略类别的指定,也需要指定所选择的测定对象基因的数量范围(至少上限)。
基因表达信息DB14并不限定于例示的GEO之类的公共DB。例如也可以为登记有在用户所属的研究所中测定的基因表达信息15的本地DB。关于注释信息DB16,也同样地不限于DAVID、InterPro之类的公共DB,例如也可以为在用户所属的研究所中准备的本地DB。
[第2实施方式]
在图26及图27中例示的第2实施方式中,根据注释信息的信息价值对评价值进行加权。
图26中示出将赋予数相对较少且稀有度相对较高的注释信息判断为信息价值高而增加该注释信息的赋予数的例子。首先,如表150所示,导出部63根据已赋予的DEGs列表74G对赋予到DEGs的各注释信息的赋予数(以下,称为总赋予数)进行计数。导出部63比较总赋予数和预先设定的阈值。然后,将总赋予数小于阈值的注释信息判断为信息价值高,如表151所示,将该注释信息在导出评价值时的赋予数设为大于1的值。即,增加判断为信息价值高的注释信息的权重。导出部63将被加权的赋予数包括在内对各DEGs的注释信息的赋予数进行计数,生成评价值表77。
图26中例示了将“10”设定为阈值且将总赋予数为“6”而小于阈值的ID“GO:0000578”的注释信息的赋予数设为“10”的情况。
图27中示出根据注释信息的正交性对评价值进行加权的例子。导出部63找出能够尽可能无遗漏且无重复地覆盖注释信息的基因组,并将该基因组判断为注释信息的正交性高。
表158中例示了由A1~A7表示的注释信息对ID“GE_1000”、“GE_1001”、“GE_1002”的三个DEGs的赋予状况。A1~A7的注释信息中,作为活体试样的种类,“iPS细胞”与A1~A4建立有关联,“外胚层”与A5~A7建立有关联。
在该情况下,若仅考虑注释信息的赋予数,则ID“GE_1000”及ID“GE_1001”的DEGs比ID“GE_1002”的DEGs更优先选作测定对象基因。然而,若考虑注释信息的正交性,则ID“GE_1002”的DEGs比ID“GE_1001”的DEGs更优先选作测定对象基因。如此,若最终选择ID“GE_1000”及ID“GE_1002”的DEGs作为测定对象基因,则既能够覆盖“iPS细胞”,也能够覆盖“外胚层”。
也可以根据以与其他基因的组合能够覆盖的注释信息的数量来导出评价值。若以表158为例进行说明,则以ID“GE_1000”及ID“GE_1001”的DEGs的组合能够覆盖的注释信息的数量为6个。以ID“GE_1000”及ID“GE_1002”的DEGs的组合能够覆盖的注释信息的数量为7个。以ID“GE_1001”及ID“GE_1002”的DEGs的组合能够覆盖的注释信息的数量为5个。根据该结果,使ID“GE_1000”及ID“GE_1002”的DEGs的评价值高于ID“GE_1001”的DEGs的评价值。
如此,在第2实施方式中,导出部63根据注释信息的信息价值对评价值进行加权。因此,例如通过增加判断为信息价值高的注释信息的赋予数的权重,容易选择被赋予认为信息价值高的注释信息的基因作为测定对象基因。因此,能够提高测定对象基因的有效性、可靠性。
在图26中,导出部63将稀有度相对较高的注释信息判断为信息价值高而增加权重。因此,能够选择被赋予容易忽略的稀有注释信息的基因作为测定对象基因。
在图27中,导出部63根据注释信息的正交性对评价值进行加权。因此,能够选择能够尽可能无遗漏且无重复地覆盖注释信息的基因组作为测定对象基因。
也可以组合图26及图27的例子来实施。在该情况下,例如,在被赋予总赋予数小于阈值的注释信息且注释信息的正交性高的DEGs的评价值上加100。
在图26中,将稀有度相对较高的注释信息判断为信息价值高的注释信息,但信息价值高的注释信息的例子并不限定于此。例如,也可以将研究论文中的刊登数相对较多的注释信息判断为信息价值高的注释信息。
在图26中,对赋予到DEGs的注释信息的赋予数进行了加权,但加权方式并不限定于此。在对先验知识基因也导出评价值的情况下,也可以与图26所示的情况相同地对赋予到先验知识基因的注释信息的赋予数进行加权。图27所示的方式也可以同样地适用于先验知识基因。
[第3实施方式]
在图28中例示的第3实施方式中,增加强度指标在预先设定的阈值范围内的基因的评价值的权重。
在图28中,第3实施方式的已赋予的DEGs列表160G中设置有强度指标信息项。强度指标信息项中登记有强度指标是否在预先设定的阈值范围内。强度指标例如为倍数变化(fold-change)、表示经多重检验校正的表达显著性差异的q值(q-value)等。
如表161所示,导出部63将强度指标在阈值范围内的DEGs的注释信息在导出评价值时的赋予数设为大于1的值。即,增加强度指标在阈值范围内的DEGs的评价值的权重。导出部63将被加权的赋予数包括在内对各DEGs的注释信息的赋予数进行计数,生成评价值表77。
图28中例示了ID“GE_2”、“GE_5”等DEGs的强度指标在阈值范围内且将它们的注释信息的赋予数设为“2”的情况。
如此,在第3实施方式中,导出部63增加强度指标在阈值范围内的DEGs的评价值的权重。因此,能够选择认为弄清活体试样的特性(例如,细胞的特性)时更为重要的强度指标在阈值范围内的DEGs作为测定对象基因。也可以组合第2实施方式和第3实施方式来实施。
如上所述,能够在基于注释信息的评价值这一依据下选择要测定的生物标记。如此选择的要测定的生物标记是对应于所关注的细胞的种类定制的。因此,能够选择有助于调整细胞A的培养工序或细胞B的表型的更适当的要测定的生物标记。
[工序(2)]
工序(2)中,在细胞A的培养开始前及培养期间中的至少一个时期,从细胞A及培养系统中的至少一者获取要测定的生物标记的评价数据。工序(2)中,也可以在细胞A的培养开始前及培养期间中的至少一个时期从细胞A及培养系统中的至少一者采集试样,保存采集到的试样,并从所保存的试样获取要测定的生物标记的评价数据。工序(2)中作为测定对象的生物标记为在工序(1)中选择的生物标记。
工序(2)在细胞A的培养开始前及培养期间中的至少一个时期进行。在细胞A的培养开始前,例如,细胞A本身、来自细胞A的提取物、细胞A的分泌物等为测定试样。在细胞A的培养期间,例如,细胞A本身、来自细胞A的提取物、培养液、培养系统内的气体等为测定试样。
工序(2)可以进行一次,也可以进行多次。工序(2)中,也可以在多个时间点从细胞A及培养系统中的至少一者采集试样,保存采集到的试样,并从所保存的试样获取要测定的生物标记的评价数据。
在多个时间点进行工序(2)的情况下,在某个时间点获取评价数据的生物标记与在另一时间点获取评价数据的生物标记可以相同,也可以不同。优选,通过多个时间点针对要测定的所有生物标记获取评价数据。
细胞A的培养在适合细胞A生存的培养条件下进行。并且,在细胞A的培养期间,根据需要诱导细胞A分化成细胞B,进行适合细胞B的分化诱导的培养(即,分化培养)。也可以在细胞A分化培养成细胞B之前进行细胞A的扩增。
在细胞A的培养期间进行工序(2)的情况下,可以在细胞A的扩增期间(即,分化培养开始前)进行,也可以在细胞A分化培养成细胞B的期间进行。工序(2)例如可以在分化培养开始3天前至分化培养开始14天后的期间进行,优选在分化培养开始3天前至分化培养开始10天后的期间进行,更优选在分化培养开始1天前至分化培养开始8天后的期间进行。并且,工序(2)例如可以在分化培养开始3天前至分化培养结束1天前的期间进行,优选在分化培养开始3天前至分化培养结束3天前的期间进行,更优选在分化培养开始1天前至分化培养结束5天前的期间进行。
[工序(3)]
工序(3)中,在细胞A的培养末期及培养结束后中的至少一个时期,从细胞A及培养系统中的至少一者获取细胞B的识别标记的评价数据。工序(3)中,也可以在细胞A的培养末期及培养结束后中的至少一个时期从细胞A及培养系统中的至少一者采集试样,保存采集到的试样,并从所保存的试样获取细胞B的识别标记的评价数据。“培养末期”及“培养结束后”表示细胞A的增殖、形态变化或细胞分化进展至能够检测出细胞B的识别标记的程度的时期。
细胞B的识别标记的种类只要是源自细胞B且能够确认细胞B的有无的标记,则并无限制。细胞B的识别标记可以为一种,也可以为两种以上。作为细胞B的识别标记,例如可举出基因的表达的有无、基因的表达量、蛋白质的表达的有无、蛋白质的表达量、细胞的形态等。从能够适用免疫学检测方法的观点出发,作为细胞B的识别标记,优选在细胞B中特异性表达的蛋白质的有无或量。
工序(2)及工序(3)可以对一个克隆的细胞A进行,也可以对多个克隆的细胞A进行。
细胞A的培养可以进行一次,也可以进行多次,由此,工序(2)及工序(3)可以进行一次,也可以进行多次。
通过多个克隆的培养或多次培养获取多组要测定的生物标记的评价数据和细胞B的识别标记的评价数据的评价数据组。可以将多组评价数据组提供到工序(4)中。
[工序(4)]
工序(4)中,根据要测定的生物标记的评价数据和细胞B的识别标记的评价数据从要测定的生物标记中确定至少一个表示用于细胞B的制造的细胞A的特征的生物标记。在工序(4)中,从要测定的生物标记中确定至少一个表示细胞A的特征且与细胞A及细胞B相关的生物标记。
作为工序(4)的实施方式的一例,可举出下述。
获取多组要测定的生物标记的评价数据和细胞B的识别标记的评价数据的评价数据组。根据细胞B的识别标记的评价数据来选取细胞B的制造效率高的至少一个细胞A和细胞B的制造效率低的至少一个细胞A。比较细胞B的制造效率高的细胞A和细胞B的制造效率低的细胞A的要测定的生物标记的评价数据,确定至少一个在表达量、生成量、浓度等上存在显著差异的生物标记。
在要测定的生物标记的数量相对较多的情况下,工序(4)例如可以通过利用统计方法或机器学习分析要测定的生物标记的评价数据和细胞B的识别标记的评价数据来实施。工序(4)的实施可以适用所有统计方法或机器学习。作为统计方法或机器学习的例子,可举出使用随机森林的回归分析、逻辑回归分析、神经网络、支持向量机、朴素贝叶斯、决策树等。优选,工序(4)通过计算机的处理来进行。
作为工序(4)的实施方式的一例,可举出使用随机森林的回归分析。随机森林为机器学习的算法之一。作为适用使用随机森林的回归分析的工序(4)的实施方式的一例,可举出下述。
获取多组要测定的生物标记的评价数据和细胞B的识别标记的评价数据的评价数据组。将要测定的生物标记的评价数据设定为解释变量,将细胞B的识别标记的评价数据设定为目标变量。将两组以上评价数据组用作训练数据,制作细胞B的识别标记的预测模型。将未用于预测模型的制作的另一评价数据组用作测试数据,确认预测模型的精度。在确认到精度高的预测模型中,从解释变量中提取对预测模型的制作的贡献度高的项目,将所提取的项目作为表示细胞A的特征的生物标记。
在实施工序(4)时解释变量相对于目标变量过多地存在的情况下,可以使用公知的降维方法来压缩和/或减少解释变量的数据量。作为压缩和/或减少数据量的方法,可以使用PCA(Principal Component Analysis、主成分分析)、LSA(Latent SemanticAnalysis、潜在语义分析)、LDA(Linear Discriminant Analysis、线性判别分析)或Lasso等稀疏建模方法。
在实施工序(4)时解释变量中存在缺失值的情况下,可以通过使用公知的缺失值补全法来代入缺失值。作为缺失值补全法,可以使用梯度提升、线性补全等。
<细胞的制造方法>
本发明的细胞的制造方法为培养细胞A来制造细胞B的方法,包括下述(A)~(C)。将下述(A)等还分别称为工序(A)等。
(A)进行本发明的生物标记确定方法来确定至少一个表示细胞A的特征的生物标记。
(B)参考所确定的生物标记的注释信息来确定生物标记所涉及的信号传导及生物标记发生变动的机理中的至少一个。
(C)在阻碍或促进信号传导及机理中的至少一个的培养条件下培养细胞A来制造细胞B。
本发明的细胞的制造方法中,通过进行工序(A)~工序(C),能够快速确定表示用于细胞B的制造的细胞A的特征的生物标记,并且能够根据该生物标记的注释信息来快速优化制造工序。
细胞A的种类和细胞B的种类如上所述。本发明的实施方式的一例中,细胞A为ES细胞、iPS细胞等多能干细胞,细胞B为衍生自多能干细胞的分化细胞。
[工序(A)]
工序(A)中,进行本发明的生物标记确定方法来确定至少一个表示细胞A的特征的生物标记。工序(A)的细节如上述工序(1)~工序(4)。
[工序(B)]
工序(B)中,参考所确定的生物标记的注释信息来确定该生物标记所涉及的信号传导及该生物标记发生变动的机理中的至少一个。
所确定的生物标记具有注释信息。在作为参考对象的注释信息因所确定的生物标记为多个或对一个生物标记赋予多个注释信息而为多个的情况下,优选参考信息价值相对较高的注释信息。信息价值相对较高的注释信息例如为稀有度相对较高的注释信息、与细胞B的正交性相对较高的注释信息、研究论文中的刊登数相对较多的注释信息等。
为了确定生物标记所涉及的信号传导及生物标记发生变动的机理中的至少一个,可以进行将生物标记与公共数据库进行对照、在多个注释信息之间查找共性、通过富集分析从注释信息中确定信号传导路径等分析。
[工序(C)]
工序(C)中,在阻碍或促进信号传导及机理中的至少一个的培养条件下培养细胞A来制造细胞B。工序(C)为阻碍或促进工序(B)中确定的信号传导及机理中的至少一个来调整细胞A的培养工序或细胞B的表型的工序。
工序(C)例如可以为下述工序。下述仅为示例,并不限定本发明的实施方式。
·在添加有参与信号传导的上游及下游中的至少一处的蛋白质的培养基中培养细胞A来制造细胞B。
·在添加有阻碍或促进参与信号传导的上游及下游中的至少一处的蛋白质的化学物质的培养基中培养细胞A来制造细胞B。
·在添加有阻碍或促进生物标记发生变动的机理的化学物质的培养基中培养细胞A来制造细胞B。
·在使生物标记发生变动后的培养基中培养细胞A来制造细胞B。
·调整使生物标记发生变动的培养条件(例如,培养系统内的O2浓度、搅拌培养基的搅拌机的转速等)培养细胞A来制造细胞B。
工序(C)的时间可以与工序(A)或工序(B)重叠,也可以不与工序(A)及工序(B)重叠。例如,可以在工序(A)或工序(B)的期间开始工序(C),并在工序(C)的任一时间点变更培养条件。
工序(C)在适合细胞A生存的培养条件下进行。并且,在工序(C)期间,根据需要诱导细胞A分化成细胞B,进行适合细胞B的分化诱导的培养(即,分化培养)。在工序(C)中,也可以在将细胞A分化培养成细胞B之前进行细胞A的扩增。
实施例
以下,通过实施例对本发明的实施方式进行更具体的说明,但本发明的实施方式并不限定于以下实施例。
化学物质等的缩写如下。
bFGF basic Fibroblast Growth Factor(碱性成纤维细胞生长因子)
BMP4 Bone Morphogenetic Protein 4(骨形态生成蛋白4)
cTnT cardiac Troponin T(心肌肌钙蛋白T)
DMEM Dulbecco's Modified Eagle Medium(杜氏改良伊氏培养基)
D-PBS Dulbecco's Phosphate-Buffered Saline(杜氏磷酸盐缓冲液)
EDTA Ethylenediaminetetraacetic acid(乙二胺四乙酸)
在下述中,关于物质浓度,若无特别说明,则“%”为“v/v%”。
<选择作为测定对象的生物标记>
对将所关注的细胞设为“iPS细胞”、将所关注的细胞的行为设为“分化能力”选择作为测定对象的生物标记的实施例进行说明。在本实施例中,类别及数量范围与图9所示的例子相同。即,作为类别指定了“iPS细胞”、“外胚层”、“中胚层”及“内胚层”,作为数量范围对各类别指定了“225~250”。
图29所示的表200中示出为了在本实施例中选择测定对象基因而指定的先验知识基因及所提取的DEGs。先验知识基因还包括从专家那里听取的基因或TaqMan记分卡之类的知名基因组。DEGs包括从iPS细胞25或ES细胞及使iPS细胞25或ES细胞分化成三胚层26或组织细胞30的实验中的提取对象15E中提取的DEGs。在本实施例中,从这些约2900个(一部分重复)基因中选择了满足数量范围的约1000个(具体而言,980个)测定对象基因。更详细而言,仅选择从注释信息DB16获取的注释信息中与分化相关的注释信息赋予到先验知识基因及DEGs。然后,根据注释信息来导出评价值,以评价值高的顺序选择了满足数量范围的数量。并且,与先验知识基因及DEGs另行地还选择了归一化用基因作为测定对象基因。如此,将约1000个(具体而言,980个)基因选作测定对象。将所选择的约1000个测定对象基因称为C1000。
在诱导iPS细胞25分化成心肌细胞的实验中,测定了iPS细胞25的阶段的15个样品的C1000的表达量。15个样品中,10个样品的分化诱导效率较高,另一方面,5个样品的分化诱导效率较低。
在此,为了确认本发明的技术的效果,作为比较例,对15个样品的分化诱导前的iPS细胞25另行地进行了基于微阵列的详尽基因表达量测定(约21000个基因的表达量测定)。
图30中示出基于微阵列的基因表达量的测定结果202。条203表示各基因的表达量。根据测定结果202,通过聚类分为左侧的9个样品的组和右侧的6个样品的组,6个样品的组包括由“差”表示的分化诱导效率低的所有5个样品。即,根据基于微阵列的基因表达量的测定结果202,发现在iPS细胞25的阶段,能够以相对较高的准确度(分化诱导效率变低的样品的检测灵敏度为100%,分化诱导效率变低的样品的特异度为83%)预测分化诱导效率的高低。“好”表示分化诱导效率高的样品。
从成为微阵列的测定对象的约21000个基因中提取了表达量为阈值以上的高表达基因,进而,通过统计方法从对高表达基因赋予的注释信息中选取了对细胞的行为的影响程度相对较高的注释信息(称为高影响注释信息。)。将其结果示于图31的表205及图32的表206。根据表205及表206,发现各种繁多的注释信息被选作高影响注释信息,难以获得有助于弄清细胞的行为的有效的知识。
图33中示出对15个样品的分化诱导前的iPS细胞25进行的C1000的表达量的测定结果208。根据测定结果208,通过聚类分为右侧的9个样品的组和左侧的6个样品的组,6个样品的组包括由“差”表示的分化诱导效率低的所有5个样品(分化诱导效率变低的样品的检测灵敏度为100%,分化诱导效率变低的样品的特异度为83%)。因此,根据本发明的技术所涉及的C1000,确认到能够进行与基于微阵列的详尽测定等同的水平的分化诱导效率的预测。
与针对成为微阵列的测定对象的基因的上述分析相同地,从C1000中提取了高表达基因,进而,选取了高影响注释信息。将其结果示于图34的表210。根据表210,发现尤其较多地选取了与血管形成系统功能表达相关的注释信息。并且,NODAL、LEFTY1、LEFTY2、CER1、BMP4等基因较为显眼,可以看出这些基因很可能已被确定分化诱导效率的高低。即,确认到若如本发明的技术那样从注释信息中导出评价值,并根据评价值来选择测定对象基因,则极有助于弄清活体试样的特性。
接着,比较了通过本发明的技术选择的C1000的测定基因组和代表以往方法的TaqMan记分卡的测定基因组的分析能力。基于TaqMan记分卡的测定基因组的测定结果是从基于微阵列的详尽基因表达量测定的结果中提取TaqMan记分卡的84个基因人工制作的。
作为分析能力的比较,通过DEGs提取对比TaqMan记分卡中的活体试样的种类和C1000中的活体试样的种类的注释信息,针对被赋予各注释信息的基因检查了表示DEGs被富集成何等程度的优势比。图35中示出基于C1000的测定基因组的优势比的条形图表215,图36中示出基于TaqMan记分卡的测定基因组的优势比的条形图表216。
根据图35的条形图表215,在C1000的测定基因组中,在分化诱导效率低的样品中,与“中胚层”及“内胚层”相关的基因被富集,并且与“iPS细胞”相关的基因减少。并且,与分化诱导效率低时的各活体试样的种类相关的基因除“外胚层”以外,优势比在统计上显著地偏离了100%(q值(q-value)小于0.05(q<0.05))。因此,发现C1000的测定基因组对分化诱导效率变低的样品具有一定的分析能力。认为得到这种结果的原因在于,均衡地分配了专注于各活体试样的种类的足够多的测定对象基因。
另一方面,根据图36的条形图表216,在TaqMan记分卡的测定基因组中,在分化诱导效率高的样品中,与“iPS细胞”相关的基因被富集,在分化诱导效率低的样品中,与“内胚层”相关的基因被富集。然而,仅与分化诱导效率高时的“iPS细胞”相关的基因的优势比在统计上显著地偏离了100%。因此,发现TaqMan记分卡的测定基因组对分化诱导效率变低的样品的分析能力是有限的。认为得到这种结果的原因在于,与C1000的情况不同,分配给各活体试样的种类的基因的数量较少,从而容易产生极端的比率。
如上所述,即使在事先未积累知识的情况下,本发明的技术也能够在统计上有意义地弄清活体试样的特性。即,能够如RNA-Seq那样利用检查时间短且以相对廉价的PCR为基础的方法,从而能够期待广泛的应用。
<制作源自iPS细胞的心肌细胞>
[诱导iPS细胞分化成心肌细胞]
按照日本专利第5984217号公报中记载的方法从源自多个供体的外周血单核细胞制作出15个克隆iPS细胞。将这些克隆称为克隆A、克隆B、克隆C、克隆D、克隆E、克隆F、克隆G、克隆H、克隆I、克隆J、克隆K、克隆L、克隆M、克隆N及克隆O。
iPS细胞的培养使用了mTeSR1(注册商标)(STEMCELL Technologies Inc.)及Matrigel(注册商标)(Corning Incorporated),利用0.5mmol/L EDTA溶液(Invitrogen公司)处理7分钟,由此回收细胞并传代。
在上述条件下,将iPS细胞扩增至两个T225烧瓶的量。在上述条件下,使iPS细胞增殖至汇合率成为80%左右之后,在TrypLE Select(“TrypLE”为注册商标)(Thermo FisherScientific Korea Ltd.)中将细胞分离及剥离成单细胞并进行回收,使细胞在添加有终浓度1μmol/L H1152(FUJIFILM Wako Pure Chemical Corporation)、25μg/ml Gentamicin(Thermo Fisher Scientific Korea Ltd.)及100ng/ml bFGF(FUJIFILM Wako PureChemical Corporation)的mTeSR1(注册商标)中悬浮,以使其成为3.0×106cells/ml,得到细胞悬浮液。采集一部分该细胞悬浮液,用于后述的基因表达分析。
向30ml一次性生物反应器(ABLE Corporation)中添加15ml上述细胞悬浮液,以40rpm的转速进行了搅拌培养。从搅拌培养开始起2小时~4小时后,在相同的培养液中定容成30ml的最终液量,继续搅拌培养。
搅拌培养开始1天后,替换成由终浓度1μmol/L H1152、25μg/ml Gentamicin、100ng/ml bFGF、24ng/ml Activin、5%胎牛血清(GE HealthCare)、×0.5mTeSR1(注册商标)及×0.5DMEM low-glucose(Thermo Fisher Scientific Korea Ltd.)构成的培养液,开始了分化培养。
搅拌培养开始2天后,采集一部分培养液,用于后述的基因表达分析。并且,采集一部分培养液来测量细胞数,制备成在由终浓度25μg/ml Gentamaicin、100ng/ml bFGF、24ng/ml Activin、40ng/ml BMP4、10%胎牛血清及DMEM low-glucose构成的培养液中成为1.0×106cells/ml,继续搅拌培养。搅拌培养开始3天~7天,在相同的培养液中每天更换培养基,继续搅拌培养。
搅拌培养开始8天后,采集一部分培养液,用于后述的基因表达分析。并且,采集一部分培养液来测量细胞数,制备成在由终浓度25μg/ml Gentamaicin、16.25μg/ml XAV939(Sigma-Aldrich Co.LLC)、10%胎牛血清及DMEM low-glucose构成的培养液中成为1.0×106cells/ml,继续搅拌培养。搅拌培养9天~13天,在除XAV939以外的相同的培养液中每2天更换培养基,继续搅拌培养。
搅拌培养开始14天后,采集一部分培养液测量了细胞数。将最终得到的分化诱导后的细胞数示于表1。
[表1]
克隆名 总细胞数(×10<sup>6</sup>cells)
A 143.5
B 534.7
C 4.9
D 24.8
E 573.5
F 212.9
G 334.2
H 8.4
I 315.4
J 173.1
K 94.6
L 555.2
M 285.6
N 46.6
O 20.6
[利用流式细胞仪分析源自iPS细胞的心肌细胞团]
利用TrypLE Select(“TrypLE”为注册商标)将搅拌培养开始14天后的细胞团分离成单细胞,使用Live/Dead(注册商标)Fixable Green Dead Cell Stain Kit(可固定绿色死细胞染色试剂盒)对死细胞进行了染色。利用D-PBS(Thermo Fisher Scientific KoreaLtd.)进行清洗之后,利用终浓度4%的甲醛(Sigma-Aldrich Co.LLC)进行处理,固定了细胞。在含有终浓度0.1%Saponin(Merck Millipore公司)及2%胎牛血清的D-PBS中将抗cTnT抗体(Abcamplc.、ab8295)稀释成1/250后添加到固定细胞0.5×106cells中,在室温下处理了1小时。同时,作为同种型对照,并置了将IgG1 Isotype Control from MurineMyeloma(Sigma-Aldrich Co.LLC、M5284)稀释成1/25后添加的样品。接着,将Alexa Fluor647(“Alexa Fluor”为注册商标)标记山羊抗小鼠IgG1抗体(Thermo Fisher ScientificKorea Ltd.、A21240)稀释成1/500后进行添加,在室温下处理了30分钟。使用流式细胞仪(Thermo Fisher Scientific Korea Ltd.、Attune NxT)对标记后的细胞进行了分析。门控前向光散射、侧向光散射及活细胞之后,根据与同种型对照的比较计算出cTnT阳性率(细胞的数量比例)。将从克隆A分化诱导的细胞团的点图示于图37,将每个克隆的cTnT阳性率示于表2。
[表2]
克隆名 cTnT阳性率(%)
A 42.7
B 14.4
C 0.1
D 22.8
E 25.5
F 16.8
G 62.2
H 1.1
I 44.9
J 41.6
K 40.1
L 11.6
M 41.8
N 16.9
O 5.0
<测定基因的表达量>
使用RNeasy Plus Mini Kit(QIAGEN N.V.)从在iPS细胞的培养工序中采集的搅拌培养第0天、第2天及第8天的细胞中分别进行了总RNA的提取。以所提取的RNA为试样,测定了C1000的基因表达量。
<分析测得的基因信息>
为了确定表示此次使用的iPS细胞的特征的基因,根据C1000的基因表达量的数据和作为心肌细胞的识别标记的cTnT阳性率进行了下述分析。
由从在搅拌培养第0天、第2天及第8天采集的各细胞中获取到的各总RNA获取C1000的基因表达量的数据,并将其作为解释变量。并且,将搅拌培养第14天的cTnT阳性率作为目标变量。根据该解释变量和目标变量,通过使用随机森林的回归分析制作出cTnT阳性率的预测模型。将15个克隆的评价数据组中的12个克隆的评价数据组用作训练数据制作出预测模型,并将剩余3个克隆的评价数据组作为测试数据验证了预测模型的有效性。将其结果示于图38。以横轴(X)为cTnT阳性率的实测值且以纵轴(Y)为cTnT阳性率的预测值描绘三个测试数据的结果,三个绘图分别渐近于Y=X的直线,表现出预测模型的有效性。
将制作上述预测模型时贡献度高的基因以贡献度高的顺序示于表3。
[表3]
贡献度的位次 基因名 测定的时间点
1 REST Day2
2 ALCAM Day0
3 sFRP2 Day8
4 AEN Day8
5 NTN1 Day8
6 VANGL1 Day8
7 CCL2 Day0
8 SEMA3E Day0
<参考基因的注释信息>
针对表3所示的基因(即,表示此次使用的iPS细胞的特征的生物标记)参考与各基因建立有对应关系的注释信息的结果,在sFRP2的注释信息中发现了sFRP2阻碍对影响分化成心肌细胞的Wnt3a的文献。根据该文献的内容,预测通过向培养液中添加Wnt3a激活Wnt信号路径,从iPS细胞分化成心肌细胞的效率上升。
<改善诱导iPS细胞分化成心肌细胞的培养工序>
从iPS细胞的15个克隆中选择克隆D、克隆H及克隆O,进行了14天与上述相同的搅拌培养。此时,各克隆分别在培养第2天~第8天的期间的每一天,以终浓度100ng/ml向培养液中添加了Wnt3a。同时,还培养了不向培养液中添加Wnt3a的对照组。通过与上述相同的流式细胞仪对搅拌培养开始14天后的细胞团进行分析,检查了cTnT阳性率。将其结果示于表4。相较于Wnt3a非添加组,Wnt3a添加组从iPS细胞分化成心肌细胞的效率显著地上升。
[表4]
Figure BDA0003974657080000351
通过在从iPS细胞制造心肌细胞的制造工序中采用本实施方式,能够改善心肌细胞的生产率。
日本专利申请第2020-106416号的发明整体通过参考并入到本说明书中。
本说明书中记载的所有文献、专利申请及技术标准可与具体且分别记载通过参考援用每一个文献、专利申请及技术标准的情况相同程度地援用于本说明书中,并且并入到本说明书中。
符号说明
10-信息处理装置,11-网络,12-基因表达信息数据库服务器(基因表达信息DB服务器),13-注释信息数据库服务器(注释信息DB服务器),14-基因表达信息数据库(基因表达信息DB),15-基因表达信息,15E-提取对象,16-注释信息数据库(注释信息DB),20-注释信息表,22、150、151、158、161、200、205、206、210-表,25-iPS细胞,26-三胚层,27-外胚层,28-中胚层,29-内胚层,30-组织细胞,31-晶状体,32-神经细胞,33-血液细胞,34-骨细胞,35-肌细胞,36-肺泡细胞,37-肠道细胞,38-肝细胞,45-存储装置,46-存储器,47-CPU(处理器),48-通信部,49-显示器,50-输入装置,51-总线,55-运行程序(信息处理装置的运行程序),60-指示受理部,61-提取部,62-获取部,63-导出部,64-选择部,65-显示控制部,70-类别及数量范围指定信息,71-先验知识基因指定信息,72-第1传送请求,73-提取对象指定信息,74-DEGs列表,74G、160G-已赋予的DEGs列表,75-第2传送请求,76-传送信息,77-评价值表,78-测定对象基因列表,78P-临时测定对象基因列表,80-类别指定画面,81、96-下拉菜单,82~84、106-输入框,85、97、107-追加按钮,86、98、108-指定按钮,87、121A~121D-显示区域,88、91-消息,90-警告画面,92-确认按钮,95-先验知识基因指定画面,105-提取对象指定画面,115-选择位次表组,116A~116D-选择位次表,120-测定对象基因显示画面,122-保存按钮,123-打印按钮,124-确认按钮,202-基于微阵列的基因表达量的测定结果,203-条,208-C1000的表达量的测定结果,215、216-条形图表,ST100、ST110、ST120、ST130、ST140、ST150、ST160、ST170、ST180、ST190、ST210、ST230、ST250-步骤,ST200-步骤(获取处理),ST220-步骤(导出处理),ST240-步骤(选择处理)。

Claims (6)

1.一种生物标记确定方法,其为确定表示用于细胞B的制造的细胞A的特征的生物标记的方法,包括下述(1)~(4):
(1)根据对多个生物标记分别赋予的注释信息来导出多个所述生物标记的每一个的评价值,并根据所述评价值从多个所述生物标记中选择要测定的生物标记;
(2)在所述细胞A的培养开始前及培养期间中的至少一个时期,从所述细胞A及培养系统中的至少一者获取所述要测定的生物标记的评价数据;
(3)在所述细胞A的培养末期及培养结束后中的至少一个时期,从所述细胞A及培养系统中的至少一者获取所述细胞B的识别标记的评价数据;及
(4)根据所述要测定的生物标记的评价数据和所述细胞B的识别标记的评价数据从所述要测定的生物标记中确定至少一个表示用于所述细胞B的制造的细胞A的特征的生物标记。
2.根据权利要求1所述的生物标记确定方法,其中,
所述生物标记包括选自由基因的表达量、蛋白质的表达量及代谢物的生成量组成的组中的至少一种。
3.根据权利要求1或2所述的生物标记确定方法,其中,
所述(2)在多个时间点进行。
4.根据权利要求1至3中任一项所述的生物标记确定方法,其中,
所述细胞A为多能干细胞,所述细胞B为分化细胞。
5.一种细胞的制造方法,其为培养细胞A来制造细胞B的方法,包括下述(A)~(C):
(A)进行权利要求1至3中任一项所述的生物标记确定方法来确定至少一个表示所述细胞A的特征的生物标记;
(B)参考所确定的生物标记的注释信息来确定该生物标记所涉及的信号传导及该生物标记发生变动的机理中的至少一个;及
(C)在阻碍或促进所述信号传导及所述机理中的至少一个的培养条件下培养所述细胞A来制造所述细胞B。
6.根据权利要求5所述的细胞的制造方法,其中,
所述细胞A为多能干细胞,所述细胞B为分化细胞。
CN202180039681.0A 2020-06-19 2021-04-21 生物标记确定方法及细胞的制造方法 Pending CN115885048A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2020106416 2020-06-19
JP2020-106416 2020-06-19
PCT/JP2021/016167 WO2021256078A1 (ja) 2020-06-19 2021-04-21 バイオマーカー特定方法及び細胞の製造方法

Publications (1)

Publication Number Publication Date
CN115885048A true CN115885048A (zh) 2023-03-31

Family

ID=79267756

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202180039681.0A Pending CN115885048A (zh) 2020-06-19 2021-04-21 生物标记确定方法及细胞的制造方法

Country Status (5)

Country Link
US (1) US20230066188A1 (zh)
EP (1) EP4148139A4 (zh)
JP (1) JPWO2021256078A1 (zh)
CN (1) CN115885048A (zh)
WO (1) WO2021256078A1 (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115454988B (zh) * 2022-09-27 2023-05-23 哈尔滨工业大学 基于随机森林网络的卫星电源系统缺失数据补全方法

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2423684A3 (en) 2006-04-21 2012-06-27 Wyeth LLC Differential expression profiling analysis of cell culture phenotypes and the uses thereof
DK2582794T3 (en) 2010-06-15 2018-05-22 Cellular Dynamics Int Inc GENERATION OF INDUCED PLURIPOTENT STEM CELLS FROM SMALL VOLUMES OF PERIPHERAL BLOOD
WO2012037456A1 (en) * 2010-09-17 2012-03-22 President And Fellows Of Harvard College Functional genomics assay for characterizing pluripotent stem cell utility and safety
AR087491A1 (es) * 2011-08-12 2014-03-26 Sanofi Sa Evaluacion de la calidad de celulas pluripotentes inducidas por referencia a patrones distintivos de corte y empalme de pluripotencia
EP3008229B1 (en) * 2013-06-10 2020-05-27 President and Fellows of Harvard College Early developmental genomic assay for characterizing pluripotent stem cell utility and safety
JP6719449B2 (ja) * 2015-03-18 2020-07-08 小野薬品工業株式会社 ナイーブ型多能性幹細胞の製造方法
JP6736772B2 (ja) * 2017-06-19 2020-08-05 公益財団法人神戸医療産業都市推進機構 多能性幹細胞の分化能の予測方法及びそのための試薬
JP7141029B2 (ja) 2017-07-12 2022-09-22 シスメックス株式会社 データベースを構築する方法
EP3808834A4 (en) * 2018-06-13 2021-08-11 FUJIFILM Corporation INFORMATION PROCESSING DEVICE, DERIVATION METHOD AND DERIVATION PROGRAM
JP6517423B1 (ja) 2018-12-27 2019-05-22 新コスモス電機株式会社 定電位電解式ガスセンサ

Also Published As

Publication number Publication date
JPWO2021256078A1 (zh) 2021-12-23
WO2021256078A1 (ja) 2021-12-23
US20230066188A1 (en) 2023-03-02
EP4148139A1 (en) 2023-03-15
EP4148139A4 (en) 2023-11-08

Similar Documents

Publication Publication Date Title
Schwalie et al. A stromal cell population that inhibits adipogenesis in mammalian fat depots
Tyser et al. Single-cell transcriptomic characterization of a gastrulating human embryo
Kernfeld et al. A single-cell transcriptomic atlas of thymus organogenesis resolves cell types and developmental maturation
Han et al. Construction of a human cell landscape at single-cell level
Tabula Muris Consortium et al. Single-cell transcriptomics of 20 mouse organs creates a Tabula Muris
Schaum et al. Single-cell transcriptomics of 20 mouse organs creates a Tabula Muris: The Tabula Muris Consortium
Hermann et al. The mammalian spermatogenesis single-cell transcriptome, from spermatogonial stem cells to spermatids
Harly et al. Development and differentiation of early innate lymphoid progenitors
Lau et al. Mouse embryo model derived exclusively from embryonic stem cells undergoes neurulation and heart development
Lundin et al. Quality control and standardization of embryo morphology scoring and viability markers
Greenblatt et al. The unmixing problem: a guide to applying single‐cell RNA sequencing to bone
US20230066188A1 (en) Biomarker identifying method and cell producing method
Sokol et al. Protocols for endothelial cell isolation from mouse tissues: small intestine, colon, heart, and liver
Palani et al. Adipogenic and SWAT cells separate from a common progenitor in human brown and white adipose depots
Korin et al. Preparation of single-cell suspensions of mouse glomeruli for high-throughput analysis
Belenguer et al. Cell population analysis of the adult murine subependymal neurogenic lineage by flow cytometry
Marques et al. Single-cell RNA sequencing of oligodendrocyte lineage cells from the mouse central nervous system
Zwick et al. Epithelial zonation along the mouse and human small intestine defines five discrete metabolic domains
Thomas et al. Human HLFneg placental erythro-myeloid progenitors give rise to HLA Class IIneg Hofbauer cells
Song et al. 3D epigenomic characterization reveals insights into gene regulation and lineage specification during corticogenesis
CN113512588B (zh) 用于骨肉瘤分型和评估骨肉瘤预后的基因及其应用
JP2023020930A (ja) 皮下組織リモデリング現象の指令因子又は指令細胞の探索方法
Min et al. Multiple human adipocyte subtypes and mechanisms of their development
Xiao et al. Tracking single-cell evolution using clock-like chromatin accessibility loci
Sun et al. The maternal-fetal interface of successful pregnancies and impact of fetal sex using single cell sequencing

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination