CN113355433A - 一种基于单细胞测序数据分析的iPSC残留检测方法 - Google Patents
一种基于单细胞测序数据分析的iPSC残留检测方法 Download PDFInfo
- Publication number
- CN113355433A CN113355433A CN202110612182.8A CN202110612182A CN113355433A CN 113355433 A CN113355433 A CN 113355433A CN 202110612182 A CN202110612182 A CN 202110612182A CN 113355433 A CN113355433 A CN 113355433A
- Authority
- CN
- China
- Prior art keywords
- ipsc
- cells
- sample
- data
- biomarker
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6876—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
- C12Q1/6888—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
- G06F18/2135—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on approximation criteria, e.g. principal component analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B25/00—ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
- G16B25/20—Polymerase chain reaction [PCR]; Primer or probe design; Probe optimisation
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B30/00—ICT specially adapted for sequence analysis involving nucleotides or amino acids
- G16B30/10—Sequence alignment; Homology search
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/158—Expression markers
Landscapes
- Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Physics & Mathematics (AREA)
- Chemical & Material Sciences (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Health & Medical Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Analytical Chemistry (AREA)
- Bioinformatics & Computational Biology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Evolutionary Biology (AREA)
- Biophysics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Biotechnology (AREA)
- Organic Chemistry (AREA)
- Molecular Biology (AREA)
- Genetics & Genomics (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- Medical Informatics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Zoology (AREA)
- Evolutionary Computation (AREA)
- Wood Science & Technology (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Microbiology (AREA)
- Immunology (AREA)
- Probability & Statistics with Applications (AREA)
- Biochemistry (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本发明公开了一种基于单细胞测序数据分析的iPSC残留检测方法,所述方法是基于单细胞测序技术,对每一个iPSC来源的功能细胞进行单细胞mRNA测序,结合生物信息学分析,在全基因转录组水平上分析iPSC残留,能够得到更加准确的结果,相对于传统的测定方法而言,本发明所述的测定方法具有准确性高、灵敏度高、检测效率高的优点。
Description
技术领域
本发明属于生物医学技术领域,涉及一种iPSC残留检测方法,具体而言,涉及一种基于单细胞测序数据分析的iPSC残留检测方法。
背景技术
多能干细胞(Pluripotent stem cells,PSC)是能够分化形成多种细胞类型的细胞。2006年,日本科学家将分化的小鼠体细胞在特定诱导因子Oct4、Sox2、c-Myc和Klf4(即OSKM体系)过表达作用下,逆转去分化重回多能干细胞,并命名为诱导多能干细胞(Inducedpluripotent stem cell,iPSC)(Takahashi K,Yamanaka S.Induction of pluripotentstem cells from mouse embryonic and adult fibroblast cultures by definedfactors.Cell.2006;126:663-676.),iPSC为类似于胚胎干细胞(Embryonic stem cell,ESC)的细胞,同时也具有强大的自我更新能力和多向分化潜能,具有未分化和低分化的特征。相对于其他干细胞而言,iPSC来源自自体体细胞或其他类型的细胞,所以可避免异体移植产生的免疫排斥反应;此外,其无需取自哺乳动物早期胚胎内细胞团,避免了ESC引起的伦理学争议。iPSC衍生的疗法在患者特异性细胞疗法中具有广阔的前景,有可能为许多威胁生命的疾病提供再生医学。越来越多的细胞疗法正在临床开发中,并具有良好的临床疗效。在开发源自iPSC的疗法中,一个关键的安全问题是残留的未分化iPSC在最终的细胞疗法产品中持续存在的可能性,最终会扩散并形成畸胎瘤。因此,建立用于检测残留未分化hiPSC的高灵敏度测定至关重要。
目前,已经开发了各种测定方法来体外检测衍生细胞疗法中残留的未分化iPSC,例如流式细胞仪、定量实时PCR(qRT-PCR)分析、数字PCR、miRNA靶标和高效培养系统,其中,流式细胞仪的检测原理是对iPSC来源的功能细胞中的2-3个干细胞特异性基因进行流式检测,得到iPSC残留的比例;定量实时PCR(qRT-PCR)分析、数字PCR、miRNA靶标的检测原理是对iPSC来源的功能细胞中的2-3个干细胞特异性基因进行定量实时PCR(qRT-PCR)分析、数字PCR、miRNA靶标分析,得到iPSC残留的比例;高效培养系统的检测原理是使用干细胞培养基,扩大培养iPSC来源的功能细胞,对扩大培养后的细胞,使用2-3个干细胞特异性基因进行定量实时PCR(qRT-PCR)分析、数字PCR、miRNA靶标分析,得到iPSC残留的比例。高效培养系统需要10到14天的检测时间,存在检测效率低、耗时长的问题,同时,该方法会存在会有残留的iPSC自分化产生假阴性的可能,通过对细胞进行扩大培养的检测方式,还存在过低的浓度细胞不易成活的问题。除高效培养系统外,这些测定方法中的大多数都是基于检测未分化的细胞标志物的表达来进行检测的,以上方法仅仅只能对3个左右的标记物进行检测,因此存在假阴性高的问题。
为了解决上述测定方法存在的假阴性率高的问题,本发明创造性地基于单细胞测序技术,对每一个iPSC来源的功能细胞进行单细胞mRNA测序,结合生物信息学分析,在全基因转录组水平上分析iPSC残留,得到更加准确的结果,目前,未见将单细胞测序技术应用于iPSC残留检测的相关报道,本发明首次将单细胞测序技术应用于iPSC残留检测中,并取得了较好的检测效果。
发明内容
为解决目前本领域面临的上述问题,本发明提供了一种基于单细胞测序数据分析的iPSC残留检测方法,所述方法基于单细胞测序技术,对每一个iPSC来源的功能细胞进行单细胞mRNA测序,结合生物信息学分析,在全基因转录组水平上分析iPSC残留,得到更加准确的结果,相对于传统的测定方法而言,本发明所述的测定方法具有准确性高、灵敏度高、检测效率高的优点。
本发明的上述目的通过以下技术方案得以实现:
本发明的第一方面提供了一组用于iPSC残留检测的生物标志物。
进一步,所述生物标志物包括Alcam、Arid1b、Ars2、Ash2l、Axin2、Bmi1、Brix、Cbx1、Cbx5、Ccna1、Ccnd1、Ccnd2、Ccne1、Ccnf、Cd24、Cd44、Cd9、Cdh3、Cdk2、Cdk4、Cdk6、Cdkn1b、Cdyl、Cldn6、Cnot1、Cnot2、Cnot3、Cops2、Cops4、Cpsf3、rabp1、Dazap1、Dnmt3b、Dppa2、Dppa3、Dppa4、Dppa5、Dpy30、E2f1、Eed、Ehmt2、Eif2b1、Eif2b2、Eif2b3、Eif2s2、Epcam、Eras、ESRG、Esrrb、Ewsr1、Ezh1、Ezh2、Fbxo15、Fgf13、Fgf4、Flt3、Foxd3、Foxh1、Fry、Fut4、SSEA1、Gabrb3、Gal、Gbx2、Gdf3、Gja1、Gli1、Gli2、Gli3、Glis1、Gnl3、Grb7、H2afz、Has2、Hcfc1、Herc5、Hesx1、Hira、Hmga1、Hspa4、Hspb1、Id1、Ing5、Itga6、Jarid2、Kat2a、Kat5、Kat6a、Kdm1a、Kdm3a、Kdm4a、Kdm4c、Kdm5b、Kit、Kitlg、Klf12、Klf2、Klf4、Klf5、L1td1、Lefty1、Lefty2、LIN28A、Lin28b、Ly6e、Mapk1、Max、Mcm2、Mcrs1、Med1、Med10、Med12、Med13、Med13l、Med14、Med17、Med19、Med24、Med28、Metap2、Mga、Mll、Mll2、Mll3、Mll5、Msi1、Mt1a、Mt2a、Mthfd1、Mybl2、Myc、Mycn、Nacc1、NANOG、Nanos1、Ncam、Ncoa2、Ncoa3、Nfrkb、Nodal、Npr1、Nr0b1、Nr6a1、Nts、Otx1、Otx2、Paf1、Pcgf6、Pcid2、Pcna、Phc1、Phc2、Phc3、Pim2、Podxl、POU5F1、Ppp1r3d、Prdm14、Prdm16、Prdm5、Prmt6、Prom1、Ptprz1、Pum1、Pum2、Rad21、Rb1、Rbbp4、Rbbp5、Rbbp7、Rbbp9、Rbl2、Rbx1、Rest、Rif1、Ring1、Rnf2、Rtf1、Sall1、Sall4Sema4a、Setdb1、Setdb2、Sf3a1、Sf3a3、Sfrp2、Sirt2、Skil、Smad1、Smad2、Smad3、Smarca4、Smarca5、Smarcd1、Smarcb1、Smarcc1、Smarcd1、Smc1a、Smo、SOX2、Sox3、Sp1、Spp1、Stag1、Stat3、Sub1、Suv39h2、Suz12、Taf2、Taf7、Tcf3、Tcf7l1、Tcl1a、Tdgf1、Terf1、Tert、Tgif、Thap11、Thy1、Tle1、Tnfrsf8、Top2a、Trim16、Trim24、Trim28、Utf1、Wdr18、Wdr5、Wnt2b、Wnt8a、Xpo7、Yy1、Zfhx3、Zfp41、Zfp42、Zfx、Zic2、Zic3、Zic5、Znf143、Znf219、Znf281、Zscan10中的一种或多种;
优选地,所述生物标志物为LIN28A、ESRG、SOX2、POU5F1、NANOG中的一种或多种。
作为本发明一种可实施的方式,所述的生物标志物包括LIN28A、ESRG、SOX2、POU5F1、NANOG中的任意一种。
作为本发明一种可实施的方式,所述的生物标志物包括LIN28A、ESRG、SOX2、POU5F1、NANOG中的任意两种。
作为本发明一种可实施的方式,所述的生物标志物包括LIN28A、ESRG、SOX2、POU5F1、NANOG中的任意三种。
作为本发明一种可实施的方式,所述的生物标志物包括LIN28A、ESRG、SOX2、POU5F1、NANOG中的任意四种。
作为本发明一种可实施的方式,所述的生物标志物包括LIN28A、ESRG、SOX2、POU5F1、NANOG中的五种。
本发明的第二方面提供了一种用于iPSC残留检测的生物标志物的筛选方法。
进一步,所述方法包括如下步骤:
(1)对待测样本进行单细胞测序;
(2)对步骤(1)测序得到的结果进行生物信息学分析,比对所有表达的基因,筛选出iPSC残留的生物标志物;
优选地,步骤(1)中所述的样本包括iPSC分化细胞;
更优选地,所述的样本包括内皮祖细胞、心肌细胞、内皮细胞、心脏成纤维细胞、神经干细胞、小胶质细胞、间充质干细胞、视网膜色素上皮细胞、肝细胞、造血干细胞、胰岛细胞、红细胞、B淋巴细胞、T淋巴细胞、自然杀伤细胞、嗜中性粒细胞、嗜碱性粒细胞、嗜酸性粒细胞、单核细胞、巨噬细胞;
最优选地,所述的样本包括内皮祖细胞、心肌细胞、胰岛细胞;
优选地,步骤(2)中所述的比对所有表达的基因包括比对iPSC细胞和样本中所有基因表达量的差异,筛选出iPSC残留的生物标志物;
更优选地,所述筛选的过程包括如下步骤:筛选出iPSC干性基因中在iPSC中表达的阳性细胞比例>50%的基因为iPSC残留的候选基因,筛选出iPSC干性基因中在样本中表达的阳性细胞比例<10%的基因为iPSC残留的候选基因,在候选基因的基础上确定iPSC残留的生物标志物。
进一步,所述iPSC干性基因包括:POU5F1、CD24、TERF1、DPPA4、L1TD1、LIN28A、SFRP2、GAL、SOX2、SALL4、EPCAM、ESRG、PIM2、NR6A1、THY1、JARID2、TOP2A、GNL3、PCNA、FOXH1、ZIC2、DNMT3B、PODXL、NANOG、PHC1、ZSCAN10、MYBL2、PTPRZ1、MTHFD1、E2F1。
进一步,所述生物信息学分析包括如下步骤:
a.使用cellranger-5.0.0对单细胞转录组rawdata数据进行分析;
b.Seurat软件包对单细胞数据进行分析;
c.添加线粒体百分比列,使用PercentageFeatureSet函数计算,并进行数据筛选;
d.使用全局缩放规范化方法LogNormalize对数据进行处理;
e.使用FindVariableFeatures完成差异分析,选择差异较高的特征基因。
进一步,步骤a中使用的为cellranger count工具,参考基因组版本为GRCh38-2020-A。
进一步,步骤b中包括应用R函数Read10X读取单细胞转录组表达矩阵结果得到一个稀疏矩阵,创建Seurat对象,并设置条件筛选细胞。
进一步,步骤c中所述的线粒体gene的比例要足够小。
本发明的第三方面提供了一种iPSC残留的检测方法。
进一步,所述方法包括如下步骤:检测待测样本中生物标志物的表达水平;
优选地,所述生物标志物为本发明第一方面所述的生物标志物。
进一步,所述方法还包括如下步骤:
(1)对待测样本中的生物标志物进行PCA分析和Kmeans分析;
(2)根据步骤(1)分析得到的PCA结果和tSNE结果,判断iPSC的残留水平;
优选地,所述生物标志物为本发明第一方面所述的生物标志物。
进一步,步骤(1)中所述的样本包括iPSC分化细胞;
优选地,所述的样本包括内皮祖细胞、心肌细胞、内皮细胞、心脏成纤维细胞、神经干细胞、小胶质细胞、间充质干细胞、视网膜色素上皮细胞、肝细胞、造血干细胞、胰岛细胞、红细胞、B淋巴细胞、T淋巴细胞、自然杀伤细胞、嗜中性粒细胞、嗜碱性粒细胞、嗜酸性粒细胞、单核细胞、巨噬细胞;
更优选地,所述的样本包括内皮祖细胞、心肌细胞、胰岛细胞。
进一步,步骤(1)中还包括如下步骤:
a.对生物标志物应用线性变换进行缩放;
b.对缩放得到的数据进行PCA分析,得到表达矩阵数据;
c.将样本表达矩阵数据与iPSC单细胞测序分析得到的表达矩阵数据合并取交集得到新的表达矩阵;
d.利用新的表达矩阵的数据进行PCA分析和Kmeans分析,得到PCA结果和tSNE结果;
优选地,所述生物标志物为本发明第一方面所述的生物标志物。
进一步,步骤a中所述的缩放包括采用ScaleData函数,使每个基因在所有细胞间的表达量均值为0,使每个基因在所有细胞间的表达量方差为1。
进一步,步骤b中还包括对缩放得到的数据进行筛选,提取数据中表达生物标志物中的一种或多种的细胞作为疑似iPSC细胞,得到表达矩阵数据;
优选地,所述生物标志物包括LIN28A、ESRG、SOX2、POU5F1、NANOG。
进一步,步骤d中所述的Kmeans分析是基于PCA分析得到的数据进行Kmeans聚类分析,再对Kmeans聚类分析得到的数据进行可视化展示得到tSNE结果。
本发明的第四方面提供了一种用于iPSC残留检测的试剂盒。
进一步,所述试剂盒包括检测生物标志物LIN28A、ESRG、SOX2、POU5F1、NANOG中的一种或多种表达水平的试剂;
优选地,所述试剂包括特异性扩增生物标志物LIN28A、ESRG、SOX2、POU5F1、NANOG中的一种或多种的引物或特异性识别生物标志物LIN28A、ESRG、SOX2、POU5F1、NANOG中的一种或多种的探针;
优选地,所述试剂盒还包括dNTPs、Mg2+离子、DNA聚合酶或包含dNTPs、Mg2+离子、DNA聚合酶的PCR体系。
本发明的第五方面提供了一种iPSC残留的检测系统,所述系统包括检测待测样本中生物标志物LIN28A、ESRG、SOX2、POU5F1、NANOG中的一种或多种表达水平的单元;
优选地,所述系统还包括培养iPSC的单元;
优选地,所述系统还包括iPSC诱导分化单元;
更优选地,所述培养iPSC的单元包括E8完全培养基、Y-27632;
最优选地,所述Y-27632的浓度为10μM;
更优选地,所述检测待测样本中生物标志物LIN28A、ESRG、SOX2、POU5F1、NANOG中的一种或多种表达水平的单元包括本发明第三方面所述的方法;
最优选地,所述检测待测样本中生物标志物LIN28A、ESRG、SOX2、POU5F1、NANOG中的一种或多种表达水平的单元是根据PCA结果和tSNE结果分析是否含有iPSC残留;
最优选地,若PCA结果和tSNE结果显示iPSC和待测样本单细胞分离数据没有交集,则表明待测样本中没有iPSC残留;若PCA结果和tSNE结果显示iPSC和待测样本单细胞分离数据有交集,则表明待测样本中有iPSC残留。
进一步,所述待测样本包括iPSC分化细胞;
优选地,所述的样本包括内皮祖细胞、心肌细胞、内皮细胞、心脏成纤维细胞、神经干细胞、小胶质细胞、间充质干细胞、视网膜色素上皮细胞、肝细胞、造血干细胞、胰岛细胞、红细胞、B淋巴细胞、T淋巴细胞、自然杀伤细胞、嗜中性粒细胞、嗜碱性粒细胞、嗜酸性粒细胞、单核细胞、巨噬细胞;
更优选地,所述的样本包括内皮祖细胞、心肌细胞、胰岛细胞。
本发明的第六方面提供了如下任一方面的应用:
(1)单细胞测序技术在iPSC残留检测中的应用;
(2)本发明第一方面所述的生物标志物在iPSC残留检测中的应用;
(3)本发明第一方面所述的生物标志物在制备iPSC残留检测试剂中的应用;
(4)检测本发明第一方面所述的生物标志物表达水平的试剂在制备iPSC残留检测试剂盒中的应用;
优选地,所述试剂盒为本发明第四方面所述的试剂盒;
(5)检测本发明第一方面所述的生物标志物表达水平的试剂在制备iPSC分化动态监测系统中的应用;
优选地,所述iPSC残留的检测系统为本发明第五方面所述的系统;
(6)本发明第四方面所述的试剂盒在iPSC残留检测中的应用;
(7)本发明第五方面所述的系统在iPSC残留检测中的应用;
(8)PCA分析和Kmeans分析在iPSC残留检测中的应用。
除非另有定义,本发明上下文中的所使用的所有的技术和科学术语具有本领域普通技术人员所理解的相同含义。本发明的说明书中所使用的术语只是为了描述具体的实施例,不是旨在于限制本发明,此外,对部分术语解释如下。
本发明中使用的术语“诱导多能干细胞”或“iPSC”,是指从成体细胞衍生的ESC样细胞。iPSC具有与ESC非常相似的特征,但避免了与ESC相关的伦理问题,因为iPSC不是衍生自胚胎,相反,iPSC通常衍生自完全分化的成体细胞,该成体细胞已被“重新编程”回到多能状态。
本发明中使用的术语“分化”,是指细胞从一种细胞类型变为另一种细胞类型的过程,特别地是细胞的不太特化的类型变成细胞的更特化的类型。
本发明中使用的术语“间充质干细胞”,是指可以从各种组织(包括骨髓、脂肪组织(脂肪)、胎盘和脐带血)中分离的特定干细胞类型,其可以分化成骨细胞、软骨细胞、脂肪细胞和其他种类的结缔组织细胞。
本发明的优点和有益效果:
相对于目前已经开发出的各种体外检测衍生细胞疗法中残留的未分化iPSC测定方法而言,例如:流式细胞仪、定量实时PCR(qRT-PCR)分析、数字PCR、miRNA靶标和高效培养系统,本发明提供了一种全新的检测方法,所述方法基于单细胞测序,对每一个iPSC来源的功能细胞进行单细胞mRNA测序,结合生物信息学分析,在全基因转录组水平上分析iPSC残留,本发明所述的检测方法能够得到更加准确的结果,具有准确性高、灵敏度高、检测效率高的优点。
附图说明
以下,结合附图来详细说明本发明的实施方案,其中:
图1显示本发明所述检测方法和其他检测方法的流程图,其中,A图:本发明所述检测方法,B图:流式细胞检测法,C图:qRT-PCR分析、数字PCR、miRNA靶标方法,D图:高效培养系统方法;
图2显示EPC单细胞测序数据质量控制的结果图;
图3显示EPC与iPSC单细胞数据结合分析的PCA图;
图4显示EPC与iPSC单细胞数据结合分析的tSNE图,其中,A图:Mahalanobis,B图:Cosine,C图:Chebychev,D图:Euclidean;
图5显示心肌单细胞测序数据质量控制结果图;
图6显示心肌单细胞与iPSC单细胞数据结合分析的PCA图;
图7显示心肌单细胞与iPSC单细胞数据结合分析的tSNE图,其中,A图:Mahalanobis,B图:Cosine,C图:Chebychev,D图:Euclidean;
图8显示胰岛单细胞测序数据质量控制结果图;
图9显示胰岛单细胞与iPSC单细胞数据结合分析的PCA图;
图10显示胰岛单细胞与iPSC单细胞数据结合分析的tSNE图,其中,A图:Mahalanobis,B图:Cosine,C图:Chebychev,D图:Euclidean。
具体实施方式
下面结合具体实施例,进一步阐述本发明,仅用于解释本发明,而不能理解为对本发明的限制。本领域的普通技术人员可以理解为:在不脱离本发明的原理和宗旨的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由权利要求及其等同物限定。下列实施例中未注明具体条件的实验方法,通常按照常规条件或按照厂商所建议的条件实施检测。
实施例1 iPSC在内皮祖细胞(EPC)中残留检测
1、实验材料
E8完全培养基、stem pro 34基础培养基、DMEM/F12培养基、TrypLE、BMP4、HumanRecombinant VEGF165(VEGFA)、Forskolin、Human Recombinant Activin A购自于Thermofisher公司;Y-27632、CHIR99021、SB431542购自于Sigma公司;matrigel、Fibronectin购自于康宁公司。
2、iPSC分化为EPC细胞流程
(1)按照iPSC传代步骤,细胞正常离心之后,移去上清,加入适量37℃预热过的含10μM Y-27632的E8完全培养基,轻轻吹打,重悬细胞沉淀,随后对重悬细胞液进行计数及活率检测;
(2)从37℃、5%CO2的细胞培养箱中取出4个Matrigel-coated的T75培养瓶,移去液体,每瓶加入13mL 37℃预热过的含10μM Y-27632的E8完全培养基;
(3)iPSCs诱导分化的起始铺种密度需控制在3.0×104-4.0×104个/cm2,根据计数后的细胞重悬液密度,将适量体积的细胞重悬液加入到步骤(2)中准备好的Matrigel-coated的T75培养瓶中;
(4)将细胞板放入37℃、5%CO2的细胞培养箱中,前后左右各晃动10次左右,尽量保证细胞在培养板面分布均匀,随后静置过夜;
(5)24h后,观察iPSCs接种后的聚合度,如果聚合度达到15-25%,则可以直接进入后续正式诱导的步骤,如果聚合度未达到15%,可更换新鲜的37℃预热过的E8完全培养基,适当延长iPSCs的培养时间至12-24h;
(6)iPSCs接种后,聚合度达到15-25%左右,开始启动正式诱导分化,规定为Day0,移去T75培养瓶中旧的培养基,用10mL DPBS洗一遍,然后每瓶加入30mL 37℃预热过的中胚层诱导完全培养基-1,随后,在37℃、5%CO2细胞培养箱中孵育17-18h。中胚层诱导完全培养基-1的成分包括:stem pro 34基础培养基、8μM CHIR99021、25ng/mL RecombinantHuman BMP-4、50ng/mL Human Recombinant Activin A;
(7)孵育17-18h后(Day1),移去T75培养瓶中旧的培养基,用10mL DPBS洗一遍,每瓶加入50mL 37℃预热过的中胚层诱导完全培养基-2,随后,在37℃、5%CO2细胞培养箱中孵育2天不换液,中胚层诱导完全培养基-2的成分包括:stem pro 34基础培养基、8μMCHIR99021、25ng/mL Recombinant Human BMP-4;
(8)在侧板中胚层细胞形成后(Day3),移去T75培养瓶中旧的培养基,用10mL DPBS洗一遍,每瓶加入30mL 37℃预热过的EPCs诱导完全培养基,将培养板放回37℃、5%CO2细胞培养箱中,孵育24h,EPCs诱导完全培养基包括:stem pro 34基础培养基、200ng/mLHuman Recombinant VEGF165(VEGFA)、10μM SB431542、2μM Forskolin;
(9)一天后(Day4),重复Day3换液操作;
(10)Day5,在准备对EPCs进行酶解重铺至少前1h,准备8个Fibronectin-co atedT175细胞培养瓶,移去所有T75培养瓶中的旧培养基,DPBS洗2遍,随后,每瓶加入3mLTrypLE,置于37℃、5%CO2细胞培养箱中3-5min,显微镜下观察细胞脱落程度,直到细胞大部分开始浮动;
(11)轻振培养瓶底部,待绝大部分细胞以流沙状脱落后,加入12mL DME M/F12Medium中和TrypLE的消化作用,用移液枪轻轻吹打脱落细胞进行重悬,随后转移至离心管中,取适量细胞计数;
(12)室温条件下200g离心5min,使用1mL EPC维持完全培养基重悬细胞,并进行计数及细胞活率检测,EPC维持完全培养基包括:stem pro 34基础培养基、200ng/mL HumanRecombinant VEGF165(VEGFA);
(13)维持在4℃的条件下,取10万个细胞送测序公司进行测序。
3、EPC单细胞测序数据分析流程
(1)使用cellranger-5.0.0对单细胞转录组rawdata数据进行分析,使用cellrange r count工具,参考基因组版本为GRCh38-2020-A,分析得到EPC单细胞转录组表达矩阵结果:
cellranger count--id=EPC--fastqs=rawdata_dir--sample=EPC--localcores=8--localmem=64--transcriptome=refdata-gex-GRCh38-2020-A;
(2)Seurat软件包可以对单细胞数据进行分析,首先应用R函数Read10X读取EPC单细胞转录组表达矩阵结果得到一个稀疏矩阵,创建Seurat对象,并设置条件筛选细胞:
pbmc.data<-Read10X(data.dir=data_dir)
pbmc1<-CreateSeuratObject(counts=pbmc.data,project=project_name,min.cells=QC_min_cells,min.features=QC_min_features)
其中:data_dir为单细胞转录组表达矩阵结果所在目录,project_name为数据集名称,QC_min_cells为能检测到某个基因的细胞数,QC_min_features为每个细胞能检测到的基因数;
(3)添加线粒体百分比列,线粒体gene的比例要足够小,使用PercentageFeatureSet函数计算,以MT-开头的则是线粒体gene,并进行数据筛选:
pbmc1[["percent.mt"]]<-PercentageFeatureSet(pbmc1,pattern="^MT-")
pbmc2<-subset(pbmc1,subset=nFeature_RNA>QC_min_features&nFeature_RNA<QC_max_features&percent.mt<QC_percent_mt)
其中:QC_max_features为细胞能检测到的最大基因数,QC_percent_mt为细胞中线粒体含量;
(4)使用全局缩放规范化方法LogNormalize,该方法通过总表达式对每个单元格的特征表达式度量进行标准化,并将其乘以一个缩放因子(默认为10,000),然后对结果进行log转换:
pbmc3<-NormalizeData(pbmc2,normalization.method="LogNormalize",scale.factor=10000);
(5)使用FindVariableFeatures完成差异分析,选择数据集中差异较高的特征基因(默认2000)并用于下游分析:
pbmc4<-FindVariableFeatures(pbmc3,selection.method="vst",nfeatures=2000);
(6)应用线性变换来缩放,这是一个标准的预处理步骤,ScaleData函数,使每个基因在所有细胞间的表达量均值为0,使每个基因在所有细胞间的表达量方差为1:
all.genes<-rownames(pbmc4)
pbmc5<-ScaleData(pbmc4,features=all.genes);
(7)对上一步骤得到的缩放数据进行PCA分析:上一步完成后会生成各个细胞和表达基因的数据矩阵数据data_pbmc11_RunTSNE.txt,筛选提取所表达矩阵数据中表达ipsmarker基因(LIN28A、ESRG、SOX2、POU5F1、NANOG)其中之一的细胞作为疑似iPSC细胞,形成新的矩阵数据sub_epc.txt;
(8)将表达矩阵数据sub_epc.txt与ips单细胞测序数据相同处理步骤产生的表达矩阵合并取交集得到ips_EPC.txt;
(9)利用ips_EPC.txt表达矩阵数据进行PCA分析,得到PCA结果,基于PCA分析得到的数据进行Kmeans聚类分析,再对Kmeans聚类分析得到的数据进行可视化展示得到tSNE结果,根据PCA结果和tSNE结果分析是否含有iPSC残留。
4、实验结果
实验结果显示,本发明所述的检测方法的流程图见图1A-D,30个iPSC干性基因在iPSC中表达的比例,阳性细胞比例高于50%的基因,为初步筛选iPSC候选基因(见表1),30个iPSC干性基因在EPC细胞中表达的比例,阳性细胞比例低于10%的基因,为初步筛选iPSC候选基因(见表2),得到的EPC单细胞测序数据质量控制结果图见图2,得到的EPC与iPSC单细胞数据结合分析的PCA图见图3,其中,红色部分为iPSC单细胞,蓝色部分为EPC单细胞分离数据,EPC与iPSC单细胞数据结合分析的tSNE图见图4A-D,其中,红色部分为iPSC单细胞,蓝色部分为EPC单细胞分离数据,红色和蓝色部分没有交集,说明EPC中没有iPSC残留。
表1 30个iPSC干性基因在iPSC中表达的比例
表2 30个iPSC干性基因在EPC细胞中表达的比例
实施例2 iPSC在心肌细胞中残留检测
1、实验材料
DMEM/F-12培养基、GlutaMAXTM Supplement、Penicilin-streptomycin(双抗)、BMP4、B27购自于Thermofisher公司;RPMI-1640培养基购自于Hyclone公司;TESR-E8购自于STEMCELL Technologies公司;Y-27632、CHIR99021、C59、IWR1、硫代甘油、L-抗坏血酸购自于Sigma公司。
2、iPSC分化为心肌细胞流程
(1)当iPSC细胞扩增至75-85%聚合度时开始传代,以T25培养皿为例,吸去旧的培养基,用室温PBS洗两遍,随后加入3mL 37℃预热过的EDTA工作液,置于37℃、5%CO2细胞培养箱中5min,显微镜下观察单个细胞间出现的空隙,弃去EDTA,加入3mL的TeSR-E8完全培养基终止消化,转移至15mL离心管,室温下,1000rpm离心5min,弃去上清,用1mL 37℃预热的含有10μM Rocki的TeSR-E8培养基轻轻吹打细胞然后重悬,计数后铺板在Matrigel包被的细胞培养板上,以6孔板为例,每孔细胞悬液2mL,铺板密度为5×104个/cm2,将未分化的iPSC使用DPBS清洗三遍,去除死细胞后,加入TeSR-E8培养基,于4X的倒置显微镜下拍照,记录细胞状态,使用的培养基为TESR-E8+10μM Y-27632,此处记为DAY0;
(2)DAY1-3,使用心脏祖细胞诱导分化培养基诱导分化心脏祖细胞,所述心脏祖细胞诱导分化培养基(CIM)为在所述心脏祖细胞诱导分化基础培养基中加入细胞因子骨形态发生蛋白4(BMP4)及GSK-3抑制剂CHIR99021后得到的培养基,所述心脏祖细胞诱导分化培养基(CIM)中,BMP4浓度为25ng/mL,CHIR99021浓度为3-5μM,所述心脏祖细胞诱导分化基础培养基由DMEM/F-12培养基、GlutaMAXTM Supplement、无VA的B27(B27-Minus VA)、硫代甘油、L-抗坏血酸和Penicilin-streptomycin(双抗)组成;
(3)DAY4-6,使用心肌细胞诱导分化培养基诱导分化心肌细胞,此处使用的培养基为含有Wnt通路抑制剂(C59或IWR-1)的心肌细胞诱导分化培养基;
所述心肌细胞诱导分化培养基(CDM1)为在所述心肌细胞诱导分化基础培养基中加入无胰岛素的B27(B27-Minus insulin)、细胞因子骨形态发生蛋白4(BMP4)及Wnt通路抑制剂C59或IWR-1后得到的培养基;
所述心肌细胞诱导分化培养基(CDM1)中,B27-Minus insulin的含量为2%,BMP4浓度为10ng/mL,C59浓度为2μM,IWR-1浓度5μM;
所述心肌细胞诱导分化基础培养基由RPMI-1640培养基、GlutaMAXTM Supplement和Penicilin-streptomycin(双抗)组成;
所述心肌细胞诱导分化基础培养基具体由体积百分含量为98%的RPMI-1640培养基、体积百分含量为1%GlutaMAXTM Supplement、体积百分含量为1%的双抗组成;
(4)DAY7-16,使用心肌细胞成熟培养基诱导心肌细胞成熟,采用心肌细胞成熟培养基进行全换液,继续培养,培养期间前6天每隔1天使用心肌细胞成熟培养基(CDM2)进行全换液,以后每两天使用心肌细胞成熟培养基(CDM2)进行全换液;
所述心肌细胞成熟培养基(CDM2)为在所述心肌细胞诱导分化基础培养基中加入B27后得到的培养基;
所述心肌细胞成熟培养基(CDM2)中,B27的含量为2%。
3、心肌细胞单细胞测序数据分析流程
(1)使用cellranger-5.0.0对单细胞转录组rawdata数据进行分析,使用cellrange r count工具,参考基因组版本为GRCh38-2020-A,分析得到EPC单细胞转录组表达矩阵结果:
cellranger count--id=EPC--fastqs=rawdata_dir--sample=EPC--localcores=8--localmem=64--transcriptome=refdata-gex-GRCh38-2020-A;
(2)Seurat软件包可以对单细胞数据进行分析,首先应用R函数Read10X读取EPC单细胞转录组表达矩阵结果得到一个稀疏矩阵,创建Seurat对象,并设置条件筛选细胞:
pbmc.data<-Read10X(data.dir=data_dir)
pbmc1<-CreateSeuratObject(counts=pbmc.data,project=project_name,min.cells=QC_min_cells,min.features=QC_min_features)
其中:data_dir为单细胞转录组表达矩阵结果所在目录,project_name为数据集名称,QC_min_cells为能检测到某个基因的细胞数,QC_min_features为每个细胞能检测到的基因数;
(3)添加线粒体百分比列,线粒体gene的比例要足够小,使用PercentageFeatureSet函数计算,以MT-开头的则是线粒体gene,并进行数据筛选:
pbmc1[["percent.mt"]]<-PercentageFeatureSet(pbmc1,pattern="^MT-")
pbmc2<-subset(pbmc1,subset=nFeature_RNA>QC_min_features&nFeature_RNA<QC_max_features&percent.mt<QC_percent_mt)
其中:QC_max_features为细胞能检测到的最大基因数,QC_percent_mt为细胞中线粒体含量;
(4)使用全局缩放规范化方法LogNormalize,该方法通过总表达式对每个单元格的特征表达式度量进行标准化,并将其乘以一个缩放因子(默认为10,000),然后对结果进行log转换:
pbmc3<-NormalizeData(pbmc2,normalization.method="LogNormalize",scale.factor=10000);
(5)使用FindVariableFeatures完成差异分析,选择数据集中差异较高的特征基因(默认2000)并用于下游分析:
pbmc4<-FindVariableFeatures(pbmc3,selection.method="vst",nfeatures=2000);
(6)应用线性变换来缩放,这是一个标准的预处理步骤,ScaleData函数,使每个基因在所有细胞间的表达量均值为0,使每个基因在所有细胞间的表达量方差为1:
all.genes<-rownames(pbmc4)
pbmc5<-ScaleData(pbmc4,features=all.genes);
(7)对上一步骤得到的缩放数据进行PCA分析:上一步完成后会生成各个细胞和表达基因的数据矩阵数据data_pbmc11_RunTSNE.txt,筛选提取所表达矩阵数据中表达ipsmarker基因(LIN28A、ESRG、SOX2、POU5F1、NANOG)其中之一的细胞作为疑似iPSC细胞,形成新的矩阵数据sub_HeartMuscle.txt;
(8)将表达矩阵数据sub_HeartMuscle.txt与ips单细胞测序数据相同处理步骤产生的表达矩阵合并取交集得到ips_HeartMuscle.txt;
(9)利用ips_HeartMuscle.txt表达矩阵数据进行PCA分析,得到PCA结果,基于PCA分析得到的数据进行Kmeans聚类分析,再对Kmeans聚类分析得到的数据进行可视化展示得到tSNE结果,根据PCA结果和tSNE结果分析是否含有iPSC残留。
4、实验结果
实验结果显示,30个iPSC干性基因在心肌细胞中表达的比例,阳性细胞比例低于10%的基因,为初步筛选iPSC候选基因(见表3),得到的心肌单细胞测序数据质量控制结果图见图5,得到的心肌单细胞与iPSC单细胞数据结合分析的PCA图见图6,其中,红色部分为iPSC单细胞,蓝色部分为心肌单细胞分离数据,心肌单细胞与iPSC单细胞数据结合分析的tSNE图见图7A-D,其中,红色部分为iPSC单细胞,蓝色部分为心肌单细胞分离数据,红色和蓝色部分没有交集,说明心肌细胞中没有iPSC残留。
表3 30个iPSC干性基因在心肌细胞中表达的比例
实施例3胰岛细胞单细胞测序
1、胰岛细胞单细胞测序数据分析流程
(1)使用cellranger-5.0.0对单细胞转录组rawdata数据进行分析,使用cellrange r count工具,参考基因组版本为GRCh38-2020-A,分析得到EPC单细胞转录组表达矩阵结果:
cellranger count--id=EPC--fastqs=rawdata_dir--sample=EPC--localcores=8--localmem=64--transcriptome=refdata-gex-GRCh38-2020-A;
(2)Seurat软件包可以对单细胞数据进行分析,首先应用R函数Read10X读取EPC单细胞转录组表达矩阵结果得到一个稀疏矩阵,创建Seurat对象,并设置条件筛选细胞:
pbmc.data<-Read10X(data.dir=data_dir)
pbmc1<-CreateSeuratObject(counts=pbmc.data,project=project_name,min.cells=QC_min_cells,min.features=QC_min_features)
其中:data_dir为单细胞转录组表达矩阵结果所在目录,project_name为数据集名称,QC_min_cells为能检测到某个基因的细胞数,QC_min_features为每个细胞能检测到的基因数;
(3)添加线粒体百分比列,线粒体gene的比例要足够小,使用PercentageFeatureSet函数计算,以MT-开头的则是线粒体gene,并进行数据筛选:
pbmc1[["percent.mt"]]<-PercentageFeatureSet(pbmc1,pattern="^MT-")
pbmc2<-subset(pbmc1,subset=nFeature_RNA>QC_min_features&nFeature_RNA<QC_max_features&percent.mt<QC_percent_mt)
其中:QC_max_features为细胞能检测到的最大基因数,QC_percent_mt为细胞中线粒体含量;
(4)使用全局缩放规范化方法LogNormalize,该方法通过总表达式对每个单元格的特征表达式度量进行标准化,并将其乘以一个缩放因子(默认为10,000),然后对结果进行log转换:
pbmc3<-NormalizeData(pbmc2,normalization.method="LogNormalize",scale.factor=10000);
(5)使用FindVariableFeatures完成差异分析,选择数据集中差异较高的特征基因(默认2000)并用于下游分析:
pbmc4<-FindVariableFeatures(pbmc3,selection.method="vst",nfeatures=2000);
(6)应用线性变换来缩放,这是一个标准的预处理步骤,ScaleData函数,使每个基因在所有细胞间的表达量均值为0,使每个基因在所有细胞间的表达量方差为1:
all.genes<-rownames(pbmc4)
pbmc5<-ScaleData(pbmc4,features=all.genes);
(7)对上一步骤得到的缩放数据进行PCA分析:上一步完成后会生成各个细胞和表达基因的数据矩阵数据data_pbmc11_RunTSNE.txt,筛选提取所表达矩阵数据中表达ipsmarker基因(LIN28A、ESRG、SOX2、POU5F1、NANOG)其中之一的细胞作为疑似iPSC细胞,形成新的矩阵数据sub_islet.txt;
(8)将表达矩阵数据sub_islet.txt与ips单细胞测序数据相同处理步骤产生的表达矩阵合并取交集得到ips_islet.txt;
(9)利用ips_islet.txt表达矩阵数据进行PCA分析,得到PCA结果,基于PCA分析得到的数据进行Kmeans聚类分析,再对Kmeans聚类分析得到的数据进行可视化展示得到tSNE结果,根据PCA结果和tSNE结果分析是否含有iPSC残留。
2、实验结果
实验结果显示,30个iPSC干性基因在胰岛细胞中表达的比例,阳性细胞比例低于10%的基因,为初步筛选iPSC候选基因(见表4),最终确定为初步筛选iPSC候选基因为LIN28A、ESRG、SOX2、POU5F1、NANOG(见表5),得到的胰岛单细胞测序数据质量控制结果图见图8,得到的胰岛单细胞与iPSC单细胞数据结合分析的PCA图见图9,其中,红色部分为iPSC单细胞,蓝色部分为胰岛单细胞分离数据,胰岛单细胞与iPSC单细胞数据结合分析的tSNE图见图10A-D,其中,红色部分为iPSC单细胞,蓝色部分为胰岛小体单细胞分离数据,红色和蓝色部分没有交集,说明胰岛小体中没有iPSC残留。
表4 30个iPSC干性基因在胰岛细胞中表达的比例
表5最终确定为初步筛选iPSC候选基因
上述实施例的说明只是用于理解本发明的方法及其核心思想。应当指出,对于本领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以对本发明进行若干改进和修饰,这些改进和修饰也将落入本发明权利要求的保护范围内。
Claims (10)
1.一组用于iPSC残留检测的生物标志物,其特征在于,所述生物标志物包括Alcam、Arid1b、Ars2、Ash2l、Axin2、Bmi1、Brix、Cbx1、Cbx5、Ccna1、Ccnd1、Ccnd2、Ccne1、Ccnf、Cd24、Cd44、Cd9、Cdh3、Cdk2、Cdk4、Cdk6、Cdkn1b、Cdyl、Cldn6、Cnot1、Cnot2、Cnot3、Cops2、Cops4、Cpsf3、rabp1、Dazap1、Dnmt3b、Dppa2、Dppa3、Dppa4、Dppa5、Dpy30、E2f1、Eed、Ehmt2、Eif2b1、Eif2b2、Eif2b3、Eif2s2、Epcam、Eras、ESRG、Esrrb、Ewsr1、Ezh1、Ezh2、Fbxo15、Fgf13、Fgf4、Flt3、Foxd3、Foxh1、Fry、Fut4、SSEA1、Gabrb3、Gal、Gbx2、Gdf3、Gja1、Gli1、Gli2、Gli3、Glis1、Gnl3、Grb7、H2afz、Has2、Hcfc1、Herc5、Hesx1、Hira、Hmga1、Hspa4、Hspb1、Id1、Ing5、Itga6、Jarid2、Kat2a、Kat5、Kat6a、Kdm1a、Kdm3a、Kdm4a、Kdm4c、Kdm5b、Kit、Kitlg、Klf12、Klf2、Klf4、Klf5、L1td1、Lefty1、Lefty2、LIN28A、Lin28b、Ly6e、Mapk1、Max、Mcm2、Mcrs1、Med1、Med10、Med12、Med13、Med13l、Med14、Med17、Med19、Med24、Med28、Metap2、Mga、Mll、Mll2、Mll3、Mll5、Msi1、Mt1a、Mt2a、Mthfd1、Mybl2、Myc、Mycn、Nacc1、NANOG、Nanos1、Ncam、Ncoa2、Ncoa3、Nfrkb、Nodal、Npr1、Nr0b1、Nr6a1、Nts、Otx1、Otx2、Paf1、Pcgf6、Pcid2、Pcna、Phc1、Phc2、Phc3、Pim2、Podxl、POU5F1、Ppp1r3d、Prdm14、Prdm16、Prdm5、Prmt6、Prom1、Ptprz1、Pum1、Pum2、Rad21、Rb1、Rbbp4、Rbbp5、Rbbp7、Rbbp9、Rbl2、Rbx1、Rest、Rif1、Ring1、Rnf2、Rtf1、Sall1、Sall4Sema4a、Setdb1、Setdb2、Sf3a1、Sf3a3、Sfrp2、Sirt2、Skil、Smad1、Smad2、Smad3、Smarca4、Smarca5、Smarcd1、Smarcb1、Smarcc1、Smarcd1、Smc1a、Smo、SOX2、Sox3、Sp1、Spp1、Stag1、Stat3、Sub1、Suv39h2、Suz12、Taf2、Taf7、Tcf3、Tcf7l1、Tcl1a、Tdgf1、Terf1、Tert、Tgif、Thap11、Thy1、Tle1、Tnfrsf8、Top2a、Trim16、Trim24、Trim28、Utf1、Wdr18、Wdr5、Wnt2b、Wnt8a、Xpo7、Yy1、Zfhx3、Zfp41、Zfp42、Zfx、Zic2、Zic3、Zic5、Znf143、Znf219、Znf281、Zscan10中的一种或多种;
优选地,所述生物标志物为LIN28A、ESRG、SOX2、POU5F1、NANOG中的一种或多种。
2.一种用于iPSC残留检测的生物标志物的筛选方法,其特征在于,所述方法包括如下步骤:
(1)对待测样本进行单细胞测序;
(2)对步骤(1)测序得到的结果进行生物信息学分析,比对所有表达的基因,筛选出iPSC残留的生物标志物;
优选地,步骤(1)中所述的样本包括iPSC分化细胞;
更优选地,所述的样本包括内皮祖细胞、心肌细胞、内皮细胞、心脏成纤维细胞、神经干细胞、小胶质细胞、间充质干细胞、视网膜色素上皮细胞、肝细胞、造血干细胞、胰岛细胞、红细胞、B淋巴细胞、T淋巴细胞、自然杀伤细胞、嗜中性粒细胞、嗜碱性粒细胞、嗜酸性粒细胞、单核细胞、巨噬细胞;
最优选地,所述的样本包括内皮祖细胞、心肌细胞、胰岛细胞;
优选地,步骤(2)中所述的比对所有表达的基因包括比对iPSC细胞和样本中所有基因表达量的差异,筛选出iPSC残留的生物标志物;
更优选地,所述筛选的过程包括如下步骤:筛选出iPSC干性基因中在iPSC中表达的阳性细胞比例>50%的基因为iPSC残留的候选基因,筛选出iPSC干性基因中在样本中表达的阳性细胞比例<10%的基因为iPSC残留的候选基因,在候选基因的基础上确定iPSC残留的生物标志物。
3.根据权利要求2所述的方法,其特征在于,所述生物信息学分析包括如下步骤:
a.使用cellranger-5.0.0对单细胞转录组rawdata数据进行分析;
b.Seurat软件包对单细胞数据进行分析;
c.添加线粒体百分比列,使用PercentageFeatureSet函数计算,并进行数据筛选;
d.使用全局缩放规范化方法LogNormalize对数据进行处理;
e.使用FindVariableFeatures完成差异分析,选择差异较高的特征基因。
4.一种iPSC残留的检测方法,其特征在于,所述方法包括如下步骤:检测待测样本中生物标志物的表达水平;
优选地,所述生物标志物为权利要求1所述的生物标志物。
5.根据权利要求4所述的方法,其特征在于,所述方法还包括如下步骤:
(1)对待测样本中的生物标志物进行PCA分析和Kmeans分析;
(2)根据步骤(1)分析得到的PCA结果和tSNE结果,判断iPSC的残留水平;
优选地,所述生物标志物为权利要求1所述的生物标志物。
6.根据权利要求5所述的方法,其特征在于,步骤(1)中所述的样本包括iPSC分化细胞;
优选地,所述的样本包括内皮祖细胞、心肌细胞、内皮细胞、心脏成纤维细胞、神经干细胞、小胶质细胞、间充质干细胞、视网膜色素上皮细胞、肝细胞、造血干细胞、胰岛细胞、红细胞、B淋巴细胞、T淋巴细胞、自然杀伤细胞、嗜中性粒细胞、嗜碱性粒细胞、嗜酸性粒细胞、单核细胞、巨噬细胞;
更优选地,所述的样本包括内皮祖细胞、心肌细胞、胰岛细胞。
7.根据权利要求4-6中任一项所述的方法,其特征在于,步骤(1)中还包括如下步骤:
a.对生物标志物应用线性变换进行缩放;
b.对缩放得到的数据进行PCA分析,得到表达矩阵数据;
c.将样本表达矩阵数据与iPSC单细胞测序分析得到的表达矩阵数据合并取交集得到新的表达矩阵;
d.利用新的表达矩阵的数据进行PCA分析和Kmeans分析,得到PCA结果和tSNE结果;
优选地,所述生物标志物为权利要求1所述的生物标志物;
优选地,步骤b中还包括对缩放得到的数据进行筛选,提取数据中表达生物标志物中的一种或多种的细胞作为疑似iPSC细胞,得到表达矩阵数据;
优选地,所述生物标志物包括LIN28A、ESRG、SOX2、POU5F1、NANOG。
8.一种用于iPSC残留检测的试剂盒,其特征在于,所述试剂盒包括检测生物标志物LIN28A、ESRG、SOX2、POU5F1、NANOG中的一种或多种表达水平的试剂;
优选地,所述试剂包括特异性扩增生物标志物LIN28A、ESRG、SOX2、POU5F1、NANOG中的一种或多种的引物或特异性识别生物标志物LIN28A、ESRG、SOX2、POU5F1、NANOG中的一种或多种的探针;
优选地,所述试剂盒还包括dNTPs、Mg2+离子、DNA聚合酶或包含dNTPs、Mg2+离子、DNA聚合酶的PCR体系。
9.一种iPSC残留的检测系统,其特征在于,所述系统包括检测待测样本中生物标志物LIN28A、ESRG、SOX2、POU5F1、NANOG中的一种或多种表达水平的单元;
优选地,所述系统还包括培养iPSC的单元;
优选地,所述系统还包括iPSC诱导分化单元;
更优选地,所述培养iPSC的单元包括E8完全培养基、Y-27632;
最优选地,所述Y-27632的浓度为10μM;
更优选地,所述检测待测样本中生物标志物LIN28A、ESRG、SOX2、POU5F1、NANOG中的一种或多种表达水平的单元包括权利要求4-7中任一项所述的方法;
最优选地,所述检测待测样本中生物标志物LIN28A、ESRG、SOX2、POU5F1、NANOG中的一种或多种表达水平的单元是根据PCA结果和tSNE结果分析是否含有iPSC残留;
最优选地,若PCA结果和tSNE结果显示iPSC和待测样本单细胞分离数据没有交集,则表明待测样本中没有iPSC残留;若PCA结果和tSNE结果显示iPSC和待测样本单细胞分离数据有交集,则表明待测样本中有iPSC残留。
10.如下任一方面的应用,其特征在于,所述应用包括:
(1)单细胞测序技术在iPSC残留检测中的应用;
(2)权利要求1所述的生物标志物在iPSC残留检测中的应用;
(3)权利要求1所述的生物标志物在制备iPSC残留检测试剂中的应用;
(4)检测权利要求1所述的生物标志物表达水平的试剂在制备iPSC残留检测试剂盒中的应用;
优选地,所述试剂盒为权利要求8所述的试剂盒;
(5)检测权利要求1所述的生物标志物表达水平的试剂在iPSC残留的检测系统中的应用;
优选地,所述iPSC残留的检测系统为权利要求9所述的系统;
(6)权利要求8所述的试剂盒在iPSC残留检测中的应用;
(7)权利要求9所述的系统在iPSC残留检测中的应用;
(8)PCA分析和Kmeans分析在iPSC残留检测中的应用。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110612182.8A CN113355433B (zh) | 2021-06-02 | 2021-06-02 | 一种基于单细胞测序数据分析的iPSC残留检测方法 |
PCT/CN2022/094411 WO2022253022A1 (zh) | 2021-06-02 | 2022-05-23 | 一种基于单细胞测序数据分析的iPSC残留检测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110612182.8A CN113355433B (zh) | 2021-06-02 | 2021-06-02 | 一种基于单细胞测序数据分析的iPSC残留检测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113355433A true CN113355433A (zh) | 2021-09-07 |
CN113355433B CN113355433B (zh) | 2022-07-19 |
Family
ID=77531098
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110612182.8A Active CN113355433B (zh) | 2021-06-02 | 2021-06-02 | 一种基于单细胞测序数据分析的iPSC残留检测方法 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN113355433B (zh) |
WO (1) | WO2022253022A1 (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114150074A (zh) * | 2021-12-20 | 2022-03-08 | 安徽中盛溯源生物科技有限公司 | Tdgf1在人多能干细胞来源功能细胞产品中多能干细胞残留检测中应用 |
WO2022253022A1 (zh) * | 2021-06-02 | 2022-12-08 | 呈诺再生医学科技(珠海横琴新区)有限公司 | 一种基于单细胞测序数据分析的iPSC残留检测方法 |
WO2023118050A1 (en) * | 2021-12-21 | 2023-06-29 | Novo Nordisk A/S | Use of novel markers to detect pluripotent stem cells |
WO2023184528A1 (zh) * | 2022-04-02 | 2023-10-05 | 武汉睿健医药科技有限公司 | 标记物基因在检测多能干细胞残留中的应用、检测方法及试剂盒 |
CN117511954A (zh) * | 2023-12-29 | 2024-02-06 | 湖南家辉生物技术有限公司 | Hcfc1基因突变体、突变体蛋白、试剂、试剂盒及应用 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20180246099A1 (en) * | 2017-02-24 | 2018-08-30 | Trustees Of Boston University | Isolation of human lung progenitors derived from pluripotent stem cells |
US20190390168A1 (en) * | 2016-11-16 | 2019-12-26 | Cynata Therapeutics Limited | Pluripotent stem cell assay |
CN111996241A (zh) * | 2020-08-13 | 2020-11-27 | 北京呈诺医学科技有限公司 | 一种使用ESRG基因作为通用标记基因的iPSC残留检测方法 |
CN112262217A (zh) * | 2018-06-15 | 2021-01-22 | 公立大学法人横滨市立大学 | 未分化细胞检测法 |
WO2021095797A1 (ja) * | 2019-11-15 | 2021-05-20 | 公立大学法人横浜市立大学 | 未分化細胞検出法 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2009057831A1 (ja) * | 2007-10-31 | 2009-05-07 | Kyoto University | 核初期化方法 |
WO2019141878A1 (en) * | 2018-01-22 | 2019-07-25 | Sistemic Scotland Ltd | Cell contamination assay |
US20200397828A1 (en) * | 2019-04-29 | 2020-12-24 | The Broad Institute, Inc. | Atlas of choroid plexus cell types and therapeutic and diagnostic uses thereof |
EP4114927A1 (en) * | 2020-03-02 | 2023-01-11 | Novo Nordisk A/S | Use of pluripotent markers to detect contaminating residual undifferentiated pluripotent stem cells |
CN113355433B (zh) * | 2021-06-02 | 2022-07-19 | 呈诺再生医学科技(珠海横琴新区)有限公司 | 一种基于单细胞测序数据分析的iPSC残留检测方法 |
-
2021
- 2021-06-02 CN CN202110612182.8A patent/CN113355433B/zh active Active
-
2022
- 2022-05-23 WO PCT/CN2022/094411 patent/WO2022253022A1/zh unknown
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20190390168A1 (en) * | 2016-11-16 | 2019-12-26 | Cynata Therapeutics Limited | Pluripotent stem cell assay |
US20180246099A1 (en) * | 2017-02-24 | 2018-08-30 | Trustees Of Boston University | Isolation of human lung progenitors derived from pluripotent stem cells |
CN112262217A (zh) * | 2018-06-15 | 2021-01-22 | 公立大学法人横滨市立大学 | 未分化细胞检测法 |
WO2021095797A1 (ja) * | 2019-11-15 | 2021-05-20 | 公立大学法人横浜市立大学 | 未分化細胞検出法 |
CN111996241A (zh) * | 2020-08-13 | 2020-11-27 | 北京呈诺医学科技有限公司 | 一种使用ESRG基因作为通用标记基因的iPSC残留检测方法 |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2022253022A1 (zh) * | 2021-06-02 | 2022-12-08 | 呈诺再生医学科技(珠海横琴新区)有限公司 | 一种基于单细胞测序数据分析的iPSC残留检测方法 |
CN114150074A (zh) * | 2021-12-20 | 2022-03-08 | 安徽中盛溯源生物科技有限公司 | Tdgf1在人多能干细胞来源功能细胞产品中多能干细胞残留检测中应用 |
WO2023118050A1 (en) * | 2021-12-21 | 2023-06-29 | Novo Nordisk A/S | Use of novel markers to detect pluripotent stem cells |
WO2023184528A1 (zh) * | 2022-04-02 | 2023-10-05 | 武汉睿健医药科技有限公司 | 标记物基因在检测多能干细胞残留中的应用、检测方法及试剂盒 |
CN117511954A (zh) * | 2023-12-29 | 2024-02-06 | 湖南家辉生物技术有限公司 | Hcfc1基因突变体、突变体蛋白、试剂、试剂盒及应用 |
CN117511954B (zh) * | 2023-12-29 | 2024-04-26 | 湖南家辉生物技术有限公司 | Hcfc1基因突变体、突变体蛋白、试剂、试剂盒及应用 |
Also Published As
Publication number | Publication date |
---|---|
WO2022253022A1 (zh) | 2022-12-08 |
CN113355433B (zh) | 2022-07-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113355433B (zh) | 一种基于单细胞测序数据分析的iPSC残留检测方法 | |
US11970714B2 (en) | Method for reprogramming blood to induced pluripotent stem cells | |
US10604770B2 (en) | Method for extracting differentiated cells | |
US20150166964A1 (en) | Systems and methods for producing stem cells and differentiated cells | |
US20190338359A1 (en) | Method for evaluating differentiation state of cells | |
CN106244558B (zh) | 一种人单个核细胞重编程为诱导多能干细胞的方法 | |
US20160222355A1 (en) | Systems and methods for producing stem cells differentiated cells, and genetically edited cells | |
Ackermann et al. | A 3D iPSC-differentiation model identifies interleukin-3 as a regulator of early human hematopoietic specification | |
Tosoni et al. | Functional purification of human and mouse mammary stem cells | |
JP6918062B2 (ja) | 細胞の分化状態を評価する方法 | |
Huang et al. | Isolation and Functional Characterization of Pluripotent Stem Cell–Derived Cardiac Progenitor Cells | |
Sriram et al. | Novel live cell fluorescent probe for human-induced pluripotent stem cells highlights early reprogramming population | |
KR102537361B1 (ko) | 인공 다능성 줄기 세포의 평가 방법 및 선발 방법, 그리고 인공 다능성 줄기 세포의 제조 방법 | |
CN113646424A (zh) | 具有分化成特定细胞的能力的多能干细胞的制造方法及其应用 | |
US20200347452A1 (en) | Method for evaluating state of undifferentiated cell and utilization thereof | |
EP3013941A1 (en) | Improved systems and methods for producing stem cells and differentiated cells | |
WO2023118050A1 (en) | Use of novel markers to detect pluripotent stem cells | |
CN117448457A (zh) | 一种人间充质干细胞分化成脂能力的检测方法 | |
CN118139973A (zh) | 用于使用非人灵长类动物的个体化的基因组组装和诱导性多能干细胞系进行临床前评估的组合物和方法 | |
CN117604113A (zh) | 一种人间充质干细胞分化成骨能力的检测方法 | |
CN116445612A (zh) | 一种诱导多能干细胞的rna标志物及其应用 | |
Salvatori et al. | Maria Gomes Fernandes, Hans Stoop, 2 Jan-Bas Prins, J. Wolter Oosterhuis, 2 Christine Mummery, 4 and Leendert HJ Looijenga 2 | |
CN111718905A (zh) | 人Ⅱ型血小板减少症iPS细胞系及其制备方法与应用 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |