CN116189765B - 一种iPS细胞遗传学风险评估系统及应用 - Google Patents

一种iPS细胞遗传学风险评估系统及应用 Download PDF

Info

Publication number
CN116189765B
CN116189765B CN202310153265.4A CN202310153265A CN116189765B CN 116189765 B CN116189765 B CN 116189765B CN 202310153265 A CN202310153265 A CN 202310153265A CN 116189765 B CN116189765 B CN 116189765B
Authority
CN
China
Prior art keywords
mutation
variation
ips
risk
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202310153265.4A
Other languages
English (en)
Other versions
CN116189765A (zh
Inventor
陈珺
郑慧迎
顾丽朋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Gemple Biotech Co ltd
Original Assignee
Shanghai Gemple Biotech Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Gemple Biotech Co ltd filed Critical Shanghai Gemple Biotech Co ltd
Priority to CN202310153265.4A priority Critical patent/CN116189765B/zh
Publication of CN116189765A publication Critical patent/CN116189765A/zh
Application granted granted Critical
Publication of CN116189765B publication Critical patent/CN116189765B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/40Population genetics; Linkage disequilibrium
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/20Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/30Detection of binding sites or motifs
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/50Mutagenesis
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B50/00ICT programming tools or database systems specially adapted for bioinformatics
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/30ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Medical Informatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Biotechnology (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Biophysics (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Analytical Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Genetics & Genomics (AREA)
  • Chemical & Material Sciences (AREA)
  • Molecular Biology (AREA)
  • Public Health (AREA)
  • Databases & Information Systems (AREA)
  • Ecology (AREA)
  • Bioethics (AREA)
  • Biomedical Technology (AREA)
  • Data Mining & Analysis (AREA)
  • Pathology (AREA)
  • Physiology (AREA)
  • Epidemiology (AREA)
  • Primary Health Care (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Apparatus Associated With Microorganisms And Enzymes (AREA)

Abstract

本发明属于细胞风险评估技术领域,且公开了一种iPS细胞遗传学风险评估系统,其特征在于:所述iPS细胞遗传学风险评估系统有三大部分组成,分别由遗传病风险评估值S1、致瘤性风险评估值S2和获得性变异负荷评估值S3共同组成,综合三者形成细胞遗传学风险指标值F。本发明针对iPS细胞的总体遗传学状态和突变负荷进行快速且标准化的检测系统和评估的方法;对起始的亲本体细胞、不同克隆来源或不同时期的iPS细胞株或衍生细胞进行高深度的外显子组测序及分析,利用评分系统对细胞中存在的与遗传疾病易感性及肿瘤驱动突变风险相关的各类遗传变异进行分级及打分,最终分值构成系统的“关键遗传学风险指标”,用于评估细胞产品制造过程中的质量指标。

Description

一种iPS细胞遗传学风险评估系统及应用
技术领域
本发明属于细胞风险评估技术领域,具体为一种iPS细胞遗传学风险评估系统及应用。
背景技术
诱导性多能干细胞是通过体外遗传或表观遗传修饰的方法,将体细胞重编程而得到的类似胚胎干细胞的一种细胞类型,iPS细胞具有类似于胚胎干细胞的全能性,又无道德伦理争议,而且来源广泛,避免了免疫排斥反应,为整个干细胞生物学领域和临床再生医学提供了新的研究方向;与传统的细胞治疗产品如原代组织细胞、造血干细胞相比,iPS细胞相关产品的制造过程更为复杂,涉及到更多体外操作步骤,更长的体外培养过程,所用细胞的代数更高,因此在制造过程中积累遗传损伤、导致基因组不稳定的风险更高;
当前缺乏一种对iPS细胞中不同类型的遗传变异,包括染色体水平、拷贝数水平和单核苷酸水平的突变进行评价,并对细胞系进行临床使用的遗传学风险进行预测的方法;缺乏一种对iPS细胞系中存在的突变负荷,根据其在染色体不同区域、影响不同的基因、以及变异对基因功能的影响程度,可能导致细胞产品中基因功能变化的程度,进行分级和权重评估的方法;缺乏一种标准化的检验和评估方法,使得不同实验室所获取的不同的iPS细胞系间的遗传学风险得以比较。
发明内容
本发明的目的在于提供一种iPS细胞遗传学风险评估系统及应用,以解决上述背景技术中提出的问题。
为了实现上述目的,本发明提供如下技术方案:一种iPS细胞遗传学风险评估系统,对iPS及/或亲本体细胞的基因组变异进行检测、注释,根据预定的原则对变异进行筛选和打分,形成遗传病风险评估值S1、致瘤性风险评估值S2和获得性变异负荷评估值S3组成,综合三者形成细胞遗传学风险指标值F。根据F的数值,将iPS细胞遗传学风险分级,并进行细胞系间的比较。
进一步地,对iPS和亲本体细胞的基因组变异进行检测和注释包括:收集所需评价的细胞沉淀、核酸提取、进行全外显子组或全基因组的文库构建和高通量测序仪上机测序。采用GATK工具、CNVkit等工具,鉴定出不同类型的基因变异,包括碱基置换突变(singlenucleotidevariant,SNV)、插入/缺失突变(Insertion/Deletion,InDel)和拷贝数变异(copy number variant,CNV)。采用体细胞分析(mutect2)工具,将iPS与亲本体细胞配对分析,鉴定出iPS细胞特有的获得性变异。所得的变异利用各类常见数据库进行人群频率、蛋白功能预测、疾病相关性等信息的注释。
进一步地,筛选iPS细胞检出的所有致病和疑似致病变异,根据相关孟德尔遗传病的不同遗传模式及类型,赋予变异基础分值,相加后获得该细胞系应用时产生的罕见性遗传病风险,命名为遗传病风险评估值S1。针对已经确认潜在应用方向的细胞系,还可建立S1补充的核心基因风险评估Sgene。Sgene的评估不局限于致病或疑似致病变异,而是对特定核心基因列表范围内变异,根据变异类型、人群频率、软件预测与临床报道情况等四个特征要素进行阈值设定和权重分配,计算得出Sgene分值。
进一步地,筛选iPS细胞位于肿瘤风险评估基因组包范围内的所有变异,保留致瘤性变异(oncogenic variant,OV)与疑似致瘤性变异(Likely oncogenic variant,LOV)。结合突变的丰度特征,计算出致瘤性风险评估值S2。
进一步地,对iPS细胞特有而体细胞没有的获得性变异变异,根据基因组位置、突变丰度、普通人群频率、是否同义突变等预设条件进行筛选。剩余的获得性变异,提取突变丰度和正常人群频率两个特征性要素,进行加权赋值,通过使用同批次样本中位值进行归一化,计算获得性变异负荷评估评分S3。
进一步地,细胞遗传学风险指标值F为遗传病风险评估值S1、致瘤性风险评估值S2与获得性变异负荷评估值S3之和。基于F值将风险定为四个等级,F值低于3分被认为是低风险,介于3和6之间为中低风险,分值在6到9之间为中高风险,大于等于9则被认为高风险。通常认为中高风险和高风险等级的iPS细胞存在应用风险。
本发明的有益效果如下:
本发明综合考虑了遗传疾病易感性及肿瘤驱动突变风险相关的iPS细胞变异,以及iPS细胞形成及扩繁过程中积累的获得性变异,采用预定的原则进行分级及打分,最终分值构成系统的“遗传学风险指标”;该发明方法具有较强的可操作性,可以实现不同iPS细胞系间的比较,用于挑选遗传学风险较低的iPS细胞株,也可用于iPS细胞系的遗传学稳定性的动态监控,用于评估细胞产品制造过程中的质量指标。
附图说明
图1为本发明iPS细胞遗传学评估系统流程示意图;
图2为本发明iPS细胞遗传病风险评估值S1的流程示意图;
图3为本发明S1的补充核心基因风险值Sgene的特征性要素分类及对应加权系数;
图4为本发明供体1来源的3例iPS细胞检出的遗传病相关致病与疑似致病变异;
图5为本发明113株iPS的遗传病风险评估值S1分布图;
图6为本发明供体1来源的3例iPS细胞检出的致瘤与疑似致瘤性变异;
图7为本发明获得性变异的特征性要素加权系数;
图8为本发明iPS1细胞的获得性变异数据图;
图9为本发明不同供体或不同代次iPS细胞遗传风险综合指标值F。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
如图1所示,本发明实施例提供了一种iPS细胞遗传学风险评估系统的流程示意图。首先,收集所需评价的iPS和亲本体细胞,进行核酸提取、进行全外显子组或全基因组的文库构建和高通量测序仪上机测序。采用GATK工具,按照标准生信流程,鉴定出各细胞样本中存在的所有基因变异,包括碱基置换突变(SNV)、插入/缺失突变(InDel)。同时使用CNVkit工具,检测iPS细胞样本中存在的≥100kb大小的拷贝数变异(CNV)。采用体细胞分析(mutect2)工具,将iPS与亲本体细胞配对分析,鉴定出iPS细胞特有的获得性变异。进一步地,针对iPS细胞的SNV、InDel和CNV变异进行注释、筛选和打分,计算得到遗传病风险评估值S1、致瘤性风险评估值S2;针对iPS细胞特有的获得性变异进行注释、筛选和打分,计算得到获得性变异负荷评估值S3。最后,遗传学风险指标F为S1、S2和S3之和,基于F值将风险定为四个等级:低、中低、中高和高风险。该遗传学风险指标值可用于iPS细胞应用时产生疾病/肿瘤及遗传学不稳定等不利情况风险的参考。
具体实施例1在本发明一优选实施例中,对于遗传病风险评估值S1及其补充Sgene的计算方法进行完整地描述。
其中,所筛选的iPS细胞的遗传病相关变异的预设原则为:在OMIM遗传病数据库、国际临床基因组资源库(ClinGen,https://www.clinicalgenome.org/)及基因管理联盟库(https://search.thegencc.org/statistics)基础上,经过人工审核,优选3455个基因与疾病关系明确的遗传病致病基因,对这些基因上突变丰度≥20%的变异位点进行评估。
如图2所示,提供了遗传病风险评估值S1的示意图。首先,依据2015年美国医学遗传学与基因组学学会(The American College of Medical Genetics and Genomics,ACMG)发布的序列变异解读指南,对变异进行致病性的评估,仅保留疑似致病或致病的变异位点。然后,根据不同的遗传模式及类型,根据以下的逻辑对检出的每个致病或疑似致病位点赋基础分值:1)检出的疑似致病或致病性拷贝数变异(≥100kb),基础分值ai为8;2)若检出的疑似致病变异与致病变异为点突变或小片段的插入缺失,且若为纯合或半合变异,基础分值ai为5;如果检测的变异为杂合但相关遗传疾病仅为显性遗传,则基础分值ai也为5;若杂合变异相关的疾病既存在显性遗传,也有隐性遗传,则变异基础分值ai为3;若检出的变异仅为隐性遗传,则进一步评估该基因是否存在另一疑似致病或致病变异位点,存在情况下基础分值为ai为2.5,不存在则为1。一些肿瘤存在家族遗传性,是由胚系突变导致,这些基因突变会导致个体罹患肿瘤的风险显著增加,这些基因被称为肿瘤易感基因,比如著名的乳腺癌易感基因BRCA1/2。我们基于国内外指南,建立了58个肿瘤易感基因,其突变往往导致多种系统肿瘤风险增加,因此,这些基因上检出的疑似致病或致病变异位点基础分值在原来的基础上加1。按照以下方法,将iPS细胞检出的所有致病和疑似致病变异分值相加即为遗传病风险评估值S1=a1+a2+a3+…+ai。此外,若iPS细胞在临床研究存在应用方向,也可建立核心基因组合,在原有S1的基础上,增加核心基因变异致病风险评估,提高特定基因范围内变异评分的权重。比如,所评估的iPS细胞未来要进行癫痫的研究应用,则可建立癫痫基因列表,对这些基因上的变异进行核心基因致病风险评估,则该样本的遗传病风险评估分值S1=S1+Sgene
Sgene的评估不局限于致病或疑似致病变异,而是对特定核心基因列表范围内的变异,根据变异类型、人群频率、软件预测与临床报道情况等四个特征要素进行阈值设定和权重分配。其中,Sgene的变异只考虑外显子以及±10bp区域内的变异,但不包括正常人群(参考gnomAD全外显子数据库)频率>1%的变异;不包括在gnomAD数据库有纯合或半合子收录的变异;不包括在ClinVar数据库中有良性或疑似良性收录的变异;不包括非经典剪接变异以及同义突变;不包括已经明确定级为疑似致病或致病的变异。不包括突变丰度在20%以下的变异;不包括覆盖深度在10以下的变异。
如图3所示,为Sgene的特征性要素分类及对应加权系数。计算致病风险值Sgene=Sum(m1*n1*g1*k1+m2*n2*g2*k2+…+mj*nj*gj*kj)/Median。其中,mj、nj、gj和kj分别变异j对应的四个特征要素的加权系数;Median为一批次数据样本中位值。
14如图4所示,为供体1来源的3例iPS细胞检出的遗传病相关致病与疑似致病变异。根据图4结果,所评估的3例iPS细胞均在SLC12A3基因上检出了c.2029G>A(p.Val677Met)杂合变异,该基因的第2029号核苷酸由G突变为A,导致编码的第1677号氨基酸由缬氨酸转变为甲硫氨酸,此变异已在多名Gitelman综合征患者中报道,根据ACMG指南,此变异可判为致病变异。SLC12A3基因突变与Gitelman综合征相关,本病是一种常染色体隐性遗传的远曲小管重吸收功能障碍,故该位点符合杂合变异且相关疾病为隐性遗传且该基因未见其他候选位点,又该基因不属于肿瘤易感基因,因此其基础分值a1=1。iPS2与iPS3细胞均只检出此位点,故两细胞遗传病风险评估值S1=a1=1。iPS1细胞除了此位点,还在DMD基因检出c.3850G>T(p.Glu1284Ter)杂合变异,该变异导致编码的谷氨酸转变为终止密码子,根据ACMG指南,此变异为致病变异。DMD基因突变与Duchenne肌营养不良以及Becker肌营养不良疾病相关,两疾病为X连锁隐性遗传,而该基因突变的部分女性杂合子会在成年期有扩张型心肌病表现,符合X连锁显性遗传,故该变异符合杂合变异但相关的疾病为隐性或显性遗传,基础分值a2=3分,因此iPS1细胞的遗传病风险评估值S1=a1+a2=4。
如图4所示,按照上述方法,我们对113株iPS细胞进行遗传病风险评估,每个iPS平均检出2.87个致病和/或疑似致病变异,iPS细胞的S1中位值为3。
具体实施例2在本发明一优选实施例中,对于致瘤性风险评估值S2的计算方法进行完整地描述。
iPS细胞的致瘤性风险是应用评估的重中之重。现有的研究已经证明,肿瘤驱动变异是肿瘤发生的核心因素,而iPS细胞中的肿瘤驱动变异可能来自于建系和长期培养过程中。参考肿瘤研究中亚克隆进化的思路,对于肿瘤风险评分中保留的变异,在同一iPS细胞株经不同体外培养时间所得的不同代次的细胞样本中进行时序分析。如果培养代次靠后的细胞中,肿瘤驱动变异的丰度继续增加,则提示携带该驱动变异的亚克隆可能存在生长竞争优势,存在较大的安全性风险。
其中,S2计算的优选实施例中,我们建立了用于肿瘤风险评估的核心基因组包,该检测包考虑了FDA已批准的肿瘤伴随诊断panel基因、COSMIC数据库(Catalog of somaticmutations in cancer)中The Cancer Gene Census(CGC)归类为Tier 1基因,并在此基础上进行人工审核和优化,最终包含612个肿瘤相关基因。
保留肿瘤风险评估的核心基因组包范围内且突变丰度>5%的变异,对其进行临床意义分级评估,仅保留致瘤性变异(oncogenic variant,OV)与疑似致瘤性变异(Likelyoncogenic variant,LOV)。根据不同的临床意义分类给予不同基础分值b:若为OV,bk为3;若为LOV变异,则bk为2。
然后,基于每个变异的突变丰度赋予不同的加权系数:突变丰度介于5%-20%,xk为1;突变丰度介于20%-50%间,xk为1.5,突变丰度≥50%;xk为2。每个变异的分值ck=xk*bk,最终致瘤性风险评估值S2=c1+c2+…+ck
如图6所示,以供体1来源的3例iPS细胞数据为例,iPS1与iPS2细胞在612个肿瘤相关基因未检出致瘤性变异与疑似致瘤性变异,因此两细胞的S2均为0。iPS3细胞则在TGFBR2基因检出c.449dupA(p.Pro154Alafs)变异,根据oncoKB及COSMIC数据库显示,TGFBR2基因为抑癌基因,已在包括结肠癌、子宫内膜癌等多个癌种中报告了该基因的变异。根据临床意义分级指南,此变异为疑似致瘤性变异,因此变异分值b1=2,此变异在iPS3细胞检出的突变丰度为16%,因此其系数x1=1,最终,iPS3样本的致瘤性风险评估值S2=c1=x1*b1=2。经对113例iPS细胞系进行统计,约28.9%(33/113)的iPS细胞至少存在1个OV或LOV变异。
具体实施例3在本发明一优选实施例中,对于获得性变异负荷评估值S3的计算方法进行完整地描述。
获得性变异负荷(Acquired Mutations Burden,AMB)评分的前提是对原始亲本体细胞和iPS细胞的变异配对分析。采用体细胞分析(mutect2)工具,参考肿瘤体细胞突变的分析方法,鉴定出iPS细胞系中存在(突变丰度不为0)、而原始亲本体细胞中不存在(突变丰度为0)的变异,即定义为iPS细胞获得性变异。对位于基因编码区以及外显子/内含子±10bp内的、突变丰度>5%的且普通人群频率<5%(普通人群频率依据参考gnomAD外显子数据库)的非同义变异进行获得突变负荷评分。
根据经验和现有领域对于变异严重性的理解,提取了变异的2个特征性要素:变异在iPS细胞中的突变丰度与变异在正常人群中存在的频率,并对两要素进行了阈值设定和权重分配,同时通过使用同批次样本中位值进行归一化,获得性变异负荷评估值S3=Sum(p1*q1+p2*q2+p3*q3+…+pm*qm)/Median。其中,pm表示变异m基于特征要素1(突变丰度)对应的加权系数;qm则表示变异m基于特征要素2(正常人群频率)对应的加权系数;Median为一批次数据样本S3的中位值。
如图7所示,为获得性变异负荷突变的特征性要素分类及加权系数。
如图8所示的一个实施例中,供体1来源的iPS1细胞共筛选出75个获得性变异位点,根据图7所示的pm及qm加权系数,计算每个变异的分值,相加即为原始的iPS1的获得性变异负荷评估值为139.5。同批的113个iPS细胞原始获得性变异负荷的中位值Median为111.5,因此iPS1细胞的获得性变异负荷评估值S3=139.5/111.5=1.25。
具体实施例4在本发明一优选实施例中,对于遗传风险综合指标值F的计算方法和风险评级进行完整地描述。
遗传病风险评估值S1、致瘤性风险评估值S2与获得性变异负荷评估值S3之和即为遗传风险综合指标值F,F值越大,风险值越高。基于113例iPS细胞的F值及实验室内部其他评估数据,将风险定为四个等级,F值低于3分被认为是低风险,介于3和6之间为中低风险,分值在6到9之间为中高风险,大于等于9则被认为高风险。中高风险和高风险等级的iPS细胞存在较大的应用风险。
供体1来源的iPS1细胞的F值=S1+S2+S3=4+0+1.25=5.25,风险评级为中低风险。
如图9所示,对113株iPS细胞系进行细胞遗传学风险评估,基于遗传学风险指标值F,发现约47.4%(54/113)的iPS细胞为高风险或中高风险。同一供体来源的不同iPS细胞系中,风险评级可能不同。约34.2%(13/38)的同一供体的不同代次细胞间,风险等级出现明显变化,其中有5组iPS细胞,随着培养代次增加,风险等级出现由低风险或中低风险转变为高风险或中高风险。以上数据提示,本系统可以为不同来源的细胞系、同一供体的不同细胞株、及同一细胞株不同代次的遗传学风险评估提供参考。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。
尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。

Claims (4)

1.一种iPS细胞遗传学风险评估系统,其特征在于:所述iPS细胞遗传学风险评估系统由三大部分组成,分别由遗传病风险评估值S1、致瘤性风险评估值S2和获得性变异负荷评估值S3共同组成,综合形成细胞遗传学风险指标值F,所述遗传学风险指标F为S1、S2和S3之和;
所述遗传病风险评估值S1的计算方法为:
对变异进行致病性的评估,仅保留疑似致病或致病的变异位点,根据不同的遗传模式及类型,根据以下的逻辑对检出的每个致病或疑似致病位点赋基础分值:
1)检出的疑似致病或致病性拷贝数变异,基础分值ai为8;
2)若检出的疑似致病变异与致病变异为点突变或小片段的插入缺失,且若为纯合或半合变异,基础分值ai为5;如果检测的变异为杂合但相关遗传疾病仅为显性遗传,则基础分值ai也为5;若杂合变异相关的疾病既存在显性遗传,也有隐性遗传,则变异基础分值ai为3;若检出的变异仅为隐性遗传,则进一步评估基因是否存在另一疑似致病或致病变异位点,存在情况下基础分值为ai为2.5,不存在则为1;建立58个肿瘤易感基因,在所述58个肿瘤易感基因上检出的疑似致病或致病变异位点基础分值在原来的基础上加1;
致瘤性风险评估值S2的计算方法为:
建立用于肿瘤风险评估的核心基因组包,所述核心基因组包考虑了FDA已批准的肿瘤伴随诊断panel基因、COSMIC数据库中The Cancer Gene Census 归类为Tier 1的基因,并在此基础上进行人工审核和优化,最终包含612个肿瘤相关基因;
保留所述核心基因组包范围内突变丰度>5%的变异,对其进行临床意义分级评估,仅保留致瘤性变异OV与疑似致瘤性变异LOV,根据不同的临床意义分类给予不同基础分值b:若为OV,bk为3;若为LOV变异,则bk为2;
然后,基于每个变异的突变丰度赋予不同的加权系数:突变丰度介于5%-20%,xk为1;突变丰度介于20%-50%间,xk为1.5,突变丰度≥50%;xk为2;每个变异的分值ck=xk*bk,最终致瘤性风险评估值S2=c1+c2+…+ck
所述获得性变异负荷评估值S3的计算方法为:
获得性变异负荷评分的前提是对原始亲本体细胞和iPS细胞的变异配对分析,鉴定出iPS细胞系中存在、而原始亲本体细胞中不存在的变异,即定义为iPS细胞获得性变异,对位于基因编码区以及外显子/内含子±10bp内的、突变丰度>5%的且普通人群频率<5%的非同义变异进行获得突变负荷评分;
提取变异的2个特征性要素:变异在iPS细胞中的突变丰度与变异在正常人群中存在的频率,并对两要素进行了阈值设定和权重分配, 同时通过使用同批次样本中位值进行归一化,获得性变异负荷评估值S3=Sum(p1*q1+p2*q2+p3*q3+…+pm*qm)/Median;其中,pm表示变异m基于特征要素1对应的加权系数;qm则表示变异m基于特征要素2对应的加权系数;Median为一批次数据样本S3的中位值。
2.根据权利要求1所述的一种iPS细胞遗传学风险评估系统,其特征在于:所述遗传病风险评估分值S1=S1+Sgene,所述iPS细胞在临床研究存在应用方向,建立核心基因组合,在原有S1的基础上,增加核心基因变异致病风险评估Sgene,提高特定基因范围内变异评分的权重,所述Sgene的特征性要素分类及对应加权系数,计算致病风险值Sgene= Sum(m1*n1*g1*k1+m2*n2*g2*k2+…+mj*nj*gj*kj)/Median,其中,mj、nj、gj和kj分别变异j对应的变异类型、人群频率、软件预测与临床报道情况等四个特征要素的加权系数;Median为一批次数据样本中位值。
3.根据权利要求1所述的一种iPS细胞遗传学风险评估系统,其特征在于,基于F值将风险定为四个等级:低、中低、中高和高风险,该遗传学风险指标值可用于iPS细胞应用时产生疾病/肿瘤及遗传学不稳定风险的参考,F值低于3分被认为是低风险,介于3和6之间为中低风险,分值在6到9之间为中高风险,大于等于9则被认为高风险。
4.根据权利要求1所述的一种iPS细胞遗传学风险评估系统,其特征在于:在同一iPS细胞株经不同体外培养时间所得的不同代次的细胞样本中进行时序分析,如果培养代次靠后的细胞中,肿瘤驱动变异的丰度继续增加,则提示携带该驱动变异的亚克隆可能存在生长竞争优势,存在较大的安全性风险。
CN202310153265.4A 2023-02-23 2023-02-23 一种iPS细胞遗传学风险评估系统及应用 Active CN116189765B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310153265.4A CN116189765B (zh) 2023-02-23 2023-02-23 一种iPS细胞遗传学风险评估系统及应用

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310153265.4A CN116189765B (zh) 2023-02-23 2023-02-23 一种iPS细胞遗传学风险评估系统及应用

Publications (2)

Publication Number Publication Date
CN116189765A CN116189765A (zh) 2023-05-30
CN116189765B true CN116189765B (zh) 2023-08-15

Family

ID=86432373

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310153265.4A Active CN116189765B (zh) 2023-02-23 2023-02-23 一种iPS细胞遗传学风险评估系统及应用

Country Status (1)

Country Link
CN (1) CN116189765B (zh)

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010132788A2 (en) * 2009-05-15 2010-11-18 The Board Of Regents Of The University Of Texas System Assay for mutations in stem cells and their derivatives
CN105263963A (zh) * 2013-05-30 2016-01-20 瑞泽恩制药公司 伴pcsk9功能获得性突变的常染色体显性高胆固醇血症的治疗方法
WO2016171625A1 (en) * 2015-04-22 2016-10-27 National University Of Singapore Targeting telomerase for cell therapy
CN108707670A (zh) * 2018-06-11 2018-10-26 北京大学人民医院 一种在b-all患者中有预后评估意义的标记物
CN110114470A (zh) * 2016-12-27 2019-08-09 住友化学株式会社 诱导的多能性干细胞的评价方法及选择方法、以及诱导的多能性干细胞的制备方法
WO2020218554A1 (ja) * 2019-04-26 2020-10-29 bitBiome株式会社 デジタル体細胞変異解析
WO2021052503A1 (zh) * 2019-09-20 2021-03-25 北京干细胞与再生医学研究院 一种多能干细胞、药物组合物及其制备方法与用途
CN112687330A (zh) * 2020-12-29 2021-04-20 北京易奇科技有限公司 一种乳腺癌患者携带胚系致病变异的风险预测系统
WO2021133724A1 (en) * 2019-12-23 2021-07-01 The Board Of Trustees Of The Leland Stanford Junior University Genetically corrected cells for therapeutic use
CN113631719A (zh) * 2018-11-29 2021-11-09 美国杰龙生物医药公司 治疗骨髓增生异常综合征的方法
KR102427600B1 (ko) * 2021-12-14 2022-08-01 주식회사 테라젠바이오 줄기세포의 배양적응성을 판단하기 위한 체세포 변이를 선별하는 방법

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2789774C (en) * 2010-02-17 2024-01-23 Biotime Inc. Methods for telomere length and genomic dna quality control analysis in pluripotent stem cells

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010132788A2 (en) * 2009-05-15 2010-11-18 The Board Of Regents Of The University Of Texas System Assay for mutations in stem cells and their derivatives
CN105263963A (zh) * 2013-05-30 2016-01-20 瑞泽恩制药公司 伴pcsk9功能获得性突变的常染色体显性高胆固醇血症的治疗方法
WO2016171625A1 (en) * 2015-04-22 2016-10-27 National University Of Singapore Targeting telomerase for cell therapy
CN110114470A (zh) * 2016-12-27 2019-08-09 住友化学株式会社 诱导的多能性干细胞的评价方法及选择方法、以及诱导的多能性干细胞的制备方法
CN108707670A (zh) * 2018-06-11 2018-10-26 北京大学人民医院 一种在b-all患者中有预后评估意义的标记物
CN113631719A (zh) * 2018-11-29 2021-11-09 美国杰龙生物医药公司 治疗骨髓增生异常综合征的方法
WO2020218554A1 (ja) * 2019-04-26 2020-10-29 bitBiome株式会社 デジタル体細胞変異解析
WO2021052503A1 (zh) * 2019-09-20 2021-03-25 北京干细胞与再生医学研究院 一种多能干细胞、药物组合物及其制备方法与用途
WO2021133724A1 (en) * 2019-12-23 2021-07-01 The Board Of Trustees Of The Leland Stanford Junior University Genetically corrected cells for therapeutic use
CN112687330A (zh) * 2020-12-29 2021-04-20 北京易奇科技有限公司 一种乳腺癌患者携带胚系致病变异的风险预测系统
KR102427600B1 (ko) * 2021-12-14 2022-08-01 주식회사 테라젠바이오 줄기세포의 배양적응성을 판단하기 위한 체세포 변이를 선별하는 방법

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
诱导重编程过程中的表观遗传重塑;陈珺等;生物化学与生物物理进展;第42卷(第11期);1054-1062 *

Also Published As

Publication number Publication date
CN116189765A (zh) 2023-05-30

Similar Documents

Publication Publication Date Title
Brown et al. Finding driver mutations in cancer: Elucidating the role of background mutational processes
US20220010385A1 (en) Methods for detecting inactivation of the homologous recombination pathway (brca1/2) in human tumors
Dong et al. Accurate identification of single-nucleotide variants in whole-genome-amplified single cells
Carmi et al. Sequencing an Ashkenazi reference panel supports population-targeted personal genomics and illuminates Jewish and European origins
Jiang et al. CODEX2: full-spectrum copy number variation detection by high-throughput DNA sequencing
Lord et al. Splicing in the diagnosis of rare disease: advances and challenges
Fan et al. Non-invasive prenatal measurement of the fetal genome
Michaelson et al. Whole-genome sequencing in autism identifies hot spots for de novo germline mutation
King et al. Detection of structural mosaicism from targeted and whole-genome sequencing data
Foley et al. Use of whole genome sequencing for diagnosis and discovery in the cancer genetics clinic
Moghadasi et al. Classification and clinical management of variants of uncertain significance in high penetrance cancer predisposition genes
Romasko et al. Utility and limitations of exome sequencing in the molecular diagnosis of pediatric inherited platelet disorders
Beal et al. Whole genome sequencing for quantifying germline mutation frequency in humans and model species: cautious optimism
Nagashima et al. Optimizing an ion semiconductor sequencing data analysis method to identify somatic mutations in the genomes of cancer cells in clinical tissue samples
Peng et al. Identifying the tissues-of-origin of circulating cell-free DNAs is a promising way in noninvasive diagnostics
Zanders et al. Detection of heterozygous mutations in the genome of mismatch repair defective diploid yeast using a Bayesian approach
López-Cortegano et al. De novo mutation rate variation and its determinants in Chlamydomonas
Valsesia et al. Identification and validation of copy number variants using SNP genotyping arrays from a large clinical cohort
Gallon et al. Constitutional microsatellite instability, genotype, and phenotype correlations in constitutional mismatch repair deficiency
Rooney et al. Performance characteristics of next-generation sequencing for the detection of antimicrobial resistance determinants in Escherichia coli genomes and metagenomes
Dehghannasiri et al. Unsupervised reference-free inference reveals unrecognized regulated transcriptomic complexity in human single cells
Tanudisastro et al. Sequencing and characterizing short tandem repeats in the human genome
Zhu et al. Extremely rare polymorphisms in Saccharomyces cerevisiae allow inference of the mutational spectrum
CN116189765B (zh) 一种iPS细胞遗传学风险评估系统及应用
Ferrarini et al. The use of non-variant sites to improve the clinical assessment of whole-genome sequence data

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant