CN115064210A - 一种鉴定二倍体胚胎细胞中染色体交叉互换位置的方法及应用 - Google Patents

一种鉴定二倍体胚胎细胞中染色体交叉互换位置的方法及应用 Download PDF

Info

Publication number
CN115064210A
CN115064210A CN202210888080.3A CN202210888080A CN115064210A CN 115064210 A CN115064210 A CN 115064210A CN 202210888080 A CN202210888080 A CN 202210888080A CN 115064210 A CN115064210 A CN 115064210A
Authority
CN
China
Prior art keywords
state
probability
haplotype
sites
parent
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202210888080.3A
Other languages
English (en)
Other versions
CN115064210B (zh
Inventor
乔杰
严智强
宋石
闫丽盈
张春梅
孔菲
朱小辉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Peking University Third Hospital Peking University Third Clinical Medical College
Original Assignee
Peking University Third Hospital Peking University Third Clinical Medical College
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Peking University Third Hospital Peking University Third Clinical Medical College filed Critical Peking University Third Hospital Peking University Third Clinical Medical College
Priority to CN202210888080.3A priority Critical patent/CN115064210B/zh
Publication of CN115064210A publication Critical patent/CN115064210A/zh
Application granted granted Critical
Publication of CN115064210B publication Critical patent/CN115064210B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/30Detection of binding sites or motifs
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/20Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/50Mutagenesis

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Chemical & Material Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Genetics & Genomics (AREA)
  • Analytical Chemistry (AREA)
  • Molecular Biology (AREA)
  • Biotechnology (AREA)
  • Organic Chemistry (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Medical Informatics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • Microbiology (AREA)
  • Immunology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明涉及一种鉴定二倍体胚胎细胞中染色体交叉互换位置的方法,所述方法首先计算同一对夫妇所有胚胎的基因型,但是仅挑选在所有胚胎中扩增度均较高的区域中的基因型位点,并从中挑选出可用于区分父母源的SNP位点。并通过孟德尔遗传定律,得到每个胚胎的单体型,由于挑选高扩增区域位点,得到的基因型和单体型更加准确,进一步通过隐马尔可夫模型精炼胚胎的单体型,提高所鉴定的二倍体胚胎细胞单体型的准确性。

Description

一种鉴定二倍体胚胎细胞中染色体交叉互换位置的方法及 应用
技术领域
本发明涉及遗传学检测领域,更为具体的,本发明涉及一种鉴定二倍体胚胎细胞中染色体交叉互换位置的方法及应用。
背景技术
在胚胎着床前遗传学检测(Preimplantation genetic testing,PGT)过程中,一般使用单体型进行连锁分析诊断胚胎是否携带致病突变,但是染色体交叉互换会极大影响单体型诊断的准确性,造成错误诊断。因此,鉴定胚胎中染色体交叉互换位置,对于准确诊断十分重要。然而目前没有一个较好的鉴定二倍体胚胎中染色体交叉互换位置的方法。本发明的目的是开发一种通过二代测序数据,鉴定二倍体胚胎中染色体交叉互换位置的计算方法。
基本方法是首先得到少量活检胚胎细胞并扩增DNA,而后对扩增后DNA进行测序,得到二代测序数据。之后通过二代测序数据得到每个胚胎的基因型。通过孟德尔遗传定律,得到每个胚胎的初始单体型,而后通过不同胚胎的单体型的相互比较,结合隐马尔可夫模型,得到每个胚胎中的父母源染色体交叉互换位置。
对于二倍体的胚胎细胞,在鉴定其中的染色体交叉互换之前,需要先确定胚胎的基因型并进一步确定胚胎的父源及母源单体型,而后才能进行交叉互换位置的计算。由于在实际诊断过程中,胚胎活检所得细胞量十分稀少,往往只有3-5个细胞,需要先进行单细胞DNA扩增得到扩增后DNA,而后进行建库测序,得到胚胎基因型。之后才可以通过基因型得到单体型,并通过单体型计算染色体交叉互换位置。在二倍体胚胎细胞DNA扩增过程中,由于目前单细胞DNA扩增方法的限制,会导致二倍体的染色体在基因组中的随机位置,其中一方染色体序列扩增失败,只有另一方染色体序列扩增成功,从而导致得到的二倍体胚胎基因型包含大量序列错误,对后续鉴定交叉互换位置造成极大影响。这种现象称之为“脱扣”。例如,胚胎在某个位置的基因型为“AT”,但是经过扩增后,只有“A”碱基扩增成功而另一方的“T”碱基扩增失败,导致得到的基因型为“AA”,从而对后续构建单体型并进一步计算交叉互换位置造成极大干扰。
单倍体的精子和卵细胞由于只有一方的染色体,在DNA扩增过程中,不存在扩增“脱扣”现象,因此基因型鉴定相对二倍体更加准确,无需矫正由于“脱扣”造成的错误。这导致鉴定单倍体精子和卵细胞中染色体交叉互换位置的方法无法直接应用于二倍体的胚胎细胞。目前鉴定单倍体生殖细胞中染色体交叉互换位置的方法主要存在两个缺陷:一是由于不涉及DNA扩增“脱扣”现象,没有涉及处理扩增后碱基错误的方面;二是该方法只适用于鉴定单倍体生殖细胞中染色体的交叉互换位置,无法直接应用于二倍体的胚胎细胞。因此,迫切需要开发一种可准确鉴定二倍体胚胎细胞中染色体交叉互换位置的方法。
发明内容
为了克服现有技术中存在的障碍,本发明提供一种鉴定二倍体胚胎细胞中染色体交叉互换位置的方法及其应用,具体的,本发明提供如下的技术方案:
本发明的第一个方面,提供一种鉴定二倍体胚胎细胞中染色体交叉互换位置的方法,所述方法包括如下步骤:
(1)将胚胎活检细胞、丈夫gDNA、妻子gDNA、患儿gDNA进行单细胞DNA扩增;
(2)将扩增后的DNA进行建库及二代测序,得到每个样本的二代测序reads数据;
(3)所得测序reads,去除接头序列、低质量碱基后,比对至人类参考基因组,得到唯一比对的去重复后reads,并鉴定染色体每个位置的基因型;
(4)对于该家系所有测序样本,进行如下过滤,得到更加准确的基因型:(a)仅保留父源或母源为杂合的基因型位点,但是不要求父源或母源同时为杂合;(b)由于MALBAC扩增方式在基因组中不同区域具有非均一性,但是在不同样本的同一区域具有重复性,因此进一步保留>1/2样本中有覆盖的位点,这些位点相对于未过滤位点,具有更高的基因分型准确性;(c)对于每个样本中的基因型,仅保留覆盖度大于5的位点,其他位点转换为NA。经过该过滤条件,可以很好地提高所得基因型的准确性。
(5)对于过滤后所得基因型,使用孟德尔分离定律,对子代样本(包括先证儿、所有胚胎)所有位点进行定相(phase),将每个基因型的碱基区分为父源来源和母源来源。至此,每个子代的所有基因型被分为了两份,一份为父源单体型,一份为母源单体型。
(6)得到子代父源及母源单体型后,对于每一个特定的子代样本i,首先确定父源单体型上的交叉互换位置,具体为:
(a)将子代i的父源单体型作为参照(下述观测矩阵第1列),同所有其他子代的父源单体型进行比较,碱基相同标记为1,碱基不同标记为0,得到mn的矩阵,其中m表示子代i所有测定所得单体型位点,n表示子代样本个数。得到如下的观测矩阵:
Figure 106472DEST_PATH_IMAGE001
(b)对于矩阵的每一列j(2≤j≤n),使用隐马尔可夫模型,推断每个位点k(1≤k≤ m)的真实状态(0或1)。具体地,对于每一个位点的转移概率
Figure 695717DEST_PATH_IMAGE002
,规定如下:
Figure 944295DEST_PATH_IMAGE003
即上一状态为1且下一状态也为1(或上一状态为0且下一状态为0)的概率为0.9999,上一状态为1而下一状态为0(或上一状态为0而下一状态为1)的概率为0.0001。
(c)对于染色体上每一个位点k的观测概率定为
Figure 605084DEST_PATH_IMAGE004
,即在真实状态为S (State)的情况下,得到观测状态O(Observation)的概率。观测概率矩阵为:
Figure 622718DEST_PATH_IMAGE005
即在真实状态为1的状态下观测到1(或真实状态为0观测到0)的概率为0.9。在真实状态为1的状态下观测到0(或真实状态为0观测到1)的概率为0.1。
(d)初始状态概率矩阵为:
Figure 710760DEST_PATH_IMAGE006
即初始情况下,真实状态为1的概率P(S=1)=0.5,真实状态为0的概率P(S=0)=0.5。
(e)通过以上概率矩阵及隐马尔可夫模型,得到每一列j的最大似然估计计算公式为:
Figure 977793DEST_PATH_IMAGE007
(f)通过Viterbi动态规划算法,得到最大概率所对应的真实状态。
对于该家系,矫正后所得的真实状态矩阵为:
Figure 379956DEST_PATH_IMAGE008
(g)对于矩阵每一列,显示所有样本均在k(此处示例为k=3)位置状态发生了转换,从连续的1转为0,或从连续的0转为1,表明实际上是位于最左侧的样本i在k位置发生了交叉互换。最后,对结果进行可视化展示。
在一种实施方式中,进一步包括使用相同的方式确定母源单体型上的交叉互换位置。
在一种实施方式中,所述步骤(1)使用MALBAC方法进行单细胞DNA扩增。
在一种实施方式中,所述步骤(3)为所得测序reads,使用trim_galore去除接头序列、低质量碱基。保留长度大于36bp的测序reads。处理后reads使用bwa默认参数比对至人类参考基因组。进一步去除低比对质量序列和PCR重复序列,得到唯一比对的去重复后reads。过滤后的比对reads使用GATK best practice鉴定染色体每个位置的基因型。
本发明相对于现有技术获得了如下突出的进步:
1. 提高所鉴定的二倍体胚胎细胞基因型的准确性,从而使用更加准确的基因型构建更加准确的单体型:首先计算同一对夫妇所有胚胎的基因型,但是仅挑选在所有胚胎中扩增度均较高的区域中的基因型位点,并从中挑选出可用于区分父母源的SNP位点。并通过孟德尔遗传定律,得到每个胚胎的单体型,由于挑选高扩增区域位点,得到的基因型和单体型更加准确;
2. 使用所得原始单体型,依据本发明所述方法构建隐马尔可夫模型,矫正原始单体型,得到更加准确的矫正后单体型,并计算二倍体胚胎中父源和母源染色体上的交叉互换位置,准确获得胚胎中父源和母源染色体的来源,用于后续胚胎突变位点诊断:通过得到的单体型,将同一夫妇所得胚胎的父源单体型相互比较,并使用所述模型矫正由于实验过程所引入的错误,鉴定每个胚胎中父源染色体上的交叉互换位置。并将所有胚胎的母源单体型相互比较,同样使用所述模型矫正由于实验过程所引入的错误,鉴定每个胚胎中母源染色体上的交叉互换位置。从而得到二倍体胚胎中父源及母源染色体上的交叉互换位置。最后使用矫正后单体型,结合交叉互换位置,诊断胚胎是否携带父源或母源突变染色体。
附图说明
附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。在附图中:
图1为实施例2中每个子代样本父源染色体最大概率所对应的真实状态(State)单体型图;
图2为实施例2中每个子代样本母源染色体最大概率真实状态(State)单体型图;
图3为实施例2中Sanger测序结果;
图4为移植后22周羊水检测结果。
具体实施方式
以下结合附图对本发明的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本发明,并不用于限定本发明。
实施例1 鉴定染色体交叉互换位置方法的构建
该方法目的为鉴定PGT家系所得子代(包括先证患儿和胚胎)的染色体交叉互换位置,从而可根据交叉互换位置和单体型应用于临床胚胎诊断,所需样本包括夫妇双方、子代(胚胎和/或先证患儿)样本。
活检获得囊胚外滋养层细胞。提取丈夫、妻子、患儿的基因组gDNA。将胚胎活检细胞、丈夫gDNA、妻子gDNA、患儿gDNA均使用MALBAC方法进行单细胞DNA扩增。
将扩增后的DNA使用MALBAC进行二代测序建库,获得足够量的测序文库,使用illumina测序仪进行双端150bp测序,平均每个样本测序深度为3×。得到每个样本的二代测序reads数据。
所得测序reads,使用trim_galore去除接头序列、低质量碱基。保留长度大于36bp的测序reads。处理后reads使用bwa默认参数比对至人类参考基因组。进一步去除低比对质量序列和PCR重复序列,得到唯一比对的去重复后reads。过滤后的比对reads使用GATKbest practice鉴定染色体每个位置的基因型。
对于该家系所有测序样本,进行如下过滤,得到更加准确的基因型:(1)仅保留父源或母源为杂合的基因型位点,但是不要求父源或母源同时为杂合;(2)由于MALBAC扩增方式在基因组中不同区域具有非均一性,但是在不同样本的同一区域具有重复性,因此进一步保留>1/2样本中有覆盖的位点,这些位点相对于未过滤位点,具有更高的基因分型准确性;(3)对于每个样本中的基因型,仅保留覆盖度大于5的位点,其他位点转换为NA。经过该过滤条件,可以很好地提高所得基因型的准确性。
对于过滤后所得基因型,使用孟德尔分离定律,对子代样本(包括先证儿、所有胚胎)所有位点进行定相(phase),将每个基因型的碱基区分为父源来源和母源来源。至此,每个子代的所有基因型被分为了两份,一份为父源单体型,一份为母源单体型。
得到子代父源及母源单体型后,对于每一个特定的子代样本i,首先确定父源单体型上的交叉互换位置,具体为:
(1)将子代i的父源单体型作为参照(下述观测矩阵第1列),同所有其他子代的父源单体型进行比较,碱基相同标记为1,碱基不同标记为0,得到m×n的矩阵,其中m表示子代i所有测定所得单体型位点,n表示子代样本个数。得到如下的观测矩阵:
Figure 517676DEST_PATH_IMAGE009
(2)对于矩阵的每一列j(2≤j≤n),使用隐马尔可夫模型,推断每个位点k(1≤k≤ m)的真实状态(0或1)。具体地,对于每一个位点的转移概率
Figure 776619DEST_PATH_IMAGE010
,规定如下:
Figure 530948DEST_PATH_IMAGE003
即上一状态为1且下一状态也为1(或上一状态为0且下一状态为0)的概率为0.9999,上一状态为1而下一状态为0(或上一状态为0而下一状态为1)的概率为0.0001。
(3)对于染色体上每一个位点k的观测概率定为
Figure 471223DEST_PATH_IMAGE004
,即在真实状态为S (State)的情况下,得到观测状态O(Observation)的概率。观测概率矩阵为:
Figure 729029DEST_PATH_IMAGE011
即在真实状态为1的状态下观测到1(或真实状态为0观测到0)的概率为0.9。在真实状态为1的状态下观测到0(或真实状态为0观测到1)的概率为0.1。
(4)初始状态概率矩阵为:
Figure 362135DEST_PATH_IMAGE006
即初始情况下,真实状态为1的概率P(S=1)=0.5,真实状态为0的概率P(S=0)=0.5。
(5)通过以上概率矩阵及隐马尔可夫模型,得到每一列j的最大似然估计计算公式为:
Figure 603761DEST_PATH_IMAGE007
(6)通过Viterbi动态规划算法,得到最大概率所对应的真实状态。
对于该家系,矫正后所得的真实状态矩阵为:
Figure 144464DEST_PATH_IMAGE008
(7)对于矩阵每一列,显示所有样本均在k(此处示例为k=3)位置状态发生了转换,从连续的1转为0,或从连续的0转为1,表明实际上是位于最左侧的样本i在k位置发生了交叉互换。最后,对结果进行可视化展示。
进一步,使用相同的方式确定母源单体型上的交叉互换位置。
实施例2 应用该方法鉴定CLN3基因突变家系中子代染色体交叉互换位置并实现 突变位点诊断
该家系中,夫妇双方为常染色体隐性遗传CLN3基因突变携带者。丈夫携带CLN3:c.265C>T突变,妻子携带CLN3:c.906+5G>A突变。该夫妇具有一先证患儿,患儿同时携带丈夫CLN3:c.265C>T突变和妻子CLN3:c.906+5G>A突变,为神经元腊样脂质褐素沉积病3型患者。该夫妇行辅助生殖共得到3枚囊胚。该家系需要通过单体型诊断每个胚胎是否携带突变所在单体型,从而判断每个胚胎是否携带突变。但是如果胚胎中继承自丈夫或妻子的携带突变的单体型发生染色体交叉互换,则严重影响诊断的准确性,导致无法诊断。因此需要计算胚胎中染色体的具体交叉互换位置,判断交叉互换是否影响了突变所在单体型。
对囊胚活检获得3-5个细胞,并取丈夫、妻子、先证患儿DNA,所有样本经MALBAC扩增后构建二代测序文库。测序文库使用illumina测序。
如实施例1中所述,所得测序数据使用trim_galore进行数据预处理,使用bwa比对至人类参考基因组(UCSC hg38),并对比对后reads进行过滤。统计家系样本测序深度,该家系测序深度如表1所示。
表1:CLN3基因突变家系各样本测序深度
Figure 991197DEST_PATH_IMAGE012
使用GATK best practice鉴定CLN3基因所在的16号染色体每个位置的基因型。并将所有样本每个位点的基因型以案例1所述方法过滤。样本过滤前后所得SNP数量如表2所示。
表2:CLN3基因突变家系样本16号染色体基因型过滤前后覆盖SNP位点数量
Figure 326363DEST_PATH_IMAGE013
对所有子代样本(包括先证患儿、3枚胚胎)使用孟德尔分离定律,将每个基因型的碱基区分为父源来源和母源来源。并进一步使用案例1所述隐马尔可夫模型及概率矩阵,分别计算每个子代样本父源染色体最大概率所对应的真实状态(State)矩阵,并进行可视化(如图1所示)。如图1所示,从左至右表示将每个子代样本作为参照,鉴定参照样本染色体上的交叉互换位置。参照样本上的“×”表示所鉴定的交叉互换位置。图中横线表示目标突变CLN3:c.265C>T所在位置。颜色相同表示继承了相同的单体型。如果交叉互换位置发生在目标突变附近,则严重影响单体型诊断突变的准确性。如果交叉互换未发生于目标突变附近,则不影响单体型诊断突变的准确性。
具体解释如下:对于先证患儿(995-3),其在短臂中部位置相对于其他子代样本均发生状态(State)的改变,因此说明并非其他样本均在同一位置发生状态改变,而是参照样本995-3本身发生交叉互换导致其他样本相对于参照样本995-3发生状态改变。 该交叉互换距离目标突变位置较远,因此不影响单体型诊断突变,可使用单体型诊断胚胎是否携带突变。由单体型可得,胚胎1(WNHP-E1-1)、胚胎2(WNHP-E2-1)在目标突变位置继承了和先证患儿(995-3)相同的染色体,且在目标位置附近未发生交叉互换,因此胚胎1(WNHP-E1-1)和胚胎2(WNHP-E2-1)携带和先证患儿(995-3)相同的父源突变。而胚胎3(WNHP-E3-1)在目标突变位置继承了和先证患儿(995-3)不同的染色体,且在目标位置附近未发生交叉互换,因此胚胎3(WNHP-E3-1)不携带父源突变。
同时计算每个子代样本母源染色体最大概率真实状态(State)矩阵,并进行可视化,可视化结果如图2所示。
由母源交叉互换计算结果可得,在先证患儿(995-3)的短臂靠近着丝粒位置,发生染色体交叉互换,且交叉互换位置位于目标突变位置附近。因此,该家系的胚胎无法直接使用单体型进行母源突变位点的诊断。
因此,本案例进一步使用PCR位点扩增的方法,对突变位点进行诊断。3枚胚胎的位点PCR结果显示,仅有胚胎1(WNHP-E1-1)得到扩增条带,Sanger测序显示其携带母源突变(如图3所示)。而胚胎2(WNHP-E2-1)及胚胎3(WNHP-E3-1)未扩增出条带,无法判定。
因此,使用图2中的胚胎1(WNHP-E1-1)作为参考,交叉互换计算结果显示胚胎1(WNHP-E1-1)在16号染色体上未发生交叉互换,胚胎2(WNHP-E2-1)继承了和胚胎1(WNHP-E1-1)相同的母源染色体,胚胎3(WNHP-E3-1)继承了和胚胎1(WNHP-E1-1)不同的母源染色体,因此,诊断结果表明胚胎2(WNHP-E2-1)携带母源突变而胚胎3(WNHP-E3-1)不携带母源突变。
本案例中,该夫妇选择了不携带双方突变的胚胎3(WNHP-E3-1)移植,移植后22周羊水检测显示,胎儿不携带夫妇双方致病突变(如图4所示),为健康胎儿,与基于交叉互换及单体型诊断胚胎结果一致。
虽然已有发表文章实现对染色体交叉互换进行计算(如文章《Probing MeioticRecombination and Aneuploidy of Single Sperm Cells by Whole-GenomeSequencing》,《Genome Analyses of Single Human Oocytes》),但是已有方法均为针对单倍体细胞的精子和卵而言。二倍体的胚胎细胞与之相比,面临完全不同的问题。由于单倍体的精子和卵仅有一套染色体,其在扩增过程中,不存在“脱扣”现象(即不存在杂合的AT位点被扩增为纯合的AA位点的情形),所得原始单体型十分准确,无需考虑扩增“脱扣”所引入的错误。而对于二倍体的胚胎细胞而言,扩增的“脱扣”现象十分严重,众多杂合位点在扩增过程中由于“脱扣”现象,在后续测序中会被判定为纯合位点。严重影响后续的判定。本方法相对于已有方法,在选择用于计算交叉互换位点的所有基因型之前,通过挑选高覆盖度区域内的位点,减少基因型的错误率。同时,通过所构建模型,进一步矫正由于扩增“脱扣”产生的错误,从而得到更加准确的单体型和交叉互换位置,最后用于临床胚胎的诊断。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (4)

1.一种鉴定二倍体胚胎细胞中染色体交叉互换位置的方法,所述方法包括如下步骤:
(1)将胚胎活检细胞、丈夫gDNA、妻子gDNA、患儿gDNA进行单细胞DNA扩增;
(2)将扩增后的DNA进行建库及二代测序,得到每个样本的二代测序reads数据;
(3)所得测序reads,去除接头序列、低质量碱基后,比对至人类参考基因组,得到唯一比对的去重复后reads,并鉴定染色体每个位置的基因型;
(4)对于该家系所有测序样本,进行如下过滤,得到更加准确的基因型:(a)仅保留父源或母源为杂合的基因型位点,但是不要求父源或母源同时为杂合;(b)由于MALBAC扩增方式在基因组中不同区域具有非均一性,但是在不同样本的同一区域具有重复性,因此进一步保留>1/2样本中有覆盖的位点,这些位点相对于未过滤位点,具有更高的基因分型准确性;(c)对于每个样本中的基因型,仅保留覆盖度大于5的位点,其他位点转换为NA,
经过该过滤条件,可以很好地提高所得基因型的准确性,
(5)对于过滤后所得基因型,使用孟德尔分离定律,对子代样本(包括先证儿、所有胚胎)所有位点进行定相(phase),将每个基因型的碱基区分为父源来源和母源来源,
至此,每个子代的所有基因型被分为了两份,一份为父源单体型,一份为母源单体型,
(6)得到子代父源及母源单体型后,对于每一个特定的子代样本i,首先确定父源单体型上的交叉互换位置,具体为:
(a)将子代i的父源单体型作为参照(下述观测矩阵第1列),同所有其他子代的父源单体型进行比较,碱基相同标记为1,碱基不同标记为0,得到m×n的矩阵,其中m表示子代i所有测定所得单体型位点,n表示子代样本个数,
得到如下的观测矩阵:
Figure 58535DEST_PATH_IMAGE001
(b)对于矩阵的每一列j(2≤j≤n),使用隐马尔可夫模型,推断每个位点k(1≤k≤m)的真实状态(0或1),
具体地,对于每一个位点的转移概率
Figure 137349DEST_PATH_IMAGE002
,规定如下:
Figure 838589DEST_PATH_IMAGE003
即上一状态为1且下一状态也为1(或上一状态为0且下一状态为0)的概率为0.9999,上一状态为1而下一状态为0(或上一状态为0而下一状态为1)的概率为0.0001,
(c)对于染色体上每一个位点k的观测概率定为
Figure 875815DEST_PATH_IMAGE004
,即在真实状态为S(State) 的情况下,得到观测状态O(Observation)的概率,
观测概率矩阵为:
Figure 26786DEST_PATH_IMAGE005
即在真实状态为1的状态下观测到1(或真实状态为0观测到0)的概率为0.9,
在真实状态为1的状态下观测到0(或真实状态为0观测到1)的概率为0.1,
(d)初始状态概率矩阵为:
Figure 174871DEST_PATH_IMAGE006
即初始情况下,真实状态为1的概率P(S=1)=0.5,真实状态为0的概率P(S=0)=0.5,
(e)通过以上概率矩阵及隐马尔可夫模型,得到每一列j的最大似然估计计算公式为:
Figure 527355DEST_PATH_IMAGE007
(f)通过Viterbi动态规划算法,得到最大概率所对应的真实状态,
对于该家系,矫正后所得的真实状态矩阵为:
Figure 673165DEST_PATH_IMAGE008
(g)对于矩阵每一列,显示所有样本均在k(此处示例为k=3)位置状态发生了转换,从连续的1转为0,或从连续的0转为1,表明实际上是位于最左侧的样本i在k位置发生了交叉互换,
最后,对结果进行可视化展示。
2.如权利要求1所述的方法,其特征在于,所述方法进一步包括使用相同的方式确定母源单体型上的交叉互换位置的步骤。
3.如权利要求1所述的方法,其特征在于,所述步骤(1)使用MALBAC方法进行单细胞DNA扩增。
4.如权利要求1所述的方法,其特征在于,所述步骤(3)为所得测序reads,使用trim_galore去除接头序列、低质量碱基,保留长度大于36bp的测序reads,处理后reads使用bwa默认参数比对至人类参考基因组,进一步去除低比对质量序列和PCR重复序列,得到唯一比对的去重复后reads,过滤后的比对reads使用GATK best practice鉴定染色体每个位置的基因型。
CN202210888080.3A 2022-07-27 2022-07-27 一种鉴定二倍体胚胎细胞中染色体交叉互换位置的方法及应用 Active CN115064210B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210888080.3A CN115064210B (zh) 2022-07-27 2022-07-27 一种鉴定二倍体胚胎细胞中染色体交叉互换位置的方法及应用

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210888080.3A CN115064210B (zh) 2022-07-27 2022-07-27 一种鉴定二倍体胚胎细胞中染色体交叉互换位置的方法及应用

Publications (2)

Publication Number Publication Date
CN115064210A true CN115064210A (zh) 2022-09-16
CN115064210B CN115064210B (zh) 2022-11-18

Family

ID=83206737

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210888080.3A Active CN115064210B (zh) 2022-07-27 2022-07-27 一种鉴定二倍体胚胎细胞中染色体交叉互换位置的方法及应用

Country Status (1)

Country Link
CN (1) CN115064210B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116153395A (zh) * 2023-04-17 2023-05-23 北京大学第三医院(北京大学第三临床医学院) 一种单细胞小片段染色体拷贝数变异的检测方法及系统

Citations (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN2874682Y (zh) * 2006-03-15 2007-02-28 叶小春 多功能染色体和dna教具
US20070184467A1 (en) * 2005-11-26 2007-08-09 Matthew Rabinowitz System and method for cleaning noisy genetic data from target individuals using genetic data from genetically related individuals
WO2008115497A2 (en) * 2007-03-16 2008-09-25 Gene Security Network System and method for cleaning noisy genetic data and determining chromsome copy number
CN101346724A (zh) * 2005-11-26 2009-01-14 吉恩安全网络有限责任公司 清除干扰遗传数据,并使用遗传数据进行预测的方法和体系
JP2009178104A (ja) * 2008-01-31 2009-08-13 Gekkeikan Sake Co Ltd ヘテロ接合性の消失を利用した二倍体細胞染色体特定領域のホモ化方法
WO2013177581A2 (en) * 2012-05-24 2013-11-28 University Of Washington Through Its Center For Commercialization Whole genome sequencing of a human fetus
CN104004817A (zh) * 2013-02-22 2014-08-27 哈佛大学 利用极体或胚胎的单细胞基因组测序来选择试管婴儿的胚胎
CN105051208A (zh) * 2013-03-28 2015-11-11 深圳华大基因股份有限公司 确定胚胎基因组中预定区域碱基信息的方法、系统和计算机可读介质
CN105760712A (zh) * 2016-03-01 2016-07-13 西安电子科技大学 一种基于新一代测序的拷贝数变异检测方法
WO2017084624A1 (zh) * 2015-11-18 2017-05-26 上海序康医疗科技有限公司 一种同时完成基因位点、染色体及连锁分析的方法
CN108256296A (zh) * 2017-12-29 2018-07-06 北京科迅生物技术有限公司 数据处理方法及装置
CN111201329A (zh) * 2018-05-17 2020-05-26 伊鲁米纳公司 具有减少的扩增偏倚的高通量单细胞测序
CN112669901A (zh) * 2020-12-31 2021-04-16 北京优迅医学检验实验室有限公司 基于低深度高通量基因组测序的染色体拷贝数变异检测装置
CN113228191A (zh) * 2018-10-05 2021-08-06 合作基因组公司 识别胚胎中染色体异常的系统和方法
CN113345518A (zh) * 2021-08-02 2021-09-03 北京嘉宝仁和医疗科技有限公司 一种不依赖先证者或参照者的单基因病的单体型构建方法
CN114480667A (zh) * 2022-01-21 2022-05-13 复旦大学附属妇产科医院 一种通过孕妇外周血游离dna检测胎儿染色体平衡性结构变异的方法

Patent Citations (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070184467A1 (en) * 2005-11-26 2007-08-09 Matthew Rabinowitz System and method for cleaning noisy genetic data from target individuals using genetic data from genetically related individuals
CN101346724A (zh) * 2005-11-26 2009-01-14 吉恩安全网络有限责任公司 清除干扰遗传数据,并使用遗传数据进行预测的方法和体系
CN2874682Y (zh) * 2006-03-15 2007-02-28 叶小春 多功能染色体和dna教具
WO2008115497A2 (en) * 2007-03-16 2008-09-25 Gene Security Network System and method for cleaning noisy genetic data and determining chromsome copy number
JP2009178104A (ja) * 2008-01-31 2009-08-13 Gekkeikan Sake Co Ltd ヘテロ接合性の消失を利用した二倍体細胞染色体特定領域のホモ化方法
WO2013177581A2 (en) * 2012-05-24 2013-11-28 University Of Washington Through Its Center For Commercialization Whole genome sequencing of a human fetus
CN104004817A (zh) * 2013-02-22 2014-08-27 哈佛大学 利用极体或胚胎的单细胞基因组测序来选择试管婴儿的胚胎
CN105051208A (zh) * 2013-03-28 2015-11-11 深圳华大基因股份有限公司 确定胚胎基因组中预定区域碱基信息的方法、系统和计算机可读介质
WO2017084624A1 (zh) * 2015-11-18 2017-05-26 上海序康医疗科技有限公司 一种同时完成基因位点、染色体及连锁分析的方法
CN105760712A (zh) * 2016-03-01 2016-07-13 西安电子科技大学 一种基于新一代测序的拷贝数变异检测方法
CN108256296A (zh) * 2017-12-29 2018-07-06 北京科迅生物技术有限公司 数据处理方法及装置
CN111201329A (zh) * 2018-05-17 2020-05-26 伊鲁米纳公司 具有减少的扩增偏倚的高通量单细胞测序
CN113228191A (zh) * 2018-10-05 2021-08-06 合作基因组公司 识别胚胎中染色体异常的系统和方法
CN112669901A (zh) * 2020-12-31 2021-04-16 北京优迅医学检验实验室有限公司 基于低深度高通量基因组测序的染色体拷贝数变异检测装置
CN113345518A (zh) * 2021-08-02 2021-09-03 北京嘉宝仁和医疗科技有限公司 一种不依赖先证者或参照者的单基因病的单体型构建方法
CN114480667A (zh) * 2022-01-21 2022-05-13 复旦大学附属妇产科医院 一种通过孕妇外周血游离dna检测胎儿染色体平衡性结构变异的方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
徐云碧等: "靶向测序基因型检测(GBTS)技术及其应用", 《中国农业科学》 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116153395A (zh) * 2023-04-17 2023-05-23 北京大学第三医院(北京大学第三临床医学院) 一种单细胞小片段染色体拷贝数变异的检测方法及系统

Also Published As

Publication number Publication date
CN115064210B (zh) 2022-11-18

Similar Documents

Publication Publication Date Title
TWI640636B (zh) A method for simultaneously performing gene locus, chromosome and linkage analysis
CN106834502A (zh) 一种基于基因捕获和二代测序技术的脊髓性肌萎缩症相关基因拷贝数检测试剂盒及方法
US20200010890A1 (en) Method for identifying balanced translocation break points and carrying state for balanced translocations in embryos
CN110349631B (zh) 确定子代对象的单体型的分析方法和装置
WO2024027569A1 (zh) 一种不依赖于先证者的单体型构建方法
CN105555970B (zh) 同时进行单体型分析和染色体非整倍性检测的方法和系统
CN115052994A (zh) 确定胚胎细胞染色体中预定位点碱基类型的方法及其应用
CN116153395B (zh) 一种单细胞小片段染色体拷贝数变异的检测方法及系统
CN113593644B (zh) 基于家系的低深度测序检测染色体单亲二体的方法
CN114214425B (zh) 一种鉴定核酸样本的亲本倾向性的方法或装置
CN115064210B (zh) 一种鉴定二倍体胚胎细胞中染色体交叉互换位置的方法及应用
CN109461473B (zh) 胎儿游离dna浓度获取方法和装置
CN113308548B (zh) 一种检测胎儿基因单倍体型的方法、装置和存储介质
CN117230175B (zh) 一种基于三代测序的胚胎植入前遗传学检测方法
JP7362789B2 (ja) 精子提供者、卵母細胞提供者、及びそれぞれの受胎産物の間の遺伝的関係を決定するためのシステム、コンピュータプログラム及び方法
CN114730610A (zh) 试剂盒和使用试剂盒的方法
CN108315436B (zh) 一种应用于鹅亲子鉴定的方法
CN112639129A (zh) 确定新发突变在胚胎中的遗传状态的方法和装置
CN114566213A (zh) 家系高通量测序数据的单亲二倍体分析方法及其系统
CN117925820A (zh) 一种用于胚胎植入前变异检测的方法
CN118291596A (zh) 一种胚胎植入前等位基因分型筛选的方法
CN116913378A (zh) 基于低深度测序数据检测基因组纯合区域的方法及系统
CN117904305A (zh) 胎儿基因缺陷预测方法
CN115287369A (zh) 基于单细胞测序的非单精子判定方法
CN116804219A (zh) 一组用于胚胎植入前检测Kartagener综合征的位点、引物组合物以及试剂盒和应用

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant