CN105986011B - 一种杂合性缺失的检测方法 - Google Patents

一种杂合性缺失的检测方法 Download PDF

Info

Publication number
CN105986011B
CN105986011B CN201510050352.2A CN201510050352A CN105986011B CN 105986011 B CN105986011 B CN 105986011B CN 201510050352 A CN201510050352 A CN 201510050352A CN 105986011 B CN105986011 B CN 105986011B
Authority
CN
China
Prior art keywords
snp
heterozygosity
detection
loss
snp site
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201510050352.2A
Other languages
English (en)
Other versions
CN105986011A (zh
Inventor
李甫强
谢国云
史旭莲
王杰
梁瀚
侯勇
吴逵
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
BGI Shenzhen Co Ltd
Original Assignee
BGI Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by BGI Shenzhen Co Ltd filed Critical BGI Shenzhen Co Ltd
Priority to CN201510050352.2A priority Critical patent/CN105986011B/zh
Publication of CN105986011A publication Critical patent/CN105986011A/zh
Application granted granted Critical
Publication of CN105986011B publication Critical patent/CN105986011B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

本申请公开了一种杂合性缺失的检测方法,本申请的检测方法以单细胞测序为基础,以dbSNP数据库为背景,以染色体臂为检测单元,对单个细胞的SNP位点进行分析,并通过hampel identifier法判断离群点,鉴别出杂合性缺失,从而检测获得准确的单个细胞的杂合性缺失信息。本申请的检测方法率先在单细胞全基因组上水平检测各个细胞的杂合性缺失;以染色体臂为检测单元,检测精度高;开辟了单细胞杂合性缺失检测先河;为单个细胞差异的鉴别,以及肿瘤组织中细胞的异质性研究奠定了基础;不仅可以用于推断肿瘤的发生发展过程,了解肿瘤克隆演化的类型;而且对不同病患或不同时期的用药或用药效果分析等也具有重要意义。

Description

一种杂合性缺失的检测方法
技术领域
本申请涉及基因检测领域,特别是涉及一种杂合性缺失的检测方法。
背景技术
单细胞全基因组测序是在单细胞水平对全基因组进行扩增测序的新技术,其主要包括单细胞的分离,单细胞遗传物质的提取与扩增,以及二代测序三个步骤。随着测序技术的发展,尤其是全基因组扩增方法的改善及新方法的提出,使得癌症单个细胞基因组分析成为可能。
基因组突变是癌症发生发展的重要因子。与癌症病人的正常细胞相比,癌症细胞的基因组有很多序列改变的特征,从单碱基的改变到染色体大片段的插入或缺失,甚至全基因组的重复。其中杂合性缺失(loss ofheterogeneous,缩写LOH)是基因组上的杂合位点的两个等位基因,其中一个部分或全部丢失,表现为未缺失等位基因的纯合子,导致缺失的等位基因不能表达。在肿瘤单细胞研究中,癌症基因组上杂合性缺失是一种普遍存在的现象,抑癌基因的杂合性缺失与多种肿瘤的发生发展息息相关。通过肿瘤杂合性缺失的检测,可以协助确定肿瘤克隆演化的类型。
现有的检测杂合性缺失的方法都是基于组织水平,如ASCAT(allele-specificcopy number analysis oftumors),其原理为比较正常组织和肿瘤组织中相同位点的单核苷酸多态性(single nucleotide polymorphism,SNP)类型,算出相应位点的基因型频率,来构建基因组水平的杂合缺失文库。这种方法需要大量对照组的相同位点的SNP信息;并且,这种检测方法是肿瘤组织层面的杂合性缺失检测,是多个细胞的平均值,由于肿瘤异质性的特点,这种检测方法难以说明单个肿瘤细胞的准确的杂合性缺失情况。
发明内容
本申请的目的是提供一种新的杂合性缺失的检测方法。
为了实现上述目的,本申请采用了以下技术方案:
本申请公开了一种杂合性缺失的检测方法,其特征在于:包括以下步骤,
(1)提取组织样品,分离获得单个细胞,提取单细胞的核酸,并采用全基因组扩增方法对所提取的核酸进行扩增,建库后上机测序,得到单细胞的全基因组测序;
(2)将步骤(1)获得的全基因组测序与参考基因序列进行比对,检测单细胞的SNP,得到单细胞全基因组上的单核苷酸多态性位点的基因型数据,并按照过滤标准对潜在的假阳性SNP位点进行过滤,得到高质量SNP数据;
(3)下载dbSNP数据库中与组织样品对应的所有SNP位点数据,过滤掉dbSNP数据库中在千人基因组中SNP频率低于5%的SNP位点,剩下的SNP位点作为背景SNP位点集;
(4)采用步骤(2)得到的高质量SNP数据,对于每个单细胞,以染色体臂为一个检测区域,统计各检测区域的SNP位点与背景SNP位点集的交集,计数为Ti,并统计纯合SNP和杂合SNP位点,纯合SNP计数为Nij
(5)计算每个单细胞中各个检测区域的纯合SNP位点频率Fij,计算公式为Fij=Nij÷Ti×100%,得到各个检测区域的纯合SNP位点频率矩阵;
(6)用hampel identifier法找纯合SNP位点频率Fij中的离群点,离群点所在的检测区域,即判定该染色体臂有发生杂合性缺失;
其中,i表示染色体臂的编号,j表示单细胞的编号。
需要说明的是,本申请的关键在于利用单细胞测序技术,对单个癌细胞或肿瘤细胞进行分析,并采用现有的dbSNP数据库为背景,以染色体臂为一个检测单元,创造性的采用hampel identifier法对离群点进行分析,从而判定染色体臂的杂合性缺失。可以理解,除此以外,例如单个细胞的获得、单细胞核酸提取、单细胞测序,测序结果的比对和SNP的检测都可以参考现有技术进行;本申请的优选方案中,为了保障检测结果,优选的采用SOAP或BWA软件对步骤(1)的测序结果进行比对,并优选的采用GATK、samtools或SOAPsnp进行SNP检测。
还需要说明的是,步骤(3)中“下载dbSNP数据库中与组织样品对应的所有SNP位点数据”,“与组织样品对应的”是指组织样品来源相对应的,例如本申请的一种实现方式中,具体对人的癌细胞进行杂合性缺失检测,则下载了人的所有SNP位点数据。可以理解,如果是对其它动物的肿瘤细胞进行的杂合性缺失检测,则需要下载对应的该动物的所有SNP位点数据;当然,前提是dbSNP数据库中有这些数据。
本申请的步骤(3)中,千人基因组中SNP频率是指,SNP频率=千人基因组中有此SNP的样本数目÷1000,本申请中过滤掉千人基因组中SNP频率低于5%的SNP,其中5%是一个经验概率,具有统计学意义,可以理解,该值同样并不是唯一不变的,在试验允许的条件下,对该值进行细微调整同样属于本申请的保护范围。步骤(2)中,所谓高质量的SNP数据是指排除各种假阳性的SNP后,可信度高的SNP数据,具体过滤标准可以参考现有的SNP分析方法中对SNP的分析判定标准。
优选的,步骤(2)中,过滤标准为,过滤去除序列reads支持数少于6的SNP,去除SNP质量少于20的SNP,去除链特异性的SNP,去除SNP位点的间距少于5bp的SNP。
需要说明的是,本申请的步骤(2)中,与全基因组测序比对的参考基因序列为,从NCBI或其他数据库下载的与本申请所测序的单细胞对应的物种基因组序列。过滤标准采用Hou et al.2012中披露的标准,可以理解,本申请采用的过滤标准中序列reads支持数和SNP质量的具体值并不是唯一不变的,根据不同的试验条件和实际需求,对“序列reads支持数少于6,SNP质量少于20”进行细微的调整同样属于本申请的保护范围;过滤标准中,链特异性的SNP是指,遗传物质具有互补双链结构,其中一条链的测序深度和其互补链测序深度相差甚大的SNP。过滤标准的出处详见文献:Hou Y,et al.2012.Single-cell exomesequencing and monoclonal evolution of a JAK2-negative myeloproliferativeneoplasm.Cell 148:873-885。还需要说明的是,Hou et al.的过滤标准只是获得高质量SNP数据的一种优选方案,不排除其它可以获得高质量的SNP数据的过滤标准同样适用于本申请。
优选的,步骤(6)用hampel identifier法找离群点具体包括,(a)找出所有检测区域的纯合SNP位点频率Fij的中位数MF,(b)计算每个纯合SNP位点频率Fij与中位数MF的差值,取差值的绝对值即各纯合SNP位点的绝对中位差|Fij-MF|,得到绝对中位差矩阵,其中染色体臂纯合率Fij小于中位数MF的判定该染色体臂没有发生杂合性缺失,(c)找出各纯合SNP位点的绝对中位差的中位数MAD,按公式计算Zij’=(|Fij-MF|)÷(MAD÷0.6745),Zij’大于2.24,为离群点,即判定该染色体臂有发生杂合性缺失。
需要说明的是,染色体臂纯合率小于平均值的判定该染色体臂没有发生杂合性缺失,这是根据LOH的特征进行判断的,本申请的研究过程中,发明人发现,发生LOH的位点其杂合性部分或全部丢失,因此其纯合率应该升高,所以如果染色体臂纯合率小于平均值,也就是纯合率降低的位点,判断为没有发生LOH。需要补充说明的是,在本申请的一种实现方式中,将没有发生LOH的位点赋值为0,发生LOH的位点赋值为1,以便统计分析。
优选的,步骤(2)中,检测单细胞的SNP所采用的软件为GATK、samtools或SOAPsnp。
优选的,步骤(2)中,将步骤(1)获得的全基因组测序与参考基因序列进行比对所采用的软件为SOAP、BWA或bowtie。
本申请的杂合性缺失的检测方法是以人类癌症细胞为基础研究出来的,其主要目的是研究人类癌症细胞单个细胞的杂合性缺失,研究各个细胞的差异,进而分析推断肿瘤的发生发展过程;因此,本申请的另一面提供了本申请的检测方法在检测人类癌症细胞的杂合性缺失中的应用。可以理解,通过对单个细胞的杂合性缺失检测,不仅可以用于推断肿瘤的发生发展过程;而且对不同病患或不同时期的用药或用药效果分析等也是具有重要意义的。
可以理解,在本申请的检测方法的基础上,可以利用本申请的检测方法制备出杂合性缺失检测的试剂盒,与其他自动化设备或检测平台结合,还可以制备出杂合性缺失检测的专用检测设备;因此,本申请的再一面还提供了本申请的检测方法在制备杂合性缺失检测试剂盒或检测设备中的应用。
由于采用以上技术方案,本申请的有益效果在于:
本申请的杂合性缺失检测方法率先在单细胞全基因组上水平检测各个细胞的杂合性缺失;并且以染色体臂为检测单元,检测精度高。本申请的检测方法开辟了单细胞杂合性缺失检测先河,为单个细胞差异的鉴别,以及肿瘤组织中细胞的异质性研究奠定了基础;不仅可以用于推断肿瘤的发生发展过程,了解肿瘤克隆演化的类型;而且对不同病患或不同时期的用药或用药效果分析等也具有重要意义。
附图说明
图1是本申请实施例中单细胞杂合性缺失结果图;
图2是本申请实施例中病人1三块组织检测杂合性缺失的结果图;
图3是本申请实施例中病人2三块组织检测杂合性缺失的结果图。
具体实施方式
本申请的方法只需要公共数据库dbsnp中的数据,更简单方便;并且,基于单细胞全基因高深度测序,考虑到单细胞测序的扩增偏向性,以染色体臂为检测单元,根据dbSNP库中每个检测单元内SNP的频率分布,从而得到准确的杂合性缺失情况,提高了检测精度。
本申请中,i表示染色体臂的编号,j表示单细胞的编号;Ti表示编号为i的染色体臂与背景SNP位点集的交集SNP位点个数;Nij表示编号j的单细胞中编号i的染色体臂中纯合SNP的个数;Fij表示编号j的单细胞中编号i的染色体臂中纯合SNP的出现频率;MF表示统计的所有Fij的中位数;|Fij-MF|表示Fij与MF的差的绝对值;MAD表示统计的所有|Fij-MF|的中位数;Zij’表示编号j的单细胞中编号i的染色体臂其纯合SNP是否为极端值,即是否为离群点的判断分数。
下面通过具体实施例和附图对本申请作进一步详细说明。以下实施例仅对本申请进行进一步说明,不应理解为对本申请的限制。
实施例
分别提取2个脑瘤病人的3块肿瘤组织,病人1的3块肿瘤组织分别标记为P1-T1、P1-T2、P1-T3,病人2的3块肿瘤组织分别标记为P2-T1、P2-T2、P2-T3。从这6块组织分别分选出3~5个单细胞,共22个单细胞,按照如下方法测定各个单细胞的杂合性缺失:
(1)从肿瘤患者的组织样品,使用流式细胞仪分离得到单个细胞,提取单个细胞的核酸并采用全基因组扩增方法进行扩增,进行常规建库后进行上机测序,得到单细胞全基因组测序下机序列;全基因组扩增方法包括简并核苷酸引物PCR(DOP-PCR),多重置换扩增(MDA)或多次退火环状循环扩增(MALBAC),可选其中任何一种,获得足够建库的核酸量,本例具体采用多重置换扩增(MDA)方法。上机测序本例采用CG测序仪。需要说明的是,测序建库采用标准的CG建库流程,MDA参考CG测序仪的使用说明,在此不累述。
(2)将步骤(1)获得的全基因组测序结果,进行CG标准分析,并获得与参考基因序列进行比对的比对结果,使用samtools检测SNP,得到单个细胞全基因组上的单核苷酸多态性位点的基因型数据,对各个单细胞样本检测得到的所有SNP位点进行过滤,过滤标准是,序列reads支持数少于6,SNP质量少于20,去除链特异性的SNP,去除SNP cluster;
(3)下载dbSNP数据库中人的所有SNP位点数据,过滤掉在所有单细胞样本中出现频率低于5%的SNP位点,作为背景SNP位点集;
(4)对于每个单细胞,以染色体臂为一个检测区域包含chr1.p,chr1.q,chr10.p,chr10.q,chr11.p,chr11.q,chr12.p,chr12.q,chr13.q,chr14.q,chr15.q,chr16.p,chr16.q,chr17.p,chr17.q,chr18.p,chr18.q,chr19.p,chr19.q,chr2.p,chr2.q,chr20.p,chr20.q,chr21.p,chr21.q,chr22.q,chr3.p,chr3.q,chr4.p,chr4.q,chr5.p,chr5.q,chr6.p,chr6.q,chr7.p,chr7.q,chr8.p,chr8.q,chr9.p,chr9.q,一共40个染色体臂,统计各检测区域的高质量的SNP位点与背景SNP位点集的交集,计数为Ti,并统计纯合SNP和杂合SNP位点,纯合SNP计数为Nij,统计的Nij值详见表1至表4,由于数据量比较大,Nij分表1至表4四个表格列出;需要说明的是,本例中,有些染色体臂很短,且现有组装结果其主要是N,所以本例只检测40个染色体臂的;
(5)计算每个单细胞中各个检测区域的纯合SNP位点频率Fij,计算公式为Fij=Nij÷Ti×100%,得到各个检测区域的纯合SNP位点频率矩阵;
表1 单细胞样本在各检测区域纯合SNP位点的频率
ChrArm chr1.p chr1.q chr10.p chr10.q chr11.p chr11.q chr12.p chr12.q chr13.q chr14.q
P1-T1-SC01 0.795 0.799 0.983 0.985 0.930 0.947 0.795 0.800 0.795 0.793
P1-T1-SC02 0.776 0.783 0.984 0.986 0.931 0.941 0.820 0.795 0.788 0.783
P1-T1-SC03 0.774 0.776 0.984 0.986 0.912 0.934 0.786 0.778 0.777 0.781
P1-T2-SC02 0.723 0.729 0.949 0.958 0.889 0.889 0.743 0.733 0.727 0.731
P1-T2-SC03 0.855 0.857 0.983 0.987 0.958 0.969 0.864 0.864 0.855 0.866
P1-T2-SC04 0.880 0.890 0.984 0.986 0.946 0.964 0.897 0.891 0.895 0.890
P1-T3-SC02-1 0.852 0.879 0.982 0.985 0.932 0.946 0.849 0.842 0.846 0.862
P1-T3-SC03 0.862 0.899 0.980 0.981 0.805 0.804 0.873 0.893 0.777 0.769
P1-T3-SC04 0.756 0.766 0.983 0.986 0.770 0.797 0.774 0.769 0.762 0.767
P1-T3-SC05 0.870 0.875 0.985 0.987 0.884 0.888 0.879 0.889 0.887 0.883
P2-T1-SC02 0.746 0.731 0.737 0.755 0.732 0.750 0.842 0.744 0.751 0.748
P2-T1-SC03 0.779 0.777 0.773 0.799 0.779 0.789 0.982 0.785 0.789 0.802
P2-T1-SC04 0.789 0.795 0.789 0.825 0.793 0.807 0.816 0.782 0.826 0.782
P2-T2-SC01 0.815 0.805 0.820 0.829 0.818 0.826 0.983 0.816 0.825 0.841
P2-T2-SC02 0.837 0.819 0.837 0.848 0.833 0.835 0.983 0.849 0.836 0.848
P2-T2-SC03 0.765 0.776 0.758 0.779 0.827 0.794 0.976 0.782 0.770 0.868
P2-T2-SC04 0.838 0.832 0.849 0.849 0.840 0.846 0.979 0.844 0.851 0.850
P2-T2-SC05 0.739 0.737 0.739 0.758 0.733 0.743 0.795 0.738 0.760 0.745
P2-T3-SC01 0.803 0.796 0.799 0.812 0.799 0.802 0.811 0.795 0.806 0.789
P2-T3-SC03 0.794 0.784 0.782 0.801 0.797 0.798 0.800 0.776 0.974 0.808
P2-T3-SC04 0.809 0.799 0.804 0.810 0.799 0.815 0.820 0.796 0.817 0.798
P2-T3-SC05 0.803 0.797 0.802 0.820 0.797 0.814 0.825 0.796 0.815 0.793
表2 单细胞样本在各检测区域纯合SNP位点的频率
ChrArm chr15.q chr16.p chr16.q chr17.p chr17.q chr18.p chr18.q chr19.p chr19.q chr2.p
P1-T1-SC01 0.810 0.784 0.793 0.979 0.984 0.795 0.803 0.789 0.803 0.788
P1-T1-SC02 0.799 0.772 0.789 0.980 0.983 0.800 0.805 0.785 0.797 0.985
P1-T1-SC03 0.793 0.762 0.779 0.981 0.985 0.799 0.792 0.774 0.783 0.776
P1-T2-SC02 0.745 0.708 0.723 0.958 0.964 0.737 0.736 0.730 0.739 0.726
P1-T2-SC03 0.875 0.870 0.860 0.982 0.984 0.890 0.873 0.853 0.873 0.862
P1-T2-SC04 0.895 0.885 0.893 0.984 0.985 0.895 0.900 0.864 0.874 0.890
P1-T3-SC02-1 0.850 0.832 0.856 0.980 0.982 0.853 0.883 0.833 0.874 0.983
P1-T3-SC03 0.978 0.780 0.840 0.976 0.978 0.775 0.773 0.966 0.975 0.893
P1-T3-SC04 0.826 0.752 0.765 0.979 0.982 0.783 0.785 0.839 0.850 0.763
P1-T3-SC05 0.884 0.874 0.863 0.983 0.985 0.872 0.875 0.864 0.855 0.869
P2-T1-SC02 0.738 0.755 0.762 0.746 0.761 0.843 0.754 0.724 0.733 0.745
P2-T1-SC03 0.785 0.786 0.801 0.780 0.799 0.975 0.787 0.778 0.788 0.781
P2-T1-SC04 0.793 0.799 0.809 0.809 0.813 0.807 0.799 0.814 0.797 0.791
P2-T2-SC01 0.821 0.838 0.824 0.825 0.841 0.974 0.826 0.823 0.821 0.819
P2-T2-SC02 0.836 0.835 0.837 0.848 0.857 0.982 0.834 0.839 0.831 0.831
P2-T2-SC03 0.815 0.816 0.776 0.774 0.786 0.969 0.778 0.751 0.766 0.780
P2-T2-SC04 0.841 0.856 0.868 0.847 0.855 0.971 0.843 0.854 0.856 0.833
P2-T2-SC05 0.741 0.750 0.760 0.747 0.760 0.810 0.746 0.739 0.744 0.743
P2-T3-SC01 0.803 0.817 0.815 0.806 0.825 0.802 0.800 0.792 0.802 0.805
P2-T3-SC03 0.783 0.794 0.800 0.795 0.809 0.976 0.790 0.778 0.792 0.791
P2-T3-SC04 0.808 0.818 0.822 0.811 0.825 0.815 0.809 0.808 0.808 0.811
P2-T3-SC05 0.806 0.814 0.826 0.818 0.824 0.812 0.811 0.800 0.797 0.812
表3 单细胞样本在各检测区域纯合SNP位点的频率
ChrArm chr2.q chr20.p chr20.q chr21.p chr21.q chr22.q chr3.p chr3.q chr4.p chr4.q
P1-T1-SC01 0.815 0.822 0.796 0.574 0.793 0.812 0.806 0.800 0.808 0.805
P1-T1-SC02 0.983 0.810 0.782 0.441 0.783 0.795 0.801 0.791 0.804 0.801
P1-T1-SC03 0.792 0.789 0.782 0.539 0.773 0.799 0.826 0.812 0.832 0.820
P1-T2-SC02 0.743 0.743 0.728 0.460 0.718 0.755 0.743 0.727 0.745 0.733
P1-T2-SC03 0.869 0.885 0.867 0.492 0.864 0.873 0.987 0.987 0.867 0.868
P1-T2-SC04 0.891 0.890 0.894 0.543 0.891 0.901 0.892 0.886 0.897 0.889
P1-T3-SC02-1 0.983 0.880 0.856 0.696 0.883 0.863 0.881 0.863 0.868 0.878
P1-T3-SC03 0.896 0.796 0.790 0.500 0.789 0.824 0.775 0.759 0.809 0.794
P1-T3-SC04 0.776 0.773 0.765 0.542 0.755 0.790 0.778 0.763 0.779 0.763
P1-T3-SC05 0.887 0.881 0.875 0.729 0.873 0.892 0.874 0.878 0.881 0.879
P2-T1-SC02 0.765 0.757 0.765 0.577 0.827 0.804 0.763 0.744 0.805 0.749
P2-T1-SC03 0.797 0.798 0.804 0.673 0.926 0.786 0.795 0.774 0.926 0.785
P2-T1-SC04 0.808 0.815 0.838 0.586 0.791 0.788 0.805 0.792 0.782 0.786
P2-T2-SC01 0.842 0.831 0.839 0.690 0.933 0.816 0.827 0.817 0.932 0.815
P2-T2-SC02 0.848 0.851 0.842 0.747 0.948 0.838 0.852 0.834 0.946 0.836
P2-T2-SC03 0.839 0.774 0.786 0.610 0.952 0.761 0.847 0.816 0.894 0.776
P2-T2-SC04 0.843 0.860 0.857 0.627 0.937 0.864 0.844 0.839 0.935 0.841
P2-T2-SC05 0.757 0.759 0.768 0.618 0.798 0.751 0.758 0.741 0.772 0.747
P2-T3-SC01 0.810 0.812 0.823 0.630 0.795 0.796 0.807 0.791 0.790 0.795
P2-T3-SC03 0.802 0.811 0.822 0.585 0.927 0.794 0.799 0.784 0.926 0.784
P2-T3-SC04 0.815 0.818 0.826 0.568 0.807 0.815 0.818 0.805 0.805 0.806
P2-T3-SC05 0.816 0.825 0.831 0.632 0.799 0.814 0.817 0.807 0.792 0.800
表4 单细胞样本在各检测区域纯合SNP位点的频率
ChrArm chr5.p chr5.q chr6.p chr6.q chr7.p chr7.q chr8.p chr8.q chr9.p chr9.q
P1-T1-SC01 0.779 0.804 0.792 0.799 0.787 0.797 0.781 0.791 0.889 0.817
P1-T1-SC02 0.786 0.798 0.783 0.796 0.784 0.792 0.788 0.783 0.868 0.802
P1-T1-SC03 0.763 0.781 0.773 0.778 0.833 0.837 0.809 0.802 0.870 0.792
P1-T2-SC02 0.712 0.732 0.727 0.732 0.727 0.732 0.722 0.719 0.839 0.753
P1-T2-SC03 0.854 0.860 0.863 0.865 0.860 0.843 0.848 0.844 0.910 0.866
P1-T2-SC04 0.878 0.899 0.903 0.892 0.873 0.875 0.874 0.867 0.924 0.874
P1-T3-SC02-1 0.853 0.863 0.868 0.869 0.823 0.834 0.849 0.816 0.893 0.854
P1-T3-SC03 0.893 0.903 0.793 0.797 0.980 0.958 0.772 0.778 0.859 0.845
P1-T3-SC04 0.754 0.773 0.769 0.767 0.772 0.773 0.759 0.755 0.867 0.786
P1-T3-SC05 0.890 0.885 0.893 0.882 0.854 0.852 0.876 0.865 0.908 0.876
P2-T1-SC02 0.743 0.814 0.763 0.737 0.744 0.724 0.748 0.749 0.818 0.743
P2-T1-SC03 0.779 0.936 0.801 0.767 0.778 0.759 0.782 0.786 0.940 0.783
P2-T1-SC04 0.779 0.792 0.811 0.772 0.786 0.774 0.795 0.816 0.811 0.793
P2-T2-SC01 0.810 0.938 0.842 0.817 0.801 0.798 0.821 0.814 0.942 0.821
P2-T2-SC02 0.835 0.949 0.854 0.826 0.835 0.817 0.847 0.843 0.951 0.835
P2-T2-SC03 0.749 0.929 0.786 0.752 0.777 0.749 0.783 0.789 0.931 0.759
P2-T2-SC04 0.824 0.950 0.857 0.823 0.838 0.830 0.840 0.840 0.956 0.843
P2-T2-SC05 0.741 0.787 0.761 0.727 0.741 0.726 0.744 0.746 0.798 0.737
P2-T3-SC01 0.791 0.804 0.817 0.787 0.799 0.785 0.808 0.805 0.816 0.803
P2-T3-SC03 0.782 0.934 0.803 0.771 0.792 0.778 0.792 0.794 0.946 0.784
P2-T3-SC04 0.805 0.815 0.822 0.798 0.804 0.796 0.812 0.817 0.825 0.808
P2-T3-SC05 0.800 0.810 0.824 0.799 0.809 0.791 0.813 0.803 0.821 0.802
(6)用hampel identifier法找纯合SNP位点频率Fij中的离群点,离群点所在的检测区域,即判定该染色体臂有发生杂合性缺失;具体包括,(a)找出所有检测区域的纯合SNP位点频率Fij的中位数MF,本例中MF=0.0808778,(b)计算每个纯合SNP位点频率Fij与中位数MF的差值,取差值的绝对值即各纯合SNP位点的绝对中位差|Fij-MF|,得到绝对中位差矩阵,绝对中位差详见表5至表8;
表5 单细胞样本在各检测区域的绝对中位差矩阵
ChrArm chr1.p chr1.q chr10.p chr10.q chr11.p chr11.q chr12.p chr12.q chr13.q chr14.q
P1-T1-SC01 0.013 0.010 0.174 0.176 0.121 0.138 0.014 0.008 0.014 0.015
P1-T1-SC02 0.032 0.026 0.175 0.177 0.122 0.132 0.011 0.013 0.021 0.026
P1-T1-SC03 0.035 0.032 0.175 0.178 0.103 0.125 0.023 0.031 0.032 0.027
P1-T2-SC02 0.086 0.080 0.141 0.149 0.080 0.081 0.066 0.076 0.082 0.078
P1-T2-SC03 0.046 0.048 0.175 0.178 0.150 0.161 0.055 0.055 0.046 0.058
P1-T2-SC04 0.071 0.081 0.175 0.178 0.138 0.155 0.088 0.082 0.086 0.081
P1-T3-SC02-1 0.043 0.070 0.173 0.176 0.123 0.137 0.040 0.033 0.038 0.053
P1-T3-SC03 0.053 0.090 0.171 0.172 0.004 0.005 0.064 0.084 0.032 0.039
P1-T3-SC04 0.052 0.043 0.174 0.177 0.038 0.012 0.034 0.039 0.047 0.042
P1-T3-SC05 0.062 0.066 0.177 0.179 0.075 0.079 0.071 0.080 0.078 0.074
P2-T1-SC02 0.063 0.078 0.072 0.054 0.076 0.059 0.033 0.065 0.058 0.061
P2-T1-SC03 0.030 0.032 0.036 0.010 0.030 0.019 0.173 0.024 0.019 0.007
P2-T1-SC04 0.019 0.014 0.020 0.016 0.016 0.002 0.007 0.026 0.018 0.027
P2-T2-SC01 0.006 0.004 0.012 0.020 0.009 0.017 0.174 0.007 0.016 0.032
P2-T2-SC02 0.028 0.010 0.028 0.039 0.025 0.026 0.174 0.040 0.027 0.039
P2-T2-SC03 0.044 0.033 0.050 0.029 0.018 0.015 0.167 0.026 0.038 0.059
P2-T2-SC04 0.029 0.023 0.040 0.040 0.031 0.037 0.170 0.035 0.042 0.041
P2-T2-SC05 0.070 0.072 0.069 0.051 0.075 0.066 0.014 0.071 0.049 0.064
P2-T3-SC01 0.006 0.013 0.010 0.003 0.010 0.007 0.002 0.014 0.003 0.020
P2-T3-SC03 0.015 0.025 0.026 0.008 0.012 0.011 0.009 0.032 0.165 0.001
P2-T3-SC04 0.000 0.010 0.005 0.002 0.010 0.006 0.011 0.012 0.008 0.011
P2-T3-SC05 0.005 0.011 0.007 0.011 0.012 0.006 0.016 0.013 0.007 0.016
表6 单细胞样本在各检测区域的绝对中位差矩阵
ChrArm chr15.q chr16.p chr16.q chr17.p chr17.q chr18.p chr18.q chr19.p chr19.q chr2.p
P1-T1-SC01 0.001 0.025 0.015 0.170 0.175 0.013 0.006 0.020 0.006 0.021
P1-T1-SC02 0.009 0.036 0.020 0.171 0.174 0.009 0.004 0.024 0.012 0.176
P1-T1-SC03 0.016 0.047 0.030 0.172 0.176 0.010 0.017 0.035 0.026 0.033
P1-T2-SC02 0.064 0.101 0.085 0.150 0.155 0.071 0.073 0.079 0.069 0.083
P1-T2-SC03 0.066 0.061 0.051 0.173 0.175 0.082 0.064 0.044 0.064 0.053
P1-T2-SC04 0.086 0.076 0.084 0.175 0.176 0.087 0.091 0.055 0.065 0.081
P1-T3-SC02-1 0.041 0.023 0.047 0.171 0.173 0.044 0.074 0.024 0.065 0.174
P1-T3-SC03 0.169 0.028 0.031 0.167 0.169 0.034 0.035 0.157 0.167 0.084
P1-T3-SC04 0.017 0.057 0.043 0.170 0.174 0.026 0.024 0.031 0.041 0.045
P1-T3-SC05 0.076 0.065 0.054 0.174 0.176 0.063 0.066 0.055 0.046 0.060
P2-T1-SC02 0.070 0.053 0.047 0.063 0.048 0.035 0.054 0.085 0.076 0.063
P2-T1-SC03 0.024 0.023 0.008 0.028 0.010 0.166 0.022 0.031 0.021 0.028
P2-T1-SC04 0.016 0.009 0.001 0.000 0.005 0.002 0.010 0.005 0.012 0.018
P2-T2-SC01 0.012 0.029 0.015 0.016 0.032 0.166 0.017 0.014 0.012 0.010
P2-T2-SC02 0.028 0.026 0.028 0.039 0.049 0.173 0.025 0.031 0.022 0.022
P2-T2-SC03 0.006 0.007 0.033 0.034 0.023 0.160 0.031 0.058 0.043 0.029
P2-T2-SC04 0.032 0.047 0.059 0.038 0.046 0.163 0.034 0.046 0.047 0.024
P2-T2-SC05 0.068 0.059 0.049 0.062 0.049 0.001 0.063 0.069 0.065 0.066
P2-T3-SC01 0.006 0.008 0.006 0.003 0.016 0.007 0.009 0.016 0.007 0.004
P2-T3-SC03 0.026 0.015 0.008 0.014 0.000 0.168 0.019 0.031 0.017 0.018
P2-T3-SC04 0.001 0.009 0.013 0.002 0.016 0.006 0.001 0.000 0.000 0.002
P2-T3-SC05 0.003 0.006 0.017 0.009 0.016 0.003 0.002 0.008 0.012 0.003
表7 单细胞样本在各检测区域的绝对中位差矩阵
ChrArm chr2.q chr20.p chr20.q chr21.p chr21.q chr22.q chr3.p chr3.q chr4.p chr4.q
P1-T1-SC01 0.006 0.013 0.012 0.234 0.016 0.003 0.003 0.008 0.000 0.004
P1-T1-SC02 0.175 0.001 0.027 0.368 0.026 0.014 0.007 0.018 0.005 0.007
P1-T1-SC03 0.016 0.020 0.027 0.269 0.035 0.010 0.017 0.003 0.024 0.011
P1-T2-SC02 0.065 0.066 0.081 0.349 0.091 0.054 0.066 0.082 0.064 0.076
P1-T2-SC03 0.061 0.076 0.058 0.317 0.055 0.064 0.178 0.179 0.058 0.059
P1-T2-SC04 0.083 0.081 0.086 0.266 0.083 0.092 0.083 0.077 0.088 0.081
P1-T3-SC02-1 0.174 0.071 0.048 0.113 0.074 0.054 0.072 0.054 0.059 0.069
P1-T3-SC03 0.088 0.012 0.019 0.309 0.020 0.015 0.034 0.050 0.000 0.014
P1-T3-SC04 0.033 0.036 0.044 0.267 0.054 0.019 0.031 0.045 0.030 0.046
P1-T3-SC05 0.078 0.072 0.066 0.080 0.064 0.083 0.065 0.069 0.073 0.070
P2-T1-SC02 0.044 0.052 0.044 0.232 0.018 0.005 0.046 0.065 0.004 0.060
P2-T1-SC03 0.011 0.011 0.005 0.136 0.117 0.023 0.014 0.034 0.117 0.023
P2-T1-SC04 0.000 0.006 0.029 0.222 0.018 0.021 0.004 0.017 0.026 0.023
P2-T2-SC01 0.033 0.022 0.030 0.119 0.124 0.008 0.018 0.009 0.123 0.007
P2-T2-SC02 0.039 0.042 0.034 0.062 0.139 0.029 0.043 0.026 0.137 0.027
P2-T2-SC03 0.030 0.035 0.023 0.199 0.144 0.048 0.038 0.007 0.085 0.033
P2-T2-SC04 0.034 0.051 0.048 0.181 0.128 0.056 0.035 0.030 0.126 0.033
P2-T2-SC05 0.051 0.050 0.041 0.191 0.011 0.058 0.051 0.068 0.037 0.062
P2-T3-SC01 0.001 0.003 0.014 0.179 0.013 0.013 0.002 0.017 0.019 0.014
P2-T3-SC03 0.007 0.003 0.014 0.224 0.118 0.015 0.010 0.025 0.117 0.025
P2-T3-SC04 0.006 0.010 0.018 0.241 0.002 0.006 0.009 0.004 0.003 0.003
P2-T3-SC05 0.007 0.016 0.022 0.177 0.010 0.006 0.008 0.002 0.017 0.008
表8 单细胞样本在各检测区域的绝对中位差矩阵
ChrArm chr5.p chr5.q chr6.p chr6.q chr7.p chr7.q chr8.p chr8.q chr9.p chr9.q
P1-T1-SC01 0.030 0.005 0.017 0.009 0.021 0.012 0.028 0.018 0.080 0.008
P1-T1-SC02 0.023 0.011 0.025 0.013 0.025 0.017 0.021 0.026 0.060 0.007
P1-T1-SC03 0.046 0.028 0.036 0.031 0.024 0.028 0.000 0.006 0.061 0.017
P1-T2-SC02 0.097 0.077 0.082 0.077 0.082 0.077 0.087 0.090 0.030 0.056
P1-T2-SC03 0.046 0.051 0.054 0.056 0.051 0.035 0.039 0.036 0.101 0.057
P1-T2-SC04 0.069 0.090 0.094 0.084 0.064 0.066 0.065 0.058 0.116 0.065
P1-T3-SC02-1 0.044 0.054 0.059 0.060 0.015 0.025 0.040 0.007 0.084 0.046
P1-T3-SC03 0.084 0.094 0.016 0.011 0.171 0.149 0.037 0.031 0.050 0.036
P1-T3-SC04 0.054 0.035 0.039 0.042 0.037 0.036 0.049 0.054 0.058 0.023
P1-T3-SC05 0.081 0.076 0.084 0.073 0.045 0.043 0.067 0.056 0.099 0.067
P2-T1-SC02 0.066 0.005 0.046 0.072 0.065 0.085 0.061 0.060 0.009 0.066
P2-T1-SC03 0.030 0.127 0.008 0.042 0.031 0.049 0.027 0.022 0.132 0.025
P2-T1-SC04 0.030 0.017 0.002 0.037 0.023 0.035 0.014 0.007 0.002 0.015
P2-T2-SC01 0.002 0.129 0.033 0.008 0.007 0.011 0.012 0.005 0.133 0.012
P2-T2-SC02 0.026 0.140 0.045 0.017 0.026 0.008 0.039 0.034 0.142 0.026
P2-T2-SC03 0.059 0.120 0.023 0.057 0.032 0.060 0.026 0.020 0.122 0.050
P2-T2-SC04 0.015 0.141 0.048 0.015 0.029 0.022 0.031 0.031 0.147 0.034
P2-T2-SC05 0.068 0.022 0.048 0.082 0.068 0.082 0.065 0.062 0.011 0.072
P2-T3-SC01 0.018 0.005 0.008 0.022 0.010 0.023 0.001 0.004 0.008 0.006
P2-T3-SC03 0.027 0.126 0.006 0.038 0.017 0.031 0.017 0.015 0.137 0.025
P2-T3-SC04 0.004 0.006 0.013 0.011 0.005 0.013 0.003 0.008 0.017 0.001
P2-T3-SC05 0.009 0.002 0.015 0.010 0.001 0.018 0.004 0.005 0.012 0.007
(c)找出各纯合SNP位点的绝对中位差的中位数MAD,本例中MAD=0.035
按公式计算Zij’=(|Fij-MF|)÷(MAD÷0.6745),得到一个判别矩阵,如表9至表13所示,其中Zij’大于2.24,为离群点,即判定该染色体臂有发生杂合性缺失。
表9 单细胞样本在各检测区域的判别矩阵
ChrArm chr1.p chr1.q chr10.p chr10.q chr11.p chr11.q chr12.p chr12.q
P1-T1-SC01 0.2613 0.18851 3.399426 3.44265 2.365996 2.701601 0.26578 0.16557
P1-T1-SC02 0.63249 0.50598 3.424266 3.466579 2.387642 2.575697 0.215198 0.26182
P1-T1-SC03 0.67634 0.63243 3.427044 3.470395 2.011834 2.450215 0.45237 0.60381
P1-T2-SC02 1.67699 1.56418 2.747279 2.917386 1.560943 1.574207 1.28674 1.48686
P1-T2-SC03 0.903388 0.936316 3.413073 3.487967 2.921962 3.137591 1.084245 1.081187
P1-T2-SC04 1.395367 1.588892 3.426278 3.469982 2.691094 3.023587 1.718304 1.610217
P1-T3-SC02-1 0.84264 1.369623 3.381235 3.439704 2.406356 2.682681 0.786455 0.650363
P1-T3-SC03 1.040007 1.768412 3.342878 3.367999 0.07566 0.09953 1.257572 1.648292
P1-T3-SC04 1.02377 0.84128 3.404043 3.455899 0.75127 0.22703 0.67255 0.77011
P1-T3-SC05 1.203038 1.287485 3.451863 3.490703 1.471407 1.548617 1.379033 1.567274
P2-T1-SC02 1.23455 1.5278 1.39729 1.04859 1.49079 1.15447 0.651746 1.27029
P2-T1-SC03 0.58575 0.62161 0.7058 0.19813 0.58723 0.37891 3.375182 0.46219
P2-T1-SC04 0.37963 0.26402 0.39036 0.314308 0.31661 0.04038 0.142395 0.51576
P2-T2-SC01 0.120668 0.07455 0.22529 0.38568 0.18146 0.326939 3.407452 0.132823
P2-T2-SC02 0.554171 0.192753 0.552055 0.76726 0.480695 0.516554 3.40645 0.791045
P2-T2-SC03 0.86227 0.64839 0.98415 0.57626 0.360459 0.28382 3.270713 0.5153
P2-T2-SC04 0.567977 0.446662 0.782222 0.791022 0.608579 0.719615 3.33027 0.679459
P2-T2-SC05 1.36729 1.4123 1.35752 0.9899 1.47198 1.28018 0.27604 1.39038
P2-T3-SC01 0.11989 0.24571 0.19751 0.066731 0.19401 0.13065 0.042713 0.27871
P2-T3-SC03 0.2972 0.48935 0.51576 0.15125 0.2288 0.21747 0.16873 0.6326
P2-T3-SC04 0.002828 0.19328 0.09675 0.031594 0.19444 0.121302 0.217853 0.24304
P2-T3-SC05 0.10363 0.22122 0.13534 0.223063 0.23624 0.108731 0.310397 0.25407
表10 单细胞样本在各检测区域的判别矩阵
ChrArm chr16.p chr16.q chr17.p chr17.q chr18.p chr18.q chr19.p chr19.q
P1-T1-SC01 0.48371 0.29932 3.324975 3.415037 0.263 0.11755 0.3925 0.11798
P1-T1-SC02 0.71053 0.3929 3.343327 3.394798 0.17776 0.08259 0.45953 0.23104
P1-T1-SC03 0.91126 0.58255 3.364244 3.4358 0.19101 0.33018 0.68768 0.50598
P1-T2-SC02 1.97279 1.66973 2.923756 3.03316 1.39653 1.41981 1.5464 1.35413
P1-T2-SC03 1.192532 1.001616 3.3757 3.4214 1.592644 1.249224 0.862682 1.259275
P1-T2-SC04 1.493794 1.638588 3.415428 3.446237 1.693926 1.777324 1.083719 1.26667
P1-T3-SC02-1 0.448933 0.916762 3.342374 3.387701 0.862215 1.443727 0.465094 1.273081
P1-T3-SC03 0.5544 0.607397 3.268754 3.310842 0.65562 0.69016 3.070265 3.25488
P1-T3-SC04 1.11619 0.84839 3.321888 3.39257 0.51137 0.46377 0.597303 0.79583
P1-T3-SC05 1.273153 1.061051 3.400644 3.44686 1.232196 1.285412 1.084011 0.904898
P2-T1-SC02 1.04424 0.91478 1.223 0.93182 0.677793 1.06126 1.66072 1.47646
P2-T1-SC03 0.45425 0.1614 0.55419 0.18569 3.247803 0.42778 0.60762 0.41103
P2-T1-SC04 0.184 0.013587 0.00296 0.088048 0.0308 0.19806 0.103326 0.22473
P2-T2-SC01 0.573755 0.289674 0.311691 0.622995 3.237562 0.340575 0.279592 0.242114
P2-T2-SC02 0.5098 0.552774 0.760645 0.950295 3.376535 0.493983 0.600239 0.435251
P2-T2-SC03 0.14641 0.64463 0.67256 0.44712 3.123186 0.60385 1.13268 0.84456
P2-T2-SC04 0.913044 1.154027 0.74224 0.896403 3.179088 0.661405 0.893388 0.913063
P2-T2-SC05 1.1433 0.9521 1.21409 0.95963 0.019278 1.22662 1.35417 1.26871
P2-T3-SC01 0.153196 0.125187 0.05616 0.308972 0.12743 0.16729 0.32049 0.13821
P2-T3-SC03 0.28815 0.16242 0.26834 0.00283 3.27634 0.3748 0.60103 0.33323
P2-T3-SC04 0.1835 0.256057 0.042508 0.319515 0.126686 0.010104 0.00824 0.00802
P2-T3-SC05 0.110762 0.330788 0.173449 0.306996 0.063232 0.047509 0.1626 0.22737
表11 单细胞样本在各检测区域的判别矩阵
ChrArm chr20.p chr20.q chr21.p chr21.q chr22.q chr4.p chr4.q chr13.q
P1-T1-SC01 0.250209 0.24391 4.57859 0.31665 0.056642 0.00688 0.07341 0.27609
P1-T1-SC02 0.019063 0.52076 7.18939 0.50337 0.27281 0.10016 0.1455 0.40847
P1-T1-SC03 0.38142 0.52061 5.2653 0.69294 0.18783 0.459662 0.212164 0.62546
P1-T2-SC02 1.29174 1.57481 6.81298 1.77244 1.0582 1.24703 1.48513 1.5986
P1-T2-SC03 1.489424 1.142625 6.19569 1.076378 1.25462 1.139884 1.156234 0.901743
P1-T2-SC04 1.588124 1.673379 5.19629 1.613816 1.792669 1.722495 1.575256 1.684897
P1-T3-SC02-1 1.389442 0.929431 2.2056 1.441422 1.052147 1.158759 1.354226 0.734199
P1-T3-SC03 0.2418 0.37612 6.03375 0.39583 0.288859 0.00411 0.28304 0.63001
P1-T3-SC04 0.69459 0.85241 5.21955 1.05024 0.36173 0.59062 0.89126 0.90897
P1-T3-SC05 1.405852 1.294893 1.5673 1.254361 1.617852 1.41736 1.364605 1.524975
P2-T1-SC02 1.0085 0.86513 4.52451 0.35549 0.09263 0.07701 1.16922 1.1291
P2-T1-SC03 0.21426 0.09639 2.65407 2.294584 0.45069 2.294307 0.45786 0.37795
P2-T1-SC04 0.119008 0.562826 4.34505 0.34544 0.41464 0.51604 0.44254 0.344195
P2-T2-SC01 0.425776 0.595043 2.32775 2.4185 0.150469 2.408532 0.127112 0.308972
P2-T2-SC02 0.829805 0.654809 1.20743 2.718151 0.562105 2.67278 0.534062 0.537277
P2-T2-SC03 0.68781 0.45074 3.88642 2.806654 0.93701 1.659264 0.64103 0.75184
P2-T2-SC04 0.996605 0.93732 3.54327 2.500316 1.08687 2.468463 0.637645 0.824596
P2-T2-SC05 0.97027 0.79305 3.72439 0.20946 1.13684 0.72564 1.2104 0.95349
P2-T3-SC01 0.05907 0.278775 3.4967 0.25948 0.25456 0.37309 0.27227 0.05014
P2-T3-SC03 0.05192 0.266404 4.36835 2.314219 0.29418 2.286761 0.482 3.225076
P2-T3-SC04 0.188291 0.345729 4.71343 0.04006 0.114816 0.06601 0.05176 0.151685
P2-T3-SC05 0.310038 0.434894 3.4626 0.19322 0.107909 0.32883 0.16486 0.127057
表12 单细胞样本在各检测区域的判别矩阵
ChrArm chr5.p chr5.q chr6.p chr6.q chr7.p chr7.q chr8.p chr8.q
P1-T1-SC01 0.58354 0.09256 0.33354 0.18132 0.41603 0.2333 0.53994 0.35422
P1-T1-SC02 0.44738 0.2132 0.49561 0.25623 0.48533 0.32616 0.40124 0.50957
P1-T1-SC03 0.89031 0.55082 0.6992 0.6011 0.466497 0.545966 0.005299 0.12368
P1-T2-SC02 1.89387 1.49695 1.59824 1.50244 1.59937 1.50534 1.69531 1.75583
P1-T2-SC03 0.893247 0.997055 1.057587 1.101414 0.995739 0.677401 0.766751 0.69687
P1-T2-SC04 1.349402 1.764336 1.836016 1.634724 1.250049 1.287844 1.278159 1.134782
P1-T3-SC02-1 0.859735 1.053657 1.151419 1.169121 0.286712 0.497171 0.783009 0.140953
P1-T3-SC03 1.641235 1.841369 0.31362 0.22392 3.338844 2.912932 0.71945 0.59761
P1-T3-SC04 1.06235 0.69192 0.76897 0.82574 0.72264 0.69768 0.96305 1.05502
P1-T3-SC05 1.579281 1.494058 1.648587 1.425412 0.874604 0.838399 1.305442 1.100264
P2-T1-SC02 1.28958 0.105 0.89111 1.40838 1.27001 1.65328 1.19105 1.17446
P2-T1-SC03 0.58009 2.488324 0.15614 0.82289 0.60182 0.96477 0.52599 0.43879
P2-T1-SC04 0.585 0.33594 0.041051 0.72619 0.44122 0.67711 0.2674 0.138037
P2-T2-SC01 0.031949 2.515432 0.651119 0.165574 0.14557 0.21119 0.229313 0.094144
P2-T2-SC02 0.512867 2.744204 0.881304 0.333195 0.504665 0.163163 0.755841 0.67096
P2-T2-SC03 1.16129 2.351226 0.44767 1.11069 0.61694 1.1773 0.50247 0.38826
P2-T2-SC04 0.294353 2.759459 0.933244 0.287149 0.5762 0.421701 0.609536 0.614517
P2-T2-SC05 1.33298 0.42946 0.93032 1.5979 1.3226 1.61186 1.26545 1.22002
P2-T3-SC01 0.35211 0.10069 0.165624 0.43252 0.1898 0.45815 0.01288 0.08194
P2-T3-SC03 0.52075 2.455182 0.11731 0.73416 0.33028 0.60586 0.3229 0.2891
P2-T3-SC04 0.08149 0.12052 0.262918 0.20871 0.08931 0.24908 0.059932 0.160079
P2-T3-SC05 0.17623 0.032613 0.292619 0.18877 0.011665 0.34479 0.084661 0.10386
表13 单细胞样本在各检测区域的判别矩阵
ChrArm chr2.p chr2.q chr3.p chr3.q chr9.p chr9.q chr14.q chr15.q
P1-T1-SC01 0.40563 0.1171 0.055 0.16475 1.565971 0.163061 0.29951 0.019152
P1-T1-SC02 3.436784 3.410873 0.14267 0.35614 1.164875 0.13523 0.50618 0.18561
P1-T1-SC03 0.63962 0.32064 0.339962 0.059227 1.187032 0.32635 0.53405 0.31168
P1-T2-SC02 1.62048 1.27648 1.2885 1.60427 0.585824 1.09828 1.52075 1.24983
P1-T2-SC03 1.03575 1.185398 3.47999 3.488649 1.979353 1.109522 1.127235 1.294151
P1-T2-SC04 1.583097 1.612971 1.618724 1.507538 2.260389 1.273223 1.588226 1.675999
P1-T3-SC02-1 3.394691 3.40866 1.410798 1.053639 1.648108 0.891025 1.034597 0.810444
P1-T3-SC03 1.637445 1.712669 0.66943 0.97266 0.98666 0.701408 0.76819 3.298626
P1-T3-SC04 0.88896 0.64954 0.60814 0.88756 1.129385 0.45381 0.81742 0.334355
P1-T3-SC05 1.177743 1.526339 1.275577 1.35368 1.941831 1.309002 1.446905 1.475971
P2-T1-SC02 1.23784 0.86134 0.89307 1.26767 0.181037 1.28277 1.18991 1.37701
P2-T1-SC03 0.54064 0.22423 0.27463 0.67164 2.571282 0.49471 0.14064 0.47375
P2-T1-SC04 0.34529 0.00874 0.07332 0.33639 0.045406 0.30113 0.53149 0.30988
P2-T2-SC01 0.193266 0.645807 0.346623 0.167632 2.598953 0.237964 0.626873 0.237045
P2-T2-SC02 0.427191 0.76498 0.846616 0.500344 2.778863 0.514579 0.768237 0.539215
P2-T2-SC03 0.5686 0.591385 0.745434 0.136693 2.382748 0.96837 1.153696 0.122238
P2-T2-SC04 0.472726 0.66743 0.681 0.585902 2.868924 0.672659 0.79821 0.626052
P2-T2-SC05 1.29275 1.00624 0.99727 1.32411 0.20808 1.3977 1.2544 1.33023
P2-T3-SC01 0.07614 0.025998 0.03611 0.33856 0.146947 0.12145 0.38623 0.11949
P2-T3-SC03 0.34954 0.13276 0.19842 0.48712 2.681626 0.48358 0.02321 0.49985
P2-T3-SC04 0.040098 0.125575 0.17958 0.07461 0.323163 0.02367 0.20744 0.02467
P2-T3-SC05 0.064307 0.134118 0.151593 0.04385 0.243288 0.14167 0.30779 0.05413
本例中,i表示染色体臂的编号i∈1,2,……,40;j表示单细胞的编号j∈1,2,3,4,…22。另外,本例中Zij’大于2.24,为离群值,说明此染色体臂发生了LOH,记为1;小于或等于2.24即为正常,记为0;并且,Fij小于中位数MF的染色体臂,我们记为0,最后获得LOH结果表,如表14至表17所示。使用R语言中NMF包,以热图的形式进行展示如图1,深灰色表示此染色体臂发生杂合缺失,而浅灰色的表示正常。
表14 LOH检测结果矩阵
Sample chr1.p chr1.q chr10.p chr10.q chr11.p chr11.q chr12.p chr12.q chr13.q chr14.q
P1-T1-SC01 0 0 1 1 1 1 0 0 0 0
P1-T1-SC02 0 0 1 1 1 1 0 0 0 0
P1-T1-SC03 0 0 1 1 0 1 0 0 0 0
P1-T2-SC02 0 0 1 1 0 0 0 0 0 0
P1-T2-SC03 0 0 1 1 1 1 0 0 0 0
P1-T2-SC04 0 0 1 1 1 1 0 0 0 0
P1-T3-SC02-1 0 0 1 1 1 1 0 0 0 0
P1-T3-SC03 0 0 1 1 0 0 0 0 0 0
P1-T3-SC04 0 0 1 1 0 0 0 0 0 0
P1-T3-SC05 0 0 1 1 0 0 0 0 0 0
P2-T1-SC02 0 0 0 0 0 0 0 0 0 0
P2-T1-SC03 0 0 0 0 0 0 1 0 0 0
P2-T1-SC04 0 0 0 0 0 0 0 0 0 0
P2-T2-SC01 0 0 0 0 0 0 1 0 0 0
P2-T2-SC02 0 0 0 0 0 0 1 0 0 0
P2-T2-SC03 0 0 0 0 0 0 1 0 0 0
P2-T2-SC04 0 0 0 0 0 0 1 0 0 0
P2-T2-SC05 0 0 0 0 0 0 0 0 0 0
P2-T3-SC01 0 0 0 0 0 0 0 0 0 0
P2-T3-SC03 0 0 0 0 0 0 0 0 1 0
P2-T3-SC04 0 0 0 0 0 0 0 0 0 0
P2-T3-SC05 0 0 0 0 0 0 0 0 0 0
表15 LOH检测结果矩阵
Sample chr15.q chr16.p chr16.q chr17.p chr17.q chr18.p chr18.q chr19.p chr19.q chr2.p
P1-T1-SC01 0 0 0 1 1 0 0 0 0 0
P1-T1-SC02 0 0 0 1 1 0 0 0 0 1
P1-T1-SC03 0 0 0 1 1 0 0 0 0 0
P1-T2-SC02 0 0 0 1 1 0 0 0 0 0
P1-T2-SC03 0 0 0 1 1 0 0 0 0 0
P1-T2-SC04 0 0 0 1 1 0 0 0 0 0
P1-T3-SC02-1 0 0 0 1 1 0 0 0 0 1
P1-T3-SC03 1 0 0 1 1 0 0 1 1 0
P1-T3-SC04 0 0 0 1 1 0 0 0 0 0
P1-T3-SC05 0 0 0 1 1 0 0 0 0 0
P2-T1-SC02 0 0 0 0 0 0 0 0 0 0
P2-T1-SC03 0 0 0 0 0 1 0 0 0 0
P2-T1-SC04 0 0 0 0 0 0 0 0 0 0
P2-T2-SC01 0 0 0 0 0 1 0 0 0 0
P2-T2-SC02 0 0 0 0 0 1 0 0 0 0
P2-T2-SC03 0 0 0 0 0 1 0 0 0 0
P2-T2-SC04 0 0 0 0 0 1 0 0 0 0
P2-T2-SC05 0 0 0 0 0 0 0 0 0 0
P2-T3-SC01 0 0 0 0 0 0 0 0 0 0
P2-T3-SC03 0 0 0 0 0 1 0 0 0 0
P2-T3-SC04 0 0 0 0 0 0 0 0 0 0
P2-T3-SC05 0 0 0 0 0 0 0 0 0 0
表16 LOH检测结果矩阵
Sample chr2.q chr20.p chr20.q chr21.p chr21.q chr22.q chr3.p chr3.q chr4.p chr4.q
P1-T1-SC01 0 0 0 0 0 0 0 0 0 0
P1-T1-SC02 1 0 0 0 0 0 0 0 0 0
P1-T1-SC03 0 0 0 0 0 0 0 0 0 0
P1-T2-SC02 0 0 0 0 0 0 0 0 0 0
P1-T2-SC03 0 0 0 0 0 0 1 1 0 0
P1-T2-SC04 0 0 0 0 0 0 0 0 0 0
P1-T3-SC02-1 1 0 0 0 0 0 0 0 0 0
P1-T3-SC03 0 0 0 0 0 0 0 0 0 0
P1-T3-SC04 0 0 0 0 0 0 0 0 0 0
P1-T3-SC05 0 0 0 0 0 0 0 0 0 0
P2-T1-SC02 0 0 0 0 0 0 0 0 0 0
P2-T1-SC03 0 0 0 0 1 0 0 0 1 0
P2-T1-SC04 0 0 0 0 0 0 0 0 0 0
P2-T2-SC01 0 0 0 0 1 0 0 0 1 0
P2-T2-SC02 0 0 0 0 1 0 0 0 1 0
P2-T2-SC03 0 0 0 0 1 0 0 0 0 0
P2-T2-SC04 0 0 0 0 1 0 0 0 1 0
P2-T2-SC05 0 0 0 0 0 0 0 0 0 0
P2-T3-SC01 0 0 0 0 0 0 0 0 0 0
P2-T3-SC03 0 0 0 0 1 0 0 0 1 0
P2-T3-SC04 0 0 0 0 0 0 0 0 0 0
P2-T3-SC05 0 0 0 0 0 0 0 0 0 0
表17 LOH检测结果矩阵
Sample chr5.p chr5.q chr6.p chr6.q chr7.p chr7.q chr8.p chr8.q chr9.p chr9.q
P1-T1-SC01 0 0 0 0 0 0 0 0 0 0
P1-T1-SC02 0 0 0 0 0 0 0 0 0 0
P1-T1-SC03 0 0 0 0 0 0 0 0 0 0
P1-T2-SC02 0 0 0 0 0 0 0 0 0 0
P1-T2-SC03 0 0 0 0 0 0 0 0 0 0
P1-T2-SC04 0 0 0 0 0 0 0 0 1 0
P1-T3-SC02-1 0 0 0 0 0 0 0 0 0 0
P1-T3-SC03 0 0 0 0 1 1 0 0 0 0
P1-T3-SC04 0 0 0 0 0 0 0 0 0 0
P1-T3-SC05 0 0 0 0 0 0 0 0 0 0
P2-T1-SC02 0 0 0 0 0 0 0 0 0 0
P2-T1-SC03 0 1 0 0 0 0 0 0 1 0
P2-T1-SC04 0 0 0 0 0 0 0 0 0 0
P2-T2-SC01 0 1 0 0 0 0 0 0 1 0
P2-T2-SC02 0 1 0 0 0 0 0 0 1 0
P2-T2-SC03 0 1 0 0 0 0 0 0 1 0
P2-T2-SC04 0 1 0 0 0 0 0 0 1 0
P2-T2-SC05 0 0 0 0 0 0 0 0 0 0
P2-T3-SC01 0 0 0 0 0 0 0 0 0 0
P2-T3-SC03 0 1 0 0 0 0 0 0 1 0
P2-T3-SC04 0 0 0 0 0 0 0 0 0 0
P2-T3-SC05 0 0 0 0 0 0 0 0 0 0
从检测结果中可以看出来,在22个脑瘤单细胞样本中,LOH主要发生在chr4.p,chr5.q,chr9.q,chr10.p,chr10.q,chr11.p,chr11.q,chr12.p,chr17.p,chr17.q,chr18.p,chr21.q染色体臂上,至少出现在5个样本以上,而其他的染色体臂上没有发生LOH或只有1个细胞在此区域发生。LOH在细胞间具有很强的异质性。
对比例
本例对两个脑瘤病人的6块肿瘤组织和2块正常的血组织,通过CG的常规流程进行DNA提取和建库,然后进行全基因组测序,得到下机数据,实验中使用的试剂为CG的常规试剂。本例使用华大基因的CG的标准分析流程进行数据处理。测序和数据处理都在华大基因完成。
对于此实施例中的组织测序,我们基于100kb窗口中所有检测到的变异位点,其所有比对上的序列数目进行估计LAF(LesserAllele Fraction),LAF是CG测序分析中的一种概念,与B等位基因频率类似,指在一个样本中等位基因中不大于50%等位基因比率,取值范围为0~0.5。对于检测出来的LAF结果,使用R语言中ggplot2包,以点图的形式进行展示如图2,图3。LAF等于或者接近于0.5,说明此检测区域没有发生杂合缺失,如图2中的区域A,图3的区域D。LAF小于0.5,并且在延伸区域LAF的值保持一致,说明此延伸区域发生杂合缺失如图2中区域B和C,图3的区域E。
根据单细胞LOH检测结果和组织样本中结果的对比发现,在组织样品中检测的LOH,在22个单细胞样品中,至少有一个样本的相同区域也检测到LOH,说明我们的检测方法和针对组织样品的CG标准分析流程的检测结果是一致的,我们的检测方法可以用来检测LOH。同时在组织水平未能检测到的LOH的区域,在单细胞样本中却检测出来,说明本申请的方法可以检测单细胞水平LOH的异质性。
以上内容是结合具体的实施方式对本申请所作的进一步详细说明,不能认定本申请的具体实施只局限于这些说明。对于本申请所属技术领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干简单推演或替换,都应当视为属于本申请的保护范围。

Claims (6)

1.一种杂合性缺失的检测方法,其特征在于:包括以下步骤,
(1)提取组织样品,分离获得单个细胞,提取单细胞的核酸,并采用全基因组扩增方法对所提取的核酸进行扩增,建库后上机测序,得到单细胞的全基因组测序;
(2)将步骤(1)获得的全基因组测序与参考基因序列进行比对,检测单细胞的SNP,得到单细胞全基因组上的单核苷酸多态性位点的基因型数据,并按照过滤标准对潜在的假阳性SNP位点进行过滤,得到高质量SNP数据;
(3)下载dbSNP数据库中与组织样品对应的所有SNP位点数据,过滤掉dbSNP数据库中在千人基因组中SNP频率低于5%的SNP位点,剩下的SNP位点作为背景SNP位点集;
(4)采用步骤(2)得到的高质量SNP数据,对于每个单细胞,以染色体臂为一个检测区域,统计各检测区域的SNP位点与背景SNP位点集的交集,计数为Ti,并统计纯合SNP和杂合SNP位点,纯合SNP计数为Nij
(5)计算每个单细胞中各个检测区域的纯合SNP位点频率Fij,计算公式为Fij=Nij÷Ti×100%,得到各个检测区域的纯合SNP位点频率矩阵;
(6)用hampel identifier法找纯合SNP位点频率Fij中的离群点,离群点所在的检测区域,即判定该染色体臂有发生杂合性缺失;
所述步骤(6)用hampel identifier法找离群点具体包括,(a)找出所有检测区域的纯合SNP位点频率Fij的中位数MF,(b)计算每个纯合SNP位点频率Fij与中位数MF的差值,取差值的绝对值即各纯合SNP位点的绝对中位差|Fij-MF|,得到绝对中位差矩阵,其中染色体臂纯合率Fij小于中位数MF的判定该染色体臂没有发生杂合性缺失,(c)找出各纯合SNP位点的绝对中位差的中位数MAD,按公式计算Zij’=(|Fij-MF|)÷(MAD÷0.6745),Zij’大于2.24,为离群点,即判定该染色体臂有发生杂合性缺失;
其中,i表示染色体臂的编号,j表示单细胞的编号。
2.根据权利要求1所述的检测方法,其特征在于:所述步骤(2)中,过滤标准为,过滤去除序列reads支持数少于6的SNP,去除SNP质量少于20的SNP,去除链特异性的SNP,去除SNP位点的间距少于5bp的SNP。
3.根据权利要求1所述的检测方法,其特征在于:所述步骤(2)中,检测单细胞的SNP所采用的软件为GATK、samtools或SOAPsnp。
4.根据权利要求1所述的检测方法,其特征在于:所述步骤(2)中,将步骤(1)获得的全基因组测序与参考基因序列进行比对所采用的软件为SOAP、BWA或bowtie。
5.根据权利要求1-4任一项所述的检测方法在检测人类癌症细胞的杂合性缺失中的应用。
6.根据权利要求1-4任一项所述的检测方法在制备杂合性缺失检测试剂盒或检测设备中的应用。
CN201510050352.2A 2015-01-30 2015-01-30 一种杂合性缺失的检测方法 Active CN105986011B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510050352.2A CN105986011B (zh) 2015-01-30 2015-01-30 一种杂合性缺失的检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510050352.2A CN105986011B (zh) 2015-01-30 2015-01-30 一种杂合性缺失的检测方法

Publications (2)

Publication Number Publication Date
CN105986011A CN105986011A (zh) 2016-10-05
CN105986011B true CN105986011B (zh) 2019-10-15

Family

ID=57036956

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510050352.2A Active CN105986011B (zh) 2015-01-30 2015-01-30 一种杂合性缺失的检测方法

Country Status (1)

Country Link
CN (1) CN105986011B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107287285A (zh) * 2017-03-28 2017-10-24 上海至本生物科技有限公司 一种预测同源重组缺失机制及患者对癌症治疗响应的方法
WO2021037016A1 (en) * 2019-08-30 2021-03-04 The Chinese University Of Hong Kong Methods for detecting absence of heterozygosity by low-pass genome sequencing
CN113113081B (zh) * 2020-08-31 2021-12-14 东莞博奥木华基因科技有限公司 基于CNV-seq测序数据检测多倍体和基因组纯合区域ROH的系统
CN112509638B (zh) * 2020-12-04 2021-12-03 深圳荻硕贝肯精准医学有限公司 人类hla染色体区域杂合性缺失的分析方法和分析处理装置
CN113257346B (zh) * 2021-06-28 2021-10-19 北京橡鑫生物科技有限公司 一种基于低深度WGS评估HRD score的方法

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006519977A (ja) * 2002-11-11 2006-08-31 アフィメトリックス インコーポレイテッド Dnaコピー数変化を同定するための方法
CN1920054A (zh) * 2006-06-23 2007-02-28 南京中医药大学附属医院 乳腺癌基因1(brca1)突变检测分析
WO2011083312A1 (en) * 2010-01-08 2011-07-14 Oxford Gene Technology (Operations) Ltd Combined cgh & allele-specific hybridisation method
US9646134B2 (en) * 2010-05-25 2017-05-09 The Regents Of The University Of California Bambam: parallel comparative analysis of high-throughput sequencing data
CN107368705B (zh) * 2011-04-14 2021-07-13 完整基因有限公司 分析生物体的基因组dna的方法和计算机系统

Also Published As

Publication number Publication date
CN105986011A (zh) 2016-10-05

Similar Documents

Publication Publication Date Title
Marwaha et al. A guide for the diagnosis of rare and undiagnosed disease: beyond the exome
Rutledge et al. Plasmodium malariae and P. ovale genomes provide insights into malaria parasite evolution
CN105986011B (zh) 一种杂合性缺失的检测方法
Chen et al. The reverse evolution from multicellularity to unicellularity during carcinogenesis
Houston et al. Development and validation of a high density SNP genotyping array for Atlantic salmon (Salmo salar)
Zheng et al. Major population expansion of East Asians began before neolithic time: evidence of mtDNA genomes
Genovese et al. Using population admixture to help complete maps of the human genome
Natri et al. Genome-wide DNA methylation and gene expression patterns reflect genetic ancestry and environmental differences across the Indonesian archipelago
JP6681475B2 (ja) がん患者のゲノム塩基配列変異情報と生存情報を利用したカスタマイズ型の薬物選択方法及びシステム
Xiao et al. Gene map of large yellow croaker (Larimichthys crocea) provides insights into teleost genome evolution and conserved regions associated with growth
CN112226495A (zh) 一种dna同源重组异常的检测方法及其应用
Keel et al. Genome‐wide copy number variation in the bovine genome detected using low coverage sequence of popular beef breeds
Hills et al. BAIT: Organizing genomes and mapping rearrangements in single cells
Xi et al. A survey of copy‐number variation detection tools based on high‐throughput sequencing data
Armstrong et al. Genomic associations with bill length and disease reveal drift and selection across island bird populations
Mueller et al. Characterization of the genome and transcriptome of the blue tit C yanistes caeruleus: polymorphisms, sex‐biased expression and selection signals
Wasakul et al. Malaria outbreak in Laos driven by a selective sweep for Plasmodium falciparum kelch13 R539T mutants: a genetic epidemiology analysis
Peng et al. Profiling miRNAs in nasopharyngeal carcinoma FFPE tissue by microarray and Next Generation Sequencing
Bredemeyer et al. Rapid macrosatellite evolution promotes X-linked hybrid male sterility in a feline interspecies cross
Sakaue et al. Decoding the diversity of killer immunoglobulin-like receptors by deep sequencing and a high-resolution imputation method
Sun et al. Deciphering the correlation between breast tumor samples and cell lines by integrating copy number changes and gene expression profiles
Lazar et al. High-resolution genome-wide mapping of chromosome-arm-scale truncations induced by CRISPR-Cas9 editing
Gómez-Hernández et al. Evaluation of the multispecies coalescent method to explore intra-Trypanosoma cruzi I relationships and genetic diversity
Zhang et al. NyuWa Genome Resource: Deep Whole Genome Sequencing Based Chinese Population Variation Profile and Reference Panel
CN114974432A (zh) 一种生物标志物的筛选方法及其相关应用

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 1227443

Country of ref document: HK

GR01 Patent grant
GR01 Patent grant