CN105986011B - 一种杂合性缺失的检测方法 - Google Patents
一种杂合性缺失的检测方法 Download PDFInfo
- Publication number
- CN105986011B CN105986011B CN201510050352.2A CN201510050352A CN105986011B CN 105986011 B CN105986011 B CN 105986011B CN 201510050352 A CN201510050352 A CN 201510050352A CN 105986011 B CN105986011 B CN 105986011B
- Authority
- CN
- China
- Prior art keywords
- snp
- heterozygosity
- detection
- loss
- snp site
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Abstract
本申请公开了一种杂合性缺失的检测方法,本申请的检测方法以单细胞测序为基础,以dbSNP数据库为背景,以染色体臂为检测单元,对单个细胞的SNP位点进行分析,并通过hampel identifier法判断离群点,鉴别出杂合性缺失,从而检测获得准确的单个细胞的杂合性缺失信息。本申请的检测方法率先在单细胞全基因组上水平检测各个细胞的杂合性缺失;以染色体臂为检测单元,检测精度高;开辟了单细胞杂合性缺失检测先河;为单个细胞差异的鉴别,以及肿瘤组织中细胞的异质性研究奠定了基础;不仅可以用于推断肿瘤的发生发展过程,了解肿瘤克隆演化的类型;而且对不同病患或不同时期的用药或用药效果分析等也具有重要意义。
Description
技术领域
本申请涉及基因检测领域,特别是涉及一种杂合性缺失的检测方法。
背景技术
单细胞全基因组测序是在单细胞水平对全基因组进行扩增测序的新技术,其主要包括单细胞的分离,单细胞遗传物质的提取与扩增,以及二代测序三个步骤。随着测序技术的发展,尤其是全基因组扩增方法的改善及新方法的提出,使得癌症单个细胞基因组分析成为可能。
基因组突变是癌症发生发展的重要因子。与癌症病人的正常细胞相比,癌症细胞的基因组有很多序列改变的特征,从单碱基的改变到染色体大片段的插入或缺失,甚至全基因组的重复。其中杂合性缺失(loss ofheterogeneous,缩写LOH)是基因组上的杂合位点的两个等位基因,其中一个部分或全部丢失,表现为未缺失等位基因的纯合子,导致缺失的等位基因不能表达。在肿瘤单细胞研究中,癌症基因组上杂合性缺失是一种普遍存在的现象,抑癌基因的杂合性缺失与多种肿瘤的发生发展息息相关。通过肿瘤杂合性缺失的检测,可以协助确定肿瘤克隆演化的类型。
现有的检测杂合性缺失的方法都是基于组织水平,如ASCAT(allele-specificcopy number analysis oftumors),其原理为比较正常组织和肿瘤组织中相同位点的单核苷酸多态性(single nucleotide polymorphism,SNP)类型,算出相应位点的基因型频率,来构建基因组水平的杂合缺失文库。这种方法需要大量对照组的相同位点的SNP信息;并且,这种检测方法是肿瘤组织层面的杂合性缺失检测,是多个细胞的平均值,由于肿瘤异质性的特点,这种检测方法难以说明单个肿瘤细胞的准确的杂合性缺失情况。
发明内容
本申请的目的是提供一种新的杂合性缺失的检测方法。
为了实现上述目的,本申请采用了以下技术方案:
本申请公开了一种杂合性缺失的检测方法,其特征在于:包括以下步骤,
(1)提取组织样品,分离获得单个细胞,提取单细胞的核酸,并采用全基因组扩增方法对所提取的核酸进行扩增,建库后上机测序,得到单细胞的全基因组测序;
(2)将步骤(1)获得的全基因组测序与参考基因序列进行比对,检测单细胞的SNP,得到单细胞全基因组上的单核苷酸多态性位点的基因型数据,并按照过滤标准对潜在的假阳性SNP位点进行过滤,得到高质量SNP数据;
(3)下载dbSNP数据库中与组织样品对应的所有SNP位点数据,过滤掉dbSNP数据库中在千人基因组中SNP频率低于5%的SNP位点,剩下的SNP位点作为背景SNP位点集;
(4)采用步骤(2)得到的高质量SNP数据,对于每个单细胞,以染色体臂为一个检测区域,统计各检测区域的SNP位点与背景SNP位点集的交集,计数为Ti,并统计纯合SNP和杂合SNP位点,纯合SNP计数为Nij;
(5)计算每个单细胞中各个检测区域的纯合SNP位点频率Fij,计算公式为Fij=Nij÷Ti×100%,得到各个检测区域的纯合SNP位点频率矩阵;
(6)用hampel identifier法找纯合SNP位点频率Fij中的离群点,离群点所在的检测区域,即判定该染色体臂有发生杂合性缺失;
其中,i表示染色体臂的编号,j表示单细胞的编号。
需要说明的是,本申请的关键在于利用单细胞测序技术,对单个癌细胞或肿瘤细胞进行分析,并采用现有的dbSNP数据库为背景,以染色体臂为一个检测单元,创造性的采用hampel identifier法对离群点进行分析,从而判定染色体臂的杂合性缺失。可以理解,除此以外,例如单个细胞的获得、单细胞核酸提取、单细胞测序,测序结果的比对和SNP的检测都可以参考现有技术进行;本申请的优选方案中,为了保障检测结果,优选的采用SOAP或BWA软件对步骤(1)的测序结果进行比对,并优选的采用GATK、samtools或SOAPsnp进行SNP检测。
还需要说明的是,步骤(3)中“下载dbSNP数据库中与组织样品对应的所有SNP位点数据”,“与组织样品对应的”是指组织样品来源相对应的,例如本申请的一种实现方式中,具体对人的癌细胞进行杂合性缺失检测,则下载了人的所有SNP位点数据。可以理解,如果是对其它动物的肿瘤细胞进行的杂合性缺失检测,则需要下载对应的该动物的所有SNP位点数据;当然,前提是dbSNP数据库中有这些数据。
本申请的步骤(3)中,千人基因组中SNP频率是指,SNP频率=千人基因组中有此SNP的样本数目÷1000,本申请中过滤掉千人基因组中SNP频率低于5%的SNP,其中5%是一个经验概率,具有统计学意义,可以理解,该值同样并不是唯一不变的,在试验允许的条件下,对该值进行细微调整同样属于本申请的保护范围。步骤(2)中,所谓高质量的SNP数据是指排除各种假阳性的SNP后,可信度高的SNP数据,具体过滤标准可以参考现有的SNP分析方法中对SNP的分析判定标准。
优选的,步骤(2)中,过滤标准为,过滤去除序列reads支持数少于6的SNP,去除SNP质量少于20的SNP,去除链特异性的SNP,去除SNP位点的间距少于5bp的SNP。
需要说明的是,本申请的步骤(2)中,与全基因组测序比对的参考基因序列为,从NCBI或其他数据库下载的与本申请所测序的单细胞对应的物种基因组序列。过滤标准采用Hou et al.2012中披露的标准,可以理解,本申请采用的过滤标准中序列reads支持数和SNP质量的具体值并不是唯一不变的,根据不同的试验条件和实际需求,对“序列reads支持数少于6,SNP质量少于20”进行细微的调整同样属于本申请的保护范围;过滤标准中,链特异性的SNP是指,遗传物质具有互补双链结构,其中一条链的测序深度和其互补链测序深度相差甚大的SNP。过滤标准的出处详见文献:Hou Y,et al.2012.Single-cell exomesequencing and monoclonal evolution of a JAK2-negative myeloproliferativeneoplasm.Cell 148:873-885。还需要说明的是,Hou et al.的过滤标准只是获得高质量SNP数据的一种优选方案,不排除其它可以获得高质量的SNP数据的过滤标准同样适用于本申请。
优选的,步骤(6)用hampel identifier法找离群点具体包括,(a)找出所有检测区域的纯合SNP位点频率Fij的中位数MF,(b)计算每个纯合SNP位点频率Fij与中位数MF的差值,取差值的绝对值即各纯合SNP位点的绝对中位差|Fij-MF|,得到绝对中位差矩阵,其中染色体臂纯合率Fij小于中位数MF的判定该染色体臂没有发生杂合性缺失,(c)找出各纯合SNP位点的绝对中位差的中位数MAD,按公式计算Zij’=(|Fij-MF|)÷(MAD÷0.6745),Zij’大于2.24,为离群点,即判定该染色体臂有发生杂合性缺失。
需要说明的是,染色体臂纯合率小于平均值的判定该染色体臂没有发生杂合性缺失,这是根据LOH的特征进行判断的,本申请的研究过程中,发明人发现,发生LOH的位点其杂合性部分或全部丢失,因此其纯合率应该升高,所以如果染色体臂纯合率小于平均值,也就是纯合率降低的位点,判断为没有发生LOH。需要补充说明的是,在本申请的一种实现方式中,将没有发生LOH的位点赋值为0,发生LOH的位点赋值为1,以便统计分析。
优选的,步骤(2)中,检测单细胞的SNP所采用的软件为GATK、samtools或SOAPsnp。
优选的,步骤(2)中,将步骤(1)获得的全基因组测序与参考基因序列进行比对所采用的软件为SOAP、BWA或bowtie。
本申请的杂合性缺失的检测方法是以人类癌症细胞为基础研究出来的,其主要目的是研究人类癌症细胞单个细胞的杂合性缺失,研究各个细胞的差异,进而分析推断肿瘤的发生发展过程;因此,本申请的另一面提供了本申请的检测方法在检测人类癌症细胞的杂合性缺失中的应用。可以理解,通过对单个细胞的杂合性缺失检测,不仅可以用于推断肿瘤的发生发展过程;而且对不同病患或不同时期的用药或用药效果分析等也是具有重要意义的。
可以理解,在本申请的检测方法的基础上,可以利用本申请的检测方法制备出杂合性缺失检测的试剂盒,与其他自动化设备或检测平台结合,还可以制备出杂合性缺失检测的专用检测设备;因此,本申请的再一面还提供了本申请的检测方法在制备杂合性缺失检测试剂盒或检测设备中的应用。
由于采用以上技术方案,本申请的有益效果在于:
本申请的杂合性缺失检测方法率先在单细胞全基因组上水平检测各个细胞的杂合性缺失;并且以染色体臂为检测单元,检测精度高。本申请的检测方法开辟了单细胞杂合性缺失检测先河,为单个细胞差异的鉴别,以及肿瘤组织中细胞的异质性研究奠定了基础;不仅可以用于推断肿瘤的发生发展过程,了解肿瘤克隆演化的类型;而且对不同病患或不同时期的用药或用药效果分析等也具有重要意义。
附图说明
图1是本申请实施例中单细胞杂合性缺失结果图;
图2是本申请实施例中病人1三块组织检测杂合性缺失的结果图;
图3是本申请实施例中病人2三块组织检测杂合性缺失的结果图。
具体实施方式
本申请的方法只需要公共数据库dbsnp中的数据,更简单方便;并且,基于单细胞全基因高深度测序,考虑到单细胞测序的扩增偏向性,以染色体臂为检测单元,根据dbSNP库中每个检测单元内SNP的频率分布,从而得到准确的杂合性缺失情况,提高了检测精度。
本申请中,i表示染色体臂的编号,j表示单细胞的编号;Ti表示编号为i的染色体臂与背景SNP位点集的交集SNP位点个数;Nij表示编号j的单细胞中编号i的染色体臂中纯合SNP的个数;Fij表示编号j的单细胞中编号i的染色体臂中纯合SNP的出现频率;MF表示统计的所有Fij的中位数;|Fij-MF|表示Fij与MF的差的绝对值;MAD表示统计的所有|Fij-MF|的中位数;Zij’表示编号j的单细胞中编号i的染色体臂其纯合SNP是否为极端值,即是否为离群点的判断分数。
下面通过具体实施例和附图对本申请作进一步详细说明。以下实施例仅对本申请进行进一步说明,不应理解为对本申请的限制。
实施例
分别提取2个脑瘤病人的3块肿瘤组织,病人1的3块肿瘤组织分别标记为P1-T1、P1-T2、P1-T3,病人2的3块肿瘤组织分别标记为P2-T1、P2-T2、P2-T3。从这6块组织分别分选出3~5个单细胞,共22个单细胞,按照如下方法测定各个单细胞的杂合性缺失:
(1)从肿瘤患者的组织样品,使用流式细胞仪分离得到单个细胞,提取单个细胞的核酸并采用全基因组扩增方法进行扩增,进行常规建库后进行上机测序,得到单细胞全基因组测序下机序列;全基因组扩增方法包括简并核苷酸引物PCR(DOP-PCR),多重置换扩增(MDA)或多次退火环状循环扩增(MALBAC),可选其中任何一种,获得足够建库的核酸量,本例具体采用多重置换扩增(MDA)方法。上机测序本例采用CG测序仪。需要说明的是,测序建库采用标准的CG建库流程,MDA参考CG测序仪的使用说明,在此不累述。
(2)将步骤(1)获得的全基因组测序结果,进行CG标准分析,并获得与参考基因序列进行比对的比对结果,使用samtools检测SNP,得到单个细胞全基因组上的单核苷酸多态性位点的基因型数据,对各个单细胞样本检测得到的所有SNP位点进行过滤,过滤标准是,序列reads支持数少于6,SNP质量少于20,去除链特异性的SNP,去除SNP cluster;
(3)下载dbSNP数据库中人的所有SNP位点数据,过滤掉在所有单细胞样本中出现频率低于5%的SNP位点,作为背景SNP位点集;
(4)对于每个单细胞,以染色体臂为一个检测区域包含chr1.p,chr1.q,chr10.p,chr10.q,chr11.p,chr11.q,chr12.p,chr12.q,chr13.q,chr14.q,chr15.q,chr16.p,chr16.q,chr17.p,chr17.q,chr18.p,chr18.q,chr19.p,chr19.q,chr2.p,chr2.q,chr20.p,chr20.q,chr21.p,chr21.q,chr22.q,chr3.p,chr3.q,chr4.p,chr4.q,chr5.p,chr5.q,chr6.p,chr6.q,chr7.p,chr7.q,chr8.p,chr8.q,chr9.p,chr9.q,一共40个染色体臂,统计各检测区域的高质量的SNP位点与背景SNP位点集的交集,计数为Ti,并统计纯合SNP和杂合SNP位点,纯合SNP计数为Nij,统计的Nij值详见表1至表4,由于数据量比较大,Nij分表1至表4四个表格列出;需要说明的是,本例中,有些染色体臂很短,且现有组装结果其主要是N,所以本例只检测40个染色体臂的;
(5)计算每个单细胞中各个检测区域的纯合SNP位点频率Fij,计算公式为Fij=Nij÷Ti×100%,得到各个检测区域的纯合SNP位点频率矩阵;
表1 单细胞样本在各检测区域纯合SNP位点的频率
ChrArm | chr1.p | chr1.q | chr10.p | chr10.q | chr11.p | chr11.q | chr12.p | chr12.q | chr13.q | chr14.q |
P1-T1-SC01 | 0.795 | 0.799 | 0.983 | 0.985 | 0.930 | 0.947 | 0.795 | 0.800 | 0.795 | 0.793 |
P1-T1-SC02 | 0.776 | 0.783 | 0.984 | 0.986 | 0.931 | 0.941 | 0.820 | 0.795 | 0.788 | 0.783 |
P1-T1-SC03 | 0.774 | 0.776 | 0.984 | 0.986 | 0.912 | 0.934 | 0.786 | 0.778 | 0.777 | 0.781 |
P1-T2-SC02 | 0.723 | 0.729 | 0.949 | 0.958 | 0.889 | 0.889 | 0.743 | 0.733 | 0.727 | 0.731 |
P1-T2-SC03 | 0.855 | 0.857 | 0.983 | 0.987 | 0.958 | 0.969 | 0.864 | 0.864 | 0.855 | 0.866 |
P1-T2-SC04 | 0.880 | 0.890 | 0.984 | 0.986 | 0.946 | 0.964 | 0.897 | 0.891 | 0.895 | 0.890 |
P1-T3-SC02-1 | 0.852 | 0.879 | 0.982 | 0.985 | 0.932 | 0.946 | 0.849 | 0.842 | 0.846 | 0.862 |
P1-T3-SC03 | 0.862 | 0.899 | 0.980 | 0.981 | 0.805 | 0.804 | 0.873 | 0.893 | 0.777 | 0.769 |
P1-T3-SC04 | 0.756 | 0.766 | 0.983 | 0.986 | 0.770 | 0.797 | 0.774 | 0.769 | 0.762 | 0.767 |
P1-T3-SC05 | 0.870 | 0.875 | 0.985 | 0.987 | 0.884 | 0.888 | 0.879 | 0.889 | 0.887 | 0.883 |
P2-T1-SC02 | 0.746 | 0.731 | 0.737 | 0.755 | 0.732 | 0.750 | 0.842 | 0.744 | 0.751 | 0.748 |
P2-T1-SC03 | 0.779 | 0.777 | 0.773 | 0.799 | 0.779 | 0.789 | 0.982 | 0.785 | 0.789 | 0.802 |
P2-T1-SC04 | 0.789 | 0.795 | 0.789 | 0.825 | 0.793 | 0.807 | 0.816 | 0.782 | 0.826 | 0.782 |
P2-T2-SC01 | 0.815 | 0.805 | 0.820 | 0.829 | 0.818 | 0.826 | 0.983 | 0.816 | 0.825 | 0.841 |
P2-T2-SC02 | 0.837 | 0.819 | 0.837 | 0.848 | 0.833 | 0.835 | 0.983 | 0.849 | 0.836 | 0.848 |
P2-T2-SC03 | 0.765 | 0.776 | 0.758 | 0.779 | 0.827 | 0.794 | 0.976 | 0.782 | 0.770 | 0.868 |
P2-T2-SC04 | 0.838 | 0.832 | 0.849 | 0.849 | 0.840 | 0.846 | 0.979 | 0.844 | 0.851 | 0.850 |
P2-T2-SC05 | 0.739 | 0.737 | 0.739 | 0.758 | 0.733 | 0.743 | 0.795 | 0.738 | 0.760 | 0.745 |
P2-T3-SC01 | 0.803 | 0.796 | 0.799 | 0.812 | 0.799 | 0.802 | 0.811 | 0.795 | 0.806 | 0.789 |
P2-T3-SC03 | 0.794 | 0.784 | 0.782 | 0.801 | 0.797 | 0.798 | 0.800 | 0.776 | 0.974 | 0.808 |
P2-T3-SC04 | 0.809 | 0.799 | 0.804 | 0.810 | 0.799 | 0.815 | 0.820 | 0.796 | 0.817 | 0.798 |
P2-T3-SC05 | 0.803 | 0.797 | 0.802 | 0.820 | 0.797 | 0.814 | 0.825 | 0.796 | 0.815 | 0.793 |
表2 单细胞样本在各检测区域纯合SNP位点的频率
ChrArm | chr15.q | chr16.p | chr16.q | chr17.p | chr17.q | chr18.p | chr18.q | chr19.p | chr19.q | chr2.p |
P1-T1-SC01 | 0.810 | 0.784 | 0.793 | 0.979 | 0.984 | 0.795 | 0.803 | 0.789 | 0.803 | 0.788 |
P1-T1-SC02 | 0.799 | 0.772 | 0.789 | 0.980 | 0.983 | 0.800 | 0.805 | 0.785 | 0.797 | 0.985 |
P1-T1-SC03 | 0.793 | 0.762 | 0.779 | 0.981 | 0.985 | 0.799 | 0.792 | 0.774 | 0.783 | 0.776 |
P1-T2-SC02 | 0.745 | 0.708 | 0.723 | 0.958 | 0.964 | 0.737 | 0.736 | 0.730 | 0.739 | 0.726 |
P1-T2-SC03 | 0.875 | 0.870 | 0.860 | 0.982 | 0.984 | 0.890 | 0.873 | 0.853 | 0.873 | 0.862 |
P1-T2-SC04 | 0.895 | 0.885 | 0.893 | 0.984 | 0.985 | 0.895 | 0.900 | 0.864 | 0.874 | 0.890 |
P1-T3-SC02-1 | 0.850 | 0.832 | 0.856 | 0.980 | 0.982 | 0.853 | 0.883 | 0.833 | 0.874 | 0.983 |
P1-T3-SC03 | 0.978 | 0.780 | 0.840 | 0.976 | 0.978 | 0.775 | 0.773 | 0.966 | 0.975 | 0.893 |
P1-T3-SC04 | 0.826 | 0.752 | 0.765 | 0.979 | 0.982 | 0.783 | 0.785 | 0.839 | 0.850 | 0.763 |
P1-T3-SC05 | 0.884 | 0.874 | 0.863 | 0.983 | 0.985 | 0.872 | 0.875 | 0.864 | 0.855 | 0.869 |
P2-T1-SC02 | 0.738 | 0.755 | 0.762 | 0.746 | 0.761 | 0.843 | 0.754 | 0.724 | 0.733 | 0.745 |
P2-T1-SC03 | 0.785 | 0.786 | 0.801 | 0.780 | 0.799 | 0.975 | 0.787 | 0.778 | 0.788 | 0.781 |
P2-T1-SC04 | 0.793 | 0.799 | 0.809 | 0.809 | 0.813 | 0.807 | 0.799 | 0.814 | 0.797 | 0.791 |
P2-T2-SC01 | 0.821 | 0.838 | 0.824 | 0.825 | 0.841 | 0.974 | 0.826 | 0.823 | 0.821 | 0.819 |
P2-T2-SC02 | 0.836 | 0.835 | 0.837 | 0.848 | 0.857 | 0.982 | 0.834 | 0.839 | 0.831 | 0.831 |
P2-T2-SC03 | 0.815 | 0.816 | 0.776 | 0.774 | 0.786 | 0.969 | 0.778 | 0.751 | 0.766 | 0.780 |
P2-T2-SC04 | 0.841 | 0.856 | 0.868 | 0.847 | 0.855 | 0.971 | 0.843 | 0.854 | 0.856 | 0.833 |
P2-T2-SC05 | 0.741 | 0.750 | 0.760 | 0.747 | 0.760 | 0.810 | 0.746 | 0.739 | 0.744 | 0.743 |
P2-T3-SC01 | 0.803 | 0.817 | 0.815 | 0.806 | 0.825 | 0.802 | 0.800 | 0.792 | 0.802 | 0.805 |
P2-T3-SC03 | 0.783 | 0.794 | 0.800 | 0.795 | 0.809 | 0.976 | 0.790 | 0.778 | 0.792 | 0.791 |
P2-T3-SC04 | 0.808 | 0.818 | 0.822 | 0.811 | 0.825 | 0.815 | 0.809 | 0.808 | 0.808 | 0.811 |
P2-T3-SC05 | 0.806 | 0.814 | 0.826 | 0.818 | 0.824 | 0.812 | 0.811 | 0.800 | 0.797 | 0.812 |
表3 单细胞样本在各检测区域纯合SNP位点的频率
ChrArm | chr2.q | chr20.p | chr20.q | chr21.p | chr21.q | chr22.q | chr3.p | chr3.q | chr4.p | chr4.q |
P1-T1-SC01 | 0.815 | 0.822 | 0.796 | 0.574 | 0.793 | 0.812 | 0.806 | 0.800 | 0.808 | 0.805 |
P1-T1-SC02 | 0.983 | 0.810 | 0.782 | 0.441 | 0.783 | 0.795 | 0.801 | 0.791 | 0.804 | 0.801 |
P1-T1-SC03 | 0.792 | 0.789 | 0.782 | 0.539 | 0.773 | 0.799 | 0.826 | 0.812 | 0.832 | 0.820 |
P1-T2-SC02 | 0.743 | 0.743 | 0.728 | 0.460 | 0.718 | 0.755 | 0.743 | 0.727 | 0.745 | 0.733 |
P1-T2-SC03 | 0.869 | 0.885 | 0.867 | 0.492 | 0.864 | 0.873 | 0.987 | 0.987 | 0.867 | 0.868 |
P1-T2-SC04 | 0.891 | 0.890 | 0.894 | 0.543 | 0.891 | 0.901 | 0.892 | 0.886 | 0.897 | 0.889 |
P1-T3-SC02-1 | 0.983 | 0.880 | 0.856 | 0.696 | 0.883 | 0.863 | 0.881 | 0.863 | 0.868 | 0.878 |
P1-T3-SC03 | 0.896 | 0.796 | 0.790 | 0.500 | 0.789 | 0.824 | 0.775 | 0.759 | 0.809 | 0.794 |
P1-T3-SC04 | 0.776 | 0.773 | 0.765 | 0.542 | 0.755 | 0.790 | 0.778 | 0.763 | 0.779 | 0.763 |
P1-T3-SC05 | 0.887 | 0.881 | 0.875 | 0.729 | 0.873 | 0.892 | 0.874 | 0.878 | 0.881 | 0.879 |
P2-T1-SC02 | 0.765 | 0.757 | 0.765 | 0.577 | 0.827 | 0.804 | 0.763 | 0.744 | 0.805 | 0.749 |
P2-T1-SC03 | 0.797 | 0.798 | 0.804 | 0.673 | 0.926 | 0.786 | 0.795 | 0.774 | 0.926 | 0.785 |
P2-T1-SC04 | 0.808 | 0.815 | 0.838 | 0.586 | 0.791 | 0.788 | 0.805 | 0.792 | 0.782 | 0.786 |
P2-T2-SC01 | 0.842 | 0.831 | 0.839 | 0.690 | 0.933 | 0.816 | 0.827 | 0.817 | 0.932 | 0.815 |
P2-T2-SC02 | 0.848 | 0.851 | 0.842 | 0.747 | 0.948 | 0.838 | 0.852 | 0.834 | 0.946 | 0.836 |
P2-T2-SC03 | 0.839 | 0.774 | 0.786 | 0.610 | 0.952 | 0.761 | 0.847 | 0.816 | 0.894 | 0.776 |
P2-T2-SC04 | 0.843 | 0.860 | 0.857 | 0.627 | 0.937 | 0.864 | 0.844 | 0.839 | 0.935 | 0.841 |
P2-T2-SC05 | 0.757 | 0.759 | 0.768 | 0.618 | 0.798 | 0.751 | 0.758 | 0.741 | 0.772 | 0.747 |
P2-T3-SC01 | 0.810 | 0.812 | 0.823 | 0.630 | 0.795 | 0.796 | 0.807 | 0.791 | 0.790 | 0.795 |
P2-T3-SC03 | 0.802 | 0.811 | 0.822 | 0.585 | 0.927 | 0.794 | 0.799 | 0.784 | 0.926 | 0.784 |
P2-T3-SC04 | 0.815 | 0.818 | 0.826 | 0.568 | 0.807 | 0.815 | 0.818 | 0.805 | 0.805 | 0.806 |
P2-T3-SC05 | 0.816 | 0.825 | 0.831 | 0.632 | 0.799 | 0.814 | 0.817 | 0.807 | 0.792 | 0.800 |
表4 单细胞样本在各检测区域纯合SNP位点的频率
ChrArm | chr5.p | chr5.q | chr6.p | chr6.q | chr7.p | chr7.q | chr8.p | chr8.q | chr9.p | chr9.q |
P1-T1-SC01 | 0.779 | 0.804 | 0.792 | 0.799 | 0.787 | 0.797 | 0.781 | 0.791 | 0.889 | 0.817 |
P1-T1-SC02 | 0.786 | 0.798 | 0.783 | 0.796 | 0.784 | 0.792 | 0.788 | 0.783 | 0.868 | 0.802 |
P1-T1-SC03 | 0.763 | 0.781 | 0.773 | 0.778 | 0.833 | 0.837 | 0.809 | 0.802 | 0.870 | 0.792 |
P1-T2-SC02 | 0.712 | 0.732 | 0.727 | 0.732 | 0.727 | 0.732 | 0.722 | 0.719 | 0.839 | 0.753 |
P1-T2-SC03 | 0.854 | 0.860 | 0.863 | 0.865 | 0.860 | 0.843 | 0.848 | 0.844 | 0.910 | 0.866 |
P1-T2-SC04 | 0.878 | 0.899 | 0.903 | 0.892 | 0.873 | 0.875 | 0.874 | 0.867 | 0.924 | 0.874 |
P1-T3-SC02-1 | 0.853 | 0.863 | 0.868 | 0.869 | 0.823 | 0.834 | 0.849 | 0.816 | 0.893 | 0.854 |
P1-T3-SC03 | 0.893 | 0.903 | 0.793 | 0.797 | 0.980 | 0.958 | 0.772 | 0.778 | 0.859 | 0.845 |
P1-T3-SC04 | 0.754 | 0.773 | 0.769 | 0.767 | 0.772 | 0.773 | 0.759 | 0.755 | 0.867 | 0.786 |
P1-T3-SC05 | 0.890 | 0.885 | 0.893 | 0.882 | 0.854 | 0.852 | 0.876 | 0.865 | 0.908 | 0.876 |
P2-T1-SC02 | 0.743 | 0.814 | 0.763 | 0.737 | 0.744 | 0.724 | 0.748 | 0.749 | 0.818 | 0.743 |
P2-T1-SC03 | 0.779 | 0.936 | 0.801 | 0.767 | 0.778 | 0.759 | 0.782 | 0.786 | 0.940 | 0.783 |
P2-T1-SC04 | 0.779 | 0.792 | 0.811 | 0.772 | 0.786 | 0.774 | 0.795 | 0.816 | 0.811 | 0.793 |
P2-T2-SC01 | 0.810 | 0.938 | 0.842 | 0.817 | 0.801 | 0.798 | 0.821 | 0.814 | 0.942 | 0.821 |
P2-T2-SC02 | 0.835 | 0.949 | 0.854 | 0.826 | 0.835 | 0.817 | 0.847 | 0.843 | 0.951 | 0.835 |
P2-T2-SC03 | 0.749 | 0.929 | 0.786 | 0.752 | 0.777 | 0.749 | 0.783 | 0.789 | 0.931 | 0.759 |
P2-T2-SC04 | 0.824 | 0.950 | 0.857 | 0.823 | 0.838 | 0.830 | 0.840 | 0.840 | 0.956 | 0.843 |
P2-T2-SC05 | 0.741 | 0.787 | 0.761 | 0.727 | 0.741 | 0.726 | 0.744 | 0.746 | 0.798 | 0.737 |
P2-T3-SC01 | 0.791 | 0.804 | 0.817 | 0.787 | 0.799 | 0.785 | 0.808 | 0.805 | 0.816 | 0.803 |
P2-T3-SC03 | 0.782 | 0.934 | 0.803 | 0.771 | 0.792 | 0.778 | 0.792 | 0.794 | 0.946 | 0.784 |
P2-T3-SC04 | 0.805 | 0.815 | 0.822 | 0.798 | 0.804 | 0.796 | 0.812 | 0.817 | 0.825 | 0.808 |
P2-T3-SC05 | 0.800 | 0.810 | 0.824 | 0.799 | 0.809 | 0.791 | 0.813 | 0.803 | 0.821 | 0.802 |
(6)用hampel identifier法找纯合SNP位点频率Fij中的离群点,离群点所在的检测区域,即判定该染色体臂有发生杂合性缺失;具体包括,(a)找出所有检测区域的纯合SNP位点频率Fij的中位数MF,本例中MF=0.0808778,(b)计算每个纯合SNP位点频率Fij与中位数MF的差值,取差值的绝对值即各纯合SNP位点的绝对中位差|Fij-MF|,得到绝对中位差矩阵,绝对中位差详见表5至表8;
表5 单细胞样本在各检测区域的绝对中位差矩阵
ChrArm | chr1.p | chr1.q | chr10.p | chr10.q | chr11.p | chr11.q | chr12.p | chr12.q | chr13.q | chr14.q |
P1-T1-SC01 | 0.013 | 0.010 | 0.174 | 0.176 | 0.121 | 0.138 | 0.014 | 0.008 | 0.014 | 0.015 |
P1-T1-SC02 | 0.032 | 0.026 | 0.175 | 0.177 | 0.122 | 0.132 | 0.011 | 0.013 | 0.021 | 0.026 |
P1-T1-SC03 | 0.035 | 0.032 | 0.175 | 0.178 | 0.103 | 0.125 | 0.023 | 0.031 | 0.032 | 0.027 |
P1-T2-SC02 | 0.086 | 0.080 | 0.141 | 0.149 | 0.080 | 0.081 | 0.066 | 0.076 | 0.082 | 0.078 |
P1-T2-SC03 | 0.046 | 0.048 | 0.175 | 0.178 | 0.150 | 0.161 | 0.055 | 0.055 | 0.046 | 0.058 |
P1-T2-SC04 | 0.071 | 0.081 | 0.175 | 0.178 | 0.138 | 0.155 | 0.088 | 0.082 | 0.086 | 0.081 |
P1-T3-SC02-1 | 0.043 | 0.070 | 0.173 | 0.176 | 0.123 | 0.137 | 0.040 | 0.033 | 0.038 | 0.053 |
P1-T3-SC03 | 0.053 | 0.090 | 0.171 | 0.172 | 0.004 | 0.005 | 0.064 | 0.084 | 0.032 | 0.039 |
P1-T3-SC04 | 0.052 | 0.043 | 0.174 | 0.177 | 0.038 | 0.012 | 0.034 | 0.039 | 0.047 | 0.042 |
P1-T3-SC05 | 0.062 | 0.066 | 0.177 | 0.179 | 0.075 | 0.079 | 0.071 | 0.080 | 0.078 | 0.074 |
P2-T1-SC02 | 0.063 | 0.078 | 0.072 | 0.054 | 0.076 | 0.059 | 0.033 | 0.065 | 0.058 | 0.061 |
P2-T1-SC03 | 0.030 | 0.032 | 0.036 | 0.010 | 0.030 | 0.019 | 0.173 | 0.024 | 0.019 | 0.007 |
P2-T1-SC04 | 0.019 | 0.014 | 0.020 | 0.016 | 0.016 | 0.002 | 0.007 | 0.026 | 0.018 | 0.027 |
P2-T2-SC01 | 0.006 | 0.004 | 0.012 | 0.020 | 0.009 | 0.017 | 0.174 | 0.007 | 0.016 | 0.032 |
P2-T2-SC02 | 0.028 | 0.010 | 0.028 | 0.039 | 0.025 | 0.026 | 0.174 | 0.040 | 0.027 | 0.039 |
P2-T2-SC03 | 0.044 | 0.033 | 0.050 | 0.029 | 0.018 | 0.015 | 0.167 | 0.026 | 0.038 | 0.059 |
P2-T2-SC04 | 0.029 | 0.023 | 0.040 | 0.040 | 0.031 | 0.037 | 0.170 | 0.035 | 0.042 | 0.041 |
P2-T2-SC05 | 0.070 | 0.072 | 0.069 | 0.051 | 0.075 | 0.066 | 0.014 | 0.071 | 0.049 | 0.064 |
P2-T3-SC01 | 0.006 | 0.013 | 0.010 | 0.003 | 0.010 | 0.007 | 0.002 | 0.014 | 0.003 | 0.020 |
P2-T3-SC03 | 0.015 | 0.025 | 0.026 | 0.008 | 0.012 | 0.011 | 0.009 | 0.032 | 0.165 | 0.001 |
P2-T3-SC04 | 0.000 | 0.010 | 0.005 | 0.002 | 0.010 | 0.006 | 0.011 | 0.012 | 0.008 | 0.011 |
P2-T3-SC05 | 0.005 | 0.011 | 0.007 | 0.011 | 0.012 | 0.006 | 0.016 | 0.013 | 0.007 | 0.016 |
表6 单细胞样本在各检测区域的绝对中位差矩阵
ChrArm | chr15.q | chr16.p | chr16.q | chr17.p | chr17.q | chr18.p | chr18.q | chr19.p | chr19.q | chr2.p |
P1-T1-SC01 | 0.001 | 0.025 | 0.015 | 0.170 | 0.175 | 0.013 | 0.006 | 0.020 | 0.006 | 0.021 |
P1-T1-SC02 | 0.009 | 0.036 | 0.020 | 0.171 | 0.174 | 0.009 | 0.004 | 0.024 | 0.012 | 0.176 |
P1-T1-SC03 | 0.016 | 0.047 | 0.030 | 0.172 | 0.176 | 0.010 | 0.017 | 0.035 | 0.026 | 0.033 |
P1-T2-SC02 | 0.064 | 0.101 | 0.085 | 0.150 | 0.155 | 0.071 | 0.073 | 0.079 | 0.069 | 0.083 |
P1-T2-SC03 | 0.066 | 0.061 | 0.051 | 0.173 | 0.175 | 0.082 | 0.064 | 0.044 | 0.064 | 0.053 |
P1-T2-SC04 | 0.086 | 0.076 | 0.084 | 0.175 | 0.176 | 0.087 | 0.091 | 0.055 | 0.065 | 0.081 |
P1-T3-SC02-1 | 0.041 | 0.023 | 0.047 | 0.171 | 0.173 | 0.044 | 0.074 | 0.024 | 0.065 | 0.174 |
P1-T3-SC03 | 0.169 | 0.028 | 0.031 | 0.167 | 0.169 | 0.034 | 0.035 | 0.157 | 0.167 | 0.084 |
P1-T3-SC04 | 0.017 | 0.057 | 0.043 | 0.170 | 0.174 | 0.026 | 0.024 | 0.031 | 0.041 | 0.045 |
P1-T3-SC05 | 0.076 | 0.065 | 0.054 | 0.174 | 0.176 | 0.063 | 0.066 | 0.055 | 0.046 | 0.060 |
P2-T1-SC02 | 0.070 | 0.053 | 0.047 | 0.063 | 0.048 | 0.035 | 0.054 | 0.085 | 0.076 | 0.063 |
P2-T1-SC03 | 0.024 | 0.023 | 0.008 | 0.028 | 0.010 | 0.166 | 0.022 | 0.031 | 0.021 | 0.028 |
P2-T1-SC04 | 0.016 | 0.009 | 0.001 | 0.000 | 0.005 | 0.002 | 0.010 | 0.005 | 0.012 | 0.018 |
P2-T2-SC01 | 0.012 | 0.029 | 0.015 | 0.016 | 0.032 | 0.166 | 0.017 | 0.014 | 0.012 | 0.010 |
P2-T2-SC02 | 0.028 | 0.026 | 0.028 | 0.039 | 0.049 | 0.173 | 0.025 | 0.031 | 0.022 | 0.022 |
P2-T2-SC03 | 0.006 | 0.007 | 0.033 | 0.034 | 0.023 | 0.160 | 0.031 | 0.058 | 0.043 | 0.029 |
P2-T2-SC04 | 0.032 | 0.047 | 0.059 | 0.038 | 0.046 | 0.163 | 0.034 | 0.046 | 0.047 | 0.024 |
P2-T2-SC05 | 0.068 | 0.059 | 0.049 | 0.062 | 0.049 | 0.001 | 0.063 | 0.069 | 0.065 | 0.066 |
P2-T3-SC01 | 0.006 | 0.008 | 0.006 | 0.003 | 0.016 | 0.007 | 0.009 | 0.016 | 0.007 | 0.004 |
P2-T3-SC03 | 0.026 | 0.015 | 0.008 | 0.014 | 0.000 | 0.168 | 0.019 | 0.031 | 0.017 | 0.018 |
P2-T3-SC04 | 0.001 | 0.009 | 0.013 | 0.002 | 0.016 | 0.006 | 0.001 | 0.000 | 0.000 | 0.002 |
P2-T3-SC05 | 0.003 | 0.006 | 0.017 | 0.009 | 0.016 | 0.003 | 0.002 | 0.008 | 0.012 | 0.003 |
表7 单细胞样本在各检测区域的绝对中位差矩阵
ChrArm | chr2.q | chr20.p | chr20.q | chr21.p | chr21.q | chr22.q | chr3.p | chr3.q | chr4.p | chr4.q |
P1-T1-SC01 | 0.006 | 0.013 | 0.012 | 0.234 | 0.016 | 0.003 | 0.003 | 0.008 | 0.000 | 0.004 |
P1-T1-SC02 | 0.175 | 0.001 | 0.027 | 0.368 | 0.026 | 0.014 | 0.007 | 0.018 | 0.005 | 0.007 |
P1-T1-SC03 | 0.016 | 0.020 | 0.027 | 0.269 | 0.035 | 0.010 | 0.017 | 0.003 | 0.024 | 0.011 |
P1-T2-SC02 | 0.065 | 0.066 | 0.081 | 0.349 | 0.091 | 0.054 | 0.066 | 0.082 | 0.064 | 0.076 |
P1-T2-SC03 | 0.061 | 0.076 | 0.058 | 0.317 | 0.055 | 0.064 | 0.178 | 0.179 | 0.058 | 0.059 |
P1-T2-SC04 | 0.083 | 0.081 | 0.086 | 0.266 | 0.083 | 0.092 | 0.083 | 0.077 | 0.088 | 0.081 |
P1-T3-SC02-1 | 0.174 | 0.071 | 0.048 | 0.113 | 0.074 | 0.054 | 0.072 | 0.054 | 0.059 | 0.069 |
P1-T3-SC03 | 0.088 | 0.012 | 0.019 | 0.309 | 0.020 | 0.015 | 0.034 | 0.050 | 0.000 | 0.014 |
P1-T3-SC04 | 0.033 | 0.036 | 0.044 | 0.267 | 0.054 | 0.019 | 0.031 | 0.045 | 0.030 | 0.046 |
P1-T3-SC05 | 0.078 | 0.072 | 0.066 | 0.080 | 0.064 | 0.083 | 0.065 | 0.069 | 0.073 | 0.070 |
P2-T1-SC02 | 0.044 | 0.052 | 0.044 | 0.232 | 0.018 | 0.005 | 0.046 | 0.065 | 0.004 | 0.060 |
P2-T1-SC03 | 0.011 | 0.011 | 0.005 | 0.136 | 0.117 | 0.023 | 0.014 | 0.034 | 0.117 | 0.023 |
P2-T1-SC04 | 0.000 | 0.006 | 0.029 | 0.222 | 0.018 | 0.021 | 0.004 | 0.017 | 0.026 | 0.023 |
P2-T2-SC01 | 0.033 | 0.022 | 0.030 | 0.119 | 0.124 | 0.008 | 0.018 | 0.009 | 0.123 | 0.007 |
P2-T2-SC02 | 0.039 | 0.042 | 0.034 | 0.062 | 0.139 | 0.029 | 0.043 | 0.026 | 0.137 | 0.027 |
P2-T2-SC03 | 0.030 | 0.035 | 0.023 | 0.199 | 0.144 | 0.048 | 0.038 | 0.007 | 0.085 | 0.033 |
P2-T2-SC04 | 0.034 | 0.051 | 0.048 | 0.181 | 0.128 | 0.056 | 0.035 | 0.030 | 0.126 | 0.033 |
P2-T2-SC05 | 0.051 | 0.050 | 0.041 | 0.191 | 0.011 | 0.058 | 0.051 | 0.068 | 0.037 | 0.062 |
P2-T3-SC01 | 0.001 | 0.003 | 0.014 | 0.179 | 0.013 | 0.013 | 0.002 | 0.017 | 0.019 | 0.014 |
P2-T3-SC03 | 0.007 | 0.003 | 0.014 | 0.224 | 0.118 | 0.015 | 0.010 | 0.025 | 0.117 | 0.025 |
P2-T3-SC04 | 0.006 | 0.010 | 0.018 | 0.241 | 0.002 | 0.006 | 0.009 | 0.004 | 0.003 | 0.003 |
P2-T3-SC05 | 0.007 | 0.016 | 0.022 | 0.177 | 0.010 | 0.006 | 0.008 | 0.002 | 0.017 | 0.008 |
表8 单细胞样本在各检测区域的绝对中位差矩阵
ChrArm | chr5.p | chr5.q | chr6.p | chr6.q | chr7.p | chr7.q | chr8.p | chr8.q | chr9.p | chr9.q |
P1-T1-SC01 | 0.030 | 0.005 | 0.017 | 0.009 | 0.021 | 0.012 | 0.028 | 0.018 | 0.080 | 0.008 |
P1-T1-SC02 | 0.023 | 0.011 | 0.025 | 0.013 | 0.025 | 0.017 | 0.021 | 0.026 | 0.060 | 0.007 |
P1-T1-SC03 | 0.046 | 0.028 | 0.036 | 0.031 | 0.024 | 0.028 | 0.000 | 0.006 | 0.061 | 0.017 |
P1-T2-SC02 | 0.097 | 0.077 | 0.082 | 0.077 | 0.082 | 0.077 | 0.087 | 0.090 | 0.030 | 0.056 |
P1-T2-SC03 | 0.046 | 0.051 | 0.054 | 0.056 | 0.051 | 0.035 | 0.039 | 0.036 | 0.101 | 0.057 |
P1-T2-SC04 | 0.069 | 0.090 | 0.094 | 0.084 | 0.064 | 0.066 | 0.065 | 0.058 | 0.116 | 0.065 |
P1-T3-SC02-1 | 0.044 | 0.054 | 0.059 | 0.060 | 0.015 | 0.025 | 0.040 | 0.007 | 0.084 | 0.046 |
P1-T3-SC03 | 0.084 | 0.094 | 0.016 | 0.011 | 0.171 | 0.149 | 0.037 | 0.031 | 0.050 | 0.036 |
P1-T3-SC04 | 0.054 | 0.035 | 0.039 | 0.042 | 0.037 | 0.036 | 0.049 | 0.054 | 0.058 | 0.023 |
P1-T3-SC05 | 0.081 | 0.076 | 0.084 | 0.073 | 0.045 | 0.043 | 0.067 | 0.056 | 0.099 | 0.067 |
P2-T1-SC02 | 0.066 | 0.005 | 0.046 | 0.072 | 0.065 | 0.085 | 0.061 | 0.060 | 0.009 | 0.066 |
P2-T1-SC03 | 0.030 | 0.127 | 0.008 | 0.042 | 0.031 | 0.049 | 0.027 | 0.022 | 0.132 | 0.025 |
P2-T1-SC04 | 0.030 | 0.017 | 0.002 | 0.037 | 0.023 | 0.035 | 0.014 | 0.007 | 0.002 | 0.015 |
P2-T2-SC01 | 0.002 | 0.129 | 0.033 | 0.008 | 0.007 | 0.011 | 0.012 | 0.005 | 0.133 | 0.012 |
P2-T2-SC02 | 0.026 | 0.140 | 0.045 | 0.017 | 0.026 | 0.008 | 0.039 | 0.034 | 0.142 | 0.026 |
P2-T2-SC03 | 0.059 | 0.120 | 0.023 | 0.057 | 0.032 | 0.060 | 0.026 | 0.020 | 0.122 | 0.050 |
P2-T2-SC04 | 0.015 | 0.141 | 0.048 | 0.015 | 0.029 | 0.022 | 0.031 | 0.031 | 0.147 | 0.034 |
P2-T2-SC05 | 0.068 | 0.022 | 0.048 | 0.082 | 0.068 | 0.082 | 0.065 | 0.062 | 0.011 | 0.072 |
P2-T3-SC01 | 0.018 | 0.005 | 0.008 | 0.022 | 0.010 | 0.023 | 0.001 | 0.004 | 0.008 | 0.006 |
P2-T3-SC03 | 0.027 | 0.126 | 0.006 | 0.038 | 0.017 | 0.031 | 0.017 | 0.015 | 0.137 | 0.025 |
P2-T3-SC04 | 0.004 | 0.006 | 0.013 | 0.011 | 0.005 | 0.013 | 0.003 | 0.008 | 0.017 | 0.001 |
P2-T3-SC05 | 0.009 | 0.002 | 0.015 | 0.010 | 0.001 | 0.018 | 0.004 | 0.005 | 0.012 | 0.007 |
(c)找出各纯合SNP位点的绝对中位差的中位数MAD,本例中MAD=0.035
按公式计算Zij’=(|Fij-MF|)÷(MAD÷0.6745),得到一个判别矩阵,如表9至表13所示,其中Zij’大于2.24,为离群点,即判定该染色体臂有发生杂合性缺失。
表9 单细胞样本在各检测区域的判别矩阵
ChrArm | chr1.p | chr1.q | chr10.p | chr10.q | chr11.p | chr11.q | chr12.p | chr12.q |
P1-T1-SC01 | 0.2613 | 0.18851 | 3.399426 | 3.44265 | 2.365996 | 2.701601 | 0.26578 | 0.16557 |
P1-T1-SC02 | 0.63249 | 0.50598 | 3.424266 | 3.466579 | 2.387642 | 2.575697 | 0.215198 | 0.26182 |
P1-T1-SC03 | 0.67634 | 0.63243 | 3.427044 | 3.470395 | 2.011834 | 2.450215 | 0.45237 | 0.60381 |
P1-T2-SC02 | 1.67699 | 1.56418 | 2.747279 | 2.917386 | 1.560943 | 1.574207 | 1.28674 | 1.48686 |
P1-T2-SC03 | 0.903388 | 0.936316 | 3.413073 | 3.487967 | 2.921962 | 3.137591 | 1.084245 | 1.081187 |
P1-T2-SC04 | 1.395367 | 1.588892 | 3.426278 | 3.469982 | 2.691094 | 3.023587 | 1.718304 | 1.610217 |
P1-T3-SC02-1 | 0.84264 | 1.369623 | 3.381235 | 3.439704 | 2.406356 | 2.682681 | 0.786455 | 0.650363 |
P1-T3-SC03 | 1.040007 | 1.768412 | 3.342878 | 3.367999 | 0.07566 | 0.09953 | 1.257572 | 1.648292 |
P1-T3-SC04 | 1.02377 | 0.84128 | 3.404043 | 3.455899 | 0.75127 | 0.22703 | 0.67255 | 0.77011 |
P1-T3-SC05 | 1.203038 | 1.287485 | 3.451863 | 3.490703 | 1.471407 | 1.548617 | 1.379033 | 1.567274 |
P2-T1-SC02 | 1.23455 | 1.5278 | 1.39729 | 1.04859 | 1.49079 | 1.15447 | 0.651746 | 1.27029 |
P2-T1-SC03 | 0.58575 | 0.62161 | 0.7058 | 0.19813 | 0.58723 | 0.37891 | 3.375182 | 0.46219 |
P2-T1-SC04 | 0.37963 | 0.26402 | 0.39036 | 0.314308 | 0.31661 | 0.04038 | 0.142395 | 0.51576 |
P2-T2-SC01 | 0.120668 | 0.07455 | 0.22529 | 0.38568 | 0.18146 | 0.326939 | 3.407452 | 0.132823 |
P2-T2-SC02 | 0.554171 | 0.192753 | 0.552055 | 0.76726 | 0.480695 | 0.516554 | 3.40645 | 0.791045 |
P2-T2-SC03 | 0.86227 | 0.64839 | 0.98415 | 0.57626 | 0.360459 | 0.28382 | 3.270713 | 0.5153 |
P2-T2-SC04 | 0.567977 | 0.446662 | 0.782222 | 0.791022 | 0.608579 | 0.719615 | 3.33027 | 0.679459 |
P2-T2-SC05 | 1.36729 | 1.4123 | 1.35752 | 0.9899 | 1.47198 | 1.28018 | 0.27604 | 1.39038 |
P2-T3-SC01 | 0.11989 | 0.24571 | 0.19751 | 0.066731 | 0.19401 | 0.13065 | 0.042713 | 0.27871 |
P2-T3-SC03 | 0.2972 | 0.48935 | 0.51576 | 0.15125 | 0.2288 | 0.21747 | 0.16873 | 0.6326 |
P2-T3-SC04 | 0.002828 | 0.19328 | 0.09675 | 0.031594 | 0.19444 | 0.121302 | 0.217853 | 0.24304 |
P2-T3-SC05 | 0.10363 | 0.22122 | 0.13534 | 0.223063 | 0.23624 | 0.108731 | 0.310397 | 0.25407 |
表10 单细胞样本在各检测区域的判别矩阵
ChrArm | chr16.p | chr16.q | chr17.p | chr17.q | chr18.p | chr18.q | chr19.p | chr19.q |
P1-T1-SC01 | 0.48371 | 0.29932 | 3.324975 | 3.415037 | 0.263 | 0.11755 | 0.3925 | 0.11798 |
P1-T1-SC02 | 0.71053 | 0.3929 | 3.343327 | 3.394798 | 0.17776 | 0.08259 | 0.45953 | 0.23104 |
P1-T1-SC03 | 0.91126 | 0.58255 | 3.364244 | 3.4358 | 0.19101 | 0.33018 | 0.68768 | 0.50598 |
P1-T2-SC02 | 1.97279 | 1.66973 | 2.923756 | 3.03316 | 1.39653 | 1.41981 | 1.5464 | 1.35413 |
P1-T2-SC03 | 1.192532 | 1.001616 | 3.3757 | 3.4214 | 1.592644 | 1.249224 | 0.862682 | 1.259275 |
P1-T2-SC04 | 1.493794 | 1.638588 | 3.415428 | 3.446237 | 1.693926 | 1.777324 | 1.083719 | 1.26667 |
P1-T3-SC02-1 | 0.448933 | 0.916762 | 3.342374 | 3.387701 | 0.862215 | 1.443727 | 0.465094 | 1.273081 |
P1-T3-SC03 | 0.5544 | 0.607397 | 3.268754 | 3.310842 | 0.65562 | 0.69016 | 3.070265 | 3.25488 |
P1-T3-SC04 | 1.11619 | 0.84839 | 3.321888 | 3.39257 | 0.51137 | 0.46377 | 0.597303 | 0.79583 |
P1-T3-SC05 | 1.273153 | 1.061051 | 3.400644 | 3.44686 | 1.232196 | 1.285412 | 1.084011 | 0.904898 |
P2-T1-SC02 | 1.04424 | 0.91478 | 1.223 | 0.93182 | 0.677793 | 1.06126 | 1.66072 | 1.47646 |
P2-T1-SC03 | 0.45425 | 0.1614 | 0.55419 | 0.18569 | 3.247803 | 0.42778 | 0.60762 | 0.41103 |
P2-T1-SC04 | 0.184 | 0.013587 | 0.00296 | 0.088048 | 0.0308 | 0.19806 | 0.103326 | 0.22473 |
P2-T2-SC01 | 0.573755 | 0.289674 | 0.311691 | 0.622995 | 3.237562 | 0.340575 | 0.279592 | 0.242114 |
P2-T2-SC02 | 0.5098 | 0.552774 | 0.760645 | 0.950295 | 3.376535 | 0.493983 | 0.600239 | 0.435251 |
P2-T2-SC03 | 0.14641 | 0.64463 | 0.67256 | 0.44712 | 3.123186 | 0.60385 | 1.13268 | 0.84456 |
P2-T2-SC04 | 0.913044 | 1.154027 | 0.74224 | 0.896403 | 3.179088 | 0.661405 | 0.893388 | 0.913063 |
P2-T2-SC05 | 1.1433 | 0.9521 | 1.21409 | 0.95963 | 0.019278 | 1.22662 | 1.35417 | 1.26871 |
P2-T3-SC01 | 0.153196 | 0.125187 | 0.05616 | 0.308972 | 0.12743 | 0.16729 | 0.32049 | 0.13821 |
P2-T3-SC03 | 0.28815 | 0.16242 | 0.26834 | 0.00283 | 3.27634 | 0.3748 | 0.60103 | 0.33323 |
P2-T3-SC04 | 0.1835 | 0.256057 | 0.042508 | 0.319515 | 0.126686 | 0.010104 | 0.00824 | 0.00802 |
P2-T3-SC05 | 0.110762 | 0.330788 | 0.173449 | 0.306996 | 0.063232 | 0.047509 | 0.1626 | 0.22737 |
表11 单细胞样本在各检测区域的判别矩阵
ChrArm | chr20.p | chr20.q | chr21.p | chr21.q | chr22.q | chr4.p | chr4.q | chr13.q |
P1-T1-SC01 | 0.250209 | 0.24391 | 4.57859 | 0.31665 | 0.056642 | 0.00688 | 0.07341 | 0.27609 |
P1-T1-SC02 | 0.019063 | 0.52076 | 7.18939 | 0.50337 | 0.27281 | 0.10016 | 0.1455 | 0.40847 |
P1-T1-SC03 | 0.38142 | 0.52061 | 5.2653 | 0.69294 | 0.18783 | 0.459662 | 0.212164 | 0.62546 |
P1-T2-SC02 | 1.29174 | 1.57481 | 6.81298 | 1.77244 | 1.0582 | 1.24703 | 1.48513 | 1.5986 |
P1-T2-SC03 | 1.489424 | 1.142625 | 6.19569 | 1.076378 | 1.25462 | 1.139884 | 1.156234 | 0.901743 |
P1-T2-SC04 | 1.588124 | 1.673379 | 5.19629 | 1.613816 | 1.792669 | 1.722495 | 1.575256 | 1.684897 |
P1-T3-SC02-1 | 1.389442 | 0.929431 | 2.2056 | 1.441422 | 1.052147 | 1.158759 | 1.354226 | 0.734199 |
P1-T3-SC03 | 0.2418 | 0.37612 | 6.03375 | 0.39583 | 0.288859 | 0.00411 | 0.28304 | 0.63001 |
P1-T3-SC04 | 0.69459 | 0.85241 | 5.21955 | 1.05024 | 0.36173 | 0.59062 | 0.89126 | 0.90897 |
P1-T3-SC05 | 1.405852 | 1.294893 | 1.5673 | 1.254361 | 1.617852 | 1.41736 | 1.364605 | 1.524975 |
P2-T1-SC02 | 1.0085 | 0.86513 | 4.52451 | 0.35549 | 0.09263 | 0.07701 | 1.16922 | 1.1291 |
P2-T1-SC03 | 0.21426 | 0.09639 | 2.65407 | 2.294584 | 0.45069 | 2.294307 | 0.45786 | 0.37795 |
P2-T1-SC04 | 0.119008 | 0.562826 | 4.34505 | 0.34544 | 0.41464 | 0.51604 | 0.44254 | 0.344195 |
P2-T2-SC01 | 0.425776 | 0.595043 | 2.32775 | 2.4185 | 0.150469 | 2.408532 | 0.127112 | 0.308972 |
P2-T2-SC02 | 0.829805 | 0.654809 | 1.20743 | 2.718151 | 0.562105 | 2.67278 | 0.534062 | 0.537277 |
P2-T2-SC03 | 0.68781 | 0.45074 | 3.88642 | 2.806654 | 0.93701 | 1.659264 | 0.64103 | 0.75184 |
P2-T2-SC04 | 0.996605 | 0.93732 | 3.54327 | 2.500316 | 1.08687 | 2.468463 | 0.637645 | 0.824596 |
P2-T2-SC05 | 0.97027 | 0.79305 | 3.72439 | 0.20946 | 1.13684 | 0.72564 | 1.2104 | 0.95349 |
P2-T3-SC01 | 0.05907 | 0.278775 | 3.4967 | 0.25948 | 0.25456 | 0.37309 | 0.27227 | 0.05014 |
P2-T3-SC03 | 0.05192 | 0.266404 | 4.36835 | 2.314219 | 0.29418 | 2.286761 | 0.482 | 3.225076 |
P2-T3-SC04 | 0.188291 | 0.345729 | 4.71343 | 0.04006 | 0.114816 | 0.06601 | 0.05176 | 0.151685 |
P2-T3-SC05 | 0.310038 | 0.434894 | 3.4626 | 0.19322 | 0.107909 | 0.32883 | 0.16486 | 0.127057 |
表12 单细胞样本在各检测区域的判别矩阵
ChrArm | chr5.p | chr5.q | chr6.p | chr6.q | chr7.p | chr7.q | chr8.p | chr8.q |
P1-T1-SC01 | 0.58354 | 0.09256 | 0.33354 | 0.18132 | 0.41603 | 0.2333 | 0.53994 | 0.35422 |
P1-T1-SC02 | 0.44738 | 0.2132 | 0.49561 | 0.25623 | 0.48533 | 0.32616 | 0.40124 | 0.50957 |
P1-T1-SC03 | 0.89031 | 0.55082 | 0.6992 | 0.6011 | 0.466497 | 0.545966 | 0.005299 | 0.12368 |
P1-T2-SC02 | 1.89387 | 1.49695 | 1.59824 | 1.50244 | 1.59937 | 1.50534 | 1.69531 | 1.75583 |
P1-T2-SC03 | 0.893247 | 0.997055 | 1.057587 | 1.101414 | 0.995739 | 0.677401 | 0.766751 | 0.69687 |
P1-T2-SC04 | 1.349402 | 1.764336 | 1.836016 | 1.634724 | 1.250049 | 1.287844 | 1.278159 | 1.134782 |
P1-T3-SC02-1 | 0.859735 | 1.053657 | 1.151419 | 1.169121 | 0.286712 | 0.497171 | 0.783009 | 0.140953 |
P1-T3-SC03 | 1.641235 | 1.841369 | 0.31362 | 0.22392 | 3.338844 | 2.912932 | 0.71945 | 0.59761 |
P1-T3-SC04 | 1.06235 | 0.69192 | 0.76897 | 0.82574 | 0.72264 | 0.69768 | 0.96305 | 1.05502 |
P1-T3-SC05 | 1.579281 | 1.494058 | 1.648587 | 1.425412 | 0.874604 | 0.838399 | 1.305442 | 1.100264 |
P2-T1-SC02 | 1.28958 | 0.105 | 0.89111 | 1.40838 | 1.27001 | 1.65328 | 1.19105 | 1.17446 |
P2-T1-SC03 | 0.58009 | 2.488324 | 0.15614 | 0.82289 | 0.60182 | 0.96477 | 0.52599 | 0.43879 |
P2-T1-SC04 | 0.585 | 0.33594 | 0.041051 | 0.72619 | 0.44122 | 0.67711 | 0.2674 | 0.138037 |
P2-T2-SC01 | 0.031949 | 2.515432 | 0.651119 | 0.165574 | 0.14557 | 0.21119 | 0.229313 | 0.094144 |
P2-T2-SC02 | 0.512867 | 2.744204 | 0.881304 | 0.333195 | 0.504665 | 0.163163 | 0.755841 | 0.67096 |
P2-T2-SC03 | 1.16129 | 2.351226 | 0.44767 | 1.11069 | 0.61694 | 1.1773 | 0.50247 | 0.38826 |
P2-T2-SC04 | 0.294353 | 2.759459 | 0.933244 | 0.287149 | 0.5762 | 0.421701 | 0.609536 | 0.614517 |
P2-T2-SC05 | 1.33298 | 0.42946 | 0.93032 | 1.5979 | 1.3226 | 1.61186 | 1.26545 | 1.22002 |
P2-T3-SC01 | 0.35211 | 0.10069 | 0.165624 | 0.43252 | 0.1898 | 0.45815 | 0.01288 | 0.08194 |
P2-T3-SC03 | 0.52075 | 2.455182 | 0.11731 | 0.73416 | 0.33028 | 0.60586 | 0.3229 | 0.2891 |
P2-T3-SC04 | 0.08149 | 0.12052 | 0.262918 | 0.20871 | 0.08931 | 0.24908 | 0.059932 | 0.160079 |
P2-T3-SC05 | 0.17623 | 0.032613 | 0.292619 | 0.18877 | 0.011665 | 0.34479 | 0.084661 | 0.10386 |
表13 单细胞样本在各检测区域的判别矩阵
ChrArm | chr2.p | chr2.q | chr3.p | chr3.q | chr9.p | chr9.q | chr14.q | chr15.q |
P1-T1-SC01 | 0.40563 | 0.1171 | 0.055 | 0.16475 | 1.565971 | 0.163061 | 0.29951 | 0.019152 |
P1-T1-SC02 | 3.436784 | 3.410873 | 0.14267 | 0.35614 | 1.164875 | 0.13523 | 0.50618 | 0.18561 |
P1-T1-SC03 | 0.63962 | 0.32064 | 0.339962 | 0.059227 | 1.187032 | 0.32635 | 0.53405 | 0.31168 |
P1-T2-SC02 | 1.62048 | 1.27648 | 1.2885 | 1.60427 | 0.585824 | 1.09828 | 1.52075 | 1.24983 |
P1-T2-SC03 | 1.03575 | 1.185398 | 3.47999 | 3.488649 | 1.979353 | 1.109522 | 1.127235 | 1.294151 |
P1-T2-SC04 | 1.583097 | 1.612971 | 1.618724 | 1.507538 | 2.260389 | 1.273223 | 1.588226 | 1.675999 |
P1-T3-SC02-1 | 3.394691 | 3.40866 | 1.410798 | 1.053639 | 1.648108 | 0.891025 | 1.034597 | 0.810444 |
P1-T3-SC03 | 1.637445 | 1.712669 | 0.66943 | 0.97266 | 0.98666 | 0.701408 | 0.76819 | 3.298626 |
P1-T3-SC04 | 0.88896 | 0.64954 | 0.60814 | 0.88756 | 1.129385 | 0.45381 | 0.81742 | 0.334355 |
P1-T3-SC05 | 1.177743 | 1.526339 | 1.275577 | 1.35368 | 1.941831 | 1.309002 | 1.446905 | 1.475971 |
P2-T1-SC02 | 1.23784 | 0.86134 | 0.89307 | 1.26767 | 0.181037 | 1.28277 | 1.18991 | 1.37701 |
P2-T1-SC03 | 0.54064 | 0.22423 | 0.27463 | 0.67164 | 2.571282 | 0.49471 | 0.14064 | 0.47375 |
P2-T1-SC04 | 0.34529 | 0.00874 | 0.07332 | 0.33639 | 0.045406 | 0.30113 | 0.53149 | 0.30988 |
P2-T2-SC01 | 0.193266 | 0.645807 | 0.346623 | 0.167632 | 2.598953 | 0.237964 | 0.626873 | 0.237045 |
P2-T2-SC02 | 0.427191 | 0.76498 | 0.846616 | 0.500344 | 2.778863 | 0.514579 | 0.768237 | 0.539215 |
P2-T2-SC03 | 0.5686 | 0.591385 | 0.745434 | 0.136693 | 2.382748 | 0.96837 | 1.153696 | 0.122238 |
P2-T2-SC04 | 0.472726 | 0.66743 | 0.681 | 0.585902 | 2.868924 | 0.672659 | 0.79821 | 0.626052 |
P2-T2-SC05 | 1.29275 | 1.00624 | 0.99727 | 1.32411 | 0.20808 | 1.3977 | 1.2544 | 1.33023 |
P2-T3-SC01 | 0.07614 | 0.025998 | 0.03611 | 0.33856 | 0.146947 | 0.12145 | 0.38623 | 0.11949 |
P2-T3-SC03 | 0.34954 | 0.13276 | 0.19842 | 0.48712 | 2.681626 | 0.48358 | 0.02321 | 0.49985 |
P2-T3-SC04 | 0.040098 | 0.125575 | 0.17958 | 0.07461 | 0.323163 | 0.02367 | 0.20744 | 0.02467 |
P2-T3-SC05 | 0.064307 | 0.134118 | 0.151593 | 0.04385 | 0.243288 | 0.14167 | 0.30779 | 0.05413 |
本例中,i表示染色体臂的编号i∈1,2,……,40;j表示单细胞的编号j∈1,2,3,4,…22。另外,本例中Zij’大于2.24,为离群值,说明此染色体臂发生了LOH,记为1;小于或等于2.24即为正常,记为0;并且,Fij小于中位数MF的染色体臂,我们记为0,最后获得LOH结果表,如表14至表17所示。使用R语言中NMF包,以热图的形式进行展示如图1,深灰色表示此染色体臂发生杂合缺失,而浅灰色的表示正常。
表14 LOH检测结果矩阵
Sample | chr1.p | chr1.q | chr10.p | chr10.q | chr11.p | chr11.q | chr12.p | chr12.q | chr13.q | chr14.q |
P1-T1-SC01 | 0 | 0 | 1 | 1 | 1 | 1 | 0 | 0 | 0 | 0 |
P1-T1-SC02 | 0 | 0 | 1 | 1 | 1 | 1 | 0 | 0 | 0 | 0 |
P1-T1-SC03 | 0 | 0 | 1 | 1 | 0 | 1 | 0 | 0 | 0 | 0 |
P1-T2-SC02 | 0 | 0 | 1 | 1 | 0 | 0 | 0 | 0 | 0 | 0 |
P1-T2-SC03 | 0 | 0 | 1 | 1 | 1 | 1 | 0 | 0 | 0 | 0 |
P1-T2-SC04 | 0 | 0 | 1 | 1 | 1 | 1 | 0 | 0 | 0 | 0 |
P1-T3-SC02-1 | 0 | 0 | 1 | 1 | 1 | 1 | 0 | 0 | 0 | 0 |
P1-T3-SC03 | 0 | 0 | 1 | 1 | 0 | 0 | 0 | 0 | 0 | 0 |
P1-T3-SC04 | 0 | 0 | 1 | 1 | 0 | 0 | 0 | 0 | 0 | 0 |
P1-T3-SC05 | 0 | 0 | 1 | 1 | 0 | 0 | 0 | 0 | 0 | 0 |
P2-T1-SC02 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
P2-T1-SC03 | 0 | 0 | 0 | 0 | 0 | 0 | 1 | 0 | 0 | 0 |
P2-T1-SC04 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
P2-T2-SC01 | 0 | 0 | 0 | 0 | 0 | 0 | 1 | 0 | 0 | 0 |
P2-T2-SC02 | 0 | 0 | 0 | 0 | 0 | 0 | 1 | 0 | 0 | 0 |
P2-T2-SC03 | 0 | 0 | 0 | 0 | 0 | 0 | 1 | 0 | 0 | 0 |
P2-T2-SC04 | 0 | 0 | 0 | 0 | 0 | 0 | 1 | 0 | 0 | 0 |
P2-T2-SC05 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
P2-T3-SC01 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
P2-T3-SC03 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 1 | 0 |
P2-T3-SC04 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
P2-T3-SC05 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
表15 LOH检测结果矩阵
Sample | chr15.q | chr16.p | chr16.q | chr17.p | chr17.q | chr18.p | chr18.q | chr19.p | chr19.q | chr2.p |
P1-T1-SC01 | 0 | 0 | 0 | 1 | 1 | 0 | 0 | 0 | 0 | 0 |
P1-T1-SC02 | 0 | 0 | 0 | 1 | 1 | 0 | 0 | 0 | 0 | 1 |
P1-T1-SC03 | 0 | 0 | 0 | 1 | 1 | 0 | 0 | 0 | 0 | 0 |
P1-T2-SC02 | 0 | 0 | 0 | 1 | 1 | 0 | 0 | 0 | 0 | 0 |
P1-T2-SC03 | 0 | 0 | 0 | 1 | 1 | 0 | 0 | 0 | 0 | 0 |
P1-T2-SC04 | 0 | 0 | 0 | 1 | 1 | 0 | 0 | 0 | 0 | 0 |
P1-T3-SC02-1 | 0 | 0 | 0 | 1 | 1 | 0 | 0 | 0 | 0 | 1 |
P1-T3-SC03 | 1 | 0 | 0 | 1 | 1 | 0 | 0 | 1 | 1 | 0 |
P1-T3-SC04 | 0 | 0 | 0 | 1 | 1 | 0 | 0 | 0 | 0 | 0 |
P1-T3-SC05 | 0 | 0 | 0 | 1 | 1 | 0 | 0 | 0 | 0 | 0 |
P2-T1-SC02 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
P2-T1-SC03 | 0 | 0 | 0 | 0 | 0 | 1 | 0 | 0 | 0 | 0 |
P2-T1-SC04 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
P2-T2-SC01 | 0 | 0 | 0 | 0 | 0 | 1 | 0 | 0 | 0 | 0 |
P2-T2-SC02 | 0 | 0 | 0 | 0 | 0 | 1 | 0 | 0 | 0 | 0 |
P2-T2-SC03 | 0 | 0 | 0 | 0 | 0 | 1 | 0 | 0 | 0 | 0 |
P2-T2-SC04 | 0 | 0 | 0 | 0 | 0 | 1 | 0 | 0 | 0 | 0 |
P2-T2-SC05 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
P2-T3-SC01 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
P2-T3-SC03 | 0 | 0 | 0 | 0 | 0 | 1 | 0 | 0 | 0 | 0 |
P2-T3-SC04 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
P2-T3-SC05 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
表16 LOH检测结果矩阵
Sample | chr2.q | chr20.p | chr20.q | chr21.p | chr21.q | chr22.q | chr3.p | chr3.q | chr4.p | chr4.q |
P1-T1-SC01 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
P1-T1-SC02 | 1 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
P1-T1-SC03 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
P1-T2-SC02 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
P1-T2-SC03 | 0 | 0 | 0 | 0 | 0 | 0 | 1 | 1 | 0 | 0 |
P1-T2-SC04 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
P1-T3-SC02-1 | 1 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
P1-T3-SC03 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
P1-T3-SC04 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
P1-T3-SC05 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
P2-T1-SC02 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
P2-T1-SC03 | 0 | 0 | 0 | 0 | 1 | 0 | 0 | 0 | 1 | 0 |
P2-T1-SC04 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
P2-T2-SC01 | 0 | 0 | 0 | 0 | 1 | 0 | 0 | 0 | 1 | 0 |
P2-T2-SC02 | 0 | 0 | 0 | 0 | 1 | 0 | 0 | 0 | 1 | 0 |
P2-T2-SC03 | 0 | 0 | 0 | 0 | 1 | 0 | 0 | 0 | 0 | 0 |
P2-T2-SC04 | 0 | 0 | 0 | 0 | 1 | 0 | 0 | 0 | 1 | 0 |
P2-T2-SC05 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
P2-T3-SC01 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
P2-T3-SC03 | 0 | 0 | 0 | 0 | 1 | 0 | 0 | 0 | 1 | 0 |
P2-T3-SC04 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
P2-T3-SC05 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
表17 LOH检测结果矩阵
Sample | chr5.p | chr5.q | chr6.p | chr6.q | chr7.p | chr7.q | chr8.p | chr8.q | chr9.p | chr9.q |
P1-T1-SC01 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
P1-T1-SC02 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
P1-T1-SC03 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
P1-T2-SC02 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
P1-T2-SC03 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
P1-T2-SC04 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 1 | 0 |
P1-T3-SC02-1 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
P1-T3-SC03 | 0 | 0 | 0 | 0 | 1 | 1 | 0 | 0 | 0 | 0 |
P1-T3-SC04 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
P1-T3-SC05 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
P2-T1-SC02 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
P2-T1-SC03 | 0 | 1 | 0 | 0 | 0 | 0 | 0 | 0 | 1 | 0 |
P2-T1-SC04 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
P2-T2-SC01 | 0 | 1 | 0 | 0 | 0 | 0 | 0 | 0 | 1 | 0 |
P2-T2-SC02 | 0 | 1 | 0 | 0 | 0 | 0 | 0 | 0 | 1 | 0 |
P2-T2-SC03 | 0 | 1 | 0 | 0 | 0 | 0 | 0 | 0 | 1 | 0 |
P2-T2-SC04 | 0 | 1 | 0 | 0 | 0 | 0 | 0 | 0 | 1 | 0 |
P2-T2-SC05 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
P2-T3-SC01 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
P2-T3-SC03 | 0 | 1 | 0 | 0 | 0 | 0 | 0 | 0 | 1 | 0 |
P2-T3-SC04 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
P2-T3-SC05 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
从检测结果中可以看出来,在22个脑瘤单细胞样本中,LOH主要发生在chr4.p,chr5.q,chr9.q,chr10.p,chr10.q,chr11.p,chr11.q,chr12.p,chr17.p,chr17.q,chr18.p,chr21.q染色体臂上,至少出现在5个样本以上,而其他的染色体臂上没有发生LOH或只有1个细胞在此区域发生。LOH在细胞间具有很强的异质性。
对比例
本例对两个脑瘤病人的6块肿瘤组织和2块正常的血组织,通过CG的常规流程进行DNA提取和建库,然后进行全基因组测序,得到下机数据,实验中使用的试剂为CG的常规试剂。本例使用华大基因的CG的标准分析流程进行数据处理。测序和数据处理都在华大基因完成。
对于此实施例中的组织测序,我们基于100kb窗口中所有检测到的变异位点,其所有比对上的序列数目进行估计LAF(LesserAllele Fraction),LAF是CG测序分析中的一种概念,与B等位基因频率类似,指在一个样本中等位基因中不大于50%等位基因比率,取值范围为0~0.5。对于检测出来的LAF结果,使用R语言中ggplot2包,以点图的形式进行展示如图2,图3。LAF等于或者接近于0.5,说明此检测区域没有发生杂合缺失,如图2中的区域A,图3的区域D。LAF小于0.5,并且在延伸区域LAF的值保持一致,说明此延伸区域发生杂合缺失如图2中区域B和C,图3的区域E。
根据单细胞LOH检测结果和组织样本中结果的对比发现,在组织样品中检测的LOH,在22个单细胞样品中,至少有一个样本的相同区域也检测到LOH,说明我们的检测方法和针对组织样品的CG标准分析流程的检测结果是一致的,我们的检测方法可以用来检测LOH。同时在组织水平未能检测到的LOH的区域,在单细胞样本中却检测出来,说明本申请的方法可以检测单细胞水平LOH的异质性。
以上内容是结合具体的实施方式对本申请所作的进一步详细说明,不能认定本申请的具体实施只局限于这些说明。对于本申请所属技术领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干简单推演或替换,都应当视为属于本申请的保护范围。
Claims (6)
1.一种杂合性缺失的检测方法,其特征在于:包括以下步骤,
(1)提取组织样品,分离获得单个细胞,提取单细胞的核酸,并采用全基因组扩增方法对所提取的核酸进行扩增,建库后上机测序,得到单细胞的全基因组测序;
(2)将步骤(1)获得的全基因组测序与参考基因序列进行比对,检测单细胞的SNP,得到单细胞全基因组上的单核苷酸多态性位点的基因型数据,并按照过滤标准对潜在的假阳性SNP位点进行过滤,得到高质量SNP数据;
(3)下载dbSNP数据库中与组织样品对应的所有SNP位点数据,过滤掉dbSNP数据库中在千人基因组中SNP频率低于5%的SNP位点,剩下的SNP位点作为背景SNP位点集;
(4)采用步骤(2)得到的高质量SNP数据,对于每个单细胞,以染色体臂为一个检测区域,统计各检测区域的SNP位点与背景SNP位点集的交集,计数为Ti,并统计纯合SNP和杂合SNP位点,纯合SNP计数为Nij;
(5)计算每个单细胞中各个检测区域的纯合SNP位点频率Fij,计算公式为Fij=Nij÷Ti×100%,得到各个检测区域的纯合SNP位点频率矩阵;
(6)用hampel identifier法找纯合SNP位点频率Fij中的离群点,离群点所在的检测区域,即判定该染色体臂有发生杂合性缺失;
所述步骤(6)用hampel identifier法找离群点具体包括,(a)找出所有检测区域的纯合SNP位点频率Fij的中位数MF,(b)计算每个纯合SNP位点频率Fij与中位数MF的差值,取差值的绝对值即各纯合SNP位点的绝对中位差|Fij-MF|,得到绝对中位差矩阵,其中染色体臂纯合率Fij小于中位数MF的判定该染色体臂没有发生杂合性缺失,(c)找出各纯合SNP位点的绝对中位差的中位数MAD,按公式计算Zij’=(|Fij-MF|)÷(MAD÷0.6745),Zij’大于2.24,为离群点,即判定该染色体臂有发生杂合性缺失;
其中,i表示染色体臂的编号,j表示单细胞的编号。
2.根据权利要求1所述的检测方法,其特征在于:所述步骤(2)中,过滤标准为,过滤去除序列reads支持数少于6的SNP,去除SNP质量少于20的SNP,去除链特异性的SNP,去除SNP位点的间距少于5bp的SNP。
3.根据权利要求1所述的检测方法,其特征在于:所述步骤(2)中,检测单细胞的SNP所采用的软件为GATK、samtools或SOAPsnp。
4.根据权利要求1所述的检测方法,其特征在于:所述步骤(2)中,将步骤(1)获得的全基因组测序与参考基因序列进行比对所采用的软件为SOAP、BWA或bowtie。
5.根据权利要求1-4任一项所述的检测方法在检测人类癌症细胞的杂合性缺失中的应用。
6.根据权利要求1-4任一项所述的检测方法在制备杂合性缺失检测试剂盒或检测设备中的应用。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510050352.2A CN105986011B (zh) | 2015-01-30 | 2015-01-30 | 一种杂合性缺失的检测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510050352.2A CN105986011B (zh) | 2015-01-30 | 2015-01-30 | 一种杂合性缺失的检测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN105986011A CN105986011A (zh) | 2016-10-05 |
CN105986011B true CN105986011B (zh) | 2019-10-15 |
Family
ID=57036956
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510050352.2A Active CN105986011B (zh) | 2015-01-30 | 2015-01-30 | 一种杂合性缺失的检测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN105986011B (zh) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107287285A (zh) * | 2017-03-28 | 2017-10-24 | 上海至本生物科技有限公司 | 一种预测同源重组缺失机制及患者对癌症治疗响应的方法 |
WO2021037016A1 (en) * | 2019-08-30 | 2021-03-04 | The Chinese University Of Hong Kong | Methods for detecting absence of heterozygosity by low-pass genome sequencing |
CN113113081B (zh) * | 2020-08-31 | 2021-12-14 | 东莞博奥木华基因科技有限公司 | 基于CNV-seq测序数据检测多倍体和基因组纯合区域ROH的系统 |
CN112509638B (zh) * | 2020-12-04 | 2021-12-03 | 深圳荻硕贝肯精准医学有限公司 | 人类hla染色体区域杂合性缺失的分析方法和分析处理装置 |
CN113257346B (zh) * | 2021-06-28 | 2021-10-19 | 北京橡鑫生物科技有限公司 | 一种基于低深度WGS评估HRD score的方法 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006519977A (ja) * | 2002-11-11 | 2006-08-31 | アフィメトリックス インコーポレイテッド | Dnaコピー数変化を同定するための方法 |
CN1920054A (zh) * | 2006-06-23 | 2007-02-28 | 南京中医药大学附属医院 | 乳腺癌基因1(brca1)突变检测分析 |
WO2011083312A1 (en) * | 2010-01-08 | 2011-07-14 | Oxford Gene Technology (Operations) Ltd | Combined cgh & allele-specific hybridisation method |
US9646134B2 (en) * | 2010-05-25 | 2017-05-09 | The Regents Of The University Of California | Bambam: parallel comparative analysis of high-throughput sequencing data |
CN107368705B (zh) * | 2011-04-14 | 2021-07-13 | 完整基因有限公司 | 分析生物体的基因组dna的方法和计算机系统 |
-
2015
- 2015-01-30 CN CN201510050352.2A patent/CN105986011B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN105986011A (zh) | 2016-10-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Marwaha et al. | A guide for the diagnosis of rare and undiagnosed disease: beyond the exome | |
Rutledge et al. | Plasmodium malariae and P. ovale genomes provide insights into malaria parasite evolution | |
CN105986011B (zh) | 一种杂合性缺失的检测方法 | |
Chen et al. | The reverse evolution from multicellularity to unicellularity during carcinogenesis | |
Houston et al. | Development and validation of a high density SNP genotyping array for Atlantic salmon (Salmo salar) | |
Zheng et al. | Major population expansion of East Asians began before neolithic time: evidence of mtDNA genomes | |
Genovese et al. | Using population admixture to help complete maps of the human genome | |
Natri et al. | Genome-wide DNA methylation and gene expression patterns reflect genetic ancestry and environmental differences across the Indonesian archipelago | |
JP6681475B2 (ja) | がん患者のゲノム塩基配列変異情報と生存情報を利用したカスタマイズ型の薬物選択方法及びシステム | |
Xiao et al. | Gene map of large yellow croaker (Larimichthys crocea) provides insights into teleost genome evolution and conserved regions associated with growth | |
CN112226495A (zh) | 一种dna同源重组异常的检测方法及其应用 | |
Keel et al. | Genome‐wide copy number variation in the bovine genome detected using low coverage sequence of popular beef breeds | |
Hills et al. | BAIT: Organizing genomes and mapping rearrangements in single cells | |
Xi et al. | A survey of copy‐number variation detection tools based on high‐throughput sequencing data | |
Armstrong et al. | Genomic associations with bill length and disease reveal drift and selection across island bird populations | |
Mueller et al. | Characterization of the genome and transcriptome of the blue tit C yanistes caeruleus: polymorphisms, sex‐biased expression and selection signals | |
Wasakul et al. | Malaria outbreak in Laos driven by a selective sweep for Plasmodium falciparum kelch13 R539T mutants: a genetic epidemiology analysis | |
Peng et al. | Profiling miRNAs in nasopharyngeal carcinoma FFPE tissue by microarray and Next Generation Sequencing | |
Bredemeyer et al. | Rapid macrosatellite evolution promotes X-linked hybrid male sterility in a feline interspecies cross | |
Sakaue et al. | Decoding the diversity of killer immunoglobulin-like receptors by deep sequencing and a high-resolution imputation method | |
Sun et al. | Deciphering the correlation between breast tumor samples and cell lines by integrating copy number changes and gene expression profiles | |
Lazar et al. | High-resolution genome-wide mapping of chromosome-arm-scale truncations induced by CRISPR-Cas9 editing | |
Gómez-Hernández et al. | Evaluation of the multispecies coalescent method to explore intra-Trypanosoma cruzi I relationships and genetic diversity | |
Zhang et al. | NyuWa Genome Resource: Deep Whole Genome Sequencing Based Chinese Population Variation Profile and Reference Panel | |
CN114974432A (zh) | 一种生物标志物的筛选方法及其相关应用 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
REG | Reference to a national code |
Ref country code: HK Ref legal event code: DE Ref document number: 1227443 Country of ref document: HK |
|
GR01 | Patent grant | ||
GR01 | Patent grant |