CN104136628A - 一种检测染色体微缺失和微重复的方法 - Google Patents

一种检测染色体微缺失和微重复的方法 Download PDF

Info

Publication number
CN104136628A
CN104136628A CN201180075188.0A CN201180075188A CN104136628A CN 104136628 A CN104136628 A CN 104136628A CN 201180075188 A CN201180075188 A CN 201180075188A CN 104136628 A CN104136628 A CN 104136628A
Authority
CN
China
Prior art keywords
sample
sites
chromosome
site
dna
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201180075188.0A
Other languages
English (en)
Inventor
陈芳
潘小瑜
陈盛培
李旭超
蒋慧
张秀清
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
BGI Shenzhen Co Ltd
Original Assignee
BGI Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by BGI Shenzhen Co Ltd filed Critical BGI Shenzhen Co Ltd
Publication of CN104136628A publication Critical patent/CN104136628A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • C12Q1/6874Methods for sequencing involving nucleic acid arrays, e.g. sequencing by hybridisation
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • G16B30/10Sequence alignment; Homology search
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Analytical Chemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Biotechnology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biophysics (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Genetics & Genomics (AREA)
  • Medical Informatics (AREA)
  • Theoretical Computer Science (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Immunology (AREA)
  • Microbiology (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • Pathology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明属于基因组突变检测领域,公开了染色体DNA片段拷贝数变异(Copy number variation,CNV)的检测。本发明还公开了与染色体DNA片段拷贝数变异有关的疾病检测。

Description

一种检测染色体微缺失和微重复的方法
技术领域
本发明涉及基因组突变检测领域, 特别涉及细胞染色体 DNA片段拷贝数变异 (Copy number variation, CNV ) 的检测。 本发明还涉及与细胞染色体 DNA片段拷贝数变异有关 疾病检测。
背景技术
染色体微缺失 /微重复是指染色体上出现长度为 1.5kb-10Mb的缺失或重复。 人类染色 体微缺失 /微重复综合征 (microdeletion/microduplication syndromes)是一类因人类染色体上 出现微小片段缺失或重复 (即 DNA片段拷贝数变异) 引起复杂表型疾病, 在围产儿和新 生儿中发病率较高, 可导致严重的疾病和异常, 如先天性心脏病或心脏畸形、 严重的生长 发育迟缓、 外貌或肢体畸形等。 另外, 微缺失综合征也是除唐氏综合征与 X染色体易损综 合征外引起智力发育迟缓的主要原因之一。【Knight SJL (ed): Genetics of Mental Retardation. Monogr Hum Genet. Basel, Karger, 2010, vol 18, 101-113 ]0 近年在来, 在国内外的主要出生 缺陷发病率统计中,排在前列的是与染色体微缺失 /微重复有关的先天性心脏病、智力低下、 脑瘫和先天性耳聋。常见的微缺失综合征包括 22ql l微缺失综合征、猫叫综合征、 Angelman 综合征、 AZF缺失等。
以 22ql l微缺失综合征为例, 该综合征是由人类染色体 22ql 1.21 - 22ql 1.23区域杂合 性缺失引起的一类临床症候群, 包括 DiGeorge综合征、腭心面综合征、椎干异常面容综合 征、 Cayler心面综合征和 Opitz综合征等数个具有相同遗传学基础的临床综合征, 该病最 常见的临床表现包括心脏畸形、 异常面容、 胸腺发育不良、 腭裂和低钙血症; 此外该综合 征患者还可以出现体格和智力发育迟缓、 学习和认知困难、 精神异常等表现, 是人类最常 见的微缺失综合征, 其发生率为 1 : 4000 (活产婴儿), 男女发病率无明显差异。 [ Drew LJ, et al. The 22ql 1.2 microdeletion: Fifteen years of insights into the genetic and neural complexity of psychiatric disorders. Int J Dev Neurosci. 2010 Oct 8.】。
尽管每种微缺失综合征发病率都很低 (https://decipher.saneer.ac.uk/svndromes ) , 其中 较常见的 22ql l微缺失综合征、 猫叫综合征、 Angelman综合征、 MiUer-Dieker综合征等发 生率分别为 1 : 4000 (活产婴儿) 、 1 : 50000、 1 : 10000、 1 : 12000, 但由于临床检测技术的 限制, 大量的微缺失综合征患者在产前筛査和产前诊断中无法检出, 甚至在婴儿出生数月 甚至数年后出现典型的临床表征后, 回溯性的寻找原因时, 也因检测技术的限制无法对病 因进行确诊。 由于部分类型的微缺失综合征无法根治, 在出生后数月或数年内去世, 给社 会和家庭带来沉重的精神和经济负担。据不完全统计,全 '快乐木偶综合征" (即 Angelman 综合征) 患者己达 1.5万名。 其他类型的染色体微缺失综合征患者数量也呈逐年增加的趋 势。因此,孕前对临床疑似患者和有相关不良孕产史的父母进行染色体微缺失 /微重复检测, 有利于提供遗传咨询和提供临床决策依据; 在孕期进行早期产前诊断可有效防止患儿出生 或为针对性的为患儿提供出生后的治疗方法提供依据 [ Bretdle F, et aL.Prenatal and postnatal diagnosis of 22ql l .2 deletion syndrome. Eur J Med Genet. 2010 Nov-Dec; 53(6): 367-370】 。
然而, 这类疾病由于染色体水平微小变异而无法用常规的临床方法如染色体核型分析 方法等(分辨率为 10M以上)检出【]^1&1(;01111 S. Microdeletion and microduplication syndromes. Prenat Diagn. 1996 Dec; 16(13): 1213 - 9】 。 目前针对微缺失 /微重复综合征的诊断方法主要 有高分辨率染色体核型分析、 FISH (荧光原位杂交) 、 Array CGH (比较基因组杂交) 、 MLPA (多重连接探针扩增技术)和 PCR的方法等, 利用这些方法, 可以检测染色体的微 缺失 /微重复。
高分辨率染色体核型分析是 20世纪 80年代后出现的高分辨显带技术, 其采用细胞同 歩化的方法, 获得大量优质的有丝分裂晚前期或早中期的显带核型, 使单套染色体的条带 数量增至数百条以上,从而提高识别染色体细微结构改变的能力,但其分辨率只有约 3-5M。 尽管该方法的分辨率较常规染色体核型分析高, 但不足以检测更小的染色体水平上的微缺 失 /微重复变异【 Jorge J. Yunis, Jeffrey R. Sawyer and David W. Ball. The characterization of high-resolution G-banded chromosomes of man. Chromosoma. 67(4), 293 - 307】。
FISH (荧光原位杂交)是在 20世纪 80年代末发展起来的一种非放射性分子细胞遗传 技术, 该方法是微缺失 /微重复检测的黄金标准, 该方法可以有效地检测出大部分染色体缺 失。其基本原理是: 如果被检测的染色体或 DNA纤维切片上的靶 DNA与所用的核酸探针 是同源互补的, 二者经变性-退火-复性, 即可形成靶 DNA与核酸探针的杂交体。将核酸探 针的某一种核苷酸标记上报告分子如生物素、 地高辛, 可利用该报告分子与荧光素标记的 特异亲和素之间的免疫化学反应, 经荧光检测体系在镜下对待测 DNA进行定性、 定量或 相对定位分析。 其优点是: 实验周期短、 能迅速得到结果、 特异性好、 定位准确。 中期染 色体 FISH的分辨率可达 1~2M, 间期染色体 FISH分辨率可达 50K, 但该技术需在已知缺 失位点的情况下,设计探针进行验证,不宜用于发现新的染色体水平的微缺失或重复异常, 且价格昂贵, 对操作人员的技术熟练程度要求高 [Fluorescence in situ hybridization. Nature Methods, 2237 - 2238, 2005
Array CGH (微阵列 -比较基因组杂交)是近年被应用到临床细胞遗传学领域的一项技 术, 其将特异 DNA片段作为靶探针固化在载体上形成微阵列, 通过将荧光素标记的待测 DNA和参考 DNA与微阵列杂交从而检测 DNA拷贝数变异。 Array CGH的分辨率取决于 所设计的探针的类型、 大小及其在基因组上的距离, 理论上可检测 5至 10kb甚至更小的 DNA序列,但该方法价格昂贵且一般并不覆盖全基因组的所有位点。 目前用于染色体微缺 失综合征的诊断已多见于文献【ACOG Committee Opinion No. 446: array comparative genomic hybridization in prenatal diagnosis. Obstetrics and Gynecology, 2009】。
MLPA (多重连接探针扩增技术)是近几年发展起来的一种针对待检 DNA序列进行定 性和半定量分析的新技术。 MLPA 技术目前在临床实验室己应用于 Y 染色体微缺失、 22ql l .2染色体微缺失等的检测,优点是高效、特异、快速、简便,缺点是样品容易被污染, 不适合检测未知的点突变类型、 不能检测染色体的平衡易位【王科等, MLPA技术检测 22ql l .2染色体微缺失. 《第七届全国唇腭裂学术会议论文集》,2009】。
PCR方法常用于 Y染色体微缺失方面的检测, 如 Y染色体上与男性生殖相关的 AZF 基因 (AZFa、 AZFb、 AZFc)等的缺失则多用 PCli的方法检测。 对于己知的染色体微缺失 位点的验证也可以用 PCR方法。该方法简便易行, 缺点是只能针对已知位点进行检测, 且 一次仅能针对一个位点进行检测。确切的检测方法需结合多个位点的 PCR反应方能达到检 测目的【Cong-yi YU, et al. Multiplex PCR Screening of Y Chromosome Microdeletions in Azoospermic Patients. JOURNAL OF REPRODUCTION AND CONTRACEPTION. 2004, 15(4)】 。
结合上述内容可知, 目前对于染色体微缺失 /微重复的检测方法存在的限制因素主要有 分辨率低、 不能覆盖全基因组、 低通量和高成本。 急需开发一种克服这些限制因素的检测 染色体微缺失 /微重复的新方法。
发明内容
随着髙通量测序技术的不断发展与测序成本的不断降低, 通过高通量测序进行染色体 异常的检测分析得到了越来越广泛的应用。为了解决目前检测染色体微缺失 /微重复方法的 缺陷如分辨率不高等, 本发明设计了一种基于高通量测序技术的检测 DNA拷贝数变异进 而对染色体微缺失 /微重复进行检测的方法。该方法克服了现有技术常用的几种方法的分辨 率低、 不能覆盖全基因组、 低通量和高成本的缺点, 在全基因组水平上进行染色体微缺失 /微重复的检测,既能对疾病的已知位点进行査找和验证,也能对未知位点进行探索和发现, 通量高、 特异性高、 定位准确。 通过对染色体微缺失 /微重复进行检测, 可以实现对染色体 微缺失 /微重复综合征的检测。
本发明涉及一种检测细胞染色体 DNA片段拷贝数变异(Copy number variation, CNV ) 的方法, 其包括以下步骤: a) 将获自待测受试者和正常受试者基因组 DNA分子随机打断, 得到 DNA片段, 并 对所述 DNA片段进行测序, 获得测序的读段;
b)将步骤 a中测定的 DNA序列与所述受试者的物种的基因组参考序列进行比对, 将 所测 DNA序列定位于参考序列上, 只选用在参考序列上有唯一位置的读段进行分析; c)寻找参考序列上符合以下条件的位点:待测受试者样品的比对结果与正常受试者样 品的比对结果相比, 在两侧拷贝数变异比率有差异的位点, 步骤如下:
i) 对于参考序列上每一个位点 b, 强制使其左右两侧的局部窗口包含 w条正常读段, 即满足 N(^,b) = N(b, ) = w, 其中 NO^x 为正常样品落在窗口 (^, )中的比对条数; ii) 在这些位置中, 筛选符合^ ^^/^^,^ 的位点, 剔出符合 A(xt,jcfl) = 0, b-w<i<b + w 的 位 点 , 其 中 1)(;^, ) = 10§( (^,(:))-10§(?((:,^)) ,
R(x,,xR)= Χι',Χκ)Ι '' , 其中正常样品读段和待测样品读段唯一比对到参考序列上的条 ' N{xL,xR)laN
数分别为和 和 、 落在窗口(^, )中的唯一比对到参考序列的读段条数分别为 ;^^^^和^^,^),通过对检验统计量/ 进行正态分布的双侧显著性检验, 得到 每个位点的 ( ^,¾)|); iii) 设置/ , 反复进行以上步骤直至得到所有符合 ^^^,^^)〉 ^的位点, 得到 候选位点集合为 Bc, Bc = H..,bN} . 其中 可以被设定,例如将侯选位点为 10、100、1000或10000时最小的/7(|/)(^, )|) 设定为 pbkp; 也可以通过以下方式选择 将正常样品作为待测样品, 执行前述歩骤 a) 至 c)的 ii),并将所有 ^^(x, , )|)通过错误发现率控制(False discovery rate control, FDR control)进行过滤,并将过滤后的位点中最后一个突破 FDR阈值的 作为 pbkp; 进行错误发现率控制的歩骤为:
将待检验的数据集按显著性 (P值) 从小到大排序, 得到他们的秩 (r); 从上到下做检验, 直到最后一个满足 A «的位点 k停止, 其中 ^为第 k个位置 的 P值, ^为第 k个位置的秩, N为总位点个数, "为显著性水平, 如 0.01;
保留 k及其之前的所有位点, 去除之后的假阳性位点; d) 对步骤 C中所得的选位点集合 , ^ .., }中的每一个位点 Α, 其两侧存 在窗口: (bk―、, bk -V}和 (bk,bkJ, 去除该两窗口之间拷贝数变异比率差异较小的位点, 即删 除/ 最大的位点 并更新合并区间 (b^bk+o 值, 通过设 重 复以上步骤,直到所有位点满足 ―,, ¾+1)|) < ,则剩余的位点即为满足寻找 CNV 所需要求的位点, 即获得发生染色体拷贝数变异的断点;
其中^ ^的可以被设定, 例如设定使剩余位点数目为原侯选位点数目的 1/2、 1/10、
I/loo或 1/1000时的最大 ? 为 Pmeise ; 也可以通过以下方式选择/ m 将正常 样品作为待测样品, 执行上述步骤 a) 至 d), 使得合并后候选位点数量变为最初位点数量 的 1/2、 1/10、 1/100或 1/1000, 其中最大的; 被选为 7m^。 本发明还涉及一种检测一类因细胞染色体 DNA 片段拷贝数变异 (Copy number variation, CNV)产生复杂的临床表型效应的疾病分析方法,所述方法除了包括上述步骤 a) -d) 外, 还包括:
e) 基于歩骤 d中得到的断点进行 CNV分析, 将待测样品对于正常样品的 CNV比率 小于等于微缺失检测阈值的位点选择为微缺失位点; 将待测样品对于正常样品的 CNV 比 率大于等于微重复检测阈值的位点选择为微重复位点,
微缺失检测阈值和微重复检测阚值可以由本领域技术人员根据经验选择, 例如微缺失 检测阈值为 0.75, 微重复检测阈值为 1.25;
f)将所述微缺失位点和 /或微重复位点对照已有的 CNV和疾病数据库进行基本的基因 注释和缺失部分涉及的基因功能分析, 标注出微缺失综合征疾病类型。
本发明的实施方案的具体技术流程见图 1。
本发明的效果
与目前检测染色体微缺失 /微重复常用的方法 (如高分辨率染色体核型分析、 FISH、 Array CGH和 PCR的方法) 相比, 本发明的优越性主要有以下几点:
1) 高分辨率: 本发明对染色体 CNV分析的精度可达 100kb, 能有效检测出染色体微 缺失 /微重复。
2) 适用于更广的数据分析, 提高内存设备利用率: 重编译算法, 改进数据处理的方 法, 原 SegSeq软件只适合 1~4X低深度测序数据分析, 改良后的 SegSeq可用于 1〜30X不 同测序深度的数据分析。
3) 覆盖全基因组:基于第二代测序技术,本发明可以对全基因组范围进行染色体 CNV 分析, 不需依赖已知的探针和设计探针, 可发现新的染色体异常。
4) 高通量: 基于高通量测序技术, 本发明可以高通量地进行染色体 CNV分析, 通过 在每个样品上加上不同的标签序列, 可以一次地对大量样品进行分析。
5) 成本低: 随着测序技术的不断发展和测序成本的不断降低, 本发明对染色体 CNV 分析的成本也在不断下降。
附图说明
图 1、 本发明对染色体 CNV分析的简要流程图。
图 2、 SeqSeq算法流程示意图。
图 3、 样品 1 (A)、 样品 2 (B) 和样品 3 (C) 的染色体数字核型图, 染色体上重复、 缺失和正常区域, 相应位置和详细信息见表 2。
图 4、 样品 4 (A)、 样品 5 (B) 和样品 6 (C) 的染色体数字核型图, 染色体上重复、 缺失和正常区域, 相应位置和详细信息见表 4。
具体实施方式
在本发明说明书和权利要求书中, 读段 (reads) 是指测序获得的序列片段。
在本发明说明书和权利要求书中, 断点(breakpoint)是指染色体上发生拷贝数变异的 分界点。
本发明中, 获自受试者的基因组 DNA可以从受试者的血液、 组织或细胞获取。 所述 的血液可以来自父母的外周血或胎儿的脐带血; 所述的组织可以是胎盘组织或绒毛膜组 织; 所述的细胞可以是未培养或培养过的羊水细胞、 绒毛组细胞。 在本发明中, 待测受试 者和正常受试者是同一物种。
本发明中, 基因组 DNA的获取可以采用盐析法、 柱层析法、 磁珠法、 SDS法等常规 DNA提取方法, 优选采用磁珠法。所谓的磁珠法, 是指血液、 组织或细胞经过细胞裂解液 和蛋白酶 K的作用后得到裸露的 DNA分子, 利用特异性的磁珠对 DNA分子进行可逆性 的亲和吸附, 经漂洗液清洗除去蛋白质、 脂质等杂质后, 用纯化液将 DNA分子从磁珠上 洗脱下来。 磁珠法可以依照生产商提供的方案进行。
在本发明中, DNA分子的随机打断处理可以采用酶切、雾化、超声、或者 HydroShear 法。 优选地, 采用超声法, 例如, Covaris公司的 S-series基于 AFA技术, 当由传感器释 放的声能 /机械能通过 DNA样品时, 溶解气体形成气泡。 当能量移除后, 气泡破裂并产生 断裂 DNA分子的能力。通过设置一定的能量强度和时间间隔等条件(打断参数举例如下: Duty cycle 20%, Intensity 10, cycles/Burst 1000, Time 60s, Mode: power tracking) , 可 将 DNA分子打断至一定范围的大小 (例如, 200bp - 800bp不等) 。 具体原理和方法请参 见生产商提供的说明书, 将 DNA分子打断为比较集中的一定大小的片段。 在本发明的一 个实施方案中, DNA分子被打断至约 500bp的大小。
在本发明中, 所采用的测序方法可以为高通量测序方法 mumina/SoleXa、 ABI/SOLiD、 Roche/454 测序类型可以为 single-end (单向)测序和 Pair-end (双向)测序, 测序长度可 以为 50bp、 90bp、 或 100bp。 在本发明的一个实施方案中, 测序平台为 Illumina/Solexa, 测序类型为 Pair-end测序, 得到具有双向位置关系的 lOObp大小的 DNA序列分子。
本发明中, 测序深度可以是 〜 30 X, 即总数据量为人类基因组长度的 1 -30倍, 例如 在本发明的一个实施方案中, 测序深度为 2 X, 即 2倍 (6x l09bp) 。 具体的测序深度可以 依据检测的染色体变异片段大小确定, 测序深度越高, 检测的缺失和重复的片段越小。
当待测的 DNA分子来自多个受试样品时, 每个样品可以被加上不同的标签序列, 以 用于在测序过程中进行样品的区分【Micah Hamady, Jeffrey J Walker, J Kirk Harris et al. Error-correcting barcoded primers forpyrosequencing hundreds of samples in multiplex. Nature Methods, 2008, 5(3)】 , 从而实现同时对多个样品进行测序。
本发明中,基因组参考序列可以来自公共数据库。例如,人类基因组序列可以是 NCBI 数据库中的人类基因组参考序列。 在本发明的一个实施方案中, 所述人类基因组序列是 NCBI数据库中版本 36 ( hgl 8 ; NCBI Build 36 ) 的人类基因组参考序列。
序列比对可以通过任何一种序列比对程序, 例如本领域技术人员可获得的短寡核苷酸 分析包 (Short Oligonucleotide Analysis Package, SOAP) 和 BWA比对 ( Burrows- Wheeler Aligner) 进行, 将读段与参考基因组序列比对, 得到读段在参考基因组上的位置。 进行序 列比对可以使用程序提供的默认参数进行, 或者由本领域技术人员根据需要对参数进行选 择。 在本发明的一个实施方案中, 所采用的比对软件是 SOAPaligner/soap2。
本发明中, 将读段比对到染色体序列数据上的是 SOAP之类的软件; 基因组拷贝数变 异(copy number variation, CNV )的软件算法是一种由 Broad研究院开发的 Matlab脚本 (:群), 称为 Segseq软件算法。 见图 2。 它能够通过新一代测序技术产生的数据, 凭借癌变样品与 正常样品的比较,计算出拷贝片段的断点(breakpoint )以及拷贝数变异比率(tumor - normal copy ratio) , 同时可以估算出相应的 P _ value等统计数据, 在低测序深度( 10M PE: 32,36 读段) 的时候可检测出 50K左右的 CNV片段。
本发明中, 对待测样品寻找 CNV分析的断点, 是指利用改良的 Segseq软件算法, 以 正常样品为阴性对照, 在参考基因组序列上寻找待测样品和正常样品在其两侧拷贝数变异 比率差异符合条件的位点, 即断点。 所述断点的寻找包括两个步骤: 即 (1 ) 初始化, 目 的在于选出候选点; (2 ) 反复合并相邻片段, 降低假阳性率。 具体的原理及数学模型是: 在测序所得读段为来自基因组 DNA中的随机片段的前提 下, 在比对后落到一个区域的读段数量应服从泊松分布。 设全基因组中可比对区域长度为 A (^ί = 2.2χ109 ) , 正常样品和待测样品能比对到参考序列的读段条数分别为和 和 、 落在窗口(χΔ, c«)中的读段条数分别为 NO^^^nr^,^), 窗口大小 = χΛ-^+1, 则 N 和 Γ分别服从参数为 =·^和 的泊松分布, 且有 i^-rxax ^, α = ατΙαΝ
A A 贝数变异比率定义为 Χ Χ 'ατ , 在抽样很大的条件下, (; ^, )接近对数
N(xL,xR)/aN
正态分布。定义 Ζ)(Χ Λ:Λ) = log A:))— log <x〈 ^。那么,由于/ 接近对数正态分布, 则 £>(χΛ, )服从正态分布, 从而应用双侧 P-value ( p D(xL,xR)\> d)) 可检验某个位点两侧的拷贝数变异比率差异是否显著。
寻找断点的歩骤 (1) 中的初始化, 是指初选出候选点的流程。 具体的, 对于参考序 列上的位置 6 , 强制使其左右两侧的局部窗口包含 w条正常读段, 即满足 N(x,,b) = N(b,xR) = w, 则在这些位置中, 满足^^!^^ ^/^^,^;^的加入候选序列; 而 满足 A(^, ) = 0, 6- v</<6 + w的被易 ij除, 不列入候选点。 通过设定合适的; ¾ , 反复 进行以上歩骤直到所有 >(|£>( ,½)|)> Pbkp, 则得到适当数目的候选点。
在本发明中, W可以是大于 1的任意整数, 例如 5 - 5000, 优选 10 - 2000, 更优选为
100- 1000例如 300。
寻找断点的歩骤 (2) 中反复合并相邻片段, 是指通过极大似然处理, 使得之间拷贝 数变异比率差异较小的相邻片段得以合并, 从而降低假阳性率。 具体的, 设步骤 (1) 中 所得的候选点集合为 Bc, BH ,bN , 则候选点 *的左右两侧窗口分别为 (bw, -1) 和 ,去除该两窗口之间拷贝数变异比率差异较小的位点。即,删除 (¾_„¾+1)|) 最大的位点 A, 并更新合并区间 (^小!^+^的^7值, 通过设置/ ^^, 重复以上步骤, 直到所 / ^, 则剩余的位点即为满足寻找 CNV所需要求的位点。
本发明中, 在寻找候选点后进行 CNV分析, 是指根据该领域群体数据分析的经验值 将待测样品对于正常样品的 CNV比率 0.75和 1.25分别作为染色体拷贝数变异的检测 阈值, CNV比率 0.75即为染色体缺失, CNV比率 1.25为染色体重复。 根据分析得到 微缺失 /微重复结果绘制染色体数字核型图。 染色体数字核型是一种量化基因组上 DNA拷贝数变异的技术, 将全基因组上特定位 点的 DNA短序列分离列举出。 例如, 对于人染色体而言, 绘制染色体核型图通常是将一 个细胞中的染色体从最大 (第 1号染色体) 到最小的 (第 22号染色体) 排列, 性染色体 ( X和 /或 Y)显示在最后。 这是本领域中常用的表示方法, 在本领域普通技术人员的能力 范围内。例如可以参考文章【Tian-Li Wang et al. Digital karyotyping. PNAS, 2002, vol. 99, no. 25, 16156~16161.】、 【Henry Wood et al. Using next-generation sequencing for high resolution multiplex analysis of copy number variation from nanogram quantities of DNA from formalin-fixed paraffin-embedded specimens. Nucleic Acids Research, 2010, 38(14), doi: 10.1093/nar/gkq510.】或者本发明实施例来进行。
在本发明中, 其中/ 7 ρ可以被设定, 例如将侯选位点为 10、 100、 1000或 10000时最 小的 设定为 ρΜρ ; 也可以通过以下方式选择/ 将正常样品作为待测样品, 执行本发明的歩骤计算/? (|£>(^, )|),并将所有/ ?(|£·(¾,χ )|)进行错误发现率控制(False discovery rate control, FDR control ),并将最后一个突破 FDR阈值的 pfl ( ^,¾ )作为 pbkp。 例如, 在实施例中, 有异于癌症样品, 群体研究中不存在默认的对照样品(例如, 癌旁) , 所以我们利用了炎黄群体的数据 (45名南方汉族 +45名北方汉族) 的深度测序数据弥补由 此带来的不足。 我们将混合正常样品 (此处只出了炎黄一号之外的炎黄群体数据) 当做待 测样品, 分别执行本发明方法步骤 a)至 c) 的 H ) , 并将所有 ρ(|Ζ)( > ½)|)进行错误发现 率控制 (False discover rate control , FDR control ) , 并将最后一个突破 FDR 阈值的
在本发明中, 其中 可以被设定, 例如设定使剩余位点数目为原侯选位点数目的
1/2、 1/10、 1/100或 1/1000时最大的 ρ(|£>(^, )|)为 pmerge;也可以通过以下方式选择 pmerge: 将正常样品作为待测样品, 执行本发明方法步骤 a) 至 d), 使得合并后候选位点数量变为 最初位点数量的 1/2、 1/10、 1/100或 1/1000,其中最大的 /?(|/)(^, |)被选为 。例如, 在实施例中, 由于缺乏默认对照样品 (例如癌旁) , 我们无法通过合并默认对照的方法来 选定阈值。 我们将混合正常样品 (此处只出了炎黄一号之外的炎黄群体数据)执行本发明 的方法至合并步骤, 直到候选点集合中候选点数量变为最初的 1/100, 其中最大的 被选为 , 用到后面的分析。 在本发明中, 正态分布显著性检验 P值的计算方法可以使用本领域中公知的方法, 也 可以通过现有的大量软件算法进行计算, 这些算法是本领域普通技术人员可以获得的。 本发明中, 已有的 CNV与疾病数据库, 是指已有拷贝数变异与疾病关联信息的数据 库 。 在 本 发 明 的 一个 实施方案 中 , 所 使用 的 数据 库值 DECIPHER (https://decipher.sanger.ac.uk/svndromes), 该数据库列出的 58 种微缺失 /微重复综合征均为 缺失重复片段与疾病关系明确的内容。
在本发明的一个实施方案中, 针对绒毛组织进行染色体 CNV分析的具体方法包括以 下歩骤:
1、 DNA提取及测序: 按照磁珠法基因组 DNA提取试剂盒(例如 Tiangen DP329)操 作手册提取绒毛组织 DNA后, 按照 niumina/Solexa标准建库流程进行建库。 在这个过程 中,绒毛组织 DNA通过超声法随机打断为集中在 500bp左右的 DNA分子,两端加上测序 所用接头, 每个样品被加上不同的标签序列(index) , 从而在一次测序得到的数据中可以 使多个样品的数据区分开。
2、 比对及统计: 利用第二代测序方法 Illumina/Solexa 测序 (用其它测序方法如 ABI/SOLiD能达到相同或相近的效果) , 每个样品得到一定大小片段的 DNA序列, 即读 段, 将其与 NCBI数据库中的标准人类基因组参考序列进行 SOAP比对, 得到所测 DNA 序列定位于基因组相应位置的信息。 为避免重复序列对 CNV分析的干扰, 只选取与人类 基因组参考序列唯一比对的读段 (Unique reads) , 作为后续 CNV分析的有效数据, 并统 计其数目 。
3、 数据分析: 以己知正常样品作为阴性样品, 通过基于 SegSeq算法的 CNV分析, 寻找 CNV分析所需的断点以及计算待测样品相对正常样品的拷贝数变异比率, 通过设置 一定的检测闽值, 判断待测样品的染色体片段微缺失 /微重复情况, 并绘制染色体数字核型 图和进行对应的基因注释。 具体过程如下:
1 )初始化: 对于同一条染色体上, 对于一个位置为 6, 设置参数^使其左右两侧的局 部窗口包含 300条正常读段, 即 N(^,6) = N(6,xs) = >v = 300。 在待测样品的读段位置中, 满足 6 = m n /j(| ,χ )|)的加入候选序列,满足 A( ,¾) = 0, >— w < < 6 + w的被易 lj除。 设置/ 7Mp相关的参数为 1000, 使该初始化流程输出 1000个候选点。 反复进行上述剔除和 加入候选序列的步骤, 直到所有;^/)^^^)〉^^, 输出染色体 c上的候选点集合 ^,
2 ) 反复合并相邻片段: 初始化得到候选点集合中候选点 ;t的左右两侧窗口分别为
1)和( ,^+1), 设置; ;mge相关的参数为 10,使该反复合并流程输出至多 10个假阳 性片段结果。 通过反复合并之间拷贝数变异比率差异较小的相邻片段, 直到所有 ' 得到最终的分析 CNV所需的有效候选点, 即断点。
3 ) CNV分析: 统计上述最终断点, 设某两个断点之间窗口为 ( ,; ^) , 计算待测样品 相对正常样品的 CNV比率 i?0c,,½) = T(X X /ar 。 将所述 CNV比率 0.75和 1.25分
' N{x, , xR) l aN
别作为染色体片段缺失和重复的检测阈值,分析得到微缺失 /微重复结果后绘制染色体数字 核型图并进行基因注释。
本发的方法适用于对动物和人进行染色体 CNV分析, 特别是哺乳动物, 更特别是人。 本发明可以用于对适用人群进行染色体 CNV分析,所述染色体 CNV分析可以用于非 诊断用途, 例如作为对基因组进行研究的工具。 本发明还可以用于对适用人群进行染色体 CNV分析,有利于提供遗传咨询和提供临床决策依据;进行植入前诊断或产前诊断可有效 防止患儿出生。 本发明适用人群可以是常规染色体核型分析无异常、 但有以下临床表现的 人群-
1) 多次胚胎停育或自然流产的女性及其配偶;
2) 曾生育过畸形胎儿的女性及其配偶;
3) 男性无精少精不育症患者;
4) 原因不明的男性不育症患者;
上述适用人群举例仅用于说明本发明, 而不应为限定本发明的范围。 下面将结合实施例对本发明的实施方案进行详细描述, 但是本领域技术人员将会 理解, 下列实施例仅用于说明本发明, 而不应视为限定本发明的范围。 实施例中未注 明具体条件者, 按照常规条件或制造商建议的条件进行。 所用试剂或仪器未注明生产 厂商者, 均为可以通过市场获得的常规产品。 以下括号内为各个试剂或试剂盒的厂家 货号。 所使用的测序用的接头和标签序列来源于 IUumina公司的 Multiplexing Sample Preparation Oligonutide Kit。
实施例一、 对 3例组织进行染色体 CNV分析
1. DNA提取与测序
按照磁珠法基因组 DNA提取试剂盒 (TiangenDP329) 操作流程提取 3例因产前筛査 高风险(风险值 1/9)、 孕妇本身为平衡易位携带者且之前怀过一例异常胎儿而进行绒毛膜 穿刺术的胎儿组织样本 (以下简称样品 1、 样品 2和样品 3 , 共 2例绒毛及 1例胎盘组织 样品) 的 DNA, 用 Qubit ( Invitrogen, the Quant-iT*1 dsDNA HS Assay Kit) 定量, 所提取 的 DNA总量为约 500ng。
提取的组织 DNA是完整的基因组 DNA,按照 Illumina/Solexa标准建库流程进行建库。 简而言之, 在打断为集中于 500bp的 DNA分子两端被加上测序所用接头, 每个样品被加 上不同的标签序列 (index ) , 然后与芯片 (flowcell ) 表面互补接头杂交, 在一定条件下 使核酸分子成簇生长, 然后在 mUmina mSeq 2000上通过双末端测序, 得到具有位置关系 的成对的长度为 lOObp的 DNA片段序列。
随后, 将获自上述组织的约 500ng的 DNA使用 Covaris S-series随机打断至 500bp片 段后, 进行修改后的 Illumina/Solexa 标准流程建库, 具体流程参照现有技术 (参见 http://www.illumina.com/提供的 Illumina/Solexa 标准建库说明书)。 经 2100 Bioanalyzer (Agilent)确定 DNA文库大小及插入片段大小, QPCR精确定量后可上机测序。每个样品最 后得到的数据总量为 6x l09bp。
本实施例中, 对于获自上述 3 例组织的 DNA样品按照 Illumina/Solexa官方公布的 Cluster Station和 Hiseq 2000 (PE sequencing) 说明书进行操作。
2. 比对与统计
经步骤 1中所述进行测序后, 每个样品根据所述标签序列区分开并得到约 500bp的一 定大小片段的 DNA序列, 即读段。 利用比对软件 SOAPaligner/SOap2, 将测序所得读段与 NCBI数据库中版本 36 (hgl 8 ; NCBI Build 36 ) 的人类基因组参考序列进行比对, 得到所 测 DNA序列定位于基因组相应位置的信息。 只选取与人类基因组参考序列唯一比对的唯 一读段, 作为后续 CNV分析的有效数据, 并统计其数目 ^。
本实施例中, 已知正常样品选取炎黄基因组 DNA样品作为阴性样品对照【Jun Wang, et al. The diploid genome sequence of an Asian individual. Nature. 2008 Nov 6; 456(7218): 60 - 65】
取与待测样品相同的数据量经标准化后统计其有效读段数目 , = 68750810。 统 计上述样品 1、样品 2和样品 3的有效读段数目 ^分别为 25934245 , 34164361和 32085646。 3. 数据分析
1) 初始化: 运行 SegSeq算法, 对于一条染色体上的位置 6, 设置参数 w = 300使位置 6左右两侧的局部窗口包含 300条正常读段, 即 Λ^(χΛ,6) = (6,χΛ) = >ν = 300。 在待测样品 的读段位置中, 满足 6 = m n /7 (| , (^,^)|)的加入候选序列, 满足 (^,^) = 0、 6 - >V ' < 6 + M的被剔除。 设置 ρΜ/)相关的参数为 1000, 使该初始化流程输出 1000个候选 点。 反复进行上述剔除和加入候选序列的步骤, , 输出染色体 c上的候选点集合 ^, Bc={b,b2,...,bN}.
2) 反复合并相邻片段: 初始化得到候选点集合, 设候选 ^ t的左右两侧窗口分别为 bk―、, b 和 φ , 设置 相关的参数为 10,使该反复合并流程输出至多 10个假阳 性片段结果。 去除两侧窗口之间拷贝数变异比率差异较小的位点, 直到所有
P Dbi (¾_„64+1)|) < Pmerge, 得到最终的分析 CNV所需的有效断点。
3) CNV分析: 统计上述最终断点, 设某两个断点之间窗口为 计算待测样品 相对正常样品的 CNV比率 ?(^,½)= T^'x^/ar 。 将所述 CNV比率 0.75和 1.25分
N{xL,xR)laN
别作为染色体片段缺失和重复的检测阈值,分析得到微缺失 /微重复结果后绘制染色体数字 核 型 图 , 与 arrayCGH ( The Fetal DNA Chip, http://www.fetalmedicine.hk/en/Fetal DNA Chip.asp ) 进行比较。 根据 DECIPHER数据库 进行疾病分类并进行基因注释。
4) CNV分析结果输出并绘制数字核型图。
阴性对照结果拷贝数均为正常, 3例样品的 CNV结果以及检测结果验证和主要基因分 别如下表 2和 3所示。
表 2
表 3
样品
区带 arrayCGH结果 比较 疾病类型或影响的基因 编号
5pl5.33-*pl3.2 5pl5.3~p 13.2(183931 ~36816731)xl 一致 猫叫综合征(Cri du Chat 样品 1
18ql2.3→q23 18pl2.3~q23(39086755~76067279)x3 一致 Syndrome),部分 18三体综合征
BIVM> C13orf27、 KDELCK 样品 2 13q32.2→q33.3 13q32~q33.3(97091318-106466788)x 1 一致
BIVM、 E CC5
2q36~q37.3(230369496~242444380 ) TRIP12, SLC19A3、 PIDK 样品 3 2q36.3→q37.3 一致
x3 NYGGF4 从上述结果可以看出: 高通量测序检测到得染色体微缺失和微重复区域与现有的 arrayCGH (The Fetal DNA Chip. http://www.fetalmedicine.hk/en/Fetal DNA Chip.asp )结果 一致, 具体数字核型图见图 3A-C。 实施例二、 对另外 3例绒毛组织进行染色体 CNV分析
3例绒毛组织 (以下简称样品 4、 样品 5和样品 6) 在经过与实施例一中同样的处理 方法和测序过程后获得上机数据, 结果与髙分辨率核型分析结果相比较。
本实施例的数据分析过程中,与实施例一相同, 已知正常样品选取炎黄基因组 DNA 样品作为阴性样品对照, 取与待测样品相约的数据量经标准化后统计其有效读段数目 , aN = 68750810。 统计上述样品 4、 样品 5和样品 6的有效读段数目 分别为 44797212, 44086450和 45374254。 其余数据分析的流程和相关参数设置均与实施例一中相同, 最后 分析得到微缺失 /微重复结果后绘制染色体数字核型图并进行基因注释。
阴性对照结果拷贝数均为正常, 3例样品的 CNV结果以及检测结果验证和主要基因分 别如下表 4和 5所示。
表 4
区 域 与 现 有 的 arrayCGH ( The Fetal DNA Chip, http://www.fetalmedicine.hk/en/Fetal DNA Chip.asp )结果一致,具体数字核型图见图 4A-C。
从上述结果可以看出: 3 例绒毛膜组织经高通量测序检测到得染色体微缺失和微重复 区域与现有的高分辨率核型分析结果一致。
尽管本发明的具体实施方式已经得到详细的描述, 本领域技术人员将会理解, 根据已 经公开的所有教导, 可以对那些细节进行各种修改和替换, 这些改变均在本发明的保护范 围之内。 本发明的全部范围由所附权利要求及其任何等同物给出。

Claims (11)

  1. 权 利 要 求 书
    1. 一种检测染色体拷贝数变异的方法, 其包括以下步骤:
    a) 将获自待测受试者和正常受试者基因组 DNA分子随机打断, 得到 DNA片段, 并 对所述 DNA片段进行测序, 获得测序的读段;
    b)将步骤 a中测定的 DNA序列与所述受试者的物种的基因组参考序列进行比对, 将 所测 DNA序列定位于参考序列上, 只选用在参考序列上有唯一位置的读段进行分析; c)寻找参考序列上符合以下条件的断点:待测受试者样品的比对结果与正常受试者样 品的比对结果相比, 在两侧拷贝数变异比率有差异的位点, 步骤如下:
    i) 对于参考序列上每一个位点 b, 强制使其左右两侧的局部窗口包含 w条正常读段, 即满足 N(x»N(b, ) = w,其中 N(xt,; 为正常样品落在窗口 , )中的比对条数, w 为大于 1的整数;
    ii) 在这些位置中, 筛选符合 ί> = η^ηρ(|£>,(;^,χΛ)|)的位点, 剔出符合 Α(^, ) = 0, b-w<i<b + w 的 位 点 , 其 中 D ( , = log -log (i?(x,^)) ,
    R(x,,xR)= Τ Χ Χ /ατ , 其中正常样品读段和待测样品读段唯一比对到参考序列上的条 ' N{x,,xR)laN
    数分别为和 和 α7.、 落在窗口(¾^«)中的唯一比对到参考序列的读段条数分别为 N(;c,,,xK)和 r(x,,xft), 通过对检验统计量 进行正态分布的双侧显著性检验, 得到 每个位点的; 7(|D ( , ¾)|); iii) 设置; >, 反复进行以上步骤直至得到所有符合 ρ(|Ζ?(^, )|)>ρ ^的位点, 得到 候选位点集合为 ^, 5C d) 对步骤 c中所得的候选位点集合 , ^- ,… ^中的每一个位点^ 其两侧 存在窗口: -1)和 去除该两窗口之间拷贝数变异比率差异较小的位点, 即 删除/ 7(|/ ( _,, +1)|)最大的位点 fc, 并更新合并区间 (1^, +1)的 值, 通过设置^^, 重复该步骤,直到所有位点满足 ^/^(^^ ^〈/^^, 则获得发生染色体拷贝数变异的 位点。
    2. 根据权利要求 1的方法, 所述 w为 100- 1000之间的整数。
    3. 根据权利要求 1或 2的方法, 其中 为侯选位点为 10、 100、 1000或 10000时最 或者通过以下方式选择; 将正常样品作为待测样品, 执行前述歩 骤 a) 至 c) 的 ii), 并将所有 /7(|Ζ^χΛ,¾ 通过错误发现率控制 (FDR) 进行过滤, 并将 过滤后的位点中最后一个突破 FDR阈值的 /?(|/)(^, )|)作为 pbkp '、进行错误发现率控制的 歩骤为:
    将待检验的数据集按显著性 ( 值) 从小到大排序, 得到他们的秩 (r); 从上到下做检验, 直到最后一个满足 的位点 k停止, 其中 A为第 k个位置 的 P值, 为第 k个位置的秩, N为总位点个数, α为显著性水平, 如 0.01 ;
    保留 k及其之前的所有位点, 去除之后的假阳性位点。
    4. 根据权利要求 1 - 3任一项的方法, 其中/ 为使剩余位点数目为原侯选位点数目 的 1/2、 1/10、 1/100或 1/1000时的最大;? (|£>^, )|); 或者通过以下方式选择/ 7m 将 ιΗ常样品作为待测样品, 执行上述歩骤 a) 至 d), 使得合并后候选位点数量变为最初位点 数量的 1/2、 1/10、 1/100或 1/1000, 其中最大的 ?(|£>(^, )|)被选为 ge
    5. 根据权利要求 1 - 4任一项的方法, 在得到发生染色体拷贝数变异的位点后, 进一 歩包括,
    e)基于步骤 d) 中得到的发生染色体拷贝数变异的位点进行分析, 将待测样品对于正 常样品的 CNV 比率小于等于微缺失检测阈值的位点选择为微缺失位点, 将大于等于微重 复检测阈值的位点选择为微重复位点;
    f)将所述微缺失位点和 /或微重复位点对照已有的 CNV和疾病数据库进行基因注释和 功能分析, 注出染色体微缺失和 /或微重复综合征疾病的类型。
    6.根据权利要求 5的方法,所述微缺失检测阈值为 0.75,所述微重复检测阈值为 1.25。
    7. 根据前述权利要求任一项的方法, 所述的样品来源于细胞、 血液或组织。
    8. 根据前述权利要求任一项的方法, 所述将样品基因组 DNA分子随机打断的步骤是 采用化学或物理断裂方式进行的, 所述化学或物理断裂方式包括酶切打断, 雾化、 超声或 HydroShear法打断。
    9. 根据前述权利要求任一项的方法, 所述 DNA片段测序步骤利用高通量测序技术进 行, 所述高通量测序技术包括 Illumina/Solexa、 ABI/SOLiD或 Roche/454测序。
    10. 根据前述权利要求任一项的方法, 所述 DNA片段测序步骤釆取的测序深度范围 是卜 30 X。
    11 . 根据权利要求 5或 6的方法, 还包括绘制染色体数字核型图的歩骤, 所述染色体 数字核型图根据拷贝数变异比率值绘制。
CN201180075188.0A 2011-10-28 2011-10-28 一种检测染色体微缺失和微重复的方法 Pending CN104136628A (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/CN2011/001805 WO2013059967A1 (zh) 2011-10-28 2011-10-28 一种检测染色体微缺失和微重复的方法

Publications (1)

Publication Number Publication Date
CN104136628A true CN104136628A (zh) 2014-11-05

Family

ID=48167029

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201180075188.0A Pending CN104136628A (zh) 2011-10-28 2011-10-28 一种检测染色体微缺失和微重复的方法

Country Status (4)

Country Link
US (1) US20140274745A1 (zh)
CN (1) CN104136628A (zh)
TW (1) TW201317362A (zh)
WO (1) WO2013059967A1 (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107408163A (zh) * 2015-06-24 2017-11-28 社会福祉法人三星生命公益财团 用于分析基因的方法及装置
CN110265087A (zh) * 2018-10-05 2019-09-20 中国医药大学附设医院 染色体异常检测模型、其检测系统及染色体异常检测方法
CN110268044A (zh) * 2017-03-07 2019-09-20 深圳华大生命科学研究院 一种染色体变异的检测方法及装置
CN111028888A (zh) * 2018-10-09 2020-04-17 北京贝瑞和康生物技术有限公司 一种全基因组拷贝数变异的检测方法及其应用
CN112863602A (zh) * 2021-02-22 2021-05-28 苏州贝康医疗器械有限公司 染色体异常的检测方法、装置、计算机设备和存储介质
CN114220481A (zh) * 2021-11-25 2022-03-22 深圳思勤医疗科技有限公司 基于全基因组测序完成待测样本的核型分析的方法、系统和计算机可读介质

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106795551B (zh) * 2014-09-26 2020-11-20 深圳华大基因股份有限公司 单细胞染色体的cnv分析方法和检测装置
CN107111692B (zh) 2014-10-10 2021-10-29 生命科技股份有限公司 用于计算经校正扩增子覆盖度的方法、系统及计算机可读媒体
CN104745718B (zh) * 2015-04-23 2018-02-16 北京中仪康卫医疗器械有限公司 一种检测人类胚胎染色体微缺失和微重复的方法
US10395759B2 (en) 2015-05-18 2019-08-27 Regeneron Pharmaceuticals, Inc. Methods and systems for copy number variant detection
US20180330050A1 (en) * 2015-11-16 2018-11-15 Mayo Foundation For Medical Education And Research Detecting copy number variations
TWI603082B (zh) * 2016-09-30 2017-10-21 有勁生物科技股份有限公司 非侵入式胎兒性徵異常檢測系統及其方法與非侵入式胎兒性徵檢測系統及其方法
WO2018144449A1 (en) * 2017-01-31 2018-08-09 Counsyl, Inc. Systems and methods for identifying and quantifying gene copy number variations
CN106778069B (zh) * 2017-02-17 2020-02-14 广州精科医学检验所有限公司 确定胎儿染色体中微缺失微重复的方法及设备
CN108363903B (zh) * 2018-01-23 2022-03-04 和卓生物科技(上海)有限公司 一种适用于单细胞的染色体非整倍性检测系统及应用
CN111326212B (zh) * 2020-02-18 2023-06-23 福建和瑞基因科技有限公司 一种结构变异的检测方法
CN113699225B (zh) * 2021-08-06 2023-11-21 菁良科技(深圳)有限公司 无创产前筛查微缺失或微重复非配对参考品及其制备和应用
CN114592056A (zh) * 2022-04-15 2022-06-07 常州市妇幼保健院 22q11微缺失和/或微重复检测引物组、引物探针组合物、试剂盒及其应用
CN114864000B (zh) * 2022-07-05 2022-09-09 北京大学第三医院(北京大学第三临床医学院) 一种动态鉴定人类单细胞染色体拷贝数的方法
CN116246704B (zh) * 2023-05-10 2023-08-15 广州精科生物技术有限公司 用于胎儿无创产前检测的系统
CN117012274B (zh) * 2023-10-07 2024-01-16 北京智因东方转化医学研究中心有限公司 基于高通量测序识别基因缺失的装置

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101555528A (zh) * 2008-09-28 2009-10-14 南京市妇幼保健院 一种染色体22q11.2区微缺失、微重复的测定方法
CN101575647A (zh) * 2009-06-19 2009-11-11 成都军区昆明总医院 一种y染色体微缺失的基因检测方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101555528A (zh) * 2008-09-28 2009-10-14 南京市妇幼保健院 一种染色体22q11.2区微缺失、微重复的测定方法
CN101575647A (zh) * 2009-06-19 2009-11-11 成都军区昆明总医院 一种y染色体微缺失的基因检测方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
DEREK Y. CHIANG等: "High-resolution mapping of copy-number alterations with massively parallel sequencing", 《NAT METHODS.》 *

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107408163A (zh) * 2015-06-24 2017-11-28 社会福祉法人三星生命公益财团 用于分析基因的方法及装置
CN107408163B (zh) * 2015-06-24 2021-03-05 吉尼努斯公司 用于分析基因的方法及装置
CN110268044A (zh) * 2017-03-07 2019-09-20 深圳华大生命科学研究院 一种染色体变异的检测方法及装置
CN110268044B (zh) * 2017-03-07 2022-08-02 深圳华大生命科学研究院 一种染色体变异的检测方法及装置
CN110265087A (zh) * 2018-10-05 2019-09-20 中国医药大学附设医院 染色体异常检测模型、其检测系统及染色体异常检测方法
CN111028888A (zh) * 2018-10-09 2020-04-17 北京贝瑞和康生物技术有限公司 一种全基因组拷贝数变异的检测方法及其应用
CN112863602A (zh) * 2021-02-22 2021-05-28 苏州贝康医疗器械有限公司 染色体异常的检测方法、装置、计算机设备和存储介质
CN112863602B (zh) * 2021-02-22 2023-07-21 苏州贝康医疗器械有限公司 染色体异常的检测方法、装置、计算机设备和存储介质
CN114220481A (zh) * 2021-11-25 2022-03-22 深圳思勤医疗科技有限公司 基于全基因组测序完成待测样本的核型分析的方法、系统和计算机可读介质
CN114220481B (zh) * 2021-11-25 2023-09-08 深圳思勤医疗科技有限公司 基于全基因组测序完成待测样本的核型分析的方法、系统和计算机可读介质

Also Published As

Publication number Publication date
WO2013059967A1 (zh) 2013-05-02
US20140274745A1 (en) 2014-09-18
TW201317362A (zh) 2013-05-01

Similar Documents

Publication Publication Date Title
CN104136628A (zh) 一种检测染色体微缺失和微重复的方法
JP6634105B2 (ja) 非侵襲性の出生前診断のために有用な、母体サンプル由来の胎児核酸のメチル化に基づく濃縮のためのプロセスおよび組成物
JP7021148B2 (ja) 性染色体におけるコピー数変異を判定するための方法
US20220010371A1 (en) Rapid aneuploidy detection
TWI708848B (zh) 使用不含細胞之dna片段大小以測定複製數變異之方法
AU2021200915B2 (en) Genetic analysis method
JP6513622B2 (ja) 非侵襲的出生前診断に有用な母体試料由来の胎児核酸のメチル化に基づく富化のためのプロセスおよび組成物
TWI640636B (zh) A method for simultaneously performing gene locus, chromosome and linkage analysis
JP6328934B2 (ja) 非侵襲性出生前親子鑑定法
EP3608420B1 (en) Nucleic acids and methods for detecting chromosomal abnormalities
EP2772549B1 (en) Method for detecting genetic variation
JP2015534807A (ja) 胎児の染色体異数性を検出するための非侵襲的方法
KR20170125044A (ko) 암 스크리닝 및 태아 분석을 위한 돌연변이 검출법
RU2597981C2 (ru) Способ и система для определения нуклеотидной последовательности в заданной области генома плода
WO2015138774A1 (en) Methods and processes for non-invasive assessment of genetic variations
AU2016269332B2 (en) Multiplexed parallel analysis of targeted genomic regions for non-invasive prenatal testing
WO2015042980A1 (zh) 确定染色体预定区域中snp信息的方法、系统和计算机可读介质
JP2014530629A (ja) 染色体の微細欠失及び微細重複を検出する方法
CA3068110A1 (en) Target-enriched multiplexed parallel analysis for assessment of fetal dna samples
Xing et al. Long‐read Oxford nanopore sequencing reveals a de novo case of complex chromosomal rearrangement involving chromosomes 2, 7, and 13
WO2018219581A1 (en) Method and system for nucleic acid sequencing
CN117858954A (zh) 细胞异质性调整的克隆甲基化(chalm):甲基化定量方法
WO2017124214A1 (zh) 一种检测染色体罗氏易位的方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20141105

RJ01 Rejection of invention patent application after publication