WO2015043278A1 - 同时进行单体型分析和染色体非整倍性检测的方法和系统 - Google Patents

同时进行单体型分析和染色体非整倍性检测的方法和系统 Download PDF

Info

Publication number
WO2015043278A1
WO2015043278A1 PCT/CN2014/081672 CN2014081672W WO2015043278A1 WO 2015043278 A1 WO2015043278 A1 WO 2015043278A1 CN 2014081672 W CN2014081672 W CN 2014081672W WO 2015043278 A1 WO2015043278 A1 WO 2015043278A1
Authority
WO
WIPO (PCT)
Prior art keywords
sample
tested
sequencing
target gene
information
Prior art date
Application number
PCT/CN2014/081672
Other languages
English (en)
French (fr)
Inventor
李剑
张现东
刘赛军
李尉
张彩芬
甄贺富
Original Assignee
深圳华大基因科技有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 深圳华大基因科技有限公司 filed Critical 深圳华大基因科技有限公司
Priority to HK16109816.5A priority Critical patent/HK1221745B/zh
Priority to CN201480050879.9A priority patent/CN105555970B/zh
Publication of WO2015043278A1 publication Critical patent/WO2015043278A1/zh

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6827Hybridisation assays for detection of mutation or polymorphism

Definitions

  • the storage medium may include: a read only memory, a random access memory, a magnetic disk or an optical disk, and the like.
  • the gene corresponding to the target single gene genetic disease is determined, and then the position of the target gene is determined by using Hgl9 as a reference sequence to determine the capture area.

Landscapes

  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Microbiology (AREA)
  • Immunology (AREA)
  • Physics & Mathematics (AREA)
  • Molecular Biology (AREA)
  • Biotechnology (AREA)
  • Biophysics (AREA)
  • Analytical Chemistry (AREA)
  • Biochemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明提供了一种对样本同时进行目标基因单体型分析和染色体非整倍性检测的方法及其系统,其中,所述方法包括步骤:基于样本基因组的至少一部分,构建目标区域测序文库,在构建区域测序文库的过程中,包括采用探针集进行筛选,探针集能够识别目标基因上下游的SNP和均匀分布于目标染色体的SNP;对目标区域测序文库进行测序,获得测序结果;将测序结果与参考序列比对,获得比对结果;基于比对结果,确定样本的SNP信息;基于样本的SNP信息,同时确定样本的目标基因单体型和染色体非整倍性信息。

Description

同时进行单体型分析和染色体非整倍性检测的方法和系统 优先权信息
本申请请求 2013年 9月 30 日提交的国际专利申请 PCT/CN2013/084783的优先权 和权益, 其完整内容通过参照在此并入。 技术领域
本发明涉及生物医学领域, 具体地, 涉及同时进行单体型分析和染色体非整倍性检 测的方法和系统。 背景技术
世界卫生组织 2012全球出生缺陷防治报告显示,全球出生缺陷总发生率为 3%,每 年有 320万出生缺陷患儿出生, 其中 27万新生儿因出生缺陷而死亡。 研究表明, 绝大 部分出生缺陷与遗传因素有关, 染色体异常与单基因遗传病是两个重要原因。 其中, 单 基因遗传病种类众多, 发病率各有不同, 且这些疾病绝大多数无法治愈, 给整个社会和 家庭带来沉重的经济和心理负担。因此防止单基因遗传病患儿的发生和减少遗传病患儿 的出生是遗传性出生缺陷防控的重点。 胚胎植入前诊断 ( Preimplantation Genetic Diagnosis, PGD) 技术可从根源上阻断遗传病的发生和传递, 将出生缺陷的预防提前到 胚胎阶段。 然而, 单基因遗传病的植入前诊断并未广泛应用, 至今为止世界上才几千例 报道。究其原因,主要是由于标本量少(仅 1〜2个细胞),容易产生等位基因脱扣(ADO ) 和污染, 检测较为困难、 准确性也不好保证, 无法完全满足单基因遗传病植入前诊断的 临床需求。 目前植入前非整倍体检测主要有三种技术, 荧光原位杂交 (FISH) 技术, Array CGH 及 SNP-array 技术, 而植入前单基因病检测技术主要为多重荧光 PCR (MF-PCR) 技术。 当前植入前非整倍体检测与单体型分析、 单基因病检测一般都是分 开进行, 还没有一种方法能将两种不同类型的植入前遗传病同时检测出来, 不利于优生 优育的发展推进。
近年来, 随着新一代测序技术的快速发展, 高通量测序被越来越广泛地应用于医学 领域, 高通量测试能够实现染色体结构变异 (缺失、 重复、 非整倍体等) 与单碱基突变 ( SNP、 点突变、 indel 等) 的检测, 并且应用于多种临床疾病检测或研究, 例如基于 高通量测序的无创产前唐氏综合症筛查、 基于高通量测序的 HPV筛查以及基于高通量 测序的各种复杂遗传病的基因诊断等。 发明内容
本发明旨在提出一种只需待测样本包含少量核酸、经一次试验和一次试验的数据量 就能同时进行目标基因单体型分析和染色体非整倍性检测的方法,也能作为同时检测单 基因病和染色体非整倍性的基础。 本发明一方面提供了一种能同时对待测样本进行目标基因单体型分析和染色体非 整倍性检测的方法, 包括以下步骤:
1 ) 基于待测样本基因组的至少一部分, 构建目标区域测序文库, 其中, 在构建目 标区域测序文库的过程中, 包括采用探针集进行筛选, 探针集由多个预定探针构成, 预 定探针能够识别所说的目标基因上下游的 SNP和均匀分布于目标染色体的 SNP;
2) 对目标区域测序文库进行测序, 以便获得测序结果;
3 ) 将测序结果与参考序列比对, 以便获得比对结果;
4) 基于比对结果, 确定待测样本的 SNP信息;
5 )基于待测样本的 SNP信息, 同时确定待测样本的目标基因单体型和染色体非整 倍性信息。
本发明的这个方法是通过设计探针将一系列均匀分布于目标染色体上的 SNP位点 和与目标基因相关联的 SNP位点信息集中到芯片上, 利用这个探针芯片将相应区域捕 获下来, 接着, 将获得的区域序列进行高通量测序, 根据测序结果进行目标基因单体型 和目标染色体非整倍性分析。 该方法只需一次实验、 少量样本 DNA和较少的数据量就 能完成多项变异的准确检测, 试剂耗材人力等成本显著降低, 具有通量高、 检测周期短 的特点, 可以一次完成多种遗传变异包括所有染色体非整倍性检测, 并且能够用于多个 不同遗传背景样品的同时检测。 该方法可以用于或者辅助用于胚胎植入前遗传学诊断, 尤其是作为实现 PGD非整倍体及单基因病同时检测的基础, 解决进行这两种检测样本 量不足的问题。值得一提的是, 在这个方法的基础上, 进一步设计使探针集能够捕获整 个目标基因, 基于目标基因里的一些已公布的 SNP与疾病的关系, 可以进一步实现直 接和 /或间接检测单基因病, 以及与染色体非整倍性的同时检测。
本发明的另一方面提供了一种计算机可读介质, 用于存储供计算机执行的程序, 本 领域普通技术人员可以理解, 在执行该程序时, 通过指令相关硬件可完成上述同时进行 样本进行单体型分析和染色体非整倍性检测方法的全部或部分步骤。所称存储介质可以 包括: 只读存储器、 随机存储器、 磁盘或光盘等。
本发明的又一方面提供了一种同时对待测样本进行目标基因单体型分析和染色体 非整倍性检测的系统, 该系统包括: 目标区域测序文库构建装置, 目标区域测序文库构 建装置适于对目标区域进行文库构建, 其中, 在构建区域测序文库的过程中, 包括采用 探针集进行筛选, 所说的探针集由多个预订探针构成, 预订探针能够识别目标基因的上 下游 SNP和均匀分布于目标染色体的 SNP;
测序装置, 测序装置与目标区域测序文库构建装置相连, 适于对目标区域测序文库 进行测序, 获得测序结果;
分析装置, 分析装置与测序装置相连, 用于分析测序结果, 包括数据输入单元、 数 据输出单元、 存储单元和处理器, 其中,
数据输入单元用于输入测序结果,
数据输出单元用于输出结果数据, 存储单元用于存储数据, 包括可执行程序,
处理器, 与所述数据输入单元、 数据输出单元和存储单元连接, 用于执行所说的可 执行程序,可执行程序可以完成包括上述本发明一方面提供的同时对待测样本进行目标 基因单体型分析和染色体非整倍性检测的方法的一部分或全部步骤。
本发明的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得 明显, 或通过本发明的实践了解到。 附图说明
本发明的上述和 /或附加的方面和优点从结合下面附图对实施例的描述中将变得明 显和容易理解, 其中:
图 1显示了本发明的一个实施例的确定区分型 SNPs方法的示意图;
图 2显示了本发明一个实施例构建的文库的 Agilent 2100的检测结果;
图 3显示了本发明一个实施例的单体型构建模拟图;
图 4显示了本发明一个实施例的胚胎单体型与胚胎遗传状况分析的流程示意图; 图 5显示了本发明的一个实施例的胚胎染色体非整倍性检测结果图。 发明详细描述
下面详细描述本发明的实施例。 下面通过参考附图描述的实施例是示例性的, 仅用于 解释本发明, 而不能理解为对本发明的限制。
需要说明的是, 术语 "第一"、 "第二"仅用于描述目的, 而不能理解为指示或暗示相 对重要性或者隐含指明所指示的技术特征的数量。 由此, 限定有 "第一"、 "第二" 的特征 可以明示或者隐含地包括一个或者多个该特征。 进一步地, 在本发明的描述中, 除非另有 说明, "多个" 的含义是两个或两个以上。
根据本发明的一个实施方式, 提供一种同时对待测样本进行目标基因单体型分析和染 色体非整倍性检测的方法, 包括以下步骤:
步骤 1 : 构建目标区域测序文库
基于待测样本基因组的至少一部分, 构建目标区域测序文库, 其中, 在构建区域测序 文库的过程中, 包括采用探针集进行筛选, 所说的探针集由多个预定探针构成, 预定探针 能够识别目标基因上下游的 S P和均匀分布于目标染色体的 S P;
目标区域测序文库, 可通过探针集捕获待测样本的基因组文库获得, 探针集能够捕获 目标基因的上下游与目标基因紧密连锁的 S P和均匀分布于目标染色体的 S P。
在本发明的具体一个实施方式中, 待测样本源自胚胎, 如取至胚胎卵裂球 4~8细胞时 期的单细胞。
在本发明的一个具体实施方式中, 探针集是这样确定的: 基于参考序列, 选择目标基 因上下游 S P以及均匀分布于染色体的 S P, 获得目标 S P集; 基于目标 S P集中的每 个 S P在参考序列上的位置, 在参考序列上截取一段包含 S P集中的至少一个 S P的、 不长于一个目标区域测序文库大小的序列作为一条预定探针, 以此获得探针集。 待测样本 源自人时, 参考序列是人已知序列, 比如人参考基因组。 在本发明的一个实施例中, 一条 预定探针中包含 1个 S P并且这个 S P位于这条预定探针的中点,这样有利于高效的捕获 这个 S P, 这里的 "中点 " ", 可以是相对的中点即一条序列的中段位置也可以是严格意义 上的中心点, 比如一条序列, 其上、 下游 1/3 分别定义为 "前段"和 "后段", 中间的 1/3 即为 "中段", 或者比如一条序列包含 2n+l个核苷酸, 严格意义上的中点即为第 n+1核苷 酸的位置, 而当一条序列含有 2η个核苷酸, 序列严格意义的中点为第 η或第 n+1个核苷酸 的位置。 当前高通量测序及探针合成技术的发展, 测序文库大小一般为 100-1000bp, 探针 长度多数为的 20-200nt,在本发明中,对目标区域测序文库的大小及探针的长度没有另外限 制。
在本发明的一个具体实施方式中, 目标基因上下游的 S P, 是指与目标基因紧密连锁 区域中的 S P。 另外, S P间距离越小, 重组率越小, 当距离小于 1M时, 重组率低于 1% (人的重组率是 1%每 1M的区域)。 探针集捕获包含的目标基因上下游的 S P的范围可以 基于人类基因组的一般重组率大概估计选择确定, 一般地, 选择的目标基因上下游的范围 小, 捕获得的 S P准确, 但是数量少, 选择的范围大, 捕获得的 S P数量多, 但是范围大 发生的重组概率也会越高, 且选择的上下游范围大 S P数量多, 设计合成花费相对高。 在 本发明的一个实施例中为降低基因重组的影响, 选择的 S P位点集中在目标基因上下游各 1M范围内, 可以把目标基因与上下游 S P区域的重组的概率降低到万分之一, 密度高、 连锁紧密, 既可以大大提高目标基因上下游 S P信息检测的灵敏度和准确性, 又可降低分 析目标基因单体型分析检测成本。
在本发明的一个具体实施方式中, 探针集能够捕获的均匀分布于染色体的 S P, 所说 的均匀分布不需要 S P之间的间隔是一个固定数值, 只要在利用所说的探针集捕获待测样 本基因组时, 能够使捕获得的 S P的间距总体上呈现相对均匀的分布, 能使捕获确定的区 域组合代表反映整条目标染色体或者整个基因组就行。 在本发明的一个实施例中, 均匀分 布于某条染色体上的 S P 中的任意两个相邻的 S P应满足在参考基因组上的距离不大于 3000kbp、 均匀分布于染色体的 S P的个数至少占所述染色体 S P总数的 1/3000。 S P越 多, 距离越近, 检测精度越高, 即越能检测到更小的染色体局部变异 (即检测到更小的拷 贝数变异), 但是 S P过多就需要更多的探针捕获, 需要测更多的数据。 比如当前发现 10M 以上的 CNV才可能与疾病相关, 那么若将检测精度定在 10M, S Ps间的距离就可以大概 确定, 大概是 10K间距, 目标染色体上的 S P数也确定了。 而为了检测染色体非整倍体, S P的数目可以很少, 选中的 SNP的间距可至多为 3000K。 在本发明的一个实施例中, 为 了检测染色体非整倍性, 均匀分布于染色体上的 S P之间的距离约为 500Κ。
在本发明的一个具体实施方式中, 目标基因上下游的和均匀分布于染色体的 S P在群 体中的频率大于等于 0.3, 群体数据可以是已知的有公开数据的群体, 比如千人基因组数据 (ftp://ftp.ncbi.nih.gov/1000genomes/ftp/release), 也可以是预先构建的、 包含多个来源于同 一物种的多个个体的基因组数据。 基于高频 S P位点在染色体 /基因组上的分布, 更有利 于作后续关联分析。
在本发明的一个具体实施方式中, 探针集进一步能够捕获整个目标基因。 基于目标基 因区中的已公开的一些 S P与疾病的关系, 可以进一步实现直接和 /或间接检测单基因病, 以及与染色体非整倍性的同时检测。
在本发明的一个具体实施方式中, 将选择的多个 S P位点集中于一张芯片上, 从能够 基于获得的 S P信息同时进行单体型和染色体非整倍性检测,无需因人而异设计实验方案, 既缩短了检测周期, 又降低了检测成本。 采用包含多个目标检测位点的芯片可以同时检测 多个样本, 检测通量极大提高。 这为未来的规模化分析检测提供巨大技术支持, 比如未来 的 PGD规模化检测需求。
步骤 2: 对目标区域测序文库进行测序, 获得测序结果
依据现有高通量平台的指导手册, 比如利用 Illumina Hiseq2000/2500、 Roche 454、 Life technologies Ion Torrent, 单分子或纳米孔测序平台等将构建好的目标区域测序文库上机测 序, 获得读段 (reads) 以及一些仪器给出的测序质量值等, 获得测序结果。 在本发明的一 个具体实施方式中, 质量值低的 reads不用于后续分析检测。
步骤 3 : 将测序结果与参考序列比对, 获得比对结果
读段在参考基因组上的位置可以通过序列比对确定, 比对可使用各种比对软件, 例如 SOAP ( Short Oligonucleotide Analysis Package), bwa (Burrows-Wheeler Aligner), samtools, GATK (Genome Analysis Toolkit)等。 有的读段能够比对到基因组的多个位置, 有的读段比 对上基因组的唯一一个位置, 有的读段比对不上基因组。 在本发明的一个实施例中, 只取 比对结果中比对到唯一位置的读段进行后续分析。
步骤 4: 基于比对结果, 确定待测样本的 S P信息
利用 S P分析软件从上述比对结果中识别出 S P位点。 根据本发明的一个实施例, 在 获得唯一比对序列后,进一步包括从上述唯一比对读段中去除建库中 PCR造成的重复 reads。 可以采用的 SNP分析软件的种类不受特别限制。 根据本发明的一个实施例中, 选用的 S P 分析软件为 SAMtools和 GATK的至少之一。
步骤 5: 基于待测样本的 S P信息, 同时确定待测样本的目标基因单体型和染色体非 整倍性信息
同时确定待测样本的目标基因单体型和染色体非整倍性信息是这样进行的: 预先或同 时利用一样的探针集构建与待测样本遗传相关的样本的目标区域测序文库, 对遗传相关样 本的目标区域测序文库进行测序, 获得遗传相关样本的测序结果, 将遗传相关样本的测序 结果与参考序列进行比对, 获得比对结果,基于比对结果, 确定遗传相关样本的 S P信息, 与待测样本遗传相关的样本包括待测样本的父本样本、 待测样本的母本样本和与待测样本 遗传自同样父母的第二样本; 基于遗传相关样本的 S P信息和待测样本 S P信息, 确定待 测样本的父本和母本样本的单体型, 推断出待测样本的单体型; 以及基于比较任一遗传相 关样本的 S P信息和待测样本的 S P信息的差异, 检测待测样本染色体非整倍性。
在本发明的一个具体实施方式中, 从待测样本或其遗传相关样本的比对结果中识别出 SNP之后进一步包括, 对识别出的 SNP进行过滤, 过滤的条件为去除满足下列条件之一的 SNP: S P测序深度低于 10X, 优选低于 20X; 和 /或杂合 S P中两种碱基测序深度差异 高于 20%, 优选高于 10%, 更优选高于 5%。 由此, 经过过滤的 S P信息准确可信。 需要 说明的是, 理论上测序深度越高, 杂合 S P测序深度比值越接近 1: 1, 且 S P过滤条件中 的测序深度、 测序深度差异度的具体数值的设定与实施时的样本、 测序深度、 测序质量相 关, 可根据实际需要调整。 在本发明的一个实施例中, 待测样本来源于胚胎, 胚胎遗传相 关个体的测序深度为 50X、 胚胎样本的测序深度为 100X且测序质量较好, 为使留下的都 是测序准确符合实际的 S P, 严格过滤, 过滤掉低于 10X的 S P, 也过滤掉测序深度差异 高于 10%的杂合 S P,去除了大量的杂合 S P;可以理解的,采用更高深度测序(> 100X ), 若也要严格过滤保证剩余 S P的真实准确, 可过滤掉如低于 20 X的 S P, 过滤掉如差异高 于 5%的杂合 S P, 相反的, 对于相对低深度测序的数据, 可设置过滤掉高于 20%的杂合 在本发明的一个具体实施方式中,待测样本来源于胚胎,基于胚胎遗传相关样本的 S P 信息和胚胎 S P信息, 确定胚胎的父本和母本单体型包括: 从父本和母本的 S P信息中筛 选出区分型 S Ps, 结合区分型 S Ps和第二样本 SNP信息确定父本和母本单体型, 第二样 本来源于先证者。 需要说明的是, 在这里所使用的术语 "区分型 S P"指的是可以有效区 分父母单体型的碱基, 即在某一位置父母双方 4个碱基中其中一碱基 (常染色体) 与该位 置的其他碱基都不相同, 该碱基可以确定父母双方 4 条单体型中的唯一一条, 如某位置父 母基因型分别为 AA、 AG, 则 G碱基为区分型 S P, 因为在该位置 G可以确定唯一的一个 单体型, 而 A在其他 3个单体型中都存在, 无法确定唯一单体型。 其中图 1显示了根据孟 德尔遗传原理, 确定父母区分型 SNPs位点方法的示意图。 这里术语 "先证者 "指确诊为带 有某致病突变, 并表现出该疾病症状的患者, 且其是与前述胚胎具有遗传关系的生物体, 既可以是胚胎或者胎儿, 也可以是出生后的个体。
基于所说的区分型 S P和先证者的 S P信息, 确定父本单体型和母本单体型。 也即: 基于区分型 S P和先证者 S P, 分别针对父母基因组中与先证者的两条同源染色体, 分别 构建第一父本单体型、 第二父本单体型、 第一母本单体型和第二母本单体型, 以便用于后 续胚胎单体型的确定。 其中, 所说的父本单体型包括第一父本单体型和第二父本单体型, 母本单体型包括第一母本单体型和第二母本单体型, 第一父本单体型、 第二父本单体型、 第一母本单体型和第二母本单体型是由区分型 S P构成的。 根据本发明的实施例, 可以根 据孟德尔遗传原理与连锁交换定律, 结合父母区分型 S P和先证者 SNPs信息构建出父母 S P-单体型, 构建原理如图 3所示。 所述 S P-单体型包含区分型 S P, 每条单体型都含有 众多区分型 S P, 单体型中的区分型 SNP能够与其他单体型相区分。 如某一位置父母基因 型分别为 AA、 AG, G为区分型 S P, A为非区分型 S P, A、 G分别为单体型中该处的碱 基。 由于先证者的 2 条单体型, 分别遗传自父母, 可根据疾病情况确定致病突变所在的单 体型。 如显性遗传病, 父亲患病, 母亲正常, 则先证者所遗传自父亲的单体型为致病突变 所在的单体型; 如隐性遗传病, 父母都是携带者, 则先证者 (患病) 的两个单体型都为致 病突变所在的单体型。 由此, 基于区分型 S P和先证者的 S P信息, 能够有效确定父本单 体型和母本单体型, 进而基于胚胎的 S P信息、 父亲 S P单体型和母亲 S P单体型, 能 够有效确定胚胎单体型。
然后, 推断出待测样本的单体型包括, 利用待测样本的 S P信息和待测样本父本母本 的单体型, 分别对待测样本 S P中包含的父本和母本的区分型 S P的数目进行统计, 依据 统计数目不小于阈值来确定待测样本 S P的单体型组合, 从而获得待测标样本单体型。 在 本发明的一个具体实施方式中, 所说的阈值为 10,。 在本发明的一个实施例中, 基于胚胎 S P 信息、 父亲单体型和母亲单体型, 确定父亲单体型和母亲单体型的组合方式, 以便获 得胚胎的 S P单体型。即基于胚胎的 S P信息与前述的第一父本单体型、第二父本单体型、 第一母本单体型和第二母本单体型, 确定胚胎某染色体或者染色体某区域中的 S P类型, 进而确定所述胚胎单体型。 胚胎单体型是通过下列步骤获得的: 确定胚胎的 S P显著支持 的父本单体型作为胚胎的父本来源单体型; 以及确定胚胎的 S P显著支持的母本单体型作 为胚胎的母本来源单体型。其中, 根据本发明的一个实施例, 区分型 S P数不低于 10个是 显著支持的指示。 具体地, 由于胚胎的 2个单体型分别遗传自父母各一条, 可以根据胚胎 S Ps信息结合父母单体型进行分析, 判断胚胎 S Ps是哪两条单体型的组合, 分析原理如 图 3所示。 分析中可采用区分型 S P数目统计计算, 根据数值的大小确定胚胎单体型, 具 体流程如图 4所示。 根据本发明的一个实施例, 一单体型区分型 S P数大于 10, 则可确定 这是胚胎遗传获得的一条单体型; 如一单体型区分型 S P数小于 4, 则可判断该单体型不 是遗传给胚胎的那条, 为错误 S P导致。 根据本发明一个具体实施例, 为确保准确, 将一 正确单体型的区分型 S P支持数定于为不低于 10个, 错误单体型的区分型 S P支持数不 高于 3个, 这是因为前面设定的 S P过滤条件较为严格, 即单体型构建中所用 S P正确率 较高, 并且候选 S P数量大, 实际测试数据表明正确单体型的 S P支持数远高于 10个, 错误单体型 S P支持数一般为 0。 根据本发明的一个实施例, 经验证, 对于一常染色体疾 病, 通过本发明的方法分析, 每个胚胎只能得到 2个满足要求的单体型; 对于一 X染色体 疾病, 通过本发明的方法分析, 可得到一个 (男胎) 或两个 (女胎) 满足要求的单体型。 本发明的单体型分析方法, 除了能够用于单基因遗传病检测, 还能够同时进行 HLA分型、 非整倍体检测, 实现了单个样本的多项检测, 可为相关 IVF病人提供个性化服务。
在本发明的一个具体实施方式中, 在确定待测样本的单体型和染色体非整倍性信息的 步骤之后, 进一步包括, 基于待测样本单体型上的 S P与疾病的关系进行样本单基因病检 测。
在本发明的一个具体实施方式中, 基于比较任一遗传相关样本的 S P信息和待测样本 的 S P信息的差异检测待测样本染色体非整倍性,其中的任一遗传相关样本的 S P信息也 可以用 k个正常参照样本的 S P信息来替代, k为自然数, k个参照样本的 S P信息的获 得可以通过参考本发明中待测样本 S P信息的获得方法, 如预先或同时利用一样的探针集 构建参照样本的目标区域测序文库, 对参照样本的目标区域文库进行测序, 获得参照样本 的测序结果, 将参照样本的测序结果与参考序列进行比对, 获得比对结果,基于比对结果, 确定参照样本的 S P信息。基于比较任一遗传相关样本或者参照样本的 S P信息和待测标 样本的 S P信息的差异来检测待测样本染色体非整倍性,是通过比较待测样本 S P的测序 深度和遗传相关样本 / k个参照样本同一位置的平均测序深度是否有显著性差异来判断待测 样本是否存在染色体非整倍性的。 这里所说的染色体非整倍性可以是整条染色体的重复或 缺失, 也可以是某条染色体上局部区域的重复或缺失即为所说的拷贝数变异。 S ^的测序 深度 利用以下公式确定, TD1= 比对上参考序列 SNP i的读段数目, i表示 S P编号。
在本发明的一个具体实施方式中,获得过滤后的待测胚胎样本的 S P后,统计每个 S P 的测序深度, 进一步对每个 S P的测序深度值进行一系列处理, 获得 S P的测序深度系数 , S P的测序深度系数 的确定包括以下步骤,
(a) 对 进行第一校正以获得第一校正测序深度 TDai, 第一校正是通过对包含 i在 内的 n个连续 S P的测序深度进行线性回归实现的, 其中, n为自然数, η^ΙΟ;
(b) 对 TDai进行均一化获得11^, 进而获得 Rl=TD ai /TD ai
在本发明的一个具体实施方式中, 在步骤 (a) 中, 基于下列公式, 确定第一校正覆盖 深度 TD^ T°ai=(∑j TDJ)/n, 其中, TDj表示所述 n个连续区域中的第 j个区域的覆盖 深度, j为自然数, Kj n; 在步骤(b) 中, 基于下列公式, 对 1031进行均一化获得 (∑Γ— >。
在本发明 一个具体实施方式中, 在获得待测样本的 后进一步包括对 进 校
正以获得 n,
Figure imgf000009_0001
, y为自然数表示参照样本编号, ,y表示参照样本 y的 S ^的测序深度系数。 或者, 在本 发明的另一个具体实施方式中, 在获得待测样本的 后进一步包括对^进行第二校正以获 得 n, R ,其中, Rai为 k个参照样本和一个待测样本的 SNP i的测序深度系数的平均值,
Figure imgf000009_0002
R„= 1
k+1 。 在本发明的一个具体实施方式中,将 SNPi的测序深度与整个胚胎样本的所有 S P的平 均测序深度进行比较, 即上述的 n取最大值, 获得 SNPi的比例值 (ratio), 即获得上述的 Ri; 接着将 SNPi的 ratio值与 k个参照样本中相同位置的平均 ratio值进行比较, 比如相除, 得到 SNPi校正后的 ratio值, 即获得上述的 ri。 为便于直观展示, 可以将染色体上校正后各 S P的 ratio值作图, ratio值的高低反应了染色体情况, 如图 5所示, 正常二倍体 ratio值在 1.0附近波动, 而单体或三体 ratio值为偏向下方 0.5或偏向上方 1.5附近波动。 上述计算处理待测样本 S ^的覆盖深度系数 的过程中, 引进中间参数或者对各参数 的校正、 均一化等处理能减少因实验条件的波动、 样品间本身的差异等带来的误差, 使最 后的 n能真实反映 且围绕 1的波动幅度比 小, 且多个样本的 n符合正态分布; 上述实 施方式中对了^进行第一校正,接着对第一校正后的数值进行均一化,相当于两次求均值的 过程, 即在打算以 S P n个 SNP连续的测序深度均值代表 S ^的测序深度之前, n个 S P中的每个 S P的测序深度值的计算都是利用以该 S P为第一个 S P的 n个连续 S P 的测序深度均值表示的, 这样相当于利用包含 S ^的 2η个连续 S P的测序深度值来校正 TDt (若 2η已超过 SNP总数, 即利用包含 S ^的所有 S P的测序深度来校正 T ), 能使 连续 S P的测序深度保持稳定。 需要说明的是, 本领域人员可以利用其它校正或求平均值 处理使相邻几个 S P的测序深度值保持稳定, 比如以与 S PJl^S多少个的几个 S P的平 均测序深度来校正目标 S ^测序深度,均属于本发明的构思。参照样本 S ^的测序深度系 数的计算处理可以参考待测样本 S ^的测序深度系数的计算处理过程, 参照样本数据可以 预先计算处理好备用, 也可以与待测样本的计算处理过程同步进行而获得。
在本发明的一个具体实施方式中, 比较待测样本 S P的测序深度和 k个参照样本同一 位置的平均测序深度是否有显著性差异, 是通过 t检验进行的。进行 t检验, 待测样本 S ^ 一 ri" y 的 t统计量的计算公式为 k , 其中, W表示 k个参照样本的1y的平均值, 1 y为
参照样本 y的 S ^的经第二校正的测序深度系数,
Figure imgf000010_0001
本标准差,
Figure imgf000010_0002
。 基于 S P 值, 获得显著水平 当 Pi <0.05 , 判定 S Pi 所在区域存在拷贝数变异; 反之, 则判定 SNPi所在区域不存在拷贝数变异。 在本发明的另 一个实施例中,基于 S P^ ti值和预先确定的显著水平 PlQ,获得 理论值 tlQ,当 ti ^ tl0, 判 定 S ^所在区域存在拷贝数变异, 反之, 则判定 S P ^在区域不存在拷贝数变异; 预先确 定的 PlQ 0.05。 这样, 通过 T检验待测样本!^与!^个参照样本的中位数 ^的差异, 能判 断出拷贝数变异(CNV)区域的位置、 大小以及倍数。, 将连续异常的 S P即将连续显著差 异的 S P连接成一个区域, 该区域即 CNV区域, CNV大小通过 S P的坐标计算出来, 而 当连续异常的 S P连接成的区域为所在染色体的大小时, 即存在染色体非整倍性变异。
根据本发明的另一个实施方式, 提供了一种计算机可读介质, 用于存储供计算机执行 的程序, 本领域普通技术人员可以理解, 在执行该程序时, 通过指令相关硬件可完成上述 同时对待测样本进行目标基因单体型分析和染色体非整倍性检测方法的全部或部分步骤。 所称存储介质可以包括: 只读存储器、 随机存储器、 磁盘或光盘等。 在本发明的一个具体 实施方式中, 从获得测序结果后的步骤都通过计算机执行程序完成。
根据本发明的又一个实施方式, 提供了一种同时对待测样本进行目标基因单体型分析 和染色体非整倍性检测的系统, 包括:
(一) 目标区域测序文库构建装置, 目标区域测序文库构建装置适于对目标区域进行 文库构建; 目标区域测序文库的构建过程包括利用探针集筛选, 比如利用探针集捕获待测 样本的基因组文库获得目标区域测序文库; 所说的探针集能够捕获目标基因上下游 S P和 均匀分布于染色体的 S P, 获得所说的目标区域。
(二) 测序装置, 测序装置与目标区域测序文库构建装置相连, 适于对上述目标区域 测序文库进行测序, 获得测序结果;
(三) 分析装置, 所述分析装置与所述测序装置相连, 用于分析测序结果, 包括数据 输入单元、 数据输出单元、 存储单元和处理器, 其中,
数据输入单元用于输入测序结果,
数据输出单元用于输出结果数据,
存储单元用于存储数据, 包括上述的计算机可执行程序,
处理器, 与所述数据输入单元、 数据输出单元和存储单元连接, 用于执行所述可执行 程序, 所说的可执行程序可以完成前述对待测样本同时进行目标基因单体型分析和染色体 非整倍性检测方法的全部或部分步骤。
需要说明的是, 前面描述的本发明的方法的优点和效果同样适用于上述同时进行单体 型分析和染色体非整倍性检测的系统, 在此不再赘述。 下面将结合实施例对本发明的方案进行解释。 本领域技术人员将会理解, 下面的实施 例仅用于说明本发明, 而不应视为限定本发明的范围。 实施例中未注明具体技术或条件的, 按照本领域内的文献所描述的技术或条件(例如参考 J.萨姆布鲁克等著, 黄培堂等译的《分 子克隆实验指南》, 第三版, 科学出版社) 或者按照产品说明书进行。 所用试剂或仪器未注 明生产厂商者, 均为可以通过市购获得的常规产品, 例如可以采购自 Illumina公司。
实施例一: 探针序列的确定、 捕获芯片的定制和测试
设计的探针能识别的区域包含三部分, 一部分为目标基因区域, 一部分为目标基因的 SNP-marker区域, 即目标基因上下游紧密连锁的高频 S P区,一部分为染色体 S P-marker 区域, 即全染色体或目标染色体范围内均匀分布的高频 S P区。 在芯片上合成确定的探针 序列。 目标基因区域主要为外显子及外显子与内含子交界区域, 该区域覆盖了绝大部分的 致病突变, 可用于疾病突变的直接检测。 SNP-marker区域为目标基因区域上下游区域, 该 区域包含了上千个高频 S P (即千人数据库中频率大于 0.3的 S P), 该区域主要用于检测 父母差异化的 S P, 结合家系中的先证者 SNP信息构建目标基因单体型。 由于减数分裂中 同源染色体间基因重组的存在,会对基因的 S P-单体型造成影响。 SNP-marker间距离越小, 重组率越小, 当距离小于 1M时, 重组率低于 1% (人的重组率是 1%每 1M的区域)。 芯片 捕获包含的 SNP-marker区域的范围可以基于人类基因组的一般重组率大概估计选择确定, 一般地选择的目标基因区域上下游的范围小, 捕获得的 S P准确, 但是数量少, 选择的范 围大, 捕获得的 S P数量多, 但是范围大发生的重组概率也会越高, 且选择的上下游范围 大 S P 数量多, 设计合成花费相对高。 为降低基因重组的影响, 确保检测准确性, 将 SNP-marker区域限定在目标基因上下游 1M内, 这样可以把目标基因区与 S P-marker区域 的重组的概率降低到万分之一。 染色体 SNP-marker区域主要用于染色体非整倍性的检测。 需要说明的是, 目标基因区和目标基因的 SNP-marker区, 与染色体 SNP-marker区域可能 会有交叉重叠, 比如目标基因区中的 S P可能同时也属于染色体 SNP-marker区域, 这些 S P 在目标基因单体型构建和染色体非整倍性检测都发挥作用, 是本发明方法能够用少量 数据量就能检测多项变异的原因之一。 其中的目标基因区, 不是同时进行目标基因单体型 分析和染色体非整倍性检测所必需。
1.1 目标基因捕获探针 /芯片设计
首先确定目标单基因遗传病对应的基因,然后以 Hgl9为参考序列确定目标基因所在位 置, 确定捕获区域。
1.2 目标基因 SNP-marker捕获探针 /芯片设计
根据 1中确定的各目标基因位置,在该位置的上下游各 IMbp范围寻找在千人数据库频 率较高的 S P, 比如频率 >0.3的 S P, 这些 S P位点及其上下 lOObp左右即构成目标基因 SNP-marker区域。使选取的 SNP位点位于目标捕获片段中段,有利于提高 S P被捕获下来 的几率, 由于后面构建的文库大小在 200bp左右, 即捕获探针的捕获片段大小主要在 200bp 左右, 为提高目标 S P的捕获效率, 将这些 S P位点及其上下 lOObp左右(使选取的 S P 大致位于 1/2 200bp处) 的区域为目标基因 SNP-marker捕获区域。
1.3染色体 SNP-marker捕获芯片设计
以 Hgl9为参考序列, 在全染色体范围内寻找在千人数据库频率较高的 S P, 筛选出均 匀分布于全染色体范围的 S P, 共筛选出 10,000个 S P位点, 然后以这些 S P位点及其 上下 lOObp左右为 SNP-marker区域, 设计探针。
1.4探针 /芯片评估
探针 /芯片设计完成之后, 采用 SSAHA ( Sequence Search and Alignment by Hashing Algorithm) 软件对探针特异性评估, 评估合格即进行芯片合成, 芯片的合成是委托罗氏公 司 (Roche) 完成的。 实施例二: 目标区域测序文库的构建、 测序
2.1样本核酸提取与 WGA
在本实施例中, 采用一般方法和检测流程分别对一苯丙酮尿症(经典型)家系 (家系一, 常染色体隐性遗传)样本及一生育进行性肌营养不良 (DMD)家系 (家系二, X染色体隐性 遗传) 样本进行检测。 家系一夫妇经过 IVF获得 7个胚胎, 并采用 MF-PCR方法进行 PAH 基因检测, 筛选出 2个正常胚胎植入, 最终获得一个女婴, 经脐带血基因检测确认该女婴 正常。 家系二夫妇经过 IVF获得 9个胚胎, 并采用 MF-PCR方法进行 DMD基因 PGD, 筛 选出 3个正常胚胎, 选择其中 2个植入, 最终获得一个男婴 (其中有一胚胎没发育), 经脐 带血基因检测确认该男婴正常。
家系一样本包括父母、 患病女儿 (先证者) 外周血及 7个胚胎卵裂球单细胞。 经 PAH 基因检测, 父亲为 PAH基因 R243Q (c.728G>A)突变携带者, 母亲为 PAH基因 V399V (C.1197A>T)突变携带者, 先证者为 PAH基因 R243Q (c.728G>A)与 V399V (c.ll97A>T)复合 突变, 表现为苯丙酮尿症。 7个胚胎卵裂球单细胞(分别标记为 El l、 E12、 E13、 E14、 E15、 E16、 E17); 家系二样本包括父母、 女儿(表型正常)外周血及 9个胚胎卵裂球单细胞。 经 DMD基因检测, 父亲正常, 母亲及女儿为 DMD基因 R2905X (c. 87130T)突变携带者。 9 个胚胎卵裂球单细胞 (分别标记为 E21、 E22、 E23、 E24、 E25、 E26、 E27、 E28、 E29) 父母、先证者外周血采用 QIAamp DNA Blood MidiKit CQiagen)试剂盒按说明提取 DNA, 并用 Nanodrop检测, 浓度大于 30ng/ul。 7个胚胎卵裂球单细胞分别采用 REPLI-g ® Single Cell WGA kit (Qiagen)试剂盒并按操作说明进行全基因组扩增,产物进行琼脂糖凝胶电泳及 Qubit定量。 样品标记分别为: Fl、 Ml、 Pl、 Ell、 E12、 E13、 E14、 E15、 E16、 E17, F2、 M2、 P2、 E21、 E22 E23、 E24、 E25、 E26、 E27、 E28、 E29。
2.2 Illumina Hiseq基因组文库构建
上述获得的 DNA样品及 WGA产物先用 CovarisTM打断仪打断至 200bp大小的片段, 然后根据 illumina®公司 HiSeq2000TM测序仪的上机要求、根据 illumina提供的建库操作说 明进行建库:
2.2.1 样品打断
22管基因组 DNA及 WGA产物各取总量 3ug用 Covaris microTube with AFA fiber and
Snap - Cap在 Covaris S2(Covaris公司)上打断。
2.2.2末端修复、 末端加 A、 加接头
按建库要求, 按双末端标签文库构建说明书步骤及其列明的试剂、 反应条件等, 对上 述断裂纯化后的 DNA片段进行末端修复, 并进行纯化;加个碱基 A于经末端修复纯化后的 DNA片段的两端, 纯化末端加 A产物; 在末端加 A产品的两端连接测序接头, 利用连接标 签接头对 22个文库分别引入不同的标签, 并记录标签和文库的对应关系, 并利用能与测序 接头互补结合的磁珠纯化带接头的 DNA片段。
2.2.3 基因组文库构建完成后经 Agilent®Bioanalyzer 2100 检测片段分布范围符合要 求, 结果如图 3, 经荧光定量 PCR (QPCR) 检测到文库浓度结果如表 1 :
表 1 QPCR定量检测文库的相对浓度
样本 文库号 QPCR浓度(nM)
F1 文库 1 66.14
Ml 文库 2 53.62
PI 文库 3 47.35
El l 文库 4 76.30 E12 文库 5 53.77
E13 文库 6 90.65
E14 文库 7 78.46
E15 文库 8 47.86
E16 文库 9 71.87
E17 文库 10 51.92
F2 文库 11 60.54
M2 文库 12 63.42
P2 文库 13 57.65
E21 文库 14 67.35
E22 文库 15 54.76
E23 文库 16 70.66
E24 文库 17 75.26
E25 文库 18 57.14
E26 文库 19 72.07
E27 文库 20 56.91
E28 文库 21 71.87
E29 文库 22 61.94
2.4 芯片捕获
上述 22个基因组文库分 2组, 每组 11个, 按等比例混合成总量 500ng的 2个混合文 库。 混合文库采用 NimbleGen公司定制的液相芯片 SeqCap EZ Choice XL Library按操作说 明进行杂交 (具体步骤见 Nimblegen SeqCap EZ Exome Capture操作说明书)。 杂交 72个小 时后采用 NmibleGenwashkit按操作说明进行洗脱。 最后洗脱产物进行富集度检测、 Qpcr和 2100检测。
2.5、 Hiseq2500测序
上述杂交产物上 illumina® HiSeq2500TM测序仪测序, 测序循环数为 PElOlindex (即 双向 lOlbp index测序), 其中仪器的参数设置及操作方法都按照 Illumina®操作手册 (可由 http://www.illumina.com/support/documentation.ilmn获耳又)。
2.6 总体数据评价
测序完成后, 首先对测序数据进行质量过滤和去除接头污染的序列, 对高质量的测序 reads的进行总体评价分析。
使用比对软件 BWA (version 0.5.10)将测序 reads比对到人类参考基因组 (HG19, NCBI release GRCh37)上, 参数设置为 (-1 -i 15 -L -k 2 -1 31 -t 4), 取比对结果中唯一比对到芯片目 标区域的 reads并用 SAMtools去除 PCR重复扩展的序列进行后续分析。测序得到的数据量, 如表 2所示。 表 2 测序数据产量
Figure imgf000015_0001
父母及先证者的外周血样品测序深度约为 100x,胚胎细胞 WGA样品测序深度约为 50x。 实施例三: 胚胎单体型分析和单基因病检测
3.1 采用 Genome Analysis ToolkitCGATK)软件包进行个样本 S P及 indel分析, 得到各 个样本的基因型。 部分基因区域基因型如表 3和表 4所示:
表 3各样本部分 PAH基因区域基因型
直 父亲 母亲 先证者 El E2 E3 E4 E5 E6 E7
103075083 AC CC CC CC AC AC CC CC CC AC
103075442 AA AT AT AA AA AA AA AT AA AT
103075731 AA AT AA AT AT AT AT AA AT AA
103077486 CC CG CC CC CG CG CG CC CG CC
Figure imgf000016_0001
一 OV OO OV OV OV OV OO OV OO 6εΐ66οεοι
ST
Z.9T80/M0ZN3/X3d Ϊ0Ζ OAV 103488841 CT TT TT TT CT CT TT TT TT CT
103491018 TG GG GG GG TG GG GG GG TG
103495380 AG GG GG GG AG AG GG GG GG
103496446 TT CT CT TT TT TT TT CT TT CT
103501101 AC AA AA AA AC AC AA AA AA AC
103501562 CC TC CC TC TC TC TC CC TC CC
103515016 TT AT TT AT AT AT AT TT AT TT 该 S P信息对应参考基因组的反义链。 -表示该处无法得到 S P (无数据覆盖或深度太 低), 斜体表示致病突变。 表中 103237426坐标和 103246707坐标对应的是 PAH数据库中 V399V (C.1197A>T) 与 R243Q (c.728G>A)位点。 为了便于理解, 已经将该两个突变位点的 反义链信息改成对应的正义链的形式表示。
表 4各样本部分 DMD基因区域基因型
先证
直 父亲 母亲 E21 E22 E23 E24 E25 E26 E27 E28 E29 者
3 1838359 T GT GT TT TG G TG G TT TG _ G
3 1859140 G AG GG AG GG G GG G AG GG A G
3 1859179 A AG AG AA AG G AG G AA AG A G
3 1860203 A AG AG AA AG G AG G AA AG A G
3 1863 187 A AG AA AG AA A AA A AG AA G A
3 1863 193 G AT AT GT AG A AG A GT AG T A
3 18633 13 T TC TC TT TC C TC C TT TC T C
3 1867628 C TC TC CC TC T TC T CC TC C T
3 1884476 A AG AA AG AA A AA A AG AA G A
3 1893307 T GT TT TG TT T TT T TG TT G T
3 1893604 T AT TT AT TT T TT T AT TT A T
3 1986430 A AC AA AC AA A AA A AC AA C A
3 1986774 T TC TT TC TT T TT T _ TT C T
32198190 C TC TC CC TC T TC T CC TC C T
32212696 C TC TC CC TC T TC T CC TC C T
32219589 C TC TC CC TC T TC T CC TC C T
32228805 G AG GG AG GG G GG G AG GG A G
32383469 C TC CC TC CC C CC C TC CC T C
32456388 C TC TC CC TC T _ T CC TC C _
32456711 C CG CG CC CG G CG G CC CG C G 32459169 A AG AG AA AG G AG G AA AG A G
32466277 A AG AG AA AG G AG G AA AG A G
32481863 C TC TC CC TC T TC T CC TC C T
32486361 A AC AA AC AA A AA A AC _ C A
32490708 C CG CG CC CG G CG G CC CG C G
32503194 C TC TC CC TC T TC T CC TC C T
32508992 C TC CC _ CC C CC C TC CC T C
32563085 G CG CG GG GC C GC C GG GC G C
32563263 A AG AG AA AG G AG G AA AG A G
32579669 C TC TC CC TC T TC T CC TC C T
32579849 C TC CC TC CC C CC C TC CC T C
32580579 C TC TC CC TC T TC T CC TC C T
32827465 A AG AG AA AG G AG G AA AG A G
32858090 T TC TC TT TC C TC C TT TC T C
32862539 G AG GG AG GG G GG G AG GG A G
32886984 C CG CC CG CC C CC C CG CC G C
32887091 T TC TT TC TT T TT T TC TT C T
32887278 A AG AA AG AA A AA A AG AA G A
32889584 C TC CC TC CC C CC C TC CC T C
32889622 A AG AA AG AA A AA A AG AA G A
32889854 G AG GG AG GG G GG G AG GG A G
32890041 T GT TT TG TT T TT T _ TT G T
-表示该处无法得到 SNP (无数据覆盖或深度太低),斜体表示致病突变。表中 32456388 坐标对应的是 DMD数据库中 R2905X (c. 8713C>T)位点。
3.2 父母单体型构建
根据父母及先证者的 S P信息按照上述图 3所示方法可以构建父母单体型, 包括致病 突变所在的单体型, 表 5和表 6分别表示 PAH及 DMD基因部分位置的单体型构建。
表 5 PAH基因父母单体型构建
直 父亲 母亲 先证者 F-Hapl F-Hap2 M-Hapl M-Hap2
103075083 AC CC CC C A C C
103075442 AA AT AT A A T A
103075731 AA AT AA A A A T
103077486 CC CG CC C C C G
103099439 GG AG GG G G G A
Figure imgf000019_0001
81
Z.9T80/M0ZN3/X3d ΪΟΖ OAV 103491018 TG GG GG G T G G
103495380 AG GG GG G A G G
103496446 TT CT CT T T C T
103501101 AC AA AA A C A A
103501562 CC TC CC C C C T
103515016 TT AT TT T T T A
表中 F-Hapl、 F-Hap2分别表示父亲两个单体型, M-Hapl, M-Hap2分别表示母亲两个 单体型。 该 S P信息对应参考基因组的负链。 -表示该处无法得到 S P (无数据覆盖或深度 太低), 斜体为致病突变。 表中 103237426坐标和 103246707坐标对应的是 PAH数据库中 V399V (C.1197A>T) 与 R243Q (c.728G>A)位点。 为了便于理解, 已经将该两个突变位点的 反义链信息改成对应的正义链的形式表示。
表 6 DMD基因父母单体型构建
直 母亲 先证者 F-Hap M-Hapl M-Hap2
31838359 T GT GT T G T
31859140 G AG GG G G A
31859179 A AG AG A G A
31860203 A AG AG A G A
31863 187 A AG AA A A G
31863 193 G AT AT G A T
318633 13 T TC TC T C T
31867628 C TC TC C T C
31884476 A AG AA A A G
31893307 T GT TT T T G
31893604 T AT TT T T A
31986430 A AC AA A A C
31986774 T TC TT T T C
32198190 C TC TC C T C
32212696 C TC TC C T C
32219589 C TC TC C T C
32228805 G AG GG G G A
32383469 C TC CC C C T
32456388 C TC TC C T C
32456711 C CG CG C G C
32459169 A AG AG A G A 32466277 A AG AG A G A
32481863 C TC TC C T C
32486361 A AC AA A A C
32490708 C CG CG C G C
32503194 C TC TC C T C
32508992 C TC CC C C T
32563085 G CG CG G C G
32563263 A AG AG A G A
32579669 C TC TC C T C
32579849 C TC CC C C T
32580579 C TC TC C T C
32827465 A AG AG A G A
32858090 T TC TC T C T
32862539 G AG GG G G A
32886984 C CG CC C C G
32887091 T TC TT T T C
32887278 A AG AA A A G
32889584 C TC CC C C T
32889622 A AG AA A A G
32889854 G AG GG G G A
32890041 T GT TT T T G
表中 F-Hap表示父亲单体型(男性只有一条 X染色体), M-Hapl , M-Hap2分别表示母 亲两个单体型。 斜体为致病突变。 表中 32456388坐标对应的是 DMD数据库中 R2905X (c. 8713C>T)位点。
3.3 胚胎单体型分析
根据表 3、 4中胚胎 S P信息及表 5、 6中父母单体型信息按照图 3所示方法对胚胎区 分型 S Ps进行统计, 然后根据对应每条单体型支持的 S P数目多少判断出胚胎单体型, 进而判断胚胎是否致病。 对于常染色体, 一个胚胎只有 2个单体型, 一般也只有两个单体 型有 S P支持, 但偶尔会出现第 3或第 4条单体型, 这是由于 S P错误导致, 这种错误的 S P在总 S P中低于 5%。此外, 由于 ADO及测序错误的存在,胚胎 S P会存在个别 S P 丢失或错误现象, 为避免这种错误对结果的影响, 我们规定一条单体型至少有 10个区分型 SNPs支持。 本实施例的大量数据表明, 错误的单体型所支持的区分型 SNPs—般不超过 3 个, 而正确的单体型所支持的区分型 SNPs会大于 20个, 这说明个别错误不会影响胚胎单 体型判断。 因而, 为确保结果准确, 本发明将正确单体型的 S P 支持数定义为不少于 10 个, 错误单体型的 S P数不大于 3个。 具体分析流程如图 4所示。 图 4显示的为一常染色 体隐性遗传病的胚胎状态分析流程, 其中父母的 Hapl为致病突变所在单体型。 图中所示 别胚胎出现了 S P支持第 3个单体型, 但支持的 S P非常少, 不会影响结果判断。
从以上分析结果即可判断胚胎状态, 如表 7所示。检测结果与传统方法 MF-PCR (多 PCR) 检测结果相符, 结果符合率为 100%, 表明本发明的方法能够准确检测胚胎基因型 ί 导胚胎植入, 并具有检测周期短、高通量、低成本的优势。 MF-PCR检测结果如表 8和表 9 上述流程开发软件自动完成。
表 7 各胚胎检测结果
样本 检测结果
E11 R243Q (c.728G>A)携带者
E12 正常
E13 正常
E14 R243Q (c.728G>A)携带者
E15 R243Q (c.728G>A)合并 V399V (C.1197A>T)突变
E16 R243Q (c.728G>A)携带者
E17 V399V (c.1 197A>T)携带者
E21 女, 正常
Ε22 女, R2905X (c. 8713C>T) 携带者
Ε23 男, R2905X (c. 8713C>T) 突变
Ε24 女, R2905X (c. 8713C>T) 携带者
Ε25 男, R2905X (c. 8713C>T)突变
Ε26 女, 正常
Ε27 女, R2905X (c. 8713C>T) 携带者
Ε28 男, 正常
Ε29 男, R2905X (c. 8713C>T)突变 表 8 家系一 7个胚胎的 MF-PCR检测结果
样本 检测结果
E11 R243Q (c.728G>A)携带者
E12 正常
E13 正常
E14 R243Q (c.728G>A;>携带者
E15 R243Q (c.728G>A)合并 V399V (C.1197A>T)突变
E16 R243Q (c.728G>A)携带者
E17 V399V (c.1 197A>T)携带者 表 9 家系二 9个胚胎的 MF-PCR检测结果
Figure imgf000023_0001
实施例四: 胚胎染色体非整倍性检测
对各胚胎样本测序后过滤得到的高质量的测序 reads进行以下分析: 筛选出预先设计的 染色体 S P区域, 并统计每个 S P区域的有效深度。 将每个 S P区域的深度与整个样品 的 S P的平均测序深度进行比较,获得各 S P区域的比例值(ratio),再各 S P区域的 ratio 值与参照样品群中相同位置的中位数 ratio值进行比较, 得到每个 S P校正后的 ratio值, 通过 T检验检验每个 S P校正后的 ratio值与参照样本的地差异程度, 判断出 CNV变异区 域的位置, 大小, 以及倍数。 为便于直观展示, 将个染色体上校正后各 S P区域的 ratio值 作图, ratio值的高低反应了染色体情况, 如图 5所示。 经本方法分析, 7个胚胎中 E3, E4 存在染色体异常, E3为 21三体, E4为 21单体, 如表 10所示。
表 10 部分各胚胎总体检测结果
样本 检测结果
非整倍体检
地中海贫血检测
E1 Codons 41/42 (-TTCT)携带者 正常
E2 正常 正常
E3 正常 21三体
E4 Codons 41/42 (-TTCT)携带者 21单体
Codons 41/42 (-TTCT)合并 Codon 17 (A->T)突 正常
E5
E6 Codons 41/42 (-TTCT)携带者 正常
E7 Codon 17 (A->T)携带者 正常 工业实用性
本发明的对样本同时进行目标基因单体型分析和染色体非整倍性检测的方法及其系 统, 能够基于一次试验、 一次试验的数据量进行多种变异的检测, 非常适于核酸含量少的 样本的变异检测。 尽管本发明的具体实施方式已经得到详细的描述, 本领域技术人员将会理解。 根据已 经公开的所有教导, 可以对那些细节进行各种修改和替换, 这些改变均在本发明的保护范 围之内。 本发明的全部范围由所附权利要求及其任何等同物给出。
在本说明书的描述中, 参考术语"一个实施例"、 "一些实施例"、 "示意性实施例"、 "示 例"、 "具体示例"、 或 "一些示例"等的描述意指结合该实施例或示例描述的具体特征、 结 构、 材料或者特点包含于本发明的至少一个实施例或示例中。 在本说明书中, 对上述术语 的示意性表述不一定指的是相同的实施例或示例。 而且, 描述的具体特征、 结构、 材料或 者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。

Claims

权利要求书
1、 一种对待测样本同时进行目标基因单体型分析和染色体非整倍性检测的方法, 其特 征在于, 包括步骤:
1) 基于待测样本基因组的至少一部分, 构建目标区域测序文库, 其中, 在所述构建区 域测序文库的过程中, 包括采用探针集进行筛选, 所述探针集由多个预定探针构成, 所述 预定探针能够识别所述目标基因上下游的 S P和均匀分布于所述染色体的 S P;
2) 对所述目标区域测序文库进行测序, 以便获得测序结果;
3) 将所述测序结果与参考序列比对, 以便获得比对结果;
4) 基于所述比对结果, 确定待测样本的 S P信息;
5)基于所述待测样本的 S P信息, 同时确定所述待测样本的目标基因单体型和染色体 非整倍性信息。
2、 权利要求 1所述的方法, 其特征在于, 所述待测样本源自胚胎, 所述待测样本包含 的核酸不少于一个细胞的 DNA含量。
3、 权利要求 1所述的方法, 其特征在于, 所述探针集能够识别所述目标基因。
4、 权利要求 1所述的方法, 其特征在于, 所述探针集是通过下列步骤确定的: 基于参考序列, 选择所述目标基因上下游 S P以及均匀分布于染色体的 S P, 获得目 标 S P集;
基于所述目标 S P集中的每个 S P在参考序列上的位置,在参考序列上截取一段包含 所述目标 S P集中的至少一个 S P的序列作为一条预定探针, 获得所述探针集, 其中, 所 述预定探针不长于一个目标区域测序文库的大小。
5、 权利要求 4所述的方法, 其特征在于, 一条所述预定探针中包含一个 S P, 并且所 述 S P位于所述预定探针的中点。
6、权利要求 4所述的方法,其特征在于,所述一个目标区域测序文库大小为 100-1000bp。
7、 权利要求 1所述的方法, 其特征在于, 所述探针长度为 20-200nt, 优选的 60-80nt。
8、 权利要求 1所述的方法, 其特征在于, 所述目标基因上下游的 S P, 为目标基因上 下游各不大于 2M范围内的 S P, 优选的, 为目标基因上下游各 1M范围内的 S P。
9.权利要求 1所述的方法, 其特征在于, 所述目标基因上下游的和均匀分布于染色体的 S P在群体中的频率大于等于 0.3。
10、 权利要求 9所述的方法, 其特征在于, 所述均匀分布于染色体的 S P, 其中任意 两个相邻的 S P应满足在参考基因组上的距离为不大于 3000kbp。
11、权利要求 10所述的方法, 其特征在于, 所述均匀分布于染色体的 S P的个数至少 占所述染色体 S P总数的 1/3000。
12、 权利要求 1所述的方法, 其特征在于, 步骤 4) 进一步包括, 对所述 S P信息进 行过滤, 所述过滤为去除满足下列条件之一的 S P:
S P测序深度低于 10 X, 优选低于 20 X; 和 /或杂合 S P中两种碱基测序深度差异高 于 20%, 优选高于 10%, 更优选高于 5%。
13、 权利要求 1-12任一所述的方法, 其特征在于, 步骤 5 ) 包括:
预先或同时利用所述探针集构建与所述待测样本遗传相关的样本的目标区域测序文 库, 对遗传相关样本的目标区域测序文库进行测序, 获得遗传相关样本的测序结果, 将所 述遗传相关样本的测序结果与参考序列进行比对, 获得比对结果,基于所述比对结果, 确定 遗传相关样本的 S P信息, 所述与目标样本遗传相关的样本包括待测样本的父本样本、 待 测样本的母本样本和与待测样本遗传自同样父母的第二样本;
基于所述遗传相关样本的 S P信息, 确定待测样本的父本和母本样本的所述目标基因 的单体型, 基于所述父本、 母本的目标基因单体型和待测样本的 S P信息, 推断出待测样 本的目标基因单体型; 以及
基于比较任一遗传相关样本的 S P信息和待测样本的 S P信息的差异,检测待测样本 染色体非整倍性。
14、 权利要求 13所述的方法, 其特征在于, 所述确定待测样本的父本和母本的目标基 因单体型包括:
从父本和母本的 S P信息中筛选出区分型 S Ps,结合所述区分型 S Ps和第二样本 S P 信息确定父本和母本的目标基因单体型, 所述第二样本来源于先证者。
15、 权利要求 14所述的方法, 其特征在于, 所述推断出待测样本的目标基因单体型包 括,利用待测样本的 S P信息和待测样本父本母本目标基因的单体型,分别对待测样本 S P 中包含的父本和母本的区分型 S P的数目进行统计, 通过比较所得的统计数目和阈值, 来 确定待测样本的目标基因的单体型组合, 从而获得待测样本的目标基因单体型。
16、 权利要求 15所述的方法, 其特征在于, 所述阈值为 10。
17、权利要求 13所述的方法,所述基于比较任一遗传相关样本的 S P信息和待测标样 本的 S P信息的差异检测待测样本染色体非整倍性,其中的任一遗传相关样本的 S P信息 可以用 k个参照样本的 S P信息替代, 所述 k个参照样本的 S P信息的获得是通过: 预先 或同时利用所述探针集构建所述 k个参照样本的目标区域测序文库, 对所述 k个参照样本 的目标区域文库进行测序, 获得 k个参照样本的测序结果, 将所述 k个参照样本的测序结 果与参考序列进行比对, 获得比对结果,基于所述比对结果确定 k个参照样本的 S P信息, 其中, k为自然数。
18、权利要求 17所述的方法, 其特征在于, 所述基于比较 k个参照样本的 S P信息和 待测样本的 S P信息的差异检测待测样本染色体非整倍性,是通过比较待测样本的 S P的 测序深度和所述 k个参照样本的同一位置的平均测序深度是否有显著性差异, 来判断待测 样本是否存在染色体非整倍性的。
19、权利要求 18所述的方法, 其特征在于, 所述待测样本 S P的测序深度和 k个参照 样本同一位置的平均测序深度是否有显著性差异, 是通过 t检验进行的。
20、 权利要求 19所述的方法, 其特征在于, 利用下述公式确定 S ^的测序深度 TD^ 丁 =比对上参考序列 S P i的读段数目, 其中, i为 S P的编号。
21、权利要求 20所述的方法, 其特征在于, 所述待测样本 S P的测序深度和 k个参照 样本同一位置的平均测序深度是否有显著性差异, 是通过比较二者同一 S P的测序深度系 数进行的, 其中, 所述 S P的测序深度系数 的确定包括以下步骤:
(a) 对 进行第一校正以获得第一校正测序深度 TDai, 所述第一校正是通过对包含 i在内的 n个连续 S P的测序深度进行线性回归实现的, 其中, n为自然数 ,η大于等于 10;
(b) 对 1031进行均一化获得 TD ai, 进而获得 Ri=TD ai /TD ai
22、 权利要求 21所述的方法, 其特征在于, 在步骤(a) 中, 基于下列公式, 确定第一 校正覆盖深度 TD^ T =(∑j TDj)/n, 其中, TDj表示所述 n个连续区域中的第 j个区 域的覆盖深度, j为自然数, 1 η。
23、 权利要求 21所述的方法, 其特征在于, 在步骤 (b) 中, 基于下列公式, 对 TDai 进行均一化获得
Figure imgf000027_0001
24、 权利要求 21~23任一所述的方法, 其特征在于, 在获得待测样本的 后进一步包 括对 进行第二校正以获得 , R ai, 其中, Rai为 k个参照样本 SNP i的测序深度系数
的平均值,
Figure imgf000027_0002
, 为自然数表示参照样本编号, , y表示参照样本 y的 S ^的测 序深度系数。
25、 权利要求 21~23任一所述的方法, 其特征在于, 在获得待测样本的 后进一步包 括对 进行第二校正以获得 n, Ra , 其中, 为 k个参照样本和一个待测样本的 SNP i
的测序深度系数的平均值, k+1 , y为自然数表示参照样本编号, y表示参照 样本 y的 S P i的测序深度系数。
26、 权利要求 24 在于, 进行所述 t检验, 待测样本 S P^
t统计量的计算公式为
Figure imgf000027_0003
表示 k个参照样本的 的平均值, 为参
Figure imgf000027_0004
照样本 y的 S P 经所述第二校正的测序深度系数, ' R , k , 为 k个参照 样本标准差,
Figure imgf000028_0001
27、 权利要求 26所述的方法, 其特征在于, 基于 S P^ ti值, 获得显著水平 当 ^<0.05 , 判定所述 S ^所在区域存在拷贝数变异; 反之, 则判定所述 S ^所在区域不存 在拷贝数变异。
28、 权利要求 26所述的方法, 其特征在于, 基于 S P^ 值和预先确定的显著水平 , 获得 理论值 tlQ, 当 tl0, 判定所述 所在区域存在拷贝数变异, 反之, 则判定 所述 S P ^在区域不存在拷贝数变异; 所述预先确定的 PlQ 0.05。
29、 一种对待测样本同时进行目标基因单体型分析和染色体非整倍性检测的系统, 其 特征在于, 包括,
目标区域测序文库构建装置, 所述目标区域测序文库构建装置适于对目标区域进行文 库构建, 其中, 在所述构建区域测序文库的过程中, 包括采用探针集进行筛选, 所述探针 集由多个预订探针构成, 所述预订探针能够识别所述目标基因的上下游 S P和均匀分布于 所述染色体的 S P;
测序装置, 所述测序装置与目标区域测序文库构建装置相连, 适于对所述目标区域测 序文库进行测序, 获得测序结果;
分析装置, 所述分析装置与所述测序装置相连, 用于分析测序结果, 包括数据输入单 元、 数据输出单元、 存储单元和处理器, 其中,
数据输入单元用于输入测序结果,
数据输出单元用于输出结果数据,
存储单元用于存储数据, 包括可执行程序,
处理器, 与所述数据输入单元、 数据输出单元和存储单元连接, 用于执行所述可执行 程序, 所述可执行程序包括完成权利要求 1-28任一所述的方法。
PCT/CN2014/081672 2013-09-30 2014-07-04 同时进行单体型分析和染色体非整倍性检测的方法和系统 WO2015043278A1 (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
HK16109816.5A HK1221745B (zh) 2013-09-30 2014-07-04 同時進行單體型分析和染色體非整倍性檢測的方法和系統
CN201480050879.9A CN105555970B (zh) 2013-09-30 2014-07-04 同时进行单体型分析和染色体非整倍性检测的方法和系统

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
PCT/CN2013/084783 WO2015042980A1 (zh) 2013-09-30 2013-09-30 确定染色体预定区域中snp信息的方法、系统和计算机可读介质
CNPCT/CN2013/084783 2013-09-30

Publications (1)

Publication Number Publication Date
WO2015043278A1 true WO2015043278A1 (zh) 2015-04-02

Family

ID=52741899

Family Applications (2)

Application Number Title Priority Date Filing Date
PCT/CN2013/084783 WO2015042980A1 (zh) 2013-09-30 2013-09-30 确定染色体预定区域中snp信息的方法、系统和计算机可读介质
PCT/CN2014/081672 WO2015043278A1 (zh) 2013-09-30 2014-07-04 同时进行单体型分析和染色体非整倍性检测的方法和系统

Family Applications Before (1)

Application Number Title Priority Date Filing Date
PCT/CN2013/084783 WO2015042980A1 (zh) 2013-09-30 2013-09-30 确定染色体预定区域中snp信息的方法、系统和计算机可读介质

Country Status (2)

Country Link
CN (2) CN106029899B (zh)
WO (2) WO2015042980A1 (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105046105A (zh) * 2015-07-09 2015-11-11 天津诺禾医学检验所有限公司 染色体跨度的单体型图及其构建方法
WO2018053761A1 (zh) * 2016-09-22 2018-03-29 华为技术有限公司 一种数据处理方法、装置及计算节点
CN108220403A (zh) * 2017-12-26 2018-06-29 北京科迅生物技术有限公司 特定突变位点的检测方法、检测装置、存储介质及处理器

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111373054B (zh) * 2018-05-31 2024-06-25 深圳华大临床检验中心 确定男性待测样本是否存在三倍体的方法、系统和计算机可读介质
CN110628891B (zh) * 2018-06-25 2024-01-09 深圳华大智造科技股份有限公司 一种对胚胎进行基因异常筛查的方法
AU2020296108B2 (en) * 2019-06-21 2023-08-03 Coopersurgical, Inc. Systems and methods for determining pattern of inheritance in embryos
CN111276189B (zh) * 2020-02-26 2020-12-29 广州市金域转化医学研究院有限公司 基于ngs的染色体平衡易位检测分析系统及应用
CN113436680B (zh) * 2020-05-22 2022-03-25 复旦大学附属妇产科医院 一种同时鉴别胚胎染色体结构异常和致病基因携带状态的方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009106294A1 (en) * 2008-02-29 2009-09-03 Roche Diagnostics Gmbh Methods and systems for uniform enrichment of genomic regions
CN102061526A (zh) * 2010-11-23 2011-05-18 深圳华大基因科技有限公司 一种DNA文库及其制备方法、以及一种检测SNPs的方法和装置

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6410231B1 (en) * 1999-02-26 2002-06-25 Incyte Genomics, Inc. SNP detection
US20040063109A2 (en) * 2002-01-25 2004-04-01 Applera Corporation Single-tube, ready-to-use assay kits, and methods using same
CN101072882A (zh) * 2004-09-10 2007-11-14 塞昆纳姆股份有限公司 用于核酸长程序列分析的方法
EP2053132A1 (en) * 2007-10-23 2009-04-29 Roche Diagnostics GmbH Enrichment and sequence analysis of geomic regions
CN102559856B (zh) * 2010-12-22 2014-03-12 深圳华大基因科技服务有限公司 去除测序文库中的载体片段的方法
CN102952855B (zh) * 2011-08-26 2015-05-20 深圳华大基因科技服务有限公司 遗传图谱构建方法和装置、单体型分析方法和装置
CN103103624B (zh) * 2011-11-15 2014-12-31 深圳华大基因科技服务有限公司 高通量测序文库的构建方法及其应用
CN102839168A (zh) * 2012-07-31 2012-12-26 深圳华大基因研究院 核酸探针及其制备方法和应用

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009106294A1 (en) * 2008-02-29 2009-09-03 Roche Diagnostics Gmbh Methods and systems for uniform enrichment of genomic regions
CN102061526A (zh) * 2010-11-23 2011-05-18 深圳华大基因科技有限公司 一种DNA文库及其制备方法、以及一种检测SNPs的方法和装置

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105046105A (zh) * 2015-07-09 2015-11-11 天津诺禾医学检验所有限公司 染色体跨度的单体型图及其构建方法
WO2018053761A1 (zh) * 2016-09-22 2018-03-29 华为技术有限公司 一种数据处理方法、装置及计算节点
CN109477140A (zh) * 2016-09-22 2019-03-15 华为技术有限公司 一种数据处理方法、装置及计算节点
CN109477140B (zh) * 2016-09-22 2022-05-31 华为技术有限公司 一种数据处理方法、装置及计算节点
CN108220403A (zh) * 2017-12-26 2018-06-29 北京科迅生物技术有限公司 特定突变位点的检测方法、检测装置、存储介质及处理器
CN108220403B (zh) * 2017-12-26 2021-07-06 北京科迅生物技术有限公司 特定突变位点的检测方法、检测装置、存储介质及处理器

Also Published As

Publication number Publication date
CN106029899B (zh) 2021-08-03
CN106029899A (zh) 2016-10-12
WO2015042980A1 (zh) 2015-04-02
HK1221745A1 (zh) 2017-06-09
CN105555970A (zh) 2016-05-04
CN105555970B (zh) 2020-06-05

Similar Documents

Publication Publication Date Title
CN104232777B (zh) 同时确定胎儿核酸含量和染色体非整倍性的方法及装置
CN105555970B (zh) 同时进行单体型分析和染色体非整倍性检测的方法和系统
Yuen et al. Whole-genome sequencing of quartet families with autism spectrum disorder
Talkowski et al. Assessment of 2q23. 1 microdeletion syndrome implicates MBD5 as a single causal locus of intellectual disability, epilepsy, and autism spectrum disorder
CN105441432B (zh) 组合物及其在序列测定和变异检测中的用途
CN112126677B (zh) 耳聋单倍型基因突变无创检测方法
CN106715711A (zh) 确定探针序列的方法和基因组结构变异的检测方法
CN114999570B (zh) 一种不依赖于先证者的单体型构建方法
CN104232778A (zh) 同时确定胎儿单体型及染色体非整倍性的方法及装置
WO2014078739A1 (en) Methods and systems for diagnosing prenatal abnormalities
TR201815541T4 (tr) Fetüslü gebe bir dişi denekten alınan bir biyolojik numunenin analiz yöntemi.
US20250037796A1 (en) Methods for detecting absence of heterozygosity by low-pass genome sequencing
CN105648045A (zh) 确定胎儿目标区域单体型的方法和装置
US20180142300A1 (en) Universal haplotype-based noninvasive prenatal testing for single gene diseases
CN110021351A (zh) 分析碱基连锁强度以及基因分型方法和系统
CN106701897A (zh) 同时检测基因点突变、插入/缺失和cnv的方法及设备
CN104093858B (zh) 确定生物样本中染色体数目异常的方法、系统和计算机可读介质
US10106836B2 (en) Determining fetal genomes for multiple fetus pregnancies
CN104232649A (zh) 基因突变体及其应用
CN105838720A (zh) Ptprq基因突变体及其应用
CN104164424A (zh) Cc2d2a基因突变体及其应用
CN103509801B (zh) 骨骼肌氯离子通道基因突变体及其应用
CN105779463B (zh) Vps13b基因突变体及其应用
CN117925820B (zh) 一种用于胚胎植入前变异检测的方法
HK1221745B (zh) 同時進行單體型分析和染色體非整倍性檢測的方法和系統

Legal Events

Date Code Title Description
WWE Wipo information: entry into national phase

Ref document number: 201480050879.9

Country of ref document: CN

121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 14847861

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

32PN Ep: public notification in the ep bulletin as address of the adressee cannot be established

Free format text: NOTING OF LOSS OF RIGHTS PURSUANT TO RULE 112(1) EPC, FORM 1205A DATED 22-08-2016

122 Ep: pct application non-entry in european phase

Ref document number: 14847861

Country of ref document: EP

Kind code of ref document: A1