CN108070648A - 确定胎儿脊髓性肌肉萎缩症基因单体型的方法及系统 - Google Patents

确定胎儿脊髓性肌肉萎缩症基因单体型的方法及系统 Download PDF

Info

Publication number
CN108070648A
CN108070648A CN201810072663.2A CN201810072663A CN108070648A CN 108070648 A CN108070648 A CN 108070648A CN 201810072663 A CN201810072663 A CN 201810072663A CN 108070648 A CN108070648 A CN 108070648A
Authority
CN
China
Prior art keywords
site
haplotype
sequencing
father
mother
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201810072663.2A
Other languages
English (en)
Other versions
CN108070648B (zh
Inventor
蒋馥蔓
曾晓静
杜伯乐
张春生
郭宇来
王阳
朱文涛
李胜
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou Jingke Medical Laboratory Co ltd
Original Assignee
Guangzhou Jingke Medical Laboratory Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou Jingke Medical Laboratory Co ltd filed Critical Guangzhou Jingke Medical Laboratory Co ltd
Priority to CN201810072663.2A priority Critical patent/CN108070648B/zh
Priority to PCT/CN2018/074940 priority patent/WO2019144425A1/zh
Publication of CN108070648A publication Critical patent/CN108070648A/zh
Application granted granted Critical
Publication of CN108070648B publication Critical patent/CN108070648B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/20Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/172Haplotypes
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • G16B25/20Polymerase chain reaction [PCR]; Primer or probe design; Probe optimisation
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Zoology (AREA)
  • Physics & Mathematics (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Analytical Chemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Biotechnology (AREA)
  • Biophysics (AREA)
  • General Engineering & Computer Science (AREA)
  • Biochemistry (AREA)
  • Immunology (AREA)
  • Microbiology (AREA)
  • Pathology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Medical Informatics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明涉及一种确定胎儿脊髓性肌肉萎缩症基因单体型的方法,包括如下步骤:基于血液样本构建三代测序文库,所述血液样本取自胎儿父亲和母亲的血样;对所述三代测序文库进行第三代测序,获得三代测序结果;根据三代测序结果确定父亲和母亲脊髓性肌肉萎缩症基因单体型;基于检测样本构建二代测序文库,所述检测样本取自孕妇外周血血样;对所述二代测序文库进行第二代测序,获得二代测序结果;根据二代测序结果及所述父亲和母亲脊髓性肌肉萎缩症基因单体型确定胎儿脊髓性肌肉萎缩症基因单体型。

Description

确定胎儿脊髓性肌肉萎缩症基因单体型的方法及系统
技术领域
本发明涉及一种确定胎儿脊髓性肌肉萎缩症基因单体型的方法及系统。
背景技术
目前,对胎儿脊髓性肌肉萎缩症(Spinal Muscular Atrophy,SMA)基因的检测方法分为有创和无创两种,鉴于有创的方法具有一定的流产风险,无创方法越来越得到认同和普及。
目前基于孕妇外周血中游离DNA检测胎儿脊髓性肌肉萎缩症基因的方法主要有如下几种:1、用微滴数字PCR检测父源或者新发的突变。2、用目标区域捕获高通量测序的方法检测父源或者新发的突变。3、对父母以及祖父母和外祖父母或者先症者进行测序构建单体型,用母体外周测序评估剂量不平衡判断遗传自父母的突变。而这些方法存在检测位点数量较少,无法检测母源突变或者需要样本量较多,取样难度大等缺点。
发明内容
鉴于以上内容,有必要提供一种检测位点多,能同时涵盖父系和母系遗传突变,并且取样样本少,操作简单,快速准确的无创检测胎儿脊髓性肌肉萎缩症基因的方法及系统。
本发明提供一种确定胎儿脊髓性肌肉萎缩症基因单体型的方法,包括如下步骤:
基于血液样本构建三代测序文库,所述血液样本取自胎儿父亲和母亲的血样;
对所述三代测序文库进行第三代测序,获得三代测序结果;
根据三代测序结果确定父亲和母亲脊髓性肌肉萎缩症基因单体型;
基于检测样本构建二代测序文库,所述检测样本取自孕妇外周血血样;
对所述二代测序文库进行第二代测序,获得二代测序结果;
根据二代测序结果及所述父亲和母亲脊髓性肌肉萎缩症基因单体型确定胎儿脊髓性肌肉萎缩症基因单体型。
本发明还提供一种确定胎儿脊髓性肌肉萎缩症基因单体型的系统,所述系统包括:
构建三代测序文库设备,所述构建三代测序文库设备用于基于血液样本构建三代测序文库,所述血液样本取自胎儿父亲和母亲的血样;
三代测序设备,所述三代测序设备用于对所述三代测序文库进行第三代测序,获得三代测序结果;
确定父母脊髓性肌肉萎缩症基因单体型设备,所述确定父母脊髓性肌肉萎缩症基因单体型设备用于根据三代测序结果确定父亲和母亲脊髓性肌肉萎缩症基因单体型;
构建二代测序文库设备,所述构建二代测序文库设备用于基于检测样本构建二代测序文库,所述检测样本取自孕妇外周血血样;
二代测序设备,所述二代测序设备用于对所述二代测序文库进行第二代测序,获得二代测序结果;
确定胎儿脊髓性肌肉萎缩症基因单体型设备,所述确定胎儿脊髓性肌肉萎缩症基因单体型设备用于根据二代测序结果及所述父亲和母亲脊髓性肌肉萎缩症基因单体型确定胎儿脊髓性肌肉萎缩症基因单体型。
相较现有技术,本发明提供的确定胎儿脊髓性肌肉萎缩症基因单体型的方法具有如下优点:
本发明能够无创的检测胎儿的脊髓性肌肉萎缩症基因单体型,避免了有创方法可能出现的出血,流产,感染,羊水渗漏,损伤胎儿的风险,能够降低孕妇的心理压力,通过新型的检测方法给出准确的结果。
进一步的,本发明能够检测所有的脊髓性肌肉萎缩症基因突变,能够对遗传自父亲和遗传自母亲的突变进行准确的判定,解决了现有技术中一次只能检测少量位点,无法判定母系突变的问题。
同时,本发明能够在检测新发突变和父系突变的同时对母系突变进行检测,对于后续判断脊髓性肌肉萎缩症这种隐性遗传病有重要的意义,能够准确的判别出携带者与患者,检测结果更具有实际的应用意义。
本发明的需要的样本简单,可操作性强,仅需要父亲和母亲的外周血就能对胎儿的脊髓性肌肉萎缩症进行检测。而现有技术中的检测方法,或者需要祖父母和外祖父母的样本,或者需要先症者的样本,而这些样本都很难取样,所以在实际的过程中,现有的方法可行性太差。本发明仅需要父亲的外周血和母亲的外周血,实用性很强,能够通过无创的方法对胎儿的脊髓性肌肉萎缩症进行检测。
附图说明
说明书附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。本发明的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解,其中
图1是本发明实施例2中父亲样本三代测序文库检测结果图。
图2是本发明实施例2中母亲样本三代测序文库检测结果图。
图3是本发明实施例2中母亲样本二代测序文库检测结果图。
图4是本发明实施例2中胎儿单体型推断的结果图。
具体实施方式
下面详细描述本发明的实施例。下面通过参考附图描述的实施例是是示例性的,仅用于解释本发明,而不能理解为对本发明的限制。
需要说明的是,术语“第一”、“第二”、“第三”、“第四”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”、“第三”、“第四”的特征可以明示或者隐含地包括一个或更多个该特征。进一步地,在本发明的描述中,除非另有说明,“多个”的含义是两个或两个以上。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
除非另有定义,本文使用的技术和科学术语具有与本发明所属领域的普通技术人员通常理解的相同的含义。除非另有明确说明或从上下文中可明显看出,本文使用的技术和科学术语不排除在其所属领域已具有的含义。除非具体相反指出,本发明的具体实施方式及实施例将采用本领域技术范围内的常规方法。本领域技术范围包括但不限于分子生物学和基因测序技术。
本发明较佳的提供一种确定胎儿脊髓性肌肉萎缩症基因单体型的方法,包括如下步骤:
S1、基于血液样本构建三代测序文库,所述血液样本取自胎儿父亲和母亲的血样;
S2、对所述三代测序文库进行第三代测序,获得三代测序结果;
S3、根据三代测序结果确定父亲和母亲脊髓性肌肉萎缩症基因单体型;
S4、基于检测样本构建二代测序文库,所述检测样本取自孕妇外周血血样;
S5、对所述二代测序文库进行第二代测序,获得二代测序结果;
S6、根据二代测序结果及所述父亲和母亲脊髓性肌肉萎缩症基因单体型确定胎儿脊髓性肌肉萎缩症基因单体型。
根据本发明的具体实施例,所述S1还包括如下步骤:
S11、从所述血液样本分离DNA片段,其中,所述DNA片段为胎儿父亲和母亲外周血白细胞的全基因组DNA片段;
S12、对所述DNA片段进行第一处理,获得第一处理后的DNA片段;
根据本发明的具体实施例,所述第一处理包括如下步骤:
S121、对所述DNA片段进行打断,以获得打断后DNA片段;
S122、对所述打断后DNA片段进行第一纯化回收,以获得第一回收产物,所述第一回收产物的长度为5-15kb;
优选的,所述第一纯化回收包括选用磁珠纯化法,切胶法或BluePinPin方法等,进行回收。
S123、将所述第一回收产物进行第一末端修复,以获得第一末端修复的DNA片段;
S124、将所述第一末端修复的DNA片段的3’末端添加碱基A,获得第一粘性末端A的DNA片段;
S125、将所述第一粘性末端A的DNA片段与第一接头相连,获得第一连接产物;
S126、将所述第一连接产物进行第一PCR扩增,获得第一扩增产物,也即所述第一处理后的DNA片段。
S13、利用探针对所述第一处理后的DNA片段进行筛选并构建三代测序文库,其中,所述探针特异性识别脊髓性肌肉萎缩症相关的靶基因,所述脊髓性肌肉萎缩症相关的靶基因为5号染色体上70,922,133到70,955,823区域,所述探针以微芯片阵列的形式提供,所述微芯片阵列为液相芯片;
根据本发明的具体实施例,所述利用探针对所述第一处理后的DNA片段进行筛选,还包括:将所述探针筛选后的DNA片段进行第二处理,获得第二处理后的DNA片段,所述第二处理后的DNA片段构成三代测序文库。
根据本发明的具体实施例,所述第二处理包括如下步骤:
S131、将所述探针筛选后的DNA片段进行第二PCR扩增,以便获得第二扩增产物;
S132、将所述第二扩增产物进行第二纯化回收,获得第二回收产物;
S133、将所述第二回收产物进行损伤修复,获得损伤修复后的DNA片段;
S134、将所述损伤修复后的DNA片段进行第二末端修复,获得第二末端修复的DNA片段;
S135、将所述第二末端修复的DNA片段进行第三纯化回收,获得第三回收后的DNA片段;
S136、将第三回收后的DNA片段进行平末端接头连接,获得第二连接产物;
S137、将第二连接产物进行第四纯化回收,获得第四回收产物。
根据本发明的具体实施例,所述第二、第三和第四纯化回收包括选用磁珠纯化法,切胶法或BluePinPin方法等进行回收。根据本发明的具体实施例,所述三代测序文库用于Pacbio sequal等三代测序平台进行测序。
根据本发明的具体实施例,所述S2中第三代测序为采用第三代测序平台进行测序,所述第三代测序平台包括Pacbio sequal等测序平台。
根据本发明的具体实施例,所述S3还包括如下步骤:
S31、将获得的三代测序结果与参考人类基因组序列进行比对,得到经过比对的测序数据集合;所述比对的软件采用Blasr;所述参考人类基因组为Hg19;
S32、在所述经过比对的测序数据集合中筛选比对得分最高的序列,获得唯一比对序列集合;
S33、计算所述唯一比对序列集合中每一条序列上的目标区域里边每个位点不同的碱基深度;所述碱基深度采用samtools进行计算;
S34、根据所述每一条序列上每个位点不同的碱基深度筛选出杂合的单核苷酸多态性位点或小片段插入缺失的位点;
根据本发明的具体实施例,所述筛选的方法包括:按照突变的碱基深度除以位点的深度大于0.2,小于0.8,并且位点的深度大于20X的标准进行筛选;
S35、根据所述筛选出的杂合的单核苷酸多态性位点或小片段插入缺失的位点,选择包含两个相邻杂合单核苷酸多态性或小片段插入缺失位点的序列片段;
根据本发明的具体实施例,S35进一步包括:对每两个相邻杂合单核苷酸多态性位点或小片段插入缺失位点找出所对应的序列片段,选择包含所述两个相邻杂合位点排列类型的序列数最多的两个相邻杂合位点排列类型所对应的序列片段;
S36、对所述序列片段上两个相邻杂合单核苷酸多态性或小片段插入缺失的位点进行判断,得到两个相邻杂合位点的连接类型;
根据本发明的具体实施例,S36进一步包括:
S361、将低质量值的序列片段进行分析和过滤,所述低质量值的序列片段是指序列片段上含有低质量值的碱基以及每两个相邻的单核苷酸多态性位点或小片段插入缺失位点无法对应的序列片段;所述低质量值的碱基是指碱基为N的碱基。
S362、计算过滤后的序列片段上所述两个相邻杂合突变位点出现的概率值,对每一种连接类型给出一个概率值,所述概率值包括贝叶斯概率或优势对数比(LOD)值;
S363、根据所述两个相邻杂合位点出现的概率值,选择相邻两个杂合位点概率最大的连接类型;
S37、判断所有所述序列片段上两个相邻杂合单核苷酸多态性或小片段插入缺失位点的连接类型,也即总体的单体型;
根据本发明的具体实施例,S37进一步包括:采用数学统计方法对所有所述序列片段上两个相邻杂合单核苷酸多态性或小片段插入缺失位点进行计算,得到所有序列片段上两个相邻杂合单核苷酸多态性或小片段插入缺失位点的连接类型,也即总体的单体型,所述数学统计方法包括图论或最优解方法;
S38、对所述总体的单体型进行修正,得到父亲和母亲的单体型。
根据本发明的具体实施例,S38进一步包括如下步骤:
S381、对所有所述序列片段上两个相邻杂合单核苷酸多态性或小片段插入缺失位点的连接顺序进行连接关系的强弱判断,所述判断的标准包括支持的序列数、计算的概率值或优势对数比值;
S382、对所述两个相邻杂合位点的连接关系为弱联系的位点进行重新判断,选择覆盖所述相邻两个相邻杂合位点及其相邻多个位点的序列,判断所述序列的支持情况,根据所述支持情况对所述弱联系的位点进行修正,所述修正的标准包括跨越多个位点的序列数或支持附近单体型的位点数。
根据本发明的具体实施例,S3还可以包括如果父亲或母亲有携带脊髓性肌肉萎缩症基因突变位点,判定父亲或母亲所携带的脊髓性肌肉萎缩症基因突变位点分别在各自的哪一条单倍体型上,且通过提取包含致病突变位点的序列及序列上相邻的突变位点进一步验证与构建的单倍体型是否相符。所述致病突变位点为与脊髓性肌肉萎缩症相关的突变位点。
根据本发明的具体实施例,所述S4还包括如下步骤:
S41、从所述检测样本分离游离DNA片段,所述游离DNA片段为孕妇外周血游离核酸;
S42、对所述游离DNA片段进行第三处理,获得第三处理后的DNA片段;
根据本发明的具体实施例,所述第三处理包括如下步骤:
S421、将所述游离DNA片段进行第三末端修复,以获得第三末端修复的DNA片段;
S422、将所述第三末端修复的DNA片段的3’末端添加碱基A,获得具有第三粘性末端A的DNA片段;
S423、将所述第三粘性末端A的DNA片段与第三接头相连,获得第三连接产物;
S424、将所述第三连接产物进行第三PCR扩增,获得第三扩增产物,也即第三处理后的DNA片段;
S43、利用探针对所述第三处理后的DNA片段进行筛选并构建二代测序文库,其中,所述探针特异性识别脊髓性肌肉萎缩症相关的靶基因,所述脊髓性肌肉萎缩症相关的靶基因为5号染色体上70,922,133到70,955,823区域,所述探针以微芯片阵列的形式提供,所述微芯片阵列为液相芯片;
根据本发明的具体实施例,所述利用探针对所述第三处理后的DNA片段进行筛选,还包括:将所述筛选后的DNA片段进行第四PCR扩增,以便获得第四扩增产物,将所述第四扩增产物进行第五纯化回收,获得第五回收产物;所述第五回收产物构成所述二代测序文库;
根据本发明的具体实施例,所述第五纯化回收包括选用磁珠纯化法,切胶法或BluePinPin方法等进行回收;根据本发明的具体实施例,所述二代测序文库用于NextSeq、NovaSeq等二代测序平台进行测序。
根据本发明的具体实施例,所述S5中第二代测序为采用第二代测序平台进行测序,所述第二代测序平台包括Nextseq或NovaSeq等测序平台。
根据本发明的具体实施例,所述S6包括如下步骤:
S61、将所述二代测序结果进行过滤,得到过滤后的测序结果,所述过滤的条件包括序列中含有N的比例,以及含有低质量碱基数的比例,所述N为测序得到的碱基无法判断;
根据本发明的具体实施例,所述过滤的条件包括:过滤一条序列中N的比例大于10%的序列,以及一条序列中质量值小于15的比例大于50%的序列;
S62、将过滤后的测序结果与参考人类基因组序列进行比对,获得经过比对的测序数据集合;所述比对的软件采用BWA或SOAP;所述参考人类基因组为Hg19;
S63、将经过比对的测序数据集合进行质量值修正和局部重比对,获得修正后的测序数据;所述质量值修正和局部重比对采用GATK软件进行;
S64、确定所述修正后测序数据里含有单核苷酸多态性位点或小片段插入缺失的位点,筛选出对应所述父亲和母亲单倍体型的连接位点;进一步包括:计算所述在孕妇外周血的二代测序数据中对应父亲和母亲单倍体型的连接位点的碱基深度,所述碱基深度采用samtools或GATK进行计算;
S65、对筛选出的对应所述父亲和母亲单倍体型的连接位点进行选择:当判断遗传母亲哪一条单体型时,选择为母亲杂合,父亲纯合的位点;当判断遗传父亲那一条单体型时,选择为父亲杂合,母亲纯合的位点;
根据本发明的具体实施例,所述选择为母亲杂合,父亲纯合的位点包括如下步骤:
S651、过滤父亲杂合位点;
S652、过滤低的碱基深度的位点;
S653、过滤未在母亲单体型中出现的位点;
根据本发明的具体实施例,所述选择为父亲杂合,母亲纯合的位点包括如下步骤:
S651、过滤母亲杂合位点;
S652、过滤低的碱基深度的位点;
S653、过滤未在父亲单体型中出现的位点;
S66、根据所述父母纯合并且不同的位点计算胎儿浓度,所述计算的方法包括根据所述父母纯合并且不同的位点,计算在孕妇外周血中母亲碱基的总深度为A,父亲碱基的总深度为B,则胎儿浓度为f=2B/(A+B);
S67、根据所述胎儿浓度用隐马模型和位点比对法判断胎儿脊髓性肌肉萎缩症基因单体型。
根据本发明的具体实施例,所述S67还包括如下步骤:
S671、计算筛选出的母亲杂合,父亲纯合的位点在孕妇外周血的二代测序数据中的质量值;
S672、根据所述胎儿浓度,计算在孕妇外周血中每个筛选出的母亲杂合,父亲纯合位点的测序分布情况的概率;
S673、根据所述质量值、测序分布情况的概率用隐马模型和viterbi算法计算出最优的遗传路径,判断胎儿遗传了母亲的哪一条单倍体型;
S674、在S64中孕妇外周血的二代测序数据中筛选出通过三代数据中得到的父亲杂合,母亲纯合的位点,通过多个位点比对到S38中得到的父亲的两条单倍体型上来确定遗传了父亲的哪一条单倍体型。所述父亲杂合,母亲纯合的位点为外周血数据中与母亲纯合位点不一致的位点。
本发明另一方面还提供一种检测、监测和诊断胎儿脊髓性肌肉萎缩症的方法,包括如下步骤:
S7、判断胎儿脊髓性肌肉萎缩症基因单体型是否遗传了父亲或母亲的突变的单体型;
S8、根据胎儿脊髓性肌肉萎缩症基因单体型是否遗传了父亲或母亲的突变的单体型,确定胎儿是正常,携带者或患者。
若胎儿脊髓性肌肉萎缩症基因单体型仅遗传了父亲或母亲的突变的单体型,则胎儿是携带者;若胎儿脊髓性肌肉萎缩症基因单体型同时遗传了父亲和母亲的突变的单体型,则胎儿是患者;若胎儿脊髓性肌肉萎缩症基因单体型均未遗传了父亲或母亲的突变的单体型,则胎儿未罹患脊髓性肌肉萎缩症。
本发明另一方面还提供一种确定胎儿脊髓性肌肉萎缩症基因单体型的系统,所述系统包括:
构建三代测序文库设备,所述构建三代测序文库设备用于基于血液样本构建三代测序文库,所述血液样本取自胎儿父亲和母亲的血样;
三代测序设备,所述三代测序设备用于对所述三代测序文库进行第三代测序,获得三代测序结果;
确定父母脊髓性肌肉萎缩症基因单体型设备,所述确定父母脊髓性肌肉萎缩症基因单体型设备用于根据三代测序结果确定父亲和母亲脊髓性肌肉萎缩症基因单体型;
构建二代测序文库设备,所述构建二代测序文库设备用于基于检测样本构建二代测序文库,所述检测样本取自孕妇外周血血样;
二代测序设备,所述二代测序设备用于对所述二代测序文库进行第二代测序,获得二代测序结果;
确定胎儿脊髓性肌肉萎缩症基因单体型设备,所述确定胎儿脊髓性肌肉萎缩症基因单体型设备用于根据二代测序结果及所述父亲和母亲脊髓性肌肉萎缩症基因单体型确定胎儿脊髓性肌肉萎缩症基因单体型。
根据本发明的具体实施例,所述构建三代测序文库设备还包括:
第一分离装置,所述第一分离装置用于从所述血液样本分离DNA片段,其中,所述DNA片段为胎儿父亲和母亲外周血白细胞的全基因组DNA片段;
第一处理装置,所述第一处理装置用于对所述DNA片段进行第一处理,获得第一处理后的DNA片段;
第一探针筛选装置,所述第一探针筛选装置用于利用探针对所述第一处理后的DNA片段进行筛选并构建三代测序文库,其中,所述探针特异性识别脊髓性肌肉萎缩症相关的靶基因。
优选的,所述构建三代测序文库设备还包括第二处理装置,所述第二处理装置用于将第一探针筛选装置中所述探针筛选后的DNA片段进行第二处理,获得第二处理后的DNA片段,所述第二处理后的DNA片段构成三代测序文库。
根据本发明的具体实施例,所述确定父母脊髓性肌肉萎缩症基因单体型设备还包括:
第一比对装置,所述第一比对装置用于将通过三代测序设备获得的三代测序结果与参考人类基因组序列进行比对,得到经过比对的测序数据集合;
筛选装置,所述筛选装置用于在所述经过比对的测序数据集合中筛选比对得分最高的序列,获得唯一比对序列集合;
计算碱基深度装置,所述计算碱基深度装置用于计算所述唯一比对序列集合中每一条序列上的目标区域里边每个位点不同的碱基深度;
筛选杂合位点装置,所述筛选杂合位点装置用于根据所述每一条序列上每个位点不同的碱基深度筛选出杂合的单核苷酸多态性位点或小片段插入缺失的位点;
选择相邻杂合位点装置,所述选择相邻杂合位点装置用于根据所述筛选出的杂合的单核苷酸多态性位点或小片段插入缺失的位点,选择包含两个相邻杂合单核苷酸多态性或小片段插入缺失位点的序列片段;
判断位点装置,所述判断位点装置用于对所述序列片段上两个相邻杂合单核苷酸多态性或小片段插入缺失的位点进行判断,得到两个相邻杂合位点的连接类型;
判断连接类型装置,所述判断连接类型装置用于判断所有所述序列片段上两个相邻杂合单核苷酸多态性或小片段插入缺失位点的连接类型,也即总体的单体型;
第一修正装置,所述修正装置用于对所述总体的单体型进行修正,得到父亲和母亲的单体型。
根据本发明的具体实施例,所述选择相邻杂合位点装置还包括序列片段选择单元,所述序列片段选择单位用于对每两个相邻杂合单核苷酸多态性位点或小片段插入缺失位点找出所对应的序列片段,选择包含所述两个相邻杂合位点排列类型的序列数最多的两个相邻杂合位点排列类型所对应的序列片段。
根据本发明的具体实施例,所述判断位点装置还包括:
分析过滤单元,所述分析过滤单元用于将低质量值的序列片段进行分析和过滤;
概率计算单元,所述概率计算单元用于计算过滤后的序列片段上所述两个相邻杂合突变位点出现的概率值,对每一种连接类型给出一个概率值,所述概率值包括贝叶斯概率或优势对数比值;
选择连接类型单元,所述选择连接类型单元用于根据所述两个相邻杂合位点出现的概率值,选择相邻两个杂合位点概率最大的连接类型。
根据本发明的具体实施例,所述判断连接类型装置还包括:
位点计算单元,所述位点计算单元用于采用数学统计方法对所有所述序列片段上两个相邻杂合单核苷酸多态性或小片段插入缺失位点进行计算,得到所有序列片段上两个相邻杂合单核苷酸多态性或小片段插入缺失位点的连接类型。
根据本发明的具体实施例,所述第一修正装置还包括:
强弱连接关系判断单元,所述强弱连接关系判断单元用于对所有所述序列片段上两个相邻杂合单核苷酸多态性或小片段插入缺失位点的连接顺序进行连接关系的强弱判断,所述判断的标准包括支持的序列数、计算的概率值或优势对数比值;
弱联系重判断单元,所述弱联系重判断单元用于对所述两个相邻杂合位点的连接关系为弱联系的位点进行重新判断,选择覆盖所述相邻两个相邻杂合位点及其相邻多个位点的序列,判断所述序列的支持情况,根据所述支持情况对所述弱联系的位点进行修正,所述修正的标准包括跨越多个位点的序列数或支持附近单体型的位点数。
根据本发明的具体实施例,所述构建二代测序文库设备还包括:
第二分离装置,所述第二分离装置用于从所述检测样本分离游离DNA片段,所述游离DNA片段为孕妇外周血游离核酸;
第三处理装置,所述第三处理装置用于对所述游离DNA片段进行第三处理,获得第三处理后的DNA片段;
第二探针筛选装置,所述第二探针筛选装置用于利用探针对所述第三处理后的DNA片段进行筛选并构建二代测序文库,其中,所述探针特异性识别脊髓性肌肉萎缩症相关的靶基因。
根据本发明的具体实施例,所述确定胎儿脊髓性肌肉萎缩症基因单体型设备还包括:
过滤装置,所述过滤装置用于将所述二代测序结果进行过滤,得到过滤后的测序结果,所述过滤的条件包括序列中含有N的比例,以及含有低质量碱基数的比例,所述N为测序得到的碱基无法判断;
第二比对装置,所述第二比对装置用于将经过比对的测序数据集合进行质量值修正和局部重比对,获得修正后的测序数据;
第二修正装置,所述第二修正装置用于将经过比对的测序数据集合进行质量值修正和局部重比对,获得修正后的测序数据;
筛选父母连接位点装置,所述筛选父母连接位点装置用于确定所述修正后测序数据里的含有单核苷酸多态性位点或小片段插入缺失的位点,筛选出对应所述父亲和母亲单倍体型的连接位点;
判断遗传父母单体型装置,所述判断遗传父母单体型装置用于对筛选出的对应所述父亲和母亲单倍体型的连接位点进行选择,当判断遗传母亲哪一条单体型时,选择为母亲杂合,父亲纯合的位点;当判断遗传父亲哪一条单体型时,选择为父亲杂合,母亲纯合的位点;
胎儿浓度计算装置,所述胎儿浓度计算装置用于根据所述父母纯合并且不同的位点计算胎儿浓度;
判断胎儿脊髓性肌肉萎缩症基因单体型装置,所述断胎儿脊髓性肌肉萎缩症基因单体型装置用于根据所述胎儿浓度用隐马模型判断胎儿脊髓性肌肉萎缩症基因单体型。
根据本发明的具体实施例,所述胎儿浓度计算装置还包括:胎儿浓度计算单元,所述胎儿浓度计算单元用于根据所述父母纯合并且不同的位点,计算在孕妇外周血中母亲碱基的总深度为A,父亲碱基的总深度为B,则胎儿浓度为f=2B/(A+B)。
根据本发明的具体实施例,判断胎儿脊髓性肌肉萎缩症基因单体型装置还包括:
质量值计算单元,所述质量值计算单元用于计算筛选出的母亲杂合,父亲纯合的位点在孕妇外周血中的质量值;
测序分布概率计算单元,所述测序分布概率计算单元用于根据所述胎儿浓度,计算在孕妇外周血中每个筛选出的母亲杂合,父亲纯合位点的测序分布情况的概率;
判断母亲单倍体型遗传单元,所述判断母亲单倍体型遗传单元用于根据所述质量值、测序分布情况的概率用隐马模型和viterbi算法计算出最优的遗传路径,判断胎儿遗传了母亲的哪一条单倍体型;
判断父亲单倍体遗传单元,所述判断父亲单倍体遗传单元用于在孕妇外周血浆数据中筛选出三代数据得到的父亲杂合,母亲纯合的位点,通过多个位点比对到所述父亲的两条单倍体型上来确定遗传了父亲的哪一条单倍体型。
下面将结合实施例对本发明的方案进行解释。本领域技术人员将会理解,下面示例仅用于解释本发明,而不能理解为对本发明的限制。除另有交待,以下实施例中涉及的未特别交待的试剂、软件及仪器,都是常规市售产品或者开源的。
实施例1
1.制备脊髓性肌肉萎缩症基因杂交捕获的芯片
确定常见的脊髓性肌肉萎缩症所在的区域,优选的区域在5号染色体上70,922,133到70,955,823为脊髓性肌肉萎缩症的区域。
去除重复的片段,优选的方法是去除重复片段在200以上的区域,即如果某一个片段比对到染色体上有200个以上的区域能够比上,那么去除这些片段。
得到SMA杂交捕获的芯片,优选的方法是液相捕获芯片。
可以同时使用PCR方法对长片段进行扩增富集,所述PCR方法可以作为一种补充的方法辅助芯片进行目的区域的捕获。
2.三代文库的构建
a.样本制备:获得胎儿父亲和母亲血液样品,提取外周血白细胞的全基因组DNA片段。
b.基因组DNA打断:通过离心、超声、酶切等方法将基因组DNA打断成大片段,约5-15k片段,并使用磁珠、Blue PinPin HT、琼脂糖凝胶电泳等回收目的片段。
c.杂交前样本准备:
1)对大片段DNA进行末端修复,得到末端修复后的大片段DNA;所述末端修复通过T4DNA聚合酶(T4DNA Polymerase)和T4多聚核苷酸激酶(T4Polynucleotide Kinase)反应进行。
2)给所述末端修复后的大片段DNA进行末端加“A”,得到末端加“A”的大片段DNA;所述末端加“A”在含有Klenow(3’-5’exo-)的末端加“A”体系中进行。
3)给所述末端加“A”的大片段DNA连接接头得到带接头的大片段DNA;所述连接接头通过测序接头和T4DNA连接酶(T4DNA Ligase)反应完成。
4)扩增所述带接头的大片段DNA,得到带接头的大片段DNA富集产物,至此完成杂交文库准备工作。
d.芯片杂交捕获:使用1.中得到的芯片对c.中准备好的样品进行杂交捕获反应,并对得到的捕获产物进行富集扩增。
e.三代测序文库构建
1)对d.中得到的富集产物进行DNA损伤修复,得到损伤修复后的DNA;
2)对所述损伤修复后的DNA进行末端修复,得到末端修复后的DNA;
3)对所述末端修复后的DNA进行纯化,得到纯化回收后的DNA;
4)给所述纯化回收后的DNA连接平末端接头得到带接头的DNA,且得到完整三代测序文库结构;
5)对所述带接头的DNA进行纯化,连续纯化三次,所述纯化方法可以是磁珠法和切胶法、BluePinPin HT方法等,至此得到三代测序文库。
f.三代文库QC质控:使用Qbuit及安捷伦2100进行文库质检,质检合格文库进行下一步测序。
3.三代目标区域测序的方法
按照三代测序仪的操作规范采用三代测序仪进行质检合格文库测序。
4.根据三代测序数据获得父亲和母亲单核苷酸多态性(SNP)和小片段插入缺失(InDel)位点
获取比对序列。将测序得到的样本测序序列与参考基因组进行比对,获得比对后的结果。
选择最优比对结果。由于三代数据序列可能比对到参考基因组的多个地方,选择比对得分最高的序列。
计算唯一比对序列集合中每一条序列的目标区域里边每个位点不同碱基的深度,以SNP为例,即如果参考基因组为A,比对上的序列显示A与C,计算A和C的深度,这里A指参考序列碱基,C指突变的碱基。
根据碱基深度筛选杂合的SNP(InDel)位点。优选的方案为,如果突变的碱基深度除以位点的深度大于0.2,小于0.8,并且位点的深度大于20X,则判定这个位点为可选的杂合SNP位点,这里深度指这个位点有多少条序列覆盖。
5.父亲和母亲单核苷酸多态性(SNP)和小片段插入缺失(InDel)位点判断父亲和母亲的单体型
对上述检测的SNP或InDel位点进行连接,得到包含两个杂合SNP或InDel位置的片段。
对每两个相邻的SNP或InDel位点给出所在的序列,以SNP为例,例如第一个点为AC,第二个点为GT,则序列上的两个点情况可能是AG,AT,CG,CT。
选择支持数最多的两种类型,例如AG有5条序列支持,AT有10条序列支持,CG有8条支持,CT有19条支持,那么选择AT与CG认为是两个点的连接。
对两个相邻的杂合SNP或InDel位点连接进行判断,得到相邻两个点的连接类型。
对低质量值的序列片段进行分析与过滤,低质量值的序列片段指序列片段上含有低质量值的碱基以及每两个相邻的单核苷酸多态性位点或小片段插入缺失位点无法对应的序列片段。
计算相邻两个杂合突变位点可能出现的概率值,对每一种连接类型给出一个概率,包括但不限于贝叶斯概率,优势对数比(LOD)值。
根据上述计算的结果,选择两点概率最大的类型。
计算所有点的单体型。
对所有的点进行考量,得到总体的单体型,如点1与点2的连接为AT和CG,点2和点3的连接为TC于GT,则点1,2,3的情况为ATC和CGT。这里应用的方法包括但不限于图论,最优解方法。
对得到的单体型进行调整。
对单体型结果的强联系和弱联系进行判断,即判断两个位点的连接是否可靠,判断的标准包括但不限于支持的reads数,计算的概率值,LOD值。
对弱联系的位点进行重新判断,选择覆盖这两个位点及其相邻位点的序列,考量这些序列的支持情况,对弱联系的位点进行修正,得到最终的单体型,这里修改的标准包括但不限于跨越多个位点的序列数,支持附近的单体型的位点数。
6.二代文库的构建方法
a.样本制备:获取孕妇外周血血样本中游离核酸,所述游离核酸由多个DNA片段组成;
b.文库制备:
1)对游离DNA进行末端修复,得到末端修复后的游离DNA;所述末端修复通过T4DNA聚合酶(T4DNA Polymerase)和T4多聚核苷酸激酶(T4Polynucleotide Kinase)反应进行;
2)给所述末端修复后的游离DNA进行末端加“A”,得到末端加“A”的游离DNA;所述末端加“A”在含有Klenow(3’-5’exo-)的末端加“A”体系中进行;
3)给所述末端加“A”的游离DNA连接接头得到带接头的游离DNA;所述连接接头通过测序接头和T4DNA连接酶(T4DNA Ligase)反应完成;
4)扩增所述带接头的游离DNA,得到带接头的游离DNA富集产物,所述扩增在含有Pfx DNA聚合酶(Platinum Pfx DNA polymerase)的扩增体系中进行,并使用磁珠回收扩增产物,得到外周血血浆游离DNA文库。
c.芯片杂交捕获
使用1.中得到的芯片对b中得到的外周血血浆游离DNA文库进行杂交捕获反应,并对得到的捕获产物进行富集扩增。
d.使用磁珠法、切胶法和Blue PinPin HT法等对富集产物进行回收,至此,完成二代捕获文库的构建;
e.文库质检:使用安捷伦2100和QPCR对二代捕获文库进行质检,检测合格文库进入下一步的测序。
7.二代的测序方法
按照二代测序仪的操作规范采用二代测序仪进行检测合格文库测序。
8.根据二代测序数据获得孕妇外周血血样本中单核苷酸多态性(SNP)和小片段插入缺失(InDel)位点
过滤数据的低质量。过滤条件包括但不限于序列中含有N(指测序得到的碱基无法判断)的比率,含有低质量碱基数比例。
获取比对的序列。将测序下机的原始文件比对到参考基因组上,所用软件包括但不限于bwa,soap。
进行质量值调整和局部重比对,所用软件包括但不限于GATK。
提取出血浆中对应父母检测突变位点,所用软件包括但不限于GATK,samtools等。
9.根据孕妇外周血血样本中单核苷酸多态性(SNP)和小片段插入缺失(InDel)位点判断胎儿单体型
根据孕妇外周血血样本中单核苷酸多态性(SNP)和小片段插入缺失(InDel)位点进行选择,当判断遗传母亲哪一条单体型时选择的为母亲杂合,父亲纯合的位点,当判断遗传父亲哪一条单体型时选择的为父亲杂合,母亲纯合的位点。例如判断遗传母亲哪一条单体型时,步骤为:
过滤父亲杂合的位点。
过滤低深度的位点。
过滤在未在母亲单体型中出现的位点。
判断遗传父亲哪一条单体型时,步骤为:
过滤母亲杂合的位点。
过滤低深度的位点。
过滤在未在父亲单体型中出现的位点。
计算胎儿的浓度,计算的方法包括但不限于用父母的纯合不同位点进行计算,优选的方法为:
选择父母纯合并且不同的位点,计数在外周血中母亲碱基的总深度为A,出现父亲碱基的总深度为B,则胎儿浓度为f=2B/(A+B)。
例如:按父母都是纯合但碱基类型不同这个要求选择了目标区域第5号位置:母亲碱基类型CC,父亲碱基类型GG(看三代测序数据);再在二代测序数据上来看这个第5号位置也是由C与G组成,这个时候C就是指母亲的碱基类型,深度(其实就是这个位置C的碱基比例)是90%,这个时候G就是指父亲的碱基类型,深度是10%,这个时候推测的胎儿浓度就是20%)。
用隐马模型推断胎儿的单体型。
计算上述a中选择的位点在孕妇外周血中的质量值。
计算每个点出现观察到测序分布情况的概率,假设母亲单体型为m0和m1,分别计算遗传m0和m1时的概率,以m0为例,优选测序的分布属于多项分布,则概率为
b=(nA+nG+nC+nT)!/(nA!nG!nC!nT!)*(pA)nA(pG)nG(pC)nC(pT)nT,其中nA表示某个位点A的深度,pA表示在这个位点A可能的概率,
pA=0.5*(1-f)*Δ(s,m0)+0.5*(1-f)*Δ(s,m1)+0.5*f*Δ(s,m0)+0.5*f*Δ(s,m1),其中Δ(x,y)当x等于y时为1-e,当x不等于y时为e/3,e为碱基的错误率,f为胎儿浓度。
用隐马模型计算出最优的遗传路径,优选的重组概率即状态转移概率为10-6,初始状态概率分别为1/2,用viterbi算法得到最优的解。
判断是否遗传了父亲的突变的单体型,判断父亲单体型上的位点,例如当选择母亲纯合并且碱基不一致,确认位点是否在外周血中出现,如果一条单体型上的这种位点均在外周血中出现,则外周血遗传了这条单体型。
分别根据父母的单体型进行推断,即判断出胎儿的单体型,确定胎儿是正常,携带者,患者。
用三代的序列进行验证,判断突变位点周围的那些位点是否与突变在同一条序列上,确定是否遗传了致病的突变。
实施例2
对1例患者进行无创SMA检测,本例的父亲和母亲均为c.56delT突变的携带者,胎儿为c.56delT的纯合突变。
1、父亲及母亲样本的收集及处理
使用Streck采血管,按照外周血标准采集操作采集父亲及母亲5mL外周血。采集结束后,按照标准两步离心法及时对父亲及母亲外周血进行血浆分离操作。
1.1血浆DNA提取
采用TIANamp Micro DNA Kit进行母亲外周血血浆游离DNA的提取,具体操作步骤如下:
1.1.1取600μL孕妇外周血血浆于2mL离心管中,加入20μL Proteinase K溶液,充分震荡混匀,短暂离心。
1.1.2加入600μL缓冲液GB(含有浓度为1μg/μL的Carrier RNA储存液,具体配制方法见说明书),充分振荡混匀,短暂离心。
1.1.3 56℃孵育10min,并不时摇动样品。离心以去除管盖内壁的液滴。
1.1.4加入300μL的冷冻无水乙醇,颠倒混匀,室温放置5min,离心。
1.1.5将1.1.4中所得溶液转入一个吸附柱(吸附柱放入收集管中),12,000rpm离心30sec,弃废液,将吸附柱放回收集管中。
1.1.6向吸附柱中加入500μL缓冲液GD(使用前请先检查是否已加入无水乙醇),12,000rpm离心30sec,弃废液,将吸附柱放回收集管中。
1.1.7向吸附柱中加入600μL漂洗液PW(使用前请先检查是否已加入无水乙醇),12,000rpm离心30sec,弃废液,将吸附柱放回收集管中。
1.1.8重复操作步骤1.1.7。
1.1.9 12,000rpm离心2min,倒掉废液。将吸附柱置于室温放置2-5min,以彻底晾干吸附材料中残余的漂洗液。
1.1.10将吸附柱转入一个干净的离心管中,向吸附膜中间位置加入90μL洗脱缓冲液TB,室温放置2-5min,12,000rpm离心2min,将溶液收集到新的1.5ml离心管中,得到孕妇外周血血浆游离DNA,在离心管上贴好相应的样品信息条形码,取1uL DNA进行NanoDrop检测并记录浓度,血浆DNA保存到-80℃待用。
1.2外周血基因组DNA提取
采用TIANamp Blood DNA Kit进行夫妇双方外周血基因组DNA提取,具体步骤如下:
1.2.1往新的1.5mL EP管依次加入20uL蛋白酶K,200uL全血,200uL AL。
1.2.2充分颠倒混匀,56℃温浴10min。
1.2.3短暂离心,加入200uL无水乙醇,充分颠倒混匀,短暂离心。
1.2.4将1.2.3中所得的溶液移入一个CB3中(吸附柱CB3放入收集管中),12000rpm离心30s,倒掉收集管中的废液,将吸附柱CB3再次放入收集管中。
1.2.5向吸附柱CB3中加入500μL漂洗液GD,12000rpm离心30s,倒掉收集管中的废液,将吸附柱CB3再次放入收集管中。
1.2.6向吸附柱CB3中加入600μL漂洗液PW,12000rpm离心30s。倒掉收集管中的废液,将吸附柱CB3再次放入收集管中。
1.2.7重复步骤1.2.6。
1.2.8空甩,12000rpm离心2min,倒掉收集管中的废液,将吸附柱CB3置于室温放置数分钟,以彻底晾干吸附材料中残余的漂洗液。
1.2.9将吸附柱CB3转入1.5ml离心管中,向吸附膜中间位置悬空滴加80μL洗脱缓冲液TB,室温放置2~5min,12000rpm离心2min,将溶液收集到离心管中,并转移至新的1.5ml离心管内,在离心管上贴好相应的样品信息条形码,取1uL DNA进行NanoDrop检测并记录浓度,基因组DNA保存到-20℃待用。
2、三代测序文库的构建
2.1基因组DNA打断
每个样品取1ug基因组DNA,补EB溶液至150μL,使用g-TUBE管进行打断。
2.1.1将g-TUBE管放置于装载器上,加入150μL样品至g-TUBE管顶部,旋上管盖,确保盖紧。
2.1.2把g-TUBE管正向放入高速离心机,7000rpm离心1min。
2.1.3取出g-TUBE,将g-TUBE管倒转再次放入高速离心机中(g-TUBE管盖朝下),7000rpm离心1min。
2.1.4取出g-TUBE管,将样品从g-TUBE管转移至至新的1.5ml离心管内,至此完成样品打断,并使用0.8倍体积的AMPure PB磁珠进行纯化,最后使用24μL EB溶液洗脱磁珠,转移22μL样品至新的1.5ml离心管内,在样品管侧贴好相关的样品标签,进入下一步操作,或者放在-20℃中备用。
2.2目的片段回收
使用Blue PinPin HT仪器的High Pass模式对≥7k片段进行回收。
仪器运行结束后取出回收样品,取1μL进行Qbuit HS检测,记录浓度信息,并在样品管侧贴好相关的样品标签,进入下一步操作,或者放在-80℃中备用。
2.3杂交前样本准备
使用KAPA Hyper Prep Kit进行杂交前样本准备。
2.3.1末端修复,加“A”
取2.2中得到的DNA 200ng,加入EB补充体积至50μL,按照以下表格在200μLPCR管中进行末端修复及加“A”体系配制。
充分混匀,短暂离心,放入PCR仪中,按照下边条件进行反应。
反应结束后,立即进入下一步反应。
2.3.2接头连接
上一步得到的溶液按照以下表格进行体系配制。
充分混匀,短暂离心,放入PCR仪中,20℃保持15min,反应结束后立即使用0.8倍体积的AMPure PB磁珠进行纯化,最后使用52μL EB溶液洗脱磁珠,转移50μL样品至新的1.5ml离心管内,在样品管侧贴好相关的样品标签,进入下一步操作,或者放在-20℃中备用。
2.3.3目的片段扩增
上一步得到的50μL溶液平均分成两份25μL,按照以下表格在200μLPCR管中配制PCR体系,即1个样品分别进行2个反应。
充分混匀,短暂离心,放入PCR仪中,按照下边条件进行反应。
反应结束后,使用0.8倍体积的AMPure PB磁珠回收PCR产物,最后使用27μL EB溶液洗脱磁珠,转移25μL样品至新的1.5ml离心管内,在样品管侧贴好相关的样品标签,立即进入下一步操作,或者放在-80℃中备用。
2.4芯片捕获
2.4.1捕获芯片准备及芯片捕获
1)将需要进行捕获的样品等量混合至1个新的1.5ml离心管中,DNA总量为3ug;
2)根据文库构建时候用的Index,加入相应的Index封闭试剂(1000pM),Index封闭试剂的总体积为4μL,该实施例中文库构建使用的Index是Index1和Index2,按照以下表格往混合样品管中加入试剂。
震荡混匀,短暂离心,使用1次性无菌采血针头在离心管的管盖上扎2个孔,60℃真空浓缩至蒸干;
3)将文库捕获芯片从-80℃拿出来,冰上解冻;
4)将蒸干的样品取出,贴上封口膜,按照以下体系往样品管中加入试剂;
震荡混匀,短暂离心,放置PCR仪上反应:95℃,10min(需提前设置好);
5)反应结束后,取出样品,室温下,最大转速离心,然后将14μL样品全部转移至含有6μL捕获芯片的200μL PCR管中,剧烈震荡。
6)放置至PCR仪上按以下程序进行杂交反应:47℃,20小时,同时PCR仪的热盖设置为57℃。反应结束后,进入下一步杂交洗脱。
2.4.2杂交洗脱
1)需提前将链霉亲和素磁珠M270放置室温平衡半小时;打开恒温混匀仪,设置47℃,下表是1个样品的使用量,多个样品递加,按照以下体系将需预热的试剂放入恒温混匀仪。
2)剧烈震荡混匀磁珠,按照50μL/捕获文库的量取出M270磁珠,加入一个新的1.5mL离心管内。
3)将带有磁珠的离心管转移至磁力架上,待澄清,丢弃上清;
4)保持离心管在磁力架上,加入100μL1x磁珠洗脱缓冲液;
5)将离心管从磁力架上取下,震荡12s;
6)将离心管转移至磁力架上,待澄清,丢弃上清;
7)重复步骤4)~6),共洗涤2次;
8)取下带有磁珠的离心管,加入50μL 1x磁珠洗脱缓冲液,并转移至200μL PCR管中,将带有磁珠的PCR管转移至磁力架上,待澄清,丢弃上清,至此,该磁珠可以用来与杂交的芯片结合;
9)将杂交反应结束后的含有芯片的溶液加入到8)中的M270磁珠,震荡混匀;
10)放入预先设置好47℃的PCR仪中反应,PCR仪的热盖设置为57℃;
11)反应结束后,往含有20μL捕获芯片的PCR管中加入100μL 47℃遇热的1x洗脱缓冲液I,用枪头吹打混匀,并将其转移至1.5mL离心管中;
12)将带有捕获芯片的离心管转移至磁力架上,待澄清,丢弃上清;
13)取下离心管,加入200μL 47℃预热的1xStringent洗脱缓冲液,用枪头吹打混匀,将离心管转移至恒温混匀仪上47℃反应5min;
14)重复步骤12)~13);共使用47℃预热的1xStringent洗脱缓冲液洗涤2次;
15)将离心管转移至磁力架上,待澄清,丢弃上清;
16)取下离心管,加入200μL常温1x洗脱缓冲液I,用枪头吹打混匀,再将离心管转移至磁力架上,待澄清,丢弃上清;
17)取下离心管,加入200μL常温1x洗脱缓冲液II,用枪头吹打混匀,再将离心管转移至磁力架上,待澄清,丢弃上清;
18)取下离心管,加入200μL常温1x洗脱缓冲液III,用枪头吹打混匀,再将离心管转移至磁力架上,待澄清,丢弃上清;
19)取下离心管,加入50μL PCR等级水,混匀,进入下一步反应或保存在-20℃待用。
2.4.3杂交文库扩增
1)上一步得到的M270磁珠芯片混悬液,取25μL/文库按照下表在200ΜlPCR管中进行PCR扩增体系配制。
充分混匀,短暂离心,放入PCR仪中,按照下边条件进行反应。
反应结束后,使用0.8倍体积的AMPure PB磁珠进行纯化,最后使用27μL EB溶液洗脱磁珠,转移24μL样品至新的1.5ml离心管内,在样品管侧贴好相关的样品标签,进入下一步操作,或者放在-80℃中备用。
2.5三代文库构建
2.5.1DNA损伤修复
上一步得到的纯化样品按照下表在PCR管中进行体系配制。
充分混匀,短暂离心,按照以下温度程序进行反应。
2.5.2末端修复
上一步反应结束后的样品,按照下表在PCR管中进行体系配制。
充分混匀,短暂离心,按照以下温度程序进行反应。
反应结束后,快速进入下一步。
2.5.3磁珠纯化
2.5.3.1将上一步得到的样品转移至1.5mL离心管中,加入23.6μL(0.45倍体积)AMPure PCR磁珠,充分混匀,短暂离心;
2.5.3.2室温下将带有样品和磁珠的离心管放置于混匀仪上,设置2000rpm,10min;
2.5.3.3短暂离心,将溶液甩至管底,将离心管转移至磁力架上,待澄清,小心吸取上清转移至1个新的1.5mL离心管内(不要碰到磁珠),做好标记;
2.5.3.4保持带有磁珠的离心管在磁力架上,加入200μL新鲜配制的70%乙醇,待澄清,丢弃上清;
2.5.3.5重复步骤2.5.3.4;
2.5.3.6丢弃乙醇后,晾干磁珠,确保没有任何乙醇残留;
2.5.3.7加入32μL EB溶液,充分混匀,再放置到混匀仪上,设置2000rpm,1min;
2.5.3.8将离心管转移至磁力架上,待澄清,吸取30μL EB溶液转移至1个新的1.5mL离心管内,并取1μL进行Nanodrop检测,以确保当前流程没有异常。
2.5.4平末端连接准备
1)将2.5.3中得到的样品按照下表在PCR管中进行体系配制,在冰上配制。
充分混匀,短暂离心,按照以下温度程序进行反应。
反应结束后,快速进入下一步。
2)消化未成功连接的产物
按照下表往上一步得到的样品管中加入以下试剂。
充分混匀,短暂离心,按照以下温度程序进行反应。
该步反应结束后,使用磁珠进行纯化。
2.5.5磁珠纯化第一次
2.5.5.1往上一步得到的样品中加入18.9μL(0.45倍体积)AMPure PB磁珠,充分混匀,短暂离心;
2.5.5.2室温下将带有样品和磁珠的离心管放置于混匀仪上,设置2000rpm,10min;
2.5.5.3短暂离心,将溶液甩至管底,将离心管转移至磁力架上,待澄清,小心吸取上清转移至1个新的1.5mL离心管内(不要碰到磁珠),做好标记;
2.5.5.4保持带有磁珠的离心管在磁力架上,加入200μL新鲜配制的70%乙醇,待澄清,丢弃上清;
2.5.5.5重复步骤2.5.5.4;
2.5.5.6丢弃乙醇后,晾干磁珠,确保没有任何乙醇残留;
2.5.5.7加入50μL EB溶液,充分混匀,再放置到混匀仪上,设置2000rpm,1min;
2.5.5.8将离心管转移至磁力架上,待澄清,吸取50μL EB溶液转移至1个新的1.5mL离心管内,进入下一步磁珠纯化过程。
2.5.6磁珠纯化第二次
2.5.6.1往上一步得到的样品中加入22.5μL(0.45倍体积)AMPure PB磁珠,充分混匀,短暂离心;
2.5.6.2室温下将带有样品和磁珠的离心管放置于混匀仪上,设置2000rpm,10min;
2.5.6.3短暂离心,将溶液甩至管底,将离心管转移至磁力架上,待澄清,小心吸取上清转移至1个新的1.5mL离心管内(不要碰到磁珠),做好标记;
2.5.6.4保持带有磁珠的离心管在磁力架上,加入200μL新鲜配制的70%乙醇,待澄清,丢弃上清;
2.5.6.5重复步骤2.5.6.4;
2.5.6.6丢弃乙醇后,晾干磁珠,确保没有任何乙醇残留;
2.5.6.7加入100μL EB溶液,充分混匀,再放置到混匀仪上,设置2000rpm,1min;
2.5.6.8将离心管转移至磁力架上,待澄清,吸取100μL EB溶液转移至1个新的1.5mL离心管内,进入下一步磁珠纯化过程。
2.5.7磁珠纯化第三次
2.5.7.1往上一步得到的样品中加入45μL(0.45倍体积)AMPure PB磁珠,充分混匀,短暂离心;
2.5.7.2室温下将带有样品和磁珠的离心管放置于混匀仪上,设置2000rpm,10min;
2.5.7.3短暂离心,将溶液甩至管底,将离心管转移至磁力架上,待澄清,小心吸取上清转移至1个新的1.5mL离心管内(不要碰到磁珠),做好标记;
2.5.7.4保持带有磁珠的离心管在磁力架上,加入200μL新鲜配制的70%乙醇,待澄清,丢弃上清;
2.5.7.5重复步骤2.5.7.4;
2.5.7.6丢弃乙醇后,晾干磁珠,确保没有任何乙醇残留;
2.5.7.7加入10μL EB溶液,充分混匀,再放置到混匀仪上,设置2000rpm,1min;
2.5.7.8将离心管转移至磁力架上,待澄清,吸取10μL EB溶液转移至1个新的1.5mL离心管内。
2.5.8三代文库QC
文库进行Qbuit检测及2100检测,2100图如图1和图2所示,检测合格文库进行测序。
2.5.9三代测序
本实施例使用Pacbio sequal测序,按照Pacbio sequal仪器操作规范进行测序。
3、检测父亲及母亲单核苷酸多态性(SNP)和小片段插入缺失(InDel)位点
对三代测序能够下机的数据进行分析,分析的步骤如下:
3.1比对,将三代测序的长片段比对到人类参考基因组上,用bwa进行比对,参考基因组选择hg19。
3.2选择最优的比对结果,对每一条序列的多个比对结果进行分析,挑选出这条序列打分最高的比对位置作为唯一的比对结果。
3.3计算每个位点的深度,用samtools得到mpileup的结果,之后进行分析,得出碱基与深度的对应情况。
3.4对杂合的SNP和InDel进行过滤,按照频率为(0.2,0.8),深度大于20X的标准过滤。结果见表1。
表1.过滤后的SNP和InDel数量
SNP InDel
父亲 135 52
母亲 142 49
4、用三代数据构建父母的单体型
通过对父母的三代下机数据进行分析,得到父母的单体型。
4.1计算杂合两个相邻杂合SNP(InDel)的位置的片段。
4.2判断两个杂合SNP(InDel)的连接。
4.3计算所有点的单体型。
4.4对得到的单体型进行调整,最终得出的结果见表2。
表2.检出单体型的结果
母亲 父亲
数量 3 2
最长 22087 22391
最长起点 70924930 70924871
最长终点 70947016 70947262
最短 4670 5318
最短起点 70925064 70929125
最短终点 70929734 70934443
如表2所示,其中数量表示检出单体型的个数,最长表示最长单体型的长度,最长起点表示最长单体型的起点,最长终点表示最长单体型的终点,最短表示最短单体型的长度,最短起点表示最短单体型的起点,最短终点表示最短单体型的终点。
4.5用序列验证突变位点所在的单体型。其中突变位点为SMN1:c.56delT,在人类参考基因组上为chr5的70925159。将母亲的无突变的单体型记为m0,有突变的单体型记为m1,将父亲的无突变的单体型记为f0,有突变的单体型记为f1。
5、二代测序文库的构建
孕妇外周血分离血浆提取的DNA进行二代文库构建。
5.1末端修复,加“A”
取2.2中得到的DNA 200ng,加入EB补充体积至50μL,按照以下表格在200μLPCR管中进行末端修复及加“A”体系配制。
充分混匀,短暂离心,放入PCR仪中,按照下边条件进行反应。
反应结束后,立即进入下一步反应。
5.2接头连接
上一步得到的溶液按照以下表格进行体系配制。
充分混匀,短暂离心,放入PCR仪中,20℃保持15min,反应结束后立即使用88μLAMPure XP磁珠进行纯化,最后使用52μL EB溶液洗脱磁珠,转移50μL样品至新的1.5ml离心管内,在样品管侧贴好相关的样品标签,进入下一步操作,或者放在-20℃中备用。
5.3目的片段扩增
按照以下表格在200μLPCR管中配制PCR体系,进行PCR扩增体系配制。
充分混匀,短暂离心,放入PCR仪中,按照下边条件进行反应。
反应结束后,使用1倍体积的AMPure XP磁珠回收PCR产物,最后使用27μL EB溶液洗脱磁珠,转移25μL样品至新的1.5ml离心管内,在样品管侧贴好相关的样品标签,立即进入下一步操作,或者放在-20℃中备用。
5.4目标区域捕获
5.4.1捕获芯片准备及芯片捕获
1)将需要进行捕获的样品等量混合至1个新的1.5ml离心管中,DNA总量为1ug;
2)根据文库构建时候用的Index,加入相应的Index封闭试剂(1000pM),Index封闭试剂的总体积为4μL,该实施例中文库构建使用的Index是Index1和Index2,按照以下表格往混合样品管中加入试剂;
震荡混匀,短暂离心,使用1次性无菌采血针头在离心管的管盖上扎2个孔,60℃真空浓缩至蒸干;
3)将文库捕获芯片从-80℃拿出来,冰上解冻;
4)将蒸干的样品取出,贴上封口膜,按照以下体系往样品管中加入试剂;
震荡混匀,短暂离心,放置PCR仪上反应:95℃,10min(需提前设置好)。
5)反应结束后,取出样品,室温下,最大转速离心,然后将14μL样品全部转移至含有6μL捕获芯片的200μL PCR管中,剧烈震荡。
6)放置至PCR仪上按以下程序进行杂交反应:47℃,16~20小时,同时PCR仪的热盖设置为57℃。反应结束后,进入下一步杂交洗脱。
5.4.2杂交洗脱
1)需提前将链霉亲和素磁珠M270放置室温平衡半小时;打开恒温混匀仪,设置47℃,下表是1个样品的使用量,多个样品递加,按照以下体系将需预热的试剂放入恒温混匀仪。
2)剧烈震荡混匀磁珠,按照50μL/捕获文库的量取出M270磁珠,加入一个新的1.5mL离心管内。
3)将带有磁珠的离心管转移至磁力架上,待澄清,丢弃上清;
4)保持离心管在磁力架上,加入100μL1x磁珠洗脱缓冲液;
5)将离心管从磁力架上取下,震荡12s;
6)将离心管转移至磁力架上,待澄清,丢弃上清;
7)重复步骤4)~6),共洗涤2次;
8)取下带有磁珠的离心管,加入50μL 1x磁珠洗脱缓冲液,并转移至200μL PCR管中,将带有磁珠的PCR管转移至磁力架上,待澄清,丢弃上清,至此,该磁珠可以用来与杂交的芯片结合;
9)将杂交反应结束后的含有芯片的溶液加入到8)中的M270磁珠,震荡混匀;
10)放入预先设置好47℃的PCR仪中反应,PCR仪的热盖设置为57℃;
11)反应结束后,往含有20μL捕获芯片的PCR管中加入100μL47℃遇热的1x洗脱缓冲液I,用枪头吹打混匀,并将其转移至1.5mL离心管中;
12)将带有捕获芯片的离心管转移至磁力架上,待澄清,丢弃上清;
13)取下离心管,加入200μL 47℃预热的1xStringent洗脱缓冲液,用枪头吹打混匀,将离心管转移至恒温混匀仪上47℃反应5min;
14)重复步骤12)~13);共使用47℃预热的1xStringent洗脱缓冲液洗涤2次;
15)将离心管转移至磁力架上,待澄清,丢弃上清;
16)取下离心管,加入200μL常温1x洗脱缓冲液I,用枪头吹打混匀,再将离心管转移至磁力架上,待澄清,丢弃上清;
17)取下离心管,加入200μL常温1x洗脱缓冲液II,用枪头吹打混匀,再将离心管转移至磁力架上,待澄清,丢弃上清;
18)取下离心管,加入200μL常温1x洗脱缓冲液III,用枪头吹打混匀,再将离心管转移至磁力架上,待澄清,丢弃上清;
19)取下离心管,加入40μL PCR等级水,混匀,进入下一步反应或保存在-20℃待用。
5.4.3杂交文库扩增
1)上一步得到的M270磁珠芯片混悬液,取20μL捕获文库按照下表在200μL PCR管中进行PCR扩增体系配制;
充分混匀,短暂离心,放入PCR仪中,按照下边条件进行反应;
反应结束后,使用60μL AmpureXP beads纯化PCR扩增产物,并用27L Elutionbuffer从AmpureXP beads洗脱该富集产物得到纯化后的杂交文库,至此芯片捕获文库构建完成。
5.4.4文库质检
应用Agilent 2100Bioanalyzer和荧光定量PCR(QPCR)进行文库质量检测,2100检测峰图如图3所示,检测结果满足上机测序的要求。
5.4.5二代测序
选择Nextseq CN500仪器进行测序,测序过程严格按照上机测序的标准操作流程进行上机操作。
6、二代测序突变的检测
通过对母亲的外周血进行测序,提取出在外周中父母存在的突变位点。
6.1过滤数据的低质量。过滤一条序列中N的比例大于10%的序列,过滤一条序列中质量值小于15的比例大于50%序列。
6.2获取比对的序列。用bwa将测序下机的原始文件比对到hg19上,得到原始的bam文件。
6.3进行质量值调整和局部重比对,所用软件为GATK。
6.4提取调整之后的bam文件中父母为突变的那些位点在母亲外周血中的深度的显示情况。具体的结果见表3。
SNP InDel
外周血 183 66
表3.挑选出母亲外周血对应父母SNP和InDel的位点,在外周血中考虑深度的情况。
7、推断胎儿的单体型
7.1根据单体型中的SNP(InDel)进行位点的选择,在处理母亲单体型时选择的母亲杂合,父亲纯合的位点,处理父亲单体型时选择的父亲杂合,母亲纯合的位点,并判断这些位点是否位于携带致病突变的单体型上。
母亲杂合父亲纯合的位点见表4。
坐标 m0碱基 m1碱基
70925506 C T
70926361 G A
70928041 C T
70929186 C G
70930517 A G
70940203 A G
70942211 T C
70943781 C T
70944025 G A
70945979 C G
70947193 T C
70949316 T C
70952760 A T
表4.母亲杂合父亲纯合的位点,按照m0和m1的单体型给出。
母亲纯合父亲杂合的位点见表5。
表5.父亲杂合,母亲纯合的位点,其中f0和f1表示父亲的单体型,由于有足够的SNP,认为SNP比InDel准确,所以此样本结果仅展示了SNP的点共有19个可用的。
7.2计算胎儿的浓度,计算的方法包括但不限于用父母的纯合不同位点进行计算。得到胎儿浓度为8%。
7.3用隐马模型推断胎儿的单体型
7.3.1计算上述a中选择的母亲杂合的,父亲纯合的位点在母亲外周血中的质量值。
7.3.2计算每个点出现测序分布的概率。
7.3.3用隐马模型和viterbi算法求的最优的路径。具体可见图4。
如图4所示,第一列表示坐标,第二列表示m0的单体型,第三列表示m1的单体型,第四列表示外周血测序数据中出现的结果,第五列表示隐马模型计算得到的最优序列。
7.3.4计算父亲遗传了哪条单体型。父亲的f1在母亲中未显示,在外周血中有显示,因此判定遗传了f1。
7.3.5根据父母的单体型进行推断,遗传了m1和f1,而m1和f1均为携带突变的位点,所以推断出胎儿为SMA患者。
7.3.6提取三代数据中的reads进行验证,确定胎儿遗传了致病的突变。
上述实施例为本发明较佳的实施方式,但本发明的实施方式并不受上述实施例的限制,以上实施方式仅是用于解释权利要求书。然本发明的保护范围并不局限于说明书。任何熟悉本技术领域的技术人员在本发明披露的技术范围内,可轻易想到的变化或者替代,都包含在本发明的保护范围之内。

Claims (10)

1.一种确定胎儿脊髓性肌肉萎缩症基因单体型的方法,包括如下步骤:
基于血液样本构建三代测序文库,所述血液样本取自胎儿父亲和母亲的血样;
对所述三代测序文库进行第三代测序,获得三代测序结果;
根据三代测序结果确定父亲和母亲脊髓性肌肉萎缩症基因单体型;
基于检测样本构建二代测序文库,所述检测样本取自孕妇外周血血样;
对所述二代测序文库进行第二代测序,获得二代测序结果;
根据二代测序结果及所述父亲和母亲脊髓性肌肉萎缩症基因单体型确定胎儿脊髓性肌肉萎缩症基因单体型。
2.如权利要求1所述的确定胎儿脊髓性肌肉萎缩症基因单体型的方法,其特征在于,所述基于血液样本构建三代测序文库,进一步包括如下步骤:
从所述血液样本分离DNA片段,其中,所述DNA片段为胎儿父亲和母亲外周血白细胞的全基因组DNA片段;
对所述DNA片段进行第一处理,获得第一处理后的DNA片段;
利用探针对所述第一处理后的DNA片段进行筛选并构建三代测序文库,其中,所述探针特异性识别脊髓性肌肉萎缩症相关的靶基因;
任选地,所述利用探针对所述第一处理后的DNA片段进行筛选,还包括:将所述探针筛选后的DNA片段进行第二处理,获得第二处理后的DNA片段,所述第二处理后的DNA片段构成三代测序文库。
3.如权利要求1所述的确定胎儿脊髓性肌肉萎缩症基因单体型的方法,其特征在于,所述第三代测序为采用Pacbio sequal测序平台进行测序。
4.如权利要求1所述的确定胎儿脊髓性肌肉萎缩症基因单体型的方法,其特征在于,根据三代测序结果确定父亲和母亲脊髓性肌肉萎缩症基因单体型,进一步包括:
将获得的三代测序结果与参考人类基因组序列进行比对,得到经过比对的测序数据集合;
在所述经过比对的测序数据集合中筛选比对得分最高的序列,获得唯一比对序列集合;
计算所述唯一比对序列集合中每一条序列上的目标区域里边每个位点不同的碱基深度;
根据所述每一条序列上每个位点不同的碱基深度筛选出杂合的单核苷酸多态性位点或小片段插入缺失的位点;
根据所述筛选出的杂合的单核苷酸多态性位点或小片段插入缺失的位点,选择包含两个相邻杂合单核苷酸多态性或小片段插入缺失位点的序列片段;
对所述序列片段上两个相邻杂合单核苷酸多态性或小片段插入缺失的位点进行判断,得到两个相邻杂合位点的连接类型;
判断所有所述序列片段上两个相邻杂合单核苷酸多态性或小片段插入缺失位点的连接类型,也即总体的单体型;
对所述总体的单体型进行修正,得到父亲和母亲的单体型;
任选地,根据所述筛选出的杂合的单核苷酸多态性位点或小片段插入缺失的位点,选择包含两个相邻杂合单核苷酸多态性或小片段插入缺失位点的序列片段进一步包括:对每两个相邻杂合单核苷酸多态性位点或小片段插入缺失位点找出所对应的序列片段,选择包含所述两个相邻杂合位点排列类型的序列数最多的两个相邻杂合位点排列类型所对应的序列片段;
任选地,对所述序列片段上两个相邻杂合单核苷酸多态性或小片段插入缺失的位点进行判断,进一步包括:
将低质量值的序列片段进行分析和过滤;
计算过滤后的序列片段上所述两个相邻杂合突变位点出现的概率值,对每一种连接类型给出一个概率值,所述概率值包括贝叶斯概率或优势对数比值;
根据所述两个相邻杂合位点出现的概率值,选择相邻两个杂合位点概率最大的连接类型;
任选地,判断所有所述序列片段上两个相邻杂合单核苷酸多态性或小片段插入缺失位点的连接类型,进一步包括:
采用数学统计方法对所有所述序列片段上两个相邻杂合单核苷酸多态性或小片段插入缺失位点进行计算,得到所有序列片段上两个相邻杂合单核苷酸多态性或小片段插入缺失位点的连接类型,也即总体的单体型,所述数学统计方法包括图论或最优解方法;
任选地,对所述总体的单体型进行修正,进一步包括:
对所有所述序列片段上两个相邻杂合单核苷酸多态性或小片段插入缺失位点的连接顺序进行连接关系的强弱判断,所述判断的标准包括支持的序列数、计算的概率值或优势对数比值;
对所述两个相邻杂合位点的连接关系为弱联系的位点进行重新判断,选择覆盖所述相邻两个相邻杂合位点及其相邻多个位点的序列,判断所述序列的支持情况,根据所述支持情况对所述弱联系的位点进行修正,所述修正的标准包括跨越多个位点的序列数或支持附近单体型的位点数。
5.如权利要求1所述的确定胎儿脊髓性肌肉萎缩症基因单体型的方法,其特征在于,所述基于检测样本构建二代测序文库,进一步包括如下步骤:
从所述检测样本分离游离DNA片段,所述游离DNA片段为孕妇外周血游离核酸;
对所述游离DNA片段进行第三处理,获得第三处理后的DNA片段;
利用探针对所述第三处理后的DNA片段进行筛选并构建二代测序文库,其中,所述探针特异性识别脊髓性肌肉萎缩症相关的靶基因。
6.如权利要求1所述的确定胎儿脊髓性肌肉萎缩症基因单体型的方法,其特征在于,所述第二代测序为采用HiSeq或NovaSeq测序平台进行测序。
7.如权利要求1所述的确定胎儿脊髓性肌肉萎缩症基因单体型的方法,其特征在于,所述根据二代测序结果及所述父亲和母亲脊髓性肌肉萎缩症基因单体型确定胎儿脊髓性肌肉萎缩症基因单体型,进一步包括:
将所述二代测序结果进行过滤,得到过滤后的测序结果,所述过滤的条件包括序列中含有N的比例,以及含有低质量碱基数的比例,所述N为测序得到的碱基无法判断;
将过滤后的测序结果与参考人类基因组序列进行比对,获得经过比对的测序数据集合;
将经过比对的测序数据集合进行质量值修正和局部重比对,获得修正后的测序数据;
确定所述修正后测序数据里的含有单核苷酸多态性位点或小片段插入缺失的位点,筛选出对应所述父亲和母亲单倍体型的连接位点;
对筛选出的对应所述父亲和母亲单倍体型的连接位点进行选择,当判断遗传母亲哪一条单体型时,选择为母亲杂合,父亲纯合的位点;当判断遗传父亲哪一条单体型时,选择为父亲杂合,母亲纯合的位点;
根据所述父母纯合并且不同的位点计算胎儿浓度;
根据所述胎儿浓度用隐马模型判断胎儿脊髓性肌肉萎缩症基因单体型;
任选地,根据所述父母纯合并且不同的位点计算胎儿浓度,进一步包括:
根据所述父母纯合并且不同的位点,计算在孕妇外周血中母亲碱基的总深度为A,父亲碱基的总深度为B,则胎儿浓度为f=2B/(A+B);
任选地,根据所述胎儿浓度用隐马模型判断胎儿遗传单体型,进一步包括:
计算筛选出的母亲杂合,父亲纯合的位点在孕妇外周血中的质量值;
根据所述胎儿浓度,计算在孕妇外周血中每个筛选出的母亲杂合,父亲纯合位点的测序分布情况的概率;
根据所述质量值、测序分布情况的概率用隐马模型和viterbi算法计算出最优的遗传路径,判断胎儿遗传了母亲的哪一条单倍体型;
在孕妇外周血浆数据中筛选出三代数据得到的父亲杂合,母亲纯合的位点,通过多个位点比对到所述父亲的两条单倍体型上来确定遗传了父亲的哪一条单倍体型。
8.一种确定胎儿脊髓性肌肉萎缩症基因单体型的系统,所述系统包括:
构建三代测序文库设备,所述构建三代测序文库设备用于基于血液样本构建三代测序文库,所述血液样本取自胎儿父亲和母亲的血样;
三代测序设备,所述三代测序设备用于对所述三代测序文库进行第三代测序,获得三代测序结果;
确定父母脊髓性肌肉萎缩症基因单体型设备,所述确定父母脊髓性肌肉萎缩症基因单体型设备用于根据三代测序结果确定父亲和母亲脊髓性肌肉萎缩症基因单体型;
构建二代测序文库设备,所述构建二代测序文库设备用于基于检测样本构建二代测序文库,所述检测样本取自孕妇外周血血样;
二代测序设备,所述二代测序设备用于对所述二代测序文库进行第二代测序,获得二代测序结果;
确定胎儿脊髓性肌肉萎缩症基因单体型设备,所述确定胎儿脊髓性肌肉萎缩症基因单体型设备用于根据二代测序结果及所述父亲和母亲脊髓性肌肉萎缩症基因单体型确定胎儿脊髓性肌肉萎缩症基因单体型。
9.如权利要求8所述的确定胎儿脊髓性肌肉萎缩症基因单体型的系统,其特征在于,所述确定父母脊髓性肌肉萎缩症基因单体型设备还包括:
第一比对装置,所述第一比对装置用于将通过三代测序设备获得的三代测序结果与参考人类基因组序列进行比对,得到经过比对的测序数据集合;
筛选装置,所述筛选装置用于在所述经过比对的测序数据集合中筛选比对得分最高的序列,获得唯一比对序列集合;
计算碱基深度装置,所述计算碱基深度装置用于计算所述唯一比对序列集合中每一条序列上的目标区域里边每个位点不同的碱基深度;
筛选杂合位点装置,所述筛选杂合位点装置用于根据所述每一条序列上每个位点不同的碱基深度筛选出杂合的单核苷酸多态性位点或小片段插入缺失的位点;
选择相邻杂合位点装置,所述选择相邻杂合位点装置用于根据所述筛选出的杂合的单核苷酸多态性位点或小片段插入缺失的位点,选择包含两个相邻杂合单核苷酸多态性或小片段插入缺失位点的序列片段;
判断位点装置,所述判断位点装置用于对所述序列片段上两个相邻杂合单核苷酸多态性或小片段插入缺失的位点进行判断,得到两个相邻杂合位点的连接类型;
判断连接类型装置,所述判断连接类型装置用于判断所有所述序列片段上两个相邻杂合单核苷酸多态性或小片段插入缺失位点的连接类型,也即总体的单体型;
第一修正装置,所述修正装置用于对所述总体的单体型进行修正,得到父亲和母亲的单体型。
10.如权利要求8所述的确定胎儿脊髓性肌肉萎缩症基因单体型的系统,其特征在于,所述确定胎儿脊髓性肌肉萎缩症基因单体型设备还包括:
过滤装置,所述过滤装置用于将所述二代测序结果进行过滤,得到过滤后的测序结果,所述过滤的条件包括序列中含有N的比例,以及含有低质量碱基数的比例,所述N为测序得到的碱基无法判断;
第二比对装置,所述第二比对装置用于将经过比对的测序数据集合进行质量值修正和局部重比对,获得修正后的测序数据;
第二修正装置,所述第二修正装置用于将经过比对的测序数据集合进行质量值修正和局部重比对,获得修正后的测序数据;
筛选父母连接位点装置,所述筛选父母连接位点装置用于确定所述修正后测序数据里的含有单核苷酸多态性位点或小片段插入缺失的位点,筛选出对应所述父亲和母亲单倍体型的连接位点;
判断遗传父母单体型装置,所述判断遗传父母单体型装置用于对筛选出的对应所述父亲和母亲单倍体型的连接位点进行选择,当判断遗传母亲哪一条单体型时,选择为母亲杂合,父亲纯合的位点;当判断遗传父亲哪一条单体型时,选择为父亲杂合,母亲纯合的位点;
胎儿浓度计算装置,所述胎儿浓度计算装置用于根据所述父母纯合并且不同的位点计算胎儿浓度;
判断胎儿脊髓性肌肉萎缩症基因单体型装置,所述断胎儿脊髓性肌肉萎缩症基因单体型装置用于根据所述胎儿浓度用隐马模型判断胎儿脊髓性肌肉萎缩症基因单体型。
CN201810072663.2A 2018-01-25 2018-01-25 确定胎儿脊髓性肌肉萎缩症基因单体型的方法及系统 Active CN108070648B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201810072663.2A CN108070648B (zh) 2018-01-25 2018-01-25 确定胎儿脊髓性肌肉萎缩症基因单体型的方法及系统
PCT/CN2018/074940 WO2019144425A1 (zh) 2018-01-25 2018-02-01 确定胎儿脊髓性肌肉萎缩症基因单体型的方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810072663.2A CN108070648B (zh) 2018-01-25 2018-01-25 确定胎儿脊髓性肌肉萎缩症基因单体型的方法及系统

Publications (2)

Publication Number Publication Date
CN108070648A true CN108070648A (zh) 2018-05-25
CN108070648B CN108070648B (zh) 2022-07-15

Family

ID=62157039

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810072663.2A Active CN108070648B (zh) 2018-01-25 2018-01-25 确定胎儿脊髓性肌肉萎缩症基因单体型的方法及系统

Country Status (2)

Country Link
CN (1) CN108070648B (zh)
WO (1) WO2019144425A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020047694A1 (zh) * 2018-09-03 2020-03-12 深圳华大智造科技有限公司 确定新发突变在胚胎中的遗传状态的方法和装置

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114999570B (zh) * 2022-08-05 2023-06-23 苏州贝康医疗器械有限公司 一种不依赖于先证者的单体型构建方法

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104232778A (zh) * 2014-09-19 2014-12-24 天津华大基因科技有限公司 同时确定胎儿单体型及染色体非整倍性的方法及装置

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104232778A (zh) * 2014-09-19 2014-12-24 天津华大基因科技有限公司 同时确定胎儿单体型及染色体非整倍性的方法及装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020047694A1 (zh) * 2018-09-03 2020-03-12 深圳华大智造科技有限公司 确定新发突变在胚胎中的遗传状态的方法和装置
CN112639129A (zh) * 2018-09-03 2021-04-09 深圳华大智造科技有限公司 确定新发突变在胚胎中的遗传状态的方法和装置

Also Published As

Publication number Publication date
WO2019144425A1 (zh) 2019-08-01
CN108070648B (zh) 2022-07-15

Similar Documents

Publication Publication Date Title
CN108048541A (zh) 确定胎儿alpha地中海贫血基因单体型的方法及系统
CN112029861B (zh) 基于捕获测序技术的肿瘤突变负荷检测装置及方法
CN103874767B (zh) 对核酸样本中预定区域进行基因分型的方法和系统
CN108315404A (zh) 确定胎儿beta地中海贫血基因单体型的方法及系统
CN106544407B (zh) 确定受体cfDNA样本中供体来源cfDNA比例的方法
CN104221022B (zh) 一种拷贝数变异检测方法和系统
CA2868836C (en) Rapid aneuploidy detection
CN105779280B (zh) 由母本生物样品进行胎儿基因组的分析
CN109767810B (zh) 高通量测序数据分析方法及装置
CN104053789B (zh) 确定胎儿基因组中预定区域碱基信息的方法、系统和计算机可读介质
CN107475375A (zh) 一种用于与微卫星不稳定性相关微卫星位点进行杂交的dna探针库、检测方法和试剂盒
CN102409047B (zh) 一种构建杂交测序文库的方法
CN109817279B (zh) 肿瘤突变负荷的检测方法、装置、存储介质及处理器
CN104293940B (zh) 构建测序文库的方法及其应用
CN107083425A (zh) 利用基因组测序诊断胎儿染色体非整倍性
CN105392894A (zh) 确定样本基因组中是否存在拷贝数变异的方法、系统和计算机可读介质
CN105040111B (zh) 系统性红斑狼疮图谱模型的构建方法
CN105132407B (zh) 一种脱落细胞dna低频突变富集测序方法
CN106399535A (zh) 一种高通量测序检测无创亲子鉴定的方法
CN107475403A (zh) 从外周血游离dna中检测循环肿瘤dna的方法、试剂盒及其测序结果的分析方法
CN110656157B (zh) 用于高通量测序样本溯源的质控品及其设计和使用方法
CN108229103A (zh) 循环肿瘤dna重复序列的处理方法及装置
CN106951731A (zh) 一种大片段插入或缺失的预测方法及系统
CN112126677B (zh) 耳聋单倍型基因突变无创检测方法
CN106939344A (zh) 用于二代测序的接头

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB03 Change of inventor or designer information
CB03 Change of inventor or designer information

Inventor after: Jiang Biman

Inventor after: Zeng Xiaojing

Inventor after: Li Sheng

Inventor after: Du Bole

Inventor after: Zhang Chunsheng

Inventor after: Guo Yulai

Inventor after: Wang Yang

Inventor after: Zhu Wentao

Inventor before: Jiang Biman

Inventor before: Zeng Xiaojing

Inventor before: Du Bole

Inventor before: Zhang Chunsheng

Inventor before: Guo Yulai

Inventor before: Wang Yang

Inventor before: Zhu Wentao

Inventor before: Li Sheng

GR01 Patent grant
GR01 Patent grant