CN105303067B - 用以检测染色体的非整倍性的方法及其非瞬时机器可读介质 - Google Patents

用以检测染色体的非整倍性的方法及其非瞬时机器可读介质 Download PDF

Info

Publication number
CN105303067B
CN105303067B CN201510287937.6A CN201510287937A CN105303067B CN 105303067 B CN105303067 B CN 105303067B CN 201510287937 A CN201510287937 A CN 201510287937A CN 105303067 B CN105303067 B CN 105303067B
Authority
CN
China
Prior art keywords
sequence
biological
target
subject sample
biological specimen
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201510287937.6A
Other languages
English (en)
Other versions
CN105303067A (zh
Inventor
詹佳翰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yourgene Bioscience Co Ltd
Original Assignee
Yourgene Bioscience Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yourgene Bioscience Co Ltd filed Critical Yourgene Bioscience Co Ltd
Publication of CN105303067A publication Critical patent/CN105303067A/zh
Application granted granted Critical
Publication of CN105303067B publication Critical patent/CN105303067B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6827Hybridisation assays for detection of mutation or polymorphism
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/10Ploidy or copy number detection
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/20Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/112Disease subtyping, staging or classification

Abstract

本发明涉及一种用以检测关于目标核酸区域的染色体的非整倍性的方法,其包含下列步骤。取得参照数据库。根据参照数据库确定至少一正规化因子。根据该参照数据库确定截止值。通过测序平台测序受试生物样本,以得到受试生物样本的目标序列的数量。受试生物样本的目标序列源自于目标核酸区域。以已正规化因子,正规化受试生物样本的目标序列的数量,然后与截止值比对。根据比对,判定胎儿中关于目标核酸区域的染色体的非整倍性是否呈现。

Description

用以检测染色体的非整倍性的方法及其非瞬时机器可读介质
技术领域
本发明涉及生物信息。
背景技术
染色体的非整倍性是指染色体数目并非特定物种的染色体数量特征的整倍数。额外或缺失的染色体是导致遗传性疾病的主要原因,其中遗传性疾病包含人类先天缺陷。羊膜穿刺术(也称作羊水测试(amniotic fluid test;AFT))是一种用于产前诊断染色体异常与婴儿感染的医疗程序。检测到的最常见的异常为唐氏症(三染色体21症)、艾德华氏症(三染色体18症)、巴陶氏症(三染色体13症)、透纳氏症(单染色体X症)。然而,羊膜穿刺术有多种风险,包含流产、针伤、羊水溢漏、Rh因子激敏反应、感染以及感染传播。
发明内容
根据本发明的部分实施方式,一种用以检测目标核酸区域的染色体的非整倍性的方法,其包含下列步骤。取得参照数据库。参照数据库通过测序平台测序多个参照生物样本而建立。根据参照数据库确定至少一正规化因子。根据该参照数据库确定截止值。通过测序平台测序受试生物样本,以得到受试生物样本的目标序列的数量。受试生物样本从孕妇上取得,且受试生物样本具有孕妇及其胎儿的核酸分子。受试生物样本的目标序列源自于目标核酸区域。以正规化因子正规化受试生物样本的目标序列的数量。比对受试生物样本的目标序列的已正规化的数量与截止值。根据比对,判定胎儿中关于目标核酸区域的染色体的非整倍性是否呈现。
根据本发明的部分实施方式,一种非瞬时机器可读介质储存程序,当该程序由至少一处理单元执行时,该程序检测关于目标核酸区域的染色体的非整倍性。该程序包含多个指令组用于下列步骤。取得参照数据库。参照数据库通过测序平台测序多个参照生物样本而建立。根据参照数据库确定至少一正规化因子。根据该参照数据库确定截止值。通过测序平台测序受试生物样本,以得到受试生物样本的目标序列的数量。受试生物样本从孕妇上取得,且受试生物样本具有孕妇及其胎儿的核酸分子。受试生物样本的目标序列源自于目标核酸区域。以正规化因子正规化受试生物样本的目标序列的数量。比对受试生物样本的目标序列的已正规化的数量与截止值。根据比对,判定胎儿中关于目标核酸区域的染色体的非整倍性是否呈现。
附图说明
图1为根据本发明的部分实施方式的用以检测染色体的非整倍性的方法的流程图。
图2A与图2B展示根据本发明的多个工作实施例以相同测序平台测序的多个参照生物样本的染色体序列的图。
图3为图1的步骤120的流程图。
图4为图3的步骤123的流程图。
图5展示根据本发明一实施例的参照生物样本的第21对染色体的总体频率分布。
图6展示参照生物样本的第22对染色体总体频率与参照生物样本的第21对染色体的43-45Mb的局部频率之间的相关性。
图7展示参照生物样本的第22对染色体总体频率与参照生物样本的第21对染色体的43-45Mb的总体频率之间的相关性。
图8展示参照生物样本的第22对染色体总体频率与参照生物样本的已正规化的第21对染色体的43-45Mb的总体频率之间的相关性。
图9为图1的步骤130的流程图。
图10展示根据图5-8的工作实施例的参照标准分数分布。
图11为图1的步骤150的流程图。
图12展示根据图5-8与图10的工作实施例的测试与参照标准分数分布。
具体实施方式
于以下详细叙述中,为了说明起见,阐述了许多特定的细节以完整地了解在此揭露的实施方式。然而,明显地,仍有一或多个实施方式可在没有这些特定细节下执行。在其它例子中,仅以示意方式绘示普遍为人所知的结构与装置,以简化附图。
于此,所使用的术语「生物样本」指从主体(例如人类,如孕妇)取出且包含一个或多个有关核酸分子的任何生物样本。
术语「核酸」指单股或双股螺旋式的脱氧核糖核酸(Deoxyribonucleic Acid;DNA)、核糖核酸(Ribonucleic Acid;RNA)或其相关聚合物。除非特别限定,该术语涵盖含有已知天然核苷酸类似物,其具有相似于参照核酸的结合特性,且以相似于天然产生的核苷酸的方式新陈代谢。除非额外叙述,特定的核酸序列也隐含地涵盖其保守修饰后的变形(例如简并密码子替换)、对偶基因、同源基因、单核苷酸多态型(Single NucleotidePolymorphisms;SNPs)以及互补序列和已经明确提到的序列。于此,术语「核酸」可与基因、由基因或基因座编码的互补脱氧核醣核酸(cDNA)、信使核糖核酸、小型非编码核醣核酸、小型核醣核酸(Micro RNA;mRNA)、Piwi-interacting RNA以及小发夹核醣核酸(shorthairpin RNA;shRNA)交换。
于此,所使用的术语「根据」表示「至少部分根据」,且指使用一数值或结果来判定另一数值或结果,例如方法中发生的输入与输出的关系。
于此,所使用的术语「染色体的非整倍性」表示染色体的定量与二倍体基因体的数量的差异。此差异可以是增加或减少。此「染色体的非整倍性」可包含一条染色体的全部或局部。
于此,所使用的术语「截止值」表示用以评断生物样本的分类的二个或更多个状态(例如异常与正常)的数值。举例而言,如果参数大于此截止值,则为此定量数据的第一分类(例如异常);如果参数小于此截止值,则为此定量数据的不同分类(例如正常)。
图1为根据本发明的部分实施方式的用以检测染色体的非整倍性的方法100的流程图。如同图1所示,用以检测关于目标核酸区域的染色体的非整倍性的方法100包含下列步骤。于步骤110中,取得参照数据库。通过测序平台测序多个参照生物样本,而建立参照数据库。参照生物样本可以是血浆、尿液、血清或其它合适的样本。参照生物样本可分别从多个孕妇上取得。因此,每一参照生物样本包含孕妇及其胎儿的核酸分子。举例而言,核酸分子可以是染色体片段。举例而言,测序平台可以是新一代测序平台,例如Roche公司的454平台、Illumina公司的HiSeq、NextSeg以及MiSeq System、Life Technologies公司的IonTorrent PGM以及Proton System或Oxford Nanopore公司的Minion。
图2A与图2B展示根据本发明多个工作实施例以相同测序平台测序的多个参照生物样本的染色体序列的图。在图2A与图2B中,X轴为染色体数,Y轴为每个染色体序列的数量与其平均的差值。如同图2A与图2B所示,每个染色体序列的数量有一个起伏变化。此起伏变化可能由样本的特性、系统的特性或环境因素而造成。因此,由于此起伏变化的关系,不能仅以每个染色体序列的数量,而判定胎儿的染色体的非整倍性是否呈现。
再回到图1。在步骤120中,根据参照数据库,确定至少一正规化因子。如同图2A与图2B所示,染色体序列的数量彼此互相关联。换句话说,某一染色体序列的数量增加会降低另一染色体序列的数量。由于图2A与图2B的参照生物样本大致上以相同方式取得,且以相同的测序平台测序,因此,不同的参照生物样本的起伏变化大致相同。如此一来,可以使用关联染色体而正规化有关染色体,以消除此起伏变化。
由于女胎儿不具有Y染色体,相较于男胎儿样本,从女胎儿的生物样本会具有不同的染色体序列谱。因此,步骤110中的参照数据库可以是性别区分的。换句话说,如果受试生物样本是来自于男胎儿,则会采用男胎儿参照数据库。如果受试生物样本是来自于女胎儿,则会采用女胎儿参照数据库。
图3为图1的步骤120的流程图。步骤120包含下列步骤。在步骤121中,确定每一参照生物样品的目标序列的数量。每一参照生物样本的目标序列源自于目标核酸区域。在步骤122中,确定每一参照生物样本的关联序列的数量。参照生物样品的关联序列的数量与参照生物样品的目标序列的数量有关。举例而言,参照生物样品的关联序列的数量与参照生物样品的目标序列的数量呈线性相关。参照生物样品的关联序列的数量与参照生物样品的目标序列的数量可具有大约0.7至大约0.99的关联系数。每一参照生物样品的关联序列源自于关联核酸区域。在步骤123中,根据参照生物样本的目标序列的数量以及参照生物样本的关联序列的数量,确定正规化因子。
图4为图3的步骤123的流程图。详细而言,步骤123包含以下步骤。在步骤124中,确定参照目标局部频率。每一参照目标局部频率为每一参照生物样本的目标序列的数量除以所述的每一参照生物样本的局部序列的数量。每一参照生物样本的局部序列源自于目标核酸区域自身的染色体。在步骤125中,确定参照关联总体频率。每一参照关联总体频率为每一参照生物样本的关联序列的数量除以所述的每一参照生物样本的全部序列的数量。于步骤126中,确定参照目标局部频率与参照关联总体频率之间的第一相关性。于步骤127中,确定参照目标总体频率。每一参照目标总体频率为每一参照生物样本的目标序列的数量除以所述的每一参照生物样本的全部序列的数量。于步骤128a中,以参照关联总体频率以及第一相关性,分别正规化参照目标局部频率。于步骤128b中,以已经正规化的参照目标局部频率,分别正规化参照目标总体频率。于步骤129中,确定已正规化的参照目标总体频率以及参照关联总体频率之间的第二相关性。
下列叙述将会采用男性三染色体21症的检测作为实施例,以说明如何执行步骤120。图5展示根据本发明一实施例的参照生物样本的第21对染色体的总体频率分布。在图5中,Y轴为第21对染色体的总体频率。第21对染色体的总体频率,即r(21)/r(all),是每个参照生物样本的源自于第21对染色体的序列的数量,即r(21),除以所述的参照生物样本的全部序列的数量,即r(all)。如同图5所示,部分非正常样品与正常样品混合,而无法确定截止值。于本发明的的实施例中,参照生物样本的数量为1004,且参照生物样本为从孕妇上取得的血浆。使用的测序平台为Illumina公司的HiSeq。
于本发明的实施方式中,第21对染色体的43-45Mb区被选为目标核酸区域。在观察过后,发现参照生物样本源自于第22对染色体的序列的数量以及参照生物样本源自于第21对染色体的43-45Mb区的数量具有大约0.94的相关系数。因此,选择第22对染色体作为关联核酸区域。根据步骤124,确定参照生物样本的第21对染色体的43-45Mb局部频率。每一参照生物样本的第21对染色体的43-45Mb区的局部频率是所述每一参照生物样本源自第21对染色体的43-45Mb区的序列的数量除以所述每一参照生物样本源自第21对染色体的序列的数量。根据步骤125,确定参照生物样本的第22对染色体总体频率,每一参照生物样本的第22对染色体总体频率是所述的每一参照生物样本源自于第22对染色体的序列的数量除以所述的每一参照生物样本的全部序列的数量。
图6展示参照生物样本的第22对染色体总体频率与参照生物样本的第21对染色体的43-45Mb的局部频率之间的相关性。在图6中,X轴是第22对染色体总体频率,Y轴是第21对染色体的43-45Mb的局部频率。可观察到,正常的参照生物样本的第22对染色体总体频率与正常的参照生物样本的第21对染色体的43-45Mb的局部频率有线性关系。正常的参照生物样本的第22对染色体总体频率与正常的参照生物样本的第21对染色体的43-45Mb的局部频率具有0.9475的决定系数以及回归线(Y=8.1892X-0.0341)。此回归线(Y=8.1892X-0.0341)可以视为步骤126中的第一相关性。
根据步骤127,确定参照生物样本的第21对染色体的43-45Mb的总体频率。每一参照生物样本的第21对染色体的43-45Mb的总体频率为所述每一参照生物样本源自于第21对染色体的43-45Mb区域的序列的数量除以所述每一参照生物样本的全部序列的数量。
图7展示参照生物样本的第22对染色体总体频率与参照生物样本的第21对染色体的43-45Mb的总体频率之间的相关性。在图7中,X轴是第22对染色体总体频率,且Y轴是第21对染色体的43-45Mb的总体频率。可观察到,在正常的参照生物样本的第22对染色体总体频率与正常的参照生物样本的第21对染色体的43-45Mb的总体频率之间有线性关系。正常的参照生物样本的第22对染色体总体频率与正常的参照生物样本的第21对染色体的43-45Mb的总体频率具有0.9374的决定系数以及回归线(Y=0.0851X-0.0003)。
根据步骤128a,以参照生物样本的第22对染色体总体频率以及第一相关性,分别正规化参照生物样本的第21对染色体的43-45Mb的局部频率。根据步骤128b,以已经正规化的参照生物样本的第21对染色体的43-45Mb的局部频率,分别正规化参照生物样本的第21对染色体的43-45Mb的总体频率。详细而言,以下列公式I计算每一参照生物样本的已正规化的第21对染色体的43-45Mb总体频率:
y1=x3/(x2/(8.1892*x1-0.0341)).....................公式I
其中y1为每一参照生物样本的已正规化的第21对染色体的43-45Mb总体频率,x1为所述每一参照生物样本的第22对染色体总体频率,x2为所述每一参照生物样本的第21对染色体的43-45Mb局部频率,x3为所述每一参照生物样本的第21对染色体的43-45Mb总体频率。
图8展示参照生物样本的第22对染色体总体频率与参照生物样本的已正规化的第21对染色体的43-45Mb总体频率之间的相关性。在图8中,X轴为第22对染色体总体频率,Y轴为已正规化的第21对染色体的43-45Mb的总体频率。可观察到,正常的参照生物样本的第22对染色体总体频率以及正常的参照生物样本的已正规化的第21对染色体的43-45Mb的总体频率有线性关系。正常的参照生物样本的第22对染色体总体频率以及正常的参照生物样本的已正规化的第21对染色体的43-45Mb总体频率具有0.9971的决定系数以及回归线(Y=0.0852X-0.0003)。此回归线(Y=0.0852X-0.0003)可以视为步骤129中的第二相关性。
参照图1。在步骤130中,根据参照数据库,确定截止值。图9为图1的步骤130的流程图。在步骤131中,根据参照关联总体频率以及第二相关性,而估计参照估计值。在步骤132中,分别确定已正规化的参照目标总体频率与参照估计值之间的参照差值。在步骤133中,根据参照数据库,分别标准化参照差值为参照标准分数。在步骤134中,根据参照标准分数,确定截止值。
以下叙述将继续与图5至图8中所示的男性三染色体21症的检测有关,以说明如何执行步骤130。于本实施例中,根据步骤131,根据参照生物样本的第22对染色体总体频率以及第二相关性,分别估计参照估计值。根据步骤132,确定参照差值。每一参照差值为每一参照生物样本的已正规化的第21对染色体的43-45Mb的总体频率与其对应的参照估计值之差。详细而言,由下列公式II计算每一参照差值:
y2=y1-(0.0852*x1-0.0003)...........................公式II
其中y1为每一参照生物样本的已正规化第21对染色体的43-45Mb总体比率,y2为参照差值,以及x1为所述每一参照生物样品的第22对染色体总体频率。
根据步骤133,分别标准化参照差值为参照标准分数。详细而言,以下列公式III计算每一参照标准分数。
Z=y2-0.000028/0.0000094..........................公式III
其中Z为参照标准分数,y2为参照差值,0.000028为平均的参照差值,且0.0000094为参照差值的标准差。
图10展示根据图5-8的工作实施例的参照标准分数分布。在图10中,Y轴为标准分数。如同图10所示,异常的样本与正常的样本分隔开来,因此可以确定截止值。于本实施例中,此截止值确定为1.75。
参照图1。在步骤140中,通过测序平台测序受试生物样本,以获得受试生物样本的目标序列的数量。受试生物样本可以是血浆、尿液、血清或其它合适的样本。受试生物样本从孕妇上获得,且具有孕妇及其胎儿的核酸分子。这些核酸分子可以是,举例而言,染色体片段。受试生物样本的目标序列源自于目标核酸区域。
在步骤150中,以正规化因子,正规化受试生物样本的目标序列的数量。图11为图1的步骤150的流程图。在步骤151中,确定测试目标总体频率。此测试目标总体频率是受试生物样本的目标序列的数量除以受试生物样本的全部序列的数量。在步骤152中,确定测试目标局部频率。测试目标局部频率是受试生物样本的目标序列的数量除以受试生物样本的局部序列的数量。受试生物样本的局部序列源自于目标核酸区域自身的染色体。在步骤153中,确定测试关联总体频率。此测试关联总体频率为受试生物样本的关联序列的数量除以该受试生物样本的全部序列的数量。受试生物样本的关联序列源自于关联核酸区域。在步骤154a中,以测试关联总体频率与第一相关性,正规化测试目标局部频率。在步骤154b中,以已经正规化的测试目标局部频率,正规化测试目标总体频率。
在步骤155中,根据测试关联总体频率以及第二相关性,估计测试估计值。在步骤156中,确定已正规化的测试目标总体频率以及测试估计值之间的测试差值。在步骤157中,根据参照数据库,标准化此测试差值为测试标准分数。
参照图1。步骤160中,将受试生物样本的目标序列的已正规化数值与截止值进行比对。于步骤170中,根据此比对,判定胎儿中关于目标核酸区域的染色体的非整倍性是否呈现。详细而言,在步骤160中,比对由步骤157所计算得到的测试标准分数与由步骤130所确定的截止值。然后,在步骤170中,如果由步骤157所计算得到的测试标准分数大于由步骤130所确定的截止值,则判定胎儿中关于目标核酸区域的染色体的非整倍性为呈现,即异常。如果由步骤157所计算得到的测试标准分数小于由步骤130所确定的截止值,则判定胎儿中关于目标核酸区域的染色体的非整倍性为未呈现,即正常。
以下叙述将继续与图5至图8以及图10中所示的男性三染色体21症的检测有关,以说明如何执行步骤140至步骤170。根据步骤140,从孕妇上取得受试生物样本(血浆)。然后,以Illumina HiSeq测序受试生物样本。
根据步骤151,确定受试生物样本的第21对染色体的43-45Mb总体频率。受试生物样本的第21对染色体的43-45Mb总体频率为受试生物样本的源自于第21对染色体的43-45Mb区的序列的数量除以受试生物样本的全部序列的数量。根据步骤152,确定受试生物样本的第21对染色体的43-45Mb局部频率。受试生物样本的第21对染色体的43-45Mb局部频率为受试生物样本的源自于第21对染色体的43-45Mb区的序列的数量除以受试生物样本的源自于第21对染色体的序列的数量。根据步骤153,确定受试生物样本的第22对染色体总体频率。受试生物样本的第22对染色体总体频率是受试生物样本的源自于第22对染色体的序列的数量除以受试生物样本的全部序列的数量。
根据步骤154a,以受试生物样本的第22对染色体总体频率与第一相关性,正规化受试生物样本的第21对染色体的43-45Mb局部频率。在步骤154b中,以受试生物样本的已正规化的第21对染色体的43-45Mb局部频率,正规化受试生物样本的第21对染色体的43-45Mb总体频率。详细而言,以公式IV计算受试生物样本的已正规化的第21对染色体的43-45Mb区总体频率:
y1=x3/(x2/(8.1892*x1-0.0341))...................公式IV
其中y1是受试生物样本的已正规化的第21对染色体的43-45Mb总体频率,x1是受试生物样本的第22对染色体的总体频率,x2是受试生物样本的第21对染色体的43-45Mb局部频率,且x3是受试生物样本的第21对染色体的43-45Mb总体频率。
根据步骤155,根据参照生物样本的第22对染色体总体频率与第二相关性,估计测试估计值。根据步骤156,确定已正规化的受试生物样本的第21对染色体的43-45Mb总体频率与测试估计值之间的测试差值。详细而言,通过公式V而计算测试差值:
y2=y1-(0.0852*x1-0.0003)...........................公式V
其中y1是已正规化的受试生物样本的第21对染色体的43-45Mb总体频率,y2是测试差值,x1是受试生物样本的第22对染色体总体频率。
根据步骤157,根据参照数据库,标准化测试差值为测试标准分数。详细而言,以下列公式VI计算测试标准分数:
Z=y2-0.000028/0.0000094..........................公式VI
其中Z为测试标准分数,y2为测试差值,0.000028为平均参照差值,且0.0000094为参照差值的标准差。
图12展示根据图5-8与图10的工作实施例的测试与参照标准分数分布。在图12中,Y轴为标准分数。如同图12所示,测试标准分数为-0.16,小于截止值,例如1.75。因此判定受试生物样本为正常。换句话说,判定胎儿中并未出现三染色体21症。
于部分实施方式中,以储存于非瞬时机器可读介质中的程序实行上述的方法。当此程序由至少一个程序单元执行时,执行上述的方法。此非瞬时机器可读介质可包含,但不限于,软性磁盘、光盘、密集音碟(Compact Discs;CDs)、数位影碟(Digital Video Discs;DVDs)、磁光盘、只读存储器(Read-Only Memories;ROMs)、随机存取内存(Random-AccessMemories;RAMs)、可擦除可程序只读存储器(Erasable Programmable Read OnlyMemories;EPROMs)、电子可擦除可程序化只读存储器(Electrically ErasableProgrammable Read-Only Memories;EEPROMs)、磁卡或光卡、或适用于储存指令的任何型态介质/机器的可读式装置。
除非特别说明,否则说明书所揭露的全部特征(包含任何搭配的权利要求、摘要以及附图)可以置换为其它提供相同、相等或相似功效的特征。因此,除非特别说明,否则每个揭露的特征仅为常见系列的相等或相似特征的实施例。

Claims (16)

1.一种用以检测关于目标核酸区域的染色体的非整倍性的方法,所述方法包含:
取得一参照数据库,其中所述参照数据库通过测序平台测序多个参照生物样本而建立;
根据所述参照数据库确定至少一正规化因子,所述确定所述正规化因子包含:
确定每一所述参照生物样本的多个目标序列的数量,其中每一所述参照生物样本的所述目标序列源自于所述目标核酸区域;
确定每一所述参照生物样本的多个关联序列的数量,其中所述参照生物样本的所述关联序列的所述数量与所述参照生物样本的所述目标序列的所述数量呈线性相关,且每一所述参照生物样本的所述关联序列源自于关联核酸区域;以及
根据所述参照生物样本的所述目标序列的所述数量以及所述参照生物样本的所述关联序列的所述数量,确定所述正规化因子;
根据所述参照数据库确定一截止值;
通过所述测序平台测序受试生物样本,以得到所述受试生物样本的多个目标序列的数量,其中所述受试生物样本从孕妇上取得,且所述受试生物样本具有所述孕妇及所述孕妇的胎儿的核酸分子,且所述受试生物样本的所述目标序列源自于所述目标核酸区域;
以所述正规化因子正规化所述受试生物样本的所述目标序列的所述数量;
比对所述受试生物样本的所述目标序列的所述已正规化的数量与所述截止值;以及
根据所述比对,判定所述胎儿中关于所述目标核酸区域的所述染色体的非整倍性是否呈现。
2.根据权利要求1所述的方法,其中所述参照数据库是性别区分的。
3.根据权利要求1所述的方法,其中所述参照生物样本的所述关联序列的所述数量与所述参照生物样本的所述目标序列的所述数量具有为0.7至0.99的相关系数。
4.根据权利要求1所述的方法,其中所述根据所述参照生物样本的所述目标序列的所述数量以及所述参照生物样本的所述关联序列的所述数量,确定所述正规化因子,包含:
确定多个参照目标局部频率,其中每一所述参照目标局部频率为每一所述参照生物样本的所述目标序列的所述数量除以所述每一所述参照生物样本的多个局部序列的数量,且每一所述参照生物样本的所述局部序列源自于所述目标核酸区域自身的染色体;
确定多个参照关联总体频率,其中每一所述参照关联总体频率为每一所述参照生物样本的所述关联序列的所述数量除以所述每一所述参照生物样本的全部序列的数量;以及
确定所述参照目标局部频率与所述参照关联总体频率之间的第一相关性。
5.根据权利要求4所述的方法,其中所述正规化所述受试生物样本的所述目标序列的所述数量包含:
确定测试目标总体频率,其中所述测试目标总体频率为所述受试生物样本的所述目标序列的所述数量除以所述受试生物样本的全部序列的数量;
确定测试目标局部频率,其中所述测试目标局部频率为所述受试生物样本的所述目标序列的所述数量除以所述受试生物样本的多个局部序列的数量,且所述受试生物样本的所述局部序列源自于所述目标核酸区域自身的染色体;
确定测试关联总体频率,其中所述测试关联总体频率为所述受试生物样本的关联序列的数量除以所述受试生物样本的所述全部序列的所述数量,且所述受试生物样本的所述关联序列源自于所述关联核酸区域;
以所述测试关联总体频率以及所述第一相关性,正规化所述测试目标局部频率;以及
以所述已正规化的测试目标局部频率,正规化所述测试目标总体频率。
6.根据权利要求5所述的方法,其中所述根据所述参照生物样本的所述目标序列的所述数量以及所述参照生物样本的所述关联序列的所述数量,确定所述正规化因子,包含:
确定参照目标总体频率,其中每一所述参照目标总体频率为每一所述参照生物样本的所述目标序列的所述数量除以所述每一所述参照生物样本的所述全部序列的所述数量;
以所述参照关联总体频率以及所述第一相关性,分别正规化所述参照目标局部频率;
以所述已正规化的参照目标局部频率,分别正规化所述参照目标总体频率;以及
确定所述已正规化的参照目标总体频率以及所述参照关联总体频率之间的第二相关性。
7.根据权利要求6所述的方法,其中所述确定所述截止值包含:
根据所述参照关联总体频率以及所述第二相关性,分别估计多个参照估计值;
分别确定所述已正规化的参照目标总体频率与所述参照估计值之间的参照差值;
根据所述参照数据库,分别标准化所述参照差值为多个参照标准分数;以及
根据所述参照标准分数,确定所述截止值。
8.根据权利要求7所述的方法,其中所述正规化所述受试生物样本的所述目标序列的所述数量包含:
根据所述测试关联总体频率以及所述第二相关性,估计一测试估计值;
确定所述已正规化的测试目标总体频率以及所述测试估计值之间的测试差值;以及
根据所述参照数据库,标准化所述测试差值为测试标准分数;
其中所述比对包含:
比对所述测试标准分数与所述截止值。
9.一种非瞬时机器可读介质,储存一程序,其中当所述程序由至少一处理单元执行时,所述程序检测关于目标核酸区域的染色体的非整倍性,所述程序包含多个指令组,用以:
取得一参照数据库,其中所述参照数据库通过测序平台测序多个参照生物样本而建立;
根据所述参照数据库确定至少一正规化因子,所述确定所述正规化因子包含:
确定每一所述参照生物样本的多个目标序列的数量,其中每一所述参照生物样本的所述目标序列源自于所述目标核酸区域;
确定每一所述参照生物样本的多个关联序列的数量,其中所述参照生物样本的所述关联序列的所述数量与所述参照生物样本的所述目标序列的所述数量呈线性相关,且每一所述参照生物样本的所述关联序列源自于关联核酸区域;以及
根据所述参照生物样本的所述目标序列的所述数量以及所述参照生物样本的所述关联序列的所述数量,确定所述正规化因子;
根据所述参照数据库确定截止值;
通过所述测序平台测序受试生物样本,以得到所述受试生物样本的多个目标序列的数量,其中所述受试生物样本从孕妇上取得,且所述受试生物样本具有所述孕妇及所述孕妇的胎儿的核酸分子,且所述受试生物样本的所述目标序列源自于所述目标核酸区域;
以所述正规化因子正规化所述受试生物样本的所述目标序列的所述数量;
比对所述受试生物样本的所述目标序列的所述已正规化的数量与所述截止值;以及
根据所述比对,判定所述胎儿中关于所述目标核酸区域的所述染色体的非整倍性是否呈现。
10.根据权利要求9所述的非瞬时机器可读介质,其中所述参照数据库取决于性别。
11.根据权利要求9所述的非瞬时机器可读介质,其中所述参照生物样本的所述关联序列的所述数量与所述参照生物样本的所述目标序列的所述数量具有为0.7至0.99的相关系数。
12.根据权利要求9所述的非瞬时机器可读介质,其中用以根据所述参照生物样本的所述目标序列的所述数量以及所述参照生物样本的所述关联序列的所述数量以确定所述正规化因子的所述指令组,包含多组指令,用以:
确定多个参照目标局部频率,其中每一所述参照目标局部频率为每一所述参照生物样本的所述目标序列的所述数量除以所述每一所述参照生物样本的多个局部序列的数量,且每一所述参照生物样本的所述局部序列源自于所述目标核酸区域自身的染色体;
确定多个参照关联总体频率,其中每一所述参照关联总体频率为每一所述参照生物样本的所述关联序列的所述数量除以所述每一所述参照生物样本的全部序列的数量;以及
确定所述参照目标局部频率与所述参照关联总体频率之间的第一相关性。
13.根据权利要求12所述的非瞬时机器可读介质,其中用以正规化所述受试生物样本的所述目标序列的所述数量的所述指令组,包含多组指令,用以:
确定测试目标总体频率,其中所述测试目标总体频率为所述受试生物样本的所述目标序列的所述数量除以所述受试生物样本的全部序列的数量;
确定测试目标局部频率,其中所述测试目标局部频率为所述受试生物样本的所述目标序列的所述数量除以所述受试生物样本的多个局部序列的数量,且所述受试生物样本的所述局部序列源自于所述目标核酸区域自身的染色体;
确定测试关联总体频率,其中所述测试关联总体频率为所述受试生物样本的关联序列的数量除以所述受试生物样本的所述全部序列的所述数量,且所述受试生物样本的所述关联序列源自于所述关联核酸区域;
以所述测试关联总体频率以及所述第一相关性,正规化所述测试目标局部频率;以及
以所述已正规化的测试目标局部频率,正规化所述测试目标总体频率。
14.根据权利要求13所述的非瞬时机器可读介质,其中用以根据所述参照生物样本的所述目标序列的所述数量以及所述参照生物样本的所述关联序列的所述数量确定所述正规化因子的所述指令组,包含多组指令,用以:
确定参照目标总体频率,其中每一所述参照目标总体频率为每一所述参照生物样本的所述目标序列的所述数量除以所述每一所述参照生物样本的所述全部序列的所述数量;
以所述参照关联总体频率以及所述第一相关性,分别正规化所述参照目标局部频率;
以所述已正规化的参照目标局部频率,分别正规化所述参照目标总体频率;以及
确定所述已正规化的参照目标总体频率以及所述参照关联总体频率之间的第二相关性。
15.根据权利要求14所述的非瞬时机器可读介质,其中用以确定所述截止值的所述指令组,包含多组指令,用以:
根据所述参照关联总体频率以及所述第二相关性,分别估计多个参照估计值;
分别确定所述已正规化的参照目标总体频率与所述参照估计值之间的参照差值;
根据所述参照数据库,分别标准化所述参照差值为多个参照标准分数;以及
根据所述参照标准分数,确定所述截止值。
16.根据权利要求15所述的非瞬时机器可读介质,其中用以正规化所述受试生物样本的所述目标序列的所述数量的所述指令组,包含多组指令,用以:
根据所述测试关联总体频率以及所述第二相关性,估计测试估计值;
确定所述已正规化的测试目标总体频率以及所述测试估计值之间的测试差值;以及
根据所述参照数据库,标准化所述测试差值为测试标准分数;
其中所述用以比对的所述指令组,包含一组指令:
比对所述测试标准分数与所述截止值。
CN201510287937.6A 2014-07-22 2015-05-29 用以检测染色体的非整倍性的方法及其非瞬时机器可读介质 Expired - Fee Related CN105303067B (zh)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US201462027258P 2014-07-22 2014-07-22
US62/027,258 2014-07-22
US14/636,193 US20160026759A1 (en) 2014-07-22 2015-03-03 Detecting Chromosomal Aneuploidy
US14/636,193 2015-03-03

Publications (2)

Publication Number Publication Date
CN105303067A CN105303067A (zh) 2016-02-03
CN105303067B true CN105303067B (zh) 2018-03-02

Family

ID=53776302

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510287937.6A Expired - Fee Related CN105303067B (zh) 2014-07-22 2015-05-29 用以检测染色体的非整倍性的方法及其非瞬时机器可读介质

Country Status (6)

Country Link
US (1) US20160026759A1 (zh)
EP (1) EP2977466B1 (zh)
CN (1) CN105303067B (zh)
ES (1) ES2699895T3 (zh)
GB (1) GB201509975D0 (zh)
TW (1) TWI546689B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11494578B1 (en) * 2015-09-21 2022-11-08 Ares Trading S.A. Systems and methods for automated assessment of embryo quality using image based features
TWI603082B (zh) * 2016-09-30 2017-10-21 有勁生物科技股份有限公司 非侵入式胎兒性徵異常檢測系統及其方法與非侵入式胎兒性徵檢測系統及其方法
AU2019480813A1 (en) * 2019-12-31 2021-12-16 Bgi Clinical Laboratories (Shenzhen) Co., Ltd. Methods for determining chromosome aneuploidy and constructing classification model, and device

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TW200415524A (en) * 2002-10-24 2004-08-16 Univ Duke Binary prediction tree modeling with many predictors and its uses in clinical and genomic applications
AU2008278839A1 (en) * 2007-07-23 2009-01-29 The Chinese University Of Hong Kong Determining a nucleic acid sequence imbalance
CN101573453A (zh) * 2006-09-05 2009-11-04 维里德克斯有限责任公司 使用生物学途径基因表达分析来预测淋巴结阴性原发性乳腺癌的远处转移的方法
CN101611319A (zh) * 2006-11-09 2009-12-23 普罗特奥格尼克斯公司 对宫颈-阴道液体进行蛋白质组分析从而在怀孕雌体中检测宫内感染或确定早产危险
CN102770558A (zh) * 2009-11-05 2012-11-07 香港中文大学 由母本生物样品进行胎儿基因组的分析
CN103069006A (zh) * 2010-07-23 2013-04-24 艾索特里克斯遗传实验室有限责任公司 区别表达的胚胎或母源基因组区的鉴定及其用途
WO2013170429A1 (zh) * 2012-05-14 2013-11-21 深圳华大基因健康科技有限公司 确定胎儿基因组中预定区域碱基信息的方法、系统和计算机可读介质
CN103620055A (zh) * 2010-12-07 2014-03-05 利兰·斯坦福青年大学托管委员会 在全基因组规模非侵入性确定亲本单倍型的胎儿遗传

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2013203079B2 (en) * 2007-07-23 2014-05-08 The Chinese University Of Hong Kong Diagnosing fetal chromosomal aneuploidy using genomic sequencing
LT2334812T (lt) * 2008-09-20 2017-04-25 The Board Of Trustees Of The Leland Stanford Junior University Neinvazinis fetalinės aneuploidijos diagnozavimas sekvenavimu
US9260745B2 (en) * 2010-01-19 2016-02-16 Verinata Health, Inc. Detecting and classifying copy number variation
LT2805280T (lt) * 2012-01-20 2022-12-27 Sequenom, Inc. Diagnostikos būdai, kurie atsižvelgia į eksperimentines sąlygas
GB201215449D0 (en) * 2012-08-30 2012-10-17 Zoragen Biotechnologies Llp Method of detecting chromosonal abnormalities

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TW200415524A (en) * 2002-10-24 2004-08-16 Univ Duke Binary prediction tree modeling with many predictors and its uses in clinical and genomic applications
CN101573453A (zh) * 2006-09-05 2009-11-04 维里德克斯有限责任公司 使用生物学途径基因表达分析来预测淋巴结阴性原发性乳腺癌的远处转移的方法
CN101611319A (zh) * 2006-11-09 2009-12-23 普罗特奥格尼克斯公司 对宫颈-阴道液体进行蛋白质组分析从而在怀孕雌体中检测宫内感染或确定早产危险
AU2008278839A1 (en) * 2007-07-23 2009-01-29 The Chinese University Of Hong Kong Determining a nucleic acid sequence imbalance
CN102770558A (zh) * 2009-11-05 2012-11-07 香港中文大学 由母本生物样品进行胎儿基因组的分析
CN103069006A (zh) * 2010-07-23 2013-04-24 艾索特里克斯遗传实验室有限责任公司 区别表达的胚胎或母源基因组区的鉴定及其用途
CN103620055A (zh) * 2010-12-07 2014-03-05 利兰·斯坦福青年大学托管委员会 在全基因组规模非侵入性确定亲本单倍型的胎儿遗传
WO2013170429A1 (zh) * 2012-05-14 2013-11-21 深圳华大基因健康科技有限公司 确定胎儿基因组中预定区域碱基信息的方法、系统和计算机可读介质

Also Published As

Publication number Publication date
EP2977466A1 (en) 2016-01-27
US20160026759A1 (en) 2016-01-28
GB201509975D0 (en) 2015-07-22
ES2699895T3 (es) 2019-02-13
CN105303067A (zh) 2016-02-03
EP2977466B1 (en) 2018-09-19
TW201604700A (zh) 2016-02-01
TWI546689B (zh) 2016-08-21

Similar Documents

Publication Publication Date Title
US10619214B2 (en) Detecting genetic aberrations associated with cancer using genomic sequencing
US9051616B2 (en) Diagnosing fetal chromosomal aneuploidy using massively parallel genomic sequencing
CN105303067B (zh) 用以检测染色体的非整倍性的方法及其非瞬时机器可读介质
AU2013203077B2 (en) Diagnosing fetal chromosomal aneuploidy using genomic sequencing
AU2008278843B2 (en) Diagnosing fetal chromosomal aneuploidy using genomic sequencing
AU2013200581B2 (en) Diagnosing cancer using genomic sequencing

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20180302

CF01 Termination of patent right due to non-payment of annual fee