CN117980504A - 能够进行两种以上检测的遗传学分析方法 - Google Patents
能够进行两种以上检测的遗传学分析方法 Download PDFInfo
- Publication number
- CN117980504A CN117980504A CN202380013654.5A CN202380013654A CN117980504A CN 117980504 A CN117980504 A CN 117980504A CN 202380013654 A CN202380013654 A CN 202380013654A CN 117980504 A CN117980504 A CN 117980504A
- Authority
- CN
- China
- Prior art keywords
- chromosome
- child
- nucleic acid
- single nucleotide
- analysis
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 190
- 238000012360 testing method Methods 0.000 title claims abstract description 122
- 238000012252 genetic analysis Methods 0.000 title claims abstract description 18
- 210000000349 chromosome Anatomy 0.000 claims abstract description 330
- 238000004458 analytical method Methods 0.000 claims abstract description 282
- 239000002773 nucleotide Substances 0.000 claims abstract description 197
- 125000003729 nucleotide group Chemical group 0.000 claims abstract description 197
- 108700028369 Alleles Proteins 0.000 claims abstract description 187
- 230000005856 abnormality Effects 0.000 claims abstract description 93
- 238000004364 calculation method Methods 0.000 claims abstract description 86
- 150000007523 nucleic acids Chemical class 0.000 claims description 152
- 108020004707 nucleic acids Proteins 0.000 claims description 151
- 102000039446 nucleic acids Human genes 0.000 claims description 151
- 238000003205 genotyping method Methods 0.000 claims description 119
- 210000003754 fetus Anatomy 0.000 claims description 71
- 238000010998 test method Methods 0.000 claims description 32
- 230000008774 maternal effect Effects 0.000 claims description 28
- 230000002068 genetic effect Effects 0.000 claims description 27
- 230000035772 mutation Effects 0.000 claims description 16
- 201000010099 disease Diseases 0.000 claims description 11
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 claims description 11
- 230000007717 exclusion Effects 0.000 claims description 8
- 239000002131 composite material Substances 0.000 claims description 7
- 238000001514 detection method Methods 0.000 abstract description 48
- 238000003745 diagnosis Methods 0.000 abstract description 4
- 239000000523 sample Substances 0.000 description 107
- 230000000694 effects Effects 0.000 description 21
- 238000012163 sequencing technique Methods 0.000 description 20
- 230000001605 fetal effect Effects 0.000 description 16
- 108090000623 proteins and genes Proteins 0.000 description 14
- 208000031404 Chromosome Aberrations Diseases 0.000 description 13
- 108091093088 Amplicon Proteins 0.000 description 12
- 206010008805 Chromosomal abnormalities Diseases 0.000 description 12
- 108020004414 DNA Proteins 0.000 description 12
- 238000011156 evaluation Methods 0.000 description 11
- 101150023686 DTC gene Proteins 0.000 description 10
- 208000024556 Mendelian disease Diseases 0.000 description 10
- 208000011580 syndromic disease Diseases 0.000 description 9
- 239000012634 fragment Substances 0.000 description 7
- 230000035935 pregnancy Effects 0.000 description 7
- IOSROLCFSUFOFE-UHFFFAOYSA-L 2-nitro-1h-imidazole;platinum(2+);dichloride Chemical compound [Cl-].[Cl-].[Pt+2].[O-][N+](=O)C1=NC=CN1.[O-][N+](=O)C1=NC=CN1 IOSROLCFSUFOFE-UHFFFAOYSA-L 0.000 description 5
- 230000002159 abnormal effect Effects 0.000 description 5
- 238000003753 real-time PCR Methods 0.000 description 5
- 201000010374 Down Syndrome Diseases 0.000 description 4
- 230000035606 childbirth Effects 0.000 description 4
- 230000000875 corresponding effect Effects 0.000 description 4
- 238000004949 mass spectrometry Methods 0.000 description 4
- 230000021121 meiosis Effects 0.000 description 4
- 238000002493 microarray Methods 0.000 description 4
- 238000004088 simulation Methods 0.000 description 4
- 201000006360 Edwards syndrome Diseases 0.000 description 3
- 201000009928 Patau syndrome Diseases 0.000 description 3
- 206010044686 Trisomy 13 Diseases 0.000 description 3
- 208000006284 Trisomy 13 Syndrome Diseases 0.000 description 3
- 208000007159 Trisomy 18 Syndrome Diseases 0.000 description 3
- 231100000071 abnormal chromosome number Toxicity 0.000 description 3
- 238000003556 assay Methods 0.000 description 3
- 239000008280 blood Substances 0.000 description 3
- 210000004369 blood Anatomy 0.000 description 3
- 210000004027 cell Anatomy 0.000 description 3
- 108091092240 circulating cell-free DNA Proteins 0.000 description 3
- 238000007847 digital PCR Methods 0.000 description 3
- 150000002500 ions Chemical class 0.000 description 3
- 238000005259 measurement Methods 0.000 description 3
- 210000000214 mouth Anatomy 0.000 description 3
- 206010053884 trisomy 18 Diseases 0.000 description 3
- 208000003407 Creutzfeldt-Jakob Syndrome Diseases 0.000 description 2
- 102000002322 Egg Proteins Human genes 0.000 description 2
- 108010000912 Egg Proteins Proteins 0.000 description 2
- 238000007476 Maximum Likelihood Methods 0.000 description 2
- 238000012408 PCR amplification Methods 0.000 description 2
- 208000037280 Trisomy Diseases 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 230000000295 complement effect Effects 0.000 description 2
- 239000003814 drug Substances 0.000 description 2
- 235000013601 eggs Nutrition 0.000 description 2
- 238000007403 mPCR Methods 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- 210000004681 ovum Anatomy 0.000 description 2
- 230000008775 paternal effect Effects 0.000 description 2
- 230000003234 polygenic effect Effects 0.000 description 2
- 102000004169 proteins and genes Human genes 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 230000008685 targeting Effects 0.000 description 2
- 210000004291 uterus Anatomy 0.000 description 2
- 208000026817 47,XYY syndrome Diseases 0.000 description 1
- 208000018311 Autosomal trisomy Diseases 0.000 description 1
- 108091061744 Cell-free fetal DNA Proteins 0.000 description 1
- 206010067477 Cytogenetic abnormality Diseases 0.000 description 1
- 206010058314 Dysplasia Diseases 0.000 description 1
- 208000017924 Klinefelter Syndrome Diseases 0.000 description 1
- 208000016679 Monosomy X Diseases 0.000 description 1
- 208000008589 Obesity Diseases 0.000 description 1
- 108091034117 Oligonucleotide Proteins 0.000 description 1
- 238000012300 Sequence Analysis Methods 0.000 description 1
- 208000026928 Turner syndrome Diseases 0.000 description 1
- 206010056894 XYY syndrome Diseases 0.000 description 1
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 1
- 206010000210 abortion Diseases 0.000 description 1
- 231100000176 abortion Toxicity 0.000 description 1
- 210000004381 amniotic fluid Anatomy 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 230000000903 blocking effect Effects 0.000 description 1
- 230000017531 blood circulation Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 208000030281 cervical edema Diseases 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 210000003040 circulating cell Anatomy 0.000 description 1
- 239000002299 complementary DNA Substances 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 239000002537 cosmetic Substances 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000002405 diagnostic procedure Methods 0.000 description 1
- 230000008011 embryonic death Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 102000054766 genetic haplotypes Human genes 0.000 description 1
- 230000007614 genetic variation Effects 0.000 description 1
- 230000006801 homologous recombination Effects 0.000 description 1
- 238000002744 homologous recombination Methods 0.000 description 1
- 238000009396 hybridization Methods 0.000 description 1
- 230000003100 immobilizing effect Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 239000003550 marker Substances 0.000 description 1
- 239000002207 metabolite Substances 0.000 description 1
- 229910044991 metal oxide Inorganic materials 0.000 description 1
- 150000004706 metal oxides Chemical class 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000007481 next generation sequencing Methods 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 235000015097 nutrients Nutrition 0.000 description 1
- 235000020824 obesity Nutrition 0.000 description 1
- 102000054765 polymorphisms of proteins Human genes 0.000 description 1
- 108091033319 polynucleotide Proteins 0.000 description 1
- 102000040430 polynucleotide Human genes 0.000 description 1
- 239000002157 polynucleotide Substances 0.000 description 1
- 238000003793 prenatal diagnosis Methods 0.000 description 1
- 238000009598 prenatal testing Methods 0.000 description 1
- 238000012175 pyrosequencing Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 108091008146 restriction endonucleases Proteins 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 238000007841 sequencing by ligation Methods 0.000 description 1
- 210000002966 serum Anatomy 0.000 description 1
- 210000003765 sex chromosome Anatomy 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 208000011908 tetrasomy Diseases 0.000 description 1
- 238000002604 ultrasonography Methods 0.000 description 1
- 230000004580 weight loss Effects 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6813—Hybridisation assays
- C12Q1/6827—Hybridisation assays for detection of mutation or polymorphism
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6844—Nucleic acid amplification reactions
- C12Q1/6851—Quantitative amplification
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6869—Methods for sequencing
Landscapes
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Organic Chemistry (AREA)
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Wood Science & Technology (AREA)
- Zoology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Genetics & Genomics (AREA)
- Biotechnology (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- Biochemistry (AREA)
- Molecular Biology (AREA)
- Microbiology (AREA)
- Biophysics (AREA)
- Analytical Chemistry (AREA)
- Immunology (AREA)
- Biomedical Technology (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Plant Pathology (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本发明的目的在于提供一种能够实施选自亲子鉴定、表型分析、染色体数异常诊断中的两种以上的检测的新技术,本发明涉及对满足选自下述条件(i)至条件(iii)中的2个以上条件的分析对象群进行分析并且选自表型分析工序、亲子鉴定工序和用于评估染色体数异常的指标计算工序中的两种以上的遗传学分析方法:(i)已知与表型有关联性的单核苷酸多态性位点的数量占分析对象群中所包含的单核苷酸多态性位点总数的比例为10%以上,(ii)次要等位基因的出现频率占分析对象群中所包含的单核苷酸多态性位点总数的1%至50%,并且在染色体上彼此相距20kb以上的单核苷酸多态性位点的数量的比例为10%以上,(iii)存在于13号染色体、18号染色体、21号染色体、X染色体、Y染色体上的单核苷酸多态性位点的数量占分析对象群中所包含的单核苷酸多态性位点总数的比例为10%以上。
Description
技术领域
本发明属于使用下一代测序仪等的核酸分析方法的技术领域。
背景技术
人类基因组和基因分析研究的进步不仅能够鉴定导致许多单基因疾病的基因,而且在阐明多因素疾病的遗传因素方面也取得了迅速进展。全基因组关联研究(GWAS)是识别遗传变异的有效方法。由此,能够识别与疾病风险和人类数量的性状(肥胖度指数、代谢物的血中浓度等)相关的基因。通过GWAS识别的变异与表型之间的关联性由P值表达。
随着此类技术的发展,基于每个人的遗传背景提供最佳医疗护理的个性化医疗的实施正在成为现实。随着这些技术创新,基因分析变得越来越容易为消费者所接受。直接向消费者提供的基因检测称为直接面向消费者的基因检测(Direct-to-Consumer GeneticTesting,DTC基因检测),向消费者提供与疾病患病风险或体质、甚至性格有关的信息以促使消费者改善行为,并且作为其延伸,还可以与提供减肥计划和销售化妆品、保健品等辅助服务组合来完成(例如,参照非专利文献1)。
另外,亲子关系是否不存在,对于合法的家族关系等产生很大影响。如果孕妇不确定子宫内胎儿的生物学父亲,有几种方法可以确定正确的生物学父亲。
一种方法是等到出生时,分析孩子和疑父的基因组DNA,并通过现有亲子鉴定中使用的片段分析(Fragment analysis)进行STR分析。
然而,在孩子出生前想知道孩子的亲生父亲的需求及多。出生前鉴定亲子关系的方法包括分析通过绒毛膜诊断和羊水穿刺回收的遗传物质的方法,但这些方法具有侵入性,并存在流产的风险。
鉴于侵入性诊断方法的上述问题,分析混合在血液中的循环无细胞DNA(cell-free DNA,cfDNA)的方法正在应用于亲子鉴定。通过来自混合在母亲血液循环的胎儿遗传物质,即是胎儿循环无细胞DNA(cell-free fetal DNA,cffDNA)分析,可以实现无创产前亲子鉴定(Non-invasive prenatal testing,NIPPT)。
在这种情况下,由于使用现有的STR分析方法难以分析出已片段化的cffDNA,因此使用了多个SNV大规模平行测序MPS(massive parallel sequencing)方法。
例如,在专利文献1中公开了一种NIPPT方法,其使用最大似然估计值或最大后验概率法通过计算机来确定疑父是胎儿的亲生父亲的概率,并且基于所确定的概率,使用单一假设拒绝检验、使用最大似然估计或最大后验概率方法来确定疑父是否是胎儿的亲生父亲。
在非专利文献2中公开了一种利用贝叶斯算法进行母体-胎儿遗传型预测的方法。
非专利文献3记载了,有效SNV的数量与次要等位基因频率(MAF)和总SNV的数量有显着关系,并且序列深度影响NIPPT的准确性。
作为胎儿循环无细胞DNA分析技术的应用领域,可以举出通过无创产前基因检测(Non-invasive prenatal genetic testing,NIPT)来检测胎儿染色体数异常。染色体数异常是染色体的数量的异常,已知有21三体性(唐氏综合征)、18三体性(爱德华兹综合征)、13三体性(帕陶综合征)、X单体性(特纳综合征)等。作为染色体数异常的主要筛查方法,除了在妊娠早期进行超声检查来测量颈项水肿(NT)之外,还在妊娠早期和中期进行了一系列母体血清标志物测试。然而,近年来,基于胎儿循环无细胞DNA的NIPT已成为可能。
基于胎儿循环无细胞DNA的NIPT称为DNA量比较法或计数法(大规模并行测序法,MPS法)。在MPS法中,对每条染色体的DNA片段的数量进行计数,而不区分源自母体和源自胎儿。如果胎儿患有21三体性(唐氏综合症),则源自21号染色体的DNA片段会比正常群稍微多一些。MPS法是通过分析DNA片段数量的差异来统计学上预测胎儿染色体数异常的方法。
除了MPS法之外,其他已知的方法包括特异性扩增单核苷酸多态性(SNV)并分析其模式的方法(例如,专利文献2)以及使用微阵列的方法等。
在NIPT中,使用一种分析计数或信号强度并数值化与正常群(中值)的偏差而进行评估的方法。作为数值化的方法,已知的方法包括:即使使用相同的MPS方法,也存在使用整个染色体作为参考染色体的Z分数的方法;以及对每个参考染色体(例如21、18和13号染色体等)使用标准化染色体值(Normalized Chromosome Value,NCV)的方法(例如,参见专利文献3)。
[现有技术文献]
[专利文献]
专利文献1:特开第2014-502845号公报
专利文献2:特开第2022-519159号公报
专利文献3:特开第2019-153332号公报
[非专利文献]
非专利文献1:《Nutrients》,2020年2月;12(2):566,2020年2月21日在线公布。
非专利文献2;《Prenatal Diagnosis》,第40卷,第4期,2020年3月,第497-506页。
非专利文献3:《PLoS One》,2016年9月15日;11(9):e0159385。
非专利文献4;《PLoS One》,2019年9月12日;14(9):e0222535。
非专利文献5:《PLoS One》,2019年4月12日;14(4):e0215368。
非专利文献6;《Clin Chem》,2011年7月;57(7):1042-9。
发明内容
[本发明要解决的问题]
DTC基因检测和单基因疾病检测等表型分析、亲子鉴定和NIPT迄今为止被认为是独立的技术和服务,并且还没有在同一次检测中同时进行分析的构思。因为没有类似的构思,所以对于同时进行这些检测时应该构建什么样的板(panel)至今尚未探讨。
鉴于这些问题,本发明的目的是选自亲子鉴定、表型分析和染色体数异常诊断中,提供一种能够实施两种以上检测的新技术。
[解决问题的手段]
解决上述问题的本发明如下。
[1]一种遗传学分析方法,其用于分析由多个单核苷酸多态性位点组成的分析对象群,
所述分析对象群满足选自下述条件(i)至条件(iii)中的2个以上条件:
(i)已知与表型有关联性的单核苷酸多态性位点的数量占分析对象群中所包含的单核苷酸多态性位点总数的比例为10%以上;
(ii)次要等位基因的出现频率占分析对象群中所包含的单核苷酸多态性位点总数的1%至50%,并且染色体上彼此相距20kb以上的单核苷酸多态性位点的数量的比例为10%以上;以及
(iii)存在于13号染色体、18号染色体、21号染色体、X染色体、Y染色体上的单核苷酸多态性位点的数量占分析对象群中所包含的单核苷酸多态性位点总数的比例为10%以上,并且
对以下样本进行分析:
包含于含有孩子遗传信息核酸的孩子核酸样本;以及
包含于含有父亲遗传信息核酸的父亲核酸样本和/或包含于含有母亲遗传信息核酸的母亲核酸样本,并且
在各样本所包含的核酸中获取数据,所述数据包括:所述分析对象群中所包含的多个单核苷酸多态性位点处的等位基因的序列信息、以及反映包含所述单核苷酸多态性位点的区域和/或所述等位基因的相对或绝对存在量的数值,并且
所述遗传学分析方法包括:基于所述数据进行基因分型的基因分型工序,
进一步,基于一次所述分析而得到的所述数据,进行从以下的表型分析工序、亲子鉴定工序、用于评估染色体数异常的指标计算工序中选择的2种以上的工序:
在包含所述表型分析工序的情况下,所述分析对象群满足上述条件(i),
在包含所述亲子鉴定工序的情况下,所述分析对象群满足上述条件(ii),
在包含所述用于评估所述染色体数异常的指标计算工序的情况下,所述分析对象群满足上述条件(iii)。
<表型分析工序>
基于在所述基因分型工序中获得的已知与所述表型有关联性的单核苷酸多态性位点的基因分型的结果,分析与所述单核苷酸多态性位点处的次要等位基因相关的所述表型至少在所述孩子中表达的可能性(但是,这不包括诊断人类是否患有疾病)。
<亲子鉴定工序>
基于所述基因分型工序的结果来求出所述多个单核苷酸多态性位点中每一个的父性指数(Paternity Index,PI)并将所述PI进行总乘积以求出综合父性指数(CombinedPaternity Index,CPI),并鉴定所述父亲与所述孩子之间是否存在亲子关系;或者
基于所述基因分型工序的结果来求出所述多个单核苷酸多态性位点中的每一个的母性指数(Maternity Index,MI)并将所述母性指数进行总乘积以求出综合母性指数(Combined Maternity Index,CMI),并是鉴定所述母亲与所述孩子之间是否存在亲子关系的工序,
所述亲子鉴定工序包括以下工序:对针对所述孩子出生前是胎儿且进行父子鉴定的情况、所述孩子出生后进行父子鉴定的情况以及所述孩子出生后进行母子鉴定的情况中的每种情况,通过以下方式算出PI或MI。
孩子出生前是胎儿且进行父子鉴定的情况:
所述孩子核酸样本是从怀有所述孩子的母亲采集的循环无细胞核酸样本,
当通过分析所述循环无细胞核酸样本和所述父亲核酸样本这两种样本对所述父亲和所述胎儿进行基因分型时,基于表1或表2算出PI,
当通过分析所述循环无细胞核酸样本、所述父亲核酸样本和所述母亲核酸样本这三种样本对所述父亲、所述母亲和所述胎儿进行基因分型时,基于表3或表4算出PI,
孩子出生后进行父子鉴定的情况:
当通过分析所述孩子核酸样本和所述父亲核酸样本这两种样本对所述父亲和所述孩子进行基因分型时,基于表5算出PI,
当通过分析所述孩子核酸样本、所述父亲核酸样本和所述母亲核酸样本这三种样本来对所述父亲、所述母亲和所述孩子进行基因分型时,基于表6算出PI,
孩子出生后进行母子鉴定的情况:
当通过分析所述孩子核酸样本和所述母亲核酸样本这两种样本对所述母亲和所述孩子进行基因分型时,基于表7算出MI,
当通过分析所述孩子核酸样本、所述父亲核酸样本和所述母亲核酸样本这三种样本对所述父亲、所述母亲和所述孩子进行基因分型时,基于表8算出MI。
[表1]
[表1]
[表2]
[表2]
[表3]
[表3]
[表4]
[表4]
[表5]
[表5]
[表6]
[表6]
[表7]
[表7]
[表8]
[表8]
在表1至表4中,循环无细胞核酸样本的分析中将信号强度相对较高的等位基因记为A,将信号强度相对较低的等位基因记为B,
在表1和表2中,k0为假阴性率(false negative rate),kb为假阳性率(falsepositive rate),a为A的出现频率,b为B的出现频率。
在表5至表8中,μ为突变率,a和b分别为等位基因A和等位基因B的出现频率,α为等位基因A的平均排除力,β为等位基因B的平均排除力。
<用于评估染色体数异常的指标计算工序>
基于所述数据中所包含的所述数值,算出Z分数或归一化染色体值NCV(Normalized Chromosome Value)作为用于评估至少在所述孩子中的13号染色体、18号染色体、21号染色体、X染色体和Y染色体上是否存在数值突变的指标,
基于下述式(1)求出N号染色体的Z分数(ZchrN),并且通过下述式(2)求出N号染色体相对于参考M号染色体的NCV(NCVchrN by chrM)。
[数学式2]
式(1)中,N为13、18、21、X或Y,
“chr N的比例”是指在分析所述孩子核酸样本时,反映N号染色体的存在量的数值与反映全染色体(不包括13号染色体、18号染色体、21号染色体、X染色体和Y染色体)存在量的数值比例,
“参考二体群体中chr N的比例的平均值”是指对含有正常染色体数(二体性)的多个标准样本进行分析时,反映N号染色体的存在量的数值与反映全染色体存在量的数值比例的平均,
“参考二体群体中chr N的比例的SD”是指对含有正常数量染色体(二体性)的多个标准样本进行分析时,反映N号染色体的存在量的数值与反映全染色体存在量的数值比例的标准偏差。
[数学式3]
式(2)中,“Chr N by Chr M的归一化比例”是指在分析所述孩子核酸样本时反映N号染色体存在量的数值与反映M号染色体存在量的数值的比例。
“参考二体群体中chr N的平均归一化比例”是指在分析含有正常染色体数量(二体性)的多个标准样本时,反映N号染色体的存在量的数值与反映M号染色体存在量的数值的比例的平均。
“参考二体群体中chr N的平均归一化比例”是指在分析含有正常数量染色体(二体性)的多个标准样本时,反映N号染色体存在量的数值与反映M号染色体存在量的数值比例的标准偏差。
[2]根据项目1所述的遗传学分析方法,其包括所述亲子鉴定工序、用于评估所述染色体数异常的指标计算工序以及所述表型分析工序中的全部。
[3]根据项目1或2所述的遗传学分析方法,所述分析对象群体满足条件(i)至条件(iii)中的全部,
已知与表型有关联性、次要等位基因的出现频率为1%至50%、在染色体上彼此相距20kb以上的距离、且存在于13号染色体、18号染色体、21号染色体、X染色体和Y染色体上的单核苷酸多态性位点占构成分析对象群的单核苷酸多态性位点总数的比例为10%以上。
[4]根据项目1至3中任一项所述的遗传学分析方法,所述孩子是母亲子宫内的胎儿,所述孩子核酸样本是从所述母亲采集的循环无细胞核酸样本。
[5]根据项目1至3中任一项所述的遗传学分析方法,其所述孩子是出生后的孩子。
[发明效果]
通过对满足上述(i)~(iii)中选择的条件中的2个以上的分析对象群的单核苷酸多态性位点进行分析,可以进行从亲子鉴定、染色体数异常诊断、表型分析中选择的两种以上的基因检测。下面将更详细地说明技术效果。
<技术效果1>孩子出生前的亲子鉴定工序与表型分析工序的组合
在将亲子鉴定工序和表型分析工序组合的情况下,通过在亲子鉴定工序中确认胎儿与父亲之间的亲子关系,可以在表型分析工序中判断源自父亲或母亲的次要等位基因是否被胎儿遗传。由此,能够更准确地估计与次要等位基因相关联的表型在胎儿中表达的可能性。
此外,在亲子鉴定工序中确认了胎儿与父亲之间的亲子关系的情况下,可以纠正胎儿实际上携带通过基因分型被认为存在于胎儿中的次要等位基因的概率的准确性。
具体而言,
1)如果父母一方携带次要等位基因为纯合子,则可以确定胎儿100%携带次要等位基因;
2)如果父母一方携带次要等位基因为杂合子,则可以确定胎儿实际携带次要等位基因的可能性较高;
3)如果父母双方均携带次要等位基因为杂合子,则可以确定胎儿实际携带次要等位基因的可能性高于上述2)中的情况。
在亲子鉴定工序和表型鉴定工序分开进行的情况下,无法获得这些技术效果,而只能通过将这些工序组合起来才能实现这些技术效果。
<技术效果2>用于评估孩子出生前染色体数异常的指标计算工序与表型分析工序的组合
如果简单地进行表型分析工序,则只能获得判断胎儿是否具有次要等位基因的效果。然而,通过组合表型分析工序和用于评估染色体数异常的指标计算工序,在次要等位基因对应于功能抑制突变或显性失活突变的情况下,可以通过了解数量异常,甚至有可能推测疾病变得更严重的可能性。
在单独进行用于评估染色体数异常的指标计算工序和表型分析工序的情况下,无法获得这种技术效果,而只能通过将这些工序组合起来才能实现这种技术效果。
<技术效果3>孩子出生前的亲子鉴定工序与用于评估染色体数异常的指标计算工序的组合
从怀孕母亲身上获得的循环无细胞核酸样本中含有母体和胎儿核酸的混合物,因此很难确定分析获得的表明特定等位基因的信号是来自母亲还是胎儿,存在导致混淆样本是否来自胎儿、且在评估染色体数异常时得出错误的结论的潜在风险。
然而,通过亲子鉴定工序确定父亲和胎儿之间的亲子关系,可以判断通过分析循环无细胞核酸样本获得的指示特定等位基因的信号是否是胎儿的信号(即,是否是通过减数分裂从父亲带来的),从而使得可以准确地评估胎儿核酸的含量。由此,可以提高染色体数异常评估的准确性。
在将亲子鉴定工序和用于评估染色体数异常的指标计算工序分开进行的情况下,无法获得这些技术效果,而只能通过将这些工序组合起来才能实现这些技术效果。
<技术效果4>孩子出生后的亲子鉴定工序与表型分析工序的组合
在将亲子鉴定工序和表型分析工序组合的情况下,通过在亲子鉴定工序中确定孩子和父亲之间的亲子关系,可以在表型分析工序中判断源自父亲或母亲的次要等位基因是否被孩子遗传。
在亲子鉴定工序和表型鉴定工序分开进行的情况下,无法获得这种技术效果,而只能通过将这些工序组合起来才能实现这种技术效果。
<技术效果5>用于评估出生后染色体数异常的指标计算工序与表型分析工序的组合
通过组合表型分析工序和评估染色体数异常的指标计算工序,在次要等位基因对应于功能抑制突变或显性失活突变的情况下,可以通过了解数量异常,甚至有可能推测疾病变得更严重的可能性。
在单独进行用于评估染色体数异常的指标计算工序和表型分析工序的情况下,无法获得这种技术效果,而只能通过将这些工序组合起来才能实现这种技术效果。
<技术效果6>孩子出生后的亲子鉴定工序与用于评估染色体数异常的指标计算工序的组合
染色体数异常是由于产生精子或卵子时的减数分裂错误而发生的。孩子特定染色体中发现的数量异常表明精子或卵子存在减数分裂错误。当简单地评估孩子的染色体数异常时,无法确定这种数量异常是由精子(父亲)还是卵子(母亲)减数分裂错误引起的。
然而,在本发明中,为了“获取数据,该数据包括:分析对象群中所包含的多个单核苷酸多态性位点处的等位基因的序列信息、以及反映包含所述单核苷酸多态性位点的区域和/或所述等位基因的相对或绝对存在量的数值”,构成为通过区分特定单核苷酸多态性位点的等位基因来检测定量异常。因此,如果通过亲子鉴定能够确定孩子与父亲或母亲的生物学亲子关系,就可以知道该单核苷酸多态性位点的等位基因是否源自父亲或母亲。通过这样做,可以识别相对于其他等位基因检测到的倍数性异常的特定等位基因是否源自父亲或母亲,这使得可以确定染色体数异常的原因是由于精子(父亲)还是卵子(母亲)的减数分裂错误。
在将亲子鉴定工序和用于评估染色体数异常的指标计算工序分开进行的情况下,无法获得这种技术效果,而只能通过将这些工序组合起来才能实现这种技术效果。
附图说明
图1是表示试验例1的模拟结果的表。随着次要等位基因的出现频率a增加,与SNV数量相对应的CPI值增加。
图2是表示试验例2的模拟结果的表。随着次要等位基因的出现频率a增加,与SNV数量相对应的CPI值增加。
具体实施方式
以下,对本发明的实施方式进行说明。在“<1>分析对象群的单核苷酸多态性位点的基因分型”中,对本发明中使用的组以及使用其的基因分型进行说明,并且在“<2>出生前”和“<3>出生后”部分,对与出生前、出生后的孩子相关的检测的实施方式进行说明。
<1>关于分析对象群的单核苷酸多态性位点的基因分型
以往,用于亲子鉴定的SNV板(panel)由可用于识别个体的SNV位点组成,在构建板时不考虑与表型的关联性以及染色体数异常的检测。因此,在使用用于亲子鉴定、DTC基因检测或单基因疾病检测的SNV板进行分析时,不能同时进行:旨在预测受试者患病的可能性和体质等表型的DTC基因检测或单基因疾病检测、以及13号染色体、18号染色体、21号染色体、X染色体、Y染色体等数值异常的评估(专利文献1、非专利文献2、3)。
另外,以往,在进行DTC基因检测等时,准备包含与表型高度相关的多态性位点的组(P值低)。此外,在单基因疾病检测中,分析直接导致疾病的单个基因是否存在突变。对于DTC基因检测和单基因疾病检测,对次要等位基因的出现频率没有限制,并且不考虑遗传关联性(染色体上单核苷酸多态性位点之间的距离),因此同一板包括与出现频率极低的次要等位基因相关的多态性位点以及染色体上彼此接近的多态性位点(遗传关联性)。因此,即使通过同一板的分析算出父性指数PI(Patenity Index),由于作为其总乘积算出的综合父性指数CPI(Combined Paternity Index)作为亲子鉴定的判断指标没有显示出有效值,因此无法进行亲子鉴定(非专利文献1)。此外,为DTC基因检测和单基因疾病检测而构建的板并不是为了评估染色体数异常而设计的,因此无法检测13号染色体、18号染色体、21号染色体、X染色体和Y染色体等染色体数异常。
此外,虽然已知通过SNV分析可以检测染色体数异常,但这里使用的SNV板并不是为了亲子鉴定或DTC基因检测而构建的,因此亲子鉴定、DTC基因检测或单基因疾病检测不能与染色体数异常检测同时进行(非专利文献3和5)。
这样,常规亲子鉴定、DTC基因检测、单基因疾病检测、染色体数异常检测等所使用的板是根据各自检测的目的而设计的,与为了某项检测而获得的SNV相关的数据不能用于其他检测目的
此外,也没有根据一次分析获得的数据进行两种以上的检测的构思。
鉴于这些问题,本发明设定了待分析的单核苷酸多态性位点的集合(分析对象群)。本发明对满足选自以下(i)~(iii)中的两种以上的条件的分析对象群进行分析。
(i)已知与表型有关联性的单核苷酸多态性位点的数量占分析对象群中所包含的单核苷酸多态性位点总数的比例为10%以上。
(ii)次要等位基因的出现频率占分析对象群中所包含的单核苷酸多态性位点总数的1%至50%,并且在染色体上彼此相距20kb以上的单核苷酸多态性位点的数量的比例为10%以上。
(iii)存在于13号染色体、18号染色体、21号染色体、X染色体、Y染色体上的单核苷酸多态性位点的数量占分析对象群中所包含的单核苷酸多态性位点总数的比例为10%以上。
另外,本发明对分析对象群中的单核苷酸多态性位点进行分析,除了获取和分析仅关注预设的板中包含的单核苷酸多态性位点的数据外,还包括进行全基因组分析并从获得的数据中分析特定的单核苷酸多态性位点
基于对满足“(i)已知与表型有关联性的单核苷酸多态性位点的数量占分析对象群中所包含的单核苷酸多态性位点总数的比例为10%以上”的条件的分析对象群进行分析而得到的数据,可以进行后述的表型分析工序。当进行下述的表型分析工序时,分析对象群需要满足条件(i)。
这里,“已知与表型有关联性的单核苷酸多态性位点”是指基于统计学、医学、分子生物学和其他科学依据已知与表型有关联性的单核苷酸多多态性位点。
目前发现的单核苷酸多态性位点均与相关表型、等位基因的出现频率、图谱信息等相关联,并记录在各种数据库中。通过搜索这些数据库,可以轻松了解已知与表型有关联的单核苷酸多态性位点及其等位基因的出现频率。此类数据库的示例如下。
dbSNP:https://www.ncbi.nlm.nih.gov/snp/
SNPedia:https://www.snpedia.com/
P值被认为是定量地指示与表型的关联性的统计值。P值为表示通过GWAS识别的突变与表型之间的关联性的统计值,数值越低,关联性越强。P值是通过对具有特定等位基因的个体的表型优势与不具有相同等位基因的个体的表型优势的优势比应用x2检验来计算的。在各种数据库中,许多单核苷酸多态性位点与P值相关联地被登记。
作为满足上述条件(i)的单核苷酸多态性位点,可选择P值为0.001以下。另外,满足条件(i)的分析对象群中追加的单核苷酸多态性位点的P值可以设定为,优选为1×10-4以下,更优选为1×10-5以下,进一步优选为1×10-6以下,进一步更优选为1×10-7以下,进一步优选为1×10-8以下。
另外,对与表型有关联性较低(P值高)且涉及同一表型的多个单核苷酸多态性位点进行分析,并在后面描述的表型分析工序中,还可以在下述表型分析工序中同时评估为多基因风险评分(polygenic risk score)。
即使未指示P值,作为满足上述条件(i)的单核苷酸多态性位点,还可以选择学术论文等中报道的已知与表型相关的单核苷酸多态性位点。
进行表型分析工序时,已知与表型有关联性的单核苷酸多态性位点的数量占分析对象群中所包含的单核苷酸多态性位点总数的比例为10%以上,更优选14%以上,更优选为20%以上,更优选为30%以上,更优选为40%以上,更优选为50%以上,更优选为60%以上,进一步优选为70%以上,进一步优选为80%以上,进一步优选为90%以上,进一步优选为95%以上,进一步优选为100%以上。
(ii)基于对满足“次要等位基因的出现频率占分析对象群中所包含的单核苷酸多态性位点总数的1%至50%,并且在染色体上彼此相距20kb以上的单核苷酸多态性位点的数量的比例为10%以上”的条件的分析对象群进行分析而得到的数据,可以进行后述的亲子鉴定工序。当进行下述的亲子鉴定工序时,分析对象群需要满足条件(ii)。
在条件(ii)下,单核苷酸多态性位点处的次要等位基因的出现频率为1%至50%。根据需要,满足上述条件(ii)的分析对象群中所包含的单核苷酸多态性位点的微小等位基因的出现频率可以设定为,优选为5%以上,更优选为10%以上,进一步优选为20%以上,更优选为30%以上。分析对象群中所包含的单核苷酸多态性位点的次要等位基因的出现频率越高,获得用于亲子鉴定的有效CPI或CMI所需的单核苷酸多态性数量越少。
同一染色体上彼此接近的多个单核苷酸多态性位点处的等位基因很可能在减数分裂过程中的同源重组过程中作为一组(单倍型)遗传给配子。从提高基于PI计算的亲子鉴定工序的准确性的观点出发,优选分析对象群中所包含的单核苷酸多态性位点彼此不表现出遗传上的关联。
因此,条件(ii)除了要求次要等位基因的出现频率在1%至50%之外,还要求染色体上含有一定数量的彼此相距20kb以上的单核苷酸多态性位点。
次要等位基因的出现频率占分析对象群中所包含的单核苷酸多态性位点总数的1%至50%且在染色体上彼此相距20kb以上的单核苷酸多态性位点的数量的比例优选为10%以上,更优选为14%以上,更优选为20%以上,更优选为30%以上,更优选为40%以上,更优选为50%以上,更优选为60%以上,进一步优选为70%以上,进一步优选为80%以上,进一步优选为90%以上,进一步优选为95%以上,进一步优选为100%以上。
(iii)基于对满足“存在于13号染色体、18号染色体、21号染色体、X染色体、Y染色体上的单核苷酸多态性位点的数量占分析对象群中所包含的单核苷酸多态性位点总数的比例为10%以上”的条件的分析对象群进行分析而得到的数据,可以进行后述的指标计算工序。当进行下述的指标计算工序时,分析对象群需要满足条件(iii)。
存在于13号染色体、18号染色体、21号染色体、X染色体和Y染色体上的单核苷酸多态性位点的数量占分析对象群中所包含的单核苷酸多态性位点的总数的比例优选为10%以上。优选为14%以上,进一步优选为14.7%以上。
上述列举以外的染色体数异常会导致严重的发育异常并导致胚胎死亡。通过将分析对象群设计为13号染色体、18号染色体、21号染色体、X染色体和Y染色体上存在的单核苷酸多态性位点的比例达到一定数值以上,可以有效地检测:21三体(唐氏综合症)、18三体(爱德华兹综合症)、13三体(帕陶综合症)等常染色体三体;XXY(克氏综合征)、XYY(雅各布综合征)等性染色体数异常。
下面总结了分析对象群所满足的每个条件的可能实施例。
使用满足(i)~(iii)全部条件的分析对象群的情况
实施例I:实施表型分析工序、亲子鉴定工序、以及用于评估染色体数异常的指标计算工序
对满足条件(i)、(ii)的分析对象群进行分析的情况
·实施例II:实施表型分析工序和亲子鉴定工序
对满足条件(i)和(iii)的分析对象群进行分析的情况
·实施例III:实施用于评估染色体数异常的表型分析工序和指标计算工序对满足条件(ii)和(iii)的分析对象群进行分析的情况
·实施例IV:实施亲子鉴定工序和用于评估染色体数异常的指标计算工序
实施例I包括稍后将描述的实施例1和实施例5。
实施例II包括稍后将描述的实施例2和实施例6。
实施例III包括稍后将描述的实施例3和实施例7。
实施例IV包括稍后将描述的实施例4和实施例8。
当采用实施例I时,分析对象群满足所有上述条件(i)至(iii)。在进一步优选的实施方式中,分析对象群已知具有表型的关联性,次要等位基因的出现频率为1%至50%,并且在染色体上彼此间隔20kb以上的距离且存在于13号染色体、18号染色体、21号染色体、X染色体和Y染色体上的单核苷酸多态性位点。
满足这些条件的单核苷酸多态性位点相对于构成分析对象群的单核苷酸多态性位点总数的比例优选为10%以上,更优选为20%以上,更优选为30%以上,更优选为40以上,更优选为50%以上,更优选为60%以上,进一步优选为70%以上,进一步优选为80%以上,进一步优选为90%以上,进一步优选为95%以上,进一步优选为100%。
当采用实施例II时,分析对象群满足上述条件(i)和(ii)。在进一步优选的实施方式中,已知分析对象群具有与表型的关联性,并且包括次要等位基因的出现频率为1%至50%且在染色体上彼此间隔20kb以上的距离的单核苷酸多态性位点。
满足这些条件的单核苷酸多态性位点相对于构成分析对象群的单核苷酸多态性位点总数的比例优选为10%以上,更优选为20%以上,更优选为30%以上,更优选为40%以上,更优选为50%以上,更优选为60%以上,进一步优选为70%以上,进一步优选为80%以上,进一步优选为90%以上,进一步优选为95%以上,进一步优选为100%。
当采用实施例III时,分析对象群满足上述条件(i)和(iii)。在进一步优选的实施方式中,已知分析对象群具有与表型的关联性,并且包括存在于13号染色体、18号染色体、21号染色体、X染色体和Y染色体上的单核苷酸多态性位点。
满足这些条件的单核苷酸多态性位点相对于构成分析对象群的单核苷酸多态性位点总数的比例优选为10%以上,更优选为20%以上,更优选为30%以上,更优选为40个%以上,更优选为50%以上,更优选为60%以上,进一步优选为70%以上,进一步优选为80%以上,进一步优选为90%以上,进一步优选为95%以上,进一步优选为100%。
当采用实施例IV时,分析对象群满足上述条件(ii)和(iii)。在进一步优选的实施方式中,分析对象群的次要等位基因的出现频率为1%~50%,并且包括在染色体上彼此间隔20kb以上的距离且存在于13号染色体、18号染色体、21号染色体、X染色体和Y染色体上的单核苷酸多态性位点。
满足这些条件的单核苷酸多态性位点相对于构成分析对象群的单核苷酸多态性位点总数的比例优选为10%以上,更优选为20%以上,更优选为30%以上,优选为40%以上,更优选为50%以上,更优选为60%以上,进一步优选为70%以上,进一步优选为80%以上,进一步优选为90%以上,进一步优选为95%以上,进一步优选为100%。
已知与表型有关联性、次要等位基因的出现频率为1%~50%,并且在染色体上彼此间隔20kb以上的距离的单核苷酸多态性位点的列表示于本说明书末尾的表9-1至表9-14中。存在于13号染色体、18号染色体、21号染色体、X染色体和Y染色体上的单核苷酸多态性位点的数量占表9-1至表9-14中示出的单核苷酸多态性位点总数的比例为10%以上(71.2%)。然而,本发明不限于利用包括表9-1至9-14中示出的单核苷酸多态性位点的分析对象群的形式。
另外,表9-1至表9-14的“P-值(P-VALUE)”栏中标有“-”的单核苷酸多态性位点是那些已知与表型有关联性但P值未记录在数据库中的位点。
在本发明的实施例中,准备并使用从表9-1至表9-14所记载的361个单核苷酸多态性位点选择的单核苷酸多态性位点所占的比例优选为10%以上,更优选为20%以上,更优选为30%以上、更优选为40%以上、更优选为50%以上、更优选为60%以上、进一步优选为70%以上、进一步优选为80%以上、进一步优选为90%以上、进一步优选为95%以上、进一步优选为100%的分析对象群。然而,本发明不限于这些实施例。
本发明包括:基于通过上述分析对象群的分析获得的数据进行基因分型的基因分型工序。具体地,包含含有孩子遗传信息的核酸的孩子核酸样本、包含含有父亲遗传信息的核酸的父亲核酸样本和/或包含含有母亲遗传信息的核酸的母亲核酸样本。通过该分析,在每个样本所包含的核酸中获取数据,该数据包括:分析对象群中所包含的多个单核苷酸多态性位点处的等位基因的序列信息、以及反映包含上述单核苷酸多态性位点的区域和/或该等位基因的相对或绝对存在量的数值,并且可以基于该数据进行基因分型。
如本说明书中的“基因分型”包括用于指定对象的遗传型的所有手段。“基因分型”除了包括直接分析对象的基因组DNA的方法之外,还包括通过分析从对象获得的循环无细胞核酸样本间接鉴定对象的遗传型的方法。
在基因分型工序中,对孩子核酸样本进行分析。除此之外,可以分析父亲核酸样本和/或母亲核酸样本(其不包含含有孩子的遗传信息的核酸)。
作为“父亲核酸样本”,可以不受限制地使用通常用于基因检测的任何样本,例如从父亲口腔采集的口腔内粘膜细胞样本等。
含有母亲遗传信息但不含孩子遗传信息的核酸的“母亲核酸样本”同样也可以不受限制地使用通常用于基因检测的任何样本,例如从母亲口腔采集的口腔内粘膜细胞样本。
“孩子核酸样本”的具体方面根据是出生前的孩子还是出生后的孩子而有所不同。
作为包含出生前的孩子的遗传信息的孩子核酸样本,合适实例是从怀孕期间的母体血液采集的循环无细胞核酸样本。循环无细胞核酸样本是将包含含有母亲遗传信息的核酸与包含含有其母亲子宫内胎儿遗传信息的核酸混合的样本。
作为含有出生后的孩子遗传信息的孩子核酸样本,与上述“父亲核酸样本”和“母亲核酸样本”一样,可以不受限制地使用通常用于基因检测的任何样本,例如从孩子口腔采集的口腔内粘膜细胞样本。
作为分析核酸样本的手段,可以不受限制地使用任何能够区分和检测多态位点处的单核苷酸取代(SNV)的分析方法。具体地,可以举出:碱基序列分析、质谱分析、数字PCR、SNV微阵列和实时PCR等。
作为碱基序列分析的具体手段,可以举出下一代测序仪(NGS)。下一代测序是一种允许对克隆扩增分子和单个核酸分子进行大规模并行测序的测序方法。在本发明中,可以采用任何NGS系统。例如,焦磷酸测序(GS Junior(Roche公司)等)、使用可逆染料终止子的合成测序(MiSeq(Illumina公司)等)、连接测序(SeqStudio遗传分析仪(Thermo FisherSCIENTIFIC公司)等)、离子半导体测序(离子质子系统(Thermo Fisher SCIENTIFIC公司)等)、使用CMOS(互补金属氧化物半导体)芯片进行测序(iSeq 100系统(Illumina公司)等)。
与已知的参考序列比对的测序读数的数量称为深度(也称为覆盖率(coverage))。关于覆盖率的数据可如下所述用于评估染色体数异常。
此外,在扩增子分析的情况下,与扩增子的量相关的数据和基于一定基因组区域中的扩增子测序的读数的总数等数据也可用于评估染染色体数异常。
所有这些数据都对应于“反映包含单核苷酸多态性位点的区域和/或等位基因的相对或绝对存在量的数值”。
此外,通过分析由下一代测序仪读取的序列数据,在多态性位点处具有特定序列(特定SNV)的等位基因的读取数可以被解释为指示该等位基因存在的信号。
此外,在可以单独识别核酸分子的条形码序列(独特分子标识符(UMI)、独特分子标签(UMT))在提交给下一代测序仪的文库的调制阶段与分析对象的核酸片段连接的情况下,可以识别多态位点处具有特定序列(特定SNV)的等位基因的UMT计数可以解释为指示该等位基因存在的信号。
在本发明中,优选使用下一代测序仪进行分析。当使用下一代测序仪作为本发明中的分析手段时,除了将已知的多态性位点进行特异性扩增的靶向测序方法之外,还可以采用利用外显子测序(Exon sequence)、GWAS等非靶向测序对DNA碱基序列进行解码。..
对于靶向测序,可以使用杂交方法和扩增子测序来创建文库。
当采用非靶向测序时,可以从解码的碱基序列中选择具有本发明规定的谱的单核苷酸多态性位点,并获得关于该单核苷酸多态性位点的定性或定量数据。
数字PCR是一种将样本分配到大量孔中并单独进行PCR以使每个孔中只有一个核酸分子进入或不进入的方法。在包含靶向序列的孔中,进行PCR扩增并检测到荧光信号,但在不包含靶向序列的孔中,不进行PCR扩增并且检测不到荧光信号。PCR后,判断每个孔中存在(+)/不存在(-)信号扩增,并且计算存在(+)信号的孔数作为靶向的拷贝数。
如果数字PCR与能够判断识别SNV等突变的探针(TaqManR探针、循环探针等)组合,则只有在具有特定序列(特定SNV)的等位基因被扩增的孔中才会观察到荧光。通过设计对每个等位基因具有不同发射波长的荧光标记探针,可以通过荧光颜色区分存在于一个多态性位点的不同等位基因而进行检测。具有与特定等位基因相对应的“某个(+)”荧光信号的孔的数量可以解释为指示等位基因存在的信号。
微阵列是将具有已知序列的核酸(例如DNA、DNA片段、cDNA、寡核苷酸、RNA或RNA片段等)作为探针排列数百至数十万个并固化并且当具有与探针互补的序列的核酸杂交时使用荧光标记来检测的方法。用于SNV分型的微阵列也称为SNV阵列。当假定一个位点存在多个等位基因时,通过分别固定每个等位基因,就可以区分和检测它们。特定等位基因固定点处的荧光强度可以解释为指示等位基因存在的信号。
实时PCR是使用分光荧光计实时监测和分析根据PCR扩增的核酸量产生的荧光的方法。优选的是,将实时PCR与能够准确判断SNV等突变的探针(例如TaqManR探针或循环探针等)组合。通过设计对每个等位基因具有不同发射波长的荧光标记探针,可以通过荧光颜色区分存在于一个多态性位点的不同等位基因而进行检测。
当试图通过实时PCR获得数据组时,从提高测量效率的角度来看,优选采用多重PCR。多重PCR是一种在一个反应体系中使用多组引物同时扩增多个靶向序列的方法。
在实时PCR中,对应于特定等位基因的荧光信号强度可以解释为指示该等位基因存在的信号。
质谱分析是一种通过将分子进行电离并测量其质荷比(m/z)来测量离子和分子质量的分析方法。本来,这种方法测量分子的质量,但如果可以测量在特定条件(例如当使用特定引物进行PCR时或当使用特定限制性酶切割核酸分子时)下制备的核酸分子的质量,则可以通过将该质量与数据库进行比较来鉴定所检测的核酸分子的碱基序列。因此,质谱分析广泛应用于基因分型。
在质谱分析中,包含特定等位基因的碱基序列特有的m/z中的离子强度可以解释为指示该等位基因存在的信号。
在基因分型工序中,获取数据,该数据包括:上述分析对象群中所包含的每个单核苷酸多态性位点处的等位基因的序列信息、以及反映包含所述单核苷酸多态性位点的区域和/或所述等位基因的相对或绝对存在量的数值。
这里的“等位基因的序列信息”用于后述的亲子鉴定工序和表型分析工序。
另一方面,“反映含有单核苷酸多态性位点的区域和/或相关等位基因的相对或绝对存在量的数值”是反映核酸样本中具有包含单核苷酸多态性位点的碱基序列区域的核酸或等位基因的相对或绝对量的数值。该数值中包括:与已知参考序列对齐的测序读数;在扩增子分析的情况下,与扩增子的量相关的数据;以及基于一定的基因组区域的扩增子测序的读数总数等数据。该数值被用在用于评估染色体数异常的指标计算工序中,这将在后面描述。
本发明的基因分型方法包括以下具体实施方式。
(a)基于父亲核酸样本对父亲进行基因分型
(b)基于母亲核酸样本对母亲进行基因分型
(c)基于出生后的孩子采集的孩子核酸样本对孩子进行基因分型
(d)基于怀孕期间从母亲获得的循环无细胞核酸样本对其母亲子宫内的胎儿进行基因分型。
(e)基于从怀孕母亲采集的循环无细胞核酸样本进行间接母亲基因分型
(a)~(c)的基因分型可以通过常规方法适当进行。
另外,当孩子出生前时,“基于孩子核酸样本的基因分型”包括基于循环无细胞样本的上述基因分型(d)至(f)。下面将添加每个的解释。
(d)基于怀孕期间从母亲获得的循环无细胞核酸样本对母亲子宫内的胎儿进行基因分型。
通过分析循环无细胞核酸样品获得的数据包含源自母体的主要核酸和源自胎儿的次级核酸的信号的混合物,因此不可能按原样识别胎儿的遗传型。因此,当基于循环无细胞核酸样本对胎儿进行基因分型时,首先通过对母亲进行基因分型来识别母亲的遗传型。然后可以通过从分析循环无细胞核酸样本获得的数据中减去母亲遗传型的信息来进行胎儿的基因分型。
在特定多态位点的两个不同等位基因中,在循环无细胞核酸样本分析中信号强度相对较高的等位基因将被记为A,而信号强度相对较低的等位基因将被记为B。胎儿的基因分型可以使用表示B的存在的信号强度与由于特定多态性位点的等位基因的总信号强度的比例(Freq.B)作为指标,并且根据以下标准进行。
AA纯合子:Freq.B≤规定值1
AB杂合子:规定值2≤Freq.B≤规定值3
这里,指定值1至3可以在满足下式的范围内适当设定。
0%≤规定值1≤规定值2≤规定值3≤45%
(e)基于从怀孕母亲获得的循环无细胞核酸样本进行间接母亲基因分型
使用上述Freq.B对母亲进行间接基因分型,并且可以使用以下标准(将Freq.B作为指标)来完成。
AA纯合子:Freq.B≤规定值4
AB杂合子:规定值5≤Freq.B≤50%
这里,指定值4和5可以在满足下式的范围内适当设定。
0%≤规定值4≤规定值5<50%
此外,母亲的间接基因分型方法不限于上述方法。通常,利用循环无细胞核酸样本中含有比源自胎儿的核酸更大比例的源自母亲的核酸这一事实,任何间接对母亲进行基因分型的方法都在本发明的范围内。
<2>出生前
下面,将详细描述孩子出生前的本发明的实施例。
在孩子是出生前的情况下,可以在基因分型工序之后进行上述(a)、(b)、(d)和(e)中的基因分型。另外,除非另有说明,“母体基因分型”包括(b)直接母体基因分型和(e)间接母体基因分型。
另外,在孩子是出生前的情况下,会基于循环无细胞核酸样本的分析来进行基因分型,但会对通过分析而得到的信号强度和/或比例设定阈值,仅将超过该阈值的信号视为有效。
在特定多态性位点处的两个不同等位基因中,在循环无细胞核酸样本的分析中信号强度相对较高的等位基因将被记为A,而信号强度相对低的等位基因将被记为B。
在这种情况下,只有当B的信号强度为预定阈值以上时,才可以将其视为有效信号。例如,当分析装置是下一代测序仪时,可以将阈值设置为优选5个扩增子以上,更优选15个扩增子以上,进一步优选为25个扩增子以上。
另外,对指示B存在的信号强度相对于特定多态性位点的等位基因引起的总信号强度的比例设定阈值,只有当该比例为该阈值以上时才可以将其视为有效信号。该比例的阈值例如可以设定为0.1%以上,优选为0.5%以上,更优选为1%以上。
在孩子是出生前的情况下,基因分型工序之后可以采取的工序是表型分析工序、亲子鉴定工序和用于评估染色体数异常的指标计算工序。
首先,将单独说明这些工序,然后将说明更具体的实施例。
<2-1>表型分析工序(出生前)
出生前的表型分析工序为如下的工序:基于基因分型工序的结果,分析与单核苷酸多态性位点处的次要等位基因相关的表型在胎儿、父亲和母亲中的一人或二人以上中表达的可能性。根据所谓的DTC检测中进行的基于遗传型的表型表达的可能性进行分析,并评估携带导致单基因疾病的基因的风险等位基因的可能性,这对应于本发明的表型分析工序。
在进行表型分析工序时,对满足上述条件(i)的分析对象群中所包含的单核苷酸多态性位点进行分析。
通过GWAS积累的遗传型和表型之间的关联性记录在GWAS目录(https://www.ebi.ac.uk/gwas/home)等数据库中。当在基因分型工序中分析的单核苷酸多态性位点处检测到次要等位基因时,通过将单核苷酸多态性的ID输入到数据库中,可以搜索与其相关的表型。
与次要等位基因相关的表型发生的可能性可以考虑通过分析检测到的次要等位基因的P值、与同一表型相关的次要等位基因的数量、连锁不平衡等来进行评估。
另外,在父亲或母亲拥有风险等位基因并表达与风险等位基因相关的表型,并且胎儿也遗传了该风险等位基因的情况下,可以推断该胎儿中表达与该风险等位基因相关的表型的可能性高。
另外,在不清楚父亲是否是亲生父亲的情况下,通过亲子鉴定工序确定疑父与胎儿的亲子关系后,再进行表型分析工序,可获得上述有益效果。
表型分析工序中的分析对象是选自孩子、父亲和母亲中的一人或二人以上。在优选实施例中,对孩子、父亲和/或母亲中的二人以上进行分析。
<2-2>亲子鉴定工序(出生前)
出生前的亲子鉴定工序是判断父亲与母亲子宫内胎儿的亲子关系的工序。在进行亲子鉴定工序时,对满足上述条件(ii)的分析对象群中所包含的单核苷酸多态性位点进行分析。以下,在说明亲子鉴定时,有时将作为亲子鉴定一方的父亲特称为“疑父”。
对于亲子鉴定,基于疑父和胎儿的基因分型结果,求出每个单核苷酸多态性位点的父性指数(PI)。
更具体地,针对次要等位基因的出现频率为1%至50%并且在染色体上彼此间隔20kb以上的距离的单核苷酸多态性位点,分别求出PI。
求出父性指数的方法没有特别限定,可以使用任意的方法。
作为NIPPT方法,可以采用专利文献1中记载的方法、非专利文献2中记载的方法、非专利文献3中记载的方法等公知的方法。
除了已知的方法之外,例如,可以采用下面描述的方法。
首先,对基于疑父和胎儿的基因分型结果算出PI的方法进行说明。在本实施例中,不需要对母亲进行基因分型,而是基于疑父和胎儿的基因分型结果进行亲子鉴定。
在本实施例的情况下,例如可以根据下面的表1或表2来求出PI。
[表1]
[表1]
[表2]
[表2]
表1和表2中,循环无细胞核酸样本的分析中信号强度相对较高的等位基因记为A,信号强度相对较低的等位基因记为B。
表1和表2中,k0为假阴性率,kb为假阳性率,a为A的出现频率,b为B的出现频率。
假阴性率是指:虽然真实遗传型为AB杂合子,但是由于未检测到有效的等位基因B信号而被判断为AA纯合子的概率。假阴性率是根据分析方法的种类和测定条件而变化的值,并且可以通过检测预先指定。据报道,在特定的下一代测序仪的情况下,各平台的假阴性率约为0.002至0.13(非专利文献4)。
假阳性率是指:虽然真实遗传型为AA纯合子,但错误检测到等位基因B的信号并判断该等位基因为AB杂合子的概率。假阳性率是根据分析方法的种类和测定条件而变化的值,并且可以通过检测预先指定。
接下来,对基于母亲、疑父、胎儿的基因分型结果算出PI的方法进行说明。在该实施例中,由于考虑了母亲的基因分型结果,因此可以进行更准确的鉴定。
在本实施例的情况下,例如可以根据下面的表3和表4来求出PI。
[表3]
[表3]
[表4]
[表4]
表3和表4中,循环无细胞核酸样本分析中信号强度相对较高的等位基因记为A,信号强度相对较低的等位基因记为B。
表3和表4中,k0为假阴性率,kb为假阳性率,a为A的出现频率,b为B的出现频率。
另外,母亲的基因分型可以是:母亲的直接基因分型(b)或母亲的间接基因分型(e)。从提高准确性的观点出发,优选采用(b)。
另外,表1至表4中,PI是基于两个等位基因A和B计算的,但单核苷酸多态性位点不限于双等位基因位点(bi-allelic),还可以是三等位基因位点(tri-allelic)、四等位基因位点(tetra-allelic)。另外,为了将判断简化,可以仅选择双等位基因位点进行PI计算。
在使用上述任何方法求出每个单核苷酸多态性位点的PI之后,可以求出综合父性指数(CPI)。求出CPI作为PI的总乘积。可以采用当CPI超过参考值时,确认胎儿与疑父之间的亲子关系的实施例。
确认亲子关系的CPI的标准值优选为100以上,更优选为1000以上,更优选为5000以上,进一步优选为10000以上。
此外,即使对次要等位基因的出现频率极低的单核苷酸多态性位点的分析对象群进行分析,各个PI也会全面显示较低的值。因此,不可能获得可以视为对亲子鉴定有效的足够的CPI。此外,计算具有遗传关联性(染色体上单核苷酸多态性位点之间的距离)且在染色体上彼此接近的多态性位点的PI并不能为亲子鉴定提供有效的判断指标。满足上述条件(ii)的分析对象群中所包含的单核苷酸多态性位点的次要等位基因的出现频率为1%~50%,并且在染色体上彼此间隔20kb以上的距离,因此适合获得有效的CPI。
计算CPI之后,可以求出父权肯定概率(Probability of Paternity,POP)。POP可以使用下述式计算。另外,式中P表示先验肯定概率。
[数学式1]
<2-3>评估染色体数异常的指标计算工序(出生前)
用于评估出生前的染色体数异常的指标计算工序是如下的工序:基于反映根据循环无细胞核酸样本分析获得的数据中包含的、含有单核苷酸多态性位点的区域和/或等位基因的相对或绝对存在量的数值,评估受试者中13号染色体、18号染色体、21号染色体、X染色体和Y染色体是否存在数量异常。具体而言,可以评估是否存在:21三体性(唐氏综合症)、18三体性(爱德华兹综合症)、13三体性(帕陶综合症)等三体性、克兰费尔特综合症(47,XXY)、雅各布综合症(XYY综合症)、以及极少数情况下的四体性。
在进行评估染色体数异常的指标计算工序时,对满足上述条件(iii)的分析对象群进行分析。
本工序中的待评估人选自胎儿、父亲、母亲中的一人或两人以上。
在将胎儿作为评估对象的情况下,将循环无细胞核酸样本作为被测对象样本。当父亲为评估对象时,父亲核酸样本为被测对象样本,当母亲为评估对象时,母亲的核酸样本为被测对象样本。
计算用于评估染色体数异常的指标计算工序可以使用反映含有单核苷酸多态性位点的区域和/或等位基因的相对或绝对存在量的数值以常规方式进行。
当使用下一代测序仪进行分析时,作为上述数据,可以使用读数(测序深度)、关于扩增子的量的数据、或者基于某个基因组区域中的扩增子测序的读数的总数的数据。
以下,举例示出用于定量评估染色体数异常的指标计算方法的两个示例。另外,为了简洁起见,“反映包含单核苷酸多态性位点的区域和/或等位基因的相对或绝对存在量的数值”将被称为“本案数值”。
首先,将描述基于对象的染色体的本案数值的比例计算Z分数的方法(详细信息参见非专利文献5)。在该方法中,基于下述式(1)计算作为对象的N号染色体的Z分数(ZchrN)。
[数学式2]
式(1)中,“chr N的比例”是指:在对作为被测对象的核酸样本进行分析时,N号染色体的本案数值相对于全染色体(但不包含13号染色体、18号染色体、21号染色体)的本案数值的比例。
“参考二体群体中chr N比例的平均值”是指:在对含有正常染色体数(二体性)的多个标准样本进行分析时,N号染色体的本案数值相对于全染色体的比例的平均。
“参考二体性群体中chr N的比例的SD”是指:在对包含正常染色体数(二体性)的多个标准样本进行分析时,N号染色体的本案数值相对于全染色体的比例的标准偏差。
当作为被测对象的核酸样本中关于对象染色体的Z分数与在分析含有正常染色体数(二体性)的标准样本时关于对象染色体的Z分数存在偏差时,可以判断存在染色体数异常。
接下来,将描述用于求出诸如21号、18号、13号、X和Y染色体等每个参考染色体的归一化染色体值(NCV)的方法(详细信息参见非专利文献6)。可以通过以下等式(2)来求出关于对象的N号染色体相对于作为参考的M号染色体的NCV(NCVchrN by chrM)。
[数学式3]
式(2)中,“chrN by chrM的归一化比例”是指:在分析作为被测对象的核酸样本时,关于N号染色体的本案数值相对于关于M号染色体的本案数值的比例。
“参考二体性群体中chr N的平均归一化比例”是指:在分析包含正常染色体数(二体性)的多个标准样本时,N号染色体的本案数值相对于M号染色体的比例的平均。
“参考二体性群体中chr N的平均归一化比例”是指:在分析包含正常染色体数(二体性)的多个标准样本时,N号染色体的本案数值相对于M号染色体的比例的标准偏差。
在实际的试验中,为了计算作为对象的N号染色体的NCV,将通过初步试验来确定将哪条染色体具体称为M号染色体。即,在分析含有正常染色体数(二体性)的标准样本和N号染色体数异常的标准样本并选择1至22号染色体作为M号染色体时,分别计算NCVchrN by chrM。此时,采用与二体性标准样本和数量异常标准样本之间NCV得分差异最大的N和M的组合有关的NCVchrN by chrM的式进行检验。
以下是在孩子出生前的情况下本发明的可能实施例。
对满足条件(i)~(iii)的分析对象群进行分析的方式
·实施表型分析工序、亲子鉴定工序以及用于评估染色体数异常的指标计算工序的实施例(实施例1)
对满足(i)、(ii)条件的分析对象群进行分析的形式
·实施表型分析工序和亲子鉴定工序的实施方式(实施例2)
对满足(i)和(iii)条件的分析对象群进行分析的形式
·实施用于评估表型分析工序和染色体数异常的指标计算工序的实施方式(实施例3)
对满足(ii)和(iii)条件的分析对象群进行分析的形式
·实施亲子鉴定工序和用于评估染色体数异常的指标计算工序的实施方式(实施例4)
以下,详细说明在孩子出生前可以采用的实施例1~4。
<2-4>实施例1(出生前的表型分析工序、亲子鉴定工序、用于评估染色体数异常的指标计算工序的组合)
实施例1为具有以下工序的实施方式:除了基因分型工序之外,还包括亲子鉴定工序、用于评估染色体数异常的指标计算工序以及表型分析工序这三种类型的检测工序。
在实施例1中,对包含满足以下条件(i)~(iii)中的全部条件的单核苷酸多态性位点的分析对象群进行分析。
(i)已知与表型有关联性的单核苷酸多态性位点的数量占分析对象群中所包含的单核苷酸多态性位点总数的比例为10%以上。
(ii)次要等位基因的出现频率占分析对象群中所包含的单核苷酸多态性位点总数的1%至50%,并且在染色体上彼此相距20kb以上的单核苷酸多态性位点的数量的比例为10%以上。
(iii)存在于13号染色体、18号染色体、21号染色体、X染色体、Y染色体上的单核苷酸多态性位点的数量占分析对象群中所包含的单核苷酸多态性位点总数的比例为10%以上。
通过对包含满足条件(i)~(iii)中的全部条件的单核苷酸多态性位点的分析对象群进行分析,可以获得可用于以下三个检测工序中任何一种的数据:表型分析工序、亲子鉴定工序以及评估染色体数异常的指标计算工序。
接下来,对于该分析对象群中包括的每个单核苷酸多态性位点,进行以下的基因分型工序:至少分析包含含有疑父遗传信息的核酸的父亲核酸样本和循环无细胞核酸样本。
在基因分型工序中,进行疑父的基因分型(上述(a)中的基因分型)和胎儿的基因分型(上述(d)中的基因分型)。在实施例1中,可以进一步进行母亲的基因分型(上述(b)和/或(e)中的基因分型)。
在基因分型工序中,可以进行以下的实施方式:基于仅对父亲核酸样本和循环无细胞核酸的分析,仅进行(a)疑父基因分型和(d)胎儿基因分型,但不进行母亲基因分型。这种实施方式的优点在于可以容易地进行亲子鉴定工序。
在基因分型工序中,可以进行以下的实施方式:基于对父亲核酸样本、母亲核酸样本和循环无细胞核酸的分析,进行(a)疑父的基因分型、(d)胎儿的基因分型和(b)母亲的基因分型。可以预期这种实施例通过对母亲进行基因分型来提高亲子鉴定工序的准确性。
实施例I中,基于基因分型工序的结果,进行亲子鉴定工序和表型分析工序,以鉴定疑父与胎儿之间是否存在亲子关系。此外,基于通过分析核酸样本获得的数据,实施用于评估染色体数异常的指标计算工序。
另外,除非另有说明,本说明书中的“亲子关系”是指生物学上的亲子关系。
<2-5>实施例2(出生前的表型分析工序和亲子鉴定工序的组合)
实施例2是包括表型分析工序和亲子鉴定工序的实施方式。通过进行亲子鉴定,可以提高表型分析工序的准确性。
在实施例2中,对包含满足下述条件(i)和(ii)的单核苷酸多态性位点的分析对象群进行分析。
(i)已知与表型有关联性的单核苷酸多态性位点的数量占分析对象群中所包含的单核苷酸多态性位点总数的比例为10%以上。
(ii)次要等位基因的出现频率占分析对象群中所包含的单核苷酸多态性位点总数的1%至50%,并且在染色体上彼此相距20kb以上的单核苷酸多态性位点的数量的比例为10%以上。
对于满足上述条件的分析对象群进行基因分型的实施可以直接应用实施例1的说明。
实施例2中的分析对象群可以通过对含有满足条件(i)和(ii)的单核苷酸多态性位点的分析对象群进行分析,可以获得可用于以下两种类型的检测工序中任何一种的数据:表型分析工序和亲子鉴定工序。
实施例2中,基于基因分型工序的结果,进行亲子鉴定工序和表型分析工序,以鉴定疑父与胎儿之间是否存在亲子关系。
另外,实施例1和实施例2中,在亲子鉴定工序中,可以通过以下方式来进行:如果确认疑父与胎儿之间的亲子关系,则进行表型分析工序,如果亲子关系被否定,则不进行表型分析工序。
当然,无论亲子鉴定工序的结果如何,都可以进行表型分析工序。
在本实施例中,可以基于通过一次样本分析而获得的数据,进行无创产前亲子鉴定和表型分析。在本实施例中,通过在亲子鉴定工序中确定胎儿与父亲之间的亲子关系,可以在表型分析工序中确定源自父亲或母亲的次要等位基因是否由胎儿遗传。
因此,如果父亲或母亲携带风险等位基因,并且将该风险等位基因遗传给胎儿,则可以推测胎儿也会表达与风险等位基因相关的表型的可能性较高。
另外,如果父亲或母亲携带风险等位基因、表达与该风险等位基因相关的表型、且该风险等位基因被胎儿遗传,则可以推测胎儿也会表达与风险等位基因相关的表型的可能性较高。
通过亲子鉴定工序确认疑父与胎儿之间的亲子关系,并进行表型分析工序,从而能够获得上述有益效果。
胎儿出生前的遗传型是基于源自微量的胎儿的核酸的循环无细胞核酸来确定的,因此即使在基因分型工序中判定胎儿具有风险等位基因,该判定也可以被认为包含不确定因素。
由于实施例1和2包括亲子鉴定工序,因此可以解决该问题并且可以提高表型分析工序的准确性。
具体地,在实施例1和实施例2中,通过亲子鉴定工序确认亲子关系时,可以采用以下判断标准更准确地判定胎儿携带风险等位基因的可能性,从而提高表型分析工序的准确性。
(标准)
1)当父母一方携带风险等位基因为纯合子时:判断胎儿100%携带风险等位基因。
2)当父母一方携带风险等位基因为杂合子时:判断胎儿携带风险等位基因的可能性较高。
3)当父母双方均携带风险等位基因为杂合子时:判断胎儿携带风险等位基因的可能性高于上述2)中的情况。
下面将说明更具体的应用情况。假设胎儿携带风险等位基因的概率为P1(%),当通过分析循环无细胞核酸样本获得表明源自胎儿的风险等位基因的存在的信号时可以估计该概率。然后,如果满足以下标准,则修正P1(%),并将胎儿携带风险等位基因的概率评估为P2(%)。
(标准)
1)如果父母一方携带风险等位基因为纯合子:
P2=100%
2)如果父母一方携带风险等位基因为杂合子:
P2=P1+(P1×0.5)
(P2是P1的1.5倍)
3)如果父母双方均携带风险等位基因为杂合子:
P2=P1+(P1×0.75)
(P2是P1的1.75倍)
然而,如果式2)和3)的右边超过100%,则P2被认为是100%。
另外,P1的计算方法没有特别限定。
例如,可以使用日本专利第7121440号中公开的方法来计算暗示胎儿中存在风险等位基因的信号的可靠性值,并且可以将其视为P1。
此外,当检测到暗示胎儿中存在风险等位基因的信号时,可以将某个预定概率统一记为P1。
<2-6>实施例3(用于评估出生前染色体数异常的指标计算工序与表型分析工序的组合)
实施例3具有以下的实施方式,除了基因分型工序之外,还包括用于评估染色体数异常的指标计算工序和表型分析工序。根据实施例3,具有以下有益效果:能够基于一次样本分析所得到的数据,同时进行用于评估染色体数异常的指标计算工序和表型分析工序这两种检测工序。
在实施例3中,对含有满足下述条件(i)和(iii)的单核苷酸多态性位点的分析对象群进行分析。
(i)已知与表型有关联性的单核苷酸多态性位点的数量占分析对象群中所包含的单核苷酸多态性位点总数的比例为10%以上。
(iii)存在于13号染色体、18号染色体、21号染色体、X染色体、Y染色体上的单核苷酸多态性位点的数量占分析对象群中所包含的单核苷酸多态性位点总数的比例为10%以上。
通过对包含满足条件(i)和(iii)的单核苷酸多态性位点的分析对象群进行分析,可以获得可用于表型分析工序和用于评估染色体数异常的指标计算工序中的任何一种的数据。由此,实施例3使得可以执行用于评估染色体数异常的指标计算工序和表型分析工序两者。
在实施例3中,使用检测对象的基因组DNA或循环无细胞核酸(cfDNA)对检测对象进行基因分型并进行表型分析。
通过同时执行用于评估染色体数异常的指标计算工序和表型分析工序两者,可以在考虑染色体数异常的情况下,更准确地判别与次要等位基因相关的表型的表达可能性。
假设某个位点有正常等位基因A和风险等位基因B。如果风险等位基因B对应于功能阻断突变或显性失活突变,则与正常情况下具有一对染色体且(A,B)杂合子的人相比,在具有染色体数量异常(三体性)且携带(A,B,B)的组合的等位基因时,由风险等位基因B引起的疾病的严重程度可能会增加。
通过进行用于评估染色体数异常的指标计算工序和表型分析工序两者,可以评估如上所述的可能性。
另外,上述说明可以直接应用于实施例3中用于评估染色体数异常的指标计算工序和表型分析工序的具体实施方式。
<2-7>实施例4(出生前亲子鉴定工序与用于评估染色体数异常的指标计算工序的组合)
实施例4是为具有以下工序的实施方式:除了基因分型工序之外,还包括亲子鉴定工序和用于评估染色体数异常的指标计算工序。根据实施例4,可以基于通过一次样本分析获得的数据来进行亲子鉴定和染色体数异常的评估。
在实施例4中,对含有满足下述条件(ii)和(iii)的单核苷酸多态性位点的分析对象群进行分析。
(ii)次要等位基因的出现频率占分析对象群中所包含的单核苷酸多态性位点总数的1%至50%,并且在染色体上彼此相距20kb以上的单核苷酸多态性位点的数量的比例为10%以上。
(iii)存在于13号染色体、18号染色体、21号染色体、X染色体、Y染色体上的单核苷酸多态性位点的数量占分析对象群中所包含的单核苷酸多态性位点总数的比例为10%以上。
通过分析该分析对象群,可以获得可用于亲子鉴定工序和用于评估染色体数异常的指标计算工序中的任何一种的数据。由此,实施例4使得可以执行亲子鉴定工序和用于评估染色体数异常的指标计算工序两者。
另外,在亲子鉴定工序的结果确认了亲子关系的情况下,能够通过用于评估染色体数异常的指标计算工序来提高评估的准确性。
例如,在某个单核苷酸多态性位点中,假设父亲和母亲都携带不同的等位基因的情况(母亲AA,父亲BB)。在确定了胎儿与父亲的生物学亲子关系的情况下,确定胎儿在单核苷酸多态性位点的遗传型为AB杂合子。即,可以通过分析循环无细胞核酸样本时获得的、暗示等位基因B存在的信号来识别胎儿核酸,并且可以准确地评估胎儿核酸的含量。由此,可以提高染色体数异常评估的准确性。
这样的效果不仅在采用实施例4的情况下能够得到,在采用实施例1的情况下也能够得到。
对于实施例4中的基因分型工序的实施方式,可以比照应用实施例1的说明。另外,上述说明可以直接应用于实施例4中的亲子鉴定工序和用于评估染色体数异常的指标计算工序的具体实施方式。
<3>出生后
下面,将详细描述婴儿出生后的本发明的实施例。
在孩子在出生后的情况下,可以在基因分型工序中进行上述(a)至(c)中的基因分型。
即使在孩子出生后,基因分型工序之后可以进行的工序是亲子鉴定工序、用于评估染色体数异常的指标计算工序以及表型分析工序。
首先,将单独说明这些工序,然后将说明更具体的实施例。
<3-1>表型分析工序(出生后)
将说明孩子出生后的表型分析工序。表型分析工序为如下的工序:基于基因分型工序的结果,评估与单核苷酸多态性位点处的次要等位基因相关的表型在选自出生后的孩子、父亲和母亲的一人或两人以上中表达的可能性。
在进行表型分析工序时,对满足上述条件(i)的分析对象群进行分析。
如果在基因分型工序中分析的单核苷酸多态性位点处检测到次要等位基因,则可以通过将单核苷酸多态性的ID输入到存储有GWAS数据的数据库中来搜索与其相关的表型。与次要等位基因相关的表型表达的可能性可以通过考虑通过分析检测到的次要等位基因的P值、与同一表型相关的次要等位基因的数量、连锁不平衡等来进行评估。
<3-2>亲子鉴定工序(出生后)
出生后的亲子鉴定工序是基于基因分型工序的结果鉴定疑父与孩子之间是否存在亲子关系和/或疑母与孩子之间是否存在亲子关系的工序。在进行亲子鉴定工序时,对满足上述条件(ii)的分析对象群进行分析。
更具体地,针对次要等位基因的出现频率为1%至50%并且在染色体上相距20kb以上的距离的单核苷酸多态性位点,分别求出PI或MI。
亲子鉴定工序的具体实施方式没有特别限制。可以采用任何已知的鉴定方法。以下,对进行父子鉴定的方式和进行母子鉴定的方式进行说明。
首先,对亲子鉴定的形式中的基于疑父和孩子的基因分型结果进行亲子鉴定的形式进行说明。在本实施例中,不需要对母亲进行基因分型,而是基于疑父和孩子的基因分型结果进行亲子鉴定。
在本实施例的情况下,例如可以根据下面的表5来求出PI。
[表5]
[表5
表5中,μ为突变率,a和b分别表示等位基因A和等位基因B的出现频率。进一步地,β是等位基因B的平均排除力(Mean Power of Exclusion值)。
接下来,对亲子鉴定的形式中的基于母亲、疑父和孩子的基因分型结果进行亲子鉴定的形式进行说明。在本实施例的情况下,例如可以根据下面的表6来求出PI。
[表6]
[表6]
表6中,μ为突变率,a和b分别表示等位基因A和等位基因B的出现频率。进一步地,α是等位基因A的平均排除力,β是等位基因B的平均排除力。
另外,在表5和表6中,PI是基于两个等位基因A和B计算的,但单核苷酸多态性位点不限于双等位基因位点(bi-allelic),还可以是三等位基因位点(tri-allelic)、四等位基因位点(tetra-allelic)。另外,为了将判断简化,可以仅选择双等位基因位点进行PI计算。
在使用上述任何方法求出每个单核苷酸多态性位点的PI之后,可以求出综合父性指数(CPI)。求出CPI作为PI的总乘积。可以采用当CPI超过参考值时,确认胎儿与疑父之间的亲子关系的实施例。
确认亲子关系的CPI的标准值优选为100以上,更优选为1000以上,更优选为5000以上,进一步优选为10000以上。
在基于疑父和孩子的基因分型使用表5中的计算式算出PI并基于此计算CPI的实施例中,作为分析基础的分析对象群中所包含的预定单核苷酸多核苷酸类型位点的数量优选为20以上,更优选为30以上,进一步优选为40以上,进一步优选为50以上,进一步优选为60以上。
通过将分析对象群中所包含的预定单核苷酸多态性位点的数量设定在上述范围内,能够得到足以确认亲子鉴定的CPI。
另外,从更可靠地获得足以确认亲子鉴定的CPI的观点来看,作为分析基础的分析对象群中所包含的预定单核苷酸多态性位点的数量优选为200以上,更优选为250以上,进一步优选为550以上。
在基于母亲、疑父和孩子的基因分型使用表6中的计算式算出PI并基于此计算CPI的实施例中,作为分析基础的分析对象群中所包括的预定单核苷酸多态性位点的数量优选为20以上,更优选为30以上,进一步优选为40以上,进一步优选为50以上。
通过将分析对象群中所包含的预定单核苷酸多态性位点的数量设定在上述范围内,能够得到足以确认亲子鉴定的CPI。
另外,从更可靠地获得足以确认亲子鉴定的CPI的观点来看,作为分析基础的分析对象群中所包含的预定单核苷酸多态性位点的数量优选为60以上,更优选为100以上,进一步优选为200以上。
此外,即使对次要等位基因的出现频率极低的单核苷酸多态性位点的集合进行分析,每个PI也会显示出全面的低值。因此,不可能获得足以有效地确认亲子鉴定的CPI。本发明所使用的分析对象群中所包含的单核苷酸多态性位点的次要等位基因的出现频率为1%~50%,适合于获得有效的CPI。
计算CPI之后,可以求出父权肯定概率(POP)。POP可以使用下述式计算。
[数学式1]
接下来,将描述用于执行母子鉴定的实施例。首先,对基于假母子的基因分型结果进行母子鉴定的方法进行说明。
在本实施例的情况下,例如,根据上述表5所示的PI计算式,可以计算出如下表7所示的母性指数(MI)。
[表7]
[表7]
此外,通过将MI进行总乘积,可以计算出母子关系的综合母性指数(CMI)。此外,可以根据上述POP计算式来求出母权肯定概率(Probability of Maternal,POM)。
接下来,将说明基于父亲、疑母和孩子的基因分型结果进行母子鉴定的方式。在这种情况下,母子鉴定是在假设父亲是孩子的亲生父亲的情况下进行的。
这种情况下的MI计算可以将上述表6中的“疑父”替换为“疑母”并且将“母亲”替换为“父亲”并作必要的修正。具体计算方法如表8所示。
[表8]
[表8]
<3-3>用于评估染色体数异常的指标计算工序(出生后)
用于评估出生后的染色体数异常的指标计算工序是如下的工序:计算用于评估从出生后的孩子、父亲和母亲中选出的一人或两人以上中13号染色体、18号染色体、21号染色体、X染色体和Y染色体的数量是否存在异常的指标。在进行用于评估染色体数异常的指标计算工序时,对满足上述条件(iii)的分析对象群进行分析。
具体实施方式基本上可以直接应用上述“<2-2>”中关于出生前的说明。不同的是,出生前,用于分析孩子的染色体数异常的样本是循环无细胞核酸样本,但出生后,则使用从孩子采集的孩子核酸样本。
由于评估是使用孩子出生后的核酸样本进行的,因此如果孩子存在染色体数异常,则计算出的Z分数或NCV与使用循环无细胞核酸样本时相比将会有非常明显的差异
以下是在孩子出生后可以采用的本发明的实施例的示例。
对满足条件(i)至(iii)中的全部条件的分析对象群进行分析的形式
·实施表型分析工序、亲子鉴定工序以及用于评估染色体数异常的指标计算工序的实施例(实施例5)
对满足(i)、(ii)条件的分析对象群进行分析的形式
·进行表型分析工序和亲子鉴定工序的实施方式(实施例6)
对满足(i)和(iii)条件的分析对象群进行分析的形式
·实施表型分析工序和用于评估染色体数异常的指标计算工序的实施方式(实施例7)
对满足(ii)和(iii)条件的分析对象群进行分析的形式
·实施亲子鉴定工序和用于评估染色体数异常的指标计算工序的实施方式(实施例8)
下面,将详细解释可以在孩子出生后采用的实施例5至实施例8。
<3-4>实施例5(出生后的表型分析工序、亲子鉴定工序以及用于评估染色体数异常的指标计算工序的组合)
实施例5为具有以下工序的实施方式:除了基因分型工序之外,还包括亲子鉴定工序、用于评估染色体数异常的指标计算工序以及表型分析工序这三种类型的检测工序。
在实施例5中,对包含满足以下条件(i)~(iii)中的全部条件的单核苷酸多态性位点的分析对象群进行分析。
(i)已知与表型有关联性的单核苷酸多态性位点的数量占分析对象群中所包含的单核苷酸多态性位点总数的比例为10%以上。
(ii)次要等位基因的出现频率占分析对象群中所包含的单核苷酸多态性位点总数的1%至50%,并且在染色体上彼此相距20kb以上的单核苷酸多态性位点的数量的比例为10%以上。
(iii)存在于13号染色体、18号染色体、21号染色体、X染色体、Y染色体上的单核苷酸多态性位点的数量占分析对象群中所包含的单核苷酸多态性位点总数的比例为10%以上。
通过对包含满足条件(i)~(iii)中的全部条件的单核苷酸多态性位点的分析对象群进行分析,可以获得可用于以下三种类型的检测工序中任何一种的数据:表型分析工序、亲子鉴定工序、用于评估染色体数异常的指标计算工序。
接下来,针对该分析对象群中所包含的各个单核苷酸多态性位点,进行至少对包含含有疑父的遗传信息的核酸的父亲核酸样本和子代核酸样本进行分析的基因分型工序。
在基因分型工序中,可以进行上述(a)至(c)的基因分型。具体实施例及其说明如下。
-对(a)疑父和(c)孩子进行基因分型的形式:亲子鉴定工序中可以基于表5进行PI计算。
-对(a)疑父、(b)母亲和(c)孩子进行基因分型的形式:亲子鉴定工序中可以基于表6进行PI计算。
·对(b)假母和(c)孩子进行基因分型的形式:在亲子鉴定工序中可以基于表7进行MI计算。
-对(b)疑母、(a)父亲和(c)孩子进行基因分型的形式:在亲子鉴定工序中可以基于表8进行MI计算。
实施例5中,基于基因分型工序的结果,进行亲子鉴定工序和表型分析工序,以鉴定疑父与孩子之间是否存在亲子关系或疑母与孩子之间是否存在亲子关系。此外,基于通过分析核酸样本获得的数据,执行用于评估染色体数异常的指标计算工序。
<3-5>实施例6(出生后的亲子鉴定工序与表型分析工序的组合)
实施例6是包括亲缘鉴定工序和表型分析工序的实施方式。通过进行亲子鉴定,可以获得能够确认次要等位基因是否源自父亲或母亲的效果。
在实施例6中,对含有满足下述条件(i)和(ii)的单核苷酸多态性位点的分析对象群进行分析。
(i)已知与表型有关联性的单核苷酸多态性位点的数量占分析对象群中所包含的单核苷酸多态性位点总数的比例为10%以上。
(ii)次要等位基因的出现频率占分析对象群中所包含的单核苷酸多态性位点总数的1%至50%,并且在染色体上彼此相距20kb以上的单核苷酸多态性位点的数量的比例为10%以上。
对于满足上述条件的分析对象群的基因分型的实施方式,可以直接应用实施例5的说明。
通过对含有满足条件(i)和(ii)的单核苷酸多态性位点的分析对象群进行分析,实施例6中分析的分析对象群可以获得可用于以下两种类型的检测工序中任何一种的数据:表型分析工序和亲子鉴定工序。
实施例6中,基于基因分型工序的结果,进行亲子鉴定工序和表型分析工序,以鉴定疑父与孩子之间是否存在亲子关系或疑母与孩子之间是否存在亲子关系。
另外,在实施例5和实施例6中,在亲子关系检验工序中,当确认了疑父与孩子之间是否存在亲子关系或疑母与孩子之间是否存在亲子关系时,可以执行表型分析工序,而当亲子关系被否定时,可以不执行表型分析工序。
当然,无论亲子鉴定工序的结果如何,都可以进行表型分析工序。
在实施例5和实施例6中,可以基于从一次样本分析获得的数据进行亲子鉴定和表型分析。在本实施例中,通过在亲子鉴定工序中确定疑父与孩子之间或疑母与孩子之间的亲子关系,在表型分析工序中可以判别源自父亲或母亲的风险等位基因否会遗传给孩子。
<3-6>实施例7(出生后的表型分析工序与用于评估染色体数异常的指标计算工序的组合)
实施例7为具有以下工序的实施方式:除了基因分型工序之外,还包括用于评估染色体数异常的指标计算工序和表型分析工序。根据实施例7,具有以下效果:基于一次样本分析而得到的数据,能够同时进行用于评估染色体数异常的指标计算工序和表型分析工序这两种检测工序。
在实施例7中,对含有满足下述条件(i)和(iii)的单核苷酸多态性位点的分析对象群进行分析。
(i)已知与表型有关联性的单核苷酸多态性位点的数量占分析对象群中所包含的单核苷酸多态性位点总数的比例为10%以上。
(iii)存在于13号染色体、18号染色体、21号染色体、X染色体、Y染色体上的单核苷酸多态性位点的数量占分析对象群中所包含的单核苷酸多态性位点总数的比例为10%以上。
通过对包含满足条件(i)和(iii)的单核苷酸多态性位点的分析对象群进行分析,可以获得可用于表型分析工序和用于评估染色体数异常的指标计算工序中的任何一种的数据。由此,实施例7使得可以执行用于评估染色体数异常的指标计算工序和表型分析工序两者。
在实施例7中,使用检测对象的基因组DNA进行基因分型并进行表型分析。
另外,上述说明可以直接应用于实施例7中评估染色体数异常的指标计算工序和表型分析工序的具体实施方式。
<3-7>实施例8(出生后的亲子鉴定工序与用于评估染色体数异常的指标计算工序的组合)
实施例8为具有以下工序的实施方式:除了基因分型工序之外,还包括亲子鉴定工序和用于评估染色体数异常的指标计算工序。根据实施例8,可以基于通过一次样本分析而获得的数据来进行亲子鉴定和染色体数异常的评估。
在实施例8中,对含有满足下述条件(ii)和(iii)的单核苷酸多态性位点的分析对象群进行分析。
(ii)次要等位基因的出现频率占分析对象群中所包含的单核苷酸多态性位点总数的1%至50%,并且在染色体上彼此相距20kb以上的单核苷酸多态性位点的数量的比例为10%以上。
(iii)存在于13号染色体、18号染色体、21号染色体、X染色体、Y染色体上的单核苷酸多态性位点的数量占分析对象群中所包含的单核苷酸多态性位点总数的比例为10%以上。
通过对该分析对象群进行分析,可以获得可用于亲子鉴定工序和用于评估染色体数异常的指标计算工序中的任何一种的数据。由此,实施例8使得可以执行亲子鉴定工序和用于评估染色体数异常的指标计算工序两者。
对于实施例8中的基因分型工序的实施方式,可以比照应用实施例5的说明。另外,上述说明可以直接应用于实施例8中的亲子鉴定工序和用于评估染色体数异常的指标计算工序的具体实施方式。
[实施例]
<试验例1>CPI模拟
对构成分析对象群(用于亲子鉴定的SNV集合)的SNV中次要等位基因的出现频率对CPI的影响进行了模拟。在本试验例中,假设仅根据疑父和孩子的基因分型的结果进行亲子鉴定的情况。
使用由次要等位基因的出现频率取0.05至0.5之间的单个值的SNV构成的分析对象群进行基因分型,在分析对象群中所包含的所有SNV中,假设当疑父是孩子的亲生父亲时,观察到一致的遗传型,将此时计算出的CPI值绘制在纵轴上,将分析对象群中所包含的SNV的数量绘制在横轴上(图1)。
如图1所示,当使用仅由次要等位基因的出现频率为0.05的SNV构成的分析对象群时,即使分析对象群中所包含的SNV数量超过1,000个,也没有计算出确认亲子关系的有效CPI(图1)。
另一方面,当使用仅由次要等位基因的出现频率为0.1以上的单个SNV构成的分析对象群时,可以计算具有足以确认亲子关系的值的CPI。研究还表明,随着次要等位基因的出现频率的增加,CPI会在SNV数量减少的情况下达到10,000。
<试验例2>CPI模拟
与试验例1同样地,在构成用于亲子鉴定的分析对象群的SNV中,模拟了次要等位基因的出现频率对CPI的影响。在该试验例中,假设根据母亲、疑父和孩子的基因分型结果进行亲子鉴定。
使用由次要等位基因的出现频率取0.05至0.5之间的单个值的SNV构成的分析对象群进行基因分型,在分析对象群中所包含的所有SNV中,假设当疑父是孩子的亲生父亲时,观察到一致的遗传型,将此时计算出的CPI值绘制在纵轴上,将分析对象群中所包含的SNV的数量绘制在横轴上(图2)。
如图2所示,即使使用仅由次要等位基因的出现频率为0.05的SNV构成的分析对象群,也可以计算出有效的CPI来确认亲子关系(图2)。此外,研究还表明,随着次要等位基因的出现频率的增加,CPI会在SNV数量减少的情况下达到10,000(图2)。
[产业上的可利用性]
本发明可应用于亲子鉴定、染色体数异常检测、DTC检测或单基因疾病分析。
[表9-1]
[表9-2]
[表9-3]
[表9-4]
[表9-5]
[表9-6]
[表9-7]
[表9-8]
[表9-9]
[表9-10]
[表9-11]
[表9-12]
[表9-13]
[表9-14]
Claims (5)
1.一种遗传学分析方法,其用于分析由多个单核苷酸多态性位点组成的分析对象群,
所述分析对象群满足选自下述条件(i)至条件(iii)中的2个以上条件:
(i)已知与表型有关联性的单核苷酸多态性位点的数量占分析对象群中所包含的单核苷酸多态性位点总数的比例为10%以上;
(ii)次要等位基因的出现频率占分析对象群中所包含的单核苷酸多态性位点总数的1%至50%,并且在染色体上彼此相距20kb以上的单核苷酸多态性位点的数量的比例为10%以上;以及
(iii)存在于13号染色体、18号染色体、21号染色体、X染色体、Y染色体上的单核苷酸多态性位点的数量占分析对象群中所包含的单核苷酸多态性位点总数的比例为10%以上,并且
对以下样本进行分析:
包含含有孩子遗传信息的核酸的孩子核酸样本;以及
包含含有父亲遗传信息的核酸的父亲核酸样本和/或包含含有母亲遗传信息的核酸的母亲核酸样本,并且
在每个样本所包含的核酸中获取数据,所述数据包括:所述分析对象群中所包含的多个单核苷酸多态性位点处的等位基因的序列信息、以及反映包含所述单核苷酸多态性位点的区域和/或所述等位基因的相对或绝对存在量的数值,并且
所述遗传学分析方法包括:基于所述数据进行基因分型的基因分型工序,
进一步,基于一次所述分析而得到的所述数据,进行从以下的表型分析工序、亲子鉴定工序、用于评估染色体数异常的指标计算工序中选择的2种以上的工序:
在包括所述表型分析工序的情况下,所述分析对象群满足上述条件(i),
在包含所述亲子鉴定工序的情况下,所述分析对象群满足上述条件(ii),
在包含所述用于评估所述染色体数异常的指标计算工序的情况下,所述分析对象群满足上述条件(iii),
<表型分析工序>
基于在所述基因分型工序中获得的已知与所述表型有关联性的单核苷酸多态性位点的基因分型的结果,分析与所述单核苷酸多态性位点处的次要等位基因相关的所述表型至少在所述孩子中表达的可能性,但是,这不包括诊断人类是否患有疾病,
<亲子鉴定工序>
基于所述基因分型工序的结果来求出所述多个单核苷酸多态性位点中每一个的父性指数并将所述父性指数相乘以求出综合父性指数,并鉴定所述父亲与所述孩子之间是否存在亲子关系;或者
基于所述基因分型工序的结果来求出所述多个单核苷酸多态性位点中的每一个的母性指数并将所述母性指数相乘以求出综合母性指数,并是鉴定所述母亲与所述孩子之间是否存在亲子关系的工序,
所述亲子鉴定工序包括以下工序:对针对所述孩子出生前是胎儿且进行父子鉴定的情况、所述孩子出生后进行父子鉴定的情况以及所述孩子出生后进行母子鉴定的情况中的每种情况,通过以下方式算出父性指数或母性指数,
孩子出生前是胎儿且进行父子鉴定的情况:
所述孩子核酸样本是从怀有所述孩子的母亲采集的循环无细胞核酸样本,
当通过分析所述循环无细胞核酸样本和所述父亲核酸样本这两种样本对所述父亲和所述胎儿进行基因分型时,基于表1或表2计算父性指数,
当通过分析所述循环无细胞核酸样本、所述父亲核酸样本和所述母亲核酸样本这三种样本对所述父亲、所述母亲和所述胎儿进行基因分型时,基于表3或表4计算父性指数,
孩子出生后进行父子鉴定的情况:
当通过分析所述孩子核酸样本和所述父亲核酸样本这两种样本对所述父亲和所述孩子进行基因分型时,基于表5计算父性指数,
当通过分析所述孩子核酸样本、所述父亲核酸样本和所述母亲核酸样本这三种样本来对所述父亲、所述母亲和所述孩子进行基因分型时,基于表6计算父性指数,
孩子出生后进行母子鉴定的情况:
当通过分析所述孩子核酸样本和所述母亲核酸样本这两种样本对所述母亲和所述孩子进行基因分型时,基于表7计算母性指数,
当通过分析所述孩子核酸样本、所述父亲核酸样本和所述母亲核酸样本这三种样本对所述父亲、所述母亲和所述孩子进行基因分型时,基于表8计算母性指数,
[表1]
[表1]
[表2]
[表2]
[表3]
[表3]
[表4]
[表4]
[表5]
[表5]
[表6]
[表6]
[表7]
[表7]
[表8]
[表8]
在表1至表4中,循环无细胞核酸样本的分析中将信号强度相对较高的等位基因记为A,将信号强度相对较低的等位基因记为B,
在表1和表2中,k0为假阴性率,kb为假阳性率,a为A的出现频率,b为B的出现频率,
在表5至表8中,μ为突变率,a和b分别为等位基因A和等位基因B的出现频率,α为等位基因A的平均排除力,β为等位基因B的平均排除力,
<用于评估染色体数异常的指标计算工序>
基于所述数据中所包含的所述数值,算出Z分数或归一化染色体值NCV作为用于评估至少在所述孩子中的13号染色体、18号染色体、21号染色体、X染色体和Y染色体上是否存在数值突变的指标,
基于下述式(1)求出N号染色体的Z分数(ZchrN),并且通过下述式(2)求出N号染色体相对于参考M号染色体的NCV(NCVchrN by chrM),
[数学式2]
式(1)中,N为13、18、21、X或Y,
“chr N的比例”是指在分析所述孩子核酸样本时,反映N号染色体的存在量的数值与反映全染色体的存在量的数值的比例,所述全染色体不包括13号染色体、18号染色体、21号染色体、X染色体和Y染色体,
“参考二体群体中chr N的比例的平均值”是指对含有正常染色体数(二体性)的多个标准样本进行分析时,反映N号染色体存在量的数值与反映全染色体存在量的数值比例的平均,
“参考二体群体中chr N的比例的SD”是指对含有正常数量染色体(二体性)的多个标准样本进行分析时,反映N号染色体的存在量的数值与反映全染色体存在量的数值比例的标准偏差,
[数学式3]
式(2)中,“Chr N by Chr M的归一化比例”是指在分析所述孩子核酸样本时反映N号染色体的存在量的数值与反映M号染色体的存在量的数值的比例,
“参考二体群体中chr N的平均归一化比例”是指在分析含有正常染色体数量(二体性)的多个标准样本时,反映N号染色体的存在量的数值与反映M号染色体的存在量的数值的比例的平均,
“参考二体群体中chr N的平均归一化比例”是指在分析含有正常数量染色体(二体性)的多个标准样本时,反映N号染色体存在量的数值与反映M号染色体存在量的数值比例的标准偏差。
2.根据权利要求1所述的遗传学分析方法,其中,包括所述亲子鉴定工序、用于评估所述染色体数异常的指标计算工序以及所述表型分析工序中的全部。
3.根据权利要求1或2所述的遗传学分析方法,其中,所述分析对象群满足条件(i)至条件(iii)中的全部,
已知与表型有关联性、次要等位基因的出现频率为1%至50%、在染色体上彼此相距20kb以上的距离、且存在于13号染色体、18号染色体、21号染色体、X染色体和Y染色体上的单核苷酸多态性位点占构成分析对象群的单核苷酸多态性位点总数的比例为10%以上。
4.根据权利要求1至3中任一项所述的遗传学分析方法,其中,所述孩子是母亲子宫内的胎儿,所述孩子核酸样本是从所述母亲采集的循环无细胞核酸样本。
5.根据权利要求1至3中任一项所述的遗传学分析方法,其中,所述孩子是出生后的孩子。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2022137059 | 2022-08-30 | ||
JP2022-137059 | 2022-08-30 | ||
JP2022205502A JP7331325B1 (ja) | 2022-08-30 | 2022-12-22 | 2種以上の検査を実施可能な遺伝学的解析方法 |
JP2022-205502 | 2022-12-22 | ||
PCT/JP2023/019597 WO2024047977A1 (ja) | 2022-08-30 | 2023-05-26 | 2種以上の検査を実施可能な遺伝学的解析方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117980504A true CN117980504A (zh) | 2024-05-03 |
Family
ID=87576916
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202380013654.5A Pending CN117980504A (zh) | 2022-08-30 | 2023-05-26 | 能够进行两种以上检测的遗传学分析方法 |
Country Status (3)
Country | Link |
---|---|
JP (1) | JP7331325B1 (zh) |
CN (1) | CN117980504A (zh) |
WO (1) | WO2024047977A1 (zh) |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2386659B1 (en) * | 2003-11-26 | 2014-01-15 | Celera Corporation | Genetic polymorphisms associated with cardiovascular disorders and drug response, methods of detection and uses thereof |
CA2821906C (en) * | 2010-12-22 | 2020-08-25 | Natera, Inc. | Methods for non-invasive prenatal paternity testing |
-
2022
- 2022-12-22 JP JP2022205502A patent/JP7331325B1/ja active Active
-
2023
- 2023-05-26 CN CN202380013654.5A patent/CN117980504A/zh active Pending
- 2023-05-26 WO PCT/JP2023/019597 patent/WO2024047977A1/ja active Application Filing
Also Published As
Publication number | Publication date |
---|---|
WO2024047977A1 (ja) | 2024-03-07 |
JP2024035014A (ja) | 2024-03-13 |
JP7331325B1 (ja) | 2023-08-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11441185B2 (en) | Noninvasive detection of fetal aneuploidy in egg donor pregnancies | |
JP6328934B2 (ja) | 非侵襲性出生前親子鑑定法 | |
KR102339760B1 (ko) | 대규모 병렬 게놈 서열분석을 이용한 태아 염색체 이수성의 진단 방법 | |
US9353414B2 (en) | Noninvasive diagnosis of fetal aneuploidy by sequencing | |
US9163282B2 (en) | Methods for non-invasive prenatal ploidy calling | |
EP3663414B1 (en) | Statistical analysis for non-invasive y chromosome aneuploidy determination | |
US20170051355A1 (en) | Highly multiplex pcr methods and compositions | |
Hill et al. | Uses of cell free fetal DNA in maternal circulation | |
US20140100134A1 (en) | Methods for non-invasive prenatal ploidy calling | |
CN103492589A (zh) | 多胎妊娠的分子测试 | |
US20190338350A1 (en) | Method, device and kit for detecting fetal genetic mutation | |
CN106939334A (zh) | 一种孕妇血浆中胎儿dna含量的检测方法 | |
US9938575B2 (en) | Compositions and methods for high-throughput nucleic acid analysis and quality control | |
EP2965243B1 (en) | Non-invasive fetal sex determination | |
Vahab Saadi et al. | Quantitative fluorescence polymerase chain reaction (QF-PCR) for prenatal diagnosis of chromosomal aneuploidies | |
JP7331325B1 (ja) | 2種以上の検査を実施可能な遺伝学的解析方法 | |
CN105567809A (zh) | 具有不同表达量的基因的鉴定方法 | |
EP2847347B1 (en) | Highly multiplex pcr methods and compositions | |
TW202438680A (zh) | 可實施2種以上檢測的遺傳學分析方法 | |
AU2021200569B2 (en) | Noninvasive diagnosis of fetal aneuploidy by sequencing | |
US20230101627A1 (en) | Noninvasive detection of fetal aneuploidy in egg donor pregnancies | |
Manegold-Brauer et al. | Clinical implementation of next-generation sequencing in the field of prenatal diagnostics | |
Morgan | 14 Considerations in Estimating Genotype in Nutrigenetic Studies | |
Yurdakul et al. | Performance of MLPA as a screening method for aneuploidy in uncultured amniocytes |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |