JP2022502786A - 胚における染色体異常を識別するためのシステムおよび方法 - Google Patents
胚における染色体異常を識別するためのシステムおよび方法 Download PDFInfo
- Publication number
- JP2022502786A JP2022502786A JP2021518537A JP2021518537A JP2022502786A JP 2022502786 A JP2022502786 A JP 2022502786A JP 2021518537 A JP2021518537 A JP 2021518537A JP 2021518537 A JP2021518537 A JP 2021518537A JP 2022502786 A JP2022502786 A JP 2022502786A
- Authority
- JP
- Japan
- Prior art keywords
- sequence information
- sample
- genomic sequence
- baseline
- dataset
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 161
- 210000002257 embryonic structure Anatomy 0.000 title claims abstract description 48
- 208000031404 Chromosome Aberrations Diseases 0.000 title claims abstract description 25
- 206010008805 Chromosomal abnormalities Diseases 0.000 title claims abstract description 22
- 230000000694 effects Effects 0.000 claims abstract description 51
- 210000001161 mammalian embryo Anatomy 0.000 claims abstract description 45
- 230000002759 chromosomal effect Effects 0.000 claims abstract description 15
- 238000000611 regression analysis Methods 0.000 claims abstract description 14
- 208000036878 aneuploidy Diseases 0.000 claims description 38
- 231100001075 aneuploidy Toxicity 0.000 claims description 35
- 210000000349 chromosome Anatomy 0.000 claims description 27
- 238000013528 artificial neural network Methods 0.000 claims description 26
- 230000008569 process Effects 0.000 claims description 22
- 238000012937 correction Methods 0.000 claims description 14
- 238000013500 data storage Methods 0.000 claims description 13
- 238000004458 analytical method Methods 0.000 claims description 12
- 208000020584 Polyploidy Diseases 0.000 claims description 7
- 230000003321 amplification Effects 0.000 claims description 6
- 230000014509 gene expression Effects 0.000 claims description 6
- 108091070501 miRNA Proteins 0.000 claims description 6
- 239000002679 microRNA Substances 0.000 claims description 6
- 238000003199 nucleic acid amplification method Methods 0.000 claims description 6
- 108010047956 Nucleosomes Proteins 0.000 claims description 5
- 210000001623 nucleosome Anatomy 0.000 claims description 5
- 238000012549 training Methods 0.000 claims description 4
- 238000009499 grossing Methods 0.000 claims description 3
- 238000005070 sampling Methods 0.000 claims description 3
- 239000000523 sample Substances 0.000 description 136
- 238000012163 sequencing technique Methods 0.000 description 33
- 150000007523 nucleic acids Chemical class 0.000 description 32
- 239000012634 fragment Substances 0.000 description 27
- 210000004027 cell Anatomy 0.000 description 25
- 102000039446 nucleic acids Human genes 0.000 description 23
- 108020004707 nucleic acids Proteins 0.000 description 23
- 238000010801 machine learning Methods 0.000 description 18
- 108020004414 DNA Proteins 0.000 description 15
- 102000053602 DNA Human genes 0.000 description 15
- 238000007481 next generation sequencing Methods 0.000 description 15
- 239000002773 nucleotide Substances 0.000 description 15
- 125000003729 nucleotide group Chemical group 0.000 description 14
- 238000013473 artificial intelligence Methods 0.000 description 12
- 108091028043 Nucleic acid sequence Proteins 0.000 description 10
- 102000040430 polynucleotide Human genes 0.000 description 10
- 108091033319 polynucleotide Proteins 0.000 description 10
- 239000002157 polynucleotide Substances 0.000 description 10
- 229920002477 rna polymer Polymers 0.000 description 10
- NOIRDLRUNWIUMX-UHFFFAOYSA-N 2-amino-3,7-dihydropurin-6-one;6-amino-1h-pyrimidin-2-one Chemical compound NC=1C=CNC(=O)N=1.O=C1NC(N)=NC2=C1NC=N2 NOIRDLRUNWIUMX-UHFFFAOYSA-N 0.000 description 9
- 230000002159 abnormal effect Effects 0.000 description 9
- 108090000623 proteins and genes Proteins 0.000 description 9
- 238000012217 deletion Methods 0.000 description 8
- 230000037430 deletion Effects 0.000 description 8
- 238000005516 engineering process Methods 0.000 description 7
- 238000012545 processing Methods 0.000 description 7
- 108091034117 Oligonucleotide Proteins 0.000 description 6
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 description 6
- 210000001766 X chromosome Anatomy 0.000 description 6
- 230000008859 change Effects 0.000 description 6
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 6
- 230000006870 function Effects 0.000 description 6
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 6
- 238000010606 normalization Methods 0.000 description 6
- 210000002593 Y chromosome Anatomy 0.000 description 5
- 238000004891 communication Methods 0.000 description 5
- 230000002068 genetic effect Effects 0.000 description 5
- 238000012800 visualization Methods 0.000 description 5
- 229930024421 Adenine Natural products 0.000 description 4
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 4
- 230000004913 activation Effects 0.000 description 4
- 229960000643 adenine Drugs 0.000 description 4
- 238000013459 approach Methods 0.000 description 4
- 230000005540 biological transmission Effects 0.000 description 4
- 238000005251 capillar electrophoresis Methods 0.000 description 4
- 230000000295 complement effect Effects 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 238000009396 hybridization Methods 0.000 description 4
- 230000010354 integration Effects 0.000 description 4
- 208000030454 monosomy Diseases 0.000 description 4
- 239000002777 nucleoside Substances 0.000 description 4
- 102000004169 proteins and genes Human genes 0.000 description 4
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 4
- 208000037280 Trisomy Diseases 0.000 description 3
- 230000003322 aneuploid effect Effects 0.000 description 3
- 230000008901 benefit Effects 0.000 description 3
- 229940104302 cytosine Drugs 0.000 description 3
- 238000007405 data analysis Methods 0.000 description 3
- 238000001514 detection method Methods 0.000 description 3
- 238000002474 experimental method Methods 0.000 description 3
- 125000003835 nucleoside group Chemical group 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 239000007787 solid Substances 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 230000007704 transition Effects 0.000 description 3
- 230000005945 translocation Effects 0.000 description 3
- 238000002054 transplantation Methods 0.000 description 3
- 229940035893 uracil Drugs 0.000 description 3
- IQFYYKKMVGJFEH-XLPZGREQSA-N Thymidine Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](CO)[C@@H](O)C1 IQFYYKKMVGJFEH-XLPZGREQSA-N 0.000 description 2
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 2
- 230000005856 abnormality Effects 0.000 description 2
- OIRDTQYFTABQOQ-KQYNXXCUSA-N adenosine Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O OIRDTQYFTABQOQ-KQYNXXCUSA-N 0.000 description 2
- 238000003556 assay Methods 0.000 description 2
- 230000001580 bacterial effect Effects 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000002487 chromatin immunoprecipitation Methods 0.000 description 2
- 238000004590 computer program Methods 0.000 description 2
- 230000002559 cytogenic effect Effects 0.000 description 2
- 238000007847 digital PCR Methods 0.000 description 2
- 238000009826 distribution Methods 0.000 description 2
- 235000013601 eggs Nutrition 0.000 description 2
- 238000013485 heteroscedasticity test Methods 0.000 description 2
- 150000002500 ions Chemical class 0.000 description 2
- 230000033001 locomotion Effects 0.000 description 2
- 210000004962 mammalian cell Anatomy 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 238000002493 microarray Methods 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 239000000178 monomer Substances 0.000 description 2
- 230000035935 pregnancy Effects 0.000 description 2
- 238000002360 preparation method Methods 0.000 description 2
- 238000003753 real-time PCR Methods 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 241000894007 species Species 0.000 description 2
- 238000010561 standard procedure Methods 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- 239000000126 substance Substances 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- 229940113082 thymine Drugs 0.000 description 2
- 210000001519 tissue Anatomy 0.000 description 2
- YKBGVTZYEHREMT-KVQBGUIXSA-N 2'-deoxyguanosine Chemical compound C1=NC=2C(=O)NC(N)=NC=2N1[C@H]1C[C@H](O)[C@@H](CO)O1 YKBGVTZYEHREMT-KVQBGUIXSA-N 0.000 description 1
- CKTSBUTUHBMZGZ-ULQXZJNLSA-N 4-amino-1-[(2r,4s,5r)-4-hydroxy-5-(hydroxymethyl)oxolan-2-yl]-5-tritiopyrimidin-2-one Chemical compound O=C1N=C(N)C([3H])=CN1[C@@H]1O[C@H](CO)[C@@H](O)C1 CKTSBUTUHBMZGZ-ULQXZJNLSA-N 0.000 description 1
- 241000251468 Actinopterygii Species 0.000 description 1
- 241000271566 Aves Species 0.000 description 1
- DWRXFEITVBNRMK-UHFFFAOYSA-N Beta-D-1-Arabinofuranosylthymine Natural products O=C1NC(=O)C(C)=CN1C1C(O)C(O)C(CO)O1 DWRXFEITVBNRMK-UHFFFAOYSA-N 0.000 description 1
- 241000283690 Bos taurus Species 0.000 description 1
- 241000283707 Capra Species 0.000 description 1
- 208000011359 Chromosome disease Diseases 0.000 description 1
- RYGMFSIKBFXOCR-UHFFFAOYSA-N Copper Chemical compound [Cu] RYGMFSIKBFXOCR-UHFFFAOYSA-N 0.000 description 1
- 238000000018 DNA microarray Methods 0.000 description 1
- 241000283086 Equidae Species 0.000 description 1
- 241000282412 Homo Species 0.000 description 1
- 241000270322 Lepidosauria Species 0.000 description 1
- 241000699670 Mus sp. Species 0.000 description 1
- 206010028980 Neoplasm Diseases 0.000 description 1
- 241001494479 Pecora Species 0.000 description 1
- 241000288906 Primates Species 0.000 description 1
- 241000700159 Rattus Species 0.000 description 1
- 238000012300 Sequence Analysis Methods 0.000 description 1
- 108020004459 Small interfering RNA Proteins 0.000 description 1
- 210000001744 T-lymphocyte Anatomy 0.000 description 1
- 108020004566 Transfer RNA Proteins 0.000 description 1
- 231100000071 abnormal chromosome number Toxicity 0.000 description 1
- 150000001413 amino acids Chemical class 0.000 description 1
- 210000004102 animal cell Anatomy 0.000 description 1
- 230000002547 anomalous effect Effects 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 210000003719 b-lymphocyte Anatomy 0.000 description 1
- IQFYYKKMVGJFEH-UHFFFAOYSA-N beta-L-thymidine Natural products O=C1NC(=O)C(C)=CN1C1OC(CO)C(O)C1 IQFYYKKMVGJFEH-UHFFFAOYSA-N 0.000 description 1
- 230000031018 biological processes and functions Effects 0.000 description 1
- 230000033228 biological regulation Effects 0.000 description 1
- 238000001574 biopsy Methods 0.000 description 1
- 201000011510 cancer Diseases 0.000 description 1
- 210000000845 cartilage Anatomy 0.000 description 1
- 239000003153 chemical reaction reagent Substances 0.000 description 1
- 208000024971 chromosomal disease Diseases 0.000 description 1
- 239000002299 complementary DNA Substances 0.000 description 1
- 230000001010 compromised effect Effects 0.000 description 1
- 230000001276 controlling effect Effects 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 229910052802 copper Inorganic materials 0.000 description 1
- 239000010949 copper Substances 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 230000000875 corresponding effect Effects 0.000 description 1
- 210000004748 cultured cell Anatomy 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 239000005549 deoxyribonucleoside Substances 0.000 description 1
- 230000001627 detrimental effect Effects 0.000 description 1
- XPPKVPWEQAFLFU-UHFFFAOYSA-J diphosphate(4-) Chemical compound [O-]P([O-])(=O)OP([O-])([O-])=O XPPKVPWEQAFLFU-UHFFFAOYSA-J 0.000 description 1
- 235000011180 diphosphates Nutrition 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 238000006911 enzymatic reaction Methods 0.000 description 1
- 210000003527 eukaryotic cell Anatomy 0.000 description 1
- 238000007667 floating Methods 0.000 description 1
- 238000007672 fourth generation sequencing Methods 0.000 description 1
- 230000002538 fungal effect Effects 0.000 description 1
- 210000004408 hybridoma Anatomy 0.000 description 1
- 230000001900 immune effect Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000009027 insemination Effects 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 239000010410 layer Substances 0.000 description 1
- 238000012886 linear function Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 210000004185 liver Anatomy 0.000 description 1
- 210000004072 lung Anatomy 0.000 description 1
- 210000002540 macrophage Anatomy 0.000 description 1
- 230000013011 mating Effects 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 108020004999 messenger RNA Proteins 0.000 description 1
- 238000000386 microscopy Methods 0.000 description 1
- 238000010369 molecular cloning Methods 0.000 description 1
- 210000003205 muscle Anatomy 0.000 description 1
- 230000035772 mutation Effects 0.000 description 1
- 210000000822 natural killer cell Anatomy 0.000 description 1
- 210000000944 nerve tissue Anatomy 0.000 description 1
- 230000006855 networking Effects 0.000 description 1
- 230000001537 neural effect Effects 0.000 description 1
- 238000001821 nucleic acid purification Methods 0.000 description 1
- 150000003833 nucleoside derivatives Chemical class 0.000 description 1
- 238000002515 oligonucleotide synthesis Methods 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 102000054765 polymorphisms of proteins Human genes 0.000 description 1
- 238000011176 pooling Methods 0.000 description 1
- 210000001236 prokaryotic cell Anatomy 0.000 description 1
- 238000000734 protein sequencing Methods 0.000 description 1
- 238000000746 purification Methods 0.000 description 1
- 238000012175 pyrosequencing Methods 0.000 description 1
- 230000006798 recombination Effects 0.000 description 1
- 238000005215 recombination Methods 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 239000002342 ribonucleoside Substances 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 238000002864 sequence alignment Methods 0.000 description 1
- 210000003765 sex chromosome Anatomy 0.000 description 1
- 230000020509 sex determination Effects 0.000 description 1
- 238000010008 shearing Methods 0.000 description 1
- 210000003491 skin Anatomy 0.000 description 1
- 230000000392 somatic effect Effects 0.000 description 1
- 210000000130 stem cell Anatomy 0.000 description 1
- 239000000758 substrate Substances 0.000 description 1
- 229940104230 thymidine Drugs 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
- 210000004291 uterus Anatomy 0.000 description 1
- 230000035899 viability Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B30/00—ICT specially adapted for sequence analysis involving nucleotides or amino acids
- G16B30/10—Sequence alignment; Homology search
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6876—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
- C12Q1/6883—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/18—Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N7/00—Computing arrangements based on specific mathematical models
- G06N7/01—Probabilistic graphical models, e.g. probabilistic networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N7/00—Computing arrangements based on specific mathematical models
- G06N7/02—Computing arrangements based on specific mathematical models using fuzzy logic
- G06N7/04—Physical realisation
- G06N7/046—Implementation by means of a neural network
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
- G16B20/10—Ploidy or copy number detection
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
- G16B20/20—Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B40/00—ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
- G16B40/10—Signal processing, e.g. from mass spectrometry [MS] or from PCR
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B40/00—ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
- G16B40/20—Supervised data analysis
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B45/00—ICT specially adapted for bioinformatics-related data visualisation, e.g. displaying of maps or networks
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/20—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/30—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
Abstract
Description
本明細書で開示される実施形態は、一般に、子宮へ移植するための胚候補を識別するためのシステムおよび方法に関する。より具体的には、将来の母に移植するための人工受精した胚候補における染色体異常を識別するための自律的なシステムおよび方法が必要である。
人工授精は、将来の母への胚移植へと続いていくことが意図される。胚が与えられる場合、健康な子が成功裡に産まれることを妨げ得る欠陥をチェックすることは重要であり、複数の胚が与えられる場合、IVFの各サイクルにつき最適な胚を選択して、移植の成功確率を増大させなければならない。
1つの局面において、胚における染色体異常を識別するための方法が開示される。胚から得たサンプルゲノム配列情報が受容され、ここで上記サンプルゲノム配列情報は、複数のゲノム配列リードから構成される。上記サンプルゲノム配列情報は、参照ゲノムに対して整列される。上記サンプルゲノム配列情報は、ベースラインゲノム配列情報に対して正規化されて、上記サンプルゲノム配列情報を遺伝子座効果に関して補正し、正規化したサンプルゲノム配列情報データセットを生成する。エラー要因の回帰分析に由来する1種またはこれより多くの補正因子は、上記正規化したサンプルゲノム配列情報データセットに適用されて、技術的効果を補正し、ノイズ除去したサンプルゲノム配列情報データセットを生成する。上記ノイズ除去したサンプルゲノム配列情報データセットにおけるコピー数変動が、上記参照ゲノム上の染色体位置に整列されるゲノム配列リードの頻度が頻度閾値から外れる場合に識別される。
本明細書は、人工受精した移植用胚候補における染色体異常を識別するためのシステムおよび方法の種々の例示的実施形態を記載する。しかし、本開示は、これらの例示的実施形態および適用にも、例示的実施形態および適用が機能するかまたは本明細書で記載される様式にも限定されない。さらに、図面は、単純化した図または部分図を示してもよく、図面の中の要素の寸法は、誇張されていてもよいし、そうでなければ比例していなくてもよい。さらに、用語「上に(on)」、「に取り付けられる(attached to)」、「に接続される(connected to)」、「に連結される(coupled to)」、または類似の文言が本明細書で使用される場合、1つの要素(例えば、材料、層、基材など)は、もう1つの要素「上に」あり得るか、もう1つの要素「に取り付けられ得る」か、「に接続され得る」か、または「に連結され得る」。それは、上記1つの要素が、他方の要素上に直接存在するか、その要素に取り付けられるか、接続されるか、もしくは連結されるか、または上記1つの要素と他方の要素との間に1もしくはこれより多くの介在する要素が存在するかにかかわらない。さらに、要素の列挙(例えば、要素a、b、c)に対して言及される場合、このような言及は、それ自体、列挙された要素の全てより少ない任意の組み合わせ、および/または列挙された要素の全ての組み合わせによって、上記列挙された要素のうちのいずれか1つを含むことが意図される。本明細書中の章立ては、検討を容易にするに過ぎず、考察される要素のいかなる組み合わせをも限定しない。
NGSデータを処理して、染色体異常を識別するための従来の方法
セグメントの重複/欠失、モザイク特徴、ならびに複雑な性別異数性を含む染色体異常の自動化検出のためのシステムおよび方法が、開示される。概念としては、これらのシステムおよび方法は、2つの主なパイプラインを有する: 1)ノイズ除去/正規化(生の配列リードをノイズ除去する)、および2)解釈(ノイズ除去/正規化したシグナルを、カリオグラムおよび臨床上の異数性呼び出しへとデコードする)。
ビンレベル正規化およびノイズ除去が完全である場合、ビンスコアは、1.0が中心になる(これは、コピオースウ状態2を表す)。次いで、機械学習および「人工知能(artificial intelligence)」方法は、遺伝子座スコアをカリオグラムおよび臨床的異数性呼び出しへと解釈(またはデコード)するために使用され得る。
種々の実施形態において、胚における染色体異常を識別するための方法は、コンピューターソフトウェアまたはハードウェアを介して実行され得る。すなわち、図9に示されるように、上記方法は、データノイズ除去エンジン906、人工知能(AI)/機械学習(ML)式解釈エンジン908およびAI/ML式性別異数性識別エンジン910を含むコンピューティングデバイス/システム904上で実行され得る。種々の実施形態において、コンピューティングデバイス/システム904は、直接的な接続を介してまたはインターネット接続を経て、NGSシーケンサー902およびディスプレイデバイス912に通信可能に接続され得る。
本明細書で開示される改善されたシステムおよび方法を、倍数性分類の全体的な正確性における改善を定量するために、胚における染色体異常を識別する従来のアプローチに対して比較した。
本発明は、例えば、以下の項目を提供する。
(項目1)
胚における染色体異常を識別するための方法であって、前記方法は、
胚から得たサンプルゲノム配列情報を受容する工程であって、ここで前記サンプルゲノム配列情報は、複数のゲノム配列リードから構成される、工程;
前記サンプルゲノム配列情報を参照ゲノムに対して整列させる工程;
前記サンプルゲノム配列情報をベースラインゲノム配列情報に対して正規化する工程であって、前記サンプルゲノム配列情報を遺伝子座効果に関して補正し、正規化したサンプルゲノム配列情報データセットを生成する工程;
エラー要因の回帰分析に由来する1種またはこれより多くの補正因子を、前記正規化したサンプルゲノム配列情報データセットに適用して、技術的効果を補正し、ノイズ除去したサンプルゲノム配列情報データセットを生成する工程;および
前記参照ゲノム上の染色体位置に対して整列されたゲノム配列リードの頻度が頻度閾値から外れる場合に、前記ノイズ除去したサンプルゲノム配列情報データセットにおけるコピー数変動を識別する工程、
を包含する方法。
(項目2)
前記ノイズ除去したサンプルゲノム配列情報データセットからカリオグラムまたは分子カリオタイプを生成する工程、
をさらに包含する、項目1に記載の方法。
(項目3)
遺伝子座効果に関する前記サンプルゲノム配列情報を正規化する工程は、
ビンサイズを設定すること;
前記サンプルゲノム配列情報および前記ベースラインゲノム配列情報を、前記ビンサイズに基づいて複数のビンにセグメント化すること;
多くのゲノム配列リードを、前記複数のサンプルゲノム配列情報ビンの各々に対して整列される前記サンプルゲノム配列情報から決定して、前記複数のサンプルゲノム配列情報ビンの各々に関するサンプルビンスコアを生成すること;
多くのゲノム配列リードを、前記複数のベースラインゲノム配列情報ビンの各々に対して整列される前記ベースラインゲノム配列情報から決定して、前記複数のベースラインゲノム配列情報ビンの各々に関するベースラインビンスコアを生成すること;
前記サンプルビンスコアを前記ベースラインビンスコアに対して正規化すること;ならびに
正規化したサンプルゲノム配列情報データセットを生成すること、
をさらに包含する、項目1に記載の方法。
(項目4)
正倍数体胚から得た複数のベースラインゲノム配列情報データセットを受容する工程;
前記複数のベースラインゲノム配列情報データセットの各々に関するビンスコアを決定する工程;
ベースラインゲノム配列情報データセットのサブセットを、前記サンプルゲノム配列情報に対する類似性閾値を超えるビンスコアを用いて、前記複数のベースラインゲノム配列情報データセットから選択する工程;ならびに
ベースラインゲノム配列情報データセットの前記選択したサブセットにおいてビンスコアのメジアン値を決定することによって、前記ベースラインビンスコアを生成する工程、
をさらに包含する、項目3に記載の方法。
(項目5)
前記複数のベースラインゲノム配列情報データセットの各々に関する類似性値を計算する工程であって、ここで前記類似性値は、各ベースラインゲノム配列情報データセットが、前記サンプルゲノム配列情報にどの程度類似するかの尺度である、工程、
をさらに包含する、項目4に記載の方法。
(項目6)
前記類似性値は、ユークリッド距離分析を使用して決定される、項目4に記載の方法。
(項目7)
前記類似性値は、マハラノビス距離分析を使用して決定される、項目4に記載の方法。
(項目8)
前記類似性値は、前記ベースラインゲノム配列情報データセットと前記サンプルゲノム配列情報との間のパーセント類似性である、項目4に記載の方法。
(項目9)
サンプリング効果に関して前記サンプルゲノム配列情報を補正することは、
前記1種またはこれより多くの補正因子を、局所的に重み付けした散布図平滑化回帰分析を使用して計算すること、
をさらに包含する、項目1に記載の方法。
(項目10)
前記エラー要因は、GC含量関連である、項目1に記載の方法。
(項目11)
前記エラー要因は、増幅バイアス関連である、項目1に記載の方法。
(項目12)
前記エラー要因は、二次構造関連である、項目1に記載の方法。
(項目13)
前記エラー要因は、ヌクレオソーム密度関連である、項目1に記載の方法。
(項目14)
前記エラー要因は、miRNA停止関連である、項目1に記載の方法。
(項目15)
前記エラー要因は、遺伝子発現関連である、項目1に記載の方法。
(項目16)
胚における染色体異常を識別するためのシステムであって、前記システムは、
胚から得たサンプルゲノム配列情報を格納するように構成されたデータ格納ユニット;
以下:
前記サンプルゲノム配列情報を前記データストレージから受容し、前記サンプルゲノム配列情報をベースラインゲノム配列情報に対して正規化して、前記サンプルゲノム配列情報を遺伝子座効果に関して補正し、エラー要因の回帰分析に由来する1種またはこれより多くの補正因子を適用して、技術的効果を補正し、ノイズ除去したサンプルゲノム配列情報データセットを生成するように構成されたデータノイズ除去エンジン、および
前記ノイズ除去したサンプルゲノム配列情報データセットにおける染色体位置に対して整列されたゲノム配列リードの頻度が頻度閾値から外れる場合に、前記ノイズ除去したサンプルゲノム配列情報データセットにおけるコピー数変動を識別するように構成された解釈エンジン、
を含む、前記データ格納ユニットに通信可能に接続されたコンピューティングデバイス;ならびに
前記コンピューティングデバイスに通信可能に接続されかつ前記識別したコピー数変動を含む報告書を表示するように構成されたディスプレイ、
を含む、システム。
(項目17)
前記エラー要因は、GC含量関連である、項目16に記載のシステム。
(項目18)
前記エラー要因は、増幅バイアス関電である、項目16に記載のシステム。
(項目19)
前記エラー要因は、二次構造関連である、項目16に記載のシステム。
(項目20)
前記エラー要因は、ヌクレオソーム密度関連である、項目16に記載のシステム。
(項目21)
前記エラー要因は、miRNA停止関連である、項目16に記載のシステム。
(項目22)
前記エラー要因は、遺伝子発現関連である、項目16に記載のシステム。
(項目23)
前記コンピューティングデバイスは、
前記ノイズ除去したサンプルゲノム配列情報データセットを分析して、前記胚の性別異数性状態を分類するために、訓練済みニューラルネットワークを利用するように構成された性別異数性識別エンジン、
をさらに含む、項目16に記載のシステム。
(項目24)
胚における性別異数性を識別するための方法であって、前記方法は、
胚から得たサンプルゲノム配列情報を受容する工程であって、ここで前記サンプルゲノム配列情報は、複数のゲノム配列リードから構成される、工程;
前記サンプルゲノム配列情報を参照ゲノムに対して整列させる工程;
前記サンプルゲノム配列情報をベースラインゲノム配列情報に対して正規化する工程であって、前記サンプルゲノム配列情報を遺伝子座効果に関して補正し、正規化したサンプルゲノム配列情報データセットを生成する工程;
エラー要因の回帰分析に由来する1種またはこれより多くの補正因子を、前記正規化したサンプルゲノム配列情報データセットに適用して、技術的効果を補正し、ノイズ除去したサンプルゲノム配列情報データセットを生成する工程;ならびに
訓練済みニューラルネットワークを利用して、前記ノイズ除去したサンプルゲノム配列情報データセットを分析し、前記胚の性別異数性状態を分類する工程、
を包含する方法。
(項目25)
複数の胚から得たノイズ除去したサンプルゲノム情報サンプルゲノム情報データセットを、既知の性別異数性分類とともに受容する工程;および
ニューラルネットワークを、前記ノイズ除去したサンプルゲノム情報データセットで更新して、前記訓練済みニューラルネットワークを生成する工程、
をさらに包含する、項目24に記載の方法。
(項目26)
前記訓練済みニューラルネットワークは、
入力層;
4つのノードを含む第1の隠れ層;
2つのノードを含む第2の隠れ層;および
異なる性別異数性分類に対応する複数のノードを有する出力層、
から構成される、項目24に記載の方法。
(項目27)
前記ニューラルネットワークは、フィードフォワードニューラルネットワークアーキテクチャを有する、項目25に記載の方法。
(項目28)
バックプロパゲーション技術を適用して、前記ニューラルネットワークを訓練する工程をさらに包含する、項目25に記載の方法。
Claims (28)
- 胚における染色体異常を識別するための方法であって、前記方法は、
胚から得たサンプルゲノム配列情報を受容する工程であって、ここで前記サンプルゲノム配列情報は、複数のゲノム配列リードから構成される、工程;
前記サンプルゲノム配列情報を参照ゲノムに対して整列させる工程;
前記サンプルゲノム配列情報をベースラインゲノム配列情報に対して正規化する工程であって、前記サンプルゲノム配列情報を遺伝子座効果に関して補正し、正規化したサンプルゲノム配列情報データセットを生成する工程;
エラー要因の回帰分析に由来する1種またはこれより多くの補正因子を、前記正規化したサンプルゲノム配列情報データセットに適用して、技術的効果を補正し、ノイズ除去したサンプルゲノム配列情報データセットを生成する工程;および
前記参照ゲノム上の染色体位置に対して整列されたゲノム配列リードの頻度が頻度閾値から外れる場合に、前記ノイズ除去したサンプルゲノム配列情報データセットにおけるコピー数変動を識別する工程、
を包含する方法。 - 前記ノイズ除去したサンプルゲノム配列情報データセットからカリオグラムまたは分子カリオタイプを生成する工程、
をさらに包含する、請求項1に記載の方法。 - 遺伝子座効果に関する前記サンプルゲノム配列情報を正規化する工程は、
ビンサイズを設定すること;
前記サンプルゲノム配列情報および前記ベースラインゲノム配列情報を、前記ビンサイズに基づいて複数のビンにセグメント化すること;
多くのゲノム配列リードを、前記複数のサンプルゲノム配列情報ビンの各々に対して整列される前記サンプルゲノム配列情報から決定して、前記複数のサンプルゲノム配列情報ビンの各々に関するサンプルビンスコアを生成すること;
多くのゲノム配列リードを、前記複数のベースラインゲノム配列情報ビンの各々に対して整列される前記ベースラインゲノム配列情報から決定して、前記複数のベースラインゲノム配列情報ビンの各々に関するベースラインビンスコアを生成すること;
前記サンプルビンスコアを前記ベースラインビンスコアに対して正規化すること;ならびに
正規化したサンプルゲノム配列情報データセットを生成すること、
をさらに包含する、請求項1に記載の方法。 - 正倍数体胚から得た複数のベースラインゲノム配列情報データセットを受容する工程;
前記複数のベースラインゲノム配列情報データセットの各々に関するビンスコアを決定する工程;
ベースラインゲノム配列情報データセットのサブセットを、前記サンプルゲノム配列情報に対する類似性閾値を超えるビンスコアを用いて、前記複数のベースラインゲノム配列情報データセットから選択する工程;ならびに
ベースラインゲノム配列情報データセットの前記選択したサブセットにおいてビンスコアのメジアン値を決定することによって、前記ベースラインビンスコアを生成する工程、
をさらに包含する、請求項3に記載の方法。 - 前記複数のベースラインゲノム配列情報データセットの各々に関する類似性値を計算する工程であって、ここで前記類似性値は、各ベースラインゲノム配列情報データセットが、前記サンプルゲノム配列情報にどの程度類似するかの尺度である、工程、
をさらに包含する、請求項4に記載の方法。 - 前記類似性値は、ユークリッド距離分析を使用して決定される、請求項4に記載の方法。
- 前記類似性値は、マハラノビス距離分析を使用して決定される、請求項4に記載の方法。
- 前記類似性値は、前記ベースラインゲノム配列情報データセットと前記サンプルゲノム配列情報との間のパーセント類似性である、請求項4に記載の方法。
- サンプリング効果に関して前記サンプルゲノム配列情報を補正することは、
前記1種またはこれより多くの補正因子を、局所的に重み付けした散布図平滑化回帰分析を使用して計算すること、
をさらに包含する、請求項1に記載の方法。 - 前記エラー要因は、GC含量関連である、請求項1に記載の方法。
- 前記エラー要因は、増幅バイアス関連である、請求項1に記載の方法。
- 前記エラー要因は、二次構造関連である、請求項1に記載の方法。
- 前記エラー要因は、ヌクレオソーム密度関連である、請求項1に記載の方法。
- 前記エラー要因は、miRNA停止関連である、請求項1に記載の方法。
- 前記エラー要因は、遺伝子発現関連である、請求項1に記載の方法。
- 胚における染色体異常を識別するためのシステムであって、前記システムは、
胚から得たサンプルゲノム配列情報を格納するように構成されたデータ格納ユニット;
以下:
前記サンプルゲノム配列情報を前記データストレージから受容し、前記サンプルゲノム配列情報をベースラインゲノム配列情報に対して正規化して、前記サンプルゲノム配列情報を遺伝子座効果に関して補正し、エラー要因の回帰分析に由来する1種またはこれより多くの補正因子を適用して、技術的効果を補正し、ノイズ除去したサンプルゲノム配列情報データセットを生成するように構成されたデータノイズ除去エンジン、および
前記ノイズ除去したサンプルゲノム配列情報データセットにおける染色体位置に対して整列されたゲノム配列リードの頻度が頻度閾値から外れる場合に、前記ノイズ除去したサンプルゲノム配列情報データセットにおけるコピー数変動を識別するように構成された解釈エンジン、
を含む、前記データ格納ユニットに通信可能に接続されたコンピューティングデバイス;ならびに
前記コンピューティングデバイスに通信可能に接続されかつ前記識別したコピー数変動を含む報告書を表示するように構成されたディスプレイ、
を含む、システム。 - 前記エラー要因は、GC含量関連である、請求項16に記載のシステム。
- 前記エラー要因は、増幅バイアス関電である、請求項16に記載のシステム。
- 前記エラー要因は、二次構造関連である、請求項16に記載のシステム。
- 前記エラー要因は、ヌクレオソーム密度関連である、請求項16に記載のシステム。
- 前記エラー要因は、miRNA停止関連である、請求項16に記載のシステム。
- 前記エラー要因は、遺伝子発現関連である、請求項16に記載のシステム。
- 前記コンピューティングデバイスは、
前記ノイズ除去したサンプルゲノム配列情報データセットを分析して、前記胚の性別異数性状態を分類するために、訓練済みニューラルネットワークを利用するように構成された性別異数性識別エンジン、
をさらに含む、請求項16に記載のシステム。 - 胚における性別異数性を識別するための方法であって、前記方法は、
胚から得たサンプルゲノム配列情報を受容する工程であって、ここで前記サンプルゲノム配列情報は、複数のゲノム配列リードから構成される、工程;
前記サンプルゲノム配列情報を参照ゲノムに対して整列させる工程;
前記サンプルゲノム配列情報をベースラインゲノム配列情報に対して正規化する工程であって、前記サンプルゲノム配列情報を遺伝子座効果に関して補正し、正規化したサンプルゲノム配列情報データセットを生成する工程;
エラー要因の回帰分析に由来する1種またはこれより多くの補正因子を、前記正規化したサンプルゲノム配列情報データセットに適用して、技術的効果を補正し、ノイズ除去したサンプルゲノム配列情報データセットを生成する工程;ならびに
訓練済みニューラルネットワークを利用して、前記ノイズ除去したサンプルゲノム配列情報データセットを分析し、前記胚の性別異数性状態を分類する工程、
を包含する方法。 - 複数の胚から得たノイズ除去したサンプルゲノム情報サンプルゲノム情報データセットを、既知の性別異数性分類とともに受容する工程;および
ニューラルネットワークを、前記ノイズ除去したサンプルゲノム情報データセットで更新して、前記訓練済みニューラルネットワークを生成する工程、
をさらに包含する、請求項24に記載の方法。 - 前記訓練済みニューラルネットワークは、
入力層;
4つのノードを含む第1の隠れ層;
2つのノードを含む第2の隠れ層;および
異なる性別異数性分類に対応する複数のノードを有する出力層、
から構成される、請求項24に記載の方法。 - 前記ニューラルネットワークは、フィードフォワードニューラルネットワークアーキテクチャを有する、請求項25に記載の方法。
- バックプロパゲーション技術を適用して、前記ニューラルネットワークを訓練する工程をさらに包含する、請求項25に記載の方法。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201862742211P | 2018-10-05 | 2018-10-05 | |
US62/742,211 | 2018-10-05 | ||
PCT/US2019/055071 WO2020073058A1 (en) | 2018-10-05 | 2019-10-07 | Systems and methods for identifying chromosomal abnormalities in an embryo |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2022502786A true JP2022502786A (ja) | 2022-01-11 |
Family
ID=68343505
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021518537A Pending JP2022502786A (ja) | 2018-10-05 | 2019-10-07 | 胚における染色体異常を識別するためのシステムおよび方法 |
Country Status (9)
Country | Link |
---|---|
US (1) | US20200111573A1 (ja) |
EP (1) | EP3861551A1 (ja) |
JP (1) | JP2022502786A (ja) |
KR (1) | KR20210068554A (ja) |
CN (1) | CN113228191A (ja) |
AU (1) | AU2019356033A1 (ja) |
CA (1) | CA3115273C (ja) |
SG (1) | SG11202103375SA (ja) |
WO (1) | WO2020073058A1 (ja) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2020257719A1 (en) | 2019-06-21 | 2020-12-24 | Coopersurgical, Inc. | Systems and methods for determining genome ploidy |
AU2020297585A1 (en) | 2019-06-21 | 2022-01-20 | Coopersurgical, Inc. | Systems and methods for using density of single nucleotide variations for the verification of copy number variations in human embryos |
WO2020257709A1 (en) | 2019-06-21 | 2020-12-24 | Coopersurgical, Inc. | Systems and methods for determining pattern of inheritance in embryos |
JP7099759B1 (ja) * | 2021-03-08 | 2022-07-12 | Varinos株式会社 | ゲノム配列上のコピー数のバリアントの区切り点の候補の機械的検出 |
CN115064210B (zh) * | 2022-07-27 | 2022-11-18 | 北京大学第三医院(北京大学第三临床医学院) | 一种鉴定二倍体胚胎细胞中染色体交叉互换位置的方法及应用 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20130304392A1 (en) * | 2013-01-25 | 2013-11-14 | Sequenom, Inc. | Methods and processes for non-invasive assessment of genetic variations |
US20180032671A1 (en) * | 2016-07-27 | 2018-02-01 | Sequenom, Inc. | Genetic Copy Number Alteration Classifications |
US20180195123A1 (en) * | 2013-01-23 | 2018-07-12 | Reproductive Genetics And Technology Solutions, Llc | Compositions and methods for genetic analysis of embryos |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2003214B1 (en) | 2005-02-01 | 2013-04-10 | AB Advanced Genetic Analysis Corporation | Reagents, methods, and libraries for bead-based sequencing |
US9367663B2 (en) * | 2011-10-06 | 2016-06-14 | Sequenom, Inc. | Methods and processes for non-invasive assessment of genetic variations |
-
2019
- 2019-10-07 SG SG11202103375SA patent/SG11202103375SA/en unknown
- 2019-10-07 CA CA3115273A patent/CA3115273C/en active Active
- 2019-10-07 CN CN201980079901.5A patent/CN113228191A/zh active Pending
- 2019-10-07 JP JP2021518537A patent/JP2022502786A/ja active Pending
- 2019-10-07 KR KR1020217013552A patent/KR20210068554A/ko not_active Application Discontinuation
- 2019-10-07 AU AU2019356033A patent/AU2019356033A1/en not_active Abandoned
- 2019-10-07 WO PCT/US2019/055071 patent/WO2020073058A1/en active Application Filing
- 2019-10-07 US US16/595,384 patent/US20200111573A1/en not_active Abandoned
- 2019-10-07 EP EP19794352.5A patent/EP3861551A1/en not_active Withdrawn
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20180195123A1 (en) * | 2013-01-23 | 2018-07-12 | Reproductive Genetics And Technology Solutions, Llc | Compositions and methods for genetic analysis of embryos |
US20130304392A1 (en) * | 2013-01-25 | 2013-11-14 | Sequenom, Inc. | Methods and processes for non-invasive assessment of genetic variations |
US20180032671A1 (en) * | 2016-07-27 | 2018-02-01 | Sequenom, Inc. | Genetic Copy Number Alteration Classifications |
Also Published As
Publication number | Publication date |
---|---|
WO2020073058A1 (en) | 2020-04-09 |
CN113228191A (zh) | 2021-08-06 |
AU2019356033A1 (en) | 2021-05-27 |
SG11202103375SA (en) | 2021-04-29 |
KR20210068554A (ko) | 2021-06-09 |
CA3115273A1 (en) | 2020-04-09 |
US20200111573A1 (en) | 2020-04-09 |
CA3115273C (en) | 2023-08-08 |
EP3861551A1 (en) | 2021-08-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
AU2021290303B2 (en) | Semi-supervised learning for training an ensemble of deep convolutional neural networks | |
CA3115273C (en) | Systems and methods for identifying chromosomal abnormalities in an embryo | |
US20210062256A1 (en) | Systems and methods for non-invasive preimplantation genetic diagnosis | |
JP7333838B2 (ja) | 胚における遺伝パターンを決定するためのシステム、コンピュータプログラム及び方法 | |
US20200399701A1 (en) | Systems and methods for using density of single nucleotide variations for the verification of copy number variations in human embryos | |
US20220076784A1 (en) | Systems and methods for identifying feature linkages in multi-genomic feature data from single-cell partitions | |
JP7446343B2 (ja) | ゲノム倍数性を判定するためのシステム、コンピュータプログラム及び方法 | |
US20200105374A1 (en) | Mixture model for targeted sequencing |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210520 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210520 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220729 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20221006 |
|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A711 Effective date: 20221006 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20221006 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20221226 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230130 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230522 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20231213 |