JP6491651B2 - 高解像度での対立遺伝子の同定 - Google Patents
高解像度での対立遺伝子の同定 Download PDFInfo
- Publication number
- JP6491651B2 JP6491651B2 JP2016523227A JP2016523227A JP6491651B2 JP 6491651 B2 JP6491651 B2 JP 6491651B2 JP 2016523227 A JP2016523227 A JP 2016523227A JP 2016523227 A JP2016523227 A JP 2016523227A JP 6491651 B2 JP6491651 B2 JP 6491651B2
- Authority
- JP
- Japan
- Prior art keywords
- sequence
- allele
- locus
- mapped
- pair
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 108700028369 Alleles Proteins 0.000 title claims description 664
- 238000000034 method Methods 0.000 claims description 181
- 238000012163 sequencing technique Methods 0.000 claims description 72
- 230000008569 process Effects 0.000 claims description 62
- 108090000623 proteins and genes Proteins 0.000 claims description 57
- 238000013507 mapping Methods 0.000 claims description 56
- 102000004169 proteins and genes Human genes 0.000 claims description 42
- 238000003199 nucleic acid amplification method Methods 0.000 claims description 34
- 230000003321 amplification Effects 0.000 claims description 33
- 238000007482 whole exome sequencing Methods 0.000 claims description 28
- 150000007523 nucleic acids Chemical class 0.000 claims description 14
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 11
- 239000002773 nucleotide Substances 0.000 claims description 10
- 125000003729 nucleotide group Chemical group 0.000 claims description 10
- 238000004590 computer program Methods 0.000 claims description 9
- 108020004707 nucleic acids Proteins 0.000 claims description 9
- 102000039446 nucleic acids Human genes 0.000 claims description 9
- 102000054765 polymorphisms of proteins Human genes 0.000 claims description 9
- 108020004414 DNA Proteins 0.000 claims description 7
- 238000012070 whole genome sequencing analysis Methods 0.000 claims description 5
- 230000007717 exclusion Effects 0.000 claims description 2
- 210000000056 organ Anatomy 0.000 description 60
- 210000001519 tissue Anatomy 0.000 description 58
- 210000004027 cell Anatomy 0.000 description 55
- 102100036242 HLA class II histocompatibility antigen, DQ alpha 2 chain Human genes 0.000 description 31
- 108010086786 HLA-DQA1 antigen Proteins 0.000 description 24
- 239000000523 sample Substances 0.000 description 20
- 102100028972 HLA class I histocompatibility antigen, A alpha chain Human genes 0.000 description 19
- 108010075704 HLA-A Antigens Proteins 0.000 description 19
- 108091007491 NSP3 Papain-like protease domains Proteins 0.000 description 18
- 102100036241 HLA class II histocompatibility antigen, DQ beta 1 chain Human genes 0.000 description 17
- 108010065026 HLA-DQB1 antigen Proteins 0.000 description 17
- 102100028976 HLA class I histocompatibility antigen, B alpha chain Human genes 0.000 description 14
- 108010058607 HLA-B Antigens Proteins 0.000 description 14
- 238000003559 RNA-seq method Methods 0.000 description 14
- 108091026890 Coding region Proteins 0.000 description 12
- 230000000717 retained effect Effects 0.000 description 10
- 208000009329 Graft vs Host Disease Diseases 0.000 description 9
- 102100028971 HLA class I histocompatibility antigen, C alpha chain Human genes 0.000 description 9
- 102100040485 HLA class II histocompatibility antigen, DRB1 beta chain Human genes 0.000 description 9
- 108010052199 HLA-C Antigens Proteins 0.000 description 9
- 108010039343 HLA-DRB1 Chains Proteins 0.000 description 9
- 208000024908 graft versus host disease Diseases 0.000 description 9
- 238000003752 polymerase chain reaction Methods 0.000 description 9
- 238000002054 transplantation Methods 0.000 description 9
- 108010081606 HLA-DQA2 antigen Proteins 0.000 description 8
- 230000000875 corresponding effect Effects 0.000 description 8
- 108020005196 Mitochondrial DNA Proteins 0.000 description 7
- 239000000427 antigen Substances 0.000 description 7
- 238000004422 calculation algorithm Methods 0.000 description 7
- 241000282412 Homo Species 0.000 description 6
- 206010028980 Neoplasm Diseases 0.000 description 6
- 206010052779 Transplant rejections Diseases 0.000 description 6
- 108091007433 antigens Proteins 0.000 description 6
- 102000036639 antigens Human genes 0.000 description 6
- 101150099138 HLA-DQA2 gene Proteins 0.000 description 5
- 238000006243 chemical reaction Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 5
- 238000012360 testing method Methods 0.000 description 5
- 230000004544 DNA amplification Effects 0.000 description 4
- 102100029966 HLA class II histocompatibility antigen, DP alpha 1 chain Human genes 0.000 description 4
- 102100031618 HLA class II histocompatibility antigen, DP beta 1 chain Human genes 0.000 description 4
- 102100040505 HLA class II histocompatibility antigen, DR alpha chain Human genes 0.000 description 4
- 102100040482 HLA class II histocompatibility antigen, DR beta 3 chain Human genes 0.000 description 4
- 102100028636 HLA class II histocompatibility antigen, DR beta 4 chain Human genes 0.000 description 4
- 102100028640 HLA class II histocompatibility antigen, DR beta 5 chain Human genes 0.000 description 4
- 108010093061 HLA-DPA1 antigen Proteins 0.000 description 4
- 108010045483 HLA-DPB1 antigen Proteins 0.000 description 4
- 108010067802 HLA-DR alpha-Chains Proteins 0.000 description 4
- 108010061311 HLA-DRB3 Chains Proteins 0.000 description 4
- 108010040960 HLA-DRB4 Chains Proteins 0.000 description 4
- 108010016996 HLA-DRB5 Chains Proteins 0.000 description 4
- 108091092724 Noncoding DNA Proteins 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 4
- 210000004369 blood Anatomy 0.000 description 4
- 239000008280 blood Substances 0.000 description 4
- 210000001185 bone marrow Anatomy 0.000 description 4
- 239000003795 chemical substances by application Substances 0.000 description 4
- 210000000349 chromosome Anatomy 0.000 description 4
- 238000012217 deletion Methods 0.000 description 4
- 230000037430 deletion Effects 0.000 description 4
- 201000010099 disease Diseases 0.000 description 4
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 4
- 238000007834 ligase chain reaction Methods 0.000 description 4
- 230000008439 repair process Effects 0.000 description 4
- 230000010076 replication Effects 0.000 description 4
- 238000011160 research Methods 0.000 description 4
- 238000012216 screening Methods 0.000 description 4
- 210000000130 stem cell Anatomy 0.000 description 4
- 238000013518 transcription Methods 0.000 description 4
- 230000035897 transcription Effects 0.000 description 4
- 101100284398 Bos taurus BoLA-DQB gene Proteins 0.000 description 3
- 101001100327 Homo sapiens RNA-binding protein 45 Proteins 0.000 description 3
- 102100038823 RNA-binding protein 45 Human genes 0.000 description 3
- 125000003275 alpha amino acid group Chemical group 0.000 description 3
- 201000011510 cancer Diseases 0.000 description 3
- 230000008859 change Effects 0.000 description 3
- 238000007796 conventional method Methods 0.000 description 3
- 208000022602 disease susceptibility Diseases 0.000 description 3
- 238000006073 displacement reaction Methods 0.000 description 3
- 239000003814 drug Substances 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 210000002865 immune cell Anatomy 0.000 description 3
- 210000004072 lung Anatomy 0.000 description 3
- 108090000765 processed proteins & peptides Proteins 0.000 description 3
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 2
- 206010006187 Breast cancer Diseases 0.000 description 2
- 208000026310 Breast neoplasm Diseases 0.000 description 2
- 206010008342 Cervix carcinoma Diseases 0.000 description 2
- 108020004705 Codon Proteins 0.000 description 2
- 108010044091 Globulins Proteins 0.000 description 2
- 102000006395 Globulins Human genes 0.000 description 2
- 101150038552 HLA-DQA1 gene Proteins 0.000 description 2
- 101000930799 Homo sapiens HLA class II histocompatibility antigen, DQ beta 2 chain Proteins 0.000 description 2
- 208000022559 Inflammatory bowel disease Diseases 0.000 description 2
- 206010067584 Type 1 diabetes mellitus Diseases 0.000 description 2
- 208000006105 Uterine Cervical Neoplasms Diseases 0.000 description 2
- 210000004504 adult stem cell Anatomy 0.000 description 2
- 230000000890 antigenic effect Effects 0.000 description 2
- 206010003246 arthritis Diseases 0.000 description 2
- 210000004507 artificial chromosome Anatomy 0.000 description 2
- 239000012472 biological sample Substances 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 2
- 210000000988 bone and bone Anatomy 0.000 description 2
- 201000010881 cervical cancer Diseases 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 239000012634 fragment Substances 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 210000002216 heart Anatomy 0.000 description 2
- 210000003709 heart valve Anatomy 0.000 description 2
- 210000003958 hematopoietic stem cell Anatomy 0.000 description 2
- JYGXADMDTFJGBT-VWUMJDOOSA-N hydrocortisone Chemical compound O=C1CC[C@]2(C)[C@H]3[C@@H](O)C[C@](C)([C@@](CC4)(O)C(=O)CO)[C@@H]4[C@@H]3CCC2=C1 JYGXADMDTFJGBT-VWUMJDOOSA-N 0.000 description 2
- 238000003780 insertion Methods 0.000 description 2
- 230000037431 insertion Effects 0.000 description 2
- 210000000936 intestine Anatomy 0.000 description 2
- 210000003734 kidney Anatomy 0.000 description 2
- 210000004185 liver Anatomy 0.000 description 2
- 206010025135 lupus erythematosus Diseases 0.000 description 2
- 201000006417 multiple sclerosis Diseases 0.000 description 2
- 238000007481 next generation sequencing Methods 0.000 description 2
- 210000000496 pancreas Anatomy 0.000 description 2
- 238000000819 phase cycle Methods 0.000 description 2
- 238000012175 pyrosequencing Methods 0.000 description 2
- 238000005096 rolling process Methods 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 238000002864 sequence alignment Methods 0.000 description 2
- 238000007841 sequencing by ligation Methods 0.000 description 2
- 238000011451 sequencing strategy Methods 0.000 description 2
- 210000002784 stomach Anatomy 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- 210000001550 testis Anatomy 0.000 description 2
- 230000001225 therapeutic effect Effects 0.000 description 2
- 108091093088 Amplicon Proteins 0.000 description 1
- 206010003445 Ascites Diseases 0.000 description 1
- 240000007124 Brassica oleracea Species 0.000 description 1
- PMATZTZNYRCHOR-CGLBZJNRSA-N Cyclosporin A Chemical compound CC[C@@H]1NC(=O)[C@H]([C@H](O)[C@H](C)C\C=C\C)N(C)C(=O)[C@H](C(C)C)N(C)C(=O)[C@H](CC(C)C)N(C)C(=O)[C@H](CC(C)C)N(C)C(=O)[C@@H](C)NC(=O)[C@H](C)NC(=O)[C@H](CC(C)C)N(C)C(=O)[C@H](C(C)C)NC(=O)[C@H](CC(C)C)N(C)C(=O)CN(C)C1=O PMATZTZNYRCHOR-CGLBZJNRSA-N 0.000 description 1
- 108010036949 Cyclosporine Proteins 0.000 description 1
- HKVAMNSJSFKALM-GKUWKFKPSA-N Everolimus Chemical compound C1C[C@@H](OCCO)[C@H](OC)C[C@@H]1C[C@@H](C)[C@H]1OC(=O)[C@@H]2CCCCN2C(=O)C(=O)[C@](O)(O2)[C@H](C)CC[C@H]2C[C@H](OC)/C(C)=C/C=C/C=C/[C@@H](C)C[C@@H](C)C(=O)[C@H](OC)[C@H](O)/C(C)=C/[C@@H](C)C(=O)C1 HKVAMNSJSFKALM-GKUWKFKPSA-N 0.000 description 1
- 108700024394 Exon Proteins 0.000 description 1
- 206010064571 Gene mutation Diseases 0.000 description 1
- 102100036117 HLA class II histocompatibility antigen, DQ beta 2 chain Human genes 0.000 description 1
- 108010010378 HLA-DP Antigens Proteins 0.000 description 1
- 102000015789 HLA-DP Antigens Human genes 0.000 description 1
- 108010062347 HLA-DQ Antigens Proteins 0.000 description 1
- 108010058597 HLA-DR Antigens Proteins 0.000 description 1
- 102000006354 HLA-DR Antigens Human genes 0.000 description 1
- 108091093105 Nuclear DNA Proteins 0.000 description 1
- 238000012408 PCR amplification Methods 0.000 description 1
- 102000006633 Sodium-Bicarbonate Symporters Human genes 0.000 description 1
- 108010087132 Sodium-Bicarbonate Symporters Proteins 0.000 description 1
- 210000001744 T-lymphocyte Anatomy 0.000 description 1
- QJJXYPPXXYFBGM-LFZNUXCKSA-N Tacrolimus Chemical compound C1C[C@@H](O)[C@H](OC)C[C@@H]1\C=C(/C)[C@@H]1[C@H](C)[C@@H](O)CC(=O)[C@H](CC=C)/C=C(C)/C[C@H](C)C[C@H](OC)[C@H]([C@H](C[C@H]2C)OC)O[C@@]2(O)C(=O)C(=O)N2CCCC[C@H]2C(=O)O1 QJJXYPPXXYFBGM-LFZNUXCKSA-N 0.000 description 1
- 230000002159 abnormal effect Effects 0.000 description 1
- 230000005856 abnormality Effects 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 150000001413 amino acids Chemical class 0.000 description 1
- 210000004381 amniotic fluid Anatomy 0.000 description 1
- 230000000781 anti-lymphocytic effect Effects 0.000 description 1
- 230000001494 anti-thymocyte effect Effects 0.000 description 1
- 230000001363 autoimmune Effects 0.000 description 1
- 229960002170 azathioprine Drugs 0.000 description 1
- LMEKQMALGUDUQG-UHFFFAOYSA-N azathioprine Chemical compound CN1C=NC([N+]([O-])=O)=C1SC1=NC=NC2=C1NC=N2 LMEKQMALGUDUQG-UHFFFAOYSA-N 0.000 description 1
- 230000001580 bacterial effect Effects 0.000 description 1
- 229960004669 basiliximab Drugs 0.000 description 1
- 239000011324 bead Substances 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 238000001574 biopsy Methods 0.000 description 1
- 239000012503 blood component Substances 0.000 description 1
- 210000004204 blood vessel Anatomy 0.000 description 1
- 210000001124 body fluid Anatomy 0.000 description 1
- 239000010839 body fluid Substances 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000009566 cancer vaccine Methods 0.000 description 1
- 229940022399 cancer vaccine Drugs 0.000 description 1
- 230000000747 cardiac effect Effects 0.000 description 1
- 230000005859 cell recognition Effects 0.000 description 1
- 210000001175 cerebrospinal fluid Anatomy 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 229960001265 ciclosporin Drugs 0.000 description 1
- 239000000306 component Substances 0.000 description 1
- 108091036078 conserved sequence Proteins 0.000 description 1
- 210000004087 cornea Anatomy 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 229930182912 cyclosporin Natural products 0.000 description 1
- 230000001086 cytosolic effect Effects 0.000 description 1
- 210000001151 cytotoxic T lymphocyte Anatomy 0.000 description 1
- 229960002806 daclizumab Drugs 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 238000012350 deep sequencing Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000003511 endothelial effect Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 229960005167 everolimus Drugs 0.000 description 1
- 210000003722 extracellular fluid Anatomy 0.000 description 1
- 238000003205 genotyping method Methods 0.000 description 1
- 210000004602 germ cell Anatomy 0.000 description 1
- 210000002443 helper t lymphocyte Anatomy 0.000 description 1
- 210000005260 human cell Anatomy 0.000 description 1
- 229960000890 hydrocortisone Drugs 0.000 description 1
- 210000000987 immune system Anatomy 0.000 description 1
- 230000006058 immune tolerance Effects 0.000 description 1
- 230000002163 immunogen Effects 0.000 description 1
- 239000003018 immunosuppressive agent Substances 0.000 description 1
- 229940125721 immunosuppressive agent Drugs 0.000 description 1
- 238000009169 immunotherapy Methods 0.000 description 1
- 229940032219 immunotherapy vaccine Drugs 0.000 description 1
- 238000002513 implantation Methods 0.000 description 1
- 230000028709 inflammatory response Effects 0.000 description 1
- 210000004966 intestinal stem cell Anatomy 0.000 description 1
- 210000004153 islets of langerhan Anatomy 0.000 description 1
- 210000000265 leukocyte Anatomy 0.000 description 1
- 210000004698 lymphocyte Anatomy 0.000 description 1
- 239000003550 marker Substances 0.000 description 1
- 210000002901 mesenchymal stem cell Anatomy 0.000 description 1
- HPNSFSBZBAHARI-UHFFFAOYSA-N micophenolic acid Natural products OC1=C(CC=C(C)CCC(O)=O)C(OC)=C(C)C2=C1C(=O)OC2 HPNSFSBZBAHARI-UHFFFAOYSA-N 0.000 description 1
- 229960000951 mycophenolic acid Drugs 0.000 description 1
- HPNSFSBZBAHARI-RUDMXATFSA-N mycophenolic acid Chemical compound OC1=C(C\C=C(/C)CCC(O)=O)C(OC)=C(C)C2=C1C(=O)OC2 HPNSFSBZBAHARI-RUDMXATFSA-N 0.000 description 1
- 210000001178 neural stem cell Anatomy 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 244000052769 pathogen Species 0.000 description 1
- 230000008506 pathogenesis Effects 0.000 description 1
- 230000035935 pregnancy Effects 0.000 description 1
- 230000002265 prevention Effects 0.000 description 1
- 230000037452 priming Effects 0.000 description 1
- 102000004196 processed proteins & peptides Human genes 0.000 description 1
- ZAHRKKWIAAJSAO-UHFFFAOYSA-N rapamycin Natural products COCC(O)C(=C/C(C)C(=O)CC(OC(=O)C1CCCCN1C(=O)C(=O)C2(O)OC(CC(OC)C(=CC=CC=CC(C)CC(C)C(=O)C)C)CCC2C)C(C)CC3CCC(O)C(C3)OC)C ZAHRKKWIAAJSAO-UHFFFAOYSA-N 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 229960004641 rituximab Drugs 0.000 description 1
- 210000003296 saliva Anatomy 0.000 description 1
- 238000007480 sanger sequencing Methods 0.000 description 1
- 230000000405 serological effect Effects 0.000 description 1
- 210000002966 serum Anatomy 0.000 description 1
- 229960002930 sirolimus Drugs 0.000 description 1
- QFJCIRLUMZQUOT-HPLJOQBZSA-N sirolimus Chemical compound C1C[C@@H](O)[C@H](OC)C[C@@H]1C[C@@H](C)[C@H]1OC(=O)[C@@H]2CCCCN2C(=O)C(=O)[C@](O)(O2)[C@H](C)CC[C@H]2C[C@H](OC)/C(C)=C/C=C/C=C/[C@@H](C)C[C@@H](C)C(=O)[C@H](OC)[C@H](O)/C(C)=C/[C@@H](C)C(=O)C1 QFJCIRLUMZQUOT-HPLJOQBZSA-N 0.000 description 1
- 210000003491 skin Anatomy 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000009897 systematic effect Effects 0.000 description 1
- 201000000596 systemic lupus erythematosus Diseases 0.000 description 1
- 229960001967 tacrolimus Drugs 0.000 description 1
- QJJXYPPXXYFBGM-SHYZHZOCSA-N tacrolimus Natural products CO[C@H]1C[C@H](CC[C@@H]1O)C=C(C)[C@H]2OC(=O)[C@H]3CCCCN3C(=O)C(=O)[C@@]4(O)O[C@@H]([C@H](C[C@H]4C)OC)[C@@H](C[C@H](C)CC(=C[C@@H](CC=C)C(=O)C[C@H](O)[C@H]2C)C)OC QJJXYPPXXYFBGM-SHYZHZOCSA-N 0.000 description 1
- 229940124597 therapeutic agent Drugs 0.000 description 1
- 238000002560 therapeutic procedure Methods 0.000 description 1
- 238000011282 treatment Methods 0.000 description 1
- 210000002700 urine Anatomy 0.000 description 1
- 238000002255 vaccination Methods 0.000 description 1
- 229960005486 vaccine Drugs 0.000 description 1
- 230000003612 virological effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B30/00—ICT specially adapted for sequence analysis involving nucleotides or amino acids
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P43/00—Drugs for specific purposes, not provided for in groups A61P1/00-A61P41/00
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6876—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
- C12Q1/6881—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for tissue or cell typing, e.g. human leukocyte antigen [HLA] probes
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
- G16B20/20—Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
- G16B20/40—Population genetics; Linkage disequilibrium
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B30/00—ICT specially adapted for sequence analysis involving nucleotides or amino acids
- G16B30/20—Sequence assembly
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/156—Polymorphic or mutational markers
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- Chemical & Material Sciences (AREA)
- Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Analytical Chemistry (AREA)
- General Health & Medical Sciences (AREA)
- Biophysics (AREA)
- Biotechnology (AREA)
- Genetics & Genomics (AREA)
- Theoretical Computer Science (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Medical Informatics (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Molecular Biology (AREA)
- Organic Chemistry (AREA)
- Wood Science & Technology (AREA)
- Zoology (AREA)
- Immunology (AREA)
- Cell Biology (AREA)
- Biochemistry (AREA)
- General Engineering & Computer Science (AREA)
- Microbiology (AREA)
- Physiology (AREA)
- Ecology (AREA)
- Animal Behavior & Ethology (AREA)
- General Chemical & Material Sciences (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Veterinary Medicine (AREA)
- Public Health (AREA)
- Pharmacology & Pharmacy (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Medicinal Chemistry (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Materials For Medical Uses (AREA)
- Medicines Containing Material From Animals Or Micro-Organisms (AREA)
- Steroid Compounds (AREA)
Description
本出願は、2013年10月15日出願された米国特許仮出願第61/891,193号に対する優先権による利益を主張するものであり、参照により前述の基礎出願の全体を本願に援用する。
本明細書では、いくつかの態様において、遺伝子座(例えば、高度多型遺伝子座)に存在する対立遺伝子を正確に判定するプロセスが提供される。いくつかの実施形態では、本方法は、PAT(Precise Allele Typing)又はPHLAT(Precise HLA Typing)と呼ばれる。用語「PHLAT」及び「PAT」は、本明細書において互換可能に使用される。PATプロセスは、HLA座、BGA座、及びHV座などの高度多型遺伝子座を含む、何らかの遺伝子座に存在する、対立遺伝子の同定に広く使用可能である。PATプロセスのある種の実施形態は、例えば、臓器移植、個別化医療、診断学、法医学、及び人類学などの多様な用途に有用である。例えば、PATプロセスの実施形態は、臓器拒絶反応及び移植片対宿主病の予防、疾患感受性の判定、ワクチン投与計画の最適化、治療有効性の予測、並びに地域的及び又は民族的起源の特定のために使用できる。
ある種の実施形態では、本明細書において開示される方法は、配列データを取得又は受信する工程(例えば、図7及び図8の工程10)を含む。いくつかの実施形態では、配列データは、任意の方法により取得又は受信することができる。例えば、配列データは、サンプルに対し配列決定プロセスを実施することにより直接得ることができる。あるいは、配列データは、例えば、サードパーティー、データベース、及び/又は出版物から間接的に得ることができる。いくつかの実施形態では、配列データは、例えば、データ格納デバイス又は別のコンピュータシステムから、コンピュータシステムに受信される。
いくつかの実施形態では、本明細書に開示される方法は、対立遺伝子候補を選別する工程を含む(例えば、図7の工程20及び30、並びに図8の工程20、32、34、及び36)。いくつかの実施形態では、対立遺伝子候補の選別は、シーケンスリードを参照配列に対してマッピングした後、リードをカウントする一連の工程により実施される。このマッピングプロセスは、任意の利用可能な配列マッピングソフトウェアを用い実施することができる。ある種の実施形態では、Bowtie 2が使用される。いくつかの実施形態では、Bowtie 2のマッピングパラメーターは、end−to−end modeにてvery−sensitive(すなわち、−D 20−R 3−N 0−L 20−I S,1,0.50)に設定される。いくつかの実施形態では、参照配列は、HLAの対立遺伝子(例えば、人工染色体)などの対立遺伝子を複数含む。いくつかの実施形態では、参照配列は、ヒトゲノム配列(例えば、GRCh37/hg19)を更に含む。いくつかの実施形態では、ヒトゲノム配列中の1つ以上の遺伝子座(例えば、HLA座)は、参照配列から除外又はマスクされる(例えば、遺伝子座の配列をNsで置き換えられる)。
ある種の実施形態では、上記の候補を選別するプロセスの性能により、対立遺伝子候補及びそれらに関連するリードのみが以降の解析に含められる。いくつかの実施形態では、対立遺伝子候補には、対立遺伝子候補の全ての組み合わせ(同じ対立遺伝子とのペア形成を含む)の対組み合わせ評価を行い、その遺伝子座に存在する尤度の最も高いペア(例えば、HLA型を肯定する尤度の最も高いペア)を発見する。このプロセスの態様の例を、図7の工程40、及び図9の工程42、44、及び46に示す。
いくつかの実施形態では、対数尤度スコア、又は遺伝子座(LLgeno)におけるそれぞれのSNPは、ベイジアンモデルに従って算出される。いくつかの実施形態では、事後対数尤度
いくつかの実施形態では、2つの隣接するSNP部位(LLphase)に及ぶ相尤度は、上記の単一のSNP部位の遺伝子型尤度と同様にモデル化され、
いくつかの実施形態では、ヒト集団においてそれぞれの対立遺伝子候補対が存在する対数頻度は、対立遺伝子候補対のうち最も尤度の高いものを判定するときに考慮される。主要なクラスI及びII遺伝子座の対立遺伝子頻度は当該技術分野で既知である。例えば、このような対立遺伝子頻度は、Allele Frequency Netからダウンロードすることができる。いくつかの実施形態では、それぞれのタンパク質(4桁)ファミリーについて、確認されている対立遺伝子からの最大頻度を用い、範囲内の全ての対立遺伝子により共有した。いくつかの実施形態では、頻度の判明していないタンパク質ファミリー(及びその対立遺伝子)のバックグラウンド値には0.0001を割り当てた。いくつかの実施形態では、LLfreqは、2つの対立遺伝子の対数頻度の合計として計算する。
いくつかの態様では、本明細書に記載のHLAタイピング法を使用して、移植拒絶反応及び/又は移植片対宿主病の尤度を低減することができる。本明細書において、いくつかの態様では、臓器、細胞、又は組織移植を実施する方法が提供される。いくつかの実施形態では、移植方法は、本明細書に記載のHLAタイピング法を実施して、臓器、組織、又は細胞の少なくとも1つのHLA座のHLA型を判定した後、臓器、組織、又は細胞をレシピエントに移植すること、を含む。いくつかの実施形態では、移植方法は、本明細書に記載のHLAタイピング法を実施して、見込まれる移植レシピエントの少なくとも1つのHLA座のHLA型を判定した後、臓器、組織、又は細胞をこのレシピエントに移植すること、を含む。いくつかの実施形態では、移植方法は、本明細書に記載のHLAタイピング法を実施して、臓器、組織、又は細胞の少なくとも1つのHLA座のHLA型を判定すること、並びに本明細書に記載のHLAタイピング法を実施して、見込まれる移植レシピエントの少なくとも1つのHLA座のHLA型を判定した後、臓器、組織、又は細胞をレシピエントに移植すること、を含む。
Bowtie 2を用いた参照ベースのリードマッピングにより、PHLATワークフローを開始した(図1、工程I)。それぞれが1つのHLA対立遺伝子のゲノムDNA配列として表される人工染色体のコレクションにより、ヒトゲノムGRCh37/hg19を伸長させて、参照ゲノムを構築した。第6番染色体上のHLA−A、B、C、DQA1、DQB1、及びDRB1座の対応するゲノム配列をN’sでマスクして、マッピングが重複するのを回避した。Bowtie 2のマッピングパラメーターは、end−to−endモードでvery−sensitive(すなわち、−D20−R3−N 0−L20−IS,1,0.50)に設定した。各リードに関し、最良のアライメント(又は同等に良好なアライメントのうちの1つ)を記録した。リード長がBowtieに利用可能なものである場合、Bowtieのマッピングエンジンを変えてもPHLATの性能に顕著な変化は生じなかった(データ非掲載)。
ショートリードによりPHLATを評価するため、HapMapトランスクリプトーム配列決定(RNAseq)データセットを使用した。ペアエンドショートリード(2×37bp)を用い、HapMapプロジェクト(研究アクセッションERP000101)に由来する公共のデータベースから、欧州北部及び西部に起源を持つ60名のユタ在住者のリンパ芽球のトランスクリプトームプロファイリングを得た。これらの50の試料に対し、最初に、Bakker et al.Nat.Genet.Nat.Genet.38:1166〜1172(2006)により、解像度4桁で主要なクラスI及びII HLA座の遺伝子型を判定し、続いてErlich et al,BMC Genomics 12:42(2011)に記載の異なる手法を用い検証した。ヒトゲノムに対するリードのマッピングが非常に低率だったため、1つの試料(アクセッションERR009139)を除外した(10%未満)。残りの49の試料を解析に使用し、この試験で比較した。
欧州北部及び西部、日本、及びナイジェリアに起源を持つユタ州在住者から、HapMap全エクソーム配列決定(WXS)データセット及びそれに伴ってクラスIの4桁のHLA型を集めた。WXSデータは、試験アクセッションSRP004078、SRR004076、及びSRR004074を介し公共のデータベースから得て、HLA遺伝子型は、Warren et al,Genome Med.4:95(2012)及びAbecasis et al.,Nature 467:1061〜1073(2010)から得た。配列決定プロセスは、HLA座のCDS領域に対する中央カバレッジ約60xとし、ペアエンドの101bpリードにより進めた(結果も参照されたい)。
目的増幅産物の配列決定データに対し、実施例1に記載のPHLATプロセスを行った。5系統のヒト細胞株のクラスIのHLA−A座及びHLA−B座をPCRにより増幅させて、データを生成した(図4)。簡単に、一段回目のPCRでは、HLA−A座及びB座のエキソン2及び3(プライマー配列は図5に示す)の増幅産物を産生すると同時に、Illumina配列決定アダプターを添加した。4種の増幅産物を1:1:1:1比で合わせ、二段階目のPCRでバーコード付加した。最後に、合わせた5種の試料を、Illumina MiSeq(Illumina Inc.CA)でマルチプレックス化したペアエンド解析により2×250サイクル配列決定した。MiSeq Reporterソフトウェアにより、5つの試料の非マルチプレックス化FASTQファイルを得た。
HapMap RNAseq、1000 Genome WXS、及びHapMap WXSのデータセットから、PHLATで誤分類された4桁の対立遺伝子を回収し、対立遺伝子の種類毎に要約した(図6A)。ある種の対立遺伝子が偏って豊富に含まれていたのかを調査し、含まれていた場合には、アルゴリズム又は他の理由のいずれにより持ち込まれたのかを調査した。HLA−A、B、C、及びDRB1座にて、ほとんど全ての対立遺伝子は制限されたサンプル長を有しており(総出現率≦10)、誤分類の発生も抑えられていた(≦2)。したがって、対立遺伝子型は偏って豊富に存在しているわけではなかった。
配列決定パラメータがいかにしてHLAの推定精度に影響を与えたのかを系統的に調査するため、上記のデータセットからPHLATにより得られたHLAの予想結果を蓄積した。基準とするデータセットにより、様々なリード長(37bp〜250bp)及びリード深度(60x未満〜1000x超)に加え、異なる配列決定プロトコル(ペアエンドでのプロトコル又はシングルエンドとして扱うプロトコル)によるテストケースを提供した。
Claims (24)
- 遺伝子座に存在する対立遺伝子を判定する、コンピュータに実装された方法であって:
複数のシーケンスリードを含む、対象の配列データをコンピュータシステムで受信することと;
前記コンピュータシステムにより、前記遺伝子座のゲノム配列と、複数の対立遺伝子配列とを含む参照配列に対して前記複数のシーケンスリードをマッピングして、対立遺伝子候補を同定することと;
対立遺伝子候補の各対に関し、前記遺伝子座における各SNPのそれぞれに対し遺伝子型の対数尤度スコアを求めることであって、各遺伝子型の対数尤度スコアが、前記遺伝子座における各SNPのそれぞれについての対数確率の合計であり、前記対立遺伝子候補対は、前記SNPに対しマッピングされる前記シーケンスリード中のそれぞれのSNPに存在する配列としてみなすことができる、対数尤度スコアを求めることと;
対立遺伝子候補の各対に関し、前記遺伝子座におけるSNPsの各配列対に対し相対数尤度スコア(phase log-likelihood)を求めることであって、各相対数尤度スコアが、前記遺伝子座におけるSNPsの各配列対についての対数確率の合計であり、前記対立遺伝子候補対は、前記SNPsの配列対に対しマッピングされる前記シーケンスリード中のSNPsの配列対に存在する配列とみなすことができる、相対数尤度スコアを求めることと;
対立遺伝子候補の各対に関し、頻度対数尤度スコアを求めることであって、前記頻度対数尤度スコアが、前記各対立遺伝子候補がヒト集団において存在する対数頻度の合計である、頻度対数尤度スコアを求めることと;
前記遺伝子型の対数尤度スコア、前記相対数尤度スコア及び頻度対数尤度スコアの合計が、遺伝子座に存在する対立遺伝子として、最も高い対立遺伝子候補対を選択することと
を含む、方法。 - 前記ゲノム配列がヒトゲノム配列であり、前記複数の対立遺伝子配列がヒト配列である、請求項1に記載の方法。
- 前記ゲノム配列中の前記遺伝子座の前記配列が除去又はマスクされている、請求項2に記載の方法。
- 前記ヒトゲノム配列がGRCh37/hg19である、請求項2に記載の方法。
- マッピングは、更に
シーケンスリードが最も多数マッピングされた前記対立遺伝子を、対立遺伝子候補の第1のセットとして同定する工程と;
前記対立遺伝子候補の第1のセットに対してマッピングされる前記シーケンスリードを除外し、シーケンスリードが最も多数マッピングされた前記対立遺伝子を、対立遺伝子候補の第2のセットとして同定する工程と;
前記遺伝子座に対してマッピングされた前記シーケンスリードの90%未満が、前記対立遺伝子候補の第1のセット又は第2のセットの対立遺伝子に対してマッピングされる場合に、前記対立遺伝子候補の第1のセット又は第2のセットに対しマッピングされた前記リードを除外し、前記シーケンスリードが最も多数マッピングされた前記対立遺伝子を、前記対立遺伝子候補の第3のセットとして同定する工程とを含む、請求項1に記載の方法。 - 複数の対立遺伝子配列が、一群のタンパク質のものから選択される、請求項5に記載の方法。
- 前記対立遺伝子候補の第1のセットに対しマッピングされた前記シーケンスリードの除外後、前記遺伝子座に対しマッピングされたシーケンスリードの数が、前記対立遺伝子候補の第1のセットに対しマッピングされたシーケンスリードの数の1%超である場合、前記対立遺伝子候補の第1のセットに対しマッピングされた前記シーケンスリードを除外せずに、2番目に多数のシーケンスリードがマッピングされた前記対立遺伝子を、前記対立遺伝子候補の第2のセットのサブセットとして更に同定する、請求項5に記載の方法。
- 前記対立遺伝子候補の第1のセット又は第2のセットに対しマッピングされるリードは除外し、シーケンスリードが最も多数マッピングされた対立遺伝子に対しマッピングされるシーケンスリードの数が、前記遺伝子座に対しマッピングされるシーケンスリードの総数の少なくとも10%を構成する場合にのみ、前記対立遺伝子候補の第3のセットが、同定される、請求項5に記載の方法。
- 前記配列データが、ゲノムワイドな配列決定データである、請求項1に記載の方法。
- 前記ゲノムワイドな配列決定データが、トランスクリプトーム配列決定データ、全エクソーム配列決定データ、又は全ゲノム配列決定データである、請求項9に記載の方法。
- 前記配列データのカバレッジが少なくとも30倍である、請求項10に記載の方法
- 前記配列データのカバレッジが、30倍〜100倍の範囲であり、前記複数のシーケンスリードがDNAに由来するものである、請求項10に記載の方法。
- 前記配列データのカバレッジが、100倍〜500倍の範囲であり、前記複数のシーケンスリードがRNAに由来するものである、請求項10に記載の方法。
- 前記配列データのカバレッジが少なくとも1000倍であり、前記複数のシーケンスリードが、目的とする配列に由来するものである、請求項10に記載の方法。
- 前記複数のシーケンスリードの平均長が、250塩基未満である、請求項1に記載の方法。
- 前記複数のシーケンスリードが、ペアエンドリードである、請求項1に記載の方法。
- 前記複数のシーケンスリードが、シングルエンドリードである、請求項1に記載の方法。
- 前記複数のシーケンスリードの平均長が50塩基未満である、請求項1に記載の方法。
- マッピングの前に、対象の遺伝子座の核酸配列を含む増幅産物を産生する核酸増幅プロセスを実施することであって、前記遺伝子座は、1つ以上の一塩基多型(SNP)を含むことと;
複数のシーケンスリードを生成する増幅産物に対して配列決定プロセスを実行することであって、複数のシーケンスリードは、35から100塩基対のシーケンスリードからなること
を更に含む、請求項1に記載の方法。 - 前記遺伝子座が、高度多型遺伝子座である、請求項1に記載の方法。
- 前記遺伝子座がHLA座である、請求項1に記載の方法。
- 遺伝子座に存在する対立遺伝子を判定する、コンピュータに実装された方法であって:
a)コンピュータシステムにて前記対象の配列データを受信することであって、前記配列データが複数のシーケンスリードを含む、データを受信することと;
b)前記コンピュータシステムにより、ヒトゲノム配列と、前記遺伝子座の複数の対立遺伝子配列とを含む参照配列に対し、前記シーケンスリードをマッピングすること;
c)前記コンピュータシステムにより、シーケンスリードが最も多数マッピングされた対立遺伝子を、対立遺伝子候補の第1のセットとして同定することと;
d)前記コンピュータシステムにより、前記対立遺伝子候補の第1のセットに対しマッピングされた前記シーケンスリードを除外し、シーケンスリードが最も多数マッピングされた対立遺伝子を、対立遺伝子候補の第2のセットとして同定することと;
e)前記遺伝子座に対してマッピングされたシーケンスリードの90%未満が、前記対立遺伝子候補の第1のセット又は第2のセットの対立遺伝子に対してマッピングされる場合に、前記対立遺伝子候補の第1のセット又は第2のセットに対しマッピングされた前記リードを除外し、シーケンスリードが最も多数マッピングされた対立遺伝子を、前記コンピュータシステムにより前記対立遺伝子候補の第3のセットとして同定することと;
f)対立遺伝子候補の各対に関し、前記遺伝子座における各SNPのそれぞれに対し遺伝子型の対数尤度スコアを求めることであって、前記各遺伝子型の対数尤度スコアが、前記遺伝子座における各SNPのそれぞれについての対数確率の合計であり、前記対立遺伝子候補対は、前記SNPに対しマッピングされる前記シーケンスリード中のそれぞれの前記SNPに存在する配列としてみなすことができる、対数尤度スコアを求めることと;
g)対立遺伝子候補の各対に関し、前記遺伝子座におけるSNPsの各配列対に対し相対数尤度スコアを求めることであって、前記各相対数尤度スコアが、前記遺伝子座におけるSNPsの各配列対についての対数確率の合計であり、前記対立遺伝子候補対は、前記SNPsの配列対に対しマッピングされる前記シーケンスリード中の前記SNPsの配列対に存在する配列とみなすことができる、相対数尤度スコアを求めることと;
h)前記コンピュータシステムにより、対立遺伝子候補の各対に関し、頻度対数尤度スコアを求めることであって、前記頻度対数尤度スコアが、前記各対立遺伝子候補がヒト集団において存在する対数頻度の合計である、頻度対数尤度スコアを求めることと;
i)前記コンピュータシステムにより、前記遺伝子型の対数尤度スコア、前記相対数尤度スコア、及び前記頻度対数尤度スコアの合計が最も高い前記対立遺伝子候補対を、前記遺伝子座に存在する対立遺伝子として同定することと;を含む、方法。 - コンピュータシステムであって:
少なくとも1つのプロセッサと;
少なくとも1つのプロセッサに割り当てられたメモリと;
ディスプレイと;
遺伝子座に存在する対立遺伝子を判定するために前記メモリでサポートされているプログラムであって、前記少なくとも1つのプロセッサに実行させるとき、前記少なくとも1つのプロセッサに対し:
a)複数のシーケンスリードを含む対象の配列データを受信させること;
b)前記遺伝子座のゲノム配列と、複数の対立遺伝子配列とを含む参照配列に対して前記シーケンスリードをマッピングさせて、対立遺伝子候補を同定させること;及び
c)前記コンピュータシステムによって、前記遺伝子座に対しマッピングされた前記シーケンスリードを前記遺伝子座に存在する対立遺伝子としてみなす尤度が最も高い対立遺伝子候補対を同定させること;を実行させる複数の命令を含む、プログラムと;を含み、
前記シーケンスリードとみなされる尤度が最も高い前記対立遺伝子候補対が:
i. 対立遺伝子候補の各対に関し、前記遺伝子座における各SNPのそれぞれに対し遺伝子型の対数尤度スコアを求めることであって、各遺伝子型の対数尤度スコアが、前記遺伝子座における各SNPのそれぞれについての対数確率の合計であり、前記対立遺伝子候補対は、前記SNPに対しマッピングされる前記シーケンスリード中のそれぞれのSNPに存在する配列としてみなすことができる、対数尤度スコアを求めることと;
ii. 対立遺伝子候補の各対に関し、前記遺伝子座におけるSNPsの各配列対に対し相対数尤度スコアを求めることであって、各相対数尤度スコアが、前記遺伝子座におけるSNPsの各配列対についての対数確率の合計であり、前記対立遺伝子候補対は、前記SNPsの配列対に対しマッピングされる前記シーケンスリード中のSNPsの配列対に存在する配列とみなすことができる、相対数尤度スコアを求めることと;
により判定され、前記対立遺伝子候補のうち、前記遺伝子型の対数尤度スコア、及び前記相対数尤度スコアの合計が最も高いものが、前記シーケンスリードとしてみなされる尤度が最も高い対立遺伝子候補対である、コンピュータシステム。 - 遺伝子座に存在する対立遺伝子を判定するためのコンピュータプログラム製品であって、前記コンピュータプログラム製品が、複数の命令を格納されている、非一時的なコンピュータにより読み取り可能な媒体上に存在しており、前記格納されている複数の命令は、コンピュータプロセッサにより実行されたときに、前記コンピュータプロセッサに:
a)複数のシーケンスリードを含む対象の配列データを受信させることと;
b)前記遺伝子座のゲノム配列と、複数の対立遺伝子配列とを含む参照配列に対して前記シーケンスリードをマッピングさせて、対立遺伝子候補を同定させることと;
c)前記遺伝子座に対しマッピングされた前記シーケンスリードを前記遺伝子座に存在する対立遺伝子としてみなす尤度が最も高い対立遺伝子候補対を同定させることと;を実行させ、
前記シーケンスリードとみなされる尤度が最も高い前記対立遺伝子候補対が:
i. 対立遺伝子候補の各対に関し、前記遺伝子座における各SNPのそれぞれに対し遺伝子型の対数尤度スコアを求めることであって、各遺伝子型の対数尤度スコアが、前記遺伝子座における各SNPのそれぞれについての対数確率の合計であり、前記対立遺伝子候補対は、前記SNPに対しマッピングされる前記シーケンスリード中のそれぞれのSNPに存在する配列としてみなすことができる、対数尤度スコアを求めることと;
ii. 対立遺伝子候補の各対に関し、前記遺伝子座におけるSNPsの各配列対に対し相対数尤度スコアを求めることであって、各相対数尤度スコアが、前記遺伝子座におけるSNPsの各配列対についての対数確率の合計であり、前記対立遺伝子候補対は、前記SNPsの配列対に対しマッピングされる前記シーケンスリード中のSNPsの配列対に存在する配列とみなすことができる、相対数尤度スコアを求めることと;
により判定され、前記対立遺伝子候補のうち、前記遺伝子型の対数尤度スコア、及び前記相対数尤度スコアの合計が最も高いものが、前記シーケンスリードとしてみなされる尤度が最も高い対立遺伝子候補対である、コンピュータプログラム製品。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201361891193P | 2013-10-15 | 2013-10-15 | |
US61/891,193 | 2013-10-15 | ||
PCT/IB2014/002843 WO2015056103A2 (en) | 2013-10-15 | 2014-10-14 | High resolution allele identification |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019037501A Division JP6715977B2 (ja) | 2013-10-15 | 2019-03-01 | 高解像度での対立遺伝子の同定 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2016541043A JP2016541043A (ja) | 2016-12-28 |
JP6491651B2 true JP6491651B2 (ja) | 2019-03-27 |
Family
ID=52630401
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016523227A Active JP6491651B2 (ja) | 2013-10-15 | 2014-10-14 | 高解像度での対立遺伝子の同定 |
JP2019037501A Active JP6715977B2 (ja) | 2013-10-15 | 2019-03-01 | 高解像度での対立遺伝子の同定 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019037501A Active JP6715977B2 (ja) | 2013-10-15 | 2019-03-01 | 高解像度での対立遺伝子の同定 |
Country Status (8)
Country | Link |
---|---|
US (2) | US10162933B2 (ja) |
EP (1) | EP3058095B1 (ja) |
JP (2) | JP6491651B2 (ja) |
KR (1) | KR102386134B1 (ja) |
CN (1) | CN106103736B (ja) |
AU (1) | AU2014335877B2 (ja) |
CA (1) | CA2927319C (ja) |
WO (1) | WO2015056103A2 (ja) |
Families Citing this family (46)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9898575B2 (en) | 2013-08-21 | 2018-02-20 | Seven Bridges Genomics Inc. | Methods and systems for aligning sequences |
US9116866B2 (en) | 2013-08-21 | 2015-08-25 | Seven Bridges Genomics Inc. | Methods and systems for detecting sequence variants |
KR102386134B1 (ko) | 2013-10-15 | 2022-04-12 | 리제너론 파마슈티칼스 인코포레이티드 | 고분별능 대립유전자 동정 |
AU2014337093B2 (en) | 2013-10-18 | 2020-07-30 | Seven Bridges Genomics Inc. | Methods and systems for identifying disease-induced mutations |
US11049587B2 (en) | 2013-10-18 | 2021-06-29 | Seven Bridges Genomics Inc. | Methods and systems for aligning sequences in the presence of repeating elements |
WO2015058095A1 (en) | 2013-10-18 | 2015-04-23 | Seven Bridges Genomics Inc. | Methods and systems for quantifying sequence alignment |
CN105793689B (zh) | 2013-10-18 | 2020-04-17 | 七桥基因公司 | 用于将遗传样本基因分型的方法和系统 |
US9092402B2 (en) | 2013-10-21 | 2015-07-28 | Seven Bridges Genomics Inc. | Systems and methods for using paired-end data in directed acyclic structure |
ES2827227T3 (es) * | 2013-12-10 | 2021-05-20 | Conexio Genomics Pty Ltd | Métodos y sondas para identificar alelos génicos |
US10867693B2 (en) | 2014-01-10 | 2020-12-15 | Seven Bridges Genomics Inc. | Systems and methods for use of known alleles in read mapping |
US9817944B2 (en) | 2014-02-11 | 2017-11-14 | Seven Bridges Genomics Inc. | Systems and methods for analyzing sequence data |
WO2016141294A1 (en) | 2015-03-05 | 2016-09-09 | Seven Bridges Genomics Inc. | Systems and methods for genomic pattern analysis |
US10793895B2 (en) | 2015-08-24 | 2020-10-06 | Seven Bridges Genomics Inc. | Systems and methods for epigenetic analysis |
MX2018002293A (es) * | 2015-08-25 | 2018-09-05 | Nantomics Llc | Sistemas y métodos para las llamadas variantes de alta precisión. |
US10584380B2 (en) | 2015-09-01 | 2020-03-10 | Seven Bridges Genomics Inc. | Systems and methods for mitochondrial analysis |
US10724110B2 (en) | 2015-09-01 | 2020-07-28 | Seven Bridges Genomics Inc. | Systems and methods for analyzing viral nucleic acids |
US20180268101A1 (en) * | 2015-09-28 | 2018-09-20 | Sirona Genomics, Inc. | Linkage disequilibrium method and database |
US11347704B2 (en) | 2015-10-16 | 2022-05-31 | Seven Bridges Genomics Inc. | Biological graph or sequence serialization |
KR101651817B1 (ko) * | 2015-10-28 | 2016-08-29 | 대한민국 | Ngs 라이브러리 제작용 프라이머 세트 및 이를 이용한 ngs 라이브러리 제작방법 및 키트 |
US20170199960A1 (en) | 2016-01-07 | 2017-07-13 | Seven Bridges Genomics Inc. | Systems and methods for adaptive local alignment for graph genomes |
US10364468B2 (en) | 2016-01-13 | 2019-07-30 | Seven Bridges Genomics Inc. | Systems and methods for analyzing circulating tumor DNA |
US10262102B2 (en) | 2016-02-24 | 2019-04-16 | Seven Bridges Genomics Inc. | Systems and methods for genotyping with graph reference |
US10790044B2 (en) | 2016-05-19 | 2020-09-29 | Seven Bridges Genomics Inc. | Systems and methods for sequence encoding, storage, and compression |
CN109477143A (zh) * | 2016-05-27 | 2019-03-15 | 细胞结构公司 | 人类白细胞抗原分型方法 |
EP3472356A4 (en) | 2016-06-17 | 2019-07-24 | Mayo Foundation for Medical Education and Research | METHOD AND MATERIALS FOR EFFECTIVELY USING THE COMBINED TARGET ENRICHMENT OF GENOMEGIONS AND FOR TOTAL GENOME SEQUENCING WITH LOW RANGE |
KR101815529B1 (ko) * | 2016-07-29 | 2018-01-30 | (주)신테카바이오 | 휴먼 하플로타이핑 시스템 및 방법 |
US11289177B2 (en) | 2016-08-08 | 2022-03-29 | Seven Bridges Genomics, Inc. | Computer method and system of identifying genomic mutations using graph-based local assembly |
US11250931B2 (en) | 2016-09-01 | 2022-02-15 | Seven Bridges Genomics Inc. | Systems and methods for detecting recombination |
US11324801B2 (en) | 2016-09-02 | 2022-05-10 | University Of Utah Research Foundation | NNIF and nNIF-related peptides and related methods |
CA3038275A1 (en) * | 2016-09-26 | 2018-03-29 | Sirona Genomics, Inc. | For human leukocyte antigen genotyping method and determining hla haplotype diversity in a sample population |
US10319465B2 (en) | 2016-11-16 | 2019-06-11 | Seven Bridges Genomics Inc. | Systems and methods for aligning sequences to graph references |
KR101936933B1 (ko) * | 2016-11-29 | 2019-01-09 | 연세대학교 산학협력단 | 염기서열의 변이 검출방법 및 이를 이용한 염기서열의 변이 검출 디바이스 |
WO2018112348A1 (en) * | 2016-12-15 | 2018-06-21 | Sirona Genomics, Inc. | Genotyping diploid samples with coverage plot of unexplained reads |
US10726110B2 (en) | 2017-03-01 | 2020-07-28 | Seven Bridges Genomics, Inc. | Watermarking for data security in bioinformatic sequence analysis |
US11347844B2 (en) | 2017-03-01 | 2022-05-31 | Seven Bridges Genomics, Inc. | Data security in bioinformatic sequence analysis |
RU2020106732A (ru) | 2017-07-14 | 2021-08-16 | Дзе Фрэнсиз Крик Инститьют Лимитед | Анализ аллелей hla в опухолях и его применения |
KR102035615B1 (ko) * | 2017-08-07 | 2019-10-23 | 연세대학교 산학협력단 | 유전자 패널에 기초한 염기서열의 변이 검출방법 및 이를 이용한 염기서열의 변이 검출 디바이스 |
CN111213210A (zh) * | 2017-09-06 | 2020-05-29 | 河谷控股Ip有限责任公司 | Hla组织匹配及用于其的方法 |
RU2020124312A (ru) * | 2018-02-23 | 2022-03-23 | Дюк Юниверсити Энд Медикал Сентр | Трансплантация культуры ткани тимуса способствует донор-специфической толерантности к аллогенным трансплантатам паренхиматозных органов |
US11819520B2 (en) | 2018-02-23 | 2023-11-21 | Duke University | Cultured thymus tissue transplantation promotes donor-specific tolerance to allogeneic solid organ transplants |
CN109448789A (zh) * | 2018-09-17 | 2019-03-08 | 上海派森诺生物科技股份有限公司 | 一种基于perl语言的种群特异SNP位点的自动化分析方法 |
CN110942806A (zh) * | 2018-09-25 | 2020-03-31 | 深圳华大法医科技有限公司 | 一种血型基因分型方法和装置及存储介质 |
WO2020235972A1 (ko) * | 2019-05-22 | 2020-11-26 | 서울대학교산학협력단 | Ngs 데이터를 이용하여 유전형을 예측하는 방법 및 장치 |
CN111312332B (zh) * | 2020-02-13 | 2020-10-30 | 国家卫生健康委科学技术研究所 | 基于hla基因的生物信息处理方法、装置及终端 |
WO2023196925A2 (en) * | 2022-04-07 | 2023-10-12 | Guardant Health, Inc. | Methods and systems for allele typing |
WO2023225607A2 (en) * | 2022-05-18 | 2023-11-23 | The University Of North Carolina At Chapel Hill | Unique molecular identifier enhanced hla genotyping and transcript quantitation using nanopore technology |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20100256917A1 (en) | 2007-06-15 | 2010-10-07 | Mcvean Gilean | Allelic determination |
WO2013040583A2 (en) * | 2011-09-16 | 2013-03-21 | Complete Genomics, Inc | Determining variants in a genome of a heterogeneous sample |
KR102386134B1 (ko) | 2013-10-15 | 2022-04-12 | 리제너론 파마슈티칼스 인코포레이티드 | 고분별능 대립유전자 동정 |
-
2014
- 2014-10-14 KR KR1020167012427A patent/KR102386134B1/ko active IP Right Grant
- 2014-10-14 CN CN201480066695.1A patent/CN106103736B/zh active Active
- 2014-10-14 JP JP2016523227A patent/JP6491651B2/ja active Active
- 2014-10-14 WO PCT/IB2014/002843 patent/WO2015056103A2/en active Application Filing
- 2014-10-14 US US14/513,952 patent/US10162933B2/en active Active
- 2014-10-14 CA CA2927319A patent/CA2927319C/en active Active
- 2014-10-14 AU AU2014335877A patent/AU2014335877B2/en active Active
- 2014-10-14 EP EP14843178.6A patent/EP3058095B1/en active Active
-
2018
- 2018-10-19 US US16/165,510 patent/US11594302B2/en active Active
-
2019
- 2019-03-01 JP JP2019037501A patent/JP6715977B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
CA2927319A1 (en) | 2015-04-23 |
US11594302B2 (en) | 2023-02-28 |
CN106103736A (zh) | 2016-11-09 |
US20150110754A1 (en) | 2015-04-23 |
AU2014335877B2 (en) | 2020-09-17 |
EP3058095A2 (en) | 2016-08-24 |
JP2019145114A (ja) | 2019-08-29 |
AU2014335877A2 (en) | 2016-06-16 |
AU2014335877A1 (en) | 2016-05-05 |
JP2016541043A (ja) | 2016-12-28 |
US10162933B2 (en) | 2018-12-25 |
CA2927319C (en) | 2023-03-28 |
US20190121940A1 (en) | 2019-04-25 |
KR20160063400A (ko) | 2016-06-03 |
WO2015056103A2 (en) | 2015-04-23 |
EP3058095B1 (en) | 2019-12-25 |
KR102386134B1 (ko) | 2022-04-12 |
CN106103736B (zh) | 2020-03-03 |
WO2015056103A3 (en) | 2016-01-21 |
JP6715977B2 (ja) | 2020-07-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6715977B2 (ja) | 高解像度での対立遺伝子の同定 | |
US20230203573A1 (en) | Methods for detection of donor-derived cell-free dna | |
Bai et al. | Inference of high resolution HLA types using genome-wide RNA or DNA sequencing reads | |
DK2567226T3 (en) | Monitoring the health and disease status using klonotypeprofiler | |
AU2016293025A1 (en) | System and methodology for the analysis of genomic data obtained from a subject | |
US20210358626A1 (en) | Systems and methods for cancer condition determination using autoencoders | |
JP2022141905A (ja) | 移植拒絶リスクを予測する新規の方法 | |
CN116964223A (zh) | 用于检测多个器官的移植受体中的供体源性游离dna的方法 | |
CN108504660A (zh) | Adcy10基因突变体及其应用 | |
US20220088174A1 (en) | Genomic variants in ig gene regions and uses of same | |
이선호 | New Methods for SNV/InDel Calling and Haplotyping from Next Generation Sequencing Data | |
Claeys | Benchmark of NGS-based prediction algorithms for | |
Larjo et al. | Accuracy of programs for the determination of HLA alleles from NGS data | |
Pineda Sanjuan et al. | Novel Non-Histocompatibility Antigen Mismatched Variants Improve the Ability to Predict Antibody-Mediated Rejection Risk in Kidney Transplant | |
JP2020178556A (ja) | 角膜疾患のリスクを判定する方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20171016 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20181018 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190118 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20190131 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20190301 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6491651 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |