JP6776404B2 - Bambam:高スループット配列決定データの並列比較分析 - Google Patents
Bambam:高スループット配列決定データの並列比較分析 Download PDFInfo
- Publication number
- JP6776404B2 JP6776404B2 JP2019089447A JP2019089447A JP6776404B2 JP 6776404 B2 JP6776404 B2 JP 6776404B2 JP 2019089447 A JP2019089447 A JP 2019089447A JP 2019089447 A JP2019089447 A JP 2019089447A JP 6776404 B2 JP6776404 B2 JP 6776404B2
- Authority
- JP
- Japan
- Prior art keywords
- sequence
- disease
- syndrome
- gene sequence
- patient
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000010835 comparative analysis Methods 0.000 title description 3
- 238000012165 high-throughput sequencing Methods 0.000 title description 2
- 206010028980 Neoplasm Diseases 0.000 claims description 172
- 108700028369 Alleles Proteins 0.000 claims description 65
- 238000012300 Sequence Analysis Methods 0.000 claims description 27
- 108020004999 messenger RNA Proteins 0.000 claims description 23
- 108020004566 Transfer RNA Proteins 0.000 claims description 18
- 239000002679 microRNA Substances 0.000 claims description 17
- 108020005544 Antisense RNA Proteins 0.000 claims description 16
- 108010026552 Proteome Proteins 0.000 claims description 13
- 238000009826 distribution Methods 0.000 claims description 12
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 5
- 102000004196 processed proteins & peptides Human genes 0.000 claims description 4
- 108090000765 processed proteins & peptides Proteins 0.000 claims description 4
- 108091032973 (ribonucleotides)n+m Proteins 0.000 claims description 3
- 210000004369 blood Anatomy 0.000 claims description 3
- 239000008280 blood Substances 0.000 claims description 3
- 229920001184 polypeptide Polymers 0.000 claims description 3
- 230000006870 function Effects 0.000 claims description 2
- 238000003205 genotyping method Methods 0.000 claims description 2
- 108091070501 miRNA Proteins 0.000 claims 1
- -1 rRNA Proteins 0.000 claims 1
- 108090000623 proteins and genes Proteins 0.000 description 235
- 238000000034 method Methods 0.000 description 161
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 148
- 238000004458 analytical method Methods 0.000 description 121
- 210000001519 tissue Anatomy 0.000 description 112
- 201000010099 disease Diseases 0.000 description 90
- 210000004602 germ cell Anatomy 0.000 description 66
- 208000011580 syndromic disease Diseases 0.000 description 66
- 208000035475 disorder Diseases 0.000 description 52
- 201000011510 cancer Diseases 0.000 description 50
- 238000011282 treatment Methods 0.000 description 44
- 208000030836 Hashimoto thyroiditis Diseases 0.000 description 42
- 206010020751 Hypersensitivity Diseases 0.000 description 39
- 201000001981 dermatomyositis Diseases 0.000 description 36
- 208000030507 AIDS Diseases 0.000 description 34
- 230000035772 mutation Effects 0.000 description 32
- 210000001685 thyroid gland Anatomy 0.000 description 31
- 210000004556 brain Anatomy 0.000 description 29
- 210000004027 cell Anatomy 0.000 description 27
- 208000007502 anemia Diseases 0.000 description 25
- 239000003814 drug Substances 0.000 description 24
- 230000014509 gene expression Effects 0.000 description 24
- 208000009956 adenocarcinoma Diseases 0.000 description 23
- 201000006417 multiple sclerosis Diseases 0.000 description 23
- 206010001052 Acute respiratory distress syndrome Diseases 0.000 description 22
- 206010014561 Emphysema Diseases 0.000 description 22
- 201000000028 adult respiratory distress syndrome Diseases 0.000 description 22
- 230000007815 allergy Effects 0.000 description 22
- 208000006673 asthma Diseases 0.000 description 22
- 201000001441 melanoma Diseases 0.000 description 22
- 210000003205 muscle Anatomy 0.000 description 22
- 206010061218 Inflammation Diseases 0.000 description 21
- 241000700605 Viruses Species 0.000 description 21
- 230000004054 inflammatory process Effects 0.000 description 21
- 210000003734 kidney Anatomy 0.000 description 21
- 230000004048 modification Effects 0.000 description 21
- 238000012986 modification Methods 0.000 description 21
- 230000037361 pathway Effects 0.000 description 21
- 210000000115 thoracic cavity Anatomy 0.000 description 21
- 208000015023 Graves' disease Diseases 0.000 description 20
- 208000026935 allergic disease Diseases 0.000 description 20
- 210000000941 bile Anatomy 0.000 description 20
- 239000000523 sample Substances 0.000 description 20
- 230000009885 systemic effect Effects 0.000 description 20
- 238000003745 diagnosis Methods 0.000 description 19
- 229940079593 drug Drugs 0.000 description 19
- 230000002068 genetic effect Effects 0.000 description 19
- 241000894007 species Species 0.000 description 19
- 210000000988 bone and bone Anatomy 0.000 description 18
- 210000000481 breast Anatomy 0.000 description 18
- 206010012601 diabetes mellitus Diseases 0.000 description 18
- 210000004072 lung Anatomy 0.000 description 18
- 206010039073 rheumatoid arthritis Diseases 0.000 description 18
- 241000894006 Bacteria Species 0.000 description 17
- 206010009900 Colitis ulcerative Diseases 0.000 description 17
- 206010058314 Dysplasia Diseases 0.000 description 17
- 208000024869 Goodpasture syndrome Diseases 0.000 description 17
- 206010025323 Lymphomas Diseases 0.000 description 17
- 108700011259 MicroRNAs Proteins 0.000 description 17
- 208000001132 Osteoporosis Diseases 0.000 description 17
- 206010033645 Pancreatitis Diseases 0.000 description 17
- 201000004681 Psoriasis Diseases 0.000 description 17
- 208000033464 Reiter syndrome Diseases 0.000 description 17
- 208000013616 Respiratory Distress Syndrome Diseases 0.000 description 17
- 206010039491 Sarcoma Diseases 0.000 description 17
- 201000009594 Systemic Scleroderma Diseases 0.000 description 17
- 206010042953 Systemic sclerosis Diseases 0.000 description 17
- 201000006704 Ulcerative Colitis Diseases 0.000 description 17
- 201000011032 Werner Syndrome Diseases 0.000 description 17
- 230000001919 adrenal effect Effects 0.000 description 17
- 208000011341 adult acute respiratory distress syndrome Diseases 0.000 description 17
- 206010002022 amyloidosis Diseases 0.000 description 17
- 210000001185 bone marrow Anatomy 0.000 description 17
- 206010006451 bronchitis Diseases 0.000 description 17
- 210000001035 gastrointestinal tract Anatomy 0.000 description 17
- 238000001631 haemodialysis Methods 0.000 description 17
- 210000002216 heart Anatomy 0.000 description 17
- 230000000322 hemodialysis Effects 0.000 description 17
- 230000009610 hypersensitivity Effects 0.000 description 17
- 208000032839 leukemia Diseases 0.000 description 17
- 210000004185 liver Anatomy 0.000 description 17
- 230000002107 myocardial effect Effects 0.000 description 17
- 201000008482 osteoarthritis Diseases 0.000 description 17
- 210000001672 ovary Anatomy 0.000 description 17
- 210000000496 pancreas Anatomy 0.000 description 17
- 244000045947 parasite Species 0.000 description 17
- 210000003899 penis Anatomy 0.000 description 17
- 210000002307 prostate Anatomy 0.000 description 17
- 208000002574 reactive arthritis Diseases 0.000 description 17
- 210000003079 salivary gland Anatomy 0.000 description 17
- 210000003491 skin Anatomy 0.000 description 17
- 210000001550 testis Anatomy 0.000 description 17
- 230000001256 tonic effect Effects 0.000 description 17
- 210000003932 urinary bladder Anatomy 0.000 description 17
- 201000001320 Atherosclerosis Diseases 0.000 description 16
- 208000023328 Basedow disease Diseases 0.000 description 16
- 206010015150 Erythema Diseases 0.000 description 16
- 208000007882 Gastritis Diseases 0.000 description 16
- 206010035226 Plasma cell myeloma Diseases 0.000 description 16
- 206010043561 Thrombocytopenic purpura Diseases 0.000 description 16
- 210000000349 chromosome Anatomy 0.000 description 16
- 231100000321 erythema Toxicity 0.000 description 16
- 201000000050 myeloid neoplasm Diseases 0.000 description 16
- 208000005987 polymyositis Diseases 0.000 description 16
- 108020004418 ribosomal RNA Proteins 0.000 description 16
- 238000012163 sequencing technique Methods 0.000 description 16
- 210000000952 spleen Anatomy 0.000 description 16
- 208000026872 Addison Disease Diseases 0.000 description 15
- 208000024827 Alzheimer disease Diseases 0.000 description 15
- 241000233866 Fungi Species 0.000 description 15
- 206010018364 Glomerulonephritis Diseases 0.000 description 15
- 208000025302 chronic primary adrenal insufficiency Diseases 0.000 description 15
- 239000003184 complementary RNA Substances 0.000 description 15
- 208000014837 parasitic helminthiasis infectious disease Diseases 0.000 description 15
- 230000000849 parathyroid Effects 0.000 description 15
- 230000004044 response Effects 0.000 description 15
- 230000019491 signal transduction Effects 0.000 description 15
- 238000003860 storage Methods 0.000 description 15
- 206010002198 Anaphylactic reaction Diseases 0.000 description 14
- 208000003098 Ganglion Cysts Diseases 0.000 description 14
- 201000005569 Gout Diseases 0.000 description 14
- 208000035186 Hemolytic Autoimmune Anemia Diseases 0.000 description 14
- 241001465754 Metazoa Species 0.000 description 14
- 206010028372 Muscular weakness Diseases 0.000 description 14
- 208000005400 Synovial Cyst Diseases 0.000 description 14
- 208000003455 anaphylaxis Diseases 0.000 description 14
- 201000000448 autoimmune hemolytic anemia Diseases 0.000 description 14
- 210000003679 cervix uteri Anatomy 0.000 description 14
- 230000036473 myasthenia Effects 0.000 description 14
- 201000001119 neuropathy Diseases 0.000 description 14
- 230000007823 neuropathy Effects 0.000 description 14
- 208000033808 peripheral neuropathy Diseases 0.000 description 14
- 238000012545 processing Methods 0.000 description 14
- 230000008707 rearrangement Effects 0.000 description 14
- 208000002491 severe combined immunodeficiency Diseases 0.000 description 14
- 239000003053 toxin Substances 0.000 description 14
- 231100000765 toxin Toxicity 0.000 description 14
- 108700012359 toxins Proteins 0.000 description 14
- 208000011231 Crohn disease Diseases 0.000 description 13
- 206010012438 Dermatitis atopic Diseases 0.000 description 13
- 201000008937 atopic dermatitis Diseases 0.000 description 13
- 210000001671 embryonic stem cell Anatomy 0.000 description 13
- 206010015037 epilepsy Diseases 0.000 description 13
- 230000036244 malformation Effects 0.000 description 13
- 208000009905 Neurofibromatoses Diseases 0.000 description 12
- 208000003532 hypothyroidism Diseases 0.000 description 12
- 230000002989 hypothyroidism Effects 0.000 description 12
- 201000004931 neurofibromatosis Diseases 0.000 description 12
- 102000004169 proteins and genes Human genes 0.000 description 12
- 230000008521 reorganization Effects 0.000 description 12
- 102100025621 Cytochrome b-245 heavy chain Human genes 0.000 description 11
- 201000004315 EAST syndrome Diseases 0.000 description 11
- 206010064571 Gene mutation Diseases 0.000 description 11
- 208000001204 Hashimoto Disease Diseases 0.000 description 11
- 208000029462 Immunodeficiency disease Diseases 0.000 description 11
- 208000010067 Pituitary ACTH Hypersecretion Diseases 0.000 description 11
- 208000020627 Pituitary-dependent Cushing syndrome Diseases 0.000 description 11
- 201000002661 Spondylitis Diseases 0.000 description 11
- 206010008129 cerebral palsy Diseases 0.000 description 11
- 230000001684 chronic effect Effects 0.000 description 11
- 208000016532 chronic granulomatous disease Diseases 0.000 description 11
- 238000012217 deletion Methods 0.000 description 11
- 230000037430 deletion Effects 0.000 description 11
- 208000014674 injury Diseases 0.000 description 11
- 230000008569 process Effects 0.000 description 11
- 230000000392 somatic effect Effects 0.000 description 11
- 238000011269 treatment regimen Methods 0.000 description 11
- 206010061598 Immunodeficiency Diseases 0.000 description 10
- 102000002852 Vasopressins Human genes 0.000 description 10
- 108010004977 Vasopressins Proteins 0.000 description 10
- KBZOIRJILGZLEJ-LGYYRGKSSA-N argipressin Chemical compound C([C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CSSC[C@@H](C(N[C@@H](CC=2C=CC(O)=CC=2)C(=O)N1)=O)N)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCCN=C(N)N)C(=O)NCC(N)=O)C1=CC=CC=C1 KBZOIRJILGZLEJ-LGYYRGKSSA-N 0.000 description 10
- 238000012790 confirmation Methods 0.000 description 10
- 230000001605 fetal effect Effects 0.000 description 10
- 208000026278 immune system disease Diseases 0.000 description 10
- 230000007813 immunodeficiency Effects 0.000 description 10
- 210000004698 lymphocyte Anatomy 0.000 description 10
- 230000008733 trauma Effects 0.000 description 10
- 229960003726 vasopressin Drugs 0.000 description 10
- 206010025327 Lymphopenia Diseases 0.000 description 9
- 208000008601 Polycythemia Diseases 0.000 description 9
- 208000002495 Uterine Neoplasms Diseases 0.000 description 9
- 102000054766 genetic haplotypes Human genes 0.000 description 9
- 231100001023 lymphopenia Toxicity 0.000 description 9
- 230000001225 therapeutic effect Effects 0.000 description 9
- 206010046766 uterine cancer Diseases 0.000 description 9
- 206010004446 Benign prostatic hyperplasia Diseases 0.000 description 8
- 206010013801 Duchenne Muscular Dystrophy Diseases 0.000 description 8
- 206010013883 Dwarfism Diseases 0.000 description 8
- 208000023105 Huntington disease Diseases 0.000 description 8
- 206010030113 Oedema Diseases 0.000 description 8
- 208000018737 Parkinson disease Diseases 0.000 description 8
- 208000004403 Prostatic Hyperplasia Diseases 0.000 description 8
- 206010039710 Scleroderma Diseases 0.000 description 8
- 230000003321 amplification Effects 0.000 description 8
- 201000010901 lateral sclerosis Diseases 0.000 description 8
- 208000005264 motor neuron disease Diseases 0.000 description 8
- 238000003199 nucleic acid amplification method Methods 0.000 description 8
- 201000010065 polycystic ovary syndrome Diseases 0.000 description 8
- 238000012502 risk assessment Methods 0.000 description 8
- 210000004291 uterus Anatomy 0.000 description 8
- 241000220479 Acacia Species 0.000 description 7
- 206010069754 Acquired gene mutation Diseases 0.000 description 7
- 206010003591 Ataxia Diseases 0.000 description 7
- 208000020925 Bipolar disease Diseases 0.000 description 7
- 201000004624 Dermatitis Diseases 0.000 description 7
- 201000010374 Down Syndrome Diseases 0.000 description 7
- 208000012661 Dyskinesia Diseases 0.000 description 7
- 208000027534 Emotional disease Diseases 0.000 description 7
- 201000011240 Frontotemporal dementia Diseases 0.000 description 7
- 235000010643 Leucaena leucocephala Nutrition 0.000 description 7
- 208000000609 Pick Disease of the Brain Diseases 0.000 description 7
- 201000007737 Retinal degeneration Diseases 0.000 description 7
- 241000283984 Rodentia Species 0.000 description 7
- 206010039966 Senile dementia Diseases 0.000 description 7
- 208000006011 Stroke Diseases 0.000 description 7
- 208000026106 cerebrovascular disease Diseases 0.000 description 7
- 201000001352 cholecystitis Diseases 0.000 description 7
- 208000001031 fetal erythroblastosis Diseases 0.000 description 7
- 201000006938 muscular dystrophy Diseases 0.000 description 7
- 150000007523 nucleic acids Chemical group 0.000 description 7
- 230000004043 responsiveness Effects 0.000 description 7
- 201000000980 schizophrenia Diseases 0.000 description 7
- 230000001932 seasonal effect Effects 0.000 description 7
- 230000037439 somatic mutation Effects 0.000 description 7
- 206010006187 Breast cancer Diseases 0.000 description 6
- 208000026310 Breast neoplasm Diseases 0.000 description 6
- 201000003874 Common Variable Immunodeficiency Diseases 0.000 description 6
- 208000014311 Cushing syndrome Diseases 0.000 description 6
- 101150014361 Delta gene Proteins 0.000 description 6
- 206010012289 Dementia Diseases 0.000 description 6
- 206010012442 Dermatitis contact Diseases 0.000 description 6
- 208000012239 Developmental disease Diseases 0.000 description 6
- 206010020850 Hyperthyroidism Diseases 0.000 description 6
- 241000700159 Rattus Species 0.000 description 6
- 208000021386 Sjogren Syndrome Diseases 0.000 description 6
- 208000036142 Viral infection Diseases 0.000 description 6
- 230000004075 alteration Effects 0.000 description 6
- 238000003556 assay Methods 0.000 description 6
- 230000015572 biosynthetic process Effects 0.000 description 6
- 208000003167 cholangitis Diseases 0.000 description 6
- 208000010247 contact dermatitis Diseases 0.000 description 6
- 230000007812 deficiency Effects 0.000 description 6
- 238000011161 development Methods 0.000 description 6
- 230000018109 developmental process Effects 0.000 description 6
- 238000010586 diagram Methods 0.000 description 6
- 230000000694 effects Effects 0.000 description 6
- 238000002474 experimental method Methods 0.000 description 6
- 210000004907 gland Anatomy 0.000 description 6
- 230000036541 health Effects 0.000 description 6
- 210000000056 organ Anatomy 0.000 description 6
- 201000009395 primary hyperaldosteronism Diseases 0.000 description 6
- 206010043554 thrombocytopenia Diseases 0.000 description 6
- 201000002510 thyroid cancer Diseases 0.000 description 6
- 230000009385 viral infection Effects 0.000 description 6
- 208000010444 Acidosis Diseases 0.000 description 5
- 208000035143 Bacterial infection Diseases 0.000 description 5
- 208000002177 Cataract Diseases 0.000 description 5
- 208000006545 Chronic Obstructive Pulmonary Disease Diseases 0.000 description 5
- 206010062334 Congenital genitourinary abnormality Diseases 0.000 description 5
- 108020004414 DNA Proteins 0.000 description 5
- 208000014094 Dystonic disease Diseases 0.000 description 5
- 208000017701 Endocrine disease Diseases 0.000 description 5
- 201000002980 Hyperparathyroidism Diseases 0.000 description 5
- 206010020880 Hypertrophy Diseases 0.000 description 5
- 208000029523 Interstitial Lung disease Diseases 0.000 description 5
- 208000019693 Lung disease Diseases 0.000 description 5
- 206010058467 Lung neoplasm malignant Diseases 0.000 description 5
- 208000036626 Mental retardation Diseases 0.000 description 5
- 241000699666 Mus <mouse, genus> Species 0.000 description 5
- 206010037423 Pulmonary oedema Diseases 0.000 description 5
- 201000001388 Smith-Magenis syndrome Diseases 0.000 description 5
- 208000024770 Thyroid neoplasm Diseases 0.000 description 5
- 206010043780 Thyroiditis acute Diseases 0.000 description 5
- 206010043784 Thyroiditis subacute Diseases 0.000 description 5
- 208000010641 Tooth disease Diseases 0.000 description 5
- 201000007960 WAGR syndrome Diseases 0.000 description 5
- 208000008383 Wilms tumor Diseases 0.000 description 5
- 230000007950 acidosis Effects 0.000 description 5
- 208000026545 acidosis disease Diseases 0.000 description 5
- 230000001154 acute effect Effects 0.000 description 5
- 201000006498 acute thyroiditis Diseases 0.000 description 5
- 210000004100 adrenal gland Anatomy 0.000 description 5
- 230000019552 anatomical structure morphogenesis Effects 0.000 description 5
- 238000010171 animal model Methods 0.000 description 5
- 208000010668 atopic eczema Diseases 0.000 description 5
- 230000001580 bacterial effect Effects 0.000 description 5
- 208000022362 bacterial infectious disease Diseases 0.000 description 5
- 238000004364 calculation method Methods 0.000 description 5
- 230000024245 cell differentiation Effects 0.000 description 5
- 230000010261 cell growth Effects 0.000 description 5
- 150000001875 compounds Chemical class 0.000 description 5
- 238000001514 detection method Methods 0.000 description 5
- 230000004069 differentiation Effects 0.000 description 5
- 230000004064 dysfunction Effects 0.000 description 5
- 208000010118 dystonia Diseases 0.000 description 5
- 210000002149 gonad Anatomy 0.000 description 5
- 208000003906 hydrocephalus Diseases 0.000 description 5
- 230000002757 inflammatory effect Effects 0.000 description 5
- 238000003780 insertion Methods 0.000 description 5
- 230000037431 insertion Effects 0.000 description 5
- 208000020082 intraepithelial neoplasia Diseases 0.000 description 5
- 201000005202 lung cancer Diseases 0.000 description 5
- 208000020816 lung neoplasm Diseases 0.000 description 5
- 230000003387 muscular Effects 0.000 description 5
- 201000008026 nephroblastoma Diseases 0.000 description 5
- 208000004296 neuralgia Diseases 0.000 description 5
- 108020004707 nucleic acids Proteins 0.000 description 5
- 102000039446 nucleic acids Human genes 0.000 description 5
- 230000008775 paternal effect Effects 0.000 description 5
- 230000004962 physiological condition Effects 0.000 description 5
- 208000005333 pulmonary edema Diseases 0.000 description 5
- 230000002685 pulmonary effect Effects 0.000 description 5
- 208000023504 respiratory system disease Diseases 0.000 description 5
- 201000000306 sarcoidosis Diseases 0.000 description 5
- 230000028327 secretion Effects 0.000 description 5
- 201000007497 subacute thyroiditis Diseases 0.000 description 5
- 238000012360 testing method Methods 0.000 description 5
- 239000003440 toxic substance Substances 0.000 description 5
- 210000005239 tubule Anatomy 0.000 description 5
- 206010003645 Atopy Diseases 0.000 description 4
- 208000014644 Brain disease Diseases 0.000 description 4
- 201000010717 Bruton-type agammaglobulinemia Diseases 0.000 description 4
- 208000005623 Carcinogenesis Diseases 0.000 description 4
- 206010010099 Combined immunodeficiency Diseases 0.000 description 4
- 208000035473 Communicable disease Diseases 0.000 description 4
- 206010018325 Congenital glaucomas Diseases 0.000 description 4
- 206010012565 Developmental glaucoma Diseases 0.000 description 4
- 208000032274 Encephalopathy Diseases 0.000 description 4
- 208000003807 Graves Disease Diseases 0.000 description 4
- 206010019860 Hereditary angioedema Diseases 0.000 description 4
- 241000282412 Homo Species 0.000 description 4
- 206010058359 Hypogonadism Diseases 0.000 description 4
- 206010028665 Myxoedema Diseases 0.000 description 4
- 208000021738 Plummer disease Diseases 0.000 description 4
- 206010044242 Toxic nodular goitre Diseases 0.000 description 4
- 108091023040 Transcription factor Proteins 0.000 description 4
- 102000040945 Transcription factor Human genes 0.000 description 4
- 108700005077 Viral Genes Proteins 0.000 description 4
- 208000016349 X-linked agammaglobulinemia Diseases 0.000 description 4
- 230000005856 abnormality Effects 0.000 description 4
- 230000005775 apoptotic pathway Effects 0.000 description 4
- 230000006907 apoptotic process Effects 0.000 description 4
- 230000008901 benefit Effects 0.000 description 4
- 238000004422 calculation algorithm Methods 0.000 description 4
- 230000036952 cancer formation Effects 0.000 description 4
- 231100000504 carcinogenesis Toxicity 0.000 description 4
- 230000008235 cell cycle pathway Effects 0.000 description 4
- 210000000038 chest Anatomy 0.000 description 4
- 230000002759 chromosomal effect Effects 0.000 description 4
- 210000002257 embryonic structure Anatomy 0.000 description 4
- 239000003102 growth factor Substances 0.000 description 4
- 230000006872 improvement Effects 0.000 description 4
- 230000001965 increasing effect Effects 0.000 description 4
- 210000001161 mammalian embryo Anatomy 0.000 description 4
- 238000007726 management method Methods 0.000 description 4
- 238000013507 mapping Methods 0.000 description 4
- 208000003786 myxedema Diseases 0.000 description 4
- 230000001314 paroxysmal effect Effects 0.000 description 4
- 244000052769 pathogen Species 0.000 description 4
- 230000035479 physiological effects, processes and functions Effects 0.000 description 4
- 238000004393 prognosis Methods 0.000 description 4
- 230000001105 regulatory effect Effects 0.000 description 4
- 210000004994 reproductive system Anatomy 0.000 description 4
- 208000017520 skin disease Diseases 0.000 description 4
- 210000000130 stem cell Anatomy 0.000 description 4
- 231100000041 toxicology testing Toxicity 0.000 description 4
- 238000013518 transcription Methods 0.000 description 4
- 230000035897 transcription Effects 0.000 description 4
- 230000002103 transcriptional effect Effects 0.000 description 4
- 230000002485 urinary effect Effects 0.000 description 4
- 206010003210 Arteriosclerosis Diseases 0.000 description 3
- 208000023275 Autoimmune disease Diseases 0.000 description 3
- 201000006935 Becker muscular dystrophy Diseases 0.000 description 3
- 108091035707 Consensus sequence Proteins 0.000 description 3
- 206010011891 Deafness neurosensory Diseases 0.000 description 3
- 208000037147 Hypercalcaemia Diseases 0.000 description 3
- 241000699670 Mus sp. Species 0.000 description 3
- 208000009966 Sensorineural Hearing Loss Diseases 0.000 description 3
- 208000000323 Tourette Syndrome Diseases 0.000 description 3
- 208000016620 Tourette disease Diseases 0.000 description 3
- 206010047115 Vasculitis Diseases 0.000 description 3
- 240000008042 Zea mays Species 0.000 description 3
- 235000005824 Zea mays ssp. parviglumis Nutrition 0.000 description 3
- 235000002017 Zea mays subsp mays Nutrition 0.000 description 3
- 230000002052 anaphylactic effect Effects 0.000 description 3
- 238000013459 approach Methods 0.000 description 3
- 208000011775 arteriosclerosis disease Diseases 0.000 description 3
- 210000002459 blastocyst Anatomy 0.000 description 3
- 239000003795 chemical substances by application Substances 0.000 description 3
- 230000002648 chondrogenic effect Effects 0.000 description 3
- 238000011109 contamination Methods 0.000 description 3
- 235000005822 corn Nutrition 0.000 description 3
- 201000003146 cystitis Diseases 0.000 description 3
- 230000013020 embryo development Effects 0.000 description 3
- 239000012634 fragment Substances 0.000 description 3
- 238000009396 hybridization Methods 0.000 description 3
- 230000000148 hypercalcaemia Effects 0.000 description 3
- 208000030915 hypercalcemia disease Diseases 0.000 description 3
- 238000000338 in vitro Methods 0.000 description 3
- 230000010354 integration Effects 0.000 description 3
- 230000003426 interchromosomal effect Effects 0.000 description 3
- 206010023365 keratopathy Diseases 0.000 description 3
- 238000004519 manufacturing process Methods 0.000 description 3
- 239000002773 nucleotide Substances 0.000 description 3
- 125000003729 nucleotide group Chemical group 0.000 description 3
- 230000006584 pituitary dysfunction Effects 0.000 description 3
- 108091033319 polynucleotide Proteins 0.000 description 3
- 102000040430 polynucleotide Human genes 0.000 description 3
- 230000001850 reproductive effect Effects 0.000 description 3
- 201000004409 schistosomiasis Diseases 0.000 description 3
- 230000035945 sensitivity Effects 0.000 description 3
- 230000001568 sexual effect Effects 0.000 description 3
- 239000000126 substance Substances 0.000 description 3
- 231100000167 toxic agent Toxicity 0.000 description 3
- 230000001988 toxicity Effects 0.000 description 3
- 231100000419 toxicity Toxicity 0.000 description 3
- 231100000027 toxicology Toxicity 0.000 description 3
- 230000009261 transgenic effect Effects 0.000 description 3
- 238000013519 translation Methods 0.000 description 3
- 239000013598 vector Substances 0.000 description 3
- OYPRJOBELJOOCE-UHFFFAOYSA-N Calcium Chemical compound [Ca] OYPRJOBELJOOCE-UHFFFAOYSA-N 0.000 description 2
- 241000288950 Callithrix jacchus Species 0.000 description 2
- 206010061762 Chondropathy Diseases 0.000 description 2
- 206010011878 Deafness Diseases 0.000 description 2
- 206010018910 Haemolysis Diseases 0.000 description 2
- 206010020649 Hyperkeratosis Diseases 0.000 description 2
- 206010062767 Hypophysitis Diseases 0.000 description 2
- 206010053198 Inappropriate antidiuretic hormone secretion Diseases 0.000 description 2
- 208000001126 Keratosis Diseases 0.000 description 2
- 241000282567 Macaca fascicularis Species 0.000 description 2
- 241000124008 Mammalia Species 0.000 description 2
- 208000003250 Mixed connective tissue disease Diseases 0.000 description 2
- 201000003793 Myelodysplastic syndrome Diseases 0.000 description 2
- 208000006105 Uterine Cervical Neoplasms Diseases 0.000 description 2
- 230000000735 allogeneic effect Effects 0.000 description 2
- 230000001363 autoimmune Effects 0.000 description 2
- 230000005784 autoimmunity Effects 0.000 description 2
- 230000008238 biochemical pathway Effects 0.000 description 2
- 239000012472 biological sample Substances 0.000 description 2
- 229910052791 calcium Inorganic materials 0.000 description 2
- 239000011575 calcium Substances 0.000 description 2
- 208000015100 cartilage disease Diseases 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 230000006378 damage Effects 0.000 description 2
- 231100000895 deafness Toxicity 0.000 description 2
- 208000037765 diseases and disorders Diseases 0.000 description 2
- 230000001973 epigenetic effect Effects 0.000 description 2
- 238000005562 fading Methods 0.000 description 2
- 230000002538 fungal effect Effects 0.000 description 2
- 230000003394 haemopoietic effect Effects 0.000 description 2
- 208000016354 hearing loss disease Diseases 0.000 description 2
- 230000008588 hemolysis Effects 0.000 description 2
- 230000003054 hormonal effect Effects 0.000 description 2
- 229940088597 hormone Drugs 0.000 description 2
- 239000005556 hormone Substances 0.000 description 2
- 230000001969 hypertrophic effect Effects 0.000 description 2
- 230000036039 immunity Effects 0.000 description 2
- 201000008284 inappropriate ADH syndrome Diseases 0.000 description 2
- 230000001939 inductive effect Effects 0.000 description 2
- 208000015181 infectious disease Diseases 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 230000000968 intestinal effect Effects 0.000 description 2
- 231100000225 lethality Toxicity 0.000 description 2
- 230000008774 maternal effect Effects 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 206010027175 memory impairment Diseases 0.000 description 2
- 230000001394 metastastic effect Effects 0.000 description 2
- 206010061289 metastatic neoplasm Diseases 0.000 description 2
- 230000011987 methylation Effects 0.000 description 2
- 238000007069 methylation reaction Methods 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- 210000003097 mucus Anatomy 0.000 description 2
- 201000008383 nephritis Diseases 0.000 description 2
- 210000005036 nerve Anatomy 0.000 description 2
- 230000002018 overexpression Effects 0.000 description 2
- 210000002990 parathyroid gland Anatomy 0.000 description 2
- 210000003635 pituitary gland Anatomy 0.000 description 2
- 231100000614 poison Toxicity 0.000 description 2
- 231100000572 poisoning Toxicity 0.000 description 2
- 230000000607 poisoning effect Effects 0.000 description 2
- 239000002157 polynucleotide Substances 0.000 description 2
- 238000002360 preparation method Methods 0.000 description 2
- 230000002062 proliferating effect Effects 0.000 description 2
- 238000011002 quantification Methods 0.000 description 2
- 238000004445 quantitative analysis Methods 0.000 description 2
- 230000000306 recurrent effect Effects 0.000 description 2
- 230000002441 reversible effect Effects 0.000 description 2
- 231100000879 sensorineural hearing loss Toxicity 0.000 description 2
- 208000023573 sensorineural hearing loss disease Diseases 0.000 description 2
- 230000001953 sensory effect Effects 0.000 description 2
- 210000002356 skeleton Anatomy 0.000 description 2
- 239000007787 solid Substances 0.000 description 2
- 210000001082 somatic cell Anatomy 0.000 description 2
- 210000004500 stellate cell Anatomy 0.000 description 2
- 210000001541 thymus gland Anatomy 0.000 description 2
- 238000011820 transgenic animal model Methods 0.000 description 2
- 230000005945 translocation Effects 0.000 description 2
- 230000035502 ADME Effects 0.000 description 1
- 208000009888 Adrenocortical Adenoma Diseases 0.000 description 1
- 206010073128 Anaplastic oligodendroglioma Diseases 0.000 description 1
- 206010003694 Atrophy Diseases 0.000 description 1
- 206010003805 Autism Diseases 0.000 description 1
- 208000020706 Autistic disease Diseases 0.000 description 1
- 238000011740 C57BL/6 mouse Methods 0.000 description 1
- 241000282472 Canis lupus familiaris Species 0.000 description 1
- 235000018893 Cercis canadensis var canadensis Nutrition 0.000 description 1
- 240000000024 Cercis siliquastrum Species 0.000 description 1
- 241000282693 Cercopithecidae Species 0.000 description 1
- 206010060774 Chondrosis Diseases 0.000 description 1
- 206010008748 Chorea Diseases 0.000 description 1
- 206010008805 Chromosomal abnormalities Diseases 0.000 description 1
- 208000031404 Chromosome Aberrations Diseases 0.000 description 1
- 108091026890 Coding region Proteins 0.000 description 1
- 206010010356 Congenital anomaly Diseases 0.000 description 1
- 206010011732 Cyst Diseases 0.000 description 1
- 238000007399 DNA isolation Methods 0.000 description 1
- 230000007067 DNA methylation Effects 0.000 description 1
- 238000001712 DNA sequencing Methods 0.000 description 1
- 206010012335 Dependence Diseases 0.000 description 1
- 206010061818 Disease progression Diseases 0.000 description 1
- 206010061819 Disease recurrence Diseases 0.000 description 1
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 description 1
- 238000012286 ELISA Assay Methods 0.000 description 1
- 241000196324 Embryophyta Species 0.000 description 1
- 201000009273 Endometriosis Diseases 0.000 description 1
- 208000004248 Familial Primary Pulmonary Hypertension Diseases 0.000 description 1
- 206010016654 Fibrosis Diseases 0.000 description 1
- 201000006353 Filariasis Diseases 0.000 description 1
- 206010017533 Fungal infection Diseases 0.000 description 1
- 208000034951 Genetic Translocation Diseases 0.000 description 1
- 201000004311 Gilles de la Tourette syndrome Diseases 0.000 description 1
- 208000010412 Glaucoma Diseases 0.000 description 1
- 208000020875 Idiopathic pulmonary arterial hypertension Diseases 0.000 description 1
- 108010025815 Kanamycin Kinase Proteins 0.000 description 1
- 208000008839 Kidney Neoplasms Diseases 0.000 description 1
- 241000282553 Macaca Species 0.000 description 1
- 201000009906 Meningitis Diseases 0.000 description 1
- 208000021642 Muscular disease Diseases 0.000 description 1
- 208000031888 Mycoses Diseases 0.000 description 1
- 206010028570 Myelopathy Diseases 0.000 description 1
- 201000009623 Myopathy Diseases 0.000 description 1
- 201000002481 Myositis Diseases 0.000 description 1
- 241000244206 Nematoda Species 0.000 description 1
- 208000012902 Nervous system disease Diseases 0.000 description 1
- 208000025966 Neurological disease Diseases 0.000 description 1
- 208000005890 Neuroma Diseases 0.000 description 1
- 108091005461 Nucleic proteins Chemical group 0.000 description 1
- 231100000229 OECD 452 Chronic Toxicity Study Toxicity 0.000 description 1
- 206010061535 Ovarian neoplasm Diseases 0.000 description 1
- 238000012408 PCR amplification Methods 0.000 description 1
- 206010033799 Paralysis Diseases 0.000 description 1
- 208000000733 Paroxysmal Hemoglobinuria Diseases 0.000 description 1
- 102100036050 Phosphatidylinositol N-acetylglucosaminyltransferase subunit A Human genes 0.000 description 1
- 235000014676 Phragmites communis Nutrition 0.000 description 1
- 208000014993 Pituitary disease Diseases 0.000 description 1
- 208000020584 Polyploidy Diseases 0.000 description 1
- 102000003946 Prolactin Human genes 0.000 description 1
- 108010057464 Prolactin Proteins 0.000 description 1
- 108091008109 Pseudogenes Proteins 0.000 description 1
- 102000057361 Pseudogenes Human genes 0.000 description 1
- 206010064911 Pulmonary arterial hypertension Diseases 0.000 description 1
- 206010037549 Purpura Diseases 0.000 description 1
- 241001672981 Purpura Species 0.000 description 1
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 1
- 201000010829 Spina bifida Diseases 0.000 description 1
- 208000006097 Spinal Dysraphism Diseases 0.000 description 1
- 208000000277 Splenic Neoplasms Diseases 0.000 description 1
- 108091027544 Subgenomic mRNA Proteins 0.000 description 1
- 241000282887 Suidae Species 0.000 description 1
- 108700019146 Transgenes Proteins 0.000 description 1
- 206010044688 Trisomy 21 Diseases 0.000 description 1
- 208000026723 Urinary tract disease Diseases 0.000 description 1
- 208000012931 Urologic disease Diseases 0.000 description 1
- 206010046798 Uterine leiomyoma Diseases 0.000 description 1
- 241000219094 Vitaceae Species 0.000 description 1
- 208000027418 Wounds and injury Diseases 0.000 description 1
- 241000244005 Wuchereria bancrofti Species 0.000 description 1
- 238000002835 absorbance Methods 0.000 description 1
- 230000021736 acetylation Effects 0.000 description 1
- 238000006640 acetylation reaction Methods 0.000 description 1
- 231100000215 acute (single dose) toxicity testing Toxicity 0.000 description 1
- 230000001668 ameliorated effect Effects 0.000 description 1
- 210000003484 anatomy Anatomy 0.000 description 1
- 206010002320 anencephaly Diseases 0.000 description 1
- 230000002491 angiogenic effect Effects 0.000 description 1
- 210000004102 animal cell Anatomy 0.000 description 1
- 208000008303 aniridia Diseases 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 206010003246 arthritis Diseases 0.000 description 1
- FIVPIPIDMRVLAY-UHFFFAOYSA-N aspergillin Natural products C1C2=CC=CC(O)C2N2C1(SS1)C(=O)N(C)C1(CO)C2=O FIVPIPIDMRVLAY-UHFFFAOYSA-N 0.000 description 1
- 206010003549 asthenia Diseases 0.000 description 1
- 230000037444 atrophy Effects 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000003542 behavioural effect Effects 0.000 description 1
- 238000004166 bioassay Methods 0.000 description 1
- 230000008236 biological pathway Effects 0.000 description 1
- 238000004820 blood count Methods 0.000 description 1
- 210000001124 body fluid Anatomy 0.000 description 1
- 239000010839 body fluid Substances 0.000 description 1
- 230000000711 cancerogenic effect Effects 0.000 description 1
- 231100000357 carcinogen Toxicity 0.000 description 1
- 231100000315 carcinogenic Toxicity 0.000 description 1
- 239000003183 carcinogenic agent Substances 0.000 description 1
- 230000000747 cardiac effect Effects 0.000 description 1
- 210000004413 cardiac myocyte Anatomy 0.000 description 1
- 230000022159 cartilage development Effects 0.000 description 1
- 230000022131 cell cycle Effects 0.000 description 1
- 230000032823 cell division Effects 0.000 description 1
- 230000019522 cellular metabolic process Effects 0.000 description 1
- 230000002490 cerebral effect Effects 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 201000001883 cholelithiasis Diseases 0.000 description 1
- 208000012601 choreatic disease Diseases 0.000 description 1
- 230000007882 cirrhosis Effects 0.000 description 1
- 208000019425 cirrhosis of liver Diseases 0.000 description 1
- 238000003776 cleavage reaction Methods 0.000 description 1
- 238000012398 clinical drug development Methods 0.000 description 1
- 208000010877 cognitive disease Diseases 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 239000000356 contaminant Substances 0.000 description 1
- 238000011443 conventional therapy Methods 0.000 description 1
- 208000031513 cyst Diseases 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 230000001627 detrimental effect Effects 0.000 description 1
- 238000002059 diagnostic imaging Methods 0.000 description 1
- 238000002405 diagnostic procedure Methods 0.000 description 1
- 230000005750 disease progression Effects 0.000 description 1
- 231100000673 dose–response relationship Toxicity 0.000 description 1
- 229940000406 drug candidate Drugs 0.000 description 1
- 206010013663 drug dependence Diseases 0.000 description 1
- 238000002651 drug therapy Methods 0.000 description 1
- 235000006694 eating habits Nutrition 0.000 description 1
- 201000003511 ectopic pregnancy Diseases 0.000 description 1
- 238000004520 electroporation Methods 0.000 description 1
- 208000006036 elephantiasis Diseases 0.000 description 1
- 230000002357 endometrial effect Effects 0.000 description 1
- 208000023965 endometrium neoplasm Diseases 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000008995 epigenetic change Effects 0.000 description 1
- 230000012173 estrus Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 239000003777 experimental drug Substances 0.000 description 1
- 230000008175 fetal development Effects 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 201000006585 gastric adenocarcinoma Diseases 0.000 description 1
- 238000003209 gene knockout Methods 0.000 description 1
- 230000004077 genetic alteration Effects 0.000 description 1
- 231100000118 genetic alteration Toxicity 0.000 description 1
- 238000012252 genetic analysis Methods 0.000 description 1
- 231100000025 genetic toxicology Toxicity 0.000 description 1
- 210000004392 genitalia Anatomy 0.000 description 1
- 238000013412 genome amplification Methods 0.000 description 1
- 230000037442 genomic alteration Effects 0.000 description 1
- 230000000762 glandular Effects 0.000 description 1
- 230000013595 glycosylation Effects 0.000 description 1
- 238000006206 glycosylation reaction Methods 0.000 description 1
- 229930004094 glycosylphosphatidylinositol Natural products 0.000 description 1
- 235000021021 grapes Nutrition 0.000 description 1
- 230000012010 growth Effects 0.000 description 1
- 230000000004 hemodynamic effect Effects 0.000 description 1
- 208000006454 hepatitis Diseases 0.000 description 1
- 231100000283 hepatitis Toxicity 0.000 description 1
- 230000013632 homeostatic process Effects 0.000 description 1
- 230000006801 homologous recombination Effects 0.000 description 1
- 238000002744 homologous recombination Methods 0.000 description 1
- 230000001976 improved effect Effects 0.000 description 1
- 238000001727 in vivo Methods 0.000 description 1
- 238000009399 inbreeding Methods 0.000 description 1
- 208000000509 infertility Diseases 0.000 description 1
- 230000036512 infertility Effects 0.000 description 1
- 231100000535 infertility Toxicity 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 238000002955 isolation Methods 0.000 description 1
- 201000010982 kidney cancer Diseases 0.000 description 1
- 230000006651 lactation Effects 0.000 description 1
- 239000002502 liposome Substances 0.000 description 1
- 231100001252 long-term toxicity Toxicity 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 201000004792 malaria Diseases 0.000 description 1
- 210000005075 mammary gland Anatomy 0.000 description 1
- 239000003550 marker Substances 0.000 description 1
- 230000013011 mating Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 239000012528 membrane Substances 0.000 description 1
- 210000003716 mesoderm Anatomy 0.000 description 1
- 230000037353 metabolic pathway Effects 0.000 description 1
- 239000002207 metabolite Substances 0.000 description 1
- 238000002705 metabolomic analysis Methods 0.000 description 1
- 230000001431 metabolomic effect Effects 0.000 description 1
- 238000002493 microarray Methods 0.000 description 1
- 244000005700 microbiome Species 0.000 description 1
- 238000000520 microinjection Methods 0.000 description 1
- 239000008267 milk Substances 0.000 description 1
- 210000004080 milk Anatomy 0.000 description 1
- 235000013336 milk Nutrition 0.000 description 1
- 238000001823 molecular biology technique Methods 0.000 description 1
- 230000000921 morphogenic effect Effects 0.000 description 1
- 238000000491 multivariate analysis Methods 0.000 description 1
- 239000003471 mutagenic agent Substances 0.000 description 1
- 231100000707 mutagenic chemical Toxicity 0.000 description 1
- 201000002120 neuroendocrine carcinoma Diseases 0.000 description 1
- 210000002569 neuron Anatomy 0.000 description 1
- 230000007935 neutral effect Effects 0.000 description 1
- 238000007481 next generation sequencing Methods 0.000 description 1
- 238000001543 one-way ANOVA Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 230000002611 ovarian Effects 0.000 description 1
- 230000016087 ovulation Effects 0.000 description 1
- 230000027758 ovulation cycle Effects 0.000 description 1
- 201000003045 paroxysmal nocturnal hemoglobinuria Diseases 0.000 description 1
- 230000001717 pathogenic effect Effects 0.000 description 1
- 230000026731 phosphorylation Effects 0.000 description 1
- 238000006366 phosphorylation reaction Methods 0.000 description 1
- 230000000704 physical effect Effects 0.000 description 1
- 230000035790 physiological processes and functions Effects 0.000 description 1
- 230000001817 pituitary effect Effects 0.000 description 1
- 238000013105 post hoc analysis Methods 0.000 description 1
- 238000012805 post-processing Methods 0.000 description 1
- 238000002203 pretreatment Methods 0.000 description 1
- 238000011809 primate model Methods 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 229940097325 prolactin Drugs 0.000 description 1
- 230000000644 propagated effect Effects 0.000 description 1
- 201000005825 prostate adenocarcinoma Diseases 0.000 description 1
- 230000009145 protein modification Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 239000013074 reference sample Substances 0.000 description 1
- 230000010076 replication Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 238000011808 rodent model Methods 0.000 description 1
- 230000007017 scission Effects 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 208000037812 secondary pulmonary hypertension Diseases 0.000 description 1
- 238000002864 sequence alignment Methods 0.000 description 1
- 231100000527 sperm abnormality Toxicity 0.000 description 1
- 210000000278 spinal cord Anatomy 0.000 description 1
- 201000002471 spleen cancer Diseases 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 230000000638 stimulation Effects 0.000 description 1
- 238000013517 stratification Methods 0.000 description 1
- 208000011117 substance-related disease Diseases 0.000 description 1
- 230000019635 sulfation Effects 0.000 description 1
- 238000005670 sulfation reaction Methods 0.000 description 1
- 230000008093 supporting effect Effects 0.000 description 1
- 238000001356 surgical procedure Methods 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 230000009897 systematic effect Effects 0.000 description 1
- 238000002626 targeted therapy Methods 0.000 description 1
- 229940124597 therapeutic agent Drugs 0.000 description 1
- 238000002560 therapeutic procedure Methods 0.000 description 1
- 208000013066 thyroid gland cancer Diseases 0.000 description 1
- 206010043778 thyroiditis Diseases 0.000 description 1
- 230000008791 toxic response Effects 0.000 description 1
- 231100000440 toxicity profile Toxicity 0.000 description 1
- 238000011426 transformation method Methods 0.000 description 1
- 230000005748 tumor development Effects 0.000 description 1
- 230000009452 underexpressoin Effects 0.000 description 1
- 208000014001 urinary system disease Diseases 0.000 description 1
- 229960005486 vaccine Drugs 0.000 description 1
- 238000012800 visualization Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B99/00—Subject matter not provided for in other groups of this subclass
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B50/00—ICT programming tools or database systems specially adapted for bioinformatics
- G16B50/30—Data warehousing; Computing architectures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/048—Interaction techniques based on graphical user interfaces [GUI]
- G06F3/0484—Interaction techniques based on graphical user interfaces [GUI] for the control of specific functions or operations, e.g. selecting or manipulating an object, an image or a displayed text element, setting a parameter value or selecting a range
- G06F3/04845—Interaction techniques based on graphical user interfaces [GUI] for the control of specific functions or operations, e.g. selecting or manipulating an object, an image or a displayed text element, setting a parameter value or selecting a range for image manipulation, e.g. dragging, rotation, expansion or change of colour
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/166—Editing, e.g. inserting or deleting
- G06F40/169—Annotation, e.g. comment data or footnotes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N7/00—Computing arrangements based on specific mathematical models
- G06N7/01—Probabilistic graphical models, e.g. probabilistic networks
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
- G16B20/10—Ploidy or copy number detection
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
- G16B20/20—Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
- G16B20/40—Population genetics; Linkage disequilibrium
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B30/00—ICT specially adapted for sequence analysis involving nucleotides or amino acids
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B30/00—ICT specially adapted for sequence analysis involving nucleotides or amino acids
- G16B30/10—Sequence alignment; Homology search
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B40/00—ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B50/00—ICT programming tools or database systems specially adapted for bioinformatics
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H10/00—ICT specially adapted for the handling or processing of patient-related medical or healthcare data
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H10/00—ICT specially adapted for the handling or processing of patient-related medical or healthcare data
- G16H10/40—ICT specially adapted for the handling or processing of patient-related medical or healthcare data for data related to laboratory analysis, e.g. patient specimen analysis
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H10/00—ICT specially adapted for the handling or processing of patient-related medical or healthcare data
- G16H10/60—ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/20—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/30—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Medical Informatics (AREA)
- Theoretical Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Evolutionary Biology (AREA)
- Biotechnology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Biophysics (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Analytical Chemistry (AREA)
- Chemical & Material Sciences (AREA)
- Genetics & Genomics (AREA)
- Molecular Biology (AREA)
- Databases & Information Systems (AREA)
- Public Health (AREA)
- Bioethics (AREA)
- Epidemiology (AREA)
- Primary Health Care (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Biomedical Technology (AREA)
- Physiology (AREA)
- Ecology (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Software Systems (AREA)
- Pathology (AREA)
- Human Computer Interaction (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Algebra (AREA)
- Mathematical Physics (AREA)
- Computing Systems (AREA)
Description
本出願は、その全体が参照により本明細書に組み込まれている、2011年11月18日出願の表題「Bambam:高スループット配列決定データの並列比較分析(Bambam:Parallel Comparative Analysis Of High−Throughput Sequencing Data)」の米国非仮特許出願第13/373,550号に関連し、その優先権を主張するものである。
本発明は、以下の米国連邦政府関連機関からの助成金を使用して一部行われた:国立癌研究所番号1U24CA143858−01。米国連邦政府は本発明の一定の権利を有する。
本発明は、データを処理し、個体又は対象における生物学的経路の構成要素を同定し、それによって個体又は対象が障害又は疾患の危険性にあるかどうかを決定する方法に関する。この方法は、SAM/BAMにフォーマット済みのファイルに記憶されているショートリードアラインメントを使用した、個体又は対象の腫瘍及び生殖系列配列決定データの比較分析を行うためのツールとして使用し得る。データを処理する方法は、全体的及び対立遺伝子特異的なコピー数を計算し、対立遺伝子不均衡の領域にわたって生殖系列配列をフェージングし、体細胞及び生殖系列配列の変異を発見し、体細胞及び生殖系列の構造的変動の領域を推量する。また、本発明は、その方法を使用して、癌、自己免疫疾患、細胞周期障害、又は他の障害に感受性があるかどうかを診断することにも関する。
配列決定における近年の進歩は、個々の生物及び一生物の組織の両方、ならびに明確な集団及び種でさえもの、大量のゲノム及びサブゲノムデータをもたらしている。このことは、様々な疾患のゲノムに基づく個別化処置又は診断、予後診断/危険性評価、ならびにゲノム、転写、及び/又は後成的情報を使用した処置応答の予測さえもの開発に拍車をかけた。
最も好ましくは、第1及び第2の遺伝子配列ストリングは、第1及び第2の組織のゲノム、トランスクリプトーム、もしくはプロテオームの少なくとも10%、より典型的には少なくとも50%、又はそれぞれ第1及び第2の組織のゲノム、トランスクリプトーム、もしくはプロテオームの実質的に全体でさえを表す。さらに、第1及び第2の組織は同じ生物学的実体を起源とする(たとえば、患者、健康な個体、細胞系、幹細胞、実験動物モデル、組換え細菌細胞、又はウイルス)ことも理解されたい。他方では、第1の組織は健康な組織であり得る一方で、第2の組織は患部組織(たとえば腫瘍組織)であり得る。さらなる企図される態様では、対応するサブストリングはホモ接合性又はヘテロ接合性の対立遺伝子を含む。
特に好ましい方法では、医療記録記憶装置はスマートカードとして構成されており、患者によって保有され、かつ/又は医療提供者によって遠隔アクセス可能である。
最も典型的には、患者の差分遺伝子配列オブジェクトは、少なくとも2つの染色体、又は患者の実質的に全ゲノムでさえもの複数の局所差分ストリングを含む。その代わりに、又はそれに加えて、患者の差分遺伝子配列オブジェクトは、少なくとも2つの組織型を表す複数の局所差分ストリング、又は同じ組織において時間間隔を空けた少なくとも2つの結果(たとえば、同じ組織の時間間隔を空けた結果は、処置開始の前及び後から得られる)も含み得る。患者に特異的な指示は、診断、予後診断、処置結果の予測、処置戦略の推奨、及び/又は処方であることがさらに一般的に好ましい。
そのような方法では、集団が、複数の血縁者ならびに/又は少なくとも1つの共通の特長(たとえば、病原体への曝露、有害物質への曝露、既往歴、処置歴、処置の成功、性別、種、及び/もしくは年齢)を共有することによって特徴づけられた複数のメンバーを含むことが一般的に企図される。また、適切な集団は、地理的位置、民族性、及び/又は職業を共有することによって特徴づけられた複数のメンバーも含み得る。したがって、集団解析記録は父系性又は母系性の確認を含むことを認識されたい。
別の好ましい実施形態では、差分遺伝子配列オブジェクトは、少なくとも1つの染色体の複数の局所差分ストリングを表す。
別の好ましい実施形態では、差分遺伝子配列オブジェクトは、第1の組織の実質的に全ゲノムの複数の局所差分ストリングを表す。
より好ましい代替の実施形態では、状態は、組織内のシグナル伝達経路に関連する経路モデル情報を含む。最も好ましい実施形態では、シグナル伝達経路は、成長因子シグナル伝達経路、転写因子シグナル伝達経路、アポトーシス経路、細胞周期経路、及びホルモン応答経路からなる群から選択される。
また、本発明は、第1の配列ストリングの全長にわたって第1及び第2の配列ストリングを繰り返し増分同期させるステップをさらに含む、本明細書中に開示した方法も提供する。
また、本発明は、集団を解析する方法であって、集団の医療記録データベース中の複数の差分遺伝子配列オブジェクトを獲得及び記憶するステップであって、記録データベースが解析エンジンと情報的に連結されているステップと、解析エンジンによって、複数の差分遺伝子配列オブジェクト内の複数の局所差分ストリングの一群を同定して一群記録を生成するステップと、解析エンジンによって、一群記録を使用して集団解析記録を生成するステップとを含む方法も提供する。好ましい実施形態では、集団は複数の血縁者を含む。好ましい代替の実施形態では、集団は、病原体への曝露、有害物質への曝露、既往歴、処置歴、処置の成功、性別、種、及び年齢からなる群から選択される少なくとも1つの共通の特長を共有することによって特徴づけられた複数のメンバーを含む。別の好ましい代替の実施形態では、集団は、地理的位置、民族性、及び職業からなる群から選択される少なくとも1つの共通の特長を共有することによって特徴づけられた複数のメンバーを含む。さらに好ましい代替の実施形態では、集団解析記録は父系性又は母系性の確認を含む。
好ましい実施形態では、客観的な情報は、遺伝的に関連性のある情報、代謝的に関連性のある情報、毒物学的に関連性のある情報、臨床的に意味のある情報、時間的に関連性のある情報、地理的に関連性のある情報、職業上の危険性に関連性のある情報、生活史に関連性のある情報などからなる群から選択される。
[1]
差分遺伝子配列オブジェクトを誘導する方法であって、
(a)第1の組織を表す第1の遺伝子配列ストリング及び(b)第2の組織を表す第2の遺伝子配列ストリングを記憶する遺伝子データベースへのアクセスを提供するステップであって、第1及び第2の配列ストリングが複数の対応するサブストリングを有するステップと、
遺伝子データベースと連結させた配列解析エンジンへのアクセスを提供するステップと、
複数の対応するサブストリングのうちの少なくとも1つの既知の位置を使用して第1及び第2の配列ストリングを増分同期させることによって、配列解析エンジンを使用して局所アラインメントを生成するステップと、
配列解析エンジンによって、局所アラインメントを使用して、局所アラインメント内の第1と第2の配列ストリングとの間で局所差分ストリングを生成するステップと、
配列解析エンジンによって、局所差分ストリングを使用して、差分配列データベース中の差分遺伝子配列オブジェクトを更新するステップと
を含む方法。
[2]
第1及び第2の遺伝子配列ストリングが、それぞれ第1及び第2の組織のゲノム、トランスクリプトーム、又はプロテオームの少なくとも10%を表す、[1]に記載の方法。
[3]
第1及び第2の遺伝子配列ストリングが、それぞれ第1及び第2の組織のゲノム、トランスクリプトーム、又はプロテオームの少なくとも50%を表す、[1]に記載の方法。
[4]
第1及び第2の遺伝子配列ストリングが、それぞれ第1及び第2の組織のゲノム、トランスクリプトーム、又はプロテオームの実質的に全体を表す、[1]に記載の方法。
[5]
第1及び第2の組織が、患者、健康な個体、細胞系、幹細胞、実験動物モデル、組換え細菌細胞、及びウイルスからなる群から選択される同じ生物学的実体を起源とする、[1]に記載の方法。
[6]
第1の組織が健康な組織であり、第2が患部組織である、[1]に記載の方法。
[7]
患部組織が腫瘍組織を含む、[6]に記載の方法。
[8]
対応するサブストリングがホモ接合性対立遺伝子を含む、[1]に記載の方法。
[9]
対応するサブストリングがヘテロ接合性対立遺伝子を含む、[1]に記載の方法。
[10]
同期ステップが、第1のストリング内の先験的に既知の位置に基づいて複数のサブストリングのうちの少なくとも1つをアラインさせることを含む、[1]に記載の方法。
[11]
同期ステップが、複数のサブストリングのうちの少なくとも1つの既知の位置を含む既知の参照ストリングに基づいて、複数のサブストリングのうちの少なくとも1つをアラインさせることを含む、[1]に記載の方法。
[12]
既知の参照ストリングがコンセンサス配列である、[11]に記載の方法。
[13]
同期ステップが、複数のサブストリングのうちの少なくとも1つの長さよりも短い長さのウィンドウ内で複数のサブストリングのうちの少なくとも1つをアラインさせることを含む、[1]に記載の方法。
[14]
第1の配列ストリングの全長にわたって第1及び第2の配列ストリングを繰り返し増分同期させることをさらに含む、[1]に記載の方法。
[15]
差分遺伝子配列オブジェクトが、少なくとも1つの染色体の複数の局所差分ストリングを表す、[1]に記載の方法。
[16]
差分遺伝子配列オブジェクトが、第1の組織の実質的に全ゲノムの複数の局所差分ストリングを表す、[1]に記載の方法。
[17]
差分遺伝子配列オブジェクトが、差分遺伝子配列オブジェクトを記述するメタデータを含む属性を含む、[1]に記載の方法。
[18]
属性が、第1及び第2の組織のうちの少なくとも1つの状態を含む、[17]に記載の方法。
[19]
状態が、第1及び第2の組織のうちの少なくとも1つの生理的状態を含む、[18]に記載の方法。
[20]
生理的状態が、新生物成長、アポトーシス、分化状態、組織年齢、及び処置への応答性からなる群から選択される状態を含む、[19]に記載の方法。
[21]
状態が遺伝子状態を含む、[18]に記載の方法。
[22]
遺伝子状態が、少なくとも1つの倍数性、遺伝子のコピー数、反復のコピー数、反転、欠失、ウイルス遺伝子の挿入、体細胞突然変異、生殖系列突然変異、構造的再編成、転位、及びヘテロ接合性の喪失からなる群から選択される状態を含む、[21]に記載の方法。
[23]
状態が、組織内のシグナル伝達経路に関連する経路モデル情報を含む、[17]に記載の方法。
[24]
シグナル伝達経路が、成長因子シグナル伝達経路、転写因子シグナル伝達経路、アポトーシス経路、細胞周期経路、及びホルモン応答経路からなる群から選択される、[23]に記載の方法。
[25]
遺伝子配列オブジェクトがファイルを含む、[1]に記載の方法。
[26]
ファイルが標準化フォーマットに従う、[25]に記載の方法。
[27]
ファイルがSAM/BAMフォーマットに従う、[26]に記載の方法。
[28]
医療サービスを提供する方法であって、
医療記録記憶装置と情報的に連結させた解析エンジンへのアクセスを提供するステップであって、記憶装置が患者の差分遺伝子配列オブジェクトを記憶するステップと、
解析エンジンによって、患者の差分遺伝子配列オブジェクト中の局所差分ストリング又は複数の局所差分ストリングの一群の存在を使用して患者に特異的なデータセットを生成するステップと、
解析エンジンによって、患者に特異的なデータセットに基づいて患者に特異的な指示を生成するステップと
を含む方法。
[29]
医療記録記憶装置はスマートカードとして構成されており、患者によって保有される、[28]に記載の方法。
[30]
医療記録記憶装置が医療提供者によって遠隔アクセス可能である、[28]に記載の方法。
[31]
患者の差分遺伝子配列オブジェクトが、少なくとも2つの染色体の複数の局所差分ストリングを含む、[28]に記載の方法。
[32]
患者の差分遺伝子配列オブジェクトが、患者の実質的に全ゲノムの複数の局所差分ストリングを含む、[28]に記載の方法。
[33]
患者の差分遺伝子配列オブジェクトが、少なくとも2つの組織型を表す複数の局所差分ストリング、又は同じ組織において時間間隔を空けた少なくとも2つの結果を含む、[28]に記載の方法。
[34]
同じ組織において時間間隔を空けた少なくとも2つの結果が、処置開始の前及び後から得られる、[33]に記載の方法。
[35]
患者に特異的な指示が、診断、予後診断、処置結果の予測、処置戦略の推奨、及び処方からなる群から選択される、[28]に記載の方法。
[36]
集団を解析する方法であって、
集団の医療記録データベース中の複数の差分遺伝子配列オブジェクトを獲得及び記憶するステップであって、記録データベースが解析エンジンと情報的に連結されているステップと、
解析エンジンによって、複数の差分遺伝子配列オブジェクト内の複数の局所差分ストリングの一群を同定して一群記録を生成するステップと、
解析エンジンによって、一群記録を使用して集団解析記録を生成するステップと
を含む方法。
[37]
集団が複数の血縁者を含む、[36]に記載の方法。
[38]
集団が、病原体への曝露、有害物質への曝露、既往歴、処置歴、処置の成功、性別、種、及び年齢からなる群から選択される少なくとも1つの共通の特長を共有することによって特徴づけられた複数のメンバーを含む、[36]に記載の方法。
[39]
集団が、地理的位置、民族性、及び職業からなる群から選択される少なくとも1つの共通の特長を共有することによって特徴づけられた複数のメンバーを含む、[36]に記載の方法。
[40]
集団解析記録が父系性又は母系性の確認を含む、[36]に記載の方法。
[41]
個々の患者の一群記録を集団解析記録と比較するステップをさらに含む、[36]に記載の方法。
[42]
個々の患者の一群記録を集団解析記録と比較するステップが、患者に特異的な記録を作成する、[41]に記載の方法。
[43]
患者に特異的な記録が、危険性評価又は患者が特定集団に属するという確認を含む、[42]に記載の方法。
[44]
患者に特異的な記録が、診断、予後診断、処置結果の予測、処置戦略の推奨、及び処方を含む、[42]に記載の方法。
[45]
人の差分遺伝子配列オブジェクトを解析する方法であって、
参照差分遺伝子配列オブジェクトを解析エンジンと情報的に連結させた医療記録データベースに記憶させるステップと、
解析エンジンによって、人の差分遺伝子配列オブジェクト中の複数の局所差分ストリングと参照差分遺伝子配列オブジェクト中の複数の局所差分ストリングとの間の偏差を計算して偏差記録を生成するステップと、
解析エンジンによって、偏差記録を使用して人に特異的な偏差プロフィールを生成するステップと
を含む方法。
[46]
参照差分遺伝子配列オブジェクトを、人の複数の局所差分ストリングから計算する、[45]に記載の方法。
[47]
参照差分遺伝子配列オブジェクトを、人の複数の局所差分ストリングから計算する、[45]に記載の方法。
[48]
患者又は人が、状態を診断された患者又は人からなる群から選択され、状態が、疾患及び障害からなる群から選択される、[1]、[28]、[36]、又は[45]に記載の方法。
[49]
状態が、後天性免疫不全症候群(AIDS)、アジソン病、成人呼吸窮迫症候群、アレルギー、強直性脊椎炎、アミロイド症、貧血、喘息、アテローム性動脈硬化症、自己免疫性溶血性貧血、自己免疫性甲状腺炎、良性前立腺肥大、気管支炎、チェディアック−東症候群、胆嚢炎、クローン病、アトピー性皮膚炎、皮膚筋炎、真性糖尿病、気腫、胎児赤芽球症、結節性紅斑、萎縮性胃炎、糸球体腎炎、グッドパスチャー症候群、痛風、慢性肉芽腫性疾患、グレーブス病、橋本甲状腺炎、過好酸球増加症、過敏性腸症候群、多発性硬化症、重症筋無力症、心筋又は心膜の炎症、骨関節炎、骨粗鬆症、膵炎、多嚢胞性卵巣症候群、多発性筋炎、乾癬、ライター症候群、関節リウマチ、強皮症、重症複合型免疫不全症(SCID)、シェーグレン症候群、全身性アナフィラキシー、全身性エリテマトーデス、全身性硬化症、血小板減少性紫斑病、潰瘍性大腸炎、ブドウ膜炎、ウェルナー症候群、癌、血液透析、及び体外循環の合併症、ウイルス、細菌、真菌、寄生生物、原虫、及び蠕虫の感染症;腺癌、白血病、リンパ腫、黒色腫、骨髄腫、肉腫、奇形癌、特に、副腎、膀胱、骨、骨髄、脳、乳房、子宮頸部、胆嚢、神経節、胃腸管、心臓、腎臓、肝臓、肺、筋肉、卵巣、膵臓、副甲状腺、陰茎、前立腺、唾液腺、皮膚、脾臓、精巣、胸腺、甲状腺、及び子宮の癌、アカシジア、アルツハイマー病、健忘症、筋萎縮性側索硬化症(ALS)、運動失調、双極性障害、緊張病、脳性麻痺、脳血管疾患、クロイツフェルト−ヤコブ病、認知症、鬱病、ダウン症候群、遅発性ジスキネジア、ジストニア、癲癇、ハンチントン病、多発性硬化症、筋ジストロフィー、神経痛、神経線維腫症、神経障害、パーキンソン病、ピック病、網膜色素変性症、統合失調症、季節性情動障害、老人性認知症、脳卒中、トゥレット症候群、ならびに特に脳の腺癌、黒色腫、及び奇形癌を含めた癌からなる群から選択される、[48]に記載の方法。
[50]
状態が、腺癌、白血病、リンパ腫、黒色腫、骨髄腫、肉腫、奇形癌などの癌、特に、副腎、膀胱、骨、骨髄、脳、乳房、子宮頸部、胆嚢、神経節、胃腸管、心臓、腎臓、肝臓、肺、筋肉、卵巣、膵臓、副甲状腺、陰茎、前立腺、唾液腺、皮膚、脾臓、精巣、胸腺、甲状腺、及び子宮の癌;後天性免疫不全症候群(AIDS)、アジソン病、成人呼吸窮迫症候群、アレルギー、強直性脊椎炎、アミロイド症、貧血、喘息、アテローム性動脈硬化症、自己免疫性溶血性貧血、自己免疫性甲状腺炎、気管支炎、胆嚢炎、接触皮膚炎、クローン病、アトピー性皮膚炎、皮膚筋炎、真性糖尿病、気腫、リンパ球毒素を伴う偶発性リンパ球減少症、胎児赤芽球症、結節性紅斑、萎縮性胃炎、糸球体腎炎、グッドパスチャー症候群、痛風、グレーブス病、橋本甲状腺炎、過好酸球増加症、過敏性腸症候群、多発性硬化症、重症筋無力症、心筋又は心膜の炎症、骨関節炎、骨粗鬆症、膵炎、多発性筋炎、乾癬、ライター症候群、関節リウマチ、強皮症、シェーグレン症候群、全身性アナフィラキシー、全身性エリテマトーデス、全身性硬化症、血小板減少性紫斑病、潰瘍性大腸炎、ブドウ膜炎、ウェルナー症候群、癌、血液透析、及び体外循環の合併症、ウイルス、細菌、真菌、寄生生物、原虫、及び蠕虫の感染症、外傷、ブルトン型X連鎖無ガンマグロブリン血症、後天性免疫グロブリン血症(CVI)、ディジョージ症候群(胸腺形成不全)、胸腺異形成、IgA単独欠損症、重症複合型免疫不全症(SCID)、血小板減少症及び湿疹を伴う免疫不全(ウィスコット−アルドリッチ症候群)、チェディアック−東症候群、慢性肉芽腫性疾患、遺伝性血管神経性浮腫、及びクッシング病関連の免疫不全などの免疫障害;並びに、腎尿細管性アシドーシス、貧血、クッシング症候群、軟骨形成不全性小人症、デュシェンヌ及びベッカー型筋ジストロフィー、癲癇、性腺形成不全、WAGR症候群(ウィルムス腫瘍、無虹彩症、泌尿生殖器奇形、及び精神遅滞)、スミス−マゲニス症候群、骨髄異形成症候群、遺伝性粘膜上皮異形成、遺伝性角皮症、シャルコー−マリー−トゥース病及び神経線維腫症などの遺伝性神経障害、甲状腺機能低下症、水頭症、シデナム(Syndenham)舞踏病及び脳性麻痺などの発作性疾患、二分脊椎、無脳症、頭蓋脊椎披裂、先天性緑内障、白内障、感音性難聴、並びに対象の任意の組織、器官、又は系、たとえば、脳、副腎、腎臓、骨格又は生殖器系に関与する細胞の成長と分化、胚形成、及び形態形成に関連する任意の障害などの発達障害からなる群から選択される、[48]に記載の方法。
[51]
状態が、性腺機能低下症、シーハン症候群、尿崩症、カルマン病、ハンド−シュラー−クリスチャン病、レッテラー−シーベ病、サルコイドーシス、トルコ鞍空洞症候群、及び小人症などの下垂体機能低下症に関連する障害などの内分泌障害;末端肥大症、巨人症、及び抗利尿ホルモン(ADH)不適合分泌症候群(SIADH)を含む下垂体機能亢進症;甲状腺種、粘液水腫、細菌感染症に関連する急性甲状腺炎、ウイルス感染症に関連する亜急性甲状腺炎、自己免疫性甲状腺炎(橋本病)及びクレチン症を含む甲状腺機能低下症に関連する障害;甲状腺中毒症及びその様々な形態、グレーブス病、前脛骨粘液水腫、中毒性多結節性甲状腺種、甲状腺癌及びプランマー病を含めた甲状腺機能亢進症に関連する障害;コーン病(慢性高カルシウム血症)を含む副甲状腺機能亢進に関連する障害;アレルギー、喘息、急性及び慢性の炎症性肺疾患、ARDS、気腫、肺鬱血及び肺浮腫、COPD、間質性肺疾患、肺癌などの呼吸器疾患;腺癌、白血病、リンパ腫、黒色腫、骨髄腫、肉腫、奇形癌などの癌、特に、副腎、膀胱、骨、骨髄、脳、乳房、子宮頸部、胆嚢、神経節、胃腸管、心臓、腎臓、肝臓、肺、筋肉、卵巣、膵臓、副甲状腺、陰茎、前立腺、唾液腺、皮膚、脾臓、精巣、胸腺、甲状腺、及び子宮の癌;並びに後天性免疫不全症候群(AIDS)、アジソン病、成人呼吸窮迫症候群、アレルギー、強直性脊椎炎、アミロイド症、貧血、喘息、アテローム性動脈硬化症、自己免疫性溶血性貧血、自己免疫性甲状腺炎、気管支炎、胆嚢炎、接触皮膚炎、クローン病、アトピー性皮膚炎、皮膚筋炎、真性糖尿病、気腫、リンパ球毒素を伴う偶発性リンパ球減少症、胎児赤芽球症、結節性紅斑、萎縮性胃炎、糸球体腎炎、グッドパスチャー症候群、痛風、グレーブス病、橋本甲状腺炎、過好酸球増加症、過敏性腸症候群、多発性硬化症、重症筋無力症、心筋又は心膜の炎症、骨関節炎、骨粗鬆症、膵炎、多発性筋炎、乾癬、ライター症候群、関節リウマチ、強皮症、シェーグレン症候群、全身性アナフィラキシー、全身性エリテマトーデス、全身性硬化症、血小板減少性紫斑病、潰瘍性大腸炎、ブドウ膜炎、ウェルナー症候群、癌、血液透析、及び体外循環の合併症、ウイルス、細菌、真菌、寄生生物、原虫、及び蠕虫の感染症、外傷などの免疫障害からなる群から選択される、[48]に記載の方法。
本発明の主題の様々な目的、特長、態様及び利点は、同様の数字は同様の構成要素を表す添付の図面と共に、以下の好ましい実施形態の詳細な説明から、より明らかとなるであろう。
本明細書中及び添付の特許請求の範囲中で使用する単数形「1つの(a)」、「1つの(an)」、及び「その(the)」には、内容により明らかにそうでないと指示される場合以外は、複数形の言及が含まれる。したがって、たとえば、「1つの対立遺伝子(an allele)」への言及には複数のそのような対立遺伝子対が含まれ、「1つのクラスター(a cluster)」への言及は1つ又は複数のクラスター及びその均等物への言及であり、その他も同様である。
内容により明らかにそうでないと指示される場合以外は、本明細書中で使用する用語「連結されている」には、直接連結(互いに接触している2つの要素が互いに連結されている)及び間接連結(少なくとも1つの追加の要素が2つの要素の間に位置している)がどちらも含まれることを意図する。したがって、用語「連結されている」及び「連結させた」は同義に使用される。本文書内では、「連結させた」とは、「通信可能に連結させた」ことも意味すると解釈されるべきである。
癌ゲノムアトラス(TCGA)、Stand Up To Cancer(SU2C)及び多数の他の研究などの研究が、様々な腫瘍のために近い将来に計画されている。現在のデータセットの解析により、患者間の遺伝子変化は異なる場合があるが、多くの場合に共通の経路を含むことが判明している。したがって、癌進行に関与している関連性のある経路を同定し、これらが様々な患者においてどのように変更されているかを検出することが重要である。
Abecasis G, Durbin R; 1000 Genome Project Data Processing Subgroup. The Sequence Alignment/Map format and SAMtools. Bioinformatics. 2009 Aug 15;25(16):2078-9. Epub 2009 Jun 8)。BamBamは、SAMtoolsライブラリとインタフェースして、SAM/BAMにフォーマット済みのファイルからのショートリードアラインメントを使用して患者の腫瘍及び生殖系列のゲノムを同時に解析する。本開示中では、BamBamツールは、情報ストリングを含む配列を比較するために使用する配列解析エンジンであり得る。一実施形態では、情報ストリングは、生物学的情報、たとえばポリヌクレオチド配列又はポリペプチド(polypetide)配列を含む。別の実施形態では、生物学的情報は、発現データ、たとえばmRNA転写物又はrRNA又はtRNA又はペプチド又はポリペプチド又はタンパク質の相対濃度レベルを含むことができる。別の実施形態では、生物学的情報は、たとえばそれだけには限定されないが、リン酸化、硫酸化、アセチル化(actylation)、メチル化、グリコシル化(glycosilation)、シアリル化(sialation)、グリコシルホスファチジルイノシトールを用いた修飾、又はプロテオグリカンを用いた修飾などのタンパク質修飾の相対量であり得る。
・オブジェクトは動的であり得、パラメータ(たとえば、時間、地理的地域、遺伝系図、種など)のベクターに関して変化することができる
・オブジェクトは、互いのオブジェクト又は参照配列に対して「距離」があるとみなされる場合がある。距離は、関連性の次元に応じて測定することができる。たとえば、距離は、時間に関する仮定上の標準からの偏差又はドリフトであり得る。
・オブジェクトは危険性の指標であり得る:疾患を発生する危険性、曝露に対する脆弱性、ある場所で働く危険性など。
・オブジェクトは利害関係者に提示するために管理することができる:医療提供者、保険会社、患者など。
・グラフオブジェクトとして提示することができる
・統計様式で提示することができる:1人の人、集団、正準の人など
・参照配列をオブジェクトから生成して、正規化した配列を形成することができる。正規化した配列は、測定したオブジェクトから誘導したコンセンサスに基づいて構築することができる。
・オブジェクトは、単一遺伝子のアラインメントではなく大きなサブゲノム又はゲノム情報を代表しており、アノテーションされている/標準のソフトウェアによって読み込み可能なメタデータを含有する。
・オブジェクトは、検出することができる内部パターン又は構造を有することができる:ある状態に相関する突然変異の組は別の箇所での第2の突然変異の組と相関している場合がある;一群の差分パターンはホットスポットである可能性がある;多変量の解析又は他のAI技法を使用して相関を同定する;ホットスポットの有意性(たとえば、存在、非存在など)を検出する
・1人の人に関連するオブジェクトはセキュリティーキーとして使用することができる
・鋳型に基づくことができる
・de novoオブジェクトであり得る
・既存のオブジェクトであり得る
例示的な代替の実施形態では、本方法を使用して患者に特異的な指示を提供することができる:処方、推奨、予後診断など。
一実施形態では、本方法を使用して、たとえば、癌組織の検出、癌組織の病期決定、転移性組織の検出など;それだけには限定されないが、アルツハイマー病、筋萎縮性側索硬化症(ALS)、パーキンソン病、統合失調症、癲癇、及びそれらの合併症などの神経障害の検出;ディジョージ症候群、自閉症、多発性硬化症などの自己免疫障害、糖尿病等の発達障害;それだけには限定されないが、ウイルス感染症、細菌感染症、真菌感染症、リーシュマニア、住血吸虫症、マラリア、サナダムシ、象皮症、線虫、紐虫(nematines)による感染症などの感染症処置の、様々な診断及び治療の応用に使用することができる臨床的情報を提供し得る。
「BamBam」は、大きな配列決定データセットを調査して、その生殖系列と比較してそれぞれの腫瘍内で起こる高品質なゲノム事象の組を生成するための、計算効率の良い方法である。これらの結果は腫瘍の染色体ダイナミクスへの瞥見をもたらし、腫瘍の最終状態及びそれらをもたらした事象の理解を改善させる。
本明細書中に記載の方法は、遺伝子又はタンパク質の発現の変更に関連する状態、疾患、又は障害のために、メッセンジャーRNA(mRNA)、リボソームRNA(rRNA)、トランスファーRNA(tRNA)、マイクロRNA(miRNA)、アンチセンスRNA(asRNA)などへの変更及び/又は修飾を含めた遺伝子構造の変更、遺伝子突然変異、遺伝子生化学的修飾を検出及び定量するために使用し得る。また、本明細書中に記載の方法は、変更された遺伝子発現、非存在/存在対過剰、mRNAの発現を検出及び定量するため、又は治療行為中のmRNAレベルを監視するためにも使用し得る。発現の変更に関連する状態、疾患又は障害には、特発性肺動脈高血圧、二次性肺高血圧、細胞増殖性障害、特に未分化乏突起神経膠腫、星細胞腫、オリゴ星細胞腫、膠芽細胞腫、髄膜腫、神経節神経腫、神経新生物、多発性硬化症、ハンチントン病、乳腺癌、前立腺腺癌、胃腺癌、転移性神経内分泌癌、非増殖性及び増殖性の乳腺線維嚢胞症、胆嚢の胆嚢炎及び胆石症、骨関節炎、ならびに関節リウマチ;後天性免疫不全症候群(AIDS)、アジソン病、成人呼吸窮迫症候群、アレルギー、強直性脊椎炎、アミロイド症、貧血、喘息、アテローム性動脈硬化症、自己免疫性溶血性貧血、自己免疫性甲状腺炎、良性前立腺肥大、気管支炎、チェディアック−東症候群、胆嚢炎、クローン病、アトピー性皮膚炎、皮膚筋炎、真性糖尿病、気腫、胎児赤芽球症、結節性紅斑、萎縮性胃炎、糸球体腎炎、グッドパスチャー症候群、痛風、慢性肉芽腫性疾患、グレーブス病、橋本甲状腺炎、過好酸球増加症、過敏性腸症候群、多発性硬化症、重症筋無力症、心筋又は心膜の炎症、骨関節炎、骨粗鬆症、膵炎、多嚢胞性卵巣症候群、多発性筋炎、乾癬、ライター症候群、関節リウマチ、強皮症、重症複合型免疫不全症(SCID)、シェーグレン症候群、全身性アナフィラキシー、全身性エリテマトーデス、全身性硬化症、血小板減少性紫斑病、潰瘍性大腸炎、ブドウ膜炎、ウェルナー症候群、血液透析、体外循環、ウイルス、細菌、真菌、寄生生物、原虫、及び蠕虫の感染症;プロラクチン産生障害、卵管疾患、排卵不良、及び子宮内膜症を含めた不妊症、発情周期破壊、月経周期破壊、多嚢胞性卵巣症候群、卵巣過剰刺激症候群、子宮内膜又は卵巣腫瘍、子宮筋腫、自己免疫障害、子宮外妊娠、ならびに奇形発生;乳癌、乳腺線維嚢胞症、及び乳汁漏出;精子形成破壊、異常精子生理学、良性前立腺肥大、前立腺炎、ペイロニー病、性交不能症、女性化乳房;光線性角化症、動脈硬化症、滑液包炎、硬変、肝炎、混合性結合組織病(MCTD)、骨髄線維症、発作性夜間ヘモグロビン尿症、真性赤血球増加症、原発性血小板血症、癌の合併症、腺癌、白血病、リンパ腫、黒色腫、骨髄腫、肉腫、奇形癌、特に、副腎、膀胱、骨、骨髄、脳、乳房、子宮頸部、胆嚢、神経節、胃腸管、心臓、腎臓、肝臓、肺、筋肉、卵巣、膵臓、副甲状腺、陰茎、前立腺、唾液腺、皮膚、脾臓、精巣、胸腺、甲状腺、及び子宮の癌を含めた癌が含まれる。別の態様では、本発明の核酸。
また、そのようなアッセイは、動物研究及び臨床治験における特定の治療処置レジメンの有効性を評価するため、又は個々の患者の処置を監視するために使用し得る。状態の存在が確立され、処置プロトコルが開始された後、診断的アッセイを定期的に繰り返して、患者中の発現のレベルが正常対象中で観察されるレベルに近づき始めるかどうかを決定し得る。また、アッセイは、腫瘍の存在、腫瘍の非存在、又は臨床的処置もしくは治療を受けている個体の寛解状態を示す及び/又は同定する、メッセンジャーRNA(mRNA)、リボソームRNA(rRNA)、トランスファーRNA(tRNA)、マイクロRNA(miRNA)、アンチセンスRNA(asRNA)などへの変更及び/又は修飾を含めた遺伝子構造、遺伝子突然変異、遺伝子生化学的修飾を検出、定量(quamtify)、又は測定するためにも使用し得る。連続的なアッセイから得られた結果を使用して、数日間から数カ月の範囲の期間にわたる処置の有効性を示し得る。
ヒトと同様の毒性応答を示し、曝露条件がヒトでの曝露に関連性がある、動物モデルをバイオアッセイとして使用し得る。哺乳動物が最も一般的なモデルであり、ほとんどの毒性研究は、低コスト、入手可能性、及び豊富な参照毒性学が理由でラット又はマウスなどのげっ歯類に対して行う。同系交配させたげっ歯類株は、目的遺伝子の過少発現又は過剰発現の生理的結果を調査するため、ならびに疾患の診断及び処置方法を開発するための、好都合なモデルを提供する。また、特定の遺伝子(たとえば乳中に分泌されるもの)を過剰発現するように同系交配させた哺乳動物は、その遺伝子によって発現されたタンパク質の好都合な供給源としても役割を果たし得る。
毒性学とは、生物系に対する薬物の効果の研究である。大多数の毒性研究が、ヒトの健康に対するこれらの薬剤の効果の予測を助けるために、ラット又はマウスに対して行われている。生理学、行動、恒常性プロセス、及び致死性における定性的及び定量的変化の観察を使用して、毒性プロフィールを作成し、薬剤に曝露させた後のヒトの健康に対する結果を評価する。
急性毒性試験は対象に対する薬剤の単一の投与に基づいて、薬剤の症候学又は致死性を決定する。3つの実験を実施する:(a)初期の用量範囲発見実験、(b)有効用量の範囲を狭めるための実験、及び(c)用量応答曲線を確立するための最終実験。
長期毒性試験は薬剤の繰返し投与に基づく。ラット及びイヌをこれらの研究において一般的に使用して、様々なファミリー中の種からのデータを提供する。発癌を例外として、薬剤を高用量濃度で3〜4カ月の期間の間1日1回投与することで、成体動物における毒性のほとんどの形態が明らかとなるという多数の証拠が存在する。
1年間以上の期間をもつ慢性毒性試験は、毒性の非存在又は薬剤の発癌潜在性のどちらかを実証するために使用する。研究をラットに対して実行する場合、最小で3つの試験群及び1つの対照群を使用し、動物を最初及び実験全体にわたって間隔的に検査及び監視する。
目的遺伝子を過剰発現又は過少発現するトランスジェニックげっ歯類を同系交配させ、ヒト疾患をモデリングするため、又は治療剤もしくは毒性剤を試験するために使用し得る。(参照により本明細書に組み込まれている米国特許第4,736,866号、第5,175,383号、及び第5,767,337号を参照。)一部の事例では、導入された遺伝子は、胎児発達中又は出産後の特定の時点で特定の組織型中で活性化させ得る。導入遺伝子の発現は、実験薬物療法を用いたチャレンジの前、その間、及びその後でのトランスジェニック動物における表現型又は組織特異的なmRNA発現の解析によって監視する。
げっ歯類の胚から単離した胚性幹細胞(ES)は、胚を形成する潜在性を保持する。ES細胞をキャリアの胚内に入れた際、これらは正常な発達を再開し、生産動物のすべての組織に貢献する。ES細胞は、実験用ノックアウト及びノックインげっ歯類株の作製に使用される好ましい細胞である。マウス129/SvJ細胞系などのマウスES細胞は初期マウス胚に由来し、当分野で周知の培養条件下で成長させる。ノックアウト株用のベクターは、in vivoでの転写及び/又は翻訳を破壊するマーカー遺伝子を含むように改変された疾患遺伝子候補を含有する。ベクターは、電気穿孔、リポソーム送達、微量注入などの当分野で周知の形質転換方法によってES細胞内に導入する。内在げっ歯類遺伝子は、細胞分裂中の相同組換え及び組込みによって、破壊された疾患遺伝子によって置き換えられる。形質転換されたES細胞を同定し、好ましくはC57BL/6マウス株からのものなどのマウス細胞胚盤胞内に微量注入する。胚盤胞を偽妊娠した雌親へと外科的に移植し、生じるキメラ子孫を遺伝子型決定し、繁殖させて、ヘテロ接合性又はホモ接合性の株を生成する。
また、ES細胞は、神経細胞、造血系、及び心筋細胞などの様々な細胞種及び組織のin vitroでの分化を研究するためにも使用されている(Bain et al. (1995) Dev. Biol. 168: 342-357、Wiles and Keller (1991) Development 111: 259-267、及びKlug et al. (1996) J. Clin. Invest. 98: 216-224)。最近の進展により、ヒト胚盤胞に由来するES細胞は、内肺葉、中胚葉、及び外胚葉(ectodermnal)細胞種を含めた8つの別々の細胞系列へと分化するようにin vitroで操作し得ることも実証されている(Thomson (1998) Science 282: 1145-1147)。
遺伝子ノックアウト解析では、ヒト疾患遺伝子候補の領域を、ネオマイシンホスホトランスフェラーゼ遺伝子(neo、たとえばCapecchi (1989) Science 244: 1288-1292を参照)などの非哺乳動物遺伝子を含むように酵素的に改変させる。挿入されたコード配列は標的遺伝子の転写及び翻訳を破壊し、疾患候補タンパク質の生化学的合成を妨げる。改変された遺伝子を培養胚性幹細胞内に形質転換させ(上述)、形質転換細胞をげっ歯類胞胚内に注入し、胞胚を偽妊娠した雌親へと移植する。トランスジェニック子孫を異種交配させて、ホモ接合性の同系交配系を得る。
胚発生の初期に存在する全能性ES細胞を使用して、ヒト疾患のノックインヒト化動物(ブタ)又はトランスジェニック動物モデル(マウスもしくはラット)を作製することができる。ノックイン技術では、ヒト遺伝子の領域を動物ES細胞内に注入し、ヒト配列は組換えによって動物細胞ゲノム内に組み込まれる。組み込まれたヒト遺伝子を含有する全能性ES細胞は上述のように取り扱う。同系交配させた動物を研究及び処置して、類似のヒト状態に関する情報を得る。これらの方法は、いくつかのヒト疾患をモデリングするために使用されている。(たとえば、Lee et al. (1998) Proc. Natl. Acad. Sci. 95: 11371-11376、Baudoin et al. (1998) Genes Dev. 12: 1202-1216、及びZhuang et al. (1998) Mol. Cell Biol. 18: 3340-3349を参照)。
動物試験の分野は、生理学、遺伝学、化学、薬理学及び統計学などの基礎科学からのデータ及び方法を扱う。これらのデータは、ヒトの健康に関連している可能性があるため、非ヒト霊長類に対する治療剤の効果を評価することにおいて卓越している。ワクチン及び薬物の評価におけるヒトの代用としてサルが使用されており、その応答は、同様の条件下でのヒトの曝露に関連性がある。カニクイザル(Macaca fascicularis、Macaca mulata)及びコモンマーモセット(Callithrix jacchus)がこれらの調査で使用されている最も一般的な非ヒト霊長類(NHP)である。NHPのコロニーの育成及び維持には多大な費用が関連するため、初期研究及び毒性学研究は、通常はげっ歯類モデルで実施する。薬物嗜癖などの行動測定を使用する研究では、NHPが第一選択肢の試験動物である。さらに、NHP及び個々のヒトは多くの薬物及び毒素に対して異なる感受性を示し、これらの薬剤の「高(extensive)代謝者」及び「低(poor)代謝者」として分類することができる。
個別化医療は、特定の処置を、利益を受ける可能性が最も高い患者へ送達することを保証する。本発明者らは、治療化合物の約半数が、臨床的に関連性のある転写又はゲノムの乳癌サブタイプのうちの1つ又は複数において優先的に有効であることを示した。これらの発見は、乳癌処置において応答関連の分子サブタイプを定義する重要性を支援している。また、本発明者らは、細胞系に関する転写及びゲノムデータの経路の組込みは、観察されたサブタイプ特異的な応答の機構的な説明を提供するサブネットワークを明らかにすることも示す。細胞系と腫瘍との間のサブネット活性の比較分析は、サブタイプ特異的なサブネットワークの大多数が細胞系と腫瘍との間で保存的であることを示す。これらの解析は、十分に特徴づけられた細胞系パネルにおける実験化合物の前臨床スクリーニングが、初期段階の臨床治験において感度上昇に使用することができる候補の応答関連分子シグネチャを同定することができるという考えを支援する。本発明者らは、このin vitro評価手法は、応答性の腫瘍サブタイプが、化合物の臨床開発が開始される前に同定され、それによって費用を減らし、最終的なFDA認可の確率を増加させ、場合によっては、応答する見込みのない患者を処置することに関連する毒性を回避する可能性を増加させることを提案する。本研究では、本発明者らは転写性サブタイプを定義する分子シグネチャのみを評価し、再発性ゲノムコピー数異常(CNA)を選択した。本発明者らは、遺伝子突然変異、メチル化及び選択的スプライシングなどの追加の分子特長が解析に含められるにつれて、この手法の能力及び制度が増加すると予想する。同様に、細胞系パネルのサイズを大きくすることは、パネル内のより一般的でない分子パターンを評価する能力を増加させ、ヒト乳癌中に存在する多様性のより完全な範囲を表す確率を増加させる。
さらなる実施形態では、ポリヌクレオチド核酸は未だ開発されていない任意の分子生物学技法において使用してよいが、ただし、その新しい技法は、それだけには限定されないが、トリプレット遺伝暗号及び特異的塩基対相互作用などの特性を含めた現在知られている核酸分子の特性に依存するものである。
さらに別の実施形態は、差分遺伝子配列オブジェクトを使用して人の遺伝子配列が参照試料から偏差する程度を決定する解析エンジン140を含む。参照差分遺伝子配列オブジェクト、場合によっては実在の人又は正準の人を表すものは、医療記録データベース130中に医療記憶として記憶させることができる。解析エンジン140は、人に関連する様々な配列オブジェクトからの人の局所差分ストリングと参照差分遺伝子配列オブジェクトからの局所差分ストリングとの間の偏差を計算する。偏差を計算した後、解析エンジン140は偏差又は逸脱を表す偏差記録154を生成する。システム中の他の記録と同様、偏差記録154には、記録中の情報の特徴を反映する属性(たとえば、人名、タイムスタンプ、試料型など)も含めることができる。その後、解析エンジン140は、偏差記録154を活用して、人の遺伝子配列が参照差分スティング(sting)からどのように偏差するか、又はその度合を示す、人に特異的な偏差プロフィール155を生成することができる。
したがって、本発明の主題に従ったシステムを使用することは、典型的には遺伝子データベースを含む。既に上述したように、遺伝子データベースは物理的には一台のコンピュータ上に位置していてよいが、分散データベースも本明細書における使用に適切であるとみなされることを理解されたい。さらに、そのようなデータベースが、それぞれ第1及び第2の組織を表す、複数の対応するサブストリングを有する第1及び第2の遺伝子配列ストリングの記憶及び検索が可能であり限りは、データベースの特定のフォーマットは本発明の主題を限定しないことも理解されたい。
解析及び試料の特定の性質に応じて、遺伝子配列ストリングの種類は相当に変動する場合があり、配列は核酸配列(DNA又はRNA)及びタンパク質配列であり得ることを指摘すべきである。最も典型的には、しかし、遺伝子配列ストリングは、解析下の第1及び第2の組織のゲノム、トランスクリプトーム、及び/又はプロテオームの顕著な一部分を表す核酸ストリングとなる。たとえば、第1及び第2の遺伝子配列ストリングは、第1及び第2の組織のゲノム、トランスクリプトーム、又はプロテオームの少なくとも10%、より典型的には少なくとも25%、より典型的には少なくとも50%、より典型的には少なくとも70%でさえ、最も典型的には少なくとも90%、又は実質的に全体(少なくとも98%)でさえを表すことが企図される。したがって、本明細書中に提示するシステム及び方法は、第1及び第2の組織との間の有意差の迅速かつ高度に包括的な全体像を可能にする一方で、コンパクトかつ情報価値のある出力ファイルを生成することを理解されたい。
したがって、対応するサブストリングの性質は相当に変動し、採取した組織の種類及びゲノムのカバレッジ量に少なくとも部分的に依存することを認識されたい。しかし、ゲノムカバレッジが比較的高いことが典型的には好ましく、ほとんどの事例では全ゲノムを解析する。したがって、対応するサブストリングには、典型的にはホモ接合性及びヘテロ接合性の対立遺伝子が含まれる。
したがって、差分遺伝子配列オブジェクトは、1つ又は複数の局所差分ストリング、典型的には少なくともゲノムの定義された一部分(たとえば少なくとも1つの染色体)、より典型的には第1又は第2の組織の実質的に全ゲノムを表すことを認識されたい。もちろん、既に知られている位置及び/又は決定された参照ストリングからの偏差に基づいて、差分遺伝子配列オブジェクトには、差分遺伝子配列オブジェクトを記述するメタデータを有する1つ又は複数の属性が含まれることに注意されたい。たとえば、属性は、第1及び/又は第2の組織の状態を説明するものであり得る。状態が生理的状態である場合は、メタデータは新生物成長、アポトーシス、分化状態、組織年齢、及び/又は組織の処置に対する応答性を反映し得る。他方では、状態が遺伝子状態である場合は、メタデータは倍数性、遺伝子のコピー数、反復のコピー数、反転、欠失、ウイルス遺伝子の挿入、体細胞突然変異、生殖系列突然変異、構造的再編成、転位、及び/又はヘテロ接合性の喪失を反映し得る。同様に、状態には組織内のシグナル伝達経路に関連する経路モデル情報(たとえば、薬物に対する予想される応答性、受容体の欠損など)が含まれ、特に企図される経路には、シグナル伝達経路(たとえば、成長因子シグナル伝達経路、転写因子シグナル伝達経路、アポトーシス経路、細胞周期経路、ホルモン応答経路など)が含まれる。
したがって、上記に鑑みて、差分遺伝子配列オブジェクトを様々な様式で使用してよく、差分遺伝子配列オブジェクトは医療、集団解析、及び個別化医療における数々の応用に特に適切であることを理解されたい。
図7〜10に関する以下の記述は、上述の解析の実施形態の例を提供する。
図7は、上記及び図8〜10に関して記述したようにさらなる解析に使用することができる、差分遺伝子配列オブジェクトを誘導する方法200を例示する。方法200は、遺伝子データベースへのアクセスを提供することを含むステップ210から始まる。好ましい遺伝子データベースは、少なくとも、1つの組織からの第1の遺伝子配列ストリング及び第2の場合によっては異なる組織からの第2の遺伝子配列ストリングを記憶する。それぞれの遺伝子配列ストリングは、好ましくは1つ又は複数の対応するサブストリングを含む。
また、図9に例示するように、差分遺伝子配列オブジェクトは、集団を解析するための方法400内でも使用することができる。ステップ410は、医療記録データベース中の差分遺伝子配列オブジェクトを得る又は記憶することを含み、医療記録データベースは人の集団全体にわたる情報を記憶する。医療記録データベース中の記録は、集団の属性(たとえば、人口統計学、民族性、病気、地理、労働条件、曝露など)に応じて構築されたクエリによって得ることができることを理解されたい。たとえば、ヨーロッパ系の郵便番号内に住むすべての男性を標的とするクエリを実行依頼することによって、差分遺伝子配列オブジェクトの結果組を作成することができる。好ましくは、医療記録データベースは解析エンジンと通信可能に連結されている。
ステップ430は、解析エンジンが一群記録を使用して集団解析記録を生成することを含み、これは1つ又は複数の出力装置上に提示させることができる。集団解析記録の例には、父系性又は母系性の確認、祖先情報、人口指標、又は他の集団情報が含まれ得る。
差分遺伝子配列オブジェクトの別の使用が図10の方法500によって表されている。方法500は、人の差分遺伝子配列オブジェクトを使用して、既知の参照に対する人に特異的な偏差プロフィールを誘導することを表している。ステップ510は、解析エンジンと通信可能に連結させた医療記録データベースに参照差分遺伝子配列オブジェクトを記憶させることを含む。参照差分遺伝子配列オブジェクトは、集団もしくは集団セグメントの統計的平均、正準の人、別の人、又は他の種の参照であり得る。
ステップ530では、解析エンジンは偏差記録を使用して人に特異的な偏差プロフィールを生成する。解析エンジンは、望ましいフォーマットに従ってプロフィールを提示するように、1つ又は複数の計算装置をさらに構成することができる。一部の実施形態では、偏差プロフィールは、素人が容易に読めるグラフ様式で人に提示することができる一方で、提示する情報は、遺伝学者、医師、保険会社、又は他の実体に提示した場合はより複雑であり得る。
本発明は、本発明の特定の態様及び実施形態を例示する目的のみで含まれ、限定するものとしては含まれない、以下の例を参照することにより容易に理解されるであろう。
参照ゲノムを介したデータセットの同期
すべてのショートリードを同じ参照ゲノムとアラインさせ、これにより、参照ゲノムが複数の関連する試料からの配列データを組織化するための自然な方法となる。BamBamは、2つのショートリード配列決定データセット、すなわち、同じ患者からの、一方は腫瘍及び他方は一致した正常(「生殖系列」)ならびに参照ゲノムを取り込み、両方のデータセット中の同じゲノム位置に重複するすべての配列が同時に処理するために利用可能であるように、これらのデータセットを読み込む。これが、そのようなデータを処理するために最も効率的である一方で、それぞれのデータセットを単独で処理し、その後にのみ結果を統合する、連続様式では達成が困難又は不可能であろう複雑な解析を可能にする方法である。
そのような方法は、2つより多くの関連する配列決定データセットに容易に拡張可能である。たとえば、3つの試料、すなわち、一致した正常、腫瘍、及び再発を配列決定した場合、この方法を使用して腫瘍及び再発試料に特異的な変化ならびに再発のみに特異的な変化を検索することができ、再発腫瘍が、それが由来すると推定される元の腫瘍からいくらか変化していることが示唆される。また、この同じ方法を使用して、子供、父親、及び母親からの配列決定された試料を考慮して子供のゲノムの遺伝性の部分を決定することもできる。
体細胞及び生殖系列の変異コール
BamBamは、ゲノム全体にわたる配列データを対のファイルで同期させて保持するため、腫瘍及び生殖系列の両方のBAMファイルからの配列決定データならびにヒト参照を必要とする複雑な突然変異モデルを容易に実行することができる。このモデルは、生殖系列の遺伝子型(生殖系列の読取及び参照ヌクレオチドを考慮)ならびに腫瘍の遺伝子型(生殖系列の遺伝子型、単純突然変異モデル、腫瘍試料中の正常組織を汚染している割合の推定、及び腫瘍配列データを考慮)の両方の同時確率を最大にすることを目的とする。
所定のゲノム位置でのすべてのリードから対立遺伝子のサポートを収集することに加えて、リードに関する情報を収集し(正方向又は逆方向のどちらの鎖にリードがマッピングされるか、リード内の対立遺伝子の位置、対立遺伝子の平均品質など)、偽陽性の呼び出しを選択的にフィルタ除去するために使用する。本発明者らは、変異をサポートする対立遺伝子のすべてについて鎖及び対立遺伝子の位置のランダム分布を予想し、分布がこのランダム分布から有意に非対称である(すなわち、すべての変異体対立遺伝子がリードの後部末端付近に見つかる)場合は、変異コールが疑わしいと示唆される。
全体的及び対立遺伝子特異的なコピー数
腫瘍又は生殖系列のどちらかのデータ中のカバレッジに応じてウィンドウのゲノム幅を拡大及び縮小させるダイナミックウィンドウ生成手法を使用して、全体的な体細胞コピー数を計算する。処理はゼロ幅のウィンドウで開始する。腫瘍又は生殖系列のどちらかの配列データからのそれぞれの固有のリードを腫瘍計数Nt又は生殖系列計数Ngへと集計する。それぞれのリードの開始及び停止の位置がウィンドウの領域を定義し、新しいリードが現在のウィンドウの境界を越えるごとに拡大する。腫瘍又は生殖系列のどちらかの計数がユーザに定義された閾値を越えた際、ウィンドウサイズ及び位置、ならびにNt、Ng、及び相対カバレッジNtを記録する。局所的なリードカバレッジに応じてNgウィンドウのサイズをあつらえることで、低いカバレッジの領域(たとえば反復領域)で大きなウィンドウ又は体細胞増幅を示す領域で小さなウィンドウが作成され、それにより、単位複製配列のゲノムの分解能が増加され、増幅の境界を定義する能力が増加される。
対立遺伝子特異的なコピー数を使用して、ヘテロ接合性の喪失(コピーの中立及びコピーの欠失のどちらも)ならびに単一の対立遺伝子に特異的な増幅又は欠失を示すゲノム領域を同定する。この最後の点は、潜在的に疾患を引き起こす対立遺伝子を、腫瘍配列データ中で増幅されるもの又は欠失していないもののどちらかとして区別することを助けるために、特に重要である。さらに、ヘミ接合性の欠失を経験する領域(たとえば1つの親染色体アーム)を使用して、配列決定された腫瘍試料中の正常な汚染物質の量を直接推定することができ、これは、上述の生殖系列及び腫瘍の遺伝子型モデリングを改善させるために使用することができる。
遺伝子型のフェージング
BamBamは、腫瘍中の大スケールのゲノムの増幅又は欠失によって引き起こされる対立遺伝子不均衡を利用することによって、生殖系列中に見つかるすべてのヘテロ接合性の位置をフェージングすることを試みる。多数票ベースのコールを腫瘍配列データ中のすべての位置で選択して、腫瘍中に存在するフェージングしたハプロタイプを構築する。多数票はショートリードのプール中で観察される最も豊富な対立遺伝子を選択し、欠失事象後に腫瘍中に留まる対立遺伝子又は増幅事象の複製された対立遺伝子が選択されるはずである。それぞれの位置において、生殖系列の対立遺伝子の状態も同定し、位置は、必須のリードサポートを有する対立遺伝子が1つしか存在しない場合はホモ接合性、少なくとも2つの対立遺伝子が必要なリードサポートを有する場合はヘテロ接合性であるとみなされる。腫瘍のハプロタイプは2つの親ハプロタイプのうちの一方を表すと仮定され、2つ目の親ハプロタイプは、腫瘍ハプロタイプに属さない生殖系列対立遺伝子の配列として生じる。この手順は、腫瘍中の対立遺伝子の割合にかかわらずゲノム全体で使用するため、本発明者らは、遺伝子型のハプロタイプの割当ては、多数と少数の対立遺伝子との間で均等にバランスがとれている領域中で本質的にランダムであると予想する。生殖系列配列の正確なフェージングは、腫瘍中の単一のゲノム事象(たとえば局所の増幅又は欠失)から生じる一貫した対立遺伝子不均衡を示す領域中でのみ起こる。腫瘍由来のハプロタイプの妥当性確認は、腫瘍由来のハプロタイプをHapMapプロジェクトから入手可能なフェージングした遺伝子型と比較することによって達成することができる(International HapMap Consortium (2007), Nature, 7164: 851-861)。
ペアエンドクラスタリングを使用した構造的変動の推量
推定上の染色体内及び染色体間の再編成を同定するために、BamBamは、ペア中のそれぞれのリードが参照配列の本質的に異なる領域にマッピングされる、不調和ペアリードを検索する。染色体内の不調和ペアは、異常に大きな挿入サイズを有する(すなわち、ペアリードを隔てる参照上のゲノムの距離がユーザに定義された閾値を越える)もの、又は不正確な配向(すなわち反転)でマッピングされるものである。染色体間の不調和ペアは、異なる染色体にマッピングされるペアリードによって定義される。ショートリードライブラリの調製におけるPCR増幅ステップの結果でしかない多数のリードによってサポートされる再編成のコールを回避するために、他のペアとして同一の位置とアラインするすべての不調和ペアエンドリードを除去する。このプロセスの全体像を図3に示す。
スプリットリードを使用した構造的変動の洗練
BamBamによって最初に見つけられたブレイクポイントは、その性質によりブレイクポイントの実際の接合点と重複することができない完全にマッピングされたリードを使用するという点で、かつリードは参照(又は、体細胞の再編成の場合は生殖系列データセット)中に存在しない配列を表すため、概算である。ブレイクポイントの位置の知識を洗練させるためにBridgetと呼ばれるプログラムを開発し、これは図4に要約されている。
それぞれのアラインしていないリードについて、二重スパニング組はブレイクポイントの潜在的な位置を決定する。それぞれのアラインしていないリードはブレイクポイントについてわずかに異なる位置を決定し得るため(ブレイクポイント付近の配列エラー、反復参照などに起因)、二重スパニング組から決定されたすべてのブレイクポイント位置を使用して可能な接合点配列を生成する。すべてのマッピングされていないリードをこれらの可能な接合点配列のそれぞれに対して新たにアラインさせ、そのアラインメントにおける全体的な改善を、リードがどのくらい良好に元の配列とアラインしたかに対して比較する。アラインメントスコアの最大の改善を与える接合点配列が、真の再編成の最良の候補として判断される。この最良の接合点配列がアラインメントスコア皆無又はそれに近い改善しかもたらさない場合は、この接合点配列は真の再編成を表している可能性が低いため廃棄する。この場合、スプリットリード確認の欠如は、BamBamによって見つけられた元の構造的再編成が人為的なものである可能性の証拠であることも決定され得る。
腫瘍特異的ゲノムブラウザ
BamBamによって出力されたすべての結果を可視化するために、図5に示すように、単一の腫瘍試料中に見つかったすべてのゲノム変異体を、その一致した正常に対して同時に表示する、腫瘍ゲノムブラウザを開発した。これは、全体的及び対立遺伝子特異的なコピー数、染色体内及び染色体間の再編成、ならびに突然変異及び小さなインデルを表示することができる。これは、データを直鎖状及び環状のどちらのプロットでも示し、染色体間の再編成を表示するためには後者がはるかにより良好に適している。
データを1つの画像で一緒に表示することによって、ユーザは単一の試料のデータを素早くナビゲートし、コピー数の変化と構造的変動との間の関係性を理解することができる。たとえば、大きな染色体内欠失型の再編成は、ブレイクポイントの間の領域中にコピー数にそれと調和した低下を有するはずである。また、突然変異データをコピー数データと共に表示することで、ユーザは、体細胞突然変異が続いて増幅されたかどうか、又は野生型対立遺伝子が腫瘍中で欠失していたかどうかを理解することができ、どちらの重要なデータ点も、この試料の腫瘍化におけるゲノム座位の重要性を示唆している。
コンピュータ要件
BamBam及びBridgetはどちらもCで書かれており、標準のCライブラリ及び最新のSAMtoolsソースコード(http://samtools.sourceforge.netから入手可能)のみを必要とする。単一の処理として、又はクラスター全体にわたる一連のジョブに分割して(たとえば1つの染色体あたり1つのジョブで)実行し得る。それぞれが数十億個の100bpのリードを含有する一対の250GBのBAMファイルを処理するBamBamは、その全ゲノム解析を単一の処理として約5時間、又は控えめなクラスター(24ノード)では約30分間で終える。BamBamのコンピュータ要件はごくわずかであり、単一のゲノム位置に重複するリードのデータを記憶するために十分なRAM、及び腫瘍又は生殖系列のゲノムのどちらかに見つかる良好にサポートされた変異を記憶するために十分なディスク空き容量のみを必要とする。
Bridgetも非常に控えめなコンピュータ要件を有する。一台のマシン上での実行時間は典型的には1秒未満であり、これには、参照配列及びブレイクポイント近隣のすべての潜在的なスプリットリードを集め、参照及びスプリットリードの両方のタイルデータベースを構築し、すべての二重スパニング組を決定し、潜在的な接合点配列を構築し、すべてのスプリットリードを参照及びそれぞれの接合点配列の両方に対して再度アラインさせ、最良の接合点配列を決定するために必要な時間が含まれる。高度に増幅された又は多数のマッピングされていないリードを有する領域はBridgetの実行時間を増やすが、これはBridgetの容易な並行化能力によって軽減し得る。
ゲノムDNAの単離
血液又は他の組織試料(2〜3ml)を患者から採取し、EDTA含有チューブ中、−80℃で使用時まで保管する。ゲノムDNAを血液試料から、製造者の指示に従って、DNA単離キットを使用して抽出する(PUREGENE、Gentra Systems、ミネソタ州Minneapolis)。DNAの純度を、ベックマン分光光度計で測定した260及び280nmでの吸光度の比(1cm光路、A260/A280)として測定する。
SNPの同定
患者のDNA試料からの一遺伝子の領域を、PCRによって、その領域用に特異的に設計されたプライマーを使用して増幅する。上述のように当業者に周知の方法を使用して、PCR産物を配列する。配列追跡において同定されたSNPはPhred/Phrap/Consedソフトウェアによって確認し、NCBI SNPデータバンクに受託された既知のSNPと比較する。
統計分析
値は平均±SDとして表す。χ2解析(ウェブキー二乗計算機(Web Chi Square Calculator)、Georgetown Linguistics、ジョージタウン大学、ワシントンDC)を使用して、正常対象と障害を有する患者との間の遺伝子型頻度の相違を評価する。事後解析を伴った一方向ANOVAを示したように行って、様々な患者群間の血行動態を比較する。
Claims (21)
- コンピュータベースの配列分析システムであって、
第1のデジタル配列データセットにおける健康な組織のリードを記憶し、かつ、第2のデジタル配列データセットにおける疑わしい患部組織のリードを記憶するよう構成されたコンピュータ読取可能なメモリと、
該コンピュータ読取可能なメモリと連結された少なくとも1つのプロセッサを有し、かつ、ソフトウェア指示の実行に基づいて、
前記第1および第2のデジタル配列データセットのリード内の共通の配列位置を決定し、
該第1および第2のデジタル配列データセットからの、該共通の配列位置において重複する、リードの配列パイルアップの少なくとも1つの対を生成し、
該配列パイルアップの少なくとも1つの対におけるリードの関数として前記共通の配列位置において健康な組織および疑わしい患部組織について遺伝子型を推測し、
前記共通の配列位置において遺伝子型間の配列差を同定し、
前記配列パイルアップの少なくとも1つの対におけるリードに基づいて偽陽性をフィルタにかけ、
装置メモリにおいて差分配列オブジェクトとして前記配列差を記憶する、
ように構成された、配列分析エンジンと、
を含む、コンピュータベースの配列分析システム。 - 前記第1および第2のデジタル配列データセットが、同じヒトの組織由来である、請求項1に記載のシステム。
- 前記第1および第2のデジタル配列データセットのうちの少なくとも1つが、血液由来である、請求項1に記載のシステム。
- 前記第2のデジタル配列データセットが、腫瘍組織由来である、請求項1に記載のシステム。
- 前記第1および第2のデジタル配列データセットのうちの少なくとも1つが、DNA配列を含む、請求項1に記載のシステム。
- 前記第1および第2のデジタル配列データセットのうちの少なくとも1つが、RNA配列を含む、請求項1に記載のシステム。
- 前記RNA配列が、次のRNAのタイプ:mRNA、rRNA、tRNA、miRNA、およびasRNAのうちの少なくとも1つを示す、請求項6に記載のシステム。
- 前記第1および第2のデジタル配列データセットのうちの少なくとも1つが、ゲノム配列を含む、請求項1に記載のシステム。
- 前記第1および第2のデジタル配列データセットのうちの少なくとも1つが、プロテオーム配列を含む、請求項1に記載のシステム。
- 前記プロテオーム配列が、ポリペプチド配列を含む、請求項9に記載のシステム。
- 前記第1および第2のデジタル配列データセットが、ショートリードを含む、請求項1に記載のシステム。
- 前記配列パイルアップの少なくとも1つの対が、100以下の位置を有する配列リードを含む、請求項1に記載のシステム。
- 前記配列パイルアップの少なくとも1つの対が、30を超えるリードを含む、請求項1に記載のシステム。
- 前記第1のデジタル配列データセットおよび第2のデジタル配列データセットのうちの少なくとも1つが、少なくとも10億のリードを含む、請求項1に記載のシステム。
- 前記偽陽性が、前記第1および第2のデジタル配列データセット内のリードのリード情報に基づいてフィルタにかけられる、請求項1に記載のシステム。
- 前記リード情報が、以下:リードがマッピングされる鎖、リード内の対立遺伝子の位置、および対立遺伝子の平均品質、のうちの少なくとも1つを含む、請求項15に記載のシステム。
- 前記偽陽性が、対立遺伝子分布に基づいてフィルタにかけられる、請求項1に記載のシステム。
- 前記対立遺伝子分布が、変異体対立遺伝子がリードの後部の近くに見出されることを示す、請求項17に記載のシステム。
- 前記偽陽性が、前記対立遺伝子分布が予想される分布から非対称である場合にフィルタにかけられる、請求項17に記載のシステム。
- 前記予想される分布がランダム分布である、請求項19に記載のシステム。
- 前記差分配列オブジェクトが、少なくとも1つの変異コールを含む、請求項1に記載のシステム。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US13/373,550 US9646134B2 (en) | 2010-05-25 | 2011-11-18 | Bambam: parallel comparative analysis of high-throughput sequencing data |
US13/373,550 | 2011-11-18 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017251051A Division JP6539835B2 (ja) | 2011-11-18 | 2017-12-27 | Bambam:高スループット配列決定データの並列比較分析 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2019164818A JP2019164818A (ja) | 2019-09-26 |
JP6776404B2 true JP6776404B2 (ja) | 2020-10-28 |
Family
ID=48429980
Family Applications (4)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014542280A Active JP5953379B2 (ja) | 2011-11-18 | 2011-12-20 | Bambam:高スループット配列決定データの並列比較分析 |
JP2016116859A Active JP6274539B2 (ja) | 2011-11-18 | 2016-06-13 | Bambam:高スループット配列決定データの並列比較分析 |
JP2017251051A Active JP6539835B2 (ja) | 2011-11-18 | 2017-12-27 | Bambam:高スループット配列決定データの並列比較分析 |
JP2019089447A Active JP6776404B2 (ja) | 2011-11-18 | 2019-05-10 | Bambam:高スループット配列決定データの並列比較分析 |
Family Applications Before (3)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014542280A Active JP5953379B2 (ja) | 2011-11-18 | 2011-12-20 | Bambam:高スループット配列決定データの並列比較分析 |
JP2016116859A Active JP6274539B2 (ja) | 2011-11-18 | 2016-06-13 | Bambam:高スループット配列決定データの並列比較分析 |
JP2017251051A Active JP6539835B2 (ja) | 2011-11-18 | 2017-12-27 | Bambam:高スループット配列決定データの並列比較分析 |
Country Status (9)
Country | Link |
---|---|
US (4) | US9646134B2 (ja) |
EP (2) | EP2780851A4 (ja) |
JP (4) | JP5953379B2 (ja) |
KR (4) | KR102175660B1 (ja) |
CN (2) | CN104067278B (ja) |
AU (1) | AU2011381073A1 (ja) |
CA (2) | CA3056128C (ja) |
IL (1) | IL232512A0 (ja) |
WO (1) | WO2013074058A1 (ja) |
Families Citing this family (85)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101952965B1 (ko) * | 2010-05-25 | 2019-02-27 | 더 리젠츠 오브 더 유니버시티 오브 캘리포니아 | Bambam:고처리율 서열분석 데이터의 병렬 비교 분석 |
US9646134B2 (en) | 2010-05-25 | 2017-05-09 | The Regents Of The University Of California | Bambam: parallel comparative analysis of high-throughput sequencing data |
KR101906254B1 (ko) | 2011-12-08 | 2018-10-10 | 파이브3 제노믹스, 엘엘씨 | Mdm2-포함 이중 소염색체들 및 그의 방법들 |
WO2013141842A2 (en) * | 2012-03-19 | 2013-09-26 | Pathway Genomics | Genome-based drug management systems |
US8812243B2 (en) | 2012-05-09 | 2014-08-19 | International Business Machines Corporation | Transmission and compression of genetic data |
US8855938B2 (en) | 2012-05-18 | 2014-10-07 | International Business Machines Corporation | Minimization of surprisal data through application of hierarchy of reference genomes |
US10353869B2 (en) | 2012-05-18 | 2019-07-16 | International Business Machines Corporation | Minimization of surprisal data through application of hierarchy filter pattern |
US9002888B2 (en) | 2012-06-29 | 2015-04-07 | International Business Machines Corporation | Minimization of epigenetic surprisal data of epigenetic data within a time series |
US8972406B2 (en) | 2012-06-29 | 2015-03-03 | International Business Machines Corporation | Generating epigenetic cohorts through clustering of epigenetic surprisal data based on parameters |
CN110491449B (zh) * | 2012-07-06 | 2023-08-08 | 河谷控股Ip有限责任公司 | 健康护理分析流的管理 |
AU2013329356B2 (en) | 2012-10-09 | 2018-11-29 | Five3 Genomics, Llc | Systems and methods for tumor clonality analysis |
CA2925818A1 (en) * | 2013-09-26 | 2015-04-02 | Five3 Genomics, Llc | Systems, methods, and compositions for viral-associated tumors |
WO2015146852A1 (ja) * | 2014-03-24 | 2015-10-01 | 株式会社 東芝 | 基準ゲノムデータを生成する方法、装置及びプログラム、差分ゲノムデータを生成する方法、装置及びプログラム、データを復元する方法、装置及びプログラム |
AU2015236054B2 (en) * | 2014-03-25 | 2019-11-21 | Five3 Genomics, Llc | Systems and methods for RNA analysis in functional confirmation of cancer mutations |
KR101945093B1 (ko) | 2014-05-30 | 2019-02-07 | 난토믹스, 엘엘씨 | 다중 종양 및 생식세포 유전자 엑솜에 걸친 분자 프로파일의 종합 분석을 위한 시스템 및 방법 |
US10230390B2 (en) * | 2014-08-29 | 2019-03-12 | Bonnie Berger Leighton | Compressively-accelerated read mapping framework for next-generation sequencing |
WO2016036969A1 (en) | 2014-09-03 | 2016-03-10 | Nantomics, Llc | Synthetic genomic variant-based secure transaction devices, systems and methods |
JP2017532699A (ja) * | 2014-09-05 | 2017-11-02 | ナントミクス,エルエルシー | 起源の判定のためのシステムと方法 |
JP6374532B2 (ja) * | 2014-12-26 | 2018-08-15 | 国立大学法人東北大学 | 特定遺伝子座群又は個別の遺伝子座の遺伝型の判定方法、判定用コンピュータシステム及び判定用プログラム |
WO2016114009A1 (ja) * | 2015-01-16 | 2016-07-21 | 国立研究開発法人国立がん研究センター | 融合遺伝子解析装置、融合遺伝子解析方法、及びプログラム |
US11101038B2 (en) | 2015-01-20 | 2021-08-24 | Nantomics, Llc | Systems and methods for response prediction to chemotherapy in high grade bladder cancer |
CN105986011B (zh) * | 2015-01-30 | 2019-10-15 | 深圳华大基因研究院 | 一种杂合性缺失的检测方法 |
WO2016143062A1 (ja) * | 2015-03-10 | 2016-09-15 | 株式会社日立ハイテクノロジーズ | 配列データ解析装置、dna解析システムおよび配列データ解析方法 |
CA2987730C (en) | 2015-04-08 | 2020-02-18 | Nantomics, Llc | Cancer neoepitopes |
CN108513593A (zh) * | 2015-04-23 | 2018-09-07 | 南托米克斯有限责任公司 | 癌症新表位 |
MA42420A (fr) | 2015-05-13 | 2018-05-23 | Agenus Inc | Vaccins pour le traitement et la prévention du cancer |
JP6663483B2 (ja) | 2015-09-10 | 2020-03-11 | エフ.ホフマン−ラ ロシュ アーゲーF. Hoffmann−La Roche Aktiengesellschaft | 統合された臨床ケアのための情報科学プラットフォーム |
KR101710138B1 (ko) * | 2015-09-21 | 2017-02-24 | 한국생명공학연구원 | 데이터 분산 처리 시스템 및 데이터 분산 처리 방법 |
CN108604257B (zh) | 2015-10-12 | 2022-12-13 | 南托米克斯有限责任公司 | 产生特异性免疫治疗组合物及其相关核酸构建体的方法 |
US11623001B2 (en) * | 2015-10-12 | 2023-04-11 | Nantomics, Llc | Compositions and methods for viral cancer neoepitopes |
US11626187B2 (en) | 2015-10-12 | 2023-04-11 | Nantomics Llc | Systems, compositions, and methods for discovery of MSI and neoepitopes that predict sensitivity to checkpoint inhibitors |
KR20240010089A (ko) | 2015-10-12 | 2024-01-23 | 난토믹스, 엘엘씨 | 네오에피토프의 반복적 발견 및 이에 대한 적응성 면역치료 및 방법 |
TWI733719B (zh) | 2015-12-07 | 2021-07-21 | 美商河谷控股Ip有限責任公司 | 改善的組合物及用於新表位之病毒遞送的方法及其應用 |
AU2017217877A1 (en) | 2016-02-12 | 2018-08-16 | Nant Holdings Ip, Llc | High-throughput identification of patient-specific neoepitopes as therapeutic targets for cancer immunotherapies |
US11154597B2 (en) | 2016-03-24 | 2021-10-26 | Nantcell, Inc. | Sequence arrangements and sequences for neoepitope presentation |
KR20190031492A (ko) | 2016-06-30 | 2019-03-26 | 난트 홀딩스 아이피, 엘엘씨 | 난트 암 백신(nant cancer vaccine) |
WO2018006057A1 (en) | 2016-06-30 | 2018-01-04 | Nantomics, Llc | Synthetic wgs bioinformatics validation |
CN107633158B (zh) * | 2016-07-18 | 2020-12-01 | 三星(中国)半导体有限公司 | 对基因序列进行压缩和解压缩的方法和设备 |
AU2017300259A1 (en) | 2016-07-18 | 2019-02-14 | Nant Holdings Ip, Llc | Distributed machine learning systems, apparatus, and methods |
KR20190038935A (ko) | 2016-08-25 | 2019-04-09 | 난토믹스, 엘엘씨 | 면역요법 마커들 및 그 용도들(immunotherapy markers and uses therefor) |
US20190321481A1 (en) | 2016-11-11 | 2019-10-24 | Nantbio, Inc. | Immunomodulatory compositions, processes for making the same, and methods for inhibiting cytokine storms |
AU2017360887B2 (en) | 2016-11-17 | 2023-01-19 | Nant Holdings Ip, Llc | Validation of inferred anticancer pathways |
AU2017362730B2 (en) | 2016-11-21 | 2021-04-08 | Nant Holdings Ip, Llc | Fractal combination therapy |
AU2017367696A1 (en) | 2016-12-01 | 2019-06-20 | Nant Holdings Ip, Llc | Tumor antigenicity processing and presentation |
WO2018148381A1 (en) | 2017-02-07 | 2018-08-16 | Nantcell, Inc. | Maximizing t-cell memory and compositions and methods therefor |
CN107103207B (zh) * | 2017-04-05 | 2020-07-03 | 浙江大学 | 基于病例多组学变异特征的精准医学知识搜索系统及实现方法 |
SG11201909882SA (en) | 2017-04-24 | 2019-11-28 | Nantcell Inc | Targeted neoepitope vectors and methods therefor |
EP3631471A4 (en) | 2017-05-30 | 2021-06-30 | Nant Holdings IP, LLC | ENRICHMENT OF CIRCULATING TUMOR CELLS USING NEO-EPITOPIA |
JP7072825B2 (ja) * | 2017-09-13 | 2022-05-23 | 三菱電機ソフトウエア株式会社 | コピー数計測装置、コピー数計測プログラムおよびコピー数計測方法 |
KR20200044123A (ko) * | 2017-10-10 | 2020-04-28 | 난토믹스, 엘엘씨 | 암 환자에서의 향상된 정밀도를 위한 포괄적 게놈 트랜스크립톰 종양-정상 유전자 패널 분석 (comprehensive genomic transcriptomic tumor-normal gene panel analysis for enhanced precision in patients with cancer) |
CA3077221A1 (en) | 2017-10-12 | 2019-04-18 | Nantomics, Llc | Cancer score for assessment and response prediction from biological fluids |
US10460446B2 (en) | 2017-10-16 | 2019-10-29 | Nant Holdings Ip, Llc | Image-based circular plot recognition and interpretation |
US10752682B2 (en) | 2017-11-01 | 2020-08-25 | Nantbio, Inc. | Anti-IL8 antibodies |
AU2018365883A1 (en) | 2017-11-07 | 2020-05-14 | Nanthealth Labs, Inc. | Targeted cell free nucleic acid analysis |
WO2019136273A1 (en) | 2018-01-05 | 2019-07-11 | NantBio Inc. | Reprogrammed t cell-like nk cells |
US11823773B2 (en) | 2018-04-13 | 2023-11-21 | Nant Holdings Ip, Llc | Nant cancer vaccine strategies |
US11564980B2 (en) | 2018-04-23 | 2023-01-31 | Nantcell, Inc. | Tumor treatment method with an individualized peptide vaccine |
TW202345890A (zh) | 2018-04-23 | 2023-12-01 | 美商南特細胞公司 | 新抗原表位疫苗及免疫刺激組合物及方法 |
MA52363A (fr) | 2018-04-26 | 2021-03-03 | Agenus Inc | Compositions peptidiques de liaison à une protéine de choc thermique (hsp) et leurs méthodes d'utilisation |
RU2690393C1 (ru) * | 2018-05-29 | 2019-06-04 | Федеральное государственное бюджетное научное учреждение "Научно-исследовательский институт комплексных проблем гигиены и профессиональных заболеваний" | Способ прогнозирования вероятности развития атеросклероза у шахтеров с хроническим пылевым бронхитом |
TW202013385A (zh) | 2018-06-07 | 2020-04-01 | 美商河谷控股Ip有限責任公司 | 基於差異的基因組之辨識分數 |
US11100086B2 (en) * | 2018-09-25 | 2021-08-24 | Wandisco, Inc. | Methods, devices and systems for real-time checking of data consistency in a distributed heterogenous storage system |
CN109411023B (zh) * | 2018-09-30 | 2022-03-18 | 华中农业大学 | 一种基于贝叶斯网络推理的基因间交互关系挖掘方法 |
CN111383713B (zh) * | 2018-12-29 | 2023-08-01 | 北京安诺优达医学检验实验室有限公司 | ctDNA检测分析装置及方法 |
CN110364224B (zh) * | 2018-12-29 | 2021-06-08 | 上海北昂医药科技股份有限公司 | 一种染色体分裂相定位排序方法 |
KR20210152464A (ko) | 2019-02-19 | 2021-12-15 | 미스트 쎄라퓨틱스, 엘엘씨 | 암 치료에 유용한 자가 t 세포의 제조 방법 및 그의 조성물 |
BR112021019328A2 (pt) | 2019-03-29 | 2021-11-30 | Myst Therapeutics Llc | Métodos ex vivo para produzir um produto terapêutico de célula t e composições e métodos relacionados |
CN110570922B (zh) * | 2019-07-19 | 2022-06-10 | 浙江大学 | 一种评估hr缺陷模型及应用 |
CA3162703A1 (en) | 2019-11-27 | 2021-06-03 | Myst Therapeutics, Llc | Method of producing tumor-reactive t cell composition using modulatory agents |
CN113053460A (zh) * | 2019-12-27 | 2021-06-29 | 分子健康有限责任公司 | 用于基因组和基因分析的系统和方法 |
US11475981B2 (en) | 2020-02-18 | 2022-10-18 | Tempus Labs, Inc. | Methods and systems for dynamic variant thresholding in a liquid biopsy assay |
US11211147B2 (en) | 2020-02-18 | 2021-12-28 | Tempus Labs, Inc. | Estimation of circulating tumor fraction using off-target reads of targeted-panel sequencing |
US11211144B2 (en) | 2020-02-18 | 2021-12-28 | Tempus Labs, Inc. | Methods and systems for refining copy number variation in a liquid biopsy assay |
BR112022016490A2 (pt) | 2020-02-27 | 2022-10-11 | Myst Therapeutics Llc | Métodos para enriquecimento ex vivo e expansão de células t reativas tumorais e composições relacionadas das mesmas |
US12006539B2 (en) | 2020-03-17 | 2024-06-11 | Western Digital Technologies, Inc. | Reference-guided genome sequencing |
US12014802B2 (en) | 2020-03-17 | 2024-06-18 | Western Digital Technologies, Inc. | Devices and methods for locating a sample read in a reference genome |
US11837330B2 (en) | 2020-03-18 | 2023-12-05 | Western Digital Technologies, Inc. | Reference-guided genome sequencing |
CN113543015A (zh) * | 2020-04-13 | 2021-10-22 | 华为技术有限公司 | 一种通信方法、装置及系统 |
US11955243B2 (en) * | 2020-11-11 | 2024-04-09 | Optellum Limited | Using unstructured temporal medical data for disease prediction |
AU2022202798A1 (en) * | 2021-05-26 | 2022-12-15 | Genieus Genomics Pty Ltd | Processing sequencing data relating to amyotrophic lateral sclerosis |
WO2022260740A1 (en) | 2021-06-10 | 2022-12-15 | Alife Health Inc. | Machine learning for optimizing ovarian stimulation |
US11901083B1 (en) | 2021-11-30 | 2024-02-13 | Vignet Incorporated | Using genetic and phenotypic data sets for drug discovery clinical trials |
US11705230B1 (en) | 2021-11-30 | 2023-07-18 | Vignet Incorporated | Assessing health risks using genetic, epigenetic, and phenotypic data sources |
WO2024186966A1 (en) * | 2023-03-07 | 2024-09-12 | Alexion Pharmaceuticals, Inc. | Systems and methods for identifying atypical hemolytic uremic syndrome (ahus) patients using clinical features |
CN117690485B (zh) * | 2024-02-04 | 2024-05-28 | 北京诺禾致源科技股份有限公司 | 用于寄生虫鉴定的基因组的处理方法和处理装置 |
Family Cites Families (75)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS592034U (ja) | 1982-06-29 | 1984-01-07 | 日野自動車株式会社 | 密封型リミツトスイツチ |
JPS60187095U (ja) | 1984-05-22 | 1985-12-11 | 武藤工業株式会社 | X−yプロツタ |
US4736866B1 (en) | 1984-06-22 | 1988-04-12 | Transgenic non-human mammals | |
US5175383A (en) | 1989-02-17 | 1992-12-29 | President And Fellows Of Harvard College | Animal model for benign prostatic disease |
US5767337A (en) | 1995-07-31 | 1998-06-16 | Duke University | Creation of human apolipoprotein E isoform specific transgenic mice in apolipoprotein deficient "knockout" mice |
WO1997040462A2 (en) | 1996-04-19 | 1997-10-30 | Spectra Biomedical, Inc. | Correlating polymorphic forms with multiple phenotypes |
IL121806A0 (en) | 1997-09-21 | 1998-02-22 | Compugen Ltd | Method and apparatus for MRNA assembly |
WO1999028505A1 (en) | 1997-12-03 | 1999-06-10 | Curagen Corporation | Methods and devices for measuring differential gene expression |
DK1052292T3 (da) | 1997-12-22 | 2003-07-28 | Genset Sa | Prostatacancer-gen |
US7734656B2 (en) * | 1998-02-24 | 2010-06-08 | Luc Bessette | System and method for electronically managing medical data files in order to facilitate genetic research |
US6223186B1 (en) | 1998-05-04 | 2001-04-24 | Incyte Pharmaceuticals, Inc. | System and method for a precompiled database for biomolecular sequence information |
US6236993B1 (en) | 1998-06-24 | 2001-05-22 | Victor V. Fanberg | Computer file comparison method |
US6410233B2 (en) | 1999-03-16 | 2002-06-25 | Daniel Mercola | Isolation and identification of control sequences and genes modulated by transcription factors |
GB0006143D0 (en) | 2000-03-14 | 2000-05-03 | Inpharmatica Ltd | Multiple sequence alignment |
US20090024416A1 (en) * | 2000-03-15 | 2009-01-22 | Mclaughlin Mark R | Healthcare Medical Information Management System |
JP2003527855A (ja) | 2000-03-20 | 2003-09-24 | ニューリンク ジェネティクス | 細胞中でのタンパク質発現プロフィールを解明する方法及びそのための組成物 |
DK1284296T3 (da) | 2000-04-27 | 2007-02-05 | Consejo Superior Investigacion | Fremgangsmåde til påvisning af minority genomer i virus-quasispecies under anvendelse af DNA mikrochips |
EP1152349A1 (en) | 2000-05-06 | 2001-11-07 | Deutsches Krebsforschungszentrum Stiftung des öffentlichen Rechts | Method for aligning sequences |
US7700359B2 (en) | 2000-06-02 | 2010-04-20 | Novartis Vaccines And Diagnostics, Inc. | Gene products differentially expressed in cancerous cells |
JP2002024416A (ja) * | 2000-07-04 | 2002-01-25 | Sony Corp | Dna情報管理システム及びdna情報管理方法 |
GB0016472D0 (en) | 2000-07-05 | 2000-08-23 | Amersham Pharm Biotech Uk Ltd | Sequencing method and apparatus |
US20070178474A1 (en) | 2000-11-30 | 2007-08-02 | Cracauer Raymond F | Nucleic acid detection assays |
US7054758B2 (en) | 2001-01-30 | 2006-05-30 | Sciona Limited | Computer-assisted means for assessing lifestyle risk factors |
DE10120797B4 (de) | 2001-04-27 | 2005-12-22 | Genovoxx Gmbh | Verfahren zur Analyse von Nukleinsäureketten |
CA2872499C (en) | 2001-05-25 | 2016-07-05 | Hitachi, Ltd. | Information processing system using nucleotide sequence related information |
US7529685B2 (en) | 2001-08-28 | 2009-05-05 | Md Datacor, Inc. | System, method, and apparatus for storing, retrieving, and integrating clinical, diagnostic, genomic, and therapeutic data |
US20030183268A1 (en) | 2002-03-29 | 2003-10-02 | Shanefield Daniel Jay | Device for conversion of environmental thermal energy into direct current electricity |
KR100489955B1 (ko) | 2002-10-04 | 2005-05-16 | 아주대학교산학협력단 | 사용자 그룹핑을 이용한 생물정보학에서의 데이터베이스처리 방법 |
US8843356B2 (en) | 2002-12-27 | 2014-09-23 | Merck Sharp & Dohme Corp. | Computer systems and methods for associating genes with traits using cross species data |
KR100537523B1 (ko) | 2003-02-03 | 2005-12-19 | 삼성전자주식회사 | Dna 서열 부호화 장치 및 방법 |
US20040153255A1 (en) * | 2003-02-03 | 2004-08-05 | Ahn Tae-Jin | Apparatus and method for encoding DNA sequence, and computer readable medium |
US7584058B2 (en) | 2003-02-27 | 2009-09-01 | Methexis Genomics N.V. | Genetic diagnosis using multiple sequence variant analysis |
WO2004105573A2 (en) | 2003-05-21 | 2004-12-09 | The Wistar Institute Of Anatomy And Biology | Method of diagnosis of cancer based on gene expression profiles in cells |
US8538704B2 (en) * | 2003-10-06 | 2013-09-17 | Cerner Innovation, Inc. | Computerized method and system for inferring genetic findings for a patient |
US7788040B2 (en) * | 2003-12-19 | 2010-08-31 | Siemens Medical Solutions Usa, Inc. | System for managing healthcare data including genomic and other patient specific information |
US8340914B2 (en) * | 2004-11-08 | 2012-12-25 | Gatewood Joe M | Methods and systems for compressing and comparing genomic data |
CA2593695A1 (en) | 2005-01-04 | 2006-07-13 | Novartis Ag | Biomarkers for identifying efficacy of tegaserod in patients with chronic constipation |
WO2006107854A2 (en) * | 2005-04-01 | 2006-10-12 | Amgen Inc. | Epidermal growth factor receptor gene copy number |
US20090186042A1 (en) | 2006-02-27 | 2009-07-23 | Arizona Board Of Regents For And On Behalf Of Arizona State University | Identification and use of novopeptides for the treatment of cancer |
US8700430B2 (en) * | 2006-07-17 | 2014-04-15 | Walgreen Co. | Optimization of a medication therapy regimen |
JP4922778B2 (ja) | 2007-01-31 | 2012-04-25 | 株式会社日立ハイテクノロジーズ | 遺伝子検査結果判定法およびプログラムおよびその装置 |
CN102317470A (zh) * | 2007-02-07 | 2012-01-11 | 解码遗传学私营有限责任公司 | 促进前列腺癌风险的遗传性变型 |
US8099298B2 (en) * | 2007-02-14 | 2012-01-17 | Genelex, Inc | Genetic data analysis and database tools |
US8140270B2 (en) | 2007-03-22 | 2012-03-20 | National Center For Genome Resources | Methods and systems for medical sequencing analysis |
US20100121872A1 (en) * | 2007-03-27 | 2010-05-13 | Sundar Subramaniam | Personally controlled storage and testing of personal genomic information |
TWM319441U (en) * | 2007-04-14 | 2007-09-21 | Jarllytec Co Ltd | Shaft with function of anti-judder |
US9726088B2 (en) | 2007-10-30 | 2017-08-08 | Ford Global Technologies, Llc | System and method for obtaining an adjustable accelerator pedal response in a vehicle powertrain |
EP2274440A4 (en) * | 2008-03-19 | 2011-06-29 | Centocor Ortho Biotech Inc | MARKERS AND METHODS FOR EVALUATION AND TREATMENT OF SEVERE OR PERSISTENT ASTHMA AND TNF-RELATED DISORDERS |
EP2227780A4 (en) * | 2008-03-19 | 2011-08-03 | Existence Genetics Llc | GENETIC ANALYSIS |
US8815508B2 (en) * | 2008-08-12 | 2014-08-26 | Zinfandel Pharmaceuticals, Inc. | Method of identifying disease risk factors |
CN101539967B (zh) | 2008-12-12 | 2010-12-01 | 深圳华大基因研究院 | 一种单核苷酸多态性检测方法 |
JP2010204838A (ja) | 2009-03-02 | 2010-09-16 | Toppan Printing Co Ltd | 解析デバイス装置、解析システム、解析方法 |
WO2010129301A2 (en) | 2009-04-27 | 2010-11-11 | New York University | Method, computer-accessible medium and system for base-calling and alignment |
WO2011038155A2 (en) * | 2009-09-23 | 2011-03-31 | Existence Genetics Llc | Genetic analysis |
WO2011050341A1 (en) | 2009-10-22 | 2011-04-28 | National Center For Genome Resources | Methods and systems for medical sequencing analysis |
US9798855B2 (en) * | 2010-01-07 | 2017-10-24 | Affymetrix, Inc. | Differential filtering of genetic data |
US8335882B2 (en) * | 2010-02-01 | 2012-12-18 | Creative Technology Ltd | Dock for a portable hard disk and a method for accessing content on a host device using the dock |
US9165109B2 (en) | 2010-02-24 | 2015-10-20 | Pacific Biosciences Of California, Inc. | Sequence assembly and consensus sequence determination |
KR102136041B1 (ko) * | 2010-04-29 | 2020-07-20 | 더 리젠츠 오브 더 유니버시티 오브 캘리포니아 | 게놈 모델에 대한 데이터 통합을 이용하는 경로 인지 알고리즘 (paradigm) |
KR101952965B1 (ko) | 2010-05-25 | 2019-02-27 | 더 리젠츠 오브 더 유니버시티 오브 캘리포니아 | Bambam:고처리율 서열분석 데이터의 병렬 비교 분석 |
US9646134B2 (en) | 2010-05-25 | 2017-05-09 | The Regents Of The University Of California | Bambam: parallel comparative analysis of high-throughput sequencing data |
DK2601609T3 (en) | 2010-08-02 | 2017-06-06 | Population Bio Inc | COMPOSITIONS AND METHODS FOR DISCOVERING MUTATIONS CAUSING GENETIC DISORDERS |
US8751100B2 (en) | 2010-08-13 | 2014-06-10 | Deere & Company | Method for performing diagnostics or software maintenance for a vehicle |
US9177100B2 (en) | 2010-08-31 | 2015-11-03 | Annai Systems Inc. | Method and systems for processing polymeric sequence data and related information |
US10127346B2 (en) | 2011-04-13 | 2018-11-13 | The Board Of Trustees Of The Leland Stanford Junior University | Systems and methods for interpreting a human genome using a synthetic reference sequence |
CN102188796B (zh) | 2011-05-12 | 2013-07-10 | 杭州双华科技有限公司 | 便携式动力爬绳器及爬绳方法 |
US9476369B2 (en) | 2012-04-13 | 2016-10-25 | Toyota Motor Engineering & Manufacturing North America, Inc. | Variable power output and maximum speed in drive mode |
US9092401B2 (en) | 2012-10-31 | 2015-07-28 | Counsyl, Inc. | System and methods for detecting genetic variation |
US10068054B2 (en) | 2013-01-17 | 2018-09-04 | Edico Genome, Corp. | Bioinformatics systems, apparatuses, and methods executed on an integrated circuit processing platform |
US9792405B2 (en) | 2013-01-17 | 2017-10-17 | Edico Genome, Corp. | Bioinformatics systems, apparatuses, and methods executed on an integrated circuit processing platform |
US9679104B2 (en) | 2013-01-17 | 2017-06-13 | Edico Genome, Corp. | Bioinformatics systems, apparatuses, and methods executed on an integrated circuit processing platform |
US10691775B2 (en) | 2013-01-17 | 2020-06-23 | Edico Genome, Corp. | Bioinformatics systems, apparatuses, and methods executed on an integrated circuit processing platform |
US10385394B2 (en) | 2013-03-15 | 2019-08-20 | The Translational Genomics Research Institute | Processes of identifying and characterizing X-linked disorders |
US9731668B2 (en) | 2013-08-09 | 2017-08-15 | Ford Global Technologies, Llc | Multi-vehicle settings |
WO2015057635A1 (en) | 2013-10-18 | 2015-04-23 | The Regents Of The University Of Michigan | Systems and methods for determining a treatment course of action |
-
2011
- 2011-11-18 US US13/373,550 patent/US9646134B2/en active Active
- 2011-12-20 AU AU2011381073A patent/AU2011381073A1/en not_active Abandoned
- 2011-12-20 KR KR1020197032370A patent/KR102175660B1/ko active IP Right Grant
- 2011-12-20 CA CA3056128A patent/CA3056128C/en active Active
- 2011-12-20 EP EP11875775.6A patent/EP2780851A4/en not_active Withdrawn
- 2011-12-20 KR KR1020147016109A patent/KR101663951B1/ko active IP Right Grant
- 2011-12-20 EP EP15159392.8A patent/EP2902933A3/en not_active Ceased
- 2011-12-20 CN CN201180076272.4A patent/CN104067278B/zh active Active
- 2011-12-20 KR KR1020167014294A patent/KR102041764B1/ko active Application Filing
- 2011-12-20 CN CN201710190109.XA patent/CN106971089B/zh active Active
- 2011-12-20 KR KR1020157001305A patent/KR101947225B1/ko active IP Right Grant
- 2011-12-20 CA CA2854084A patent/CA2854084C/en active Active
- 2011-12-20 JP JP2014542280A patent/JP5953379B2/ja active Active
- 2011-12-20 WO PCT/US2011/001996 patent/WO2013074058A1/en active Application Filing
-
2014
- 2014-05-08 IL IL232512A patent/IL232512A0/en unknown
- 2014-12-11 US US14/567,774 patent/US10242155B2/en active Active
-
2016
- 2016-06-13 JP JP2016116859A patent/JP6274539B2/ja active Active
-
2017
- 2017-03-31 US US15/476,337 patent/US10726945B2/en active Active
- 2017-12-27 JP JP2017251051A patent/JP6539835B2/ja active Active
-
2019
- 2019-05-10 JP JP2019089447A patent/JP6776404B2/ja active Active
-
2020
- 2020-05-14 US US16/874,470 patent/US20200279617A1/en active Pending
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6776404B2 (ja) | Bambam:高スループット配列決定データの並列比較分析 | |
JP6826568B2 (ja) | Bambam:ハイスループットシークエンシングデータの同時比較解析 | |
AU2015203624B2 (en) | Bambam: parallel comparative analysis of high-throughput sequencing data | |
AU2016210784A1 (en) | Bambam: parallel comparative analysis of high-throughput sequencing data |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190521 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20190521 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20200521 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200812 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20200914 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20201007 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6776404 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |