JP2022524208A - 腫瘍モデルの同定のための方法および組成物 - Google Patents
腫瘍モデルの同定のための方法および組成物 Download PDFInfo
- Publication number
- JP2022524208A JP2022524208A JP2021555073A JP2021555073A JP2022524208A JP 2022524208 A JP2022524208 A JP 2022524208A JP 2021555073 A JP2021555073 A JP 2021555073A JP 2021555073 A JP2021555073 A JP 2021555073A JP 2022524208 A JP2022524208 A JP 2022524208A
- Authority
- JP
- Japan
- Prior art keywords
- sample
- mouse
- snp
- genotype
- human
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 106
- 206010028980 Neoplasm Diseases 0.000 title claims abstract description 66
- 239000000203 mixture Substances 0.000 title abstract description 35
- 210000004027 cell Anatomy 0.000 claims description 221
- 239000000523 sample Substances 0.000 claims description 189
- 239000002773 nucleotide Substances 0.000 claims description 64
- 125000003729 nucleotide group Chemical group 0.000 claims description 64
- 238000011109 contamination Methods 0.000 claims description 48
- 239000000470 constituent Substances 0.000 claims description 42
- 238000007481 next generation sequencing Methods 0.000 claims description 35
- 150000007523 nucleic acids Chemical class 0.000 claims description 33
- 102000039446 nucleic acids Human genes 0.000 claims description 28
- 108020004707 nucleic acids Proteins 0.000 claims description 28
- 239000000356 contaminant Substances 0.000 claims description 23
- 210000001519 tissue Anatomy 0.000 claims description 19
- 238000001514 detection method Methods 0.000 claims description 17
- 239000013074 reference sample Substances 0.000 claims description 17
- 210000002220 organoid Anatomy 0.000 claims description 12
- 108090000623 proteins and genes Proteins 0.000 claims description 12
- 241000204031 Mycoplasma Species 0.000 claims description 11
- 238000002493 microarray Methods 0.000 claims description 10
- 239000012634 fragment Substances 0.000 claims description 9
- 210000003765 sex chromosome Anatomy 0.000 claims description 6
- 208000036142 Viral infection Diseases 0.000 claims description 4
- 230000009385 viral infection Effects 0.000 claims description 4
- 241000700605 Viruses Species 0.000 claims description 3
- 239000003795 chemical substances by application Substances 0.000 claims description 3
- 230000001052 transient effect Effects 0.000 claims description 2
- 238000010586 diagram Methods 0.000 abstract 1
- 241000699666 Mus <mouse, genus> Species 0.000 description 82
- 108020004414 DNA Proteins 0.000 description 39
- 238000012163 sequencing technique Methods 0.000 description 37
- 238000012360 testing method Methods 0.000 description 26
- 238000003556 assay Methods 0.000 description 21
- 201000011510 cancer Diseases 0.000 description 20
- 238000009826 distribution Methods 0.000 description 17
- 108091092878 Microsatellite Proteins 0.000 description 16
- 239000000463 material Substances 0.000 description 16
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 15
- 238000003559 RNA-seq method Methods 0.000 description 15
- 238000007482 whole exome sequencing Methods 0.000 description 15
- 108091033319 polynucleotide Proteins 0.000 description 14
- 102000040430 polynucleotide Human genes 0.000 description 14
- 239000002157 polynucleotide Substances 0.000 description 14
- 230000002068 genetic effect Effects 0.000 description 13
- 238000009396 hybridization Methods 0.000 description 13
- 238000002156 mixing Methods 0.000 description 11
- 238000003199 nucleic acid amplification method Methods 0.000 description 11
- 210000000056 organ Anatomy 0.000 description 11
- 230000003321 amplification Effects 0.000 description 10
- 230000035945 sensitivity Effects 0.000 description 10
- 239000002299 complementary DNA Substances 0.000 description 9
- 239000000758 substrate Substances 0.000 description 9
- 230000000295 complement effect Effects 0.000 description 8
- 210000000130 stem cell Anatomy 0.000 description 8
- 230000000735 allogeneic effect Effects 0.000 description 7
- 238000003491 array Methods 0.000 description 7
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 7
- 238000003752 polymerase chain reaction Methods 0.000 description 7
- 108091028043 Nucleic acid sequence Proteins 0.000 description 6
- 238000013459 approach Methods 0.000 description 6
- 239000012472 biological sample Substances 0.000 description 6
- 230000006870 function Effects 0.000 description 6
- 239000000047 product Substances 0.000 description 6
- 238000003860 storage Methods 0.000 description 6
- 108700024394 Exon Proteins 0.000 description 5
- 108091034117 Oligonucleotide Proteins 0.000 description 5
- 238000004458 analytical method Methods 0.000 description 5
- 239000011324 bead Substances 0.000 description 5
- 201000010099 disease Diseases 0.000 description 5
- 210000005260 human cell Anatomy 0.000 description 5
- 238000000338 in vitro Methods 0.000 description 5
- 229920001184 polypeptide Polymers 0.000 description 5
- 102000004196 processed proteins & peptides Human genes 0.000 description 5
- 108090000765 processed proteins & peptides Proteins 0.000 description 5
- 108700028369 Alleles Proteins 0.000 description 4
- 241000282412 Homo Species 0.000 description 4
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 4
- 230000002490 cerebral effect Effects 0.000 description 4
- 210000000349 chromosome Anatomy 0.000 description 4
- 210000004962 mammalian cell Anatomy 0.000 description 4
- 108020004999 messenger RNA Proteins 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 4
- 210000004500 stellate cell Anatomy 0.000 description 4
- 239000000126 substance Substances 0.000 description 4
- 210000004881 tumor cell Anatomy 0.000 description 4
- 238000005406 washing Methods 0.000 description 4
- 208000031261 Acute myeloid leukaemia Diseases 0.000 description 3
- 206010018338 Glioma Diseases 0.000 description 3
- 241000699670 Mus sp. Species 0.000 description 3
- 108020004711 Nucleic Acid Probes Proteins 0.000 description 3
- 241000283973 Oryctolagus cuniculus Species 0.000 description 3
- 208000009565 Pharyngeal Neoplasms Diseases 0.000 description 3
- 206010034811 Pharyngeal cancer Diseases 0.000 description 3
- 210000002593 Y chromosome Anatomy 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 3
- 210000004369 blood Anatomy 0.000 description 3
- 239000008280 blood Substances 0.000 description 3
- 238000004422 calculation algorithm Methods 0.000 description 3
- 210000003714 granulocyte Anatomy 0.000 description 3
- 230000012010 growth Effects 0.000 description 3
- 239000005556 hormone Substances 0.000 description 3
- 229940088597 hormone Drugs 0.000 description 3
- 229910052739 hydrogen Inorganic materials 0.000 description 3
- 239000001257 hydrogen Substances 0.000 description 3
- 239000002853 nucleic acid probe Substances 0.000 description 3
- 238000002360 preparation method Methods 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 210000002955 secretory cell Anatomy 0.000 description 3
- 238000004088 simulation Methods 0.000 description 3
- 239000007790 solid phase Substances 0.000 description 3
- 239000000243 solution Substances 0.000 description 3
- 210000000952 spleen Anatomy 0.000 description 3
- 238000012800 visualization Methods 0.000 description 3
- 208000024893 Acute lymphoblastic leukemia Diseases 0.000 description 2
- 208000014697 Acute lymphocytic leukaemia Diseases 0.000 description 2
- 108091093088 Amplicon Proteins 0.000 description 2
- 241000234671 Ananas Species 0.000 description 2
- 235000007119 Ananas comosus Nutrition 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 2
- 102000053602 DNA Human genes 0.000 description 2
- 241000196324 Embryophyta Species 0.000 description 2
- 208000032612 Glial tumor Diseases 0.000 description 2
- 241000701044 Human gammaherpesvirus 4 Species 0.000 description 2
- 241000725303 Human immunodeficiency virus Species 0.000 description 2
- 241000701806 Human papillomavirus Species 0.000 description 2
- 208000008839 Kidney Neoplasms Diseases 0.000 description 2
- 206010027476 Metastases Diseases 0.000 description 2
- 241001465754 Metazoa Species 0.000 description 2
- WGZDBVOTUVNQFP-UHFFFAOYSA-N N-(1-phthalazinylamino)carbamic acid ethyl ester Chemical compound C1=CC=C2C(NNC(=O)OCC)=NN=CC2=C1 WGZDBVOTUVNQFP-UHFFFAOYSA-N 0.000 description 2
- 208000006664 Precursor Cell Lymphoblastic Leukemia-Lymphoma Diseases 0.000 description 2
- 241000288906 Primates Species 0.000 description 2
- 241000700159 Rattus Species 0.000 description 2
- 206010038389 Renal cancer Diseases 0.000 description 2
- 208000006265 Renal cell carcinoma Diseases 0.000 description 2
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 2
- 210000004102 animal cell Anatomy 0.000 description 2
- 238000001574 biopsy Methods 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 2
- 210000003321 cartilage cell Anatomy 0.000 description 2
- 238000004113 cell culture Methods 0.000 description 2
- 230000004663 cell proliferation Effects 0.000 description 2
- 238000012512 characterization method Methods 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 230000002759 chromosomal effect Effects 0.000 description 2
- 208000029742 colonic neoplasm Diseases 0.000 description 2
- 230000001186 cumulative effect Effects 0.000 description 2
- 238000012350 deep sequencing Methods 0.000 description 2
- 238000012217 deletion Methods 0.000 description 2
- 230000037430 deletion Effects 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000018109 developmental process Effects 0.000 description 2
- 208000035475 disorder Diseases 0.000 description 2
- 238000009509 drug development Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 235000013601 eggs Nutrition 0.000 description 2
- 210000001671 embryonic stem cell Anatomy 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000007613 environmental effect Effects 0.000 description 2
- 210000003743 erythrocyte Anatomy 0.000 description 2
- 210000003527 eukaryotic cell Anatomy 0.000 description 2
- 230000002496 gastric effect Effects 0.000 description 2
- 238000001727 in vivo Methods 0.000 description 2
- 238000011534 incubation Methods 0.000 description 2
- 230000000968 intestinal effect Effects 0.000 description 2
- 201000010982 kidney cancer Diseases 0.000 description 2
- 210000002540 macrophage Anatomy 0.000 description 2
- 210000003584 mesangial cell Anatomy 0.000 description 2
- 238000010369 molecular cloning Methods 0.000 description 2
- 210000000663 muscle cell Anatomy 0.000 description 2
- 210000000440 neutrophil Anatomy 0.000 description 2
- 238000007899 nucleic acid hybridization Methods 0.000 description 2
- 230000000849 parathyroid Effects 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 210000001778 pluripotent stem cell Anatomy 0.000 description 2
- 210000001236 prokaryotic cell Anatomy 0.000 description 2
- 239000002096 quantum dot Substances 0.000 description 2
- 230000002829 reductive effect Effects 0.000 description 2
- 238000010839 reverse transcription Methods 0.000 description 2
- 238000013207 serial dilution Methods 0.000 description 2
- 239000007787 solid Substances 0.000 description 2
- 241000894007 species Species 0.000 description 2
- 238000007619 statistical method Methods 0.000 description 2
- 230000004936 stimulating effect Effects 0.000 description 2
- 210000001685 thyroid gland Anatomy 0.000 description 2
- 238000012070 whole genome sequencing analysis Methods 0.000 description 2
- NHBKXEKEPDILRR-UHFFFAOYSA-N 2,3-bis(butanoylsulfanyl)propyl butanoate Chemical compound CCCC(=O)OCC(SC(=O)CCC)CSC(=O)CCC NHBKXEKEPDILRR-UHFFFAOYSA-N 0.000 description 1
- 208000006468 Adrenal Cortex Neoplasms Diseases 0.000 description 1
- 206010061424 Anal cancer Diseases 0.000 description 1
- 208000007860 Anus Neoplasms Diseases 0.000 description 1
- 101001007348 Arachis hypogaea Galactose-binding lectin Proteins 0.000 description 1
- 239000004475 Arginine Substances 0.000 description 1
- 241000972773 Aulopiformes Species 0.000 description 1
- 208000010839 B-cell chronic lymphocytic leukemia Diseases 0.000 description 1
- 208000032791 BCR-ABL1 positive chronic myelogenous leukemia Diseases 0.000 description 1
- 241000894006 Bacteria Species 0.000 description 1
- 206010004146 Basal cell carcinoma Diseases 0.000 description 1
- 206010004593 Bile duct cancer Diseases 0.000 description 1
- 206010005003 Bladder cancer Diseases 0.000 description 1
- 208000018084 Bone neoplasm Diseases 0.000 description 1
- 241000283690 Bos taurus Species 0.000 description 1
- 208000003174 Brain Neoplasms Diseases 0.000 description 1
- 206010006187 Breast cancer Diseases 0.000 description 1
- 208000026310 Breast neoplasm Diseases 0.000 description 1
- 238000011740 C57BL/6 mouse Methods 0.000 description 1
- 108090000994 Catalytic RNA Proteins 0.000 description 1
- 102000053642 Catalytic RNA Human genes 0.000 description 1
- 206010008342 Cervix carcinoma Diseases 0.000 description 1
- 208000010833 Chronic myeloid leukaemia Diseases 0.000 description 1
- 108091026890 Coding region Proteins 0.000 description 1
- 206010009944 Colon cancer Diseases 0.000 description 1
- 229920000742 Cotton Polymers 0.000 description 1
- 241000699800 Cricetinae Species 0.000 description 1
- 238000007400 DNA extraction Methods 0.000 description 1
- 238000001712 DNA sequencing Methods 0.000 description 1
- 206010014561 Emphysema Diseases 0.000 description 1
- 206010014733 Endometrial cancer Diseases 0.000 description 1
- 206010014759 Endometrial neoplasm Diseases 0.000 description 1
- 241000283073 Equus caballus Species 0.000 description 1
- 208000000461 Esophageal Neoplasms Diseases 0.000 description 1
- 208000006168 Ewing Sarcoma Diseases 0.000 description 1
- 241000282326 Felis catus Species 0.000 description 1
- 210000000712 G cell Anatomy 0.000 description 1
- 206010064571 Gene mutation Diseases 0.000 description 1
- 102100031547 HLA class II histocompatibility antigen, DO alpha chain Human genes 0.000 description 1
- 208000017604 Hodgkin disease Diseases 0.000 description 1
- 208000021519 Hodgkin lymphoma Diseases 0.000 description 1
- 208000010747 Hodgkins lymphoma Diseases 0.000 description 1
- 101000866278 Homo sapiens HLA class II histocompatibility antigen, DO alpha chain Proteins 0.000 description 1
- 102100034343 Integrase Human genes 0.000 description 1
- 108091092195 Intron Proteins 0.000 description 1
- 208000007766 Kaposi sarcoma Diseases 0.000 description 1
- 206010058467 Lung neoplasm malignant Diseases 0.000 description 1
- 208000031422 Lymphocytic Chronic B-Cell Leukemia Diseases 0.000 description 1
- 206010025323 Lymphomas Diseases 0.000 description 1
- 241001544487 Macromiidae Species 0.000 description 1
- 238000007476 Maximum Likelihood Methods 0.000 description 1
- 208000033761 Myelogenous Chronic BCR-ABL Positive Leukemia Diseases 0.000 description 1
- 208000033776 Myeloid Acute Leukemia Diseases 0.000 description 1
- 206010029260 Neuroblastoma Diseases 0.000 description 1
- 239000000020 Nitrocellulose Substances 0.000 description 1
- 208000015914 Non-Hodgkin lymphomas Diseases 0.000 description 1
- 108091092724 Noncoding DNA Proteins 0.000 description 1
- 238000000636 Northern blotting Methods 0.000 description 1
- 239000004677 Nylon Substances 0.000 description 1
- 206010030155 Oesophageal carcinoma Diseases 0.000 description 1
- 108020005187 Oligonucleotide Probes Proteins 0.000 description 1
- 108700026244 Open Reading Frames Proteins 0.000 description 1
- 206010033128 Ovarian cancer Diseases 0.000 description 1
- 206010061535 Ovarian neoplasm Diseases 0.000 description 1
- 238000012408 PCR amplification Methods 0.000 description 1
- 206010061902 Pancreatic neoplasm Diseases 0.000 description 1
- 241001494479 Pecora Species 0.000 description 1
- 241000009328 Perro Species 0.000 description 1
- 206010035226 Plasma cell myeloma Diseases 0.000 description 1
- 206010035664 Pneumonia Diseases 0.000 description 1
- 239000004698 Polyethylene Substances 0.000 description 1
- 239000002202 Polyethylene glycol Substances 0.000 description 1
- 239000004793 Polystyrene Substances 0.000 description 1
- 239000013614 RNA sample Substances 0.000 description 1
- 108010092799 RNA-directed DNA polymerase Proteins 0.000 description 1
- 238000011530 RNeasy Mini Kit Methods 0.000 description 1
- 208000015634 Rectal Neoplasms Diseases 0.000 description 1
- 108091028664 Ribonucleotide Proteins 0.000 description 1
- 241000283984 Rodentia Species 0.000 description 1
- 208000000453 Skin Neoplasms Diseases 0.000 description 1
- 108091027967 Small hairpin RNA Proteins 0.000 description 1
- 238000002105 Southern blotting Methods 0.000 description 1
- 238000012896 Statistical algorithm Methods 0.000 description 1
- 208000005718 Stomach Neoplasms Diseases 0.000 description 1
- 108091035286 Strbase Proteins 0.000 description 1
- 208000037065 Subacute sclerosing leukoencephalitis Diseases 0.000 description 1
- 206010042297 Subacute sclerosing panencephalitis Diseases 0.000 description 1
- 241000282898 Sus scrofa Species 0.000 description 1
- 210000001744 T-lymphocyte Anatomy 0.000 description 1
- 208000024313 Testicular Neoplasms Diseases 0.000 description 1
- 206010057644 Testis cancer Diseases 0.000 description 1
- 208000024770 Thyroid neoplasm Diseases 0.000 description 1
- 102000011923 Thyrotropin Human genes 0.000 description 1
- 108010061174 Thyrotropin Proteins 0.000 description 1
- 108091023040 Transcription factor Proteins 0.000 description 1
- 102000040945 Transcription factor Human genes 0.000 description 1
- 108020004566 Transfer RNA Proteins 0.000 description 1
- 208000007097 Urinary Bladder Neoplasms Diseases 0.000 description 1
- 208000006105 Uterine Cervical Neoplasms Diseases 0.000 description 1
- 210000001766 X chromosome Anatomy 0.000 description 1
- 230000002159 abnormal effect Effects 0.000 description 1
- 230000005856 abnormality Effects 0.000 description 1
- 210000001789 adipocyte Anatomy 0.000 description 1
- 210000004404 adrenal cortex Anatomy 0.000 description 1
- 201000002454 adrenal cortex cancer Diseases 0.000 description 1
- 230000001919 adrenal effect Effects 0.000 description 1
- 210000004504 adult stem cell Anatomy 0.000 description 1
- 230000003322 aneuploid effect Effects 0.000 description 1
- 208000036878 aneuploidy Diseases 0.000 description 1
- 238000010171 animal model Methods 0.000 description 1
- 230000000692 anti-sense effect Effects 0.000 description 1
- 201000011165 anus cancer Diseases 0.000 description 1
- 210000004396 apud cell Anatomy 0.000 description 1
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 1
- 210000003719 b-lymphocyte Anatomy 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 208000026900 bile duct neoplasm Diseases 0.000 description 1
- 230000008827 biological function Effects 0.000 description 1
- 210000003969 blast cell Anatomy 0.000 description 1
- 201000000053 blastoma Diseases 0.000 description 1
- 210000000601 blood cell Anatomy 0.000 description 1
- 210000001124 body fluid Anatomy 0.000 description 1
- 239000010839 body fluid Substances 0.000 description 1
- 210000000988 bone and bone Anatomy 0.000 description 1
- 210000002449 bone cell Anatomy 0.000 description 1
- 210000000233 bronchiolar non-ciliated Anatomy 0.000 description 1
- 230000032823 cell division Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 239000004568 cement Substances 0.000 description 1
- 201000010881 cervical cancer Diseases 0.000 description 1
- 239000003153 chemical reaction reagent Substances 0.000 description 1
- 210000004978 chinese hamster ovary cell Anatomy 0.000 description 1
- 208000006990 cholangiocarcinoma Diseases 0.000 description 1
- 210000001612 chondrocyte Anatomy 0.000 description 1
- 208000032852 chronic lymphocytic leukemia Diseases 0.000 description 1
- 238000004140 cleaning Methods 0.000 description 1
- 201000010897 colon adenocarcinoma Diseases 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 230000001010 compromised effect Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- 230000002559 cytogenic effect Effects 0.000 description 1
- 230000001461 cytolytic effect Effects 0.000 description 1
- 210000001151 cytotoxic T lymphocyte Anatomy 0.000 description 1
- 210000004443 dendritic cell Anatomy 0.000 description 1
- 210000003298 dental enamel Anatomy 0.000 description 1
- 239000005547 deoxyribonucleotide Substances 0.000 description 1
- 125000002637 deoxyribonucleotide group Chemical group 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 230000001627 detrimental effect Effects 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- 238000002405 diagnostic procedure Methods 0.000 description 1
- 210000002249 digestive system Anatomy 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 238000007877 drug screening Methods 0.000 description 1
- 201000008184 embryoma Diseases 0.000 description 1
- 230000002124 endocrine Effects 0.000 description 1
- 210000003890 endocrine cell Anatomy 0.000 description 1
- 210000002919 epithelial cell Anatomy 0.000 description 1
- 201000004101 esophageal cancer Diseases 0.000 description 1
- 230000005713 exacerbation Effects 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 210000002950 fibroblast Anatomy 0.000 description 1
- 235000019688 fish Nutrition 0.000 description 1
- 238000013467 fragmentation Methods 0.000 description 1
- 238000006062 fragmentation reaction Methods 0.000 description 1
- 230000002538 fungal effect Effects 0.000 description 1
- 206010017758 gastric cancer Diseases 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 230000000762 glandular Effects 0.000 description 1
- 239000011521 glass Substances 0.000 description 1
- 230000002414 glycolytic effect Effects 0.000 description 1
- 210000002149 gonad Anatomy 0.000 description 1
- 210000004007 growth hormone secreting cell Anatomy 0.000 description 1
- 210000002768 hair cell Anatomy 0.000 description 1
- 201000010536 head and neck cancer Diseases 0.000 description 1
- 208000014829 head and neck neoplasm Diseases 0.000 description 1
- 201000010235 heart cancer Diseases 0.000 description 1
- 208000024348 heart neoplasm Diseases 0.000 description 1
- 210000002443 helper t lymphocyte Anatomy 0.000 description 1
- 230000002440 hepatic effect Effects 0.000 description 1
- 208000006454 hepatitis Diseases 0.000 description 1
- 231100000283 hepatitis Toxicity 0.000 description 1
- 208000029824 high grade glioma Diseases 0.000 description 1
- 125000004435 hydrogen atom Chemical group [H]* 0.000 description 1
- 230000002267 hypothalamic effect Effects 0.000 description 1
- 210000000987 immune system Anatomy 0.000 description 1
- 229940124622 immune-modulator drug Drugs 0.000 description 1
- 239000012535 impurity Substances 0.000 description 1
- 238000000126 in silico method Methods 0.000 description 1
- 238000010348 incorporation Methods 0.000 description 1
- 210000004263 induced pluripotent stem cell Anatomy 0.000 description 1
- 208000015181 infectious disease Diseases 0.000 description 1
- 239000004615 ingredient Substances 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 238000011005 laboratory method Methods 0.000 description 1
- 208000032839 leukemia Diseases 0.000 description 1
- 230000000670 limiting effect Effects 0.000 description 1
- 201000007270 liver cancer Diseases 0.000 description 1
- 210000005229 liver cell Anatomy 0.000 description 1
- 208000014018 liver neoplasm Diseases 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000000504 luminescence detection Methods 0.000 description 1
- 210000004072 lung Anatomy 0.000 description 1
- 201000005202 lung cancer Diseases 0.000 description 1
- 208000020816 lung neoplasm Diseases 0.000 description 1
- 238000007403 mPCR Methods 0.000 description 1
- 230000003211 malignant effect Effects 0.000 description 1
- 201000011614 malignant glioma Diseases 0.000 description 1
- 208000015486 malignant pancreatic neoplasm Diseases 0.000 description 1
- 208000025854 malignant tumor of adrenal cortex Diseases 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 201000001441 melanoma Diseases 0.000 description 1
- 238000002844 melting Methods 0.000 description 1
- 230000008018 melting Effects 0.000 description 1
- 239000012528 membrane Substances 0.000 description 1
- 230000009401 metastasis Effects 0.000 description 1
- 244000005700 microbiome Species 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 210000005087 mononuclear cell Anatomy 0.000 description 1
- 210000002894 multi-fate stem cell Anatomy 0.000 description 1
- 230000035772 mutation Effects 0.000 description 1
- 201000000050 myeloid neoplasm Diseases 0.000 description 1
- 230000002107 myocardial effect Effects 0.000 description 1
- 210000000581 natural killer T-cell Anatomy 0.000 description 1
- 210000000822 natural killer cell Anatomy 0.000 description 1
- 230000001613 neoplastic effect Effects 0.000 description 1
- 210000005036 nerve Anatomy 0.000 description 1
- 210000000653 nervous system Anatomy 0.000 description 1
- 210000004498 neuroglial cell Anatomy 0.000 description 1
- 210000001719 neurosecretory cell Anatomy 0.000 description 1
- 229920001220 nitrocellulos Polymers 0.000 description 1
- 108091027963 non-coding RNA Proteins 0.000 description 1
- 102000042567 non-coding RNA Human genes 0.000 description 1
- 238000003499 nucleic acid array Methods 0.000 description 1
- 238000007826 nucleic acid assay Methods 0.000 description 1
- 229920001778 nylon Polymers 0.000 description 1
- 239000002751 oligonucleotide probe Substances 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 239000005304 optical glass Substances 0.000 description 1
- 229920000620 organic polymer Polymers 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 210000004798 organs belonging to the digestive system Anatomy 0.000 description 1
- 210000000963 osteoblast Anatomy 0.000 description 1
- 201000002528 pancreatic cancer Diseases 0.000 description 1
- 208000008443 pancreatic carcinoma Diseases 0.000 description 1
- 201000002530 pancreatic endocrine carcinoma Diseases 0.000 description 1
- 230000009996 pancreatic endocrine effect Effects 0.000 description 1
- 210000004738 parenchymal cell Anatomy 0.000 description 1
- 230000036961 partial effect Effects 0.000 description 1
- 230000001575 pathological effect Effects 0.000 description 1
- 239000008188 pellet Substances 0.000 description 1
- -1 phosphoramidite triester Chemical class 0.000 description 1
- 230000026731 phosphorylation Effects 0.000 description 1
- 238000006366 phosphorylation reaction Methods 0.000 description 1
- 230000010399 physical interaction Effects 0.000 description 1
- 230000001817 pituitary effect Effects 0.000 description 1
- 210000002381 plasma Anatomy 0.000 description 1
- 239000013612 plasmid Substances 0.000 description 1
- 229920001223 polyethylene glycol Polymers 0.000 description 1
- 229920000642 polymer Polymers 0.000 description 1
- 229920002223 polystyrene Polymers 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 210000002307 prostate Anatomy 0.000 description 1
- 210000000512 proximal kidney tubule Anatomy 0.000 description 1
- 238000003908 quality control method Methods 0.000 description 1
- 238000011002 quantification Methods 0.000 description 1
- 206010038038 rectal cancer Diseases 0.000 description 1
- 201000001275 rectum cancer Diseases 0.000 description 1
- 210000003289 regulatory T cell Anatomy 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 208000015347 renal cell adenocarcinoma Diseases 0.000 description 1
- 230000008439 repair process Effects 0.000 description 1
- 210000004994 reproductive system Anatomy 0.000 description 1
- 230000000241 respiratory effect Effects 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 230000002207 retinal effect Effects 0.000 description 1
- 239000002336 ribonucleotide Substances 0.000 description 1
- 125000002652 ribonucleotide group Chemical group 0.000 description 1
- 108091092562 ribozyme Proteins 0.000 description 1
- 235000019515 salmon Nutrition 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 230000003248 secreting effect Effects 0.000 description 1
- 210000002966 serum Anatomy 0.000 description 1
- 230000020509 sex determination Effects 0.000 description 1
- 239000002210 silicon-based material Substances 0.000 description 1
- 201000000849 skin cancer Diseases 0.000 description 1
- 210000004927 skin cell Anatomy 0.000 description 1
- 239000004055 small Interfering RNA Substances 0.000 description 1
- 239000011780 sodium chloride Substances 0.000 description 1
- 210000004872 soft tissue Anatomy 0.000 description 1
- 210000001082 somatic cell Anatomy 0.000 description 1
- 210000002325 somatostatin-secreting cell Anatomy 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000013179 statistical model Methods 0.000 description 1
- 210000002784 stomach Anatomy 0.000 description 1
- 201000011549 stomach cancer Diseases 0.000 description 1
- 210000002536 stromal cell Anatomy 0.000 description 1
- 238000007920 subcutaneous administration Methods 0.000 description 1
- 239000006228 supernatant Substances 0.000 description 1
- 208000024891 symptom Diseases 0.000 description 1
- 238000001308 synthesis method Methods 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
- 210000002435 tendon Anatomy 0.000 description 1
- 201000003120 testicular cancer Diseases 0.000 description 1
- 201000002510 thyroid cancer Diseases 0.000 description 1
- 210000003014 totipotent stem cell Anatomy 0.000 description 1
- 238000011144 upstream manufacturing Methods 0.000 description 1
- 201000005112 urinary bladder cancer Diseases 0.000 description 1
- 230000002485 urinary effect Effects 0.000 description 1
- 210000002700 urine Anatomy 0.000 description 1
- 206010046885 vaginal cancer Diseases 0.000 description 1
- 208000013139 vaginal neoplasm Diseases 0.000 description 1
- 238000010200 validation analysis Methods 0.000 description 1
- 239000013598 vector Substances 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6876—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
- C12Q1/6881—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for tissue or cell typing, e.g. human leukocyte antigen [HLA] probes
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6876—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
- C12Q1/6879—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for sex determination
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6876—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
- C12Q1/6883—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
- C12Q1/6886—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6876—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
- C12Q1/6888—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms
- C12Q1/689—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms for bacteria
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/156—Polymorphic or mutational markers
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/16—Primer sets for multiplex assays
Landscapes
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Organic Chemistry (AREA)
- Health & Medical Sciences (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Engineering & Computer Science (AREA)
- Zoology (AREA)
- Analytical Chemistry (AREA)
- Wood Science & Technology (AREA)
- Immunology (AREA)
- Genetics & Genomics (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Biotechnology (AREA)
- Microbiology (AREA)
- Molecular Biology (AREA)
- General Health & Medical Sciences (AREA)
- Biophysics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biochemistry (AREA)
- Pathology (AREA)
- Oncology (AREA)
- Hospice & Palliative Care (AREA)
- Cell Biology (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本開示は、一群のSNP遺伝子座における試料、例えば腫瘍モデル、の遺伝子型に基づいて試料を同定または認証するための方法および組成物、例えばキット、を提供する。【選択図】なし
Description
関連出願の相互参照
本出願は、2019年3月12日出願の出願PCT/CN2019/077750号に基づく優先権を主張するものであり、その開示を本明細書に参考として組み込む。
本出願は、2019年3月12日出願の出願PCT/CN2019/077750号に基づく優先権を主張するものであり、その開示を本明細書に参考として組み込む。
本発明は全般に、分子生物学、がん生物学および動物モデルに関する。
細胞株、オルガノイド、異種移植および同種移植モデルは、腫瘍学およびその他の生物医学的研究において有用なモデルシステムである。モデルの認証および特徴づけは、それらの適切な利用を助け、誤同定および誤用、交差夾雑、誤ったがん分類、長期培養および遺伝的浮動に起因するゲノム変化などの一連の問題を軽減するが、これらは全て、それらの一般的な使用に起因して、細胞株において特に十分に注目されたものである。例えば、様々な研究が、細胞株バンクについて、約10~40%の誤同定/夾雑率を報告している。
細胞形態学試験、イソ酵素学〔isoenzymology〕、細胞遺伝学的分析(核型分析およびFISH)、ヒトリンパ球抗原(HLA)タイプ分け、ショートタンデムリピート(STR)プロファイリング、単一ヌクレオチド多型(SNP)タイプ分け、DNAおよびRNAシークエンシングを含む、細胞株を認証するための様々な方法が存在している(Freedman,L.P.et al.Biotechniques 59,189-90,192(2015);Nims,R.W.&Reid,Y.In Vitro Cell Dev Biol Anim 53,880-887(2017))。これらの技術のうち、STRプロファイリングは最も広く使用されており、ヒト細胞株を認証する際のその適用を指南する基準(ASN-0002)が存在する(Almeida,J.L.,Cole,K.D.&Plant,A.L.PLoS Biol 14,e1002476(2016))。マウス細胞株については、19のSTRマーカーのパネルも開発されている(Zaaijer,S.et al.Elife 6(2017))。夾雑物を検出するためのSTRアッセイの感度は、約5~10%である(Yu,M.et al.Nature 520,307-11(2015))。近年、SNPタイプ分けは、その改善された精度、感度および低減されたコストのおかげで、細胞株および生体試料認証のためにますます使用されるようになってきている。SNPは、PCR、ならびにトランスクリプトームシークエンシングまたはRNA-seq、全エキソームシークエンシング(WES)および全ゲノムシークエンシング(WGS)を含む次世代シークエンシング(NGS)によってプロファイリングすることができる。現行のSNPアッセイは、約3~5%の検出感度を有する。それらの認証および特徴づけを促進する、STR、SNPおよび細胞株についてのその他の情報を含むデータベースも存在する。
細胞株に加えて、オルガノイドおよびマウス腫瘍モデルが、腫瘍学研究および薬物開発において広く使用されている。オルガノイドは、幹細胞、初代および操作された腫瘍試料、ならびに多くの生物構造および機能を維持する異種移植されたヒト腫瘍に由来するin vitro 三次元培養物である。マウス腫瘍モデルは、患者由来異種移植(PDX)、細胞株由来異種移植(CDX)、同系またはマウス細胞株由来モデル、マウス同種移植モデルなどを含むin vivoシステムである。PDXなど、これらのモデルの一部は、細胞株よりも、原発性腫瘍についての病理組織学およびゲノミクスを忠実に捕捉することができる。細胞株と同様、これらの腫瘍モデルには、類似の品質管理上の問題があるが、さらなる問題が存在する。異種移植モデルでは、腫瘍は、ヒト腫瘍細胞およびマウス間質細胞を含有し、後者は、モデルの継代の間にヒトの対応物を徐々に置き換え、これがゲノム不均一性、移植部位の違い(皮下および同所)、増殖の変動および切開のランダムさと複合されると、腫瘍のヒト-マウス遺伝子組成は、同じPDXからのものであっても、一部の試料がほとんど純粋なヒト内容またはマウス内容である程度まで、かなり異なることになる。このような腫瘍-宿主混合および干渉は、全ての移植された腫瘍モデルに生じ、STRマーカーおよびSNPについての対立遺伝子頻度のゆらぎを引き起こし、したがって、従来のSTRおよびSNPベースの認証方法に有害な影響を与える。大規模試料認証はまた、多くの種類のin vitroおよびin vivoモデルが同時に維持され使用されるバイオバンクについては特に、ロジスティック上の負荷があり、エラープローンである。したがって、腫瘍モデルを同定および認証するための新たなSNPベースのアッセイを開発する必要がある。
一態様では、本開示は、試料を同定または認証するための方法を提供する。一実施形態では、この方法は、試料から核酸を得ること;複数のヒト単一ヌクレオチド多型(SNP)遺伝子座または複数のマウスSNP遺伝子座において、試料について遺伝子型を検出すること;試料についての遺伝子型を参照遺伝子型と比較すること;および試料の同定を決定することを含む。ある種の実施形態では、ヒトSNPは、表1に示される群から選択される。ある種の実施形態では、マウスSNPは、表2に示される群から選択される。
ある種の実施形態では、試料は、細胞、組織、オルガノイド、またはそれらの組合せである。ある種の実施形態では、試料は、細胞株または腫瘍組織である。ある種の実施形態では、試料は、異種移植または同種移植腫瘍モデルに由来する。ある種の実施形態では、試料は、患者由来異種移植(PDX)、細胞株由来異種移植(CDX)、同系またはマウス細胞株由来モデル、マウス同種移植モデルに由来する。
ある種の実施形態では、試料は夾雑物を含み、方法は、試料中の夾雑物のパーセンテージを決定することをさらに含む。ある種の実施形態では、この方法は、夾雑物の正体を決定することをさらに含む。
ある種の実施形態では、検出するステップは、次世代シークエンシング(NGS)またはシークエンシングベースのSNPアレイを使用する。ある種の実施形態では、核酸は、バーコード化される。
ある種の実施形態では、この方法は、試料を得た対象の性別を同定することをさらに含む。ある種の実施形態では、この方法は、試料を得た対象の民族性を同定することをさらに含む。ある種の実施形態では、この方法は、試料中のウイルスまたはマイコプラズマの存在を検出することをさらに含む。ある種の実施形態では、この方法は、試料を得た免疫不全マウスの系統を決定することをさらに含む。
別の態様では、本開示は、ヒト構成成分およびマウス構成成分を含む試料を認証する方法を提供する。ある種の実施形態では、この方法は、試料から核酸を得ること;100個以上のマウスゲノム遺伝子座において、試料の遺伝子型を検出すること、ここで、マウスゲノム遺伝子座の各々が、対応する相同なヒトゲノム遺伝子座を有し、マウスゲノム遺伝子座の各々および対応する相同なヒトゲノム遺伝子座が、同一な隣接ヌクレオチド配列を有する;ならびに遺伝子型に基づいて、試料中のマウス構成成分の比率を決定すること、を含む。ある種の実施形態では、マウスゲノム遺伝子座は、表6から選択される。
別の態様では、本開示は、試料を同定するためのキットを提供する。ある種の実施形態では、このキットは、試料中の一群のヒトSNP遺伝子座または一群のマウスSNP遺伝子座を検出するためのプライマーを含む。ある種の実施形態では、このキットは、ヒトまたはマウスSNPを含有するDNA断片を、これらのプライマーを使用して増幅するための薬剤をさらに含む。
別の態様では、本開示は、ヒトまたはマウス試料を同定するためのマイクロアレイを提供する。ある種の実施形態では、このマイクロアレイは、一群のヒトまたはマウスSNP遺伝子座において試料の遺伝子型を検出するためのプローブを含む。
さらに別の態様では、本開示は、指示が記憶された非一過性のコンピュータ可読媒体であって、指示がプロセッサによって実行されるとき、指示がプロセッサに、一群のヒトまたはマウスSNP遺伝子座における試料の遺伝子型の検索;試料の遺伝子型の、参照遺伝子型との比較;および試料の同定の決定、を行わせる、コンピュータ可読媒体を提供する。
さらに別の態様では、本開示は、主要構成成分および微量構成成分を含む試料を認証するための方法を提供する。ある種の実施形態では、この方法は、100個以上のSNP遺伝子座において、試料の遺伝子型を検出すること;表11に示される式に従って、SNP遺伝子座の各々についてSNP不均一性比率を決定すること;遺伝子型をモデル化する混合ガウス分布を使用して、SNP遺伝子座についてのSNP不均一性比率に基づいて試料不均一性比率を決定すること;および試料の遺伝子型を、参照試料において各々検出された一群の参照遺伝子型と比較すること、試料の遺伝子型に対して最も高い同一性を有する参照遺伝子型を有する参照試料を同定すること、(i)参照遺伝子型が試料の遺伝子型に対して90%よりも高く同一であり、かつ試料不均一性比率が10%未満であるときに、または(ii)参照遺伝子型が試料の遺伝子型に対して80%よりも高く同一であり、かつ試料不均一性比率が10%よりも高いときに、主要構成成分が参照試料であることを決定することによって、試料の主要構成成分を決定すること、を含む。
ある種の実施形態では、この方法は、試料の微量構成成分を決定することをさらに含む。ある種の実施形態では、この方法は、試料中の主要構成成分および微量構成成分のパーセンテージを決定することをさらに含む。
以下の図面は本明細書の一部を構成し、本開示のある特定の態様をさらに示すために含まれる。本開示は、本明細書で提示した特定の実施形態の詳細な説明と組み合わせてこれらの図面の1つまたは複数を参照することによって、よりよく理解することができる。
本開示をより詳細に説明する前に、本開示は記載した特定の実施形態に限定されず、それ自体もちろん変化することができることを理解されたい。本明細書で使用した専門用語は、特定の実施形態を説明するためだけのものであって、限定を意味するものではなく、なぜならば、本開示の範囲は添付の特許請求の範囲によってのみ限定されるからであることも理解されたい。
他に規定しなければ、本明細書で使用した技術用語および科学用語は全て、本開示が属する業界の当業者によって通常理解されるのと同じ意味を有する。本明細書で記載したものと類似の、または同等のいかなる方法および材料も本開示の実践または試験において使用することができるが、好ましい方法および材料をここで説明する。
本明細書で引用した刊行物および特許は全て、それぞれ個々の刊行物または特許が具体的かつ個々に参考として組み込まれることが指示されているように参考として本明細書に組み込まれており、刊行物が引用されたものに関連して方法および/または材料を開示して記載するために、参考として本明細書に組み込まれている。いかなる刊行物の引用も、その開示が本出願日より前であるためであり、本開示は先行開示によりこのような刊行物に先行する権利がないことの承認と解釈されるべきではない。さらに、提供された刊行物の日付は、個別に確認する必要があり得る実際の刊行日とは異なっていてもよい。
本開示を読めば当業者には明らかなように、本明細書で記載し例示した個々の実施形態のそれぞれは、本開示の範囲または精神を逸脱することなく、その他のいくつかの実施形態のいずれかの特性から容易に分離するか、または一緒にすることができる別個の構成成分および特性を有する。任意の引用した方法は、引用した事象の順番で、または論理的に可能な任意のその他の順番で実施することができる。
定義
以下の定義は読者を支援するために提供される。他に規定しなければ、本明細書で使用した技術用語、表記およびその他の科学的用語または医学用語または専門用語は全て、化学および医学業界の当技術者によって通常理解される意味を有するものとする。場合によっては、通常理解される意味を有する用語は、明瞭になるように、および/または容易に参照できるように本明細書で定義されており、本明細書にこのような定義を含めるのは、当業界で一般的に理解されるような用語の定義をめぐる実質的な違いを表すためのものと必ずしも解釈されるべきではない。
以下の定義は読者を支援するために提供される。他に規定しなければ、本明細書で使用した技術用語、表記およびその他の科学的用語または医学用語または専門用語は全て、化学および医学業界の当技術者によって通常理解される意味を有するものとする。場合によっては、通常理解される意味を有する用語は、明瞭になるように、および/または容易に参照できるように本明細書で定義されており、本明細書にこのような定義を含めるのは、当業界で一般的に理解されるような用語の定義をめぐる実質的な違いを表すためのものと必ずしも解釈されるべきではない。
本明細書で使用する場合、単数形「a」、「an」および「the」は、文脈が明確に他のことを指示していない限り、複数の参照物を含む。
用語「対立遺伝子」は、特定の多型遺伝子座の2つ以上の既存の遺伝的バリアントのうち1つを意味する。
用語「量」または「レベル」は、試料中に存在する目的のポリヌクレオチドまたは目的のポリペプチドの量を意味する。このような量は、絶対的に、すなわち、試料中のポリヌクレオチドまたはポリペプチドの全量で表現されているか、あるいは相対的に、すなわち、試料中のポリヌクレオチドまたはポリペプチドの濃度で表現されていてもよい。
本明細書で使用する場合、用語「がん」または「腫瘍」は、異常な細胞増殖が関与する任意の疾患を意味し、体内の任意の組織、器官または細胞に影響を及ぼす疾患の全病期および全形態を含む。この用語には、悪性、良性、軟組織または固形物として特徴づけられる公知のがんおよび新生物状態の全て、ならびに転移前および転移後のがんを含む全病期およびグレードのがんが含まれる。全般的に、がんは、がんが位置する、またはがんが発生した組織または器官ならびに癌性組織および細胞の形態によって分類することができる。本明細書で使用する場合、がんの種類には、限定されるものではないが、急性リンパ性白血病(ALL)、急性骨髄性白血病、副腎皮質癌、肛門がん、星状細胞腫、小児小脳または大脳基底細胞癌、胆管がん、膀胱がん、骨腫瘍、脳がん、小脳星状細胞腫、大脳星状細胞腫/悪性神経膠腫、上衣腫、髄芽腫、テント上原始神経外胚葉性腫瘍、視覚路および視床下部神経膠腫、乳がん、バーキットリンパ腫、子宮頸がん、慢性リンパ性白血病、慢性骨髄性白血病、結腸がん、肺気腫、子宮内膜がん、上衣腫、食道がん、ユーイング肉腫、網膜芽細胞腫、胃〔gastric〕(胃〔stomach〕)がん、神経膠腫、頭部および頸部がん、心臓がん、ホジキンリンパ腫、膵島細胞癌(膵内分泌部)、カポジ肉腫、腎臓がん(腎細胞がん)、咽頭がん、白血病、肝臓がん、肺がん、神経芽細胞腫、非ホジキンリンパ腫、卵巣がん、膵臓がん、咽頭がん、前立腺がん、直腸がん、腎細胞癌(腎臓がん)、網膜芽細胞腫、ユーイングファミリーの腫瘍、皮膚がん、胃がん、精巣がん、咽頭がん、甲状腺がん、膣がんが含まれる。
本明細書で使用する「細胞」は、原核細胞であっても真核細胞であってもよい。原核細胞には、例えば、細菌が含まれる。真核細胞には、例えば、真菌、植物細胞および動物細胞が含まれる。動物細胞(例えば、哺乳類細胞またはヒト細胞)の種類には、例えば、循環/免疫系または器官の細胞(例えば、B細胞、T細胞(細胞傷害性T細胞、ナチュラルキラーT細胞、制御性T細胞、ヘルパーT細胞)、ナチュラルキラー細胞、顆粒球(例えば、好塩基性顆粒球、好酸性顆粒球、好中性顆粒球および過分葉好中球)、単核球またはマクロファージ、赤血球細胞(例えば、網状赤血球)、肥満細胞、血小板または巨核球、および樹状細胞)、内分泌系または器官の細胞(例えば、甲状腺細胞(例えば、甲状腺上皮細胞、傍濾胞細胞)、副甲状腺細胞(例えば、副甲状腺主細胞、好酸性細胞)、副腎細胞(例えば、クロム親和性細胞)および松果体の細胞(例えば、松果体細胞))、神経系または器官の細胞(例えば、神経膠芽細胞(例えば、星状膠細胞および乏突起膠細胞)、小膠細胞、巨細胞性神経分泌細胞、星状細胞、ベッチェル細胞および下垂体細胞(例えば、性腺刺激ホルモン分泌細胞、副腎皮質刺激ホルモン分泌細胞、甲状腺刺激ホルモン分泌細胞、成長ホルモン分泌細胞および乳腺刺激ホルモン分泌細胞))、呼吸系または器官の細胞(例えば、肺胞細胞(I型肺胞細胞およびII型肺胞細胞)、クララ細胞、杯状細胞、肺胞マクロファージ)、循環系または器官の細胞(例えば、心筋細胞および周辺細胞)、消化系または器官の細胞(例えば、胃主細胞、壁細胞、杯状細胞、パネート細胞、G細胞、D細胞、ECL細胞、I細胞、K細胞、S細胞、腸内分泌細胞、腸クロム親和性細胞、APUD細胞、肝臓の細胞(例えば、肝実質細胞およびクッパー細胞))、外被系または器官の細胞(例えば、骨の細胞(例えば、骨芽細胞、骨細胞および破骨細胞)、歯の細胞(例えば、セメント芽細胞およびエナメル芽細胞)、軟骨の細胞(例えば、軟骨芽細胞および軟骨細胞)、皮膚/髪の細胞(例えば、毛胞、角化細胞およびメラニン形成細胞(母斑細胞))、筋肉細胞(例えば、筋細胞)、脂肪細胞、線維芽細胞および腱細胞)、泌尿器系または器官の細胞(例えば、有足細胞、傍糸球体細胞、糸球体内メサンギウム細胞、糸球体外メサンギウム細胞、腎臓近位尿細管刷子縁細胞および緻密斑細胞)ならびに生殖器系または器官の細胞(例えば、精子、セルトリ細胞、ライディッヒ細胞、卵子、卵母細胞)が含まれる。細胞は、正常で健康な細胞であるか、または病的で不健康な細胞(例えば、がん細胞)であってもよい。細胞にはさらに、哺乳類接合子または胚性幹細胞、胎児幹細胞、人工多能性幹細胞および成人幹細胞を含む幹細胞が含まれる。幹細胞とは、未分化状態を維持しながら細胞分裂のサイクルを経て、特殊化した細胞種に分化することができる細胞である。幹細胞は、全能性幹細胞、多能性幹細胞、複能性幹細胞、寡能性幹細胞および単能性幹細胞であってもよく、いずれも体細胞から誘導することができる。幹細胞はまた、がん性幹細胞を含むことができる。哺乳類細胞は、齧歯類細胞、例えば、マウス、ラット、ハムスター細胞であってもよい。哺乳類細胞は、ウサギ目細胞、例えば、ウサギ細胞であってもよい。哺乳類細胞はまた、霊長類細胞、例えば、ヒト細胞であってもよい。ある特定の例では、細胞は、マスバイオプロダクションで使用される細胞、例えば、CHO細胞である。
用語「相補性」は、伝統的なワトソン-クリックまたはその他の非伝統的な方法のいずれかによって、別の核酸配列と水素結合を形成する核酸の能力を意味する。パーセント相補性は、第2の核酸配列と水素結合(例えば、ワトソン-クリック塩基対)を形成することができる核酸分子中の残基のパーセンテージを指し示す(例えば、10のうち5、6、7、8、9、10は50%、60%>、70%>、80%>、90%および100%相補性である)。「完全に相補性である」は、核酸配列の連続した残基が全て、第2の核酸配列中の同じ数の連続した残基と水素結合することを意味する。本明細書で使用する「実質的に相補性である」は、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、30、35、40、45、50、またはそれ以上のヌクレオチドの領域に亘って少なくとも60%、65%、70%、75%、80%、85%、90%、95%、97%、98%、99%または100%である相補性の程度を意味するか、あるいはストリンジェント条件下でハイブリダイズする2つの核酸を意味する。
本開示では、「含む〔comprises〕」、「含んだ〔comprised〕」、「含んでいる〔comprising〕」、「含有する〔contains〕」、「含有している〔containing〕」などの用語は、米国特許法にある意味を有し、これらは包括的またはオープンエンドであり、追加的な、引用されていない要素または方法ステップを排除しないことに注意されたい。「から本質的になっている〔consisting essentially of〕」および「から本質的になる〔consists essentially of〕」などの用語は、米国特許法にある意味を有し、これらは請求された発明の基本的で新規な特質に著しい影響を及ぼさない追加的な成分またはステップを含むことを許可する。用語「からなる〔consists of〕」および「からなっている〔consisting of〕」は米国特許法にあるものとみなされる意味を有し、すなわち、これらの用語はクローズエンドである。
本明細書で使用する場合、用語「夾雑物」は、試料中の主要構成成分とは異なる、または試料の不純物もしくはその他の望ましくない影響、例えば、だめにすること〔spoiling〕、汚染、感染を引き起こす、試料中に存在する構成成分を意味する。
用語「決定する」、「評価する」、「アッセイする」、「測定する」および「検出する」は同義に使用することができ、定量的および半定量的決定の両方を意味する。定量的および半定量的決定のいずれかを意味する場合、目的のポリヌクレオチドまたはポリペプチドの「レベルを決定する」または目的のポリヌクレオチドまたはポリペプチドを「検出する」という語句を使用することができる。
用語「ゲノム」は、その染色体の完全なDNA配列によって示される、個々の生物または細胞が運搬する総遺伝情報を意味する。
用語「ハイブリダイジング」は、ストリンジェント条件下で特定のヌクレオチド配列に対して優先的な核酸分子の結合、二重鎖形成またはハイブリダイジングを意味する。用語「ストリンジェント条件」は、混合した集団(例えば、組織生検からの細胞溶解物またはDNA調製物)中において、プローブがその標的部分配列に優先的にハイブリダイズし、その他の配列に対しては比較的少ない程度でハイブリダイズするか、または全くハイブリダイズしない条件を意味する。核酸ハイブリダイゼーションの場合における(例えば、アレイ、マイクロアレイ、サザンもしくはノザンハイブリダイゼーションにおけるような)「ストリンジェントハイブリダイゼーション」および「ストリンジェントハイブリダイゼーション洗浄条件」は、配列に依存し、異なる環境パラメータ下では異なる。核酸のハイブリダイゼーションの広範な指針は、例えば、Tijssen Laboratory Techniques in Biochemistry and Molecular Biology-Hybridization with Nucleic Acid Probes part I,Ch.2,“Overview of principles of Hybridization and the strategy of Nucleic acid probe assays,”(1993)Elsevier,N.Y.に見出される。全般的に、高ストリンジェントハイブリダイゼーションおよび洗浄条件は、規定されたイオン強度およびpHでの特定の配列の融点(Tm)より約5℃低くなるように選択される。Tmは、(規定されたイオン強度およびpHで)標的配列の50%が完全に一致したプローブにハイブリダイズする温度である。非常にストリンジェントな条件は、特定のプローブのTmに等しくなるように選択される。サザンまたはノザンブロットにおいてアレイまたはフィルター上に100個を上回る相補的残基を有する相補的核酸のハイブリダイゼーションのためのストリンジェントハイブリダイゼーション条件の一例は、標準的なハイブリダイゼーション溶液を使用して42℃である(例えば、Sambrook and Russell Molecular Cloning:A Laboratory Manual(3rd ed.)Vol.1-3(2001)Cold Spring Harbor Laboratory,Cold Spring Harbor Press,NYを参照のこと)。高ストリンジェント洗浄条件の一例は、NaCl 0.15Mで72℃で約15分間である。ストリンジェント洗浄条件の一例は、0.2×SSC洗浄で65℃で約15分間である。しばしば、バックグラウンドプローブシグナルを除去するために、高ストリンジェント洗浄に先行して低ストリンジェント洗浄を行う。例えば、100ヌクレオチドを上回る二本鎖のための中程度ストリンジェント洗浄の一例は、1×SSCで45℃で15分間である。例えば、100ヌクレオチドを上回る二本鎖のための低ストリンジェント洗浄の一例は、4×SSCから6×SSCで40℃で15分間である。
用語「遺伝子座」は、生物学的機能にかかわらず、当業界で公知の参照ゲノム中の染色体座標によって規定される、ゲノム中のDNA配列の任意のセグメントを意味する。DNA遺伝子座は、複数の遺伝子を含有してもよく、遺伝子を含有しなくてもよい;DNA遺伝子座は、単一の塩基対または数百万の塩基対であり得る。
用語「核酸」および「ポリヌクレオチド」は同義に使用され、デオキシリボヌクレオチドもしくはリボヌクレオチドのいずれかの任意の長さのヌクレオチドの多量体型、またはそれらの類似体を意味する。ポリヌクレオチドは、任意の三次元構造を有することができ、公知のまたは公知ではない任意の機能を果たすことができる。ポリヌクレオチドの非限定的な例には、遺伝子、遺伝子断片、エキソン、イントロン、メッセンジャーRNA(mRNA)、トランスファーRNA、リボソームRNA、リボザイム、cDNA、shRNA、一本鎖の短いかまたは長いRNA、組換えポリヌクレオチド、枝分かれポリヌクレオチド、プラスミド、ベクター、任意の配列の単離されたDNA、調節領域、任意の配列の単離されたRNA、核酸プローブおよびプライマーが含まれる。核酸分子は、直鎖状または環状であってもよい。
用語「オリゴヌクレオチド」は、少なくとも約5ヌクレオチド~約500ヌクレオチド(例えば、5、6、7、8、9、10、12、15、18、20、21、22、25、30、35、40、45、50、55、60、65、70、75、80、85、90、100、125、150、175、200、250、300、350、400、450または500ヌクレオチド)の核酸配列を意味する。一部の実施形態では、例えば、オリゴヌクレオチドは、例えば、ポリメラーゼ連鎖反応(PCR)増幅アッセイにおけるプライマーとして、および/またはハイブリダイゼーションアッセイもしくはマイクロアレイにおけるプローブとして使用され得る、約15ヌクレオチド~約30ヌクレオチド、または約20ヌクレオチド~約25ヌクレオチドであり得る。本発明のオリゴヌクレオチドは、当業界で周知のように、天然または合成の、例えば、DNA、RNA、PNA、LNA、修飾された骨格などであり得る。
用語「多型遺伝子座」は、2つ以上の対立遺伝子が同定されているゲノム遺伝子座を意味する。
用語「参照遺伝子型」は、本明細書で使用する場合、参照試料、例えば、既知の正体を有する試料中に存在する、1つ以上のゲノム遺伝子座の予め決定された遺伝子型を意味する。参照遺伝子型は、試験試料中に存在する特定のゲノム遺伝子座の遺伝子型を比較するための基礎として機能するように、本発明の方法の使用のために適切である。参照遺伝子型は、試料の性質ならびにこのような参照試料を確立する基となった対象の性別、年齢、民族性などのその他の要素に応じて変化し得る。
本明細書で使用する用語「試料」または「生物学的試料」は、任意の細胞、組織、オルガノイド、または目的の1つ以上の核酸分子を含有する任意のその他の試料を意味する。ある種の実施形態では、試料は、細胞(例えば、正常細胞、がん細胞、細胞株)、組織(例えば、正常組織、がん組織、異種移植または同種異系移植組織)、オルガノイドなどである。
用語「単一ヌクレオチド多型」または「SNP」は、2つ以上の代替的対立遺伝子が集団内に感知できる頻度、例えば>1%で存在する、ゲノム配列中の単一のヌクレオチド位置を意味する。SNPは、遺伝子のコード配列内、遺伝子の非コード領域内、および/または遺伝子の遺伝子間(例えば、イントロン)領域中に存在し得る。タンパク質コード領域中に存在するわけではないSNPもなお、遺伝子スプライシング、転写因子結合および/または非コードRNAの配列に対して影響を有し得る。本明細書で提供したSNP命名法は、GenBank(登録商標)データベースにおいて入手可能な、National Center for Biotechnological Information(NCBI)によって各固有のSNPに割り当てられた公式のReference SNP(rs)同定番号を意味する。
本明細書で使用する場合、用語「対象」は、ヒトまたは任意の非ヒト動物(例えば、マウス、ラット、ウサギ、イヌ、ネコ、ウシ、ブタ、ヒツジ、ウマまたは霊長類)を意味する。ヒトには、出生前および出生後の形態が含まれる。多くの実施形態では、対象は人間である。対象は患者であってもよく、これは疾患の診断または処置のために医療機関に来院した人を意味する。用語「対象」は、本明細書では「個体」または「患者」と同義に使用される。対象は、疾患または障害に罹っているか、または罹りやすくてもよいが、疾患または障害の症状を表していてもいなくてもよい。
用語「基材」は、アレイの文脈で使用する場合、関連するアッセイ構成成分(例えば、アッセイ領域、細胞、試験化合物など)を支持することができる材料を意味する。基材の例には、限定されるものではないが、ガラス、Siベースの材料、官能化ポリスチレン、官能化ポリエチレングリコール、官能化有機ポリマー、ニトロセルロースまたはナイロンメンブレン、紙、綿、および合成に適切な材料が含まれる。基材は、平らである必要はなく、球状形状(例えば、ビーズ)を含む任意の型の形状が含まれる。基材に結合される材料は、基材の任意の部分に結合され得る(例えば、多孔性基材材料の内側部分に結合され得る)。本発明の技術の好ましい実施形態は、基材に結合した核酸プローブを有する。核酸プローブは、非ランダムな化学的または物理的相互作用を介して基材と関連する場合、基材に「結合」されている。一部の好ましい実施形態では、結合は、例えばリンカーによって提供されるような、共有結合を介したものである。
用語「腫瘍モデル」は、本明細書で使用する場合、がんの発達および増悪を研究するため、ならびにヒトに与えられる前に処置を試験するために使用される、細胞、組織または動物を意味する。
用語「腫瘍試料」には、1つまたは複数の腫瘍細胞を含有する生物学的試料または生物源からの試料が含まれる。生物学的試料には、体液、例えば、血液、血漿、血清もしくは尿の試料、または、例えば、生検によって、細胞、組織もしくは器官、好ましくはがん細胞を含むか、もしくは本質的にはがん細胞からなることが疑われる腫瘍組織から得られた試料が含まれる。
腫瘍試料の同定のためのSNP
バイオバンク試料(例えば、細胞株)の誤同定および夾雑は、生物医学的研究を悩ませてきた。ショートタンデムリピート(STR)および単一ヌクレオチド多型(SNP)アッセイは、生体試料を認証するために広く使用されており、それぞれ5~10%および3~5%の感度で夾雑を検出することができる。本開示は、一態様では、夾雑を検出するのに≦1%の感度を有する方法を提供する。この方法はさらに、混合細胞株試料について、夾雑物を同定でき、夾雑比率を推定できる。この方法は、細胞株認証について報告された、ずばぬけて最も高感度かつ正確な方法である。ある種の実施形態では、この方法は、異種移植腫瘍などのヒト-マウス混合試料における種間夾雑を検出することもでき、マウス比率を正確に推定することもできる。ある種の実施形態では、マイコプラズマおよびモリキュートも、研究標的の中にある。ある種の実施形態では、この多機能方法は、ヒト試料の集団構造および性別を同時に推論する。ある種の実施形態では、DNAバーコード化技術のおかげで、本明細書で開示した方法は、従来のSTRアッセイと匹敵する試料当たりのコストで、単一の実行で100~200の試料をプロファイリングすることができ、それにより、高品質のバイオバンクを維持するための真にハイスループットかつ低コストのツールになっている。
バイオバンク試料(例えば、細胞株)の誤同定および夾雑は、生物医学的研究を悩ませてきた。ショートタンデムリピート(STR)および単一ヌクレオチド多型(SNP)アッセイは、生体試料を認証するために広く使用されており、それぞれ5~10%および3~5%の感度で夾雑を検出することができる。本開示は、一態様では、夾雑を検出するのに≦1%の感度を有する方法を提供する。この方法はさらに、混合細胞株試料について、夾雑物を同定でき、夾雑比率を推定できる。この方法は、細胞株認証について報告された、ずばぬけて最も高感度かつ正確な方法である。ある種の実施形態では、この方法は、異種移植腫瘍などのヒト-マウス混合試料における種間夾雑を検出することもでき、マウス比率を正確に推定することもできる。ある種の実施形態では、マイコプラズマおよびモリキュートも、研究標的の中にある。ある種の実施形態では、この多機能方法は、ヒト試料の集団構造および性別を同時に推論する。ある種の実施形態では、DNAバーコード化技術のおかげで、本明細書で開示した方法は、従来のSTRアッセイと匹敵する試料当たりのコストで、単一の実行で100~200の試料をプロファイリングすることができ、それにより、高品質のバイオバンクを維持するための真にハイスループットかつ低コストのツールになっている。
本明細書で記載した方法および組成物は、腫瘍モデルから得られた試料を同定および認証するために使用され得る一群のSNP遺伝子座の発見に一部基づく。ある種の実施形態では、腫瘍モデルは、原発性ヒト腫瘍、患者由来異種移植(PDX)、ヒト腫瘍細胞株、ヒト細胞株由来異種移植およびヒトオルガノイドを含むヒト腫瘍モデルである。ある種の実施形態では、SNPは、いくつかのヒト腫瘍モデルのRNAseqまたは全エキソームシークエンシング(WES)データに基づいて、ヒトSNPから選択される。選択されたヒトSNPは、22個の常染色体に亘って主に非連鎖不平衡(非LD)ブロック中に位置する、高度に発現される遺伝子のエキソン領域中に位置する。したがって、各ヒト腫瘍モデルは、選択されたヒトSNP遺伝子座において、固有の遺伝子型(すなわち、SNPフィンガープリント)を有する。
ある種の実施形態では、選択されたヒトSNP遺伝子座は、マウスゲノムにおいて相同性を有する。このようなヒトSNP遺伝子座を標的化するプライマーを使用して試料が増幅される場合、試料がマウスの細胞または組織と混合されていれば、対応するマウス遺伝子座のヌクレオチド配列が生成され得る。このようなヒトSNPは、例えば、これらのSNPのマウスおよびヒト読み取りの数に基づいて、ヒトおよびマウスの細胞/組織の混合物中のマウス含量のパーセンテージを推定するために使用され得る。
ある種の実施形態では、本明細書で使用するヒトSNPは、表1に示される群から選択される。
ある種の実施形態では、SNPには、マウス腫瘍細胞株などのマウス腫瘍モデルを同定および認証するための一群のマウスSNPが含まれる。一部の実施形態では、本明細書で使用するマウスSNPは、表2に示される群から選択される。
ある種の実施形態では、SNPには、試料を得た対象の性別を決定するための、性染色体(X染色体およびY染色体)中のヒトSNPがさらに含まれる。ある種の実施形態では、性染色体SNPは、表3に示される群から選択される。
ある種の実施形態では、SNPには、試料を得た免疫不全マウスの系統を決定するために使用され得るマウスSNPがさらに含まれる。一部の実施形態では、SNPは、表4に示される。
方法
一態様では、本開示は、試料を同定および認証するための方法を提供する。
一態様では、本開示は、試料を同定および認証するための方法を提供する。
ある種の実施形態では、本明細書で開示した方法は、試料を参照(例えば、標準的ながん細胞株)と一致させるためのものである。従来のSTRおよびSNPアッセイは、遺伝子型ベースのTanabe-Mastersアルゴリズムおよびそのバリエーションを主に使用していた。STRアッセイは、たくさんのマーカーについて類似のシグナルを生じる。SNPアッセイは、しばしばさらに多くのSNPを遺伝子型決定する。したがって、2つの試料を一致と呼ぶためにSNPアッセイによって使用される類似性閾値は、より高い場合が多い。しかし、従来のアッセイの一致力〔matching power〕は、約100のSNPを用いた場合であっても、夾雑された試料についてひどく損なわれ得る。ある種の実施形態では、本明細書で開示した方法は、ヒト試料について237のSNP部位の高深度(3000×)シークエンシングを実施し、試料、または夾雑された試料の主要構成成分を同定することにおいて100%の精度を示した。
ある種の実施形態では、本明細書で開示した方法は、生物学的試料における夾雑を検出するためのものである。細胞株における夾雑を検出するための感度は、STRアッセイについては約5~10%、SNPアッセイについては3~5%である。しかし、性能はむしろ、>20%の夾雑ですら96-SNPアッセイによって2つの無関係の細胞株の混合物中で検出されなかった程度まで、不安定であり得る(Liang-Chu,M.M.et al.PLoS One 10,e0116218(2015))。ある種の実施形態では、本明細書で開示した方法は一貫して、不均一性比率だけを使用する場合、その値および区別できる二/三峰性分布の両方によって、2%の感度に到達する。感度は、SNPフィンガープリントを有する参照試料のライブラリー中に夾雑物が存在する場合には、≦1%に達する。夾雑なしの細胞株は、多クローン性およびシークエンシングエラーに起因して、約1%の夾雑を有する細胞株試料と匹敵するレベルの遺伝的不均一性を示すので、このような感度は事実上、理論的検出限界である。
ある種の実施形態では、本明細書で開示した方法は、夾雑物を同定するためのものである。細胞株の交差夾雑は、バイオバンクでは一般的である。夾雑された培養物の組成は、細胞株の異なる増殖速度に起因して、経時的に変化する。細胞株は、遺伝子変異など、ゲノミクスが異なっており、薬物処置に異なって応答して、薬物スクリーニングにおいて誤った結果を引き起こし得る。本開示の発明者らは、1000を超えるがん細胞株についてSNPフィンガープリントライブラリーを構築し、それにより、夾雑している細胞株は、一義的に同定され得る。さらに、夾雑比率が正確に推定され得る。細胞株の品質をチェックすることに加えて、この能力は、生物学的または化学的な干渉の下での2つの細胞株の動的組成をモニターすることなどの、その他の利用を有し得る。
種内夾雑に加えて、ある種の実施形態では、本明細書で開示した方法は、ヒトとマウスとの間の種間夾雑を正確に検出および定量することができる。ある種の実施形態では、本明細書で開示した方法は、SNPではなく、2つの種間で異なっているが、同一な隣接ヌクレオチド配列を有する、108の相同なDNAセグメントを使用し、したがって、共通プライマーを、ヒトおよびマウスDNAセグメントの偏りのない増幅のために設計することができる。このアプローチは、一連のマウス-ヒトDNA混合物ベンチマーク試料において、完璧な性能を示した。相同性ベースの原理は、その他の種間夾雑を検出するために使用され得る。
ある種の実施形態では、本明細書で開示した方法の力は、いくつかの新規の特性から来ている。第1は、ディープNGSシークエンシングであり、これは、SNPの遺伝子型およびヌクレオチド頻度の両方を得るものであるが、従来のSTRおよびSNPアッセイは、SNP遺伝子型をプロファイリングするだけである。第2に、SNPプロファイリングとは別に、本明細書で開示した方法は、マイコプラズマ夾雑を検出し、マウス-ヒト混合比率を推定するために、標的化シークエンシングを実施する。第3に、一そろいの統計モデルおよびアルゴリズムが、ディープNGSシークエンシングデータを利用するために開発されており、認証方法を自動的でロバストかつ客観的なものにしている。最後に、DNAバーコード技術が、100~200の試料の同時の並列シークエンシングを可能にするために使用され、コストを大幅に低減させる。
本明細書で開示したハイスループットで低コストの方法は、認証済みの高品質の試料を維持するために、バイオバンクによって慣用的に使用され得る。この方法は、その他の種およびさらにはマイクロバイオームからの試料に広く適応され得、任意のNGSシークエンシングプラットフォーム上で実現され得る。
一実施形態では、この方法は、試料から核酸を得ること;本明細書で開示した複数のヒトまたはマウスの単一のSNP遺伝子座において、試料についての遺伝子型を検出すること;試料についての遺伝子型を、参照試料において検出された参照遺伝子型と比較すること;および試料の同定を決定することを含む。ある種の実施形態では、50、60、70、80、90、100、110、120、130、140、150、160、170、180、190、200またはそれ以上のSNP遺伝子座における遺伝子型が検出される。
試料から得られた核酸は、RNAまたはDNAであり得る。ある種の実施形態では、試料から得られた核酸は、試料から単離されたゲノムDNAである。ある種の実施形態では、試料から得られた核酸は、ゲノムDNAであり、試料から単離された総RNAまたはmRNAである。ある種の実施形態では、試料から得られた核酸は、例えば、PCR反応または逆転写後のPCRによって増幅される。
SNP遺伝子座における試料についての遺伝子型は、当業界で公知の任意の適切な方法、例えば、限定されるものではないが、シークエンシングベースの方法およびハイブリダイゼーションベースの方法に基づいて検出することができる。
ある種の実施形態では、検出するステップは、増幅ステップを含む。このような場合、検出剤は、SNP遺伝子座を含有するゲノム領域にハイブリダイズし、ポリメラーゼの存在下でそのSNP遺伝子座を包囲するポリヌクレオチド配列を増幅することができる、少なくとも一対のプライマーを含む。SNPを含有するゲノム領域を増幅するために使用されるプライマー対は、プライマーまたはプローブが、ゲノム領域またはその相補鎖に特異的にハイブリダイズできるように、ゲノム領域の少なくとも一部分に対して十分な同一性または相補性を有する。「特異的にハイブリダイズする」は、本明細書で使用する場合、プライマーまたはプローブが、ストリンジェント条件下で意図した配列にハイブリダイズできることを意味する。「ストリンジェント条件」は、本明細書で使用する場合、5×SSPE、5×デンハルト液、0.5%SDSおよび100ug/mL変性サケ精子DNAからなる溶液中で42℃でハイブリダイズし、次いで、0.5×SSCおよび0.1%SDSを含む溶液で42℃で洗浄することを意味する。
PCRなどの適切な核酸増幅方法による増幅後、増幅生成物中の配列またはSNPが検出される。ある種の実施形態では、増幅生成物は、50bp~500bpの長さを有する。ある種の実施形態では、増幅生成物中のSNPの配列は、シークエンシングベースの方法、例えば、次世代シークエンシング(NGS)方法を使用して検出される。ある種の実施形態では、NGS方法は、多数のSNP遺伝子座における配列を決定するために使用される。ある種の実施形態では、NGS方法は、各試料から得られた核酸をバーコード化することによって、多くの試料からのSNP遺伝子座の配列を同時に決定するために使用され得る。
試料から得られた核酸がRNAである場合、増幅ステップは、試料中のRNAのcDNAを産生するための逆転写ステップを任意選択で含み得る。次いで、cDNAは、SNPの存在の検出を可能にするために、プライマーを使用して増幅される。
一部の実施形態では、例えば、マイクロアレイが、核酸中のSNPを検出するために使用される。マイクロアレイは、固相支持体に結合した捕捉プローブの再現性のあるパターンから構成される。標識されたRNAまたはDNAは、アレイ上の相補的プローブにハイブリダイズし、その後レーザースキャンによって検出される。SNPの存在は、アレイ上の特異的プローブに結合する標識されたRNAまたはDNAの強度を測定することによって検出され得る。
機械的合成法を使用したこれらのアレイの合成技術は、例えば、米国特許第5,384,261号に記載されている。平面アレイ表面が使用されることが多いが、アレイは実際にはいかなる形状の表面に製造されていてもよく、多重の表面に製造されてもよい。アレイはまた、ビーズ、ゲル、ポリマー表面、光ファイバーなどの繊維、ガラスまたは任意のその他の適切な基材上の核酸であってもよく、米国特許第5,770,358号、第5,789,162号、第5,708,153号、第6,040,193号および第5,800,992号を参照のこと。アレイは、診断法または包括的装置のその他の操作を可能にするような方法で包装されていてもよい。
本発明を実践するために必要なプローブおよびプライマーは、周知の技術を使用して合成するかまたは標識することができる。プローブおよびプライマーとして使用するオリゴヌクレオチドは、Beaucage and Caruthers,Tetrahedron Letts.(1981) 22:1859-1862によって最初に記載された固相ホスホラミダイトトリエステル法によって、Needham-Van Devanter et al,Nucleic Acids Res.(1984)12:6159-6168に記載されているように、自動合成機を使用して化学合成することができる。
ある種の実施形態では、この方法は、例えば、表3に示される群から選択される性染色体SNPを検出することによって、試料を得た対象の性別を同定することをさらに含む。ある種の実施形態では、この方法は、試料を得た対象の民族性を同定することをさらに含む。ある種の実施形態では、この方法は、例えば、表4に示される供給業者のSNPを検出することによって、試料を得た免疫不全マウスの系統を決定することをさらに含む。
ある種の実施形態では、本明細書で開示した方法は、腫瘍モデルにおける、A/B/C型肝炎ウイルス(HAV/HBV/HCV)、ヒト免疫不全ウイルス(HIV)、エプスタイン・バーウイルス(EBV)およびヒトパピローマウイルス(HPV)を含む一般的なウイルス感染およびマイコプラズマ夾雑を検出することをさらに含む。ある種の実施形態では、ウイルス感染およびマイコプラズマ夾雑を検出するために使用されるマーカーは、表5に示される。
ある種の実施形態では、本明細書で開示した方法は、主要構成成分および微量構成成分を含む試料を認証するために使用され得る。ある種の実施形態では、この方法は、不均一性比率を推定すること;試料の主要構成成分を決定すること;試料の微量構成成分を決定すること;ならびに主要構成成分および微量構成成分の混合比率を推定することを含む。
ある種の実施形態では、不均一性比率は、以下のように推定することができる。ディープNGSシークエンシングデータから不均一性比率を推定するために使用され得る6つのインフォーマティブな遺伝子型組合せが存在する(表11)。これらは、4つの区別できるヌクレオチド頻度パターンを示す。組合せ1および2は、同じパターンを生じ、本発明者らは、微量構成成分S2のパーセンテージ、すなわち不均一性比率を計算するために、平均式を使用する。この式は、SNPの数が大きい場合に接近して近似されるはずのシナリオである、2つの組合せが等しい頻度で生じる場合に、比率の正確な推定を生じる。類似の平均化アプローチが、組合せ4および5に使用される。不均一性比率が低い場合、シークエンシングエラーが、不均一性比率の推論を妨害し得る。これを軽減するために、2段階の統計手法が使用され得る。シークエンシングエラーをe=0.001と仮定し、所与のSNP部位におけるシークエンシング深度をn(n≧500、n<500のSNPはいずれも破棄される)と仮定すると、k個の誤ったヌクレオチドを観測する確率は、パラメータnおよびeによる二項分布に従う。
各nについて、累積密度関数が、n個のヌクレオチドのうちh個よりも多くの誤ったヌクレオチドを観測する確率が0.01よりも小さくなるような閾値hを得るために計算され得る。シークエンシングデータにおいて、対応する閾値hよりも小さい数の読み取りを有する低頻度ヌクレオチドはいずれも破棄される。次いで、期待値最大化アルゴリズム(R用パッケージmclust、バージョン3.5.3)が、最大不均一性(この研究では全ての試料について0.2を使用した)よりも小さいヌクレオチド頻度の分布をモデル化する混合ガウス(1~3つの成分を有する)のパラメータを推定するために使用される。単一のガウス成分、または全てのデータポイントの60%よりも多くを占める最小平均を有するガウス成分のみが存在する場合、全てのデータポイントの中央値を試料不均一性比率とし、さもなくば、その他のガウス成分中のデータポイントの中央値を試料不均一性比率とする。
試料中の主要構成成分を決定するために、SNP部位における遺伝子型が、参照試料については10%、夾雑されている可能性がある試験試料については25%である閾値よりも大きい対立遺伝子頻度を有するヌクレオチドのみを使用して決定される。参照試料と試験試料との間の遺伝子型類似性は、試験試料中の500未満のシークエンシング深度を有するSNPを除いた、同一な遺伝子型を有するSNPのパーセンテージである。試験試料の主要構成成分は、最も高い遺伝子型類似性を有する参照試料であり、この類似性は、試験試料の不均一性比率が<10%(または>10%)である場合には、90%(または80%)よりも高くなければならない。さもなくば、主要構成成分はコールされない。
不均一性比率の推定および主要構成成分の決定の後、試験試料の微量構成成分が決定され得る。主要構成成分とその他の参照試料(例えば、ゲノムデータがある全ての細胞株)のうち1つとの混合物について、おそらくは1~4のヌクレオチドを有するキメラ遺伝子型が、全てのSNP部位において得られ得る。ヌクレオチドの頻度が、不均一性比率を使用して計算される。同様に、試験試料のキメラ遺伝子型が得られる。2つのキメラ遺伝子型は、それらが同じヌクレオチドを保有し、各ヌクレオチドの頻度が3倍以内である場合、同一とみなされる。次いで、試験試料と、主要構成成分と組み合わせた各参照試料との間の、遺伝子型類似性が計算される。次いで、全てのペアワイズ遺伝子型類似性のセットに、パラメータ(α,β)を用いるベータ分布がフィットされる。
等式中、Γ(α)はガンマ関数であり、xは遺伝子型類似性である。そのパラメータは、R用パッケージfitdistrplus(バージョン3.5.3)によって推定される。フィットさせたベータ分布から、特定の値よりも大きい任意の遺伝子型類似性を観測する確率が計算される。99%信頼帯を伴う分位数-分位数グラフが、視覚化のために、全ての観測された遺伝子型類似性についてプロットされる。参照試料は、(1)それが最も高い遺伝子型類似性を有する場合、(2)その遺伝子型類似性が、分位数-分位数グラフ中の99%信頼上限を上回る場合、および(3)フィットさせたベータ分布におけるそのp値<1.0E-6である場合、微量構成成分とみなされる。
2つの参照試料についての混合比率は、以下のように推定することができる。2つの構成成分S1およびS2を、S1についてΘ、S2について(1-Θ)の比率で混合すると仮定し、このとき、0≦Θ≦1である。ディープNGSシークエンシングデータから、両方の構成成分中のn個全てのSNPのヌクレオチド頻度が、正確に推定され得る。SNPについて、その4つのヌクレオチド頻度が、構成成分S1については{A1,T1,G1,C1}、構成成分S2については{A2,T2,G2,C2}として示され、これらは合計すると1になる。原理上、頻度のうち1つは、SNPがホモ接合性である場合には1に近く、2つの頻度は共に、SNPがヘテロ接合性である場合には0.5に近い。実際のデータは、シークエンシングエラーおよびランダムさ、ならびに細胞株の多クローン性に起因して、いくらかの偏差を有し得る。
混合試料のシークエンシングデータから、4つのヌクレオチドの実際の発生率は、x={nA,nT,nG,nC}として示される。このような観測の尤度は、
尤度PΘ(xi)は、観測されたデータxiを用いて、任意のSNPi∈(1,2,...,n)について計算され得、全てのSNPについてデータX={x1,x2,...,xn}を観測する尤度は、
したがって、log-尤度は、
尤度を最大化するΘは、Θの段階的増加によって解かれ得る。
キットおよびマイクロアレイ
別の態様では、本開示は前述の方法で使用するためのキットを提供する。このキットは、本明細書で記載した方法を実施するための試薬のいずれかまたは全てを含むことができる。ある種の実施形態では、このキットは、試料中の一群のヒトSNP遺伝子座または一群のマウスSNP遺伝子座を検出するためのプライマーを含む。ある種の実施形態では、このキットは、試料を得た対象の性別を同定するために性染色体SNPを検出するためのプライマーをさらに含む。ある種の実施形態では、このキットは、試料を得た対象の民族性を同定するために民族性SNPを検出するためのプライマーをさらに含む。ある種の実施形態では、このキットは、試料を得た免疫不全マウスの系統を決定するために供給業者のSNPを検出するためのプライマーをさらに含む。ある種の実施形態では、このキットは、試料中のウイルス感染またはマイコプラズマ夾雑を検出するためのプライマーをさらに含む。
別の態様では、本開示は前述の方法で使用するためのキットを提供する。このキットは、本明細書で記載した方法を実施するための試薬のいずれかまたは全てを含むことができる。ある種の実施形態では、このキットは、試料中の一群のヒトSNP遺伝子座または一群のマウスSNP遺伝子座を検出するためのプライマーを含む。ある種の実施形態では、このキットは、試料を得た対象の性別を同定するために性染色体SNPを検出するためのプライマーをさらに含む。ある種の実施形態では、このキットは、試料を得た対象の民族性を同定するために民族性SNPを検出するためのプライマーをさらに含む。ある種の実施形態では、このキットは、試料を得た免疫不全マウスの系統を決定するために供給業者のSNPを検出するためのプライマーをさらに含む。ある種の実施形態では、このキットは、試料中のウイルス感染またはマイコプラズマ夾雑を検出するためのプライマーをさらに含む。
ある種の実施形態では、このキットは、ヒトまたはマウスSNPを含有するDNA断片を、これらのプライマーを使用して増幅するための薬剤をさらに含む。さらに、キットは、本明細書で提供した方法の実践のための指示(すなわち、プロトコル)を含有する指示資料を含んでいてもよい。指示資料は典型的に文書または印刷された資料を含むが、これだけに限定されない。このような指示を記憶することができ、末端使用者がこのような指示と連絡することができる任意の媒体が本発明では検討される。このような媒体には、限定されるものではないが、電子記憶媒体(例えば、磁気ディスク、テープ、カートリッジ、チップ)、光学媒体(例えば、CDROM)などが含まれる。このような媒体には、このような指示資料を提供するインターネットサイトへのアドレスを含めることができる。
別の態様では、本開示は、例えば、Eds.,Bowtell and Sambrook DNA Microarrays:A Molecular Cloning Manual(2003)Cold Spring Harbor Laboratory Pressに記載されるようなアレイスライドまたはチップなどの固相支持体に結合したオリゴヌクレオチドプローブを提供する。このような装置の構造は、例えば、米国特許および特許公開、米国特許第5,837,832号、PCT出願第WO95/11995号、米国特許第5,807,522号;米国特許第7,157,229号、第7,083,975号、第6,444,175号、第6,375,903号、第6,315,958号、第6,295,153号および第5,143,854号、第2007/0037274号、第2007/0140906号、第2004/0126757号、第2004/0110212号、第2004/0110211号、第2003/0143550号、第2003/0003032号および第2002/0041420号に記載されたように、当業界では周知である。核酸アレイはまた、以下の参考文献に総括されている:Biotechnol Annu Rev(2002)8:85-101;Sosnowski et al.Psychiatr Genet(2002)12(4):181-92;Heller,Annu Rev Biomed Eng(2002)4:129-53;Kolchinsky et al.,Hum. Mutat(2002)19(4):343-60;およびMcGail et al.,Adv Biochem Eng Biotechnol(2002)77:21-42。
マイクロアレイは、固相支持体に固定された、通常は合成アンチセンスポリヌクレオチドまたはcDNAの断片のいずれかである多数の固有の一本鎖ポリヌクレオチドから構成され得る。典型的なポリヌクレオチドは好ましくは約6~60ヌクレオチド長、より好ましくは約15~30ヌクレオチド長、最も好ましくは約18~25ヌクレオチド長である。ある特定の種類のアレイまたはその他の検出キット/系のために、ほんの約7~20ヌクレオチド長であるオリゴヌクレオチドを使用することが好ましいことがある。化学ルミネセンス検出技術と併せて使用したアレイなどのその他の種類のアレイでは、好ましいプローブ長は、例えば、約15~80ヌクレオチド長、好ましくは約50~70ヌクレオチド長、より好ましくは約55~65ヌクレオチド長、最も好ましくは約60ヌクレオチド長であってもよい。
コンピュータが実現する方法、システムおよび装置
本明細書で記載した方法のいずれも、全体的にまたは部分的に、ステップを実施するために構成することができる1つまたは複数のプロセッサを含むコンピュータシステムで実施することができる。したがって、実施形態は、それぞれのステップまたはステップのそれぞれの群を実施する異なる構成成分を有する可能性のある、本明細書で記載した方法のいずれかのステップを実施するために構成されたコンピュータシステムを対象とする。番号付けしたステップとして提示されているが、本明細書の方法のステップは、同時に、または異なる順番で実施することができる。さらに、これらのステップの一部は、その他の方法のその他のステップの一部と共に使用することができる。また、ステップの全部または一部は任意選択であってもよい。どの方法のどのステップも、これらのステップを実施するためにモジュール、回路またはその他の手段で実施することができる。
本明細書で記載した方法のいずれも、全体的にまたは部分的に、ステップを実施するために構成することができる1つまたは複数のプロセッサを含むコンピュータシステムで実施することができる。したがって、実施形態は、それぞれのステップまたはステップのそれぞれの群を実施する異なる構成成分を有する可能性のある、本明細書で記載した方法のいずれかのステップを実施するために構成されたコンピュータシステムを対象とする。番号付けしたステップとして提示されているが、本明細書の方法のステップは、同時に、または異なる順番で実施することができる。さらに、これらのステップの一部は、その他の方法のその他のステップの一部と共に使用することができる。また、ステップの全部または一部は任意選択であってもよい。どの方法のどのステップも、これらのステップを実施するためにモジュール、回路またはその他の手段で実施することができる。
本明細書で言及したコンピュータシステムのいずれも、任意の適切な数のサブシステムを利用することができる。一部の実施形態では、コンピュータシステムは、サブシステムがコンピュータ機器の構成成分であり得る単一のコンピュータ機器を含む。その他の実施形態では、コンピュータシステムは、内部構成成分を有する、それぞれがサブシステムである多数のコンピュータ機器を含むことができる。サブシステムはシステムバスを介して相互接続することができる。さらなるサブシステムは、例えば、プリンター、キーボード、記憶装置、ディスプレイアダプターに結合されるモニターおよびその他を含む。I/O調節器と結合する周辺装置および入力/出力(I/O)装置は、シリアルポートなどの当業界で公知の任意の数の手段によってコンピュータシステムに連結することができる。例えば、シリアルポートまたは外部インターフェース(例えば、イーサネット〈登録商標〉、Wi-Fiなど)は、コンピュータシステムをインターネットなどの広域ネットワーク、マウス入力装置またはスキャナーに連結するために使用することができる。システムバスを介した相互接続は、中央処理装置が各サブシステムと連絡し、システムメモリまたは記憶装置(例えば、ハードドライブもしくは光学ディスクなどの固定ディスク)からの指示の実行を制御するのを可能にし、サブシステム間の情報交換を可能にする。システムメモリおよび/または記憶装置はコンピュータ可読媒体を組み入れることができる。本明細書で言及したデータのいずれも、1構成成分から別の構成成分への出力であってもよく、使用者への出力であってもよい。
コンピュータシステムは、例えば、外部インターフェースによって、または内部インターフェースによって一緒に連結した複数の同じ構成成分またはサブシステムを含むことができる。一部の実施形態では、コンピュータシステム、サブシステムまたは機器は、ネットワークと連絡することができる。このような場合、一コンピュータをクライアント、別のコンピュータをサーバーとみなすことができ、それぞれが同じコンピュータシステムの一部であってもよい。クライアントおよびサーバーはそれぞれ、多数のシステム、サブシステムまたは構成成分を含むことができる。
本開示の実施形態のいずれも、ハードウェア(例えば、特定用途向け集積回路もしくはフィールドプログラマブルゲートアレイ)を使用して、および/またはモジュラー型もしくは一体型の一般的なプログラマブルプロセッサを有するコンピュータソフトウェアを使用して、制御論理の形態で実現することができることを理解されたい。本明細書で使用する場合、プロセッサは、同じ集積チップ上にマルチコアプロセッサを含むか、または単一の回路基板上に多数の処理装置を含むか、またはネットワークされた多数の処理装置を含む。本明細書で提供した開示および教示に基づいて、当業者ならば、ハードウェアならびにハードウェアおよびソフトウェアの組合せを使用して、本開示の実施形態を実現するためのその他のやり方および/または方法に気づき、理解するだろう。
本出願で記載したソフトウェア構成成分または機能のいずれも、例えば、Java〈登録商標〉、C++またはPerlなどの任意の適切なコンピュータ言語を使用し、例えば、従来技術またはオブジェクト指向技術を使用して、プロセッサによって実行されるソフトウェアコードとして実現することができる。ソフトウェアコードは、記憶および/または伝達のためのコンピュータ可読媒体上の一連の指示または命令として記憶することができ、適切な媒体には、ランダムアクセスメモリ(RAM)、リードオンリメモリ(ROM)、ハードドライブもしくはフロッピーディスクなどの磁気媒体、またはコンパクトディスク(CD)もしくはDVD(デジタル多用途ディスク)などの光学媒体、フラッシュメモリなどが含まれる。コンピュータ可読媒体はこのような記憶もしくは伝達装置の任意の組合せであってもよい。
このようなプログラムはまた、インターネットを含む様々なプロトコルに適合する有線、光学および/または無線ネットワークを介した伝達に適応したキャリア信号を使用して記号化され、伝達され得る。したがって、本発明の実施形態によるコンピュータ可読媒体は、このようなブログラムで記号化されたデータ信号を使用して作製することができる。プログラムコードで記号化されたコンピュータ可読媒体は、互換性がある装置にパッケージ化されてもよく、または(例えば、インターネットダウンロードを介して)その他の装置から別々に提供されてもよい。任意のこのようなコンピュータ可読媒体は、単一のコンピュータ製品(例えば、ハードドライブ、CDまたは全コンピュータシステム)上、または内に存在していてもよく、システムまたはネットワーク内の異なるコンピュータ製品上または内に存在していてもよい。コンピュータシステムは、本明細書で言及した結果のいずれかを使用者に提供するために、モニター、プリンターまたはその他の適切なディスプレイを含んでいてもよい。
以下の実施例は、特許請求した発明をよりよく例示するために提供され、本発明の範囲を限定しないものと解釈される。以下に記載した特定の組成物、材料および方法は全て、全体または一部が本発明の範囲内にある。これらの特定の組成物、材料および方法は、本発明を限定するものではなく、本発明の範囲内にある特定の実施形態を例示するに過ぎない。当業者は、創作能力を発揮することなく、かつ本発明の範囲を逸脱することなく、同等の組成物、材料および方法を開発することができる。本発明の範囲内にありながら、記載した本明細書の手法において多くの変更を行うことができることを理解されたい。このような変更が本発明の範囲内に含まれることは、本発明者らの意図である。
[実施例1]
材料および方法
核酸抽出
細胞、PDXおよびPDXOからのゲノムDNAを、製造業者の指示に従ってDNeasy Blood&Tissue Kit(QIAGEN、Cat.69506、CA)を使用して精製した。DNAの完全性を、2100 Bioanalyser(Agilent)によって決定し、NanoDrop(Thermo Scientific)を使用して定量した。高品質のDNA試料(OD260/280=1.8~2.0、OD260/230≧2.0、>1μg)の1つのアリコートを、ディープNGSシークエンシングおよびWESシークエンシングに使用した。細胞、PDXおよびPDXOからの総RNAを、製造業者の指示に従ってRNeasy Mini Kit(QIAGEN、Cat.74106、CA)を使用して精製した。総RNAの完全性を、2100 Bioanalyser(Agilent)によって決定し、NanoDrop(Thermo Scientific)を使用して定量した。高品質のRNA試料(OD260/280=1.8~2.2、OD260/230≧2.0、RIN≧8.0、>1μg)の1つのアリコートを、ディープNGSシークエンシングおよびRNAseqシークエンシングに使用した。
材料および方法
核酸抽出
細胞、PDXおよびPDXOからのゲノムDNAを、製造業者の指示に従ってDNeasy Blood&Tissue Kit(QIAGEN、Cat.69506、CA)を使用して精製した。DNAの完全性を、2100 Bioanalyser(Agilent)によって決定し、NanoDrop(Thermo Scientific)を使用して定量した。高品質のDNA試料(OD260/280=1.8~2.0、OD260/230≧2.0、>1μg)の1つのアリコートを、ディープNGSシークエンシングおよびWESシークエンシングに使用した。細胞、PDXおよびPDXOからの総RNAを、製造業者の指示に従ってRNeasy Mini Kit(QIAGEN、Cat.74106、CA)を使用して精製した。総RNAの完全性を、2100 Bioanalyser(Agilent)によって決定し、NanoDrop(Thermo Scientific)を使用して定量した。高品質のRNA試料(OD260/280=1.8~2.2、OD260/230≧2.0、RIN≧8.0、>1μg)の1つのアリコートを、ディープNGSシークエンシングおよびRNAseqシークエンシングに使用した。
細胞株混合物の調製
細胞株混合物を、2つの細胞株からの細胞を所与の比率で混合することによって調製した。細胞増殖速度に基づいて、細胞を、T75中で15mlの培地中に播種して、細胞のコンフルエンスを60%~80%に到達させ、その後、CO2 Water Jacketed Incubator(SANYO)で一晩インキュベートした。細胞を対数増殖期間の間に回収し、血球計(Chongguang)でカウントして濃度を計算した。次いで、2つの細胞株からの細胞を、予め規定された比率に従って混合して、細胞株混合物を作製し、これを引き続いて、3,000rpmで5分間遠心分離した。上清を吸引し、細胞ペレットをDNA抽出のために-20℃で貯蔵した。
細胞株混合物を、2つの細胞株からの細胞を所与の比率で混合することによって調製した。細胞増殖速度に基づいて、細胞を、T75中で15mlの培地中に播種して、細胞のコンフルエンスを60%~80%に到達させ、その後、CO2 Water Jacketed Incubator(SANYO)で一晩インキュベートした。細胞を対数増殖期間の間に回収し、血球計(Chongguang)でカウントして濃度を計算した。次いで、2つの細胞株からの細胞を、予め規定された比率に従って混合して、細胞株混合物を作製し、これを引き続いて、3,000rpmで5分間遠心分離した。上清を吸引し、細胞ペレットをDNA抽出のために-20℃で貯蔵した。
ヒト-マウスDNA混合物の調製
一連のマウス-ヒトDNA混合物ベンチマーク試料を、マウス脾臓DNAおよびヒトゲノムDNA(Thermo Scientific、Cat.4312660)を混合することによって調製した。マウス脾臓DNAを、製造業者の指示に従ってDNeasy Blood&Tissue Kit(QIAGEN、Cat.69506、CA)を使用して精製し、NanoDrop(Thermo Scientific)を使用して定量した。マウス脾臓DNAおよびヒトゲノムDNAを200ng/μLに希釈し、次いで、予め規定された比率で混合した。DNA混合物を、後にディープNGSシークエンシングに使用した。
一連のマウス-ヒトDNA混合物ベンチマーク試料を、マウス脾臓DNAおよびヒトゲノムDNA(Thermo Scientific、Cat.4312660)を混合することによって調製した。マウス脾臓DNAを、製造業者の指示に従ってDNeasy Blood&Tissue Kit(QIAGEN、Cat.69506、CA)を使用して精製し、NanoDrop(Thermo Scientific)を使用して定量した。マウス脾臓DNAおよびヒトゲノムDNAを200ng/μLに希釈し、次いで、予め規定された比率で混合した。DNA混合物を、後にディープNGSシークエンシングに使用した。
ディープNGSシークエンシングをバーコード化する
多重PCRを使用して、150bpのペアードエンド読み取り長さ(pE150)を用いるIlluminaシークエンサーのための標的シークエンシングライブラリーを調製した。NGSディープシークエンシングは、630のアンプリコンをカバーし、それらのサイズは、160bp~260bpの範囲であった。ゲノムDNAを、IGT-EM808ポリメラーゼ混合物(iGene TechBioscience Co.,Ltd、95℃で3分30秒間、98℃で20秒間および60℃で8分間のインキュベーション18サイクル、72℃で5分間維持)を使用して増幅し、次いで、AMPure XPビーズ(Beckman、Cat.A63881)によって精製した。
多重PCRを使用して、150bpのペアードエンド読み取り長さ(pE150)を用いるIlluminaシークエンサーのための標的シークエンシングライブラリーを調製した。NGSディープシークエンシングは、630のアンプリコンをカバーし、それらのサイズは、160bp~260bpの範囲であった。ゲノムDNAを、IGT-EM808ポリメラーゼ混合物(iGene TechBioscience Co.,Ltd、95℃で3分30秒間、98℃で20秒間および60℃で8分間のインキュベーション18サイクル、72℃で5分間維持)を使用して増幅し、次いで、AMPure XPビーズ(Beckman、Cat.A63881)によって精製した。
バーコード化を、第2ラウンドの増幅によって実行した。簡潔に述べると、精製された標的アンプリコンを鋳型とし、PCR反応のための上流のIGT-I5インデックス(10μM)、下流のIGT-I7インデックス(10μM)およびポリメラーゼ混合物と共に添加した。次いで、この混合物を、以下の設定での増幅のためにサーマルサイクラー中に置いた:95℃で3分30秒間、98℃で20秒間、58℃で1分間および72℃で30秒間のインキュベーション9サイクル、72℃で5分間固定。次いで、バーコード化されたライブラリーを、AMPure XPビーズ(Beckmen、Cat.A63881)を使用して精製した。
ライブラリー構築後、Qubit 3.0 fluorometer dsDNA HS Assay(Thermo Fisher Scientific)を使用して、得られたシークエンシングライブラリーの濃度を定量した。Agilent BioAnalyzer 2100(Agilent)を使用して、280bp~420bpの範囲のサイズ分布を分析した。ペアードエンドシークエンシングを、2×150bpペアードエンドシークエンシングのためのIllumina提供のプロトコルに従ってIlluminaシステムを使用して実施した。
RNAseqおよびWESシークエンシング
RNAseqシークエンシングでは、mRNAに焦点を当てたシークエンシングライブラリーを、総RNAから構築した。ポリ-A mRNAを、オリゴ-dTが結合した磁気ビーズを使用して総RNAから精製し、次いで、断片化緩衝剤によって断片化した。短い断片を鋳型として使用して、第1鎖cDNAを、逆転写酵素およびランダムプライマーを使用して合成し、その後、第2鎖cDNAを合成した。次いで、合成されたcDNAを、ライブラリー構築プロトコルに従って、末端修復、リン酸化および「A」塩基付加に供した。次いで、シークエンシングアダプターを、cDNA断片の両方の末端に付加した。cDNA断片についてのPCR増幅後、標的化された250~350bpの断片を浄化した。ライブラリー構築後、Qubit 3.0 fluorometer dsDNA HS Assay(Thermo Fisher Scientific)を使用して、得られたシークエンシングライブラリーの濃度を定量し、サイズ分布を、Agilent BioAnalyzer 2100(Agilent)を使用して分析した。ライブラリーの検証後、HiSeq PE Cluster Kits(Illumina)と併せてIllumina cBOTクラスター生成システムを使用して、クラスターを生成した。ペアードエンドシークエンシングを、2×150ペアードエンドシークエンシングのためのIllumina提供のプロトコルに従ってIlluminaシステムを使用して実施した。
RNAseqシークエンシングでは、mRNAに焦点を当てたシークエンシングライブラリーを、総RNAから構築した。ポリ-A mRNAを、オリゴ-dTが結合した磁気ビーズを使用して総RNAから精製し、次いで、断片化緩衝剤によって断片化した。短い断片を鋳型として使用して、第1鎖cDNAを、逆転写酵素およびランダムプライマーを使用して合成し、その後、第2鎖cDNAを合成した。次いで、合成されたcDNAを、ライブラリー構築プロトコルに従って、末端修復、リン酸化および「A」塩基付加に供した。次いで、シークエンシングアダプターを、cDNA断片の両方の末端に付加した。cDNA断片についてのPCR増幅後、標的化された250~350bpの断片を浄化した。ライブラリー構築後、Qubit 3.0 fluorometer dsDNA HS Assay(Thermo Fisher Scientific)を使用して、得られたシークエンシングライブラリーの濃度を定量し、サイズ分布を、Agilent BioAnalyzer 2100(Agilent)を使用して分析した。ライブラリーの検証後、HiSeq PE Cluster Kits(Illumina)と併せてIllumina cBOTクラスター生成システムを使用して、クラスターを生成した。ペアードエンドシークエンシングを、2×150ペアードエンドシークエンシングのためのIllumina提供のプロトコルに従ってIlluminaシステムを使用して実施した。
WESは、Wuxi Nextcode Co.Ltd.(Shanghai、China)が実施した。簡潔に述べると、ゲノムDNAを抽出し、180~280bpの平均サイズに断片化した。DNAライブラリーを、Illuminaの製造業者のペアードエンドプロトコルによって生成した。エキソンを、Agilent SureSelect Human All Exon V6によって捕捉し、引き続いて、Illumina NovaSeqプラットフォーム(Illumina Inc.、San Diego、CA、USA)によってシークエンシングして、150bpのペアードエンド読み取りを生成した。
SNPの選択およびプロファイリング
本発明者らは、以下のいくつかの基準によって、ヒト試料認証のためのパネルSNPを選択した:1)SNPがエキソン中にある、2)大きい染色体セグメントの欠失および重複を含む染色体の異常性が腫瘍において共通しているので、SNPが、22個全ての常染色体上に位置し、互いに十分に離れている、3)SNPが、高度に発現される遺伝子中にある、4)SNPのマイナー対立遺伝子頻度(MAF)が、International HapMap Projectの3つの参照集団、すなわち、中国の漢族(CHB)、ナイジェリアのヨルバ族(YRI)ならびにCEPHコレクションからの北および西ヨーロッパ人祖先を持つユタ州住民(CEU)において、0.5に近い。
本発明者らは、以下のいくつかの基準によって、ヒト試料認証のためのパネルSNPを選択した:1)SNPがエキソン中にある、2)大きい染色体セグメントの欠失および重複を含む染色体の異常性が腫瘍において共通しているので、SNPが、22個全ての常染色体上に位置し、互いに十分に離れている、3)SNPが、高度に発現される遺伝子中にある、4)SNPのマイナー対立遺伝子頻度(MAF)が、International HapMap Projectの3つの参照集団、すなわち、中国の漢族(CHB)、ナイジェリアのヨルバ族(YRI)ならびにCEPHコレクションからの北および西ヨーロッパ人祖先を持つユタ州住民(CEU)において、0.5に近い。
ベンチマーク試料およびデータ
2つの細胞株ベンチマーク試料セットを調製した。第1のセットは、PANC-1およびRT4、MV-4-11および「LNCaPクローンFGC」、CAL27およびRajiを含む3対の細胞株について、78の試料を有する。各対は、純粋な2つの細胞株と、細胞カウントによる8つの混合比率についての3つの反復とを含む、26の試料を有する(補足の表S2)。第2のセットは、大抵は小さいが特定されない比率で既知の第2の細胞株が各々夾雑した22の細胞株を有する(補足の表S3)。
2つの細胞株ベンチマーク試料セットを調製した。第1のセットは、PANC-1およびRT4、MV-4-11および「LNCaPクローンFGC」、CAL27およびRajiを含む3対の細胞株について、78の試料を有する。各対は、純粋な2つの細胞株と、細胞カウントによる8つの混合比率についての3つの反復とを含む、26の試料を有する(補足の表S2)。第2のセットは、大抵は小さいが特定されない比率で既知の第2の細胞株が各々夾雑した22の細胞株を有する(補足の表S3)。
不均一性比率を推定する
ディープNGSシークエンシングデータから不均一性比率を推定するために使用され得る6つのインフォーマティブな遺伝子型組合せが存在する(表11)。これらは、4つの区別できるヌクレオチド頻度パターンを示す。組合せ1および2は、同じパターンを生じ、我々は、微量構成成分S2のパーセンテージ、すなわち不均一性比率を計算するために、平均式を使用する。この式は、SNPの数が大きい場合に接近して近似されるはずのシナリオである、2つの組合せが等しい頻度で生じる場合に、比率の正確な推定を生じる。類似の平均化アプローチが、組合せ4および5に使用される。不均一性比率が低い場合、シークエンシングエラーが、不均一性比率の推論を妨害し得る。これを軽減するために、我々は、2段階の統計手法を使用する。シークエンシングエラーをe=0.001と仮定し、所与のSNP部位におけるシークエンシング深度をn(n≧500、n<500のSNPはいずれも破棄される)と仮定すると、k個の誤ったヌクレオチドを観測する確率は、パラメータnおよびeによる二項分布に従う。
ディープNGSシークエンシングデータから不均一性比率を推定するために使用され得る6つのインフォーマティブな遺伝子型組合せが存在する(表11)。これらは、4つの区別できるヌクレオチド頻度パターンを示す。組合せ1および2は、同じパターンを生じ、我々は、微量構成成分S2のパーセンテージ、すなわち不均一性比率を計算するために、平均式を使用する。この式は、SNPの数が大きい場合に接近して近似されるはずのシナリオである、2つの組合せが等しい頻度で生じる場合に、比率の正確な推定を生じる。類似の平均化アプローチが、組合せ4および5に使用される。不均一性比率が低い場合、シークエンシングエラーが、不均一性比率の推論を妨害し得る。これを軽減するために、我々は、2段階の統計手法を使用する。シークエンシングエラーをe=0.001と仮定し、所与のSNP部位におけるシークエンシング深度をn(n≧500、n<500のSNPはいずれも破棄される)と仮定すると、k個の誤ったヌクレオチドを観測する確率は、パラメータnおよびeによる二項分布に従う。
各nについて、我々は、累積密度関数を計算し、n個のヌクレオチドのうちh個よりも多くの誤ったヌクレオチドを観測する確率が0.01よりも小さくなるような閾値hを得る。シークエンシングデータにおいて、対応する閾値hよりも小さい数の読み取りを有する低頻度ヌクレオチドはいずれも破棄される。次いで、我々は、最大不均一性(この研究では全ての試料について0.2を使用した)よりも小さいヌクレオチド頻度の分布をモデル化する混合ガウス(1~3つの成分を有する)のパラメータを推定するために、期待値最大化アルゴリズム(R用パッケージmclust、バージョン3.5.3(Team,R.C.R:A language and environment for statistical computing.3.5.3 edn(R Foundation for Statistical Computing、Vienna、Austria.、2018)))を使用する。単一のガウス成分、または全てのデータポイントの60%よりも多くを占める最小平均を有するガウス成分のみが存在する場合、全てのデータポイントの中央値を試料不均一性比率とし、さもなくば、その他のガウス成分中のデータポイントの中央値を試料不均一性比率とする。
試料の主要構成成分を決定する
SNP部位における遺伝子型が、参照試料については10%、夾雑されている可能性がある試験試料については25%である閾値よりも大きい対立遺伝子頻度を有するヌクレオチドのみを使用して決定される。参照試料と試験試料との間の遺伝子型類似性は、試験試料中の500未満のシークエンシング深度を有するSNPを除いた、同一な遺伝子型を有するSNPのパーセンテージである。試験試料の主要構成成分は、最も高い遺伝子型類似性を有する参照試料であり、この類似性は、試験試料の不均一性比率が<10%(または>10%)である場合には、90%(または80%)よりも高くなければならない。さもなくば、主要構成成分はコールされない。
SNP部位における遺伝子型が、参照試料については10%、夾雑されている可能性がある試験試料については25%である閾値よりも大きい対立遺伝子頻度を有するヌクレオチドのみを使用して決定される。参照試料と試験試料との間の遺伝子型類似性は、試験試料中の500未満のシークエンシング深度を有するSNPを除いた、同一な遺伝子型を有するSNPのパーセンテージである。試験試料の主要構成成分は、最も高い遺伝子型類似性を有する参照試料であり、この類似性は、試験試料の不均一性比率が<10%(または>10%)である場合には、90%(または80%)よりも高くなければならない。さもなくば、主要構成成分はコールされない。
試料の微量構成成分を決定する
不均一性比率の推定および主要構成成分の決定の後、我々は、試験試料の微量構成成分を決定する。主要構成成分とその他の参照試料(例えば、ゲノムデータがある全ての細胞株)のうち1つとの混合物について、我々は、おそらくは1~4のヌクレオチドを有するキメラ遺伝子型を、全てのSNP部位において得る。ヌクレオチドの頻度が、不均一性比率を使用して計算される。同様に、我々は、試験試料のキメラ遺伝子型を得る。2つのキメラ遺伝子型は、それらが同じヌクレオチドを保有し、各ヌクレオチドの頻度が3倍以内である場合、同一とみなされる。次いで、我々は、試験試料と、主要構成成分と組み合わせた各参照試料との間の、遺伝子型類似性を計算する。次いで、全てのペアワイズ遺伝子型類似性のセットに、パラメータ(α,β)を用いるベータ分布がフィットされる。
不均一性比率の推定および主要構成成分の決定の後、我々は、試験試料の微量構成成分を決定する。主要構成成分とその他の参照試料(例えば、ゲノムデータがある全ての細胞株)のうち1つとの混合物について、我々は、おそらくは1~4のヌクレオチドを有するキメラ遺伝子型を、全てのSNP部位において得る。ヌクレオチドの頻度が、不均一性比率を使用して計算される。同様に、我々は、試験試料のキメラ遺伝子型を得る。2つのキメラ遺伝子型は、それらが同じヌクレオチドを保有し、各ヌクレオチドの頻度が3倍以内である場合、同一とみなされる。次いで、我々は、試験試料と、主要構成成分と組み合わせた各参照試料との間の、遺伝子型類似性を計算する。次いで、全てのペアワイズ遺伝子型類似性のセットに、パラメータ(α,β)を用いるベータ分布がフィットされる。
等式中、Γ(α)はガンマ関数であり、xは遺伝子型類似性である。そのパラメータを、R用パッケージfitdistrplus(バージョン3.5.3)によって推定した。次いで、フィットさせたベータ分布から、我々は、特定の値よりも大きい任意の遺伝子型類似性を観測する確率を計算した。99%信頼帯を伴う分位数-分位数グラフを、視覚化のために、全ての観測された遺伝子型類似性についてプロットした。参照試料は、(1)それが最も高い遺伝子型類似性を有する場合、(2)その遺伝子型類似性が、分位数-分位数グラフ中の99%信頼上限を上回る場合、および(3)フィットさせたベータ分布におけるそのp値<1.0E-6である場合、微量構成成分とみなした。
2つの細胞株の混合比率を推定する
細胞株が、2つの参照試料についての混合比率の推定を説明するために使用される。2つの細胞株S1およびS2を、S1についてΘ、S2について(1-Θ)の比率で混合すると仮定し、このとき、0≦Θ≦1である。ディープNGSシークエンシングデータから、両方の細胞株中のn個全てのSNPのヌクレオチド頻度が、正確に推定され得る。SNPについて、その4つのヌクレオチド頻度が、細胞株S1については{A1,T1,G1,C1}、細胞株S2については{A2,T2,G2,C2}として示され、これらは合計すると1になる。原理上、頻度のうち1つは、SNPがホモ接合性である場合には1に近く、2つの頻度は共に、SNPがヘテロ接合性である場合には0.5に近い。実際のデータは、シークエンシングエラーおよびランダムさ、ならびに細胞株の多クローン性に起因して、いくらかの偏差を有し得る。
細胞株が、2つの参照試料についての混合比率の推定を説明するために使用される。2つの細胞株S1およびS2を、S1についてΘ、S2について(1-Θ)の比率で混合すると仮定し、このとき、0≦Θ≦1である。ディープNGSシークエンシングデータから、両方の細胞株中のn個全てのSNPのヌクレオチド頻度が、正確に推定され得る。SNPについて、その4つのヌクレオチド頻度が、細胞株S1については{A1,T1,G1,C1}、細胞株S2については{A2,T2,G2,C2}として示され、これらは合計すると1になる。原理上、頻度のうち1つは、SNPがホモ接合性である場合には1に近く、2つの頻度は共に、SNPがヘテロ接合性である場合には0.5に近い。実際のデータは、シークエンシングエラーおよびランダムさ、ならびに細胞株の多クローン性に起因して、いくらかの偏差を有し得る。
混合試料のシークエンシングデータから、4つのヌクレオチドの実際の発生率は、x={nA,nT,nG,nC}として示される。このような観測の尤度は、
尤度PΘ(xi)は、観測されたデータxiを用いて、任意のSNPi∈(1,2,...,n)について計算され得、全てのSNPについてデータX={x1,x2,...,xn}を観測する尤度は、
したがって、log-尤度は、
次いで、尤度を最大化するΘが、Θの段階的増加によって解かれ得る。上記手法は、任意の2つのヒト試料の混合物についても同様に使用され得る。
夾雑物検出のための細胞株混合物のシミュレーション
シミュレーションを、PANC-1およびRT4、MV-4-11および「LNCaPクローンFGC」、CAL27およびRajiを含む3つの細胞株対について実施した。6つ全ての細胞株を、ディープNGSシークエンシングによってプロファイリングして、それらのSNPフィンガープリントを得た。対になった2つの細胞株を、in silicoで混合したが、第一の細胞株の比率はrであり、rは、以下の値をとる:0.15%、0.30%、0.625%、1.25%、2.5%、5%、10%、15%および20%。各SNP部位について、r×n個のヌクレオチドを第1の細胞株から得、式中、nは、500~5000のランダムな整数であり、r×nを、第1の細胞株におけるそれらの頻度に従って、4つのヌクレオチド(A、T、G、C)にさらに振り分けた。同様に、(1-r)×n個のヌクレオチドを、第2の細胞株から得た。次いで、比率を逆転させ、そうして、対称サンプリングを、第2の細胞株について比率rで実施した。
シミュレーションを、PANC-1およびRT4、MV-4-11および「LNCaPクローンFGC」、CAL27およびRajiを含む3つの細胞株対について実施した。6つ全ての細胞株を、ディープNGSシークエンシングによってプロファイリングして、それらのSNPフィンガープリントを得た。対になった2つの細胞株を、in silicoで混合したが、第一の細胞株の比率はrであり、rは、以下の値をとる:0.15%、0.30%、0.625%、1.25%、2.5%、5%、10%、15%および20%。各SNP部位について、r×n個のヌクレオチドを第1の細胞株から得、式中、nは、500~5000のランダムな整数であり、r×nを、第1の細胞株におけるそれらの頻度に従って、4つのヌクレオチド(A、T、G、C)にさらに振り分けた。同様に、(1-r)×n個のヌクレオチドを、第2の細胞株から得た。次いで、比率を逆転させ、そうして、対称サンプリングを、第2の細胞株について比率rで実施した。
RNAseqおよびWESデータセットからマウス比率を推定する
シークエンシング読み取りを、デフォルトパラメータを用いて、RNAseqデータについてはマッピングツールSTAR(Dobin,A.et al.STAR:ultrafast universal RNA-seq aligner.Bioinformatics 29,15-21(2013))を使用し、WESデータについてはBWA(Li,H.&Durbin,R.Fast and accurate short read alignment with Burrows-Wheeler transform.Bioinformatics 25,1754-60(2009))を使用して、ヒト(hg19)およびマウス(mm10)ゲノムにマッピングした。読み取りがヒトゲノムのみにマッピングされた場合、またはマウスゲノムに対してよりもヒトゲノムに対しての不一致がより少なかった場合、その読み取りは、ヒト読み取りとして分類した。マウス読み取りも同様に割り当てた。読み取りが、多くても2ずれた近い数の不一致で両方のゲノムにマッピングされた場合、その読み取りは分類不能であり、破棄した。マウス比率は、全ての保持した読み取りのうちのマウス読み取りの割合であった。
シークエンシング読み取りを、デフォルトパラメータを用いて、RNAseqデータについてはマッピングツールSTAR(Dobin,A.et al.STAR:ultrafast universal RNA-seq aligner.Bioinformatics 29,15-21(2013))を使用し、WESデータについてはBWA(Li,H.&Durbin,R.Fast and accurate short read alignment with Burrows-Wheeler transform.Bioinformatics 25,1754-60(2009))を使用して、ヒト(hg19)およびマウス(mm10)ゲノムにマッピングした。読み取りがヒトゲノムのみにマッピングされた場合、またはマウスゲノムに対してよりもヒトゲノムに対しての不一致がより少なかった場合、その読み取りは、ヒト読み取りとして分類した。マウス読み取りも同様に割り当てた。読み取りが、多くても2ずれた近い数の不一致で両方のゲノムにマッピングされた場合、その読み取りは分類不能であり、破棄した。マウス比率は、全ての保持した読み取りのうちのマウス読み取りの割合であった。
[実施例2]
この実施例は、ヒト試料認証および夾雑検出を例示する。
この実施例は、ヒト試料認証および夾雑検出を例示する。
SNPプロファイリングおよびフィンガープリント
SNPのパネルを、細胞株、異種移植片およびオルガノイドを含むヒト試料を認証するために選択した(表1)。SNPを、3000の平均深度を用いるディープNGSシークエンシングによってプロファイリングした。各試料は、全てのSNPについて、ヌクレオチド同一性および頻度の両方からなる固有のSNPフィンガープリントを有する。細胞株は、遺伝的浮動および不均一性に起因して、継代間およびバイオバンク間でゆらぐSNPフィンガープリントを有し得、したがって、現在のSNPフィンガープリントが、より良いキュレーションのためにプロファイリングされ得ることが強調される。SNPフィンガープリントは、比較的低深度のNGSデータによって、低減された正確さで生成され得る。この実施例では、本発明者らは、本発明者らおよびCCLEがプロファイリングしたRNAseqデータから、1050の細胞株についてのSNPフィンガープリントを生成した。これは、参照として機能する。
SNPのパネルを、細胞株、異種移植片およびオルガノイドを含むヒト試料を認証するために選択した(表1)。SNPを、3000の平均深度を用いるディープNGSシークエンシングによってプロファイリングした。各試料は、全てのSNPについて、ヌクレオチド同一性および頻度の両方からなる固有のSNPフィンガープリントを有する。細胞株は、遺伝的浮動および不均一性に起因して、継代間およびバイオバンク間でゆらぐSNPフィンガープリントを有し得、したがって、現在のSNPフィンガープリントが、より良いキュレーションのためにプロファイリングされ得ることが強調される。SNPフィンガープリントは、比較的低深度のNGSデータによって、低減された正確さで生成され得る。この実施例では、本発明者らは、本発明者らおよびCCLEがプロファイリングしたRNAseqデータから、1050の細胞株についてのSNPフィンガープリントを生成した。これは、参照として機能する。
本発明者らは、217の細胞株試料、220のPDXおよび31のPDX由来オルガノイド(PDXO)試料についてのディープNGSシークエンシングからのSNPプロファイリングデータを使用した、認証、特徴づけ、種内および種間夾雑検出を例示した。細胞株試料について、本発明者らは、連続希釈からの既知の混合比率の2つの細胞株の混合物および6つの対応する純粋な細胞株(表7)、未知の混合比率の2つの細胞株の混合物(表8)、ならびに117の未混合の細胞株(表9)を試験した。
ヒト試料の認証
試料の正体、または夾雑された試料の主要構成成分を、参照試料のライブラリーに対するその遺伝子型類似性によって決定した。217の試験した細胞株試料において、同じ細胞株間の遺伝子型類似性は、98.6%の平均で常に>90%であり、最低は、JEG-3の16.7%の夾雑を伴った、A-875細胞培養物についての91.7%であった(図1A、表8)。対照的に、無関係の細胞株間の遺伝子型類似性は、ほぼ常に50%を下回った。表示ミス、夾雑、同じ患者に由来すること、1つの細胞株が別の細胞株の親であることなどを含む様々な理由によって、密接に関係するまたは同じ同義の群中にある細胞株がなおも存在した。例えば、HCT-15およびHCT-8は、同じ患者に由来した可能性が高い;QGY-7701が夾雑し、これはHeLa誘導体である。データセット中の16のこのような細胞株対についての遺伝子型類似性は、84%~96%の範囲である(表10)。これらの細胞株対は、HLEおよびHLFなどのほぼ同一なものを除き、区別することができる。同じモデル間の遺伝子型類似性は、平均して、220のPDXおよび31のPDX由来オルガノイド(PDXO)試料については98.0%(87.2~100%)であり、ほぼ全てが、異なるモデル間で50%を下回る。
試料の正体、または夾雑された試料の主要構成成分を、参照試料のライブラリーに対するその遺伝子型類似性によって決定した。217の試験した細胞株試料において、同じ細胞株間の遺伝子型類似性は、98.6%の平均で常に>90%であり、最低は、JEG-3の16.7%の夾雑を伴った、A-875細胞培養物についての91.7%であった(図1A、表8)。対照的に、無関係の細胞株間の遺伝子型類似性は、ほぼ常に50%を下回った。表示ミス、夾雑、同じ患者に由来すること、1つの細胞株が別の細胞株の親であることなどを含む様々な理由によって、密接に関係するまたは同じ同義の群中にある細胞株がなおも存在した。例えば、HCT-15およびHCT-8は、同じ患者に由来した可能性が高い;QGY-7701が夾雑し、これはHeLa誘導体である。データセット中の16のこのような細胞株対についての遺伝子型類似性は、84%~96%の範囲である(表10)。これらの細胞株対は、HLEおよびHLFなどのほぼ同一なものを除き、区別することができる。同じモデル間の遺伝子型類似性は、平均して、220のPDXおよび31のPDX由来オルガノイド(PDXO)試料については98.0%(87.2~100%)であり、ほぼ全てが、異なるモデル間で50%を下回る。
遺伝的不均一性の推定
試料が夾雑なしであり、純粋に単クローン性の二倍体である場合、SNP部位は、ホモ接合性またはヘテロ接合性のいずれかであり、観測されたヌクレオチド頻度は、ディープNGSシークエンシングデータにおいて1または0.5に近く、この違いは、シークエンシングにおけるエラーおよびランダムさのみから来ている。実際には、細胞株は、微量クローンを有している可能性があり、異数体であり、または夾雑されており(夾雑物)、したがって、本発明者らは、SNP部位において、0.5および1からかけ離れた頻度を観測しただけでなく、3または4のヌクレオチドもまた観測した。このような情報は、試料の遺伝的不均一性を推定するために使用することができる。
試料が夾雑なしであり、純粋に単クローン性の二倍体である場合、SNP部位は、ホモ接合性またはヘテロ接合性のいずれかであり、観測されたヌクレオチド頻度は、ディープNGSシークエンシングデータにおいて1または0.5に近く、この違いは、シークエンシングにおけるエラーおよびランダムさのみから来ている。実際には、細胞株は、微量クローンを有している可能性があり、異数体であり、または夾雑されており(夾雑物)、したがって、本発明者らは、SNP部位において、0.5および1からかけ離れた頻度を観測しただけでなく、3または4のヌクレオチドもまた観測した。このような情報は、試料の遺伝的不均一性を推定するために使用することができる。
支配的なクローンは、試料の主要構成成分であり、微量クローンおよび夾雑物は、微量構成成分である。4つの観測されたヌクレオチド頻度パターンに基づいて、SNP不均一性比率を推定するために使用され得る主要構成成分および微量構成成分の6つのインフォーマティブな遺伝子型組合せが存在する(表11)。SNP部位は、4つのパターンのうち1つを生じる場合、インフォーマティブである。引き続いて、試料不均一性比率を、統計的モデル化アプローチによって、個々のSNP不均一性比率から推定する(実施例1を参照のこと)。試験試料を使用して、本発明者らは、夾雑なしの細胞株が、平均して、107のインフォーマティブなSNP部位を有するが、夾雑された細胞株が、わずかに多い112を有することを見出した。平均して、PDXおよびPDXOモデルは、それぞれ、156および111のインフォーマティブなSNP部位を有し、これは、PDXモデルにおけるより高い遺伝的不均一性および/またはマウス夾雑を反映している。
夾雑の検出および定量
本発明者らは、3つの分析を組み合わせることによって、試料夾雑を検出した。第1に、夾雑された試料は、高い不均一性比率を有し得るが、夾雑なしの試料はそれを有さない。試験試料において、118の推定上夾雑なしの細胞株のうち115(97.5%)が、不均一性比率<2%を有し、全てが<3%を有した(図1B)。対照的に、本発明者らは、夾雑された細胞株について高い不均一性比率を観測し、例えば、JEG-3細胞と混合されたA-875細胞培養物は、15.5%の不均一性比率を有した(表8)。上で示したように、不均一性比率は、夾雑比率(夾雑物のパーセンテージ)に比例し、したがって、夾雑の良好な指標である。PDXモデルから切開されたヒト腫瘍は、マウス間質を含有し、実際、本発明者らは、マウス夾雑(図1C)によって引き起こされる、PDX腫瘍におけるより高い不均一性比率(図1B)を観測した。PDXOは、PDXのin vitro培養物として、はるかに小さいおよびしばしば痕跡量のみのマウス細胞に起因して、有意に小さい不均一性比率を有する(図1B)。
本発明者らは、3つの分析を組み合わせることによって、試料夾雑を検出した。第1に、夾雑された試料は、高い不均一性比率を有し得るが、夾雑なしの試料はそれを有さない。試験試料において、118の推定上夾雑なしの細胞株のうち115(97.5%)が、不均一性比率<2%を有し、全てが<3%を有した(図1B)。対照的に、本発明者らは、夾雑された細胞株について高い不均一性比率を観測し、例えば、JEG-3細胞と混合されたA-875細胞培養物は、15.5%の不均一性比率を有した(表8)。上で示したように、不均一性比率は、夾雑比率(夾雑物のパーセンテージ)に比例し、したがって、夾雑の良好な指標である。PDXモデルから切開されたヒト腫瘍は、マウス間質を含有し、実際、本発明者らは、マウス夾雑(図1C)によって引き起こされる、PDX腫瘍におけるより高い不均一性比率(図1B)を観測した。PDXOは、PDXのin vitro培養物として、はるかに小さいおよびしばしば痕跡量のみのマウス細胞に起因して、有意に小さい不均一性比率を有する(図1B)。
夾雑は、試料について、SNP不均一性比率の確率密度における区別できる右ピークによっても示された(図2A~2F)。夾雑および不均一性比率が増加するにつれて、ピークは右にシフトし、時には2つのピークに分かれる。二/三峰性分布は、消滅したか、または夾雑なしの細胞株もしくは非常に低い夾雑比率(<1%)および不均一性比率(<2%)の細胞株についてわずかに出現したに過ぎない。
最後に、夾雑物は、直感的な視覚化および厳密な確率論的測定を与える統計的モデル化によって直接検出することができる(実施例1、図3Aを参照のこと)。各々別の細胞株と混合された94の細胞株試料において、本発明者らは、不均一性比率が≧2%である場合、細胞株中の微量夾雑物細胞株を常に正確に推論することができる(図3B)。不均一性比率が1~2%および<1%であるとき、精度は、約80%および50%まで下がる。8つの不首尾に終わった試料について、7つの試料がクリーンであると特徴づけられ、1つだけが、誤った夾雑している細胞株と評価された。もちろん、このような推論は、夾雑している細胞株も既知のSNPフィンガープリントを有するものである場合にもっともらしいに過ぎない。本発明者らは、我々のバイオバンクにおいていくつかの夾雑された細胞株を検出し、1つの例は、細胞株「G-292クローンA141B1」であり、これは、7.62%の高い不均一性比率を有し(図3C)、6.21%のOCI-AML-2が夾雑していた(図3D)。
夾雑している細胞株を同定した後で、本発明者らは、最尤アプローチを使用して、夾雑比率(すなわち、第2の細胞株のパーセンテージ)を推定することができる(実施例1を参照のこと)。シミュレーション研究により、推定された夾雑比率が、既知の比率と極めて近いことが示された(図3E)。本発明者らは、不均一性比率と夾雑比率との間の緊密な線形の相関を観測した(図3F)。したがって、以前に議論したように、不均一性比率は、夾雑の良好な推定子であり、夾雑物が標準的な細胞株でない場合に特に有用である。やはり夾雑された試料においてであるが、夾雑物は、時には遺伝的不均一性の大部分に寄与するとはいえ、その一部に寄与するだけであり、その結果、夾雑比率は、対応する不均一性比率よりも概して小さく(表8を参照のこと)、わずかな逸脱が、データ処理方法によって引き起こされた。
要約すると、その値および分布による不均一性比率は、ヒト試料についての信頼性のある夾雑尺度である。不均一性比率≧2%を有する細胞株試料は、夾雑されている可能性が非常に高く、夾雑物がこれもまたSNPフィンガープリント情報を有する別の細胞株である場合、その正体が推論され得、夾雑比率は、細胞またはDNA混合比率によって測定すると、≦1%で、前例のない感度で推定され得る(表7および8)。
[実施例3]
この実施例は、マウス腫瘍モデル認証を例示する。
この実施例は、マウス腫瘍モデル認証を例示する。
マウスSNPのパネル(表2を参照のこと)を、4T1、A20、B16-BL6、B16-F0、B16-F1、B16-F10、C1498、Colon26、CT26WT、E.G7-Ova、EL4、EMT6、H22、Hepa1-6、J558、J774A1、JC、KLN205、L1210、L5178-R、LLC、MBT2、MC38、MPC-11、Neuro-2a、P388D1、P815、Pan02、Renca、RM1、S91およびWEHI164を含む、前臨床免疫調節薬物開発において一般に使用される32の同系マウス腫瘍モデルを認証するために選択した。ほとんどのモデルは、6つの固有のSNPを有する。Colon26およびCT26WTは、BALB/cマウス系統に起源するマウス結腸腺癌モデルであり、各々、12のSNPを6つの共通のSNPと併せて有し、合計18の固有のSNPを有する。B16-BL6、B16-F0、B16-F1およびB16-F10は、C57BL/6マウス系統におけるマウス黒色腫細胞株であり、全てB16に由来し、したがって、高い遺伝的類似性を共有する。具体的には、B16は、B16-F0の親株であり、順に、B16-F0は、B16-F1の親株である。B16-F10は、B16-F0の10代目の連続継代であり、B16-BL646の親株である。本発明者らは、7つの共通のSNPを使用して、試験細胞株をこの群に最初に割り当て、次いで、6つの固有のSNPを各々が有するB16-BL6、B16-F0およびB16-F10に割り当て、18のSNPのいずれも観測されない場合には、試験細胞株にはB16-F1が割り当てられる。これらのモデルについての認証は、100%の精度を達成した。
[実施例4]
この実施例は、ヒト-マウス種間夾雑検出を例示する。
この実施例は、ヒト-マウス種間夾雑検出を例示する。
本発明者らは、ヒトhg19およびマウスmm10ゲノムを比較し、一群の100~300bpのセグメントを同定した(表3を参照のこと)が、その結果、各セグメントは、ヒトとマウスとの間で、挿入、欠失および点変異によって有意に異なっているが(31~97%の配列類似性)、共通のプライマー対が設計できるような同一な隣接配列をなおも有する。NGSシークエンシングの後、本発明者らは、ヒト読み取りとマウス読み取りとを分離し、全てのセグメントについてマウス比率を計算し、これらの比率の中央値を、ヒト-マウス混合試料中のマウス比率とした。この方法は、マウスおよびヒトのDNAが連続希釈によって混合されたベンチマーク試料のセットにおいて極めて高い精度を実証した(図4A)。本発明者らは、RNAseqおよびWESデータからマウス含量を推定する方法もまた開発した(実施例1を参照のこと)。本発明者らは、220のPDXおよび31のPDXOモデルにおいてマウス比率を推定することにおいて、3つの方法を比較した(図4B~C)。DNA(WESおよびディープNGSシークエンシングのため)およびRNA(RNAseqのため)を抽出し、モデルの同じ試料からシークエンシングして、試料の変動を除去した。PDXOモデルは概して、低いマウス含量を有した。PDXモデルでは、ディープNGSシークエンシングデータから正確に推定されたマウス比率は最も高く、次がRNAseqからのものであり、次がWESからのものであった。これは、WESにおいて使用したエキソン捕捉キットがヒトエキソンを富化するように設計されたものであり、相同なマウスエキソンに対する低いハイブリダイゼーション親和性を有したことに主に起因する。RNAseqは、種を優先しないポリA富化プロトコルを使用したが、遺伝子発現は、PDXのヒト腫瘍およびマウス間質において、大きな時空間的可変性を有する。実際、本発明者らは、ディープNGSシークエンシングデータとWESデータとの間に、マウス比率について非常に強い二次関係を観測したが(R=0.96、図4D)、ディープシークエンシングデータとRNAseqデータとの間には、はるかに弱い線形の相関を観測した(R=0.62)。
[実施例5]
この実施例は、試料中のマイコプラズマの検出を例示する。
この実施例は、試料中のマイコプラズマの検出を例示する。
本発明者らは、有効性が証明された、全てのマイコプラズマ種の検出のための一対のユニバーサルプライマー、ならびにA.laidlawii、M.arginine、M.fermentans、M.genitalium、M.hominis、M.hyorhinis、M.orale、M.pneumonia、M.salivariumおよびU.urealyticumを含む11のモリキュートを検出するための11対のプライマーを使用した(Molla Kazemiha,V.et al.Cytotechnology 61,117-24(2009))。本発明者らは、ディープNGSシークエンシング方法によって、バイオバンクにおいて1つのマイコプラズマ夾雑された細胞株を同定し、引き続いて、マイコプラズマ検出キットによってそれを検証した。
[実施例6]
この実施例は、集団構造分析および性別決定を例示する。
この実施例は、集団構造分析および性別決定を例示する。
ヒト試料認証に使用したSNPのパネルのうち、143は、International HapMap Project(International HapMap,C.The International HapMap Project.Nature 426,789-96(2003))によって特徴づけられたものである。本発明者らは、fastSTRUCTURE(Raj,A.,Stephens,M.&Pritchard,J.K.Genetics 197,573-89(2014))を使用して、以下の3つの参照集団の集団構造分析を実施した:中国の漢族(CHB)、ナイジェリアのヨルバ族(YRI)ならびにCEPHコレクションからの北および西ヨーロッパ人祖先を持つユタ州住民(CEU)。406人全ての個体を、高い確率で一義的に割り当てた。次いで、本発明者らは、東アジア人患者に由来する423のPDXモデルおよび米国の西洋人患者に由来する634のPDXモデルをプロファイリングした。全ての東アジア人PDXモデルは、1つの例外だけを除いて、支配的なCHB組成を有している。西洋人PDXモデルの大部分は、CEU組成を支配的に有し、残りは、主要なCHBもしくはYRI組成、または参照集団のうち2つもしくは3つの混合物を有している。本発明者らは、性別推論のためにY染色体にある3つのSNPも使用し(表3)、これは、Y染色体が失われた腫瘍試料を除き、常に正確であった。
本開示は、特定の実施形態(そのうちのいくつかは好ましい実施形態である)を参照しながら特に示し説明したが、当業者は、本明細書で開示した本開示の精神および範囲を逸脱することなく形態および詳細の様々な変化を行うことができることを理解されたい。
参考文献
1. Identity crisis. Nature 457, 935-6 (2009).
2. American Type Culture Collection Standards Development Organization Workgroup, A.S.N. Cell line misidentification: the beginning of the end. Nat Rev Cancer 10, 441-8 (2010).
3. Capes-Davis, A. et al. Match criteria for human cell line authentication: where do we draw the line? Int J Cancer 132, 2510-9 (2013).
4. Gartler, S.M. Apparent Hela cell contamination of human heteroploid cell lines. Nature 217, 750-1 (1968).
5. Lacroix, M. Persistent use of "false" cell lines. Int J Cancer 122, 1-4 (2008).
6. Lorsch, J.R., Collins, F.S. & Lippincott-Schwartz, J. Cell Biology. Fixing problems with cell lines. Science 346, 1452-3 (2014).
7. Fusenig, N.E., Capes-Davis, A., Bianchini, F., Sundell, S. & Lichter, P. The need for a worldwide consensus for cell line authentication: Experience implementing a mandatory requirement at the International Journal of Cancer. PLoS Biol 15, e2001438 (2017).
8. Yu, M. et al. A resource for cell line authentication, annotation and quality control. Nature 520, 307-11 (2015).
9. Bian, X., Yang, Z., Feng, H., Sun, H. & Liu, Y. A Combination of Species Identification and STR Profiling Identifies Cross-contaminated Cells from 482 Human Tumor Cell Lines. Sci Rep 7, 9774 (2017).
10. Horbach, S. & Halffman, W. The ghosts of HeLa: How cell line misidentification contaminates the scientific literature. PLoS One 12, e0186281 (2017).
11. de Maagd, R.A. et al. Identification of Bacillus thuringiensis delta-endotoxin Cry1C domain III amino acid residues involved in insect specificity. Appl Environ Microbiol 65, 4369-74 (1999).
12. Azari, S., Ahmadi, N., Tehrani, M.J. & Shokri, F. Profiling and authentication of human cell lines using short tandem repeat (STR) loci: Report from the National Cell Bank of Iran. Biologicals 35, 195-202 (2007).
13. Wu, M.L. et al. A 2-yr service report of cell line authentication. In Vitro Cell Dev Biol Anim 49, 743-5 (2013).
14. Masters, J.R. HeLa cells 50 years on: the good, the bad and the ugly. Nat Rev Cancer 2, 315-9 (2002).
15. MacLeod, R.A. et al. Widespread intraspecies cross-contamination of human tumor cell lines arising at source. Int J Cancer 83, 555-63 (1999).
16. Cosme, B. et al. Are your results valid? Cellular authentication a need from the past, an emergency on the present. In Vitro Cell Dev Biol Anim 53, 430-434 (2017).
17. Ye, F., Chen, C., Qin, J., Liu, J. & Zheng, C. Genetic profiling reveals an alarming rate of cross-contamination among human cell lines used in China. FASEB J 29, 4268-72 (2015).
18. Freedman, L.P. et al. The culture of cell culture practices and authentication--Results from a 2015 Survey. Biotechniques 59, 189-90, 192 (2015).
19. Nims, R.W. & Reid, Y. Best practices for authenticating cell lines. In Vitro Cell Dev Biol Anim 53, 880-887 (2017).
20. Almeida, J.L., Cole, K.D. & Plant, A.L. Standards for Cell Line Authentication and Beyond. PLoS Biol 14, e1002476 (2016).
21. Almeida, J.L. et al. Interlaboratory study to validate a STR profiling method for intraspecies identification of mouse cell lines. PLoS One 14, e0218412 (2019).
22. Zaaijer, S. et al. Rapid re-identification of human samples using portable DNA sequencing. Elife 6(2017).
23. Yousefi, S. et al. A SNP panel for identification of DNA and RNA specimens. BMC Genomics 19, 90 (2018).
24. Jobling, M.A. & Gill, P. Encoded evidence: DNA in forensic analysis. Nat Rev Genet 5, 739-51 (2004).
25. Sanchez, J.J. et al. A multiplex assay with 52 single nucleotide polymorphisms for human identification. Electrophoresis 27, 1713-24 (2006).
26. Didion, J.P. et al. SNP array profiling of mouse cell lines identifies their strains of origin and reveals cross-contamination and widespread aneuploidy. BMC Genomics 15, 847 (2014).
27. Liang-Chu, M.M. et al. Human biosample authentication using the high-throughput, cost-effective SNPtrace(TM) system. PLoS One 10, e0116218 (2015).
28. Pengelly, R.J. et al. A SNP profiling panel for sample tracking in whole-exome sequencing studies. Genome Med 5, 89 (2013).
29. Morgan, A.P. et al. The Mouse Universal Genotyping Array: From Substrains to Subspecies. G3 (Bethesda) 6, 263-79 (2015).
30. Castro, F. et al. High-throughput SNP-based authentication of human cell lines. Int J Cancer 132, 308-14 (2013).
31. El-Hoss, J. et al. A single nucleotide polymorphism genotyping platform for the authentication of patient derived xenografts. Oncotarget 7, 60475-60490 (2016).
32. Ruitberg, C.M., Reeder, D.J. & Butler, J.M. STRBase: a short tandem repeat DNA database for the human identity testing community. Nucleic Acids Res 29, 320-2 (2001).
33. van der Meer, D. et al. Cell Model Passports-a hub for clinical, genetic and functional datasets of preclinical cancer models. Nucleic Acids Res 47, D923-D929 (2019).
34. Tuveson, D. & Clevers, H. Cancer modeling meets human organoid technology. Science 364, 952-955 (2019).
35. Day, C.P., Merlino, G. & Van Dyke, T. Preclinical mouse cancer models: a maze of opportunities and challenges. Cell 163, 39-53 (2015).
36. Guo, S. et al. Molecular Pathology of Patient Tumors, Patient-Derived Xenografts, and Cancer Cell Lines. Cancer Res 76, 4619-26 (2016).
37. Khaled, W.T. & Liu, P. Cancer mouse models: past, present and future. Semin Cell Dev Biol 27, 54-60 (2014).
38. Li, Q.X., Feuer, G., Ouyang, X. & An, X. Experimental animal modeling for immuno-oncology. Pharmacol Ther 173, 34-46 (2017).
39. Chao, C. et al. Patient-derived Xenografts from Colorectal Carcinoma: A Temporal and Hierarchical Study of Murine Stromal Cell Replacement. Anticancer Res 37, 3405-3412 (2017).
40. Fasterius, E. & Al-Khalili Szigyarto, C. Analysis of public RNA-sequencing data reveals biological consequences of genetic heterogeneity in cell line populations. Sci Rep 8, 11226 (2018).
41. Ghandi, M. et al. Next-generation characterization of the Cancer Cell Line Encyclopedia. Nature 569, 503-508 (2019).
42. Vermeulen, S.J. et al. Did the four human cancer cell lines DLD-1, HCT-15, HCT-8, and HRT-18 originate from one and the same patient? Cancer Genet Cytogenet 107, 76-9 (1998).
43. Rebouissou, S., Zucman-Rossi, J., Moreau, R., Qiu, Z. & Hui, L. Note of caution: Contaminations of hepatocellular cell lines. J Hepatol 67, 896-897 (2017).
44. Barretina, J. et al. The Cancer Cell Line Encyclopedia enables predictive modelling of anticancer drug sensitivity. Nature 483, 603-7 (2012).
45. Bairoch, A. The Cellosaurus, a Cell-Line Knowledge Resource. J Biomol Tech 29, 25-38 (2018).
46. Molla Kazemiha, V. et al. PCR-based detection and eradication of mycoplasmal infections from various mammalian cell lines: a local experience. Cytotechnology 61, 117-24 (2009).
47. International HapMap, C. The International HapMap Project. Nature 426, 789-96 (2003).
48. Raj, A., Stephens, M. & Pritchard, J.K. fastSTRUCTURE: variational inference of population structure in large SNP data sets. Genetics 197, 573-89 (2014).
49. Masters, J.R. et al. Short tandem repeat profiling provides an international reference standard for human cell lines. Proc Natl Acad Sci U S A 98, 8012-7 (2001).
50. Hideyuki Tanabe, Y.T., Daisuke Minegishi, Miharu Kurematsu, Tohru Masui, Hiroshi Mizusawa. Cell line individualization by STR multiplex system in the cell bank found cross-contamination between ECV304 and EJ-1/T24. Tiss. Cult. Res. Commun. 18, 329-338 (1999).
51. Team, R.C. R: A language and environment for statistical computing. 3.5.3 edn (R Foundation for Statistical Computing, Vienna, Austria., 2018).
52. Dobin, A. et al. STAR: ultrafast universal RNA-seq aligner. Bioinformatics 29, 15-21 (2013).
53. Li, H. & Durbin, R. Fast and accurate short read alignment with Burrows-Wheeler transform. Bioinformatics 25, 1754-60 (2009).
1. Identity crisis. Nature 457, 935-6 (2009).
2. American Type Culture Collection Standards Development Organization Workgroup, A.S.N. Cell line misidentification: the beginning of the end. Nat Rev Cancer 10, 441-8 (2010).
3. Capes-Davis, A. et al. Match criteria for human cell line authentication: where do we draw the line? Int J Cancer 132, 2510-9 (2013).
4. Gartler, S.M. Apparent Hela cell contamination of human heteroploid cell lines. Nature 217, 750-1 (1968).
5. Lacroix, M. Persistent use of "false" cell lines. Int J Cancer 122, 1-4 (2008).
6. Lorsch, J.R., Collins, F.S. & Lippincott-Schwartz, J. Cell Biology. Fixing problems with cell lines. Science 346, 1452-3 (2014).
7. Fusenig, N.E., Capes-Davis, A., Bianchini, F., Sundell, S. & Lichter, P. The need for a worldwide consensus for cell line authentication: Experience implementing a mandatory requirement at the International Journal of Cancer. PLoS Biol 15, e2001438 (2017).
8. Yu, M. et al. A resource for cell line authentication, annotation and quality control. Nature 520, 307-11 (2015).
9. Bian, X., Yang, Z., Feng, H., Sun, H. & Liu, Y. A Combination of Species Identification and STR Profiling Identifies Cross-contaminated Cells from 482 Human Tumor Cell Lines. Sci Rep 7, 9774 (2017).
10. Horbach, S. & Halffman, W. The ghosts of HeLa: How cell line misidentification contaminates the scientific literature. PLoS One 12, e0186281 (2017).
11. de Maagd, R.A. et al. Identification of Bacillus thuringiensis delta-endotoxin Cry1C domain III amino acid residues involved in insect specificity. Appl Environ Microbiol 65, 4369-74 (1999).
12. Azari, S., Ahmadi, N., Tehrani, M.J. & Shokri, F. Profiling and authentication of human cell lines using short tandem repeat (STR) loci: Report from the National Cell Bank of Iran. Biologicals 35, 195-202 (2007).
13. Wu, M.L. et al. A 2-yr service report of cell line authentication. In Vitro Cell Dev Biol Anim 49, 743-5 (2013).
14. Masters, J.R. HeLa cells 50 years on: the good, the bad and the ugly. Nat Rev Cancer 2, 315-9 (2002).
15. MacLeod, R.A. et al. Widespread intraspecies cross-contamination of human tumor cell lines arising at source. Int J Cancer 83, 555-63 (1999).
16. Cosme, B. et al. Are your results valid? Cellular authentication a need from the past, an emergency on the present. In Vitro Cell Dev Biol Anim 53, 430-434 (2017).
17. Ye, F., Chen, C., Qin, J., Liu, J. & Zheng, C. Genetic profiling reveals an alarming rate of cross-contamination among human cell lines used in China. FASEB J 29, 4268-72 (2015).
18. Freedman, L.P. et al. The culture of cell culture practices and authentication--Results from a 2015 Survey. Biotechniques 59, 189-90, 192 (2015).
19. Nims, R.W. & Reid, Y. Best practices for authenticating cell lines. In Vitro Cell Dev Biol Anim 53, 880-887 (2017).
20. Almeida, J.L., Cole, K.D. & Plant, A.L. Standards for Cell Line Authentication and Beyond. PLoS Biol 14, e1002476 (2016).
21. Almeida, J.L. et al. Interlaboratory study to validate a STR profiling method for intraspecies identification of mouse cell lines. PLoS One 14, e0218412 (2019).
22. Zaaijer, S. et al. Rapid re-identification of human samples using portable DNA sequencing. Elife 6(2017).
23. Yousefi, S. et al. A SNP panel for identification of DNA and RNA specimens. BMC Genomics 19, 90 (2018).
24. Jobling, M.A. & Gill, P. Encoded evidence: DNA in forensic analysis. Nat Rev Genet 5, 739-51 (2004).
25. Sanchez, J.J. et al. A multiplex assay with 52 single nucleotide polymorphisms for human identification. Electrophoresis 27, 1713-24 (2006).
26. Didion, J.P. et al. SNP array profiling of mouse cell lines identifies their strains of origin and reveals cross-contamination and widespread aneuploidy. BMC Genomics 15, 847 (2014).
27. Liang-Chu, M.M. et al. Human biosample authentication using the high-throughput, cost-effective SNPtrace(TM) system. PLoS One 10, e0116218 (2015).
28. Pengelly, R.J. et al. A SNP profiling panel for sample tracking in whole-exome sequencing studies. Genome Med 5, 89 (2013).
29. Morgan, A.P. et al. The Mouse Universal Genotyping Array: From Substrains to Subspecies. G3 (Bethesda) 6, 263-79 (2015).
30. Castro, F. et al. High-throughput SNP-based authentication of human cell lines. Int J Cancer 132, 308-14 (2013).
31. El-Hoss, J. et al. A single nucleotide polymorphism genotyping platform for the authentication of patient derived xenografts. Oncotarget 7, 60475-60490 (2016).
32. Ruitberg, C.M., Reeder, D.J. & Butler, J.M. STRBase: a short tandem repeat DNA database for the human identity testing community. Nucleic Acids Res 29, 320-2 (2001).
33. van der Meer, D. et al. Cell Model Passports-a hub for clinical, genetic and functional datasets of preclinical cancer models. Nucleic Acids Res 47, D923-D929 (2019).
34. Tuveson, D. & Clevers, H. Cancer modeling meets human organoid technology. Science 364, 952-955 (2019).
35. Day, C.P., Merlino, G. & Van Dyke, T. Preclinical mouse cancer models: a maze of opportunities and challenges. Cell 163, 39-53 (2015).
36. Guo, S. et al. Molecular Pathology of Patient Tumors, Patient-Derived Xenografts, and Cancer Cell Lines. Cancer Res 76, 4619-26 (2016).
37. Khaled, W.T. & Liu, P. Cancer mouse models: past, present and future. Semin Cell Dev Biol 27, 54-60 (2014).
38. Li, Q.X., Feuer, G., Ouyang, X. & An, X. Experimental animal modeling for immuno-oncology. Pharmacol Ther 173, 34-46 (2017).
39. Chao, C. et al. Patient-derived Xenografts from Colorectal Carcinoma: A Temporal and Hierarchical Study of Murine Stromal Cell Replacement. Anticancer Res 37, 3405-3412 (2017).
40. Fasterius, E. & Al-Khalili Szigyarto, C. Analysis of public RNA-sequencing data reveals biological consequences of genetic heterogeneity in cell line populations. Sci Rep 8, 11226 (2018).
41. Ghandi, M. et al. Next-generation characterization of the Cancer Cell Line Encyclopedia. Nature 569, 503-508 (2019).
42. Vermeulen, S.J. et al. Did the four human cancer cell lines DLD-1, HCT-15, HCT-8, and HRT-18 originate from one and the same patient? Cancer Genet Cytogenet 107, 76-9 (1998).
43. Rebouissou, S., Zucman-Rossi, J., Moreau, R., Qiu, Z. & Hui, L. Note of caution: Contaminations of hepatocellular cell lines. J Hepatol 67, 896-897 (2017).
44. Barretina, J. et al. The Cancer Cell Line Encyclopedia enables predictive modelling of anticancer drug sensitivity. Nature 483, 603-7 (2012).
45. Bairoch, A. The Cellosaurus, a Cell-Line Knowledge Resource. J Biomol Tech 29, 25-38 (2018).
46. Molla Kazemiha, V. et al. PCR-based detection and eradication of mycoplasmal infections from various mammalian cell lines: a local experience. Cytotechnology 61, 117-24 (2009).
47. International HapMap, C. The International HapMap Project. Nature 426, 789-96 (2003).
48. Raj, A., Stephens, M. & Pritchard, J.K. fastSTRUCTURE: variational inference of population structure in large SNP data sets. Genetics 197, 573-89 (2014).
49. Masters, J.R. et al. Short tandem repeat profiling provides an international reference standard for human cell lines. Proc Natl Acad Sci U S A 98, 8012-7 (2001).
50. Hideyuki Tanabe, Y.T., Daisuke Minegishi, Miharu Kurematsu, Tohru Masui, Hiroshi Mizusawa. Cell line individualization by STR multiplex system in the cell bank found cross-contamination between ECV304 and EJ-1/T24. Tiss. Cult. Res. Commun. 18, 329-338 (1999).
51. Team, R.C. R: A language and environment for statistical computing. 3.5.3 edn (R Foundation for Statistical Computing, Vienna, Austria., 2018).
52. Dobin, A. et al. STAR: ultrafast universal RNA-seq aligner. Bioinformatics 29, 15-21 (2013).
53. Li, H. & Durbin, R. Fast and accurate short read alignment with Burrows-Wheeler transform. Bioinformatics 25, 1754-60 (2009).
Claims (22)
- 試料を認証するための方法であって、
前記試料から核酸を得ること;
表1に示される群から選択される50個以上のヒト単一ヌクレオチド多型(SNP)遺伝子座または表2に示される群から選択される50個以上のマウスSNP遺伝子座において、前記試料の遺伝子型を検出すること;
前記試料の遺伝子型を参照遺伝子型と比較すること;および
前記試料の認証を決定すること
を含む、方法。 - 前記試料が、細胞、組織、オルガノイド、またはそれらの組合せである、請求項1に記載の方法。
- 前記試料が、細胞株または腫瘍組織である、請求項2に記載の方法。
- 前記試料が夾雑物を含み、前記方法が、前記試料中の夾雑物のパーセンテージを決定することをさらに含む、請求項1に記載の方法。
- ヒト試料が夾雑物を含み、前記方法が、夾雑物の正体を決定することをさらに含む、請求項1に記載の方法。
- 検出するステップが、次世代シークエンシング(NGS)を使用する、請求項1に記載の方法。
- 前記核酸がバーコード化される、請求項1に記載の方法。
- 表3に示される群から選択される性染色体SNPを検出することによって、前記試料を得た対象の性別を同定することをさらに含む、請求項1に記載の方法。
- 前記試料を得た対象の民族性を同定することをさらに含む、請求項1に記載の方法。
- 前記試料中のウイルスまたはマイコプラズマの存在を検出することをさらに含む、請求項1に記載の方法。
- 前記試料が、4T1、A20、B16-BL6、B16-F0、B16-F1、B16-F10、C1498、Colon26、CT26WT、E.G7-Ova、EL4、EMT6、H22、Hepa1-6、J558、J774A1、JC、KLN205、L1210、L5178-R、LLC、MBT2、MC38、MPC-11、Neuro-2a、P388D1、P815、Pan02、Renca、RM1、S91およびWEHI164からなる群から選択されるマウス腫瘍モデルである、請求項1に記載の方法。
- ヒト構成成分およびマウス構成成分を含む試料を認証する方法であって、
前記試料から核酸を得ること;
100個よりも多くのマウスゲノム遺伝子座において、前記試料の遺伝子型を検出すること、ここで、前記マウスゲノム遺伝子座の各々が、対応する相同なヒトゲノム遺伝子座を有し、マウスゲノム遺伝子座の各々および対応する相同なヒトゲノム遺伝子座が、同一な隣接配列を有する;ならびに
前記遺伝子型に基づいて、前記試料中のマウス構成成分の比率を決定すること
を含む、方法。 - 前記マウスゲノム遺伝子座が、表6から選択される、請求項12に記載の方法。
- 検出するステップが、NGSを使用する、請求項12に記載の方法。
- 試料を認証するためのキットであって、
試料中の、表1に示される群から選択される少なくとも50個のヒトSNPまたは表2に示される群から選択される少なくとも50個のマウスSNPを検出するためのプライマー;および
ヒトまたはマウスSNPを含有するDNA断片を、前記プライマーを使用して増幅するための薬剤
を含む、キット。 - 表3に示される群から選択される性染色体SNPを検出するためのプライマーをさらに含む、請求項15に記載のキット。
- 前記試料中のウイルス感染またはマイコプラズマ夾雑を検出するためのプライマーをさらに含む、請求項16に記載のキット。
- ヒトまたはマウス試料を同定するためのマイクロアレイであって、
試料中の、表1に示される群から選択される少なくとも50個のヒトSNPまたは表2に示される群から選択される少なくとも50個のマウスSNPを検出するためのプローブを含む、マイクロアレイ。 - 指示が記憶された非一過性のコンピュータ可読媒体であって、前記指示がプロセッサによって実行されるとき、前記指示がプロセッサに、
表1に示される群から選択される50個以上のヒトSNP遺伝子座または表2に示される群から選択される50個以上のマウスSNP遺伝子座における、試料の遺伝子型の検索;
前記試料の遺伝子型の、参照遺伝子型との比較;および
前記試料の認証の決定
を行わせる、コンピュータ可読媒体。 - 主要構成成分および微量構成成分を含む試料を認証するための方法であって、
100個よりも多くのSNP遺伝子座において、前記試料の遺伝子型を検出すること;
表11に示される式に従って、SNP遺伝子座の各々についてSNP不均一性比率を決定すること;
遺伝子型をモデル化する混合ガウスを使用して、SNP遺伝子座についてのSNP不均一性比率に基づいて試料不均一性比率を決定すること;および
前記試料の遺伝子型を、参照試料において各々検出された一群の参照遺伝子型と比較すること、
前記試料の遺伝子型に対して最も高い同一性を有する参照遺伝子型を有する参照試料を同定すること、
参照遺伝子型が前記試料の遺伝子型に対して90%よりも高く同一であり、かつ試料不均一性比率が10%未満であるときに、または、参照遺伝子型が前記試料の遺伝子型に対して80%よりも高く同一であり、かつ試料不均一性比率が10%よりも高いときに、主要構成成分が参照試料であることを決定すること
によって、前記試料の主要構成成分を決定すること
を含む、方法。 - 前記試料の微量構成成分を決定することをさらに含む、請求項20に記載の方法。
- 前記試料中の主要構成成分および微量構成成分のパーセンテージを決定することをさらに含む、請求項21に記載の方法。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2019077750 | 2019-03-12 | ||
CNPCT/CN2019/077750 | 2019-03-12 | ||
PCT/CN2020/079067 WO2020182193A1 (en) | 2019-03-12 | 2020-03-12 | Methods and compositions for identification of tumor models |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2022524208A true JP2022524208A (ja) | 2022-04-28 |
Family
ID=72426334
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021555073A Pending JP2022524208A (ja) | 2019-03-12 | 2020-03-12 | 腫瘍モデルの同定のための方法および組成物 |
Country Status (5)
Country | Link |
---|---|
US (1) | US11739387B2 (ja) |
EP (1) | EP3938536A4 (ja) |
JP (1) | JP2022524208A (ja) |
CN (1) | CN113614246A (ja) |
WO (1) | WO2020182193A1 (ja) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10908066B2 (en) | 2010-11-16 | 2021-02-02 | 1087 Systems, Inc. | Use of vibrational spectroscopy for microfluidic liquid measurement |
US8961904B2 (en) | 2013-07-16 | 2015-02-24 | Premium Genetics (Uk) Ltd. | Microfluidic chip |
US11796449B2 (en) | 2013-10-30 | 2023-10-24 | Abs Global, Inc. | Microfluidic system and method with focused energy apparatus |
EP4245140A3 (en) | 2019-04-18 | 2024-01-17 | ABS Global, Inc. | System and process for continuous addition of cryoprotectant |
US11628439B2 (en) | 2020-01-13 | 2023-04-18 | Abs Global, Inc. | Single-sheath microfluidic chip |
AU2021365488A1 (en) * | 2020-10-21 | 2023-06-01 | Abs Global, Inc. | Methods and systems for processing genetic samples to determine identity or detect contamination |
CN112522380A (zh) * | 2020-11-19 | 2021-03-19 | 赣南医学院第一附属医院 | 一种基于高通量测序技术检测马凡及其类综合征相关突变基因的方法 |
CN114464246B (zh) * | 2022-01-19 | 2023-05-30 | 华中科技大学同济医学院附属协和医院 | 基于CovMutt框架检测与遗传性增加相关的突变的方法 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8927213B2 (en) * | 2004-12-23 | 2015-01-06 | Greg Hampikian | Reference markers for biological samples |
ES2682466T3 (es) * | 2004-06-04 | 2018-09-20 | Biotheranostics, Inc. | Identificación de tumores |
US9556482B2 (en) * | 2013-07-03 | 2017-01-31 | The United States Of America, As Represented By The Secretary Of Commerce | Mouse cell line authentication |
US20180142303A1 (en) * | 2015-05-19 | 2018-05-24 | The Wistar Institute Of Anatomy And Biology | Methods and compositions for diagnosing or detecting lung cancers |
CN108647495B (zh) * | 2018-05-21 | 2020-04-10 | 广州金域医学检验中心有限公司 | 身份关系鉴定方法、装置、设备及存储介质 |
-
2020
- 2020-03-12 JP JP2021555073A patent/JP2022524208A/ja active Pending
- 2020-03-12 WO PCT/CN2020/079067 patent/WO2020182193A1/en unknown
- 2020-03-12 CN CN202080005269.2A patent/CN113614246A/zh active Pending
- 2020-03-12 EP EP20769798.8A patent/EP3938536A4/en active Pending
-
2021
- 2021-05-25 US US17/329,176 patent/US11739387B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
WO2020182193A1 (en) | 2020-09-17 |
US11739387B2 (en) | 2023-08-29 |
EP3938536A1 (en) | 2022-01-19 |
US20210277486A1 (en) | 2021-09-09 |
CN113614246A (zh) | 2021-11-05 |
EP3938536A4 (en) | 2023-03-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2022524208A (ja) | 腫瘍モデルの同定のための方法および組成物 | |
US11111545B2 (en) | Methods for simultaneous amplification of target loci | |
US20210189498A1 (en) | Methods for simultaneous amplification of target loci | |
US11939634B2 (en) | Methods for simultaneous amplification of target loci | |
US20200157629A1 (en) | Methods for simultaneous amplification of target loci | |
US20210054457A1 (en) | Autism associated genetic markers | |
JP6328934B2 (ja) | 非侵襲性出生前親子鑑定法 | |
CN103608818B (zh) | 非侵入性产前倍性识别装置 | |
US20190338350A1 (en) | Method, device and kit for detecting fetal genetic mutation | |
US20220411875A1 (en) | Methods for simultaneous amplification of target loci | |
US20220356526A1 (en) | Methods for simultaneous amplification of target loci | |
WO2012173809A2 (en) | Method of identifying de novo copy number variants (cnv) using mz twins discordant for attention problems/disorders | |
US20240158855A1 (en) | Methods for simultaneous amplification of target loci | |
Sheng | METHODS AND COMPOSITIONS FOR IDENTIFICATION OF TUMOR MODELS-Patent Information |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20230224 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20240305 |